Principe général
Une plateforme de supervision Shinken permet de vérifier l'état de fonctionnement des serveurs, équipements ou applications définis dans la configuration. Lorsqu'un de ces éléments se trouve dans un état non voulu (serveur injoignable, application surchargée, équipement défaillant), Shinken Entreprise est capable d'envoyer des alertes permettant d'avertir les utilisateurs du dysfonctionnement.
Mais que se passe-t-il lorsque la plateforme Shinken n'est pas en fonctionnement ?
En effet, puisqu’aucun système n'est infaillible, il est possible que la plateforme Shinken étant censée envoyer les alertes ne soit pas opérationnelle (extinction de la machine qui héberge la plateforme, problème réseau ...). Dans ce cas, l'alerte ne pourra pas être levée par Shinken pour avertir les utilisateurs. Il faut donc pouvoir être informé que la plateforme de supervision principale ne fonctionne pas correctement.
Pour pallier à ce problème, une solution efficace est de mettre en place une seconde plateforme de supervision qui permettra de surveiller les dysfonctionnements de la plateforme de supervision principale. De cette manière, tout problème sur la plateforme de supervision principale pourra être détecté par notre supervision secondaire et remontée aux administrateurs.
La mise en place d'une plateforme de supervision secondaire n'est pas seulement bénéfique en cas de panne. Elle permet également de vérifier le bon fonctionnement de la plateforme principale, en mettant à disposition des indicateurs de performance. On peut par exemple être averti lorsque la supervision principale commence à être surchargée, et donc réagir avant que le problème ne devienne critique.
Mise en place d'une plateforme de supervision secondaire
Configuration manuelle
Une architecture Shinken complète serait donc composée de 2 installations:
- La plateforme de supervision principale:
- Il s'agit de la plateforme Shinken qui va superviser la plupart des hôtes. L'organisation de ses royaumes et démons peut être complexe.
- Cette plateforme va aussi superviser les démons de l'installation secondaire. De cette manière, si la plateforme secondaire entre en erreur, on en sera averti.
- La plateforme de supervision secondaire:
- Cette plateforme supervise les démons de la plateforme principale. En cas d'incident sur la plateforme principale, on en sera averti.
- Elle ne requiert pas autant de ressources que la plateforme principale puisqu'elle ne supervise qu'un nombre réduit d'éléments (même sur une supervision principale conséquente, on dépasse rarement 10 machines à superviser)
Dans chacune des plateformes de supervision, les démons Shinken sont supervisés grâce aux checks fournis dans le Pack shinken. En pratique, il faudra accrocher sur ces hôtes les modèles correspondants aux démons qu'il y a sur la machine (shinken-arbiter, shinken-poller, etc...).
Ensuite, il est bien sur possible d'accrocher d'autres checks ou modèles jugés nécessaires pour vérifier le bon fonctionnement de la machine.
Configuration automatique
La configuration manuelle d'une plateforme de supervision secondaire n'est en général pas un travail titanesque.
Pourtant, elle comporte un inconvénient puisque cette configuration devra ensuite être maintenue pour suivre les évolutions de l'architecture de la supervision principale, ce qui peut devenir un travail fastidieux.
Shinken Entreprise permet de créer automatiquement la configuration d'une plateforme de supervision secondaire grâce à l'addon "nagvis-export-architecture".
L'explication pas à pas de cette procédure de configuration est détaillée dans la page suivante: Exemple pratique - Mise en place automatisée d'une plateforme de supervision secondaire
