Introduction
Quand sont lancés les checks des hôtes?
Les hôtes sont vérifiés par les démons Shinken Enterprise :
- A intervalles réguliers, tels que défini dans la définition de l'hôte .
- A la demande quand il y a un changement d'état du check associé à l'hôte .
- A la demande selon la logique de dépendance de l'hôte .
Les vérifications planifiées sont optionnelles.
Si vous validez la valeur zéro dans le paramètre check_interval Shinken Enterprise ne lancera pas de vérifications régulières.
| Panel |
|---|
On pourra cependant toujours lancer des vérifications à la demande .
Les vérifications à la demande sont lancées lorsqu'un service associé à un hôte change d'état, car Shinken Enterprise a besoin de savoir si l'hôte a également changé d'état. Un service qui change d'état est très souvent un indicateur montrant que l'hôte a également changé d'état.
Par exemple, si Shinken Enterprise détecte que le check "HTTP" associé à un hôte vient de passer de l'état CRITICAL à OK, cela peut vouloir dire que l'hôte vient juste de revenir suite à un reboot et est à nouveau opérationnel.
Les vérifications à la demande sont également lancées dans le cadre de la gestion des dépendances. Shinken Enterprise est conçu pour détecter dès que possible les problèmes réseaux, et doit pouvoir faire la différence entre le statut DOWN et le statut UNREACHABLE . Cela doit aider l’administrateur à investiguer plus rapidement un problème
Checks et dépendances
Vous pouvez définir des parents sur un hôte afin de ne pas avoir à vérifier le statut de tous les hôtes dépendants. Plus d'informations disponibles dans le paragraphe "gestion des dépendances" .
Parallélisation des Checks
Tous les checks sont lancés en parallèle.
Etats des hôtes
Les hôtes vérifiés peuvent être dans 3 états différents :
- UP
- DOWN
- UNREACHABLE
| Anchor | ||||
|---|---|---|---|---|
|
Détermination de l'état de l'hôte
Données manquantes
Le statut d'un hôte ou d'un check dépend aussi de la durée d'expiration du statut.
Si Shinken n'a pas reçu de nouveau résultat de check d'ici cette période, le statuts expire et devient Données manquantes.
La durée d'expiration du statut est le 1.5 * check_interval (Propriété : Intervalle entre les vérifications).
Les cas les plus courant de Données manquantes sont :
- Les Pollers ne fonctionne pas, ou ne joignent pas les Schedulers.
- Les Schedulers ne fonctionne pas, ou ne joignent pas le Broker.
- L'hôte à une check période et durant la période ou le check n'est plus exécuté il passe en Données manquantes.
- L'hôte est une vérification passive et pas de check_interval.
L'expiration des statut est géré par les modules :
Le Module Livestatus ne gère pas l'expiration de statut donc dans Nagvis les statuts reste même si les Pollers ne fonctionne pas.
Voir : Configuration avancée (shinken.cfg) → Temps Temps d'attente minimum avant la création du statut données manquante [TODO faire lien]manquante dans Configuration avancée (shinken.cfg)
Shinken Inactif
Lorsque Le Broker n'est pas démarré les hôtes et les checks prennent ce statut. Ce statut n'est pas visible dans l'interface de visualisation, par définition si le broker ne fonctionne pas il n'est pas possible de voir les éléments supervisés. Ce statut est propre au module SLA : Onglet Historique/SLA et les Rapports de l'interface de visualisation.
Voir : Module SLA [TODO faire lien] Module SLA
Changement d'état d'un hôte
Comme vous le savez certainement, un hôte ne reste jamais dans le même état tout le temps. Quand Shinken Enterprise vérifie le statut d'un hôte, il est capable de détecter un changement d'état entre UP, DOWN, et UNREACHABLE et de prendre les actions appropriées .
Ces changements d'états résultent en différent types (HARD or SOFT), qui peuvent lancer des événements et des notifications. Détecter et gérer tous ces changements d'état est l’essence même de Shinken Enterprise .
Lorsque l'état d'un hôte change trop souvent, il est considéré comme comme étant en "flapping". Un bon exemple serait un serveur qui se reboot à chaque fois que l'OS charge.
Shinken Enterprise peut détecter quand un hôte entre en statut flapping, et peut alors bloquer l'envoi de notifications tant que l'état n'est pas stabilisé. Plus d’informations disponibles dans le paragraphe "flapping".


