L'état de supervision d'un hôte ou d'un check est déterminé par 2 composants :
Ces états sont primordiaux car ils sont utilisés pour déterminer quand les événements sont exécutés et quand les notifications sont envoyées.
Ce paragraphe décrit les différences entre état SOFT et état HARD, quand ces états s'appliquent, ainsi que les actions qui en découlent.
Afin d'éviter les fausses alarmes liées aux états transitoires, Shinken Enterprise permet de définir combien de fois un service ou un hôte doit être (re)vérifié avant d'être considéré comme ayant un réel problème.
Ceci est contrôlé par le paramètre "max_check_attempts" dans la définition des checks et des hôtes. Il est important de comprendre comment sont (re)vérifiés les hôtes et checks afin de comprendre les différents types d'état.
L'état "SOFT" apparaît dans les conditions suivantes :
Le point suivant apparaît lorsqu'un check ou un hôte subit un changement d'état "SOFT" :
Le plus important lors d'un état "SOFT" est le lancement du traitement d'événements. Utiliser le traitement d'événements peut être très pratique si vous essayez de régler pro-activement un problème avant que l'état ne passe en "HARD". Les notations de remplacement de contenu $HOSTSTATETYPE$ ou $SERVICESTATETYPE$ auront la valeur "SOFT" lorsque les événements sont exécutés, ce qui permet au script de savoir quand il est nécessaire de réaliser des actions correctrices. Plus d'informations disponibles dans la page des Gestionnaire d'événements.
L'état "HARD" apparaît dans les conditions suivantes :
Les points suivants apparaissent lorsqu'un service ou un hôte subissent un changement d'état "HARD":
Les notations de remplacement de contenu $HOSTSTATETYPE$ ou $SERVICESTATETYPE$ sont à "HARD" lorsque les événements sont exécutés ce qui permet au script de savoir quand il est nécessaire de réaliser des actions correctrices. Plus d'informations disponibles dans la page des Gestionnaire d'événements.
Voici un exemple de comment sont déterminés les types d'état quand un changement apparaît, et quand les événements et les notifications sont lancés.
L'exemple ci dessous montre le résultat de vérifications consécutives sur un check, la valeur du paramètre max_check_attempts étant à 3.
| Temps | Nombre de vérifications | Type d'état | Type d'état | Changement | Notes | Lancement du gestionnaire d'événements |
|---|---|---|---|---|---|---|
| 0 | 1 | OK | HARD | Non | Etat Initial | |
| 1 | 1 | CRITICAL | SOFT | Oui | 1ère détection d'un état non-OK. | X |
| 2 | 2 | WARNING | SOFT | Oui | Le check continue d'être en non-OK. | X |
| 3 | 3 | CRITICAL | HARD | Oui | Le nombre maximum de check est atteint donc l'état passe à "HARD" .
| X |
| 4 | 1 | WARNING | HARD | Oui | Le check passe en état HARD WARNING.
| X |
| 5 | 1 | WARNING | HARD | Non | Le check se stabilise en état "problème HARD" .
| -- |
| 6 | 1 | OK | HARD | Oui | Le check repasse en état HARD .
| X |
| 7 | 1 | OK | HARD | Non | Le check est toujours OK. | -- |
| 8 | 1 | UNKNOWN | SOFT | Oui | Le check est détecté comme passant de l'état "SOFT" à "non-OK". | X |
| 9 | 2 | OK | HARD | Oui | Le check revient à un état SOFT .
| X |
| 10 | 1 | OK | HARD | Non | Le check se stabilise en état OK . |