Contexte
Un incident est un regroupement d'événement sur un élément de supervision ( hôtes et checks ) qui passe dans un état problématique confirmé ( statut différent de ).
L'intérêt est de retrouver les différentes dates des événements et les utilisateurs notifiés ( voir la page Les notifications ).
Les incidents existent sur les hôtes et les checks, mais seuls les checks affichent le détail des incidents ( voir la page Détail d'un check )
Détail d'un incident
Démarrage d'un incident
Un incident sera créé lors de la première notification sur un statut Non-OK.
À son initialisation, 3 événements seront présents :
- L'événement du premier statut Non-OK ( statut non confirmé ( voir la page Statut confirmé ( HARD ) et non confirmé ( SOFT ) )
cet événement est optionnel si la configuration du status est configurée sur 1 ( voir la page Editer un check appliqué à un hôte ). - L'événement de la confirmation du statut Non-OK.
- La notification.
Incident EN COURS
Sur un élément ( hôte ou check ), il ne peut y avoir qu'un incident en cours.
Incident FERMÉ
Un incident EN COURS est fermé si :
- il y a 20 statuts successifs.
Sa date de fin correspondra à la date du premier statut sur les 20.
Un incident fermé sera supprimé au bout de 7 jours.
Suppression d'un incident
Un incident est supprimé sept jours après sa date de fermeture.
Affichage des incidents
Hôte
Les hôtes ne disposent pas d'un affichage détaillé de leur incident, ils ne sont visibles que par les enveloppes :
- dans le widget statut d'un dashboard ( voir la page Widget Statut )
- et dans le détail d'un hôte ( voir la page Page détaillée d'un Hôte/Cluster )
Une enveloppe et le nombre de notifications indiquera qu'un incident est EN COURS.
Checks
Widget status
Sur un widget status affichant la liste des checks ( voir la page Widget Statut ) une enveloppe et le nombre de notifications indiquera qu'un incident est EN COURS. Un clic sur l'enveloppe ouvrira la vue détaillée ( voir la page Détail d'un check ).
Dans l'exemple le check Memory SSH a un incident en cours avec cinq notifications déjà envoyées.
Page détaillée
1, 2 et 3 : le nombre de notifications sur l'incident en cours.
4 : Nombre d'incidents sur sept jours.
5 : Total des notifications sur 7 jours ( somme des notifications s'il y a plusieurs incidents sur la période )
6 : liste des incidents en cours et terminés
( voir la page Détail d'un check )






