Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

Introduction

Ce chapitre explique en détail quand et comment sont envoyées les notifications, ainsi que les contacts concernés.

...

Quand s'opèrent les notifications ?

La décision d’envoyer une notification est définie dans la politique de vérification. Elles sont lancées dans les cas suivants :

...

...

  • Quand un état "hard" change. Plus d'informations sur le statut "hard" sont disponibles dans la page Etat "Hard" et "

...

...

...

  • Quand un hôte ou un check

...

  • rentre d'un contexte particulier (DOWNTIME, ACKNOWLEDGE, ou FLAPPING), ou qu'il en sors (sauf ACKNOWLEDGE, qui n'est notifié qu'une fois).
    Les notifications sont désactivées pendant la durée du contexte. Cela permet d'éviter de noyer l'information principale par celle des changements de status intermédiaires lors d'une maintenance ou d'un FLAPPING.
  • Si l'élément possède une Escalade des notifications, elle peut être activée si l'élément est toujours non-OK pendant un temps donné.
  • Après un temps précisé dans l'intervalle de notification, une notification se répète si l'état de l'élément est toujours non-OK (par défaut, une journée).

Notez que seuls les changements sont notifiés. Il est donc possible de ne pas recevoir de notification lorsqu'on les active sur un hôte ou un check qui est déjà en état "hard" non-OK, puisque cet état n'a pas encore changé.

Par ailleurs, les notifications de reprise ne sont envoyées que si la notification de problème d'origine (warning ou critique) a été notifiée.

Qui est notifié ?

Dans chaque définition d'hôte et de check,

...

les paramètres Contact et Contact groups précisent quels contacts doivent recevoir les

...

notifications pour cet

...

Quand Shinken Enterprise envoie une notification, il prévient chaque contact ou membre du groupe défini. Si un contact appartient à plusieurs groupes, il supprime les doublons avant envoi de la notification. 

Quels filtres adoptés pour envoyer des notifications

 

Ce n'est pas juste parce qu'il faut envoyer la notification que des contacts vont être avertis . Il ya plusieurs filtres qu'une notification doit traverser avant qu'elle ne soit jugée suffisamment digne d'être envoyée . Même là, des contacts peuvent ne pas la recevoir si leurs filtres de notification ne permettent pas la notification . 

Program-Wide Filter:

Le 1er filtre que les notifications doivent passer est un test permettant de vérifier que celles-ci sont autorisées à un niveau global. Cette étape est définie par le paramètre  :ref:`"enable_notifications" <configuration/configmain-advanced#enable_notifications>` dans le fichier principal de configuration, (il est peut être changé en cours d'utilisation dans l'interface web) . Si les notifications sont désactivées à un niveau global, aucune notification sur un  hôte ou un check ne sera envoyée . Si elles sont activées au niveau global, d'autres filtres restent à passer. 

Filtres sur les hôtes et les check :

...

Le second filtre est de vérifier si l'élément n'est pas en état "flapping" (si la détection est activée).Si c'est le cas, personne n'est notifié. Si ce n'est pas le cas, il passe au filtre suivant

Le 3ème filtre est de vérifier si il n'y a pas d'options spécifiques sur l’élément. Chaque définition de check contient des options qui déterminent si les notificatiosn peuvent être envoyées en fonction de l'état "warning" ou "critical", ou de la reprise. De la même façon, chaque définition d'hôte contient des options qui déterminent si les notifications sont envoyées lorsque l'élément tombe, devient injoignable ou retrouve son état. Si la notification ne passe pas ces filtres, aucune notification n'est envoyée. Sinon, elle passe au filtre suivant. 

Les notifications de retour à un état normal ne sont envoyées que lorsqu'une notification a déjà été envoyée sur le problème d'origine. Cela n'aurait pas de sens d'avertir sur un retour à la nromale alors qu'on était pas informé d'un incident...  

...

élément en particulier (voir l'onglet de notification dans la page Créer un Hôte et Créer un check)

Si un contact est présent soit dans le paramètre contacts, ou appartient à un des groupes, il fera parti des contacts à notifier.

Après application des filtres, pour chaque contact à notifier, le Reactionner lancera la commande de notification appropriée. Cette commande est définie dans la Méthodes de notification.

La méthode de notification permet de choisir la commande envoyée et de configurer les filtres par type de notification et par période.

Les filtres

Plusieurs mécanismes permettent de filtrer les notifications. Ces filtres sont cumulatifs, et une notification doit donc respecter tous les critères de configuration avant d'être envoyée.

 

Filtre global

Il est possible de désactiver de manière globale les notifications envoyées, en utilisant le paramètre Notification Enabled dans la configuration de l'hôte ou du check.

Mettre cette option à 0 désactivera toute notification sur l'élément concerné.

 

Filtres sur le type de notification

La configuration spécifique des éléments sur un check ou un hôte permet de déterminer si un type de notification donné est envoyé.

Il est possible de déterminer, par exemple, que seuls les notifications de type état critique seront envoyé, et de désactiver donc les warning (dans le cas des checks), le unknown, le flapping, les maintenances et les reprises.

Ce filtre est également présent sur la méthode de notification. Le type de notification doit être autorisé à la fois par l'élément à l'origine de la notification et la méthode de notification.

 

Filtre par période

Chaque définition d'hôte et de check contient un paramètre

...

Notification Period qui précise la période de validité pendant laquelle les notifications sont autorisées (par ex, 8h-18h). Si le temps ne correspond pas à la période valide, personne n'est contacté.

...

Si le passage du filtre de période n'est pas réussi, le Shinken Enterprise va replanifier la prochaine notification pour l'hôte ou le check  (si il est dans un état non-OK ) dans la période temps valide. Cela permet de garantir que les contacts seront notifiés des problèmes dès que possible lorsque la prochaine période temps valide arrivera.

...

Les derniers filtres sont conditionnés par 2 choses :  (1) une notification a déjà été envoyée sur un problème avec l'hôte ou le check dans le passé et (2) l'hôte ou le check est toujours dans le même état non-OK que celui dans lequel il était au moment de l'envoi de la dernière notification. Si ces 2 critères sont remplis, alors Shinken Enterprise vérifiera et s'assurer que le temps écoulé depuis la dernière notification est supérieur ou égal à la valeur spécifiée par l'option " notification_interval " dans la définition de  l'hôte ou du check . Si pas assez de temps s'est écoulé depuis la dernière notification , personne n'est contacté . Si un temps suffisant s'est écoulé depuis la dernière notification ou les deux critères de ce filtre n'ont pas été réunis, la notification sera envoyée ! 

Filtres sur les contacts:

A ce stade, la notification a passé le programme de filtre et Shinken Enterprise commence à notifier les personnes concernées. Cela veut-il dire que chaque contact va recevoir une notification ? Non ! Chaque contact a ses propres filtres que les notifications doivent également passer avant qu'elles soient reçues.  

Les filtres sont spécifiques à chaque contact .

Le 1er filtre qui doit être passé pour chaque contact concerne les options de notification. Chaque définition de contact contient des options qui déterminent si les notificatiosn peuvent être envoyées en fonction de l'état "warning" ou "critical", ou de la reprise. De la même façon, chaque définition d'hôte contient des options qui déterminent si les notifications sont envoyées lorsque l'élément tombe, devient injoignable ou retrouve son état. Si la notification ne passe pas ces filtres, aucune notification n'est envoyée. Sinon, elle passe au filtre suivant  

Les notifications de retour à un état normal ne sont envoyées que lorsqu'une notification a déjà été envoyée sur le problème d'origine. Cela n'aurait pas de sens d'avertir sur un retour à la nromale alors qu'on était pas informé d'un incident...  

Le 4ème filtre est de vérifier la période de test.Chaque définition de contact contient un paramètre "notification_period" qui précise la période de validité. Si le temps ne correspond pas à la période valide, personne n'est contacté. Sinon, le contact est notifié ! 

Méthodes de notification 

...

Ce filtre est également présent sur la méthode de notification et la période doit donc également correspondre.

Récapitulatif en visualisation

Les dernières notifications envoyées sont récapitulées sur l'élément en question, dans l'UI de visualisation. Dans le cas des checks, les notifications récentes sont disponibles dans un onglet du volet de détail du check.

Il est également possible de rechercher un contact particulier dans le but de connaître les notifications qu'il a effectivement reçues, après application des filtres.

Panel

Image Added

Il existe déjà de nombreuses solutions externes prenant en main le gestion de ces notifications. Il suffit d'utiliser des packages disponibles supportant les mobiles, SMS....(simple script ou système complet de gestion) 

Type de macro de notification 

...

 

ValeurDescription
PROBLEM Un check ou un hôte vient juste de passer (ou est encore) en état "problème". Si c'est une notification de check , cela signifie que le check est soit en état WARNING, UNKNOWN ou CRITICAL .Si c'est une notification d'hôte, cela signifie qu'il est dans un état DOWN ou UNREACHABLE .
RECOVERY A check or host recovery has occurred. If this is a check notification, it means the check has just returned to an OK state. If it is a host notification, it means the host has just returned to an UP state. 
ACKNOWLEDGEMENT This notification is an acknowledgement notification for a host or check problem. Acknowledgement notifications are initiated via the web interface by contacts for the particular host or check. 
FLAPPINGSTART The host or check has just started flapping. 
FLAPPINGSTOP The host or check has just stopped flapping. 
FLAPPINGDISABLED  The host or check has just stopped flapping because flap detection was disabled
DOWNTIMESTART The host or check has just entered a period of scheduled downtime. Future notifications will be suppressed.
DOWNTIMESTOP The host or check has just exited from a period of scheduled downtime. Notifications about problems can now resume. 
DOWNTIMECANCELLED The period of scheduled downtime for the host or check was just cancelled. Notifications about problems can now resume. 

 

...