Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.
Comment: Make by tools (01.00.01) - action=same_as_next_version
Scroll Ignore
scroll-pdftrue
scroll-officetrue
scroll-chmtrue
scroll-docbooktrue
scroll-eclipsehelptrue
scroll-epubtrue
scroll-htmltrue
Panel
titleSommaire

Table of Contents
stylenone

Introduction

L'état de supervision d'un hôte ou d'un check est déterminé par 2 deux composants :

  • Le le "statut" de l'hôte ou du check ( OKATTENTION, CRITIQUE, ATTENTION ou INCONNU)
  • Le type d'état la "Confirmation du Statut" dans lequel se trouve le l'hôte ou le check , aussi appelé la "Confirmation de Statut" dans l'UI de visualisation. Il y a 2 types d'états dans Shinken Enterprise :
    • l'état SOFT  pour un statut à confirmer
    • l'état HARD pour un statut confirmé.
Ces états sont primordiaux, car ils sont utilisés pour déterminer quand les gestionnaires événements sont exécutés et quand
  • :
    • Un statut est non confirmé ( SOFT ), quand il s'agit d'un statut ( CRITIQUE, ATTENTION ou INCONNU ) et que l'on n'a pas atteint le nombre de vérifications prévu pour confirmer le statut.
    • Un statut est confirmé ( HARD ),
      • si c'est un statut OK,
      • ou c'est un des statuts ( CRITIQUE, ATTENTION ou INCONNU ) et que le nombre de vérifications a été atteint.

La confirmation du statut est utilisée pour déterminer quand

  • les gestionnaires d'événements sont exécutés,
  • les notifications sont envoyées.

Ce paragraphe Cette page décrit les différences entre état SOFT et état HARD statut confirmé ( SOFT ) et non confirmé ( HARD ), quand ces états s'appliquent, ainsi que les actions qui en découlent.

Relance des vérifications d'hôtes et de checks

Afin d'éviter les fausses alarmes liées aux états transitoires à une interruption temporaire ( SOFT ), Shinken Enterprise permet de définir combien de fois un service check ou un hôte doit être (re-)vérifié avant d'être considéré comme ayant réellement un réel problème ( état HARD ).

Ceci est contrôlé par la propriété "Nb maximum de tentatives de confirmation du statut de l'hôte" ( dans l'interface Configuration) ou clé d'import : "max_check_attempts" (dans la définition .cfg des checks et des hôtes ).

Etat "SOFT"


Statut non confirmé ( SOFT )

Le statut d'un élément est non confirmé ( SOFT )selon L'état "SOFT" survient dans les conditions suivantes :

  • Quand le résultat de la vérification d'un check ou d'un hôte n'est pas OK, est CRITIQUE, ATTENTION ou INCONNU,
  • et qu'il n'a pas encore atteint le nombre d'essai essais défini dans la propriété "max_check_attempts".  C'est ce qu'on appelle une "Erreur SOFT", le statut n'est pas confirmé.

Quand un check ou un hôte revient d'un état "erreur SOFT", on qualifie ce changement de "reprise SOFT".

  • Nb maximum de tentatives de confirmation du statut de l'hôte".

Si une commande du gestionnaire d'événement ( si configuré ) sera lancée à la réception de chaque vérification de status (Quel que soit le statut )Lorsqu'un check ou un hôte subit un changement d'état "SOFT", le  gestionnaire d'événements est lancé, s'il a été configuré.

  • Le gestionnaire d'événements peut être très pratique si vous essayez de régler
proactivement
  • pro-activement un problème avant que
l'état ne passe en "HARD"
  • le statut soit confirmé ( HARD ).
  • Les
notations de remplacement de contenu $
  • données $HOSTSTATETYPE$ ou $SERVICESTATETYPE$ auront la valeur "SOFT" lorsque les gestionnaires d'événements sont exécutés, ce qui permet au script de savoir quand il est nécessaire de réaliser des actions
correctrices. 
  • Plus d'informations sont disponibles sur la page
des

Etat "HARD"

Statut confirmé  ( HARD )

Le statut d'un élément est confirmé ( HARD )selon L'état "HARD" survient dans les conditions suivantes :

  • Quand le résultat de la vérification d'un service check ou d'un hôte n'est pas OK, est CRITIQUE, ATTENTION ou INCONNU, et qu'il a atteint le nombre d'essais défini dans la propriété "max_check_attempts" et que le dernier essai n'est pas OK.  C'est ce qu'on appelle une erreur "HARD", le statut est alors confirmé.Nb maximum de tentatives de confirmation du statut de l'hôte",
  • Quand un hôte ou check passe change d'un état statut d'erreur à un autre état statut d'erreur  (e.g. ATTENTION à CRITIQUE) alors ( CRITIQUE, ATTENTION ou INCONNU ) et que le nombre d'essais défini définis par la propriété max_check_attempts est dépassé."Nb maximum de tentatives de confirmation du statut de l'hôte" est dépassé ou atteint,
  • Quand le résultat de la vérification d'un check ou d'un hôte n'est pas OK et que est ( CRITIQUE, ATTENTION ou INCONNU ), dans ce cas, on relance une vérification de l'hôte. Si le statut de l'hôte associé est dans un état DOWN ou UNREACHABLE.
  • Quand un hôte ou un check revient d'un état d'erreur "HARD". On qualifie alors ce retour de  "reprise HARD".
  • est bien en ( CRITIQUEou INCONNU ) alors, on considère que le statut du check est confirmé ( HARD ),
  • Quand le résultat de la vérification d'un check ou d'un hôte est OK,Quand un hôte ou un check revient d'un état d'erreur "SOFT", suite à une "reprise SOFT".
  • Quand on reçoit le résultat d'un check passif. Les résultats de checks passifs sont directement considérés comme confirmés  confirmés ( HARD ).


Le statut d'un élément devient confirmé ( HARD )Lorsqu'un service ou un hôte subissent un changement d'état "HARD", cela entraîne les conséquences  conséquences suivantes :

  • Le gestionnaire d'événements  est lancé pour gérer l'état "HARD"Une vérification de l'état de son parent est alors forcée uniquement si le statut de ce dernier est ( CRITIQUE, ATTENTION ou INCONNU ) et non confirmé ( SOFT).
  • Les contacts sont notifiés au sujet du problème ou de sa résolution .Une vérification de ( si l'état envoie de son parent est alors forcée uniquement si ce dernier est en état non OK et non confirmé (SOFT).
Les notations de remplacement de contenu $gestionnaires
  • notification est configuré ).
  • La commande du gestionnaire d'événement sera lancée ( si configuré ) pour gérer la confirmation du statut ( HARD ).
    • Les notations de remplacement de contenu $HOSTSTATETYPE$ ou $SERVICESTATETYPE$ auront la valeur "HARD" lorsque les gestionnaires d'événements seront exécutés, ce qui permet au script de savoir quand il est nécessaire de réaliser des actions correctrices.
      ( voir la page Les Variables ( Remplacement dynamique de contenu - Anciennement les Macros ))
    • Plus d'informations sont disponibles sur la page
des

Exemple

Voici un exemple sur la détermination du types d'état (soft ou hard) de la confirmation de statut ( SOFT ou HARD ), quand un changement apparaît, et quand les événements et les notifications sont lancés.

L'exemple ci-dessous montre le résultat de vérifications consécutives sur un check, la valeur du paramètre max_check_attempts étant à 3.

TempsNombre de vérificationsStatut
État
Statut confirméChangementNotes
01OKOui ( HARD )Non
Etat
État Initial
11CRITIQUENon ( SOFT )Oui
1ère

1ʳᵉ détection d'un statut "non OK".

  • Exécution du gestionnaire d'événements ( si
paramétré
  • configuré ).
22AVERTISSEMENTNon ( SOFT )Oui

Le check continue d'être en "non OK".

  • Exécution du gestionnaire d'événements ( si
paramétré
  • configuré ).
33CRITIQUEOui ( HARD )Oui

Le nombre maximum d'essais est atteint donc

l'état passe à "HARD"

son statut est confirmé ( HARD )

  • Exécution du gestionnaire d'événements ( si
paramétré
  • configuré )
et envoi
  • Envoi d'une notification sur un problème ( si configuré )
  • Une vérification du statut de son parent ( ici son hôte ) est forcée, uniquement si ce dernier est en état "non OK
et
  • " et non confirmé ( SOFT ).
  • Le nombre de vérifications est remis à 1 aussitôt après.
41AVERTISSEMENTOui ( HARD )Oui

Le check passe au statut AVERTISSEMENT

en état HARD.

et est confirmé ( HARD ).

  • Si le paramètre "event_handler__hard_state__trigger_on_any_status_change" est activé, exécution
Exécution
  • du gestionnaire d'événements ( si
paramétré)
et envoi
  • d'une notification sur un problème.
51AVERTISSEMENTOui ( HARD )Non

Le check se stabilise sur un statut "

problème" en état HARD.

non OK" confirmé ( HARD ).

  • En fonction de la définition de l'intervalle de temps entre les notifications défini pour le check, une autre notification peut être envoyée.
61OKOui ( HARD )Oui

Le check repasse au statut OK

en état

confirmé ( HARD ).

  • Exécution du gestionnaire d'événements ( si
paramétré
  • configuré )
et envoi
  • Envoi d'une notification de reprise
71OKOui ( HARD )Non

Le

check est

check est toujours OK.

81INCONNUNon ( SOFT )Oui

Le check est détecté comme passant sur un statut "non OK"

en état

non confirmé ( SOFT ).

  • Exécution du gestionnaire d'événements ( si
paramétré
  • configuré ).
92OKOui ( HARD )Oui

Le check revient à un statut OK depuis un

état SOFT

statut non confirmé (

reprise

SOFT ).

  • Exécution du gestionnaire d'événements ( si
paramétré
  • configuré ), mais
pas
  • Pas d'envoi de notifications, car il ne s'agissait pas vraiment d'un problème.
L'état est passé à "HARD" et
  • Le statut est confirmé ( HARD ) et le nombre de vérifications repasse à 1 aussitôt après. 
101OKOui ( HARD )Non

Le

check se stabilise en état OK

statut du check devient OK confirmé ( HARD )