Contexte

Le check Receiver - $KEY$ - Alive vérifie que le démon Receiver peut être correctement contacté sur le réseau.

Il donne également la version du démon ( Résultat court ) et ainsi que les modules opérationnels ( Résultat long ).

Paramétrage

Le check utilise la ligne de commande suivante :

$PLUGINSDIR$/check_shinken -H "$HOSTADDRESS$" -p "$ARG2$" --shinkenversion "$SHINKENVERSION$" -t arbiter -m $ARG1$ 
--timeout "$_HOSTCHECK_SHINKEN_TIMEOUT$" -w "$_HOSTTHRESHOLD_CPU_STOLEN_WARNING$" -c "$_HOSTTHRESHOLD_CPU_STOLEN_CRITICAL$"



Données utilisées provenant du modèle

Données communes pour les checks du modèle

Provenant du modèle shinken

Provenant du modèle shinken-daemon

Provenant du modèle shinken-receiver

Données spécifiques pour ce check

Pas de données spécifiques pour ce check.

Les données DFE ( Duplicate Foreach )

Données utilisées provenant du check

Pas de données provenant du check pour ce check.

Données globales

Propriétés de l'hôte

Résultat

Exemple

Interprétation

Statut

Il peut prendre quatre valeurs OK/ CRITIQUE/ ATTENTION / INCONNU.

  • Le statut va dépendre du retour de sonde et de la configuration spécifique du check pour les données suivantes :
    • THRESHOLD_CPU_STOLEN_CRITICAL,
    • THRESHOLD_CPU_STOLEN_WARNING,
    • CHECK_SHINKEN_TIMEOUT


Les vérifications communes

Les vérifications spécifiques

Situation

Statut

En fonction du pourcentage de CPU volé :

  • Si c'est supérieur à THRESHOLD_CPU_STOLEN_CRITICAL par défaut : 10% )

CRITIQUE

En fonction du pourcentage de CPU volé :

  • Si c'est supérieur à THRESHOLD_CPU_STOLEN_WARNING ( par défaut : 5% )

ATTENTION

Si la sonde n'a pas eu de réponse avant le temps maximum

  • Si supérieur à CHECK_SHINKEN_TIMEOUT par défaut : 3 sec )
INCONNU

Résultat

Renvoi au format texte : 

  • Si le démon fonctionne correctement, la version installée et le temps qu'a pris le check pour établir la  communication avec le démon .

Résultat Long

Précise le fonctionnement des modules du Receiver, leur statut, le nombre de redémarrages lors des 2 dernières heures, la date de dernier redémarrage et les sous-modules

Description des erreurs

Métriques

NomUnitéDescription
connexion_time
seconde

Temps pris par la sonde pour se connecter au Receiver en seconde.

cpu_stolen__vmware__percent_ready
%

Seulement si le démon est situé sur une VM VMWare. Valeur de l'indicateur VMWare %ready ( temps de blocage de la VM avant d'avoir accès à ses VCpu, donc temps perdu du point de vue de la VM ).