Contexte

Le check Arbiter - $KEY$ - Alive vérifie que le démon Arbiter peut être correctement contacté sur le réseau.

Il donne également la version du démon ( Résultat court ) et ainsi que les modules opérationnels ( Résultat long ).

Paramétrage

Le check utilise la ligne de commande suivante :

$PLUGINSDIR$/check_shinken -H "$HOSTADDRESS$" -p "$ARG2$" --shinkenversion "$SHINKENVERSION$" -t arbiter -m $ARG1$ --timeout "$_HOSTCHECK_SHINKEN_TIMEOUT$" -w "$_HOSTTHRESHOLD_CPU_STOLEN_WARNING$" -c "$_HOSTTHRESHOLD_CPU_STOLEN_CRITICAL$"



Données utilisées provenant du modèle

Données communes pour les checks du modèle

Provenant du modèle shinken

Provenant du modèle shinken-daemon

Provenant du modèle shinken-arbiter

Données spécifiques pour ce check

Pas de données spécifiques pour ce check.

Les données DFE ( Duplicate Foreach )

 

Données utilisées provenant du check

 Pas de données provenant du check pour ce check.

Données globales

Propriétés de l'hôte

Résultat

Exemple

Interprétation

Statut

Il peut prendre quatre valeurs OK/ CRITIQUE/ ATTENTION / INCONNU.

  • Le statut va dépendre du retour de sonde et de la configuration spécifique du check pour les données suivantes :
    • THRESHOLD_CPU_STOLEN_CRITICAL,
    • THRESHOLD_CPU_STOLEN_WARNING,
    • CHECK_SHINKEN_TIMEOUT

Les vérifications communes

Les vérifications spécifiques

Situation

Statut

En fonction du pourcentage de CPU volé :

  • Si c'est supérieur à THRESHOLD_CPU_STOLEN_CRITICAL par défaut : 10% )

CRITIQUE

En fonction du pourcentage de CPU volé :

  • Si c'est supérieur à THRESHOLD_CPU_STOLEN_WARNING ( par défaut : 5% )

ATTENTION

Si la sonde n'a pas eu de réponse avant le temps maximum

  • Si supérieur à CHECK_SHINKEN_TIMEOUT par défaut : 3 sec )
INCONNU

Résultat

Renvoi au format texte : 

  • L'état de fonctionnement du démon,
  • la version installée,
  • le temps mis par le check pour établir la communication avec le check.

Résultat Long

Précise le fonctionnement des modules de l'Arbiter, leur statut, le nombre de redémarrages lors des 24 dernières heures, la date de dernier redémarrage et les sous-modules

Description des erreurs

Métriques

NomUnitéDescription
connexion_time
seconde

Temps pris par la sonde pour se connecter à l'Arbiter en seconde.