Contexte

Le modèle shinken-arbiter vous permet de superviser un hôte hébergeant le démon Arbiter.

Description du modèle

Modèle d'hôte correspondant:  shinken-arbiter (notez que ce modèle hérite du modèle shinken et shinken-deamon)

Afin de superviser le démon Arbiter, le modèle  shinken-arbiter  appliqué à votre hôte, attachera deux checks qui vérifieront la santé et la performance de ce démon.

Checks

  • Arbiter - $KEY$ - Alive

    Vérifie que le démon Arbiter peut être correctement contacté sur le réseau ; la version du démon est affichée également ( Résultat court ) et que les modules sont opérationnels ( Résultat long ).




  • Arbiter - $KEY$ - Performance

    Retourne le temps de connexion au démon Arbiter ainsi que la liste des connexions avec les autres démons de l'architecture avec leurs numéros de version ( si possible ).

    Si certains démons ne sont pas à jours, alors un Avertissement sera remonté.

    Si jamais le démon Arbiter est en exécution sur une machine virtuelle supervisé par VMware, alors le pourcentage de temps de vol de CPU ( CPU Ready ) sera affiché.




Données du modèle

Les checks de l'Arbiter peuvent être configurés via des données fournies par le modèle.

Les données suivantes sont disponibles:

Nom de la donnéeDescriptionValeur par défautHérité du modèle d'hôte ou locale
SHINKEN_PROTOCOLProtocole utilisé pour établir la connexion avec l'Arbiterhttpshinken
ARBITER_PORTPort utilisé pour l'établissement de la connexion avec l'Arbiter7770Locale
CHECK_SHINKEN_TIMEOUTTimeout utilisé pour l'établissement de la connexion avec l'Arbiter3shinken
ARBITER_LISTListe d'Arbiter ( Multi-démon )arbiter-master$($_HOSTARBITER_PORT$)$Locale - Duplicate For Each
THRESHOLD_CPU_STOLEN_WARNINGSeuil de CPU volé ( en pourcentage ) sur une machine virtuelle supervisée par VMware avant de déclencher un warning5shinken-deamon
THRESHOLD_CPU_STOLEN_CRITICALSeuil de CPU volé ( en pourcentage ) sur une machine virtuelle supervisée par VMware avant de déclencher un critique10shinken-deamon


Métriques enregistrées

Les checks du modèle enregistrent des données de performance, qui peuvent ensuite être affichées dans l'interface de Visualisation sur l'Onglet Graphes ou bien le Widget Graphique.

Nom du checkNom de la métriqueExplication

Arbiter - $KEY$ - Alive

connexion_time

Temps de connexion en secondes pour contacter le démon

Arbiter - $KEY$ - Performance

cpu_stolen__vmware__percent_ready

(Seulement si le démon est situé sur une VM VMWare) Valeur de l'indicateur VMWare %ready (temps de blocage de la VM avant d'avoir accès à ses VCpu, donc temps perdu du point de vue de la VM)


Commandes


Nom du checkCommande du checkLigne de commande
Arbiter - $KEY$ - Alivecheck_shinken_arbiter!alive!$VALUE1$ $PLUGINSDIR$/check_shinken -H "$HOSTADDRESS$" -p "$ARG2$" --shinkenversion "$SHINKENVERSION$" -t arbiter -m $ARG1$ --timeout $_HOSTCHECK_SHINKEN_TIMEOUT$ -w $_HOSTTHRESHOLD_CPU_STOLEN_WARNING$ -c $_HOSTTHRESHOLD_CPU_STOLEN_CRITICAL$
Arbiter - $KEY$ - Performancecheck_shinken_arbiter!stats! $VALUE1$ $PLUGINSDIR$/check_shinken -H "$HOSTADDRESS$" -p "$ARG2$" --shinkenversion "$SHINKENVERSION$" -t arbiter -m $ARG1$ --timeout $_HOSTCHECK_SHINKEN_TIMEOUT$ -w $_HOSTTHRESHOLD_CPU_STOLEN_WARNING$ -c $_HOSTTHRESHOLD_CPU_STOLEN_CRITICAL$


Description des erreurs de Arbiter - $KEY$ - Alive

Erreur de surcharge des disques de logs

  • En cas de disques trop lent sur le volume des logs, le check sera mis en WARNING avec l'erreur suivante.



Description des erreurs de Arbiter - $KEY$ - Performance

Erreur de vol de CPU

Seulement si votre machine virtuelle est hébergé sur un hyperviseur VMWare

  • Si la VM se fait voler trop de temps de calcul (CPU Stolen), le check sera mis en WARNING  ou en CRITIQUE ( en fonction du taux de vol fixé par défaut ou  indiqué par l'utilisateur ).




Les serveurs ne sont pas à la même heure

  • Si le serveur n'est pas à la même heure que le serveur Arbiter ( qui fait office de référence ), une erreur CRITICAL sera levée, car des temps différents sur les différents serveurs va avoir des effets désastreux sur la cohérences des données de supervision.