Contexte

Le check Reactionner - $KEY$ - Performance affiche les statistiques des performances de l'exécution des checks dans le Reactionner

Paramétrage

Le check utilise la ligne de commande suivante :

$PLUGINSDIR$/check_shinken -H "$HOSTADDRESS$" -p "$ARG2$" --shinkenversion "$SHINKENVERSION$" -t reactionner -m $ARG1$ --active_reactionner_latency "$_HOSTACTIVE_REACTIONNER_LATENCY$" --check_tolerate "$_HOSTREACTIONNER_NB_CHECK_IN_TIMEOUT_TOLERATE$" --timeout "$_HOSTCHECK_SHINKEN_TIMEOUT$" -w "$_HOSTTHRESHOLD_CPU_STOLEN_WARNING$" -c "$_HOSTTHRESHOLD_CPU_STOLEN_CRITICAL$"



Données utilisées provenant du modèle

Données communes pour les checks du modèle

Provenant du modèle shinken

Provenant du modèle shinken-daemon

Provenant du modèle shinken-reactionner

Données spécifiques pour ce check

Pas de données spécifiques pour ce check.

Les données DFE ( Duplicate Foreach )

 

Données utilisées provenant du check

 Pas de données provenant du check pour ce check.

Données globales

Propriétés de l'hôte

Résultat

Exemple

Interprétation

Statut

Il peut prendre deux valeurs  OK / CRITIQUE / ATTENTION   /   INCONNU .

  • Le statut va dépendre du retour de sonde et de la configuration spécifique du check pour les données suivantes :
    • THRESHOLD_CPU_STOLEN_CRITICAL,
    • THRESHOLD_CPU_STOLEN_WARNING,
    • CHECK_SHINKEN_TIMEOUT

  • Voici un tableau récapitulatif du statut attendu suivant le retour de sonde :

Les vérifications communes



Les vérifications spécifiques

Situation

Statut

En fonction du pourcentage de CPU volé :

  • Si c'est supérieur à THRESHOLD_CPU_STOLEN_CRITICAL par défaut : 10 %  )

CRITIQUE

En fonction du pourcentage de CPU volé :

  • Si c'est supérieur à THRESHOLD_CPU_STOLEN_WARNING(  par défaut : 5%  )

ATTENTION

Si la sonde n'a pas eu de réponse avant le temps maximum

  • Si supérieur à CHECK_SHINKEN_TIMEOUT par défaut : 3 sec )
INCONNU

Résultat

Renvoi au format texte : 

  • Les statistiques des performances de l'exécution des checks dans le Reactionner.

Résultat Long

Renvoie un tableau présentant les 5 actions les plus longues à effectuer avec leur temps d'exécution.

Description des erreurs

Métriques

NomUnitéDescription
cpu_usage
%Utilisation du CPU par le démon
nb_action_done_per_sec
---Nombre de notifications & event handlers exécutés par seconde en moyenne sur la dernière minute
cpu_stolen__vmware__percent_ready
%

Seulement si le démon est situé sur une VM VMWare

Valeur de l'indicateur VMWare %ready (  temps de blocage de la VM avant d'avoir accès à ses VCpu, donc temps perdu du point de vue de la VM   )