Contexte

Le check Reactionner - $KEY$ - Performance affiche les statistiques des performances de l'exécution des checks dans le Reactionner

Paramétrage

Le check utilise la ligne de commande suivante :

$PLUGINSDIR$/check_shinken -H "$HOSTADDRESS$" -p "$ARG2$" --shinkenversion "$SHINKENVERSION$" -t reactionner -m $ARG1$ 
--active_reactionner_latency "$_HOSTACTIVE_REACTIONNER_LATENCY$" --check_tolerate "$_HOSTREACTIONNER_NB_CHECK_IN_TIMEOUT_TOLERATE$" 
--timeout "$_HOSTCHECK_SHINKEN_TIMEOUT$" -w "$_HOSTTHRESHOLD_CPU_STOLEN_WARNING$" -c "$_HOSTTHRESHOLD_CPU_STOLEN_CRITICAL$"

Données utilisées provenant du modèle

Données communes pour les checks du modèle

Provenant du modèle shinken

Provenant du modèle shinken-daemon

Données spécifiques pour ce check

NomModifiable sur UnitéDéfaut

Valeur par défaut à

l'installation de Shinken

Description
SHINKEN_PROTOCOL

l'Hôte

( Onglet Données )

--http http

Protocole utilisé pour établir la connexion avec le Reactionner

CHECK_SHINKEN_TIMEOUT

l'Hôte

( Onglet Données )

seconde3 3

Timeout utilisé pour établir la connexion avec le Reactionner

REACTIONNER_PORT

l'Hôte

( Onglet Données )

---7769 7769

Port utilisé pour établir la connexion avec le Reactionner

Autres check(s) impacté(s) :

Note : Cette valeur remplacera la valeur $ARG2$ dans la commande

NB_CHECK_IN_TIMEOUT_TOLERATE

l'Hôte

( Onglet Données )

--0 0

Nombre de checks en timeout provoquant une sortie en erreur du check

REACTIONNER_NB_CHECK_IN_TIMEOUT_TOLERATE

l'Hôte

( Onglet Données )

--$_HOSTNB_CHECK_IN_TIMEOUT_TOLERATE$

$_HOSTNB_CHECK_IN

_TIMEOUT_TOLERATE$

Nombre de checks en timeout provoquant une sortie en erreur du check
ACTIVE_REACTIONNER_LATENCY

l'Hôte

( Onglet Données )

seconde0.5 0.5 Latence de connexion ( en secondes )  au-delà de laquelle le check sort en erreur

Les données DFE ( Duplicate Foreach )

 

Données utilisées provenant du check

Pas de données spécifiques pour ce check.

Données globales

Propriétés de l'hôte

Résultat

Exemple

Interprétation

Statut

Il peut prendre deux valeurs  OK / CRITIQUE / ATTENTION   /   INCONNU .

  • Le statut va dépendre du retour de sonde et de la configuration spécifique du check pour les données suivantes :
    • THRESHOLD_CPU_STOLEN_CRITICAL,
    • THRESHOLD_CPU_STOLEN_WARNING,
    • CHECK_SHINKEN_TIMEOUT

  • Voici un tableau récapitulatif du statut attendu suivant le retour de sonde :

Les vérifications communes



Les vérifications spécifiques

Situation

Statut

En fonction du pourcentage de CPU volé :

  • Si c'est supérieur à THRESHOLD_CPU_STOLEN_CRITICAL par défaut : 10 %  )

CRITIQUE

En fonction du pourcentage de CPU volé :

  • Si c'est supérieur à THRESHOLD_CPU_STOLEN_WARNING(  par défaut : 5%  )

ATTENTION

Si la sonde n'a pas eu de réponse avant le temps maximum

  • Si supérieur à CHECK_SHINKEN_TIMEOUT par défaut : 3 sec )
INCONNU

Résultat

Renvoi au format texte : 

  • Les statistiques des performances de l'exécution des checks dans le Reactionner.

Résultat Long

Renvoie un tableau présentant les 5 actions les plus longues à effectuer avec leur temps d'exécution.

Description des erreurs

Métriques

NomUnitéDescription
cpu_usage
%Utilisation du CPU par le démon
nb_action_done_per_sec
--Nombre de notifications & event handlers exécutés par seconde en moyenne sur la dernière minute
cpu_stolen__vmware__percent_ready
%

Seulement si le démon est situé sur une VM VMWare

Valeur de l'indicateur VMWare %ready (  temps de blocage de la VM avant d'avoir accès à ses VCpu, donc temps perdu du point de vue de la VM   )