Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.
Comment: Make by tools (01.00.01) - action=same_as_next_version
Scroll Ignore
scroll-pdftrue
scroll-officetrue
scroll-chmtrue
scroll-docbooktrue
scroll-eclipsehelptrue
scroll-epubtrue
scroll-htmltrue
Panel
titleSommaire

Table of Contents
stylenone

Contexte

Vérifie que le démon Poller peut être correctement contacté sur le réseau et affiche son numéro de version.

Affiche également le nombre d'éléments qu'il gère dans un tableau, en distinguant les hôtes, les Clusters et les Checks et le Total des éléments. (   Résultat court   )

Présente la liste les démons auxquels le Scheduler doit se connecter, et l'état des connexions (  Résultat long  ).

Donne un état des modules chargés (  Résultat long  ).


Panel

Paramétrage

Le check utilise la ligne de commande suivante :

Scroll Title
title
Code Block
languagejs
themeConfluence
$PLUGINSDIR$/check_shinken -H "$HOSTADDRESS$" -p "$ARG2$" --shinkenversion "$SHINKENVERSION$" -t scheduler -m $ARG1$ -l "lck-$LASTSERVICECHECK$"
 --passive_poller_latency "$_HOSTPASSIVE_POLLER_LATENCY$" --timeout "$_HOSTCHECK_SHINKEN_TIMEOUT$" -w "$_HOSTTHRESHOLD_CPU_STOLEN_WARNING$" -c 
"$_HOSTTHRESHOLD_CPU_STOLEN_CRITICAL$" --scheduler_too_old_retention_save_margin "$_HOSTSCHEDULER__RETENTION__RENTENTION-IS-TOO-OLD-AFTER_X_MINUTES$"



Données utilisées provenant du modèle

Données communes pour les checks du modèle

Provenant du modèle shinken

Excerpt Include
Modèle shinken
Modèle shinken
nopaneltrue

Provenant du modèle shinken-daemon

Excerpt Include
Modèle shinken-pollerdaemon
Modèle shinken-daemon
nopaneltrue

Provenant du modèle shinken-poller

Excerpt Include
Le Poller
Le Poller
nopaneltrue

Données spécifiques pour ce check

  Pas de données spécifiqiue spécifiques pour ce check.

Les données DFE ( Duplicate Foreach )

scroll

Excerpt-

title

Include Page
Modèle shinken-poller
Modèle shinken-poller
nopaneltrue

anchordata_for_check_sup_de_sup
title
NomModifiable sur UnitéDéfautValeur par défaut à l'installation de ShinkenDescription
No Format
POLLER_LIST

l'Hôte

( Onglet Données )

--
poller-master$($_HOSTPOLLER_PORT$)$poller-master$($_HOSTPOLLER_PORT$)$

Configuration du port de communication avec l'Arbiter.

Autres check(s) impacté(s) :

Note : Cette valeur remplacera dans la commande la valeur $ARG2$

Données utilisées provenant du check

   Pas de données provenant du check pour ce check.

Données globales

Excerpt Include
Mise en place du Pack windows
Mise en place du Pack windows
nopaneltrue

Résultat

Exemple

Panel

Exemple d'un état de santé dégradé du Poller

Lorsque le Poller rencontre des problèmes qui peuvent signifier un fonctionnement dégradé, ces problèmes sont également remontés dans le résultat du check "Poller - Running Well".

Lorsque certains checks ont un temps d'exécution supérieur aux différents seuils définis, ils sont répertoriés dans le résultat du check "Poller - Running Well" pour permettre d'avertir des potentielles erreurs sur ces checks ou du Poller.


Dans l'exemple, le check signale que 10 checks ont pris plus que 10 secondes pour s'exécuter pendant les 20 dernières minutes, et ont leur exécution a donc été arrêtée de force.

Panel

La durée de temps ( en secondes ) durant laquelle les checks sont conservés dans l'ensemble des checks en timeout est configurable dans le fichier de configuration du Poller concerné.

Il est également possible de définir un seuil de tolérance afin d'afficher un avertissement seulement lorsqu'il y a plus qu'un certain nombre de checks en timeout. Pour cela, il faut modifier la donnée NB_CHECK_IN_TIMEOUT_TOLERATE dans l'hôte concerné dans la configuration.


Code Block
languagejs
themeConfluence
title/etc/shinken/pollers/mon_poller.cfg
define poller {
    ...
    keep_timeout_time    1200
    ...
}

Interprétation

Statut

Il peut prendre quatre valeurs  OK / CRITIQUE / ATTENTION   /   INCONNU .

  • Le statut va dépendre du retour de sonde et de la configuration spécifique du check pour les données suivantes :
    •   THRESHOLD_CPU_STOLEN_CRITICAL
    •  THRESHOLD_CPU_STOLEN_WARNING
    •  SCHEDULER__RETENTION__RENTENTION-IS-TOO-OLD-AFTER_X_MINUTES    
    •  CHECK_SHINKEN_TIMEOUT 
  • Voici un tableau récapitulatif du statut attendu suivant le retour de sonde :

Les vérifications communes

Excerpt Include
Liste des événements sur les démons modifiant le résultat des checks
Liste des événements sur les démons modifiant le résultat des checks
nopaneltrue

Les vérifications spécifiques

Situation

Statut

Le temps de connexion à la base de données :

  • Si c'est supérieur à THRESHOLD_CPU_STOLEN_CRITICAL par défaut : 10%  )

CRITIQUE

Le temps de connexion à la base de données :

  • Si c'est supérieur à THRESHOLD_CPU_STOLEN_WARNING (  par défaut : 5%  )

ATTENTION

Le temps de connexion à la base de données :

  • Si c'est supérieur à SCHEDULER__RETENTION__RENTENTION-IS-TOO-OLD-AFTER_X_MINUTES (  par défaut : 5%  )

ATTENTION

Si la sonde n'a pas eu de réponse avant le temps maximum

  • Si supérieur à CHECK_SHINKEN_TIMEOUT ( par défaut : 3 sec   )
INCONNU

Résultat

Renvoi au format texte : 

  • Une mention qui indique si le Poller est actif ou passif. Dans l'exemple, on a affaire à un Poller actif.
  • La liste des tags du Poller. Dans l'exemple, aucun tag n'est défini sur le Poller.
  • La latence de connexion avec le ou les Schedulers du royaume et des sous-royaumes

Résultat Long

Pas de résultat long pour ce check.

Description des erreurs

Excerpt Include
Les vérifications communes à tous les démons
Les vérifications communes à tous les démons
nopaneltrue

Excerpt Include
Les vérifications de vol de CPU
Les vérifications de vol de CPU
nopaneltrue

Métriques

Scroll Title
anchorparameter_check_metrics
title
NomUnitéDescription
No Format
languagetext
themeEmacs
nb_check_in_timeout
---

Nombre de checks qui sont entrés en timeout sur le Poller pendant les 20 dernières minutes. Cette durée est configurable dans le fichier de configuration du Poller, avec l'option keep_timeout_time ( par défaut 1200s )