Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.
Comment: Make by tools (01.00.01) - action=clean_macro_parameter
Scroll Ignore
scroll-pdftrue
scroll-officetrue
scroll-chmtrue
scroll-docbookhtmltruefalse
scroll-eclipsehelpdocbooktrue
scroll-epubeclipsehelptrue
scroll-htmlepubtrue
Panel
titleSommaire

Table of Contents
stylenone

Contexte

Vérifie que le démon Pollerpeut Poller peut être correctement contacté sur le réseau et affiche son numéro de version.

Affiche également le nombre d'éléments qu'il gère dans un tableau, en distinguant les hôtes, les Clusters et les Checks et le Total des éléments. (   Résultat court   )

Présente la liste les démons auxquels le Scheduler doit se connecter, et l'état des connexions (  Résultat long  ).

Donne un état des modules chargés (  Résultat long  ).


Panel
Image Removed

Image Added

Paramétrage

Le check utilise la ligne de commande suivante :

bashEmacs
Scroll Title
title
Code Block
language
js
theme
Confluence
$PLUGINSDIR$/check_shinken -H "$HOSTADDRESS$" -p "$ARG2$" --shinkenversion "$SHINKENVERSION$" -t scheduler -m $ARG1$ -l "lck-$LASTSERVICECHECK$"
 --passive_poller_latency "$_HOSTPASSIVE_POLLER_LATENCY$" --timeout "$_HOSTCHECK_SHINKEN_TIMEOUT$" -w "$_HOSTTHRESHOLD_CPU_STOLEN_WARNING$" -c 
"$_HOSTTHRESHOLD_CPU_STOLEN_CRITICAL$" --scheduler_too_old_retention_save_margin "$_HOSTSCHEDULER__RETENTION__RENTENTION-IS-TOO-OLD-AFTER_X_MINUTES$"



Données utilisées provenant du modèle

Données communes pour les checks du modèle

Provenant du modèle shinken

Excerpt Include
Modèle shinken
Modèle shinken
nopaneltrue

Provenant du modèle shinken-daemon

Excerpt Include
Modèle shinken-poller ( Modèle d'hôte )shinken-poller ( Modèle d'hôte )daemon
Modèle shinken-daemon
nopaneltrue

Provenant du modèle shinken-poller

Excerpt Include
Le Poller
Le Poller
nopaneltrue

Données spécifiques pour ce check

  Pas de données spécifiqiue spécifiques pour ce check.

Les données DFE ( Duplicate Foreach )

NomModifiable sur UnitésDéfautValeur par défaut à l'installation de ShinkenDescription
No Format
POLLER_LIST
POLLER_LIST
--

Modèle d'hôte

( Onglet Données )

7771

Configuration du port de communication avec l'Arbiter.

Autres check(s) impacté(s) :

Note : Cette valeur remplacera dans la commande la valeur $ARG2$

Excerpt Include
Modèle shinken-poller
Modèle shinken-poller
nopaneltrue

Données utilisées provenant du check

   Pas de données provenant du check pour ce check.

Données globales

Excerpt Include
Mise en place du Pack windows
Mise en place du Pack windows
nopaneltrue

Résultat

Exemple

Panel

Image Added

Exemple d'un état de santé dégradé du Poller

Lorsque le Poller rencontre des problèmes qui peuvent signifier un fonctionnement dégradé, ces problèmes sont également remontés dans le résultat du check "Poller - Running Well".

Lorsque certains checks ont un temps d'exécution supérieur aux différents seuils définis, ils sont répertoriés dans le résultat du check "Poller - Running Well" pour permettre d'avertir des potentielles erreurs sur ces checks ou du Poller.


Dans l'exemple, le check signale que 10 checks ont pris plus que 10 secondes pour s'exécuter pendant les 20 dernières minutes, et ont leur exécution a donc été arrêtée de force.

Panel

Image Added

La durée de temps ( en secondes ) durant laquelle les checks sont conservés dans l'ensemble des checks en timeout est configurable dans le fichier de configuration du Poller concerné.

Il est également possible de définir un seuil de tolérance afin d'afficher un avertissement seulement lorsqu'il y a plus qu'un certain nombre de checks en timeout. Pour cela, il faut modifier la donnée NB_CHECK_IN_TIMEOUT_TOLERATE dans l'hôte concerné dans la configuration.


Code Block
languagejs
themeConfluence
title/etc/shinken/pollers/mon_poller.cfg
define poller {
    ...
    keep_timeout_time    1200
    ...
}
Image Removed

Interprétation

Statut

Il peut prendre quatre valeurs  OK / CRITIQUE / ATTENTION   /   INCONNU .

  • Le statut va dépendre du retour de sonde et de la configuration spécifique du check pour les données suivantes :
    •   THRESHOLD_CPU_STOLEN_CRITICAL
    •  THRESHOLD_CPU_STOLEN_WARNING
    •  SCHEDULER__RETENTION__RENTENTION-IS-TOO-OLD-AFTER_X_MINUTES    
    •  CHECK_SHINKEN_TIMEOUT 
  • Voici un tableau récapitulatif du statut attendu suivant le retour de sonde :

Les vérifications communes

Excerpt Include
Liste des événements sur les démons modifiant le résultat des checks
Liste des événements sur les démons modifiant le résultat des checks
nopaneltrue

Les vérifications spécifiques

Situation

Statut

Le temps de connexion à la base de données :

  • Si c'est supérieur à THRESHOLD_CPU_STOLEN_CRITICAL par défaut : 10%  )

CRITIQUE

Le temps de connexion à la base de données :

  • Si c'est supérieur à THRESHOLD_CPU_STOLEN_WARNING (  par défaut : 5%  )

ATTENTION

Le temps de connexion à la base de données :

  • Si c'est supérieur à SCHEDULER__RETENTION__RENTENTION-IS-TOO-OLD-AFTER_X_MINUTES (  par défaut : 5%  )

ATTENTION

Si la sonde n'a pas eu de réponse avant le temps maximum

  • Si supérieur à CHECK_SHINKEN_TIMEOUT ( par défaut : 3 sec   )
INCONNU

Résultat

Renvoi au format texte : 

  • L'état de fonctionnement du Scheduler, ainsi que le nombre d'hôtes, de clusters, de checks et le nombre total d'éléments gérés par le Scheduler.

Résultat Long

Renvoi au format texte :

  • Une liste des démons ( Schedulers, Pollers passifs, Reactionners passifs ) auxquels le Schedulers doit se connecter, pour chacun des démons :
    • Son nom ( suivi des tags gérés pour les Pollers passifs ou pour les Reactionners passifs )
    • Son type
    • La valeur du paramètre timeout renseigné dans le fichier de configuration de ce démon ( qui correspond au délai potentiel maximal requis pour le contacter )
    • L'état de la connexion
    • La liste des modules chargés ainsi que leur état
  • Une mention qui indique si le Poller est actif ou passif. Dans l'exemple, on a affaire à un Poller actif.
  • La liste des tags du Poller. Dans l'exemple, aucun tag n'est défini sur le Poller.
  • La latence de connexion avec le ou les Schedulers du royaume et des sous-royaumes

Résultat Long

Pas de résultat long pour ce check.

Description des erreurs

Excerpt Include
Les vérifications communes à tous les démons
Les vérifications communes à tous les démons
nopaneltrue

Excerpt Include
Les vérifications de vol de CPU
Les vérifications de vol de CPU
nopaneltrue

Métriques

Nom
Scroll Title
UnitéDescription
No Format
languagetext
themeEmacs
nb_hosts
--

Nombre d'hôtes gérés par ce Scheduler.

No Format
languagetext
themeEmacs
nb_clusters
--

Nombre de clusters gérés par ce Scheduler.

No Format
languagetext
themeEmacs
nb_late_checks	
--Nombre d'exécutions de checks ( pour les pollers ) en retard de lancement ( late ) dans ce Scheduler
anchorparameter_check_metrics
title
NomUnitéDescription
No Format
languagetext
themeEmacs
nb_
late
check_
event
in_
handlers
timeout
--

Nombre d’exécutions d'event handlers ( pour les reactionners ) en retard de lancement ( late ) dans ce Scheduler

No Format
languagetext
themeEmacs
nb_checks
-
-

Nombre de checks

gérés par ce Scheduler.
No Format
languagetext
themeEmacs
nb_late_notifications
--

Nombre d’exécutions de notifications ( pour les reactionners ) en retard de lancement ( late ) dans ce Scheduler

No Format
languagetext
themeEmacs
cpu_stolen__vmware__percent_ready
--( Seulement si le démon est situé sur une VM VMWare )
Valeur de l'indicateur VMWare %ready ( temps de blocage de la VM avant d'avoir accès à ses VCpu, donc temps perdu du point de vue de la VM

qui sont entrés en timeout sur le Poller pendant les 20 dernières minutes. Cette durée est configurable dans le fichier de configuration du Poller, avec l'option keep_timeout_time ( par défaut 1200s )