Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.
Scroll Ignore
scroll-pdftrue
scroll-officetrue
scroll-chmtrue
scroll-docbooktrue
scroll-eclipsehelptrue
scroll-epubtrue
scroll-htmltrue
Panel
titleSommaire

Table of Contents
stylenone

Contexte

Vérifie que le démon Scheduler peut être correctement contacté sur le réseau et affiche son numéro de version.

Affiche également le nombre d'éléments qu'il gère dans un tableau, en distinguant les hôtes, les Clusters et les Checks et le Total des éléments. (   Résultat court   )

Présente la liste les démons auxquels le Scheduler doit se connecter, et l'état des connexions (  Résultat long  ).

Donne un état des modules chargés (  Résultat long  ).

La supervision d'un démon Poller présente un grand nombre de statistiques de performances qui permettent de visualiser le travail effectué par le Poller. Le Poller a pour rôle d'exécuter les checks.

Il est ainsi souvent un des premiers démons que l'on regarde lorsqu'on veut visualiser combien de checks sont exécutés. Aussi, pour dimensionner correctement une installation Shinken Entreprise, il est important de pouvoir visualiser combien de checks un Poller est capable d'exécuter pour pouvoir décider d'ajouter ou retirer des Pollers de la configuration.

Les checks du Poller fournis dans le pack Shinken fournissent donc un grand nombre de données sur les performances du Poller.


Panel

Image Added

Panel

Image Removed

Paramétrage

Le check utilise la ligne de commande suivante :

Code Block
languagebash
themeEmacs
$PLUGINSDIR$/check_shinken -H "$HOSTADDRESS$" -p "$ARG2$" --shinkenversion "$SHINKENVERSION$" -t schedulerpoller -m $ARG1$ --lactive_poller_latency "lck-$LASTSERVICECHECK$"

"$_HOSTACTIVE_POLLER_LATENCY$" --passivecheck_poller_latencytolerate "$_HOSTPASSIVE_POLLER_LATENCY$_HOSTPOLLER_NB_CHECK_IN_TIMEOUT_TOLERATE$" --timeout "$_HOSTCHECK_SHINKEN_TIMEOUT$" -w 
"$_HOSTTHRESHOLD_CPU_STOLEN_WARNING$" -c 
"$_HOSTTHRESHOLD_CPU_STOLEN_CRITICAL$" --scheduler_too_old_retention_save_margin "$_HOSTSCHEDULER__RETENTION__RENTENTION-IS-TOO-OLD-AFTER_X_MINUTES$"

 

Données utilisées provenant du modèle

Données communes pour les checks du modèle

excerpt-include

Modèle shinken-schedulerModèle shinken-scheduler


Données spécifiques pour ce check

 Pas de données spécifiqiue pour ce check.

Les données DFE ( Duplicate Foreach )

NomModifiable sur UnitésDéfautValeur par défaut à l'installation de ShinkenDescription
No Format
SCHEDULERPOLLER_LIST
SCHEDULERPOLLER_LIST
--

Modèle d'hôte

( Onglet Données )

9768

Configuration du port de communication avec l'Arbiter.

Autres check(s) impacté(s) :

Note : Cette valeur remplacera dans la commande la valeur $ARG2$

Données utilisées provenant du check

 Pas de données provenant du check pour ce check.

Données globales

Excerpt Include
Mise en place du Pack windows
Mise en place du Pack windows
nopaneltrue

Résultat

Exemple

Panel

Image Removed  Image Added 

Interprétation

Statut

Il peut prendre quatre valeurs  OK / CRITIQUE / ATTENTION   /   INCONNU .

  • Le statut va dépendre du retour de sonde et de la configuration spécifique du check pour les données suivantes :
    •   THRESHOLD_CPU_STOLEN_CRITICAL
    •  THRESHOLD_CPU_STOLEN_WARNING
    •  SCHEDULER__RETENTION__RENTENTION-IS-TOO-OLD-AFTER_X_MINUTES    
    •  CHECK_SHINKEN_TIMEOUT 
  • Voici un tableau récapitulatif du statut attendu suivant le retour de sonde :

Situation

Statut

Le temps de connexion à la base de données :

  • Si c'est supérieur à THRESHOLD_CPU_STOLEN_CRITICAL par défaut : 10%  )

CRITIQUE

Le temps de connexion à la base de données :

  • Si c'est supérieur à THRESHOLD_CPU_STOLEN_WARNING (  par défaut : 5%  )

ATTENTION

Le temps de connexion à la base de données :

  • Si c'est supérieur à SCHEDULER__RETENTION__RENTENTION-IS-TOO-OLD-AFTER_X_MINUTES (  par défaut : 5%  )

ATTENTION

Si la sonde n'a pas eu de réponse avant le temps maximum

  • Si supérieur à CHECK_SHINKEN_TIMEOUT ( par défaut : 3 sec   )
INCONNU

Résultat

Renvoi au format texte : 

  • L'état de fonctionnement du Scheduler, ainsi que le nombre d'hôtes, de clusters, de checks et le nombre total d'éléments gérés par le Scheduler.

Résultat Long

Renvoi au format texte :

  • Une liste des démons ( Schedulers, Pollers passifs, Reactionners passifs ) auxquels le Schedulers doit se connecter, pour chacun des démons :
    • Son nom ( suivi des tags gérés pour les Pollers passifs ou pour les Reactionners passifs )
    • Son type
    • La valeur du paramètre timeout renseigné dans le fichier de configuration de ce démon ( qui correspond au délai potentiel maximal requis pour le contacter )
    • L'état de la connexion
    • La liste des modules chargés ainsi que leur état

Métriques

NomUnitéDescription
No Format
languagetext
themeEmacs
checksused_todoram_by_secpercent
--

Nombre de vérifications d'hôtes et de checks générées par seconde dans le Scheduler ( moyenne glissante calculée sur 1 min ).Pourcentage de mémoire utilisée sur le serveur

No Format
languagetext
themeEmacs
nbcpu_reactionnersusage_in_overloadpercent
--

Nombre de Reactionners connectés à ce Scheduler en surcharge.Pourcentage de temps processeur utilisé par le Poller

No Format
languagetext
themeEmacs
nb_pollers
--Nombre de Pollers connectés à ce Scheduler.
No Format
languagetext
themeEmacs
nb_reactionners
--

Nombre de Reactionners connectés à ce Scheduler.

No Format
languagetext
themeEmacs
checks_done_by_sec
--Nombre de résultats de vérification d'hôtes et de checks donnés par les Pollers par seconde ( moyenne glissante calculée sur 1 min ).
poller_load_state
--

Booléen ( 0 ou 100 ) qui indique si le Poller a atteint sa charge maximale :

  • 0 : Le Poller n'a pas atteint sa charge maximale, il peut encore exécuter des checks supplémentaires
  • 100 : Le Poller a atteint sa charge maximale, il ne peut pas exécuter plus de checks
No Format
languagetext
themeEmacs
average_scheduler_cpu_usage
--

Durée d'un cycle de traitement du Scheduler.

  • Le maximum est à 100.
  • Plus cette valeur est haute plus cela indique une charge sur le Scheduler.
No Format
languagetext
themeEmacs
notifications_and_event_handlersnb_action_done_byper_sec
--

Nombre

de notifications & event handlers fait par les Reactionners par seconde

moyen de checks exécutés par le Poller (moyenne glissante calculée sur

1 min

1mn )

.

No Format
languagetext
themeEmacs
notificationscpu_todorunning_by_secqueue
--Nombre de notifications générées par seconde dans le Scheduler ( moyenne glissante calculée sur 1 min ).
No Format
languagetext
themeEmacs
save_retention_time
--Durée en seconde de la dernière sauvegarde de rétention
No Format
languagetext
themeEmacs
event_handlers_todo_by_sec
--Nombre d'event handlers générées par seconde dans le Scheduler Queue moyenne de checks exécutés par le Poller (moyenne glissante calculée sur 1 min ).
No Format
languagetext
themeEmacs
load_retention_time
--

Durée en seconde du dernier chargement de rétention

No Format
languagetext
themeEmacs
average_scheduler_cpu_estimated_overload
--

Estimation de la surcharge du Scheduler.

  • Si cette métrique est à zéro alors le Scheduler n'est pas en surcharge.
  • Si cette métrique est trop souvent supérieure à 0, c'est l'indication qu'il y a besoin d'un Scheduler supplémentaire.
No Format
languagetext
themeEmacs
nb_pollers_in_overload
--Nombre de Pollers connectés à ce Scheduler en surcharge.1mn )