Contexte

Le modèle shinken-scheduler vous permet de superviser un hôte hébergeant le démon Scheduler.  



Description du modèle

Modèle d'hôte correspondant: shinken-scheduler    (notez que ce modèle hérite du modèle shinken)

Afin de superviser le démon Scheduler, le modèle shinken-scheduler appliqué à votre hôte, attachera plusieurs checks qui vérifieront la santé et la performance de ce démon.



Checks


Nom du checkDescriptionExemple de sortie
Scheduler - Running WellVérifie que le démon Scheduler peut être correctement contacté sur le réseau, Affiche le nombre d'élément qu'il gère dans un tableau, en distinguant les hôtes, les Clusters et les Checks. Vous aurez également le Total des éléments.

Scheduler - Performance

Affiche l'utilisation CPU ainsi que les statistiques des Pollers et des Reactionners qu'il gère. Si des limites de CPU ou de RAM sont atteintes sur vos Pollers, alors ces limites seront affichées.

Si certains de vos Pollers sont en spare, ils seront également affichés, avec le texte (SPARE) après leurs noms.


Paramètres du check

Les checks du Scheduler peuvent être configurés via des données fournies par le modèle.. Les paramètres SSH sont décrits sur la page  Rétention Mongodb

Les données suivantes sont disponibles pour le Scheduler:

Nom de la donnéeDescriptionValeur par défautHérité du modèle d'hôte ou locale
SHINKEN_PROTOCOLProtocole utilisé pour établir la connexion avec le Schedulerhttpshinken
SCHEDULER_PORTPort utilisé pour établir la connexion avec le scheduler7768Locale
PASSIVE_POLLER_LATENCY

Latence de connexion (en secondes)  au-delà de laquelle le check sort en erreur

0.5Locale


Interprétation des données de l'état de santé du Scheduler

Statistiques de l'état de santé du Scheduler




Exemple d'un état de santé dégradé du Scheduler





Interprétation des données de performance du Scheduler

La supervision d'un démon Scheduler présente un grand nombre de statistiques de performances qui permettent de visualiser le travail d'ordonnancement effectué par le Scheduler ainsi que les statistiques des Poller qui viennent se connecter sur celui ci.

Le démon Scheduler va effectuer tous le travail d'ordonnancement, et c'est à lui que vont s'adresser (en autres) les démons Poller et Reactionner pour récupérer les checks et les notifications à effectuer. Son bon fonctionnement est donc vital au bon fonctionnement de votre architecture Shinken. Aussi, pour dimensionner correctement une installation Shinken Entreprise, il est important de pouvoir visualiser combien de checks ses Poller satellites peuvent traiter, ainsi que leurs utilisations CPU et RAM.

Les checks du Scheduler fournis dans le pack Shinken fournissent donc un grand nombre de données sur les performances du Scheduler et de ses Pollers.

L'ensemble des informations se retrouve dans le résultat court du check.


Statistiques générales des performances du Scheduler


La première statistique remontée par le check est le pourcentage CPU moyen utilisé par le démon Scheduler sur le serveur supervisé.

La deuxième statistique remontée est le temps d'attente moyen d'un check sur le Scheduler avant d'être récupéré par un Poller pour traitement.



Information générale des Satellites du Scheduler


Suite aux statistiques générales, un premier tableau rassemble les données de performance des satellites du Scheduler de type Poller.


La première partie du tableau (les trois premières colonnes) identifie les Pollers, en affichant leurs noms, leurs appartenances à un Royaume, et enfin leurs tags (None si aucun tag n'est associé au Poller).



Statistiques des checks


Les deux colonnes suivantes affichent les performances de traitement des checks des Pollers :

  • checks todo : Moyenne du nombre de check à traiter par le Poller (en checks par seconde)
  • checks done : Moyenne du nombre de check traités par le Poller (en checks par seconde) 


Vous pourrez donc avoir l'information du nombre de checks récupérés et traités par vos différents Pollers rattachés à ce Scheduler et ainsi pouvoir comparer les performances de vos Pollers suivant leur positionnement dans votre architecture réseau, ou suivant leur puissance matérielle.





Utilisation du CPU

CPU Available


La colonne "CPU available" concernent les performances CPU des Pollers.

Cette information représente la charge du Poller. Il s'agit d'un indicateur général indiquant si le Poller peut encore supporter des checks supplémentaires, ou si il est chargé au maximum. Cet indicateur n'est pas lié aux autres indicateurs de performances de la machine (File d'attente CPU, mémoire) 

Une pastille orange précédant la mention "Poller load" signifie que le Poller ne peut plus prendre de checks supplémentaires.

C'est donc un signe indiquant qu'il faudrait ajouter un Poller supplémentaire dans l'architecture Shinken.

Si tous vos Pollers sont en surcharge, alors les checks ne pourront plus être récupérés, et vous aurez des retards visibles dans le retour de votre check "Scheduler - Running Well".

Il vous faudra de toute urgence rajouter des Pollers dans votre royaume.



Voici par exemple une surcharge d'un Poller.

screen NO MORE CPU USABLE

Metrics: CPU used by the poller


La colonne "Metrics: CPU used by the poller" permet d'afficher la consommation CPU utilisée par le Poller.

Lorsque le Poller utilise le maximum de CPU possible sur le serveur, une information apparaît.


Plus il y a d'application sur votre serveur Poller consommant du CPU, moins votre démon pourra utiliser de CPU.




Screen Limit reached

Metrics: CPU Running queue on the poller







Utilisation de la RAM

% used RAM on the server





Screen Limit reached

Information des Reactionners Satellites