Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.


Scroll Ignore
scroll-pdftrue
scroll-officetrue
scroll-chmtrue
scroll-docbooktrue
scroll-eclipsehelptrue
scroll-epubtrue
scroll-htmltrue


Panel
titleSommaire

Table of Contents
stylenone

But du script de récupération

Le script shinken-gatherer a pour but de collecter des données en tâche de fond des démons.

Pour graphite:
  • Comptage du nombre d'hôtes et métriques présent dans les données de graphite.
  • Récupération de l'activité disque ( ça prend du temps pour avoir des valeurs stables donc trop long pour un check )



    Les fichiers de log du Gatherer sont situés dans le dossier /var/log/shinken/. Pour plus d'informations, consultez la page Fichiers Logs.

    Arrêt/démarrage du démon

    Lors de l'arrêt/démarrage du script, une ligne de log sera écrite.

    Code Block
    themeEmacs
    [2020-07-02 15:07:48] INFO   : [gatherer       ] [DAEMON          ] Receiving a stop (signal 15). Exiting.

    Lors d'un démarrage :

    Code Block
    themeEmacs
    [2020-07-02 15:07:50] INFO   : [gatherer       ] [DAEMON          ] Starting the gatherer as the process pid 21359.


    Erreur d'écriture du fichier de stats

    En cas d'erreur d'écriture du fichier de stats des performances disques ( /tmp/__check_graphite_iostats.tmp ) on a l'erreur avec la raison (ici plus d'espace disque):

    Code Block
    themeEmacs
    [2020-07-02 15:07:48] ERROR   : [gatherer       ] [IO-STATS          ] Cannot save io stats file /tmp
    Pour VMware:Récupération des statistiques de disponibilité CPU des machines virtuelles.

    Utilisation du script

    • /etc/init.d/shinken-gatherer start => vérifie qu'il n'est pas lancé, et le démarre si nécessaire
    • /etc/init.d/shinken-gatherer stop => vérifie qu'il est arrêté, et l'éteint si nécessaire
    • /etc/init.d/shinken-gatherer status => indique s'il est démarré ou éteint

    Les différents cas de démarrage du script

    Le script se lance automatiquement sur les actions suivantes :

    • Quand on lance shinken en entier ou un seul daemon ( /etc/init.d/shinken(*) start )
    • Si on lance carbon-cache ( /etc/init.d/carbon-cache start )
    • Si on le lance/arrête spécifiquement ( /etc/init.d/shinken-gatherer start/stop/status )

    Logs du script

    Le log du script est disponible sur /var/log/shinken/gathererd.log. Le niveau de log est INFO.

    A noter:

    • La rotation normale ( 6 jours ) des logs est active.
    • Le script accepte  les niveaux de log suivant : DEBUG, INFO, WARNING, CRITICAL.
    • Le niveau de log se change dans /etc/shinken/deamons/gathererd.ini
    Code Block
    themeEmacs
    # accepted log level values= DEBUG, INFO, WARNING, CRITICAL
    log_level=INFO

    Les données collectées

    Récupération du nombre d'hôte et métriques dans Graphite

    Le script compte :

    • Le nombre d'hôtes en comptant les répertoires dans /opt/graphite/storage/whisper
    • Le nombre de métriques en comptant les fichiers .wsp dans /opt/graphite/storage/whisper

    et mets le résultat dans /opt/graphite/storage/whisper/.nb_metrics.

    Warning
    titleImportant
    • Si le script n'a jamais tourné, graphite fera lui-même la vérification lorsqu'on lui demande le nombre d’hôtes et de métriques
    • Si le script ne fonctionne plus, graphite retournera des données qui ne sont plus à jour.
      • => Le shinken-healthcheck vous indiquera que l'information n'est plus à jour sur ce serveur.
      • => le check "Broker - $KEY$ - Module Visualisation UI - Metrology Reader" vous l'indiquera aussi.

    Récupération des données d'activité disque

    Il écrit le fichier /dev/shm
    /__check_graphite_iostats.tmp
    avec les données des disques (issu de /proc/diskstats) pour le %util de chaque disque ( physique, PAS partition )

    Si le script ne fonctionne pas:

    • Le check de graphite writer sera en UNKNOWN en mettant qu'il n'arrive pas à lire le fichier.

    Récupération des données de VMWare

    : No space left on device


    Récupération des statistiques VMware

    Sur des systèmes qui ne sont pas des VMware ou bien sur Windows (récupération non supportée)

    Si on lance le gatherer sous Windows, on aura :

    Code Block
    themeEmacs
    [YYYY-MM-DD HH:MM:SS] INFO : [ gatherer ] [ VMWARE STATS ] Currently VMWare is not supported


    Si on le lance sur un serveur qui n'est pas une VMware, on aura, une fois par heure :

    Code Block
    themeEmacs
    [YYYY-MM-DD HH:MM:SS] INFO : [ gatherer ] [ VMWARE STATS ] The server is not a VMWare server


    Sur un système où la récupération a été désactivée dans le gatherer

    Si la récupération des statistiques VMware est désactivée, on aura le message suivant :

    WarningLa variable vmware_statistics_compute_enable dans le fichier /etc/shinken/deamons/gathererd.ini permet de choisir l'activation de la récupération des données de VMWare.

    Code Block
    themeEmacs
    #
    [YYYY-MM-
    VMware management -- # Get the VMware statistics vmware_statistics_compute_enable=1
    DD HH:MM:SS] INFO : [ gatherer ] [ VMWARE STATS ] Currently the VMWare stats are disabled by the configuration


    Sur une VMWare

    Sur une machine virtuelle VMWare on aura deux lignes:

    • la première avec la valeur récupérée cette seconde

      Code Block
      themeEmacs
      [YYYY-MM-DD HH:MM:SS] INFO : [ gatherer ] [ VMWARE STATS ]  This second CPU Stolen: 21.1


    • La seconde avec la moyenne sur la dernière minute (valeur remontée si une commande shinken-healthcheck ou un check vient demander la valeur actuelle):

      Code Block
      themeEmacs
      [YYYY-MM-DD HH:MM:SS] INFO : [ gatherer ] [ VMWARE STATS ] Current VMWare CPU Stolen for this server: 10.5
    Il écrit le fichier /dev/shm/ vmware_stats_export.dat si le serveur est une VM VMWare. Il écrit dedans quand il a fait la vérification, si c'est une VM VMWare et la valeur du CPU Stolen (%ready + %costop).

    Si le script n'a pas tourné (depuis le redémarrage du serveur):

    • Le démon a qui on fait la demande va retourner que le serveur n'est pas une VMware.

    Si le script a déjà tourné (depuis le redémarrage du serveur), mais ne tourne plus:

    • Le démon va retourner les dernières valeurs mesurées:
    • Donc pas de soucis si VM/pas VM, ça ne change pas,
    • Mais les mesures CPU seront fausses