Qu'est-ce que le health check

Cet outil est utilisé pour vérifier :

  • L'état de l'installation de Shinken Enterprise, (version des démons).
  • L'état des principales options de configuration réseau (ports, adresses).
  • L'état des modules et sous-modules activés.
  • L'état des connexions réseau et la synchronisation d'horloge entre les démons.

Si il est lancé sur l'arbiter, il vérifiera tous les démons de l'architecture. Une option permet de ne vérifier que les option locaux.

Si il est lancé sur un serveur distant (scheduler, poller, etc...) seul le démon local sera vérifié.

Il s'agit d'un outil de diagnostic général qui peut détecter les problèmes les plus importants mais ne fournit pas autant d'information et de détail que les checks fournis par Shinken pour son propre monitoring, qui donnent par exemple des indicateurs de performance.

 

Usage:

shinken-healthcheck

 

Principales options:

OptionDescription
--version
Montre le numéro de version de Shinken.
-h, --help
Montre les différentes options acceptées par la commande.
-f, --file

Écrit la sortie de la commande dans un fichier, par exemple dans le but d'un envoi à l'équipe Shinken Solution.

 

Données de sortie

La sortie de la commande est constituée de plusieurs parties:

  • Architecture: au sujet de la configuration des démons
  • Libs: au sujet des librairies installées et nécessaires à Shinken Enterprise
  • Licence key: au sujet de votre clé de licence 
  • Modules:au sujet des Interfaces Utilisateurs
  • Storage: au sujet du stockage dans mongodb et dans graphite 

Il y a 3 niveaux en sortie:

  • OK: tout va bien
  • AT RISK: Problème pouvant potentiellement nuire au fonctionnement du système.
  • ERROR: Une erreur bloquante a été détectée.

Exemple d'informations envoyées

Voici un extrait de vérification pour un démon :

##################################################
This tool is used to check the state of your Shinken Enterprise (02.04.00) installation and configuration
Note: Global check launch as launch from a arbiter server
##################################################
  Healthcheck report 24/03/2017 14:08:44
--------------------------------------------------
shinken-healthcheck versions:
  Original installed version : 02.03.03.U01.fr
  Updated version            : 02.04.00-124.fr
##################################################

    --------------
    | Realm /All |
    --------------

        -----------
        | In All/ |
        -----------


                [broker: broker-master]
                    AT RISK: broker-master is defined with the localhost address. It is a problem in distributed mode. Please configure it with the LAN IP/FQDN address instead
                    OK:      Connection to daemon is OK at port 7772
                    OK:      Daemon version is: 02.04.00-124.fr
                    OK:      Correct connection from arbiter "arbiter-master" ( and no time shift )
                    Module WebUI:
                        OK:      Name: WebUI                   Type: webui
                        Submodules:
                            ERROR:   Name: auth-active-directory   Type: ad_webui
                                The module was not able to auth in the LDAP server. Please check your connection configuration and credentials.
                            OK:      Name: Mongodb                 Type: mongodb
                            OK:      Name: Cfg_password            Type: cfg_password_webui
                            OK:      Name: webui-enterprise        Type: webui_enterprise
                            OK:      Name: sla                     Type: sla
                    Modules:
                        OK:      Name: Simple-log              Type: simple-log
                        OK:      Name: trending                Type: trending
                        OK:      Name: sla                     Type: sla
                        OK:      Name: Livestatus              Type: livestatus
                        OK:      Name: Graphite-Perfdata       Type: graphite_perfdata
                    Talk to:
                        OK:      Reachable receiver satellite (receiver-1) at http://198.162.1.44:7773
                        OK:      Reachable poller satellite (poller-master) at http://198.162.1.44:7771
                        OK:      Reachable reactionner satellite (reactionner-master) at http://198.162.1.44:7769
                        OK:      Reachable scheduler satellite (scheduler-master) at http://198.162.1.44:7768 

 

On peut voir ici deux problèmes :

  • Le broker ici configuré est en adresse "localhost". C'est cette adresse qui est distribué aux démons pour contacter le broker, ce qui signifie qu'avec cette adresse, aucun démon distant ne pourra contacter ce broker
  • Un sous-module, ici l'authentification active-directory, est en erreur
  • Par ailleurs le démon est dans la bonne version, contacte correctement les autres satellites, et n'a pas de décalage temporel avec l'arbiter.