| Scroll Ignore | ||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ||||||||||||||
|
Contexte
Le check Broker - $KEY$ - Module Metrology Writer vérifie que le bon fonctionnement du module Graphite-Perfdata d'un démon broker ( voir la page Module Graphite-Perfdata )Visualisation UI - Metrology Reader affiche des statistiques concernant les métriques disponibles sur chaque serveur de métriques.
Il permet de vérifier que le module WebUI peut contacter les serveurs de métriques pour chacun des royaumes que la WebUI gère.
Pour chacun des serveurs graphite, le check va vérifier les points suivants :
- Est-ce que le module WebUI a accès au serveur graphite ?
- Combien d'hôtes sont hébergés sur le serveur ?
- Combien de métriques dispose le serveur ?
- Est-ce que le processus graphite fonctionne ?
- Est-ce que le serveur dispose d'assez d'espace disque ?
| Panel |
|---|
| Panel |
Paramétrage
Le check utilise la ligne de commande suivante :
| Scroll Title | |||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|
| |||||||||||
|
Données utilisées provenant du modèle
Données communes pour les checks du modèle
Provenant du modèle shinken
| Excerpt Include | ||||||
|---|---|---|---|---|---|---|
|
Données spécifiques pour ce check
Provenant du modèle shinken-broker-module-visualisation-ui
Excerpt Include Mode actif et mode passif Mode actif et mode passif nopanel true
| Excerpt Include | ||||||
|---|---|---|---|---|---|---|
|
| Excerpt Include | ||||||
|---|---|---|---|---|---|---|
|
Données spécifiques pour ce check
| Excerpt | |||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
| No Format |
|---|
BROKER_PORT |
Modèle d'hôte
( Onglet Données )
Configuration du port de communication avec le Broker.
Autres check(s) impacté(s) :
- Broker - $KEY$ - Performance API Connection
- Broker - $KEY$ - Performance API Connection
- Broker - $KEY$ - Performance Modules Queues
Note : Cette valeur remplacera la valeur $ARG1$ dans la commande
| No Format |
|---|
GRAPHITE_DATA_LOCATION |
Modèle d'hôte
( Onglet Données )
L'endroit où sont stockées les métriques reçues.
| No Format |
|---|
GRAPHITE_PROCESS_NAME |
Modèle d'hôte
( Onglet Données )
Le nom du service utilisé pour le cache de Graphite.
| No Format |
|---|
GRAPHITE_STORAGE_CRITICAL |
Modèle d'hôte
( Onglet Données )
%
Le seuil d'espace disque utilisé pour lequel on veut lever une alerte critique
| No Format |
|---|
GRAPHITE_STORAGE_WARNING |
Modèle d'hôte
( Onglet Données )
%
Le seuil d'espace disque utilisé pour lequel on veut lever un avertissement.
| No Format |
|---|
GRAPHITE_USER |
Modèle d'hôte
( Onglet Données )
---
Le nom d'utilisateur utilisé pour se connecter à la base Graphite.
| No Format |
|---|
SSH_KEY |
Modèle d'hôte
( Onglet Données )
---
| No Format |
|---|
SSH_KEY_PASSPHRASE |
|
| No Format |
|---|
SSH_PORT |
Modèle d'hôte
( Onglet Données )
---
| No Format |
|---|
SSH_USER |
Modèle d'hôte
( Onglet Données )
---
|
Les données DFE ( Duplicate Foreach )
Excerpt Include Modèle shinken-broker-module-metrologyvisualisation-writerui Modèle shinken-broker-module-metrologyvisualisation-writerui nopanel true
Données utilisées provenant du check
Pas de données spécifiques pour ce check.
Données globales
Propriétés de l'hôte
Mode de fonctionnement du graphite installé
Graphite configuré en mode "Cache"
Les données de métrologie sont stockées seulement dans un carbon-cache.
Il s'agit de la configuration avec laquelle Shinken est livrée.
- Vérifie que le module Graphite-Perfdata peut contacter le serveur hébergeant le service graphite.
- Vérifie que le service est disponible :
- port réseau ouvert,
- processus en cours d’exécution,
- suffisamment d'espace disque,
- permissions,
- statistiques d'entrées/sorties disque pour écrire les données de métrologie.
- Renvoie également les statistiques globales et pour chaque worker :
- Nombre de données reçues,
- volume et charge du module.
La charge du module est calculée à partir du temps de traitement utilisé par rapport au temps d’exécution que le module dispose pour traiter les données.
| Panel |
|---|
Graphite configuré en mode "relais"
Lorsque le service Graphite est configuré comme un relais vers d'autres nœuds de stockage, le check vérifie l'état du relais vers lequel le module Graphite-Perfdata envoie les métriques ; il se connecte également sur les nœuds vers lesquels le relais Graphite relaie les métriques.
Veuillez vous référer à la page Haute disponibilité de la base de métrologie (Graphite) pour la mise en place de cette architecture.
Le check donne :
- du détail sur le relai
- et un aperçu des nœuds carbon-cache.
Vous devez consulter les checks Shinken Graphite Status ( voir la page shinken-graphite ( Modèle d'hôte ) ) de ces nœuds pour obtenir les détails.
Dans l'exemple ci-contre, le module envoie ses données à un relais ( 192.168.1.58:2013 ), qui transmet les données à deux nœuds "cache" :
Paramètre du check
- Vu que le check est exécuté sur un Poller, il faut permettre à ce dernier d'accéder aux serveurs graphite en SSH.
- D’où la nécessité de paramétrer les donnéesSSH_KEY, SSH_KEY_PASSPHRASE, SSH_PORT, SSH_USER.
- REMARQUE : il est obligatoire en l’état du check actuel que cette même clef soit autorisée sur tous les serveurs graphites surveillés.
- Si un autre check Shinken a déjà été paramétré avec une clé SSH pour accéder au serveur graphite, il est bien sûr possible de reprendre cette même clé.
Données globales
| Excerpt Include | ||||||
|---|---|---|---|---|---|---|
|
Propriétés de l'hôte
| Excerpt Include | ||||||
|---|---|---|---|---|---|---|
|
Résultat
Exemple
| Panel |
|---|
| Info |
|---|
Les hôtes composant l'architecture Graphite sont automatiquement ajoutés à votre configuration par le listener Shinken ( voir la page Présentation détaillée où cette fonctionnalité est décrite en bas de page ). |
| Panel |
|---|
Vérifier le détail des carbon-caches
Pour chaque nœud d'un carbon-relay , il est possible d'avoir plus de détails sur son état en allant vérifier le résultat des checks Shinken Graphite Status pour chaque nœud correspondant. Ces checks sont présents sur des hôtes possédant le modèle d'hôte shinken-graphite .
| Panel |
|---|
| Info |
|---|
Pour plus d'informations sur ce check, veuillez vous référer à la page du modèle correspondant shinken-graphite ( Modèle d'hôte ). |
Envoi des données d'inventaire
Données spécifiques au serveur d'inventaire de métrologie
| No Format |
|---|
NB_METROLOGY_INVENTORY_SERVER_REQUESTS_DISPLAYED |
Modèle d'hôte
( Onglet Données )
Nombre de requêtes affiché
| No Format |
|---|
NB_METROLOGY_INVENTORY_SERVER_ERRORS_DISPLAYED |
Modèle d'hôte
( Onglet Données )
Nombre de requêtes en erreur affiché
Exemple d'affichage du check lorsque tout est OK pour les serveurs d'inventaire de métrologie
| Panel |
|---|
Différents cas d'erreur
Le serveur d'inventaire de métrologie a reçu des requêtes avec une mauvaise clé d'authentification :
| Panel |
|---|
Le serveur d'inventaire de métrologie n'est pas à jour par rapport à la configuration de l'Arbiter :
| Panel |
|---|
Résultat
Exemple
| Panel |
|---|
Interprétation
Statut
Il peut prendre deux valeurs OK / CRITIQUE / ATTENTION / INCONNU .
- Le statut va dépendre du retour de sonde et de la configuration spécifique du check pour les données suivantes :
- GRAPHITECHECK_STORAGE_CRITICAL,GRAPHITE_STORAGE_WARNING,METROLOGY_READER_SHINKEN_TIMEOUT
- CHECK_SHINKEN_TIMEOUT
Voici un tableau récapitulatif du statut attendu suivant le retour de sonde :
Les vérifications
communesspécifiques
Situation | Statut |
|---|---|
Le Graphite backend d'un royaume utilise un port non valide | CRITIQUE |
Le Graphite backend d'un royaume utilise n'a pas d'adresse | CRITIQUE |
Un ou plusieurs royaumes n'ont pas de Graphite backend | CRITIQUE |
Le Graphite backend d'un royaume n'utilise pas un protocole valide | CRITIQUE |
Un ou plusieurs royaumes n'est pas géré par le Broker | ATTENTION |
Le Broker est en cours d'arrêt | ATTENTION |
Si la connexion avec le Broker dépasse
| INCONNU |
Les vérifications spécifiques
Situation | Statut | CRITIQUE | En fonction du pourcentage d'espace disque utilisé :
| ATTENTION
|---|---|
Si la sonde n'a pas eu de réponse avant le temps maximum
| INCONNU |
Résultat
Renvoi au format texte :
- Si le démon serveur graphite fonctionne correctement, la version installée et le temps qu'a pris le check pour établir la communication avec le check.
Résultat Long
Précise le fonctionnement des modules du Broker, leur statut, le nombre de redémarrages lors des 24 dernières heures, la date de dernier redémarrage et les sous-modules
Description des erreurs
Echec de la connexion aux nœud
Cette erreur arrive lorsque la configuration n'est pas correcte. Il peut y avoir plusieurs sources à ce problème :
| Panel |
|---|
- et les statistiques des modules
Résultat Long
Rapport détaillé sur :
- Accès du serveur graphite par le module WebUI
- Nombre d'hôtes sont hébergés sur le serveur
- Nombre de métriques dispose le serveur
- Fonctionnement du processus graphite
- Disponibilité de suffisamment d'espace disque pour le serveur
Description des erreurs
Le Graphite backend d'un royaume utilise un port non valide
Si dans le graphite_backends d'une WebUI, une adresse utilise un port HTTP non valide, alors une erreur est remontée dans le check.
Par exemple, le graphite_backends suivant va remonter une erreur :
graphite_backends *:127.0.0.1:80, Italie:192.168.1.26:80, Japon:127.0.0.1:invalid_portLes métriques ne seront alors pas disponibles pour ce royaume.
| Panel |
|---|
Le Graphite backend d'un royaume utilise n'a pas d'adresse
Si dans la définition d'un Graphite backend d'un royaume, l'adresse ( ou l'IP ) est manquante, alors une erreur est remontée.
Par exemple, le graphite_backends suivant va remonter une erreur :
graphite_backends *:127.0.0.1:80, Italie::80, Japon:127.0.0.1:80Les métriques ne seront alors pas disponibles pour ce royaume.
| Panel |
|---|
Un ou plusieurs royaumes n'ont pas de Graphite backend
Si dans la définition d'un graphite_backends, un ou plusieurs royaumes n'ont pas d'adresse définie, mais qu'ils sont quand même gérés par le Broker, alors une erreur sera remontée dans le check.
Par exemple, un Broker gère les royaumes suivants : All, France, Italie, Japon
Maintenant, une des WebUI du Broker a le graphite_backends suivant :
graphite_backends France:192.168.1.23:80Alors, les royaumes "All, Italie et Japon" n'ont pas de Graphite backend défini par la WebUI, ce qui aura pour conséquence que les éléments de ces royaumes n'auront pas accès à leurs métriques.
| Panel |
|---|
Le Graphite backend d'un royaume n'utilise pas un protocole valide
Si la définition d'un Graphite backend utilise un protocole qui n'est pas valide, le check remonte une erreur pour le backend concerné.
Par exemple, le graphite_backends suivant va remonter une erreur :
graphite_backends *:192.168.1.23:80, France:htt://192.168.1.23:80Les métriques ne seront alors pas disponibles pour ce royaume.
| Panel |
|---|
Un ou plusieurs royaumes n'est pas géré par le Broker
Le check averti lorsqu'un royaume est présent dans la définition des graphite_backends de la WebUI et que celui-ci n'est pas géré par le Broker.
Par exemple, un Broker gère les royaumes : All, France, Italie, Japon
Mais la définition d'une de ses WebUI est la suivante :
graphite_backends *:127.0.0.1:80, Canada:192.168.1.44Dans ce cas, le royaume Canada n'est pas géré par le Broker et sera donc ignoré.
Ce problème ne bloque pas le fonctionnement du module, il suffit juste d'enlever ou de corriger l'adresse de ce royaume dans la configuration de la WebUI pour enlever cet avertissement.
| Panel |
|---|
Avertissement ou erreur dans un nœud
Lorsqu'un ou plusieurs nœuds remontent un dysfonctionnement, celui-ci apparaît dans le check Broker - $KEY$ - Module Metrology Writer. Un avertissement signifie qu'il y a une erreur non bloquante au fonctionnement normal du cache. Il est tout même conseiller d'essayer de résoudre ce problème. Pour avoir plus d'informations sur le problème remonté par le nœud, veuillez vous référer au check Shinken Graphite Status du nœud correspondant ( voir la page shinken-graphite ( Modèle d'hôte ) ).
| Note |
|---|
Remarque : Lorsque plusieurs erreurs ( par exemple un avertissement et une erreur critique ) surgissent sur un même nœud, seule la plus importante ( ici l'erreur critique ) sera affichée dans le retour du check Broker - $KEY$ - Module Metrology Writer ( comme sur l'image suivante ). |
| Panel |
|---|
Le Broker est en cours d'arrêt
Lorsque le Broker est en cours d'arrêt, le check le signale, et les informations relatives au module ne sont plus disponibles
| Panel |
|---|
Métriques
| Scroll Title |
|---|
| No Format | ||||
|---|---|---|---|---|
| ||||
IP_HOST_graphite_disk_sda_IO |
Taille en pourcentage des entrées/sorties utilisé sur le disque de la machine ou graphite est installé. HOST_ADRESS correspond à l'adresse IP ou au DNS de l'hôte.
| No Format | ||||
|---|---|---|---|---|
| ||||
IP_HOST_graphite_storage_size |
| ||||||||||
|
|
| No Format | ||||
|---|---|---|---|---|
| ||||
worker_X_last_minute_work_time |
|














