Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.
Scroll Ignore
scroll-pdftrue
scroll-officetrue
scroll-chmtrue
scroll-docbooktrue
scroll-eclipsehelptrue
scroll-epubtrue
scroll-htmltrue
Panel
titleSommaire

Table of Contents
stylenone

Contexte

Le check Shinken Graphite Status affiche le bon fonctionnement et les statistiques de la base de métrologie Graphite ( voir la page Base de métrologie ( Graphite ) )

Panel

Paramétrage

Le check utilise la ligne de commande suivante :

Code Block
languagetext
themeEmacs
$PLUGINSDIR$/check_shinken_graphite.py -H "$HOSTADDRESS$" -u "$_HOSTSSH_USER$" -p "$_HOSTSSH_PORT$" -i "$_HOSTSSH_KEY$" 
-P "$_HOSTSSH_KEY_PASSPHRASE$" -s "$_HOSTGRAPHITE_PORT$" -d "$_HOSTGRAPHITE_DATA_LOCATION$" -U "$_HOSTGRAPHITE_USER$" 
-w "$_HOSTGRAPHITE_STORAGE_WARNING$" -c "$_HOSTGRAPHITE_STORAGE_CRITICAL$" -n "$_HOSTGRAPHITE_CACHE_NAME$" -R "$_HOSTGRAPHITE_RELAY_NAME$"

Données utilisées provenant du modèle

Données communes pour les checks du modèle

Excerpt Include
Modèle shinken
Modèle shinken
nopaneltrue

Données spécifiques pour ce check

Nom

Modifiable sur 

Unités

Défaut

Valeur par défaut à l'installation de Shinken

Description

GRAPHITE_CACHE_NAME

Modèle d'hôte

( Onglet Données )

---carbon-cachecarbon-cache

Le nom du service utilisé pour le cache de Graphite.

GRAPHITE_DATA_LOCATION

Modèle d'hôte

( Onglet Données )

---/opt/graphite/storage/whisper/opt/graphite/storage/whisper

L'endroit où est stocké les métriques reçues.

GRAPHITE_PORT

Modèle d'hôte

( Onglet Données )

---20032003

Le port de connexion au serveur Graphite.

GRAPHITE_RELAY_NAME

Modèle d'hôte

( Onglet Données )

---carbo-relaycarbon-relay

Le nom du service utilisé pour le relai de Graphite.

GRAPHITE_STORAGE_CRITICAL

Modèle d'hôte

( Onglet Données )

%9595

Le seuil d'espace disque utilisé pour lequel on veut lever une alerte critique.

GRAPHITE_STORAGE_WARNING

Modèle d'hôte

( Onglet Données )

%8585

Le seuil d'espace disque utilisé pour lequel on veut lever un avertissement.

GRAPHITE_USER

Modèle d'hôte

( Onglet Données )

---apacheapache

Le nom d'utilisateur utilisé pour se connecter à la base Graphite.

SSH_KEY

Modèle d'hôte

( Onglet Données )

---$SSH_KEY$$SSH_KEY$

Le chemin vers le dossier où se trouve les clés SSH à utiliser pour se connecter au nœud où se situe le cache Graphite.

SSH_KEY_PASSPHRASE

Modèle d'hôte

( Onglet Données )

---

$SSH_KEY_PASSPHRASE$

$SSH_KEY_PASSPHRASE$

Le mot de passe de la clé SSH privée.

SSH_PORT

Modèle d'hôte

( Onglet Données )

---

$SSH_PORT$

$SSH_PORT$

Le port utilisé pour la connexion SSH.

SSH_USER

Modèle d'hôte

( Onglet Données )

---

$SSH_USER$

$SSH_USER$

Le nom d'utilisateur avec lequel se connecter pour la connexion SSH.

Les données DFE ( Duplicate Foreach )

 Pas de données DFE pour ce check.

Données utilisées provenant du check

Pas de données spécifiques pour ce check.

Données globales

Pas de données globales pour ce check.

Propriétés de l'hôte

Excerpt Include
Mise en place du Pack windows
Mise en place du Pack windows
nopaneltrue

Résultat

Exemple

Panel



Interprétation

Statut

Il peut prendre deux valeurs  OK / CRITIQUE / ATTENTION / INCONNU .

  • Le statut va dépendre du retour de sonde et de la configuration spécifique du check pour les données suivantes :
    • GRAPHITE_STORAGE_CRITICAL
    • GRAPHITE_STORAGE_WARNING
    • CHECK_SHINKEN_TIMEOUT

  • Voici un tableau récapitulatif du statut attendu suivant le retour de sonde :

Les vérifications spécifiques

Situation

Statut

En fonction du pourcentage d'espace disque utilisé par Graphite :

  • Si c'est supérieur à GRAPHITE_STORAGE_CRITICAL par défaut : 95% )

CRITIQUE

En fonction du pourcentage d'espace disque utilisé par Graphite :

  • Si c'est supérieur à GRAPHITE_STORAGE_WARNING par défaut : 85% )

ATTENTION

Si la sonde n'a pas eu de réponse avant le temps maximum

  • Si supérieur à CHECK_SHINKEN_TIMEOUT par défaut : 3 sec )
INCONNU

Résultat

Renvoi au format texte le bon fonctionnement de la base de métrologie Graphite.

Résultat Long

Mode du fonctionnement du cache

Une fois les hôtes ajoutés par l'export de l'architecture, les checks Shinken Graphite Status donnent les informations suivantes sur les hôtes :

  • File permission : Si le carbon-cache dispose de droits suffisants pour écrire sur le disque.
  • Metric reception : Des informations sur le service carbon-cache.
  • Storate I/O statistics : Des informations sur l'utilisation du disque (espace disponible, lecture et écriture) par le service carbon-cache.


Remarque: Il est possible de changer le type de cache utilisé, pensez à changer les variables GRAPHITE_CACHE_NAME par le nom du service de votre cache ( ou relay ) dans les hôtes concernés.

Dans le cas du carbon-relay, c'est la variable GRAPHITE_RELAY_NAME qu'il faut changer ( valeurs par défaut respectives : carbon-cache et carbon-relay ).


Panel

Erreur dans un check Shinken Graphite Status

Le check Shinken Graphite Status fait appel à deux services pour récupérer les données à afficher :

  1. carbon-cache : On a besoin de savoir si il peut recevoir les métriques.
  2. shinken-gatherer : Utilisé pour avoir des informations sur l'utilisation ( lecture & écriture ) du disque de l'hôte.

Pour vérifier l'état de ces services

Si un service n'est pas trouvé, une solution peut être de tenter de le relancer sur l'hôte en question à l'aide des commandes suivante :

Relancer le shinken-gatherer :

Code Block
languagetext
themeEmacs
service shinken-gatherer restart


Relancer le carbon-cache :

Code Block
languagetext
themeEmacs
service carbon-cache restart


Dans le cas où l'on ne peut pas récupérer les données sur l'utilisation du disque ( typiquement le shinken-gatherer  ne fonctionne pas ), l'erreur remontée est seulement catégorisée comme un avertissement puisque cela ne va pas bloquer le fonctionnement du carbon-cache. On ne peut juste pas être informé des statistiques sur le disque ( lecture et écriture ). Il est tout de même conseillé de résoudre le problème, car il peut être important de savoir si le disque de l'hôte est saturé.

Remarque: Le check utilise le nom des services pour vérifier leurs états. Si un service n'est pas trouvé, il est possible que les noms indiqués dans les variables GRAPHITE_CACHE_NAME et GRAPHITE_RELAY_NAME des hôtes ne soient pas ceux des services (en fonction des implémentations utilisées).

Panel

Métriques

Scroll Title
anchorparameter_check_metrics
title

Nom

Unité

Description

(adresse_graphite)_graphite_disk_(nom_du_disque)_IO
%

Utilisation du disque ( lecture et écriture ).

(adresse_graphite)_graphite_storage_size
%

Utilisation du disque ( espace utilisé ).

(nom_worker)_last_minute_work_time
seconde

Nombre de secondes où le worker à travailler durant la dernière minute.

(nom_worker)_last_minute_metrics_sent_nb
---Nombre de métriques que le worker a envoyé durant la dernière minute.