| Scroll Ignore | ||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ||||||||||||||
|
Contexte
Dans une installation où une haute disponibilité a été paramétré pour le stockage de la métrologie ( un carbon-relay et 2 carbone-cache ), le modèle shinken-graphite vous permet de superviser les nœuds de stockage ( carbon-cache ).
| Info |
|---|
Avant d'aller plus loin, nous vous conseillons de lire les chapitres suivant :
|
Il permet d'obtenir des informations sur les nœuds d'écriture ( carbon-cache ) grâce au check Shinken Graphite Status qui lui est rattaché ( détaillé plus bas sur cette page ).
Ce modèle est attaché automatiquement aux hôtes grâce au listener Shinken aux hôtes possédant un carbon-cache relié à un carbon-relay.
- Vous pouvez aussi l'accrocher manuellement.
Les données
Les données communes pour tous les checks
Provenant du modèle shinken
Pas de données communes pour ce check.
Provenant du modèle shinken-daemon
Pas de données provenant du modèle shinken-daemon pour ce check.
Données
globalesspécifiques pour ce check
Le modèle est paramétrable via des données fournies par le modèle.
Les données sont les suivantes :
GRA
| GRAPHITE_CACHE_NAME |
PHITE_RELAY_NAME
| Info |
|---|
Le SSH est utilisé pour se connecter au serveur graphite afin de vérifier que le processus indiqué est bien en cours d'exécution, que le serveur dispose d'assez d'espace de stockage et que l'utilisation du disque ( lecture & écriture ) est correcte. |
| Nom | Modifiable sur | Unités | Défaut | Valeur par défaut à l'installation de Shinken | Description | ||
|---|---|---|---|---|---|---|---|
| Modèle d'hôte ( Onglet Données ) | --- | carbon-cache | carbon-cache | Le nom du service utilisé pour le cache de Graphite. | ||
| Modèle d'hôte ( Onglet Données ) | --- | carbo-relay | carbon-relay | Le nom du service utilisé pour le relai de Graphite. | ||
| Modèle d'hôte ( Onglet Données ) | --- | /opt/graphite/storage/whisper | /opt/graphite/storage/whisper | L'endroit où est stocké les métriques reçues. | ||
| Modèle d'hôte ( Onglet Données ) | --- | 2003 | 2003 | Le port de connexion au serveur Graphite. | ||
| Modèle d'hôte ( Onglet Données ) | --- | 95 | 95 | Le seuil ( en pourcentage ) d'espace disque utilisé pour lequel on veut lever une alerte critique. | ||
| Modèle d'hôte ( Onglet Données ) | --- | 85 | 85 | Le seuil ( en pourcentage ) d'espace disque utilisé pour lequel on veut lever un avertissement. | ||
| Modèle d'hôte ( Onglet Données ) | --- | apache | apache | Le nom d'utilisateur utilisé pour se connecter à la base Graphite. | ||
| Modèle d'hôte ( Onglet Données ) | --- | $SSH_KEY$ | $SSH_KEY$ | Le chemin vers le dossier où se trouver les clé SSH à utiliser pour se connecter au nœud où se situe le cache Graphite. | ||
| Modèle d'hôte ( Onglet Données ) | --- | $SSH_KEY_PASSPHRASE$ | $SSH_KEY_PASSPHRASE$ | Le mot de passe de la clé SSH privée. | ||
| Modèle d'hôte ( Onglet Données ) | --- | $SSH_PORT$ | $SSH_PORT$ | Le port utilisé pour la connexion SSH. | ||
| Modèle d'hôte ( Onglet Données ) | --- | $SSH_USER$ | $SSH_USER$ | Le nom d'utilisateur avec le quel se connecter pour la connexion SSH. |
Les données DFE ( Duplicate Foreach )
Pas de données DFE pour ce check.
Données globales
Pas de données global pour ce check.
Comment appliquer un modèle d'hôte à un hôte
| Excerpt Include | ||||||
|---|---|---|---|---|---|---|
|
Description des checks
Shinken Graphite Status
Mode du fonctionnement du cache
Une fois les hôtes ajoutés par l'export de l'architecture, les checks Shinken Graphite Status donnent les informations suivantes sur les hôtes :
- File permission : Si le
carbon-cachedispose de droits suffisants pour écrire sur le disque. - Metric reception : Des informations sur le service
carbon-cache. - Storate I/O statistics : Des informations sur l'utilisation du disque (espace disponible, lecture et écriture) par le service
carbon-cache.
Remarque: Il est possible de changer le type de cache utilisé, pensez à changer les variables GRAPHITE_CACHE_NAME par le nom du service de votre cache ( ou relay ) dans les hôtes concernés.
Dans le cas du carbon-relay, c'est la variable GRAPHITE_RELAY_NAME qu'il faut changer ( valeurs par défaut respectives : carbon-cache et carbon-relay ).
| Panel |
|---|
Erreur dans un check Shinken Graphite Status
Le check Shinken Graphite Status fait appel à deux services pour récupérer les données à afficher :
carbon-cache: On a besoin de savoir si il peut recevoir les métriques.shinken-gatherer: Utilisé pour avoir des informations sur l'utilisation ( lecture & écriture ) du disque de l'hôte.
Pour vérifier l'état de ces services
Si un service n'est pas trouvé, une solution peut être de tenter de le relancer sur l'hôte en question à l'aide des commandes suivante :
Relancer le shinken-gatherer :
service shinken-gatherer restart
Relancer le carbon-cache :
service carbon-cache restart
Dans le cas où l'on ne peut pas récupérer les données sur l'utilisation du disque ( typiquement le shinken-gatherer ne fonctionne pas ), l'erreur remontée est seulement catégorisée comme un avertissement puisque cela ne va pas bloquer le fonctionnement du carbon-cache. On ne peut juste pas être informé des statistiques sur le disque ( lecture et écriture ). Il est tout de même conseillé de résoudre le problème car il peut être important de savoir si le disque de l'hôte est saturé.
Remarque: Le check utilise le nom des services pour vérifier leurs états. Si un service n'est pas trouvé, il est possible que les noms indiqués dans les variables GRAPHITE_CACHE_NAME et GRAPHITE_RELAY_NAME des hôtes ne soient pas ceux des services (en fonction des implémentations utilisées).
| Panel |
|---|
Paramètres du check
| Nom de la donnée | Description | Valeur par défaut | Hérité d'un autre modèle ou locale |
|---|---|---|---|
| PLUGINSDIR | Chemin vers le dossier où se situe le script du check. | /var/lib/shinken/libexec | Donnée globale |
| HOSTADDRESS | Adresse de l'hôte où se situe de cache de Graphite. | Paramètre du script | |
| GRAPHITE_CACHE_NAME | Le nom du service utilisé pour le cache de Graphite. | carbon-cache | Donnée locale de l'hôte ( shinken-graphite ) |
| GRAPHITE_RELAY_NAME | Le nom du service utilisé pour le relai de Graphite. | carbon-relay | Donnée locale de l'hôte ( shinken-graphite ) |
| GRAPHITE_DATA_LOCATION | L'endroit où est stocké les métriques reçues. | /opt/graphite/storage/whisper | Donnée locale de l'hôte ( shinken-graphite ) |
| GRAPHITE_PORT | Le port de connexion au serveur Graphite. | 2003 | Donnée locale de l'hôte ( shinken-graphite ) |
| GRAPHITE_STORAGE_CRITICAL | Le seuil ( en pourcentage ) d'espace disque utilisé pour lequel on veut lever une alerte critique. | 95 | Donnée locale de l'hôte ( shinken-graphite ) |
| GRAPHITE_STORAGE_WARNING | Le seuil ( en pourcentage ) d'espace disque utilisé pour lequel on veut lever un avertissement. | 85 | Donnée locale de l'hôte ( shinken-graphite ) |
| GRAPHITE_USER | Le nom d'utilisateur utilisé pour se connecter à la base Graphite. | apache | Donnée locale de l'hôte ( shinken-graphite ) |
| SSH_KEY | Le chemin vers le dossier où se trouver les clé SSH à utiliser pour se connecter au nœud où se situe le cache Graphite. | ~/.ssh/id_rsa | Donnée locale de l'hôte ( shinken-graphite ) |
| SSH_KEY_PASSPHRASE | Le mot de passe de la clé SSH privée. | '' | Donnée locale de l'hôte ( shinken-graphite ) |
| SSH_PORT | Le port utilisé pour la connexion SSH. | 22 | Donnée locale de l'hôte ( shinken-graphite ) |
| SSH_USER | Le nom d'utilisateur avec le quel se connecter pour la connexion SSH. | shinken | Donnée locale de l'hôte ( shinken-graphite ) |
Métriques du check
En plus des retours sur l'état des composants liés à graphite, le check Shinken Graphite Status nous renvoie les métriques suivantes
| Métrique | Description | Exemple |
|---|---|---|
| (adresse_graphite)_graphite_disk_(nom_du_disque)_IO | Utilisation du disque ( lecture et écriture ) en pourcentage. | 192.168.1.123_graphite_disk_sda_IO=25% |
| (adresse_graphite)_graphite_storage_size | Utilisation du disque ( espace utilisé ) en pourcentage. | 192.168.1.123_graphite_storage_size=16% |
| (nom_worker)_last_minute_work_time | Nombre de secondes où le worker à travailler durant la dernière minute. | worker_0_last_minute_work_time=0.0021000 |
| (nom_worker)_last_minute_metrics_sent_nb | Nombre de métriques que le worker a envoyé durant la dernière minute. | worker_0_last_minute_metrics_sent_nb=256 |
Détails de la commande
| Nom du check | Commande du check | Ligne de commande |
|---|---|---|
| Shinken Graphite Status | check_shinken_graphite | $PLUGINSDIR$/check_shinken_graphite.py -H "$HOSTADDRESS$" -u "$_HOSTSSH_USER$" -p "$_HOSTSSH_PORT$" -i "$_HOSTSSH_KEY$" -P "$_HOSTSSH_KEY_PASSPHRASE$" -s "$_HOSTGRAPHITE_PORT$" -d "$_HOSTGRAPHITE_DATA_LOCATION$" -U "$_HOSTGRAPHITE_USER$" -w "$_HOSTGRAPHITE_STORAGE_WARNING$" -c "$_HOSTGRAPHITE_STORAGE_CRITICAL$" -n "$_HOSTGRAPHITE_CACHE_NAME$" -R "$_HOSTGRAPHITE_RELAY_NAME$" |
...

