Sommaire

Contexte

Le check Disks Usage SSH analyse les partitions afin de détecter un éventuel manque d'espace libre ( toutes les partitions qui ne sont pas de type tmpfs ).

  • Un tableau récapitulatif de toutes les partitions est affiché dans les métriques.
  • Ce check indique la proportion occupée ainsi que l'espace utilisé, l'espace libre et la taille de chaque disque.

Paramétrage

Le check utilise la ligne de commande suivante :

$LINUXBYSSH_SHINKEN_PLUGINSDIR$/check_linux_health_by_ssh_rust --check check_disks_usage
    -H "$HOSTADDRESS$"
    -u "$_HOSTSSH_USER$"
    -p "$_HOSTSSH_PORT$"
    -i "$_HOSTSSH_KEY$"
    -P "$_HOSTSSH_KEY_PASSPHRASE$"
    -U "$_HOSTSTORAGE_UNIT$"
    -w "$_HOSTSTORAGE_WARN$"
    -c "$_HOSTSTORAGE_CRIT$"
    -m "$_HOSTSTORAGE_MOUNTS$"
    -x "$_HOSTSTORAGE_EXCLUDE_MOUNTS$"

Données utilisées provenant du modèle

Données communes pour les checks des modèles

Authentification

NomModifiable surUnitéDéfautValeur par défaut à l'installation de ShinkenDescription
SSH_KEY

l'Hôte

( Onglet Données )

--$SSH_KEY_KEY$    ~/.ssh/id_rsa

Chemin vers la clé SSH privé de l'utilisateur shinken, sur le serveur hébergeant le Poller qui exécutera le check. 

  • Cette clé doit être présente dans les clefs autorisées du compte utilisateur utilisé pour se connecter sur le serveur linux supervisé ( voir la donnée SSH_USER si dessous ).
SSH_KEY_PASSPHRASE

l'Hôte

( Onglet Données )

--$SSH_KEY_PASSPHRASE$''

Phrase secrète utilisée pour déchiffrer la clé privée de l'utilisateur ( si celle-ci est protégée par une passphrase ). La clé privée déchiffré est ensuite utilisée pour authentifier l'utilisateur.

SSH_PORT

l'Hôte

( Onglet Données )

--$SSH_PORT$22

Port de connexion SSH.

SSH_USER

l'Hôte

( Onglet Données )

--$SSH_USER$shinken

Nom de l'utilisateur pour se connecter sur le serveur supervisé.

Données spécifiques pour ce check

DonnéeModifiable surUnitéValeur par défautDescription
STORAGE_CRIT

l'Hôte

( Onglet Données )

%

90 %Définit le pourcentage d'utilisation disque d'au moins une partition à partir duquel le check passe en CRITIQUE.
STORAGE_WARN

l'Hôte

( Onglet Données )

%

80 %Définit le pourcentage d'utilisation disque d'au moins une partition à partir duquel le check passe en ATTENTION .
STORAGE_MOUNTS

l'Hôte

( Onglet Données )

--

ALL

Définit une liste de points de montage qui seront analysés, séparées par des virgules.

Afin de faire correspondre plusieurs points de montages avec une seule expression, le caractère spécial * peut être utilisé.
Si un élément de la liste est terminé par le caractère spécial *, alors tous les points de montages commençant par cet élément seront analysés.
Le caractère spécial * est valide uniquement lorsqu'il est présent à la fin d'un élément dans la liste.

Afin d'inclure tous les points de montages disponibles ( sauf ceux de type tmpfs ), la valeur spéciale ALL peut être utilisé.

Exemples :

Valeur
Explication
// sera analysé 
/usr,/var/usr et /var seront analysés
/,/mnt/*/ sera analysé, ainsi que tout les points de montages commençants par /mnt/
ALL
Tous les points de montages sont analysés.
STORAGE_EXCLUDE_MOUNTS

l'Hôte

( Onglet Données )

--

NONE

Définit une liste de points de montage à exclure de l'analyse, séparées par des virgules.

Afin d'exclure plusieurs points de montages avec une seule expression, le caractère spécial * peut être utilisé.
Si un élément de la liste est terminé par le caractère spécial *, alors tous les points de montages commençant par cet élément seront exclu de l'analyse.
Le caractère spécial * est valide uniquement lorsqu'il est présent à la fin d'un élément dans la liste

La valeur NONE peut être utilisé pour n'exclure aucun point de montage.

Exemples :

ValeurExplication
// sera exclu de l'analyse
/usr,/var/usr et /var seront exclu de l'analyse
/,/mnt/*/ sera exclu de l'analyse ainsi que tous les points de montages commençants par /mnt/
NONE
Aucun point de montage ne sera exclu de l'analyse
STORAGE_UNIT

l'Hôte

( Onglet Données )

--

GBDéfinit l'unité d'affichage: B, KB, MB, GB ou TB.

Données utilisées provenant du check

Pas de données spécifiques pour ce check

Résultat

Exemple

Interprétation des données

Statut

Il peut prendre 4 valeurs différentes  OK / CRITIQUE / ATTENTION / INCONNU .

  • Le statut va dépendre du retour de sonde et de la configuration spécifique du check pour les données suivantes :

    • STORAGE_CRIT
    • STORAGE_WARN
  • Voici un tableau récapitulatif du statut attendu suivant le retour de sonde :

Le texte de la colonne  "Affichage des seuils" montre les paramètres utilisés et leur valeur définie sur l'équipement supervisé.

 

Situation

Statut

Exemple

  • Les charges dépassent la valeur de STORAGE_CRIT

CRITIQUE

  • Les charges dépassent la valeur de STORAGE_WARN

ATTENTION

Résultat

Le résultat contient le statut du check, ainsi que le nombre de disques dépassant les seuils.

Résultat long

Le résultat long contient un tableau listant les disques trouvés avec :

  • Le taux d'utilisation du disque en %.
  • La quantité de données utilisées avec l'unité définit dans la variable STORAGE-UNIT.
  • La quantité de donnée totale avec l'unité définit dans la variable STORAGE-UNIT.

Métriques

Définition

Nom de la métriqueUnitéDescriptionSeuil d'avertissementSeuil critique
NOM_PARTITION )_totalSTORAGE_UNITQuantité de mémoire totale du disque----
( NOM_PARTITION )_usedSTORAGE_UNITQuantité de mémoire disque utilisée ( utilisant l'unité choisie dans les données )( NOM_DISQUE )_total * STORAGE_WARN / 100( NOM_DISQUE )_total * STORAGE_CRIT / 100
( NOM_PARTITION )_used_pct%Pourcentage d'occupation du disque

STORAGE_WARN

STORAGE_CRIT

Exemple

Remarques

On remarque que les 3 colonnes Usage / Used / Total ( présentes dans le tableau du résultat long ) ne sont pas tout à fait corrects ( en termes de valeur, par rapport à la taille physique de vos disques ).

  • En réalité, pour les partitions formatées en ext2 / ext3 / ext4 / xfs, Linux réserve par défaut 5% d'espace disque pour les opérations de maintenance du système, qui seront accessibles seulement par l'utilisateur "root".
    • Cela permet à l'administrateur système de toujours avoir accès à la machine, même si pour les applications, il n'y a plus de place.
  • En effet, en faisant le calcul, le pourcentage d'utilisation indiqué par le check ( et aussi la commande "df" de Linux ) ne correspond pas au contenu des colonnes "Used" et "Total". Cette différence est due à ces 5% réservés par le système.


En réalité, le pourcentage est quand même un indicateur fiable pour mesurer l'occupation du disque ( même s'il reste encore de la place "dédié" à l'utilisateur root ) :

  • D'une manière générale, les applications ne sont pas démarrées en tant que l'utilisateur "root" ( c'est au minimum très fortement déconseillé pour des raisons évidentes de sécurité ), et n'auront pas accès à cet espace disque réservé par le système.
  • Un disque indiqué plein par le check signifie que les applications qui utilisent ce disque auront très probablement des problèmes de fonctionnement et qu'il faut intervenir.


Cet espace réservé par défaut peut être visualisé/modifié avec la commande tune2fs:

Les Erreurs

Erreurs spécifiques à ce check

UI CONFIGURATION - PARAMETER ISSUE – Found [...] mounted partitions on the host, but none is matching the filtering parameters. 

Aucun point de montage ne correspond aux paramètres d'inclusions ou d'exclusions :

  • STORAGE_MOUNTS
  • STORAGE_EXCLUDE_MOUNTS



RESOLUTION :

Les paramètres suivants doivent être mise à jour :

  • STORAGE_MOUNTS
  • STORAGE_EXCLUDE_MOUNTS


Afin de mieux régler les paramètres de filtre, la commande suivante permet de lister les partitions disponibles sur le linux supervisé :

Les instructions suivantes sont à exécuter sur l'hôte supervisée.

df -TP

Erreurs de connexion ( communes à tous les checks )

UNKNOWN – Username/PublicKey combination invalid

La connexion a échoué, car la paire utilisateur / clef public n'est pas reconnu par l'hôte supervisée.


Résolution :


Possibles raisons :

  • L'utilisateur utilisé n'existe pas
  • La paire utilisateur / clef public n'est pas autorisé pour se connecter sur la machine supervisée.

UNKNOWN – Unable to extract public key from private key file : Unable to open private key file


La clef privée configurée par la donnée SSH_KEY n'existe pas.


UNKNOWN – Unable to extract public key from private key file : Wrong passphrase or invalid/unrecognized private key file format


Le mot de passe pour déchiffrer la clef privé n'est pas correct.


Résolution :


Vérifier la donnée SSH_KEY_PASSPHRASE.

UNKNOWN – Connection refused (os error 111)

La résolution DNS a échoué.


Résolution :


Vérifier l'adresse ou le nom utilisé pour se connecter à l'hôte

UNKNOWN – Name or service not known

La résolution DNS a échoué.


Résolution :


Vérifier l'adresse ou le nom utilisé pour se connecter à l'hôte