Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.
Panel
titleSommaire

Table of Contents

Contexte

Le check CPU Stats SSH va utiliser des commandes à travers votre serveur SSH pour rechercher des informations sur votre CPU, tel que le nombre de coeurs, la fréquence, le pourcentage d'utilisation du processeur au cours de la dernière seconde et pour finir, si votre utilisation du processeur est trop importante, les X processus utilisant le plus gros du processeur ( X étant la donnée CPU_MAX_PROCESS modifiable dans la configuration ) avec une notation "étoile" permettant de voir quels processus sont les plus consommateurs.

Le seuil choisi pour la consommation d'un processus sera la valeur du processus le plus consommateur et fera office de base pour trouver quels processus sont les plus consommateurs. En effet nous n'affichons pas le pourcentage de CPU utilisé par chaque processus car ceux-ci ne représentent que l'utilisation globale à un instant T.

Le nombre d’étoiles ( correspondant à la consommation du CPU ) de chaque processus sera déterminé en fonction du processus le plus consommateur au moment du check. Le processus ayant 5 étoiles n'est donc pas obligatoirement un processus qui surcharge votre CPU, il s'agit uniquement du plus consommateur au moment du check.

Si vous souhaitez voir en détail l'algorithme de calcul de consommation, rendez-vous en bas de page pour lire les schémas d'explication de l'algorithme.

Info
Le check CPU Stats SSH utilise le paquet SysStat. Si votre serveur Linux ne dispose pas de cette librairie, il faudra l'installer.
Info

Afin de récupérer le pourcentage d'utilisation du CPU au cours d'une seconde, le check durera au moins une seconde, lui permettant de calculer le pourcentage au niveau de celle-ci.

Paramétrage

Le check utilise la ligne de commande suivante :

Code Block
languagetext
themeEmacs
$USERPLUGINSDIR$/linux_by_ssh/check_cpu_stats_by_ssh_rust -H "$HOSTADDRESS$" -u "$_HOSTSSH_USER$" -p "$_HOSTSSH_PORT$" -i "$_HOSTSSH_KEY$" -P "$_HOSTSSH_KEY_PASSPHRASE$" -w "$_HOSTCPU_WARN$" -c "$_HOSTCPU_CRIT$" -m "$_HOSTCPU_MAX_PROCESS$"

Données utilisées provenant des modèles

Données communes pour les checks des modèles

Authentification

Excerpt Include
NEW_PAGE - 004.0 - SEF-10821 - Modèle linux_by_ssh
NEW_PAGE - 004.0 - SEF-10821 - Modèle linux_by_ssh
nopaneltrue

Données spécifiques pour ce check

DonnéeDescriptionValeur par défaut
No Format
CPU_CRIT
Définit le pourcentage d'utilisation du processeur à partir duquel le check passe en critique90
No Format
CPU_WARN
Définit le pourcentage d'utilisation du processeur à partir duquel le check passe en warning80
No Format
CPU_MAX_PROCESS
Définit le nombre de processus alarmant à afficher au maximum10

Données DFE ( Duplicate Foreach )

Pas de données DFE pour ce check

Données utilisées provenant du check

Pas de données spécifiques pour ce check

Résultat

Exemple

Interprétation des données

Statut

Le statut peut prendre 4 valeurs différentes ( OK / WARNING / CRITICAL /  UNKNOWN ).

  • Le seuil du statut CRITICAL est 90%.
  • Le seuil du statut WARNING est de 80%.

Résultat

Le résultat contient un message indiquant le statut ainsi que l'utilisation du CPU en pourcentage.

Résultat Long

  • Le résultat long contient un tableau qui liste les 10 processus les plus consommateurs ( le nombre de processus correspond à la donnée CPU_MAX_PROCESS ), ainsi qu'un indice sur leur impact.

Métriques

Nom de la métriqueUnitéDescription
cpu__all_usage%Retourne le pourcentage de temps CPU actif au cours de la dernière seconde
cpu_(numerocpu)_sys%Retourne le pourcentage de temps CPU utilisé par le noyau Linux au cours de la dernière seconde
cpu_(numerocpu)_usr%Retourne le pourcentage de temps CPU utilisé par les processus en espace utilisateur au cours de la dernière seconde
cpu_(numerocpu)_soft%Retourne le pourcentage de temps CPU utilisé par les interruptions logicielles au cours de la dernière seconde
cpu_(numerocpu)_guest%Retourne le pourcentage de temps CPU utilisé par les processeurs virtuels au cours de la dernière seconde
cpu_(numerocpu)_idle%Retourne le pourcentage de temps CPU inactif au cours de la dernière seconde
cpu_(numerocpu)_irq%Retourne le pourcentage de temps CPU utilisé par les interruptions matérielles au cours de la dernière seconde
cpu_(numerocpu)_nice%Retourne le pourcentage de temps CPU utilisé par les processus en espace utilisateur dont le nice a été changé au cours de la dernière seconde
cpu_(numerocpu)_iowait%Retourne le pourcentage de temps CPU utilisé pour effectuer des attentes d'entrées/sorties au cours de la dernière seconde
cpu_(numerocpu)_steal%Retourne le pourcentage de temps CPU utilisé par une attente involontaire imposée par un hyperviseur au cours de la dernière seconde
Info

Tous les métriques contenant le mot (numerocpu) dans le teableau ci-dessus seront dupliqué en fonction du nombre de CPUs présents sur le serveur supervisé.

Exemple ( pour 2 CPUs ) :

  • cpu_0_sys
  • cpu_0_usr
  • ...
  • cpu_1_sys
  • cpu_1_usr
  • ...

Détails de l'algorithme