Contexte

Le check CPU Stats SSH va utiliser des commandes à travers votre serveur SSH pour rechercher des informations sur votre CPU, tel que le nombre de coeurs, la fréquence, le pourcentage d'utilisation du processeur au cours de la dernière seconde et pour finir, si votre utilisation du processeur est trop importante, les X processus utilisant le plus gros du processeur (X étant la donnée CPU_MAX_PROCESS modifiable dans la configuration) avec une notation "étoile" permettant de voir quels processus sont les plus consommateurs.

Le seuil choisi pour la consommation d'un processus sera la valeur du processus le plus consommateur et fera office de base pour trouver quels processus sont les plus consommateurs. En effet nous n'affichons pas le pourcentage de CPU utilisé par chaque processus car ceux-ci ne représentent que l'utilisation globale à un instant T. Pour essayer de trouver les processus les plus consommateurs nous essayons alors d'analyser une tendance.

Nous utilisons donc le pourcentage global du CPU consommé par les processus. Nous faisons une moyenne de ce pourcentage selon le nombre de CPU de votre machine pour ensuite réaliser une échelle "d'alarme" montrant intuitivement quels sont les processus à réellement surveiller ( voir la page Pack Linux ).


Note : Le check CPU Stats SSH utilise le paquet SysStat. Si votre serveur Linux ne dispose pas de cette librairie, il faudra l'installer (yum install sysstat)

Afin de récupérer le pourcentage d'utilisation du CPU au cours d'une seconde, le check durera au moins une seconde, lui permettant de calculer le pourcentage au niveau de celle-ci

Sommaire

Exemple

Exemple de résultat

Cas spécifique

Si le check a le statut "Unknown" :

       Installez le paquet sysstat (via la commande yum install sysstat, apt-get install sysstat, pacman -S sysstat ou yaourt -S sysstat, selon votre OS).

Données et métriques

Données

DonnéeDescriptionValeur par défaut
CPU_CRITDéfinit le pourcentage d'utilisation du processeur à partir duquel le check passe en critique90
CPU_WARNDéfinit le pourcentage d'utilisation du processeur à partir duquel le check passe en warning80
CPU_MAX_PROCESSDéfinit le nombre de processus alarmant à afficher au maximum10

Métriques

Nom de la métriqueDescription
cpu_(numerocpu)_sysPourcentage de temps CPU utilisé par le noyau Linux au cours de la dernière seconde
cpu_(numerocpu)_usrPourcentage de temps CPU utilisé par les processus en espace utilisateur au cours de la dernière seconde
cpu_(numerocpu)_softPourcentage de temps CPU utilisé par les interruptions logicielles au cours de la dernière seconde
cpu_(numerocpu)_guestPourcentage de temps CPU utilisé par les processeurs virtuels au cours de la dernière seconde
cpu_(numerocpu)_idlePourcentage de temps CPU inactif au cours de la dernière seconde
cpu_(numerocpu)_irqPourcentage de temps CPU utilisé par les interruptions matérielles au cours de la dernière seconde
cpu_(numerocpu)_nicePourcentage de temps CPU utilisé par les processus en espace utilisateur dont le nice a été changé au cours de la dernière seconde
cpu_(numerocpu)_iowaitPourcentage de temps CPU utilisé pour effectuer des attentes d'entrées/sorties au cours de la dernière seconde
cpu_(numerocpu)_stealPourcentage de temps CPU utilisé par une attente involontaire imposée par un hyperviseur au cours de la dernière seconde
cpu_(numerocpu)_usedPourcentage de temps pendant lequel le CPU est utilisé (de n'importe qu'elle manière) au cours de la dernière seconde

Cas particulier

"No processes found"

Il se peut que votre tableau ne vous affiche que le message "No processes found", dans ce cas votre machine est configurée au cas par cas et donc il nous est impossible de trouver les processus utilisés par les autres utilisateurs que celui utilisé pour la supervision.

Veuillez nous contacter en nous détaillant votre configuration.

Détails de l'algorithme

  • No labels