Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.
Panel
titleSommaire

Table of Contents
stylenone

Contexte

Le check CPU Stats SSH by SSH va utiliser des commandes à travers votre serveur SSH pour rechercher des informations sur votre CPU, tel que le nombre de coeurscœurs, la fréquence, le pourcentage d'utilisation du processeur au cours de la dernière seconde et pour finir, si votre utilisation du processeur est trop importante, les X processus utilisant consommant le plus gros du processeur de CPU ( X étant la donnée CPU_MAX_PROCESS modifiable dans la configuration ) avec une notation "étoile" permettant de voir quels processus sont les plus consommateurs.

Le seuil choisi pour la consommation d'un processus sera la valeur du processus le plus consommateur et fera office de base pour trouver quels processus sont les plus consommateurs. En effet, nous n'affichons pas le pourcentage de CPU utilisé par chaque processus, car ceux-ci ne représentent que l'utilisation globale à un instant T.

Le nombre d’étoiles ( correspondant à la consommation du CPU ) de chaque processus sera déterminé en fonction du processus le plus consommateur au moment du check. Le processus ayant 5 étoiles n'est donc pas obligatoirement un processus qui surcharge votre CPU, il s'agit uniquement du plus consommateur au moment du check.

Si vous souhaitez voir en détail l'algorithme de calcul de consommation, rendez-vous en bas de page pour lire les schémas d'explication explications de l'algorithme.

Panel

Image Added

Info

Note : Le check CPU Stats SSH utilise le paquet SysStat. Si votre serveur Linux ne dispose pas de cette librairie, il faudra l'installer

.

( yum install sysstat )

Info

Afin de récupérer le pourcentage d'utilisation du CPU au cours d'une seconde, le check durera attendra au moins une seconde, lui permettant de calculer le pourcentage au niveau de celle-ci.

Paramétrage

Le check utilise la ligne de commande suivante :

Code Block
languagetextbash
themeEmacs
$USERPLUGINSDIR$/linux$LINUXBYSSH_bySHINKEN_sshPLUGINSDIR$/check_cpulinux_statshealth_by_ssh_rust --check check_cpu_stats
    -H "$HOSTADDRESS$"
    -u "$_HOSTSSH_USER$"
    -p "$_HOSTSSH_PORT$"
    -i "$_HOSTSSH_KEY$"
    -P "$_HOSTSSH_KEY_PASSPHRASE$"
    -w "$_HOSTCPU_WARN$"
    -c "$_HOSTCPU_CRIT$"
    -m "$_HOSTCPU_MAX_PROCESS$"

Données utilisées provenant des modèles

Données communes pour les checks des modèles

Authentification

Excerpt Include
NEW_PAGE - 004.0 - SEF-10821 - Modèle linux_-by_sshNEW_PAGE - 004.0 - SEF-10821 - Modèle linux_by_ssh-SSH
Modèle linux-by-SSH
nopaneltrue

Données spécifiques pour ce check

DonnéeModifiable sur
Description
UnitéValeur par défautDescription
No Format
CPU_CRIT

l'Hôte

( Onglet Données )

%

90 %Définit le pourcentage d'utilisation du processeur à partir duquel le check passe en
critique90
CRITIQUE.
No Format
CPU_WARN

l'Hôte

( Onglet Données )

%

80 %Définit le pourcentage d'utilisation du processeur à partir duquel le check passe en
warning
ATTENTION.
80
No Format
CPU_MAX_PROCESS

l'Hôte

( Onglet Données )

--

10Définit le nombre de processus alarmant à afficher au maximum
10
.

Données DFE ( Duplicate Foreach )

Pas de données DFE pour ce check

Données utilisées provenant du check

Pas de données spécifiques pour ce check

Résultat

Exemple

Panel
Image Removed

Image Added

Interprétation des données

Statut

Le statut

Il peut prendre

4

quatre valeurs

différentes (

  OK /

 WARNING / CRITICAL )

 CRITIQUE / ATTENTION / INCONNU 

UNKNOWN 

.

  • Le statut va dépendre du retour de sonde et de la configuration spécifique du check pour les données suivantes :

    • CPU_CRIT
    • CPU_WARN
  • Voici un tableau récapitulatif du statut attendu suivant le retour de sonde :

Info

Le texte de la colonne  "Affichage des seuils" montre les paramètres utilisés et leur valeur définie sur l'équipement supervisé.

Panel

Image Added 

Situation

Statut

Exemple

  • Les charges dépassent la valeur de CPU_CRIT.

CRITIQUE

Panel

Image Added

  • Les charges dépassent la valeur de CPU_WARN.

ATTENTION

Panel

Image Added

seuil du statut CRITICAL est 90%.
  • Le seuil du statut WARNING est de 80%.
  • Résultat

    Le résultat contient un message indiquant le statut ainsi que l'utilisation du CPU en pourcentage, valeur correspondant à la métrique cpu__all_usage.

    Résultat Long

    Le résultat long contient un tableau qui liste les

    10

    X processus les plus consommateurs ( le

    nombre de processus

    X correspond à la donnée CPU_MAX_PROCESS ), ainsi qu'

    un indice

    une indication sur leur impact.

    Métriques

    Définition

    Nom de la métriqueUnitéDescriptionSeuil d'avertissementSeuil critique
    cpu__all_usage%Retourne le pourcentage de temps CPU actif au cours de la dernière seconde ( Correspond au % afficher dans le résultat du check ).

    CPU_WARN

    CPU_CRIT

    cpu_(numerocpu)_sys%Retourne le pourcentage de temps CPU utilisé par le noyau Linux au cours de la dernière seconde.----
    cpu_(numerocpu)_usr%Retourne le pourcentage de temps CPU utilisé par les processus en espace utilisateur au cours de la dernière seconde.----
    cpu_(numerocpu)_soft%Retourne le pourcentage de temps CPU utilisé par les interruptions logicielles au cours de la dernière seconde.----
    cpu_(numerocpu)_guest%Retourne le pourcentage de temps CPU utilisé par les processeurs virtuels au cours de la dernière seconde.----
    cpu_(numerocpu)_idle%Retourne le pourcentage de temps CPU inactif au cours de la dernière seconde.----
    cpu_(numerocpu)_irq%Retourne le pourcentage de temps CPU utilisé par les interruptions matérielles au cours de la dernière seconde.----
    cpu_(numerocpu)_nice%Retourne le pourcentage de temps CPU utilisé par les processus en espace utilisateur dont le nice a été changé au cours de la dernière seconde.----
    cpu_(numerocpu)_iowait%Retourne le pourcentage de temps CPU utilisé pour effectuer des attentes d'entrées/sorties au cours de la dernière seconde.----
    cpu_(numerocpu)_steal%Retourne le pourcentage de temps CPU utilisé par une attente involontaire imposée par un hyperviseur au cours de la dernière seconde.----
    Info

    Tous Toutes les métriques contenant le mot (numerocpu) dans dans le teableau tableau ci-dessus seront dupliqué dupliquées en fonction du nombre de CPUs présents sur le serveur supervisé.

    Exemple ( pour 2 CPUs ) :

    • cpu_0_sys
    • cpu_0_usr
    • ...
    • cpu_1_sys
    • cpu_1_usr
    • ...

    Exemple

    Panel

    Image Added

    Les Erreurs

    Erreurs spécifiques à ce check

    Excerpt
    Section

    MONITORED HOST - BAD STATE – Command 'mpstat' not found.



    La commande 'mpstat' n'est pas installé sur l'hôte à superviser.


    Panel

    Image Added


    Résolution


    Installer le packet 'sysstat' sur sa distribution, selon son gestionnaire de packet.

    Code Block
    languagetext
    themeEmacs
    # Alma, Rocky, Centos, Fedora, OpenSUSE
    yum install sysstat
    
    dnf install sysstat
    
    # Ubuntu, Debian
    apt install sysstat
    
    # Arch, Manjaro
    pacman -Syu sysstat

    Excerpt Include
    Erreurs du pack linux-by-SSH
    Erreurs du pack linux-by-SSH
    nopaneltrue

    Détails de l'algorithme

    Texte non vérifié — veuillez confirmer la politique de confidentialitéTexte non vérifié — veuillez confirmer la politique de confidentialité