Contexte

Le check Stats CPU by WinRM va utiliser des commandes à travers votre serveur WinRM pour rechercher des informations sur votre CPU, tel que le nombre de cœurs, la fréquence, le pourcentage d'utilisation du processeur au cours de la dernière seconde et pour finir, si votre utilisation du processeur est trop importante, les X processus consommant le plus de CPU ( X étant la donnée CPU_MAX_PROCESS modifiable dans la configuration ) avec une notation jaugée permettant de voir quels processus sont les plus consommateurs.

Les processus sont accompagnés de valeurs chiffrées précises reflétant leur consommation CPU, ainsi que d’indicateurs visuels pour faciliter l’interprétation :

  • Total CPU % : utilisation cumulée du temps CPU sur l’ensemble des processeurs logiques. Cette valeur peut aller jusqu’à 100 % × nombre de processeurs logiques.
  • Average CPU % : moyenne de consommation CPU par cœur logique. Calculée ainsi : Average CPU % = Total CPU % / nombre de processeurs logiques Elle correspond à la valeur affichée dans le Gestionnaire des tâches de Windows

Chaque processus affiche sa propre consommation CPU (en pourcentage), calculée sur un intervalle de temps entre deux mesures. Des jauges graphiques permettent de visualiser simplement l’Average CPU %.

Paramétrage

    $WINDOWS-BY-WINRM__SHINKEN__PLUGINSDIR$/check_windows_health_by_winrm_rust --check check_stats_cpu
    --hostname "$HOSTADDRESS$"
    --port "$_HOSTWINDOWS-BY-WINRM__PORT$"
    --username "$_HOSTWINDOWS-BY-WINRM__DOMAINUSER$" 
    --password "$_HOSTWINDOWS-BY-WINRM__DOMAINPASSWORD$"
    --auth_method "$_HOSTWINDOWS-BY-WINRM__AUTHMETHOD$"
    --timeout "$_HOSTWINDOWS-BY-WINRM__TIMEOUT$"
    --local_winrm_tmp_wf "$_HOSTWINDOWS-BY-WINRM__POLLER-LOCAL-WORKING-FOLDER$"
    -c "$_HOSTWINDOWS-BY-WINRM__STATS-CPU__CRIT$"
    -w "$_HOSTWINDOWS-BY-WINRM__STATS-CPU__WARN$"
    -m "$_HOSTWINDOWS-BY-WINRM__STATS-CPU__MAX-PROCESS$"

Données utilisées provenant des modèles

Données communes pour les checks des modèles

Données spécifiques pour ce check

DonnéeModifiable surUnitéDéfautValeur par défaut à l'installation Description
WINDOWS-BY-WINRM__STATS-CPU__CRIT

l'Hôte

( Onglet Données )

%

9090Définit le pourcentage d'utilisation du processeur à partir duquel le check passe en CRITIQUE.
WINDOWS-BY-WINRM__STATS-CPU__WARN

l'Hôte

( Onglet Données )

%

8080Définit le pourcentage d'utilisation du processeur à partir duquel le check passe en ATTENTION.
WINDOWS-BY-WINRM__STATS-CPU__MAX-PROCESS

l'Hôte

( Onglet Données )

--

1010Définit le nombre de processus alarmant à afficher au maximum.

Afin de récupérer le pourcentage d'utilisation du CPU au cours d'une seconde, le check attendra au moins une seconde, lui permettant de calculer le pourcentage au niveau de celle-ci.

Données DFE ( Duplicate Foreach )

Pas de données DFE pour ce check.


Données utilisées provenant du check

Pas de données provenant du check pour ce modèle

Résultat

Exemple

Interprétation

Statut

Il peut prendre quatre valeurs  OK / CRITIQUE / ATTENTION / INCONNU .

  • Le statut va dépendre du retour de sonde et de la configuration spécifique du check pour les données suivantes :

    • WINDOWS-BY-WINRM__STATS-CPU__CRIT
    • WINDOWS-BY-WINRM__STATS-CPU_WARN
  • Voici un tableau récapitulatif du statut attendu suivant le retour de sonde :

Le texte de la colonne  "Affichage des seuils" montre les paramètres utilisés et leur valeur définie sur l'équipement supervisé.

Situation

Statut

Exemple

  • Les charges dépassent la valeur de WINDOWS-BY-WINRM__STATS-CPU__CRIT

CRITIQUE

  • Les charges dépassent la valeur de WINDOWS-BY-WINRM__STATS-CPU_WARN.

ATTENTION


Résultat

Le résultat contient un message indiquant le statut ainsi que l'utilisation du CPU en pourcentage, valeur correspondant à la métrique cpu_all_usage.

Résultat Long

Le résultat long contient un tableau qui liste les X processus les plus consommateurs ( le X correspond à la donnée CPU_MAX_PROCESS ), ainsi qu'une indication sur leur impact.

Métriques

Nom de la métriqueUnitéDescription
cpu__all_usage%Retourne le pourcentage de temps CPU actif au cours de la dernière seconde ( Correspond au % afficher dans le résultat du check ).
cpu_(numerocpu)_usr%Retourne le pourcentage de temps CPU utilisé par les processus en espace utilisateur au cours de la dernière seconde.
cpu_(numerocpu)_priv%Retourne le pourcentage de temps CPU utilisé par les processus en mode noyau au cours de la dernière seconde.
cpu_(numerocpu)_idle%Retourne le pourcentage de temps CPU inactif au cours de la dernière seconde.
cpu_(numerocpu)_irq
Retourne le pourcentage de temps CPU consacré au traitement des interruptions matérielles (périphériques physiques) au cours de la dernière seconde.
cpu_(numerocpu)_dpc%Retourne le pourcentage de temps CPU utilisé par les DPC (Deferred Procedure Calls) — routines différées généralement utilisées par les pilotes pour finaliser le traitement d’interruptions au cours de la dernière seconde.

Toutes les métriques contenant le mot (numerocpu) dans le tableau ci-dessus seront dupliquées en fonction du nombre de CPUs présents sur le serveur supervisé.

Exemple ( pour 2 CPUs ) :

  • cpu_0_usr
  • cpu_0_priv
  • ...
  • cpu_1_usr
  • cpu_1_priv
  • ...