Contexte

Le check Stats CPU by WinRM va utiliser des commandes à travers le serveur WinRM pour rechercher des informations sur le CPU, tel que le nombre de cœurs, la fréquence, le pourcentage d'utilisation du processeur au cours de la dernière seconde et pour finir, si l'utilisation du processeur est trop importante, les X processus consommant le plus de CPU ( X étant la donnée CPU_MAX_PROCESS modifiable dans la configuration ), permettant de voir quels processus sont les plus consommateurs.

Les processus sont accompagnés leur consommation CPU, ainsi que d’indicateurs en pourcentage ainsi qu'une jauge graphique pour facilement visualiser l'Average CPU % :

  • Total CPU % : utilisation cumulée du temps CPU sur l’ensemble des processeurs logiques. Cette valeur peut aller jusqu’à 100 % × nombre de processeurs logiques.
  • Average CPU % : moyenne de consommation CPU par cœur logique. Calculée ainsi : Average CPU % = Total CPU % / nombre de processeurs logiques. Elle correspond à la valeur affichée dans le Gestionnaire des tâches de Windows

La somme des mesures individuelles de l'Average CPU% de chaque processus peuvent différer de CPU usage, car ces mesures ne peuvent pas être prises à un seul instant T. Comme ces mesures sont volatiles, on peut alors parfois observer des différences.

Paramétrage

$WINDOWS-BY-WINRM__SHINKEN__PLUGINSDIR$/check_windows_health_by_winrm_rust --check check_stats_cpu
    --hostname "$HOSTADDRESS$"
    --port "$_HOSTWINDOWS_BY_WINRM__PORT$"
    --username "$_HOSTWINDOWS_BY_WINRM__DOMAINUSER$" 
    --password "$_HOSTWINDOWS_BY_WINRM__DOMAINPASSWORD$"
    --auth_method "$_HOSTWINDOWS_BY_WINRM__AUTHMETHOD$"
    --timeout "$_HOSTWINDOWS_BY_WINRM__TIMEOUT$"
    -c "$_HOSTWINDOWS_BY_WINRM__STATS-CPU__CRIT$"
    -w "$_HOSTWINDOWS_BY_WINRM__STATS-CPU__WARN$"
    -m "$_HOSTWINDOWS_BY_WINRM__STATS-CPU__MAX-PROCESS$"

Données utilisées provenant des modèles

Données communes pour les checks des modèles

Données spécifiques pour ce check

DonnéeModifiable surUnitéValeur par défautDescription
WINDOWS_BY_WINRM__STATS-CPU__CRIT

l'Hôte

( Onglet Données )

%

90Définit le pourcentage d'utilisation du processeur à partir duquel le check passe en CRITIQUE.
WINDOWS_BY_WINRM__STATS-CPU__WARN

l'Hôte

( Onglet Données )

%

80Définit le pourcentage d'utilisation du processeur à partir duquel le check passe en ATTENTION.
WINDOWS_BY_WINRM__STATS-CPU__MAX-PROCESS

l'Hôte

( Onglet Données )

--

10Définit le nombre de processus alarmant à afficher au maximum.

Afin de récupérer le pourcentage d'utilisation du CPU au cours d'une seconde, le check attendra au moins une seconde, lui permettant de calculer le pourcentage au niveau de celle-ci.

Données DFE ( Duplicate Foreach )

Pas de données DFE pour ce check.


Données utilisées provenant du check

Pas de données provenant du check pour ce modèle

Résultat

Exemple

Interprétation

Statut

Il peut prendre quatre valeurs  OK / CRITIQUE / ATTENTION / INCONNU .

  • Le statut va dépendre du retour de sonde et de la configuration spécifique du check pour les données suivantes :

    • WINDOWS_BY_WINRM__STATS-CPU__CRIT
    • WINDOWS_BY_WINRM__STATS-CPU__WARN
  • Voici un tableau récapitulatif du statut attendu suivant le retour de sonde :

Le texte de la colonne  "Affichage des seuils" montre les paramètres utilisés et leur valeur définie sur l'équipement supervisé.

Situation

Statut

Exemple

  • Les charges dépassent la valeur de WINDOWS_BY_WINRM__STATS-CPU__CRIT

CRITIQUE

  • Les charges dépassent la valeur de WINDOWS_BY_WINRM__STATS-CPU__WARN.

ATTENTION

Résultat


Le résultat contient un message indiquant le statut ainsi que l'utilisation du CPU en pourcentage, valeur correspondant à la métrique cpu_all_usage.

Résultat Long

Le résultat long contient un tableau qui liste les X processus les plus consommateurs ( le X correspond à la donnée WINDOWS_BY_WINRM__STATS-CPU__MAX-PROCESS ). La mesure d'utilisation CPU est donnée avec Total CPU% et Average CPU%.

Métriques

Définition

Nom de la métriqueUnitéDescriptionSeuil d'avertissementSeuil critique
cpu_all_usage%Retourne le pourcentage de temps CPU actif au cours de la dernière seconde ( Correspond au % afficher dans le résultat du check ).WINDOWS_BY_WINRM__STATS-CPU__WARNWINDOWS_BY_WINRM__STATS-CPU__CRIT
cpu_( NUMERO_CPU )_usr%Retourne le pourcentage de temps CPU utilisé par les processus en espace utilisateur au cours de la dernière seconde.----
cpu_( NUMERO_CPU )_priv%Retourne le pourcentage de temps CPU utilisé par les processus en mode noyau au cours de la dernière seconde.----
cpu_( NUMERO_CPU )_idle%Retourne le pourcentage de temps CPU inactif au cours de la dernière seconde.----
cpu_( NUMERO_CPU )_irq%Retourne le pourcentage de temps CPU consacré au traitement des interruptions matérielles (périphériques physiques) au cours de la dernière seconde.----
cpu_( NUMERO_CPU )_dpc%Retourne le pourcentage de temps CPU utilisé par les DPC (Deferred Procedure Calls) — routines différées généralement utilisées par les pilotes pour finaliser le traitement d’interruptions au cours de la dernière seconde.

--

--

Toutes les métriques contenant le mot ( NUMERO_CPU ) dans le tableau ci-dessus seront dupliquées en fonction du nombre de processeurs logique présents sur le serveur supervisé.

Exemple ( pour 2 CPUs ) :

  • cpu_00_usr
  • cpu_00_priv
  • ...
  • cpu_01_usr
  • cpu_01_priv
  • ...

Exemple

Erreurs et pré-requis