Le check Stats CPU by SNMPv3 va récupérer les informations relatives à l'utilisation de votre CPU, tel que le nombre de cœurs, la fréquence, le pourcentage d'utilisation du processeur au cours de la dernière seconde et pour finir, si votre utilisation du processeur est trop importante, les X processus consommant le plus de CPU ( X étant la donnée CPU_MAX_PROCESS modifiable dans la configuration ) avec une notation jaugée permettant de voir quels processus sont les plus consommateurs.
Les processus sont accompagnés leur consommation CPU, ainsi que d’indicateurs en pourcentage ainsi qu'une jauge graphique pour facilement visualiser l'Average CPU % :
La somme des mesures individuelles de l'Average CPU% de chaque processus peuvent différer de CPU usage, car ces mesures ne peuvent pas être prises à un seul instant T. Comme ces mesures sont volatiles, on peut alors parfois observer des différences.
|
Le check utilise une des lignes de commandes suivantes selon le modèle d'hôte utilisé :
$LINUX-BY-SNMP__SHINKEN__PLUGINSDIR$/check_linux_health_by_snmp_rust --check check_stats_cpu
-H "$HOSTADDRESS$"
-p "$_HOSTLINUX-BY-SNMP__PORT$"
-t "$_HOSTLINUX-BY-SNMP__TIMEOUT$"
-w "$_HOSTLINUX-BY-SNMP__STATS-CPU__WARN$"
-c "$_HOSTLINUX-BY-SNMP__STATS-CPU__CRIT$"
-m "$_HOSTLINUX-BY-SNMP__STATS-CPU__MAX-PROCESS$"
--snmp_version "3"
--user "$_HOSTLINUX-BY-SNMP__V3-LOGIN$"
--level "noAuthNoPriv" |
$LINUX-BY-SNMP__SHINKEN__PLUGINSDIR$/check_linux_health_by_snmp_rust --check check_stats_cpu
-H "$HOSTADDRESS$"
-p "$_HOSTLINUX-BY-SNMP__PORT$"
-t "$_HOSTLINUX-BY-SNMP__TIMEOUT$"
-w "$_HOSTLINUX-BY-SNMP__STATS-CPU__WARN$"
-c "$_HOSTLINUX-BY-SNMP__STATS-CPU__CRIT$"
-m "$_HOSTLINUX-BY-SNMP__STATS-CPU__MAX-PROCESS$"
--snmp_version "3"
--user "$_HOSTLINUX-BY-SNMP__V3-LOGIN$"
--auth_password "$_HOSTLINUX-BY-SNMP__V3-PASSPHRASE-AUTH$"
--auth_protocol "$_HOSTLINUX-BY-SNMP__V3-PROTOCOL-AUTH$"
--level "authNoPriv" |
$LINUX-BY-SNMP__SHINKEN__PLUGINSDIR$/check_linux_health_by_snmp_rust --check check_stats_cpu
-H "$HOSTADDRESS$"
-p "$_HOSTLINUX-BY-SNMP__PORT$"
-t "$_HOSTLINUX-BY-SNMP__TIMEOUT$"
-w "$_HOSTLINUX-BY-SNMP__STATS-CPU__WARN$"
-c "$_HOSTLINUX-BY-SNMP__STATS-CPU__CRIT$"
-m "$_HOSTLINUX-BY-SNMP__STATS-CPU__MAX-PROCESS$"
--snmp_version "3"
--user "$_HOSTLINUX-BY-SNMP__V3-LOGIN$"
--auth_password "$_HOSTLINUX-BY-SNMP__V3-PASSPHRASE-AUTH$"
--priv_passphrase "$_HOSTLINUX-BY-SNMP__V3-PASSPHRASE-PRIV$"
--auth_protocol "$_HOSTLINUX-BY-SNMP__V3-PROTOCOL-AUTH$"
--priv_protocol "$_HOSTLINUX-BY-SNMP__V3-PROTOCOL-PRIV$"
--level "authPriv" |
| Nom | Modifiable sur | Unité | Valeur par défaut à l'installation de Shinken | Description | |
|---|---|---|---|---|---|
| l'Hôte ( Onglet Données ) | % | 90 % | Définit le pourcentage d'utilisation du processeur à partir duquel le check passe en CRITIQUE. | |
| l'Hôte ( Onglet Données ) | % | 80 % | Définit le pourcentage d'utilisation du processeur à partir duquel le check passe en ATTENTION. | |
| l'Hôte ( Onglet Données ) | -- | 10 | Définit le nombre de processus alarmant à afficher au maximum. |
Pas de données DFE pour ce check
Pas de données provenant du check pour ce modèle
|
Il peut prendre quatre valeurs OK / CRITIQUE / ATTENTION / INCONNU .
Le statut va dépendre du retour de sonde et de la configuration spécifique du check pour les données suivantes :
Le texte de la colonne "Affichage des seuils" montre les paramètres utilisés et leur valeur définie sur l'équipement supervisé.
|
Situation | Statut | Exemple |
|---|---|---|
| CRITIQUE | |
| ATTENTION |
Le résultat contient un message indiquant le statut ainsi que l'utilisation du CPU en pourcentage, valeur correspondant à la métrique cpu__all_usage.
Le résultat long contient un tableau qui liste les X processus les plus consommateurs ( le X correspond à la donnée LINUX-BY-SNMP__STATS-CPU__MAX-PROCESS ), ainsi qu'une indication sur leur impact.
| Nom de la métrique | Unité | Description |
|---|---|---|
| cpu__all_usage | % | Retourne le pourcentage de temps CPU actif au cours de la dernière seconde ( Correspond au % afficher dans le résultat du check ). |
| cpu_(numerocpu)_sys | % | Retourne le pourcentage de temps CPU utilisé par le noyau Linux au cours de la dernière seconde. |
| cpu_(numerocpu)_usr | % | Retourne le pourcentage de temps CPU utilisé par les processus en espace utilisateur au cours de la dernière seconde. |
| cpu_(numerocpu)_soft | % | Retourne le pourcentage de temps CPU utilisé par les interruptions logicielles au cours de la dernière seconde. |
| cpu_(numerocpu)_guest | % | Retourne le pourcentage de temps CPU utilisé par les processeurs virtuels au cours de la dernière seconde. |
| cpu_(numerocpu)_idle | % | Retourne le pourcentage de temps CPU inactif au cours de la dernière seconde. |
| cpu_(numerocpu)_irq | % | Retourne le pourcentage de temps CPU utilisé par les interruptions matérielles au cours de la dernière seconde. |
| cpu_(numerocpu)_nice | % | Retourne le pourcentage de temps CPU utilisé par les processus en espace utilisateur dont le nice a été changé au cours de la dernière seconde. |
| cpu_(numerocpu)_iowait | % | Retourne le pourcentage de temps CPU utilisé pour effectuer des attentes d'entrées/sorties au cours de la dernière seconde. |
| cpu_(numerocpu)_steal | % | Retourne le pourcentage de temps CPU utilisé par une attente involontaire imposée par un hyperviseur au cours de la dernière seconde. |
Toutes les métriques contenant le mot (numerocpu) dans le tableau ci-dessus seront dupliquées en fonction du nombre de CPUs présents sur le serveur supervisé. Exemple ( pour 2 CPUs ) :
|
|