Le check Load Average by SNMPv3 analyse la charge système et l'affiche dans un tableau.
En résumé, le check ( suivant son paramétrage ) va permettre de définir, ce qui est acceptable en termes de charge, et alerter lorsque quelque chose d'excessif par rapport à l'utilisation standard sera détecté.
|
Le check utilise une des lignes de commandes suivantes selon le modèle d'hôte utilisé :
$LINUX-BY-SNMP__SHINKEN__PLUGINSDIR$/check_linux_health_by_snmp_rust --check check_load_average
-H "$HOSTADDRESS$"
-p "$_HOSTLINUX-BY-SNMP__PORT$"
-t "$_HOSTLINUX-BY-SNMP__TIMEOUT$"
-w "$_HOSTLINUX-BY-SNMP__LOAD-AVERAGE__LOAD-WARN$"
-c "$_HOSTLINUX-BY-SNMP__LOAD-AVERAGE__LOAD-CRIT$"
-C
--snmp_version "3"
--user "$_HOSTLINUX-BY-SNMP__V3-LOGIN$"
--level "noAuthNoPriv" |
$LINUX-BY-SNMP__SHINKEN__PLUGINSDIR$/check_linux_health_by_snmp_rust --check check_load_average
-H "$HOSTADDRESS$"
-p "$_HOSTLINUX-BY-SNMP__PORT$"
-t "$_HOSTLINUX-BY-SNMP__TIMEOUT$"
-w "$_HOSTLINUX-BY-SNMP__LOAD-AVERAGE__LOAD-WARN$"
-c "$_HOSTLINUX-BY-SNMP__LOAD-AVERAGE__LOAD-CRIT$"
-C
--snmp_version "3"
--user "$_HOSTLINUX-BY-SNMP__V3-LOGIN$"
--auth_password "$_HOSTLINUX-BY-SNMP__V3-PASSPHRASE-AUTH$"
--auth_protocol "$_HOSTLINUX-BY-SNMP__V3-PROTOCOL-AUTH$"
--level "authNoPriv" |
$LINUX-BY-SNMP__SHINKEN__PLUGINSDIR$/check_linux_health_by_snmp_rust --check check_load_average
-H "$HOSTADDRESS$"
-p "$_HOSTLINUX-BY-SNMP__PORT$"
-t "$_HOSTLINUX-BY-SNMP__TIMEOUT$"
-w "$_HOSTLINUX-BY-SNMP__LOAD-AVERAGE__LOAD-WARN$"
-c "$_HOSTLINUX-BY-SNMP__LOAD-AVERAGE__LOAD-CRIT$"
-C
--snmp_version "3"
--user "$_HOSTLINUX-BY-SNMP__V3-LOGIN$"
--auth_password "$_HOSTLINUX-BY-SNMP__V3-PASSPHRASE-AUTH$"
--priv_passphrase "$_HOSTLINUX-BY-SNMP__V3-PASSPHRASE-PRIV$"
--auth_protocol "$_HOSTLINUX-BY-SNMP__V3-PROTOCOL-AUTH$"
--priv_protocol "$_HOSTLINUX-BY-SNMP__V3-PROTOCOL-PRIV$"
--level "authPriv" |
|
| Donnée | Modifiable sur | Unité | Valeur par défaut | Description | |
|---|---|---|---|---|---|
| l'Hôte ( Onglet Données ) | -- | 3,3,3 | Définit le load average à partir duquel le check passe en CRITIQUE .
| |
| l'Hôte ( Onglet Données ) | -- | 1.5,1.5,1.5 | Définit le load average à partir duquel le check passe en ATTENTION .
|
Le check multipliées automatiquement, les valeurs des données sont par le nombre de CPU de la machine supervisée :
Cette multiplication permet d'avoir un paramétrage assez générique sans se soucier du nombre de CPUs dans la définition des seuils de WARNING et CRITICAL du check sur chaque serveur. |
Pas de données DFE pour ce check
Pas de données spécifiques pour ce check
|
Il peut prendre 4 valeurs OK / CRITIQUE / ATTENTION / INCONNU .
Le statut va dépendre du retour de sonde et de la configuration spécifique du check pour les données suivantes :
Voici un tableau récapitulatif du statut attendu suivant le retour de sonde :
Le texte de la colonne "Affichage des seuils" montre les paramètres utilisés et leur valeur définie sur l'équipement supervisé.
|
Situation | Statut | Exemple | |
|---|---|---|---|
| CRITIQUE |
| |
| ATTENTION |
|
Le résultat contient un message indiquant le statut ainsi que le load average de la minute précédente ainsi que le load average des 5 et 15 dernières minutes.
Le résultat long contient un tableau qui affiche pour la moyenne a 1 minute, 5 minutes et 15 minutes :
| Nom de la métrique | Unité | Description | Seuil d'avertissement | Seuil critique |
|---|---|---|---|---|
| load1 | -- | Moyenne de la charge pendant la dernière minute. | LINUX-BY-SNMP__LOAD-AVERAGE__LOAD-WARN * nombre_cpu | LINUX-BY-SNMP__LOAD-AVERAGE__LOAD-CRIT * nombre_cpu |
| load5 | -- | Moyenne de la charge pendant les 5 dernières minutes. | LINUX-BY-SNMP__LOAD-AVERAGE__LOAD-WARN * nombre_cpu | LINUX-BY-SNMP__LOAD-AVERAGE__LOAD-CRIT * nombre_cpu |
| load15 | -- | Moyenne de la charge pendant les 15 dernières minutes. | LINUX-BY-SNMP__LOAD-AVERAGE__LOAD-WARN * nombre_cpu | LINUX-BY-SNMP__LOAD-AVERAGE__LOAD-CRIT * nombre_cpu |
|