Contexte

Le check Load Average by SNMPv1v2 analyse la charge système et l'affiche dans un tableau.

  • Dans ce tableau, les moyennes de la charge sont affichées pendant :
    • la dernière minute,
    • les 5 dernières minutes,
    • et les 15 dernières minutes.



Paramétrage

Le check utilise la ligne de commande suivante :

$LINUX-BY-SNMP__SHINKEN__PLUGINSDIR$/check_linux_health_by_snmp_rust --check check_load_average
    -H "$HOSTADDRESS$"
    -p "$_HOSTLINUX-BY-SNMP__PORT$"
    -t "$_HOSTLINUX-BY-SNMP__TIMEOUT$"
    -w "$_HOSTLINUX-BY-SNMP__LOAD-AVERAGE__LOAD-WARN$"
    -c "$_HOSTLINUX-BY-SNMP__LOAD-AVERAGE__LOAD-CRIT$"
    -C
    --snmp_version "2"
    --community "$_HOSTLINUX-BY-SNMP__V1V2-COMMUNITY$"

Données utilisées provenant des modèles

Données communes pour les checks du modèle

Données spécifiques pour ce check

DonnéeModifiable surUnitéValeur par défautDescription
LINUX-BY-SNMP__LOAD-AVERAGE__LOAD-CRIT

l'Hôte

( Onglet Données )

--

3,3,3

Définit le load average à partir duquel le check passe en CRITIQUE .

  • pour la dernière minute,
  • pour les 5 dernières minutes,
  • et pour les 15 dernières minutes.
LINUX-BY-SNMP__LOAD-AVERAGE__LOAD-WARN

l'Hôte

( Onglet Données )

--

1.5,1.5,1.5

Définit le load average à partir duquel le check passe en ATTENTION .

  • pour la dernière minute,
  • pour les 5 dernières minutes,
  • et pour les 15 dernières minutes.

Le check multipliées automatiquement, les valeurs des données sont par le nombre de CPU de la machine supervisée :

  • un warning à 1,1,1 sur une machine avec 4 CPU passera donc à 4,4,4 ( à l'intérieur du check ).

Cette multiplication permet d'avoir un paramétrage assez générique sans se soucier du nombre de CPUs dans la définition des seuils ATTENTION et CRITIQUE du check sur chaque serveur.

Données DFE ( Duplicate Foreach )

Pas de données DFE pour ce check

Données utilisées provenant du check

Pas de données spécifiques pour ce check

Résultat

Exemple

Interprétation des données

Statut

  • Il peut prendre 4 valeurs  OK / CRITIQUE / ATTENTION / INCONNU .

    • Le statut va dépendre du retour de sonde et de la configuration spécifique du check pour les données suivantes :

      • LINUX-BY-SNMP__LOAD-AVERAGE__LOAD-CRIT
      • LINUX-BY-SNMP__LOAD-AVERAGE__LOAD-WARN
    • Voici un tableau récapitulatif du statut attendu suivant le retour de sonde :

Le texte de la colonne  "Affichage des seuils" montre les paramètres utilisés et leur valeur définie sur l'équipement supervisé.

 

Situation

Statut

Exemple

  • Les charges dépassent la valeur de LINUX-BY-SNMP__LOAD-AVERAGE__LOAD-CRIT.

CRITIQUE

  • Les charges dépassent la valeur de LINUX-BY-SNMP__LOAD-AVERAGE__LOAD-WARN

ATTENTION

Résultat

Le résultat contient un message indiquant le statut ainsi que le load average de la minute précédente ainsi que le load average des 5 et 15 dernières minutes.

Résultat Long

Le résultat long contient un tableau qui affiche pour la moyenne a 1 minute, 5 minutes et 15 minutes :

  • le load percent ( avec la charge et le nombre de CPU ),
  • les seuils ( la valeur des données LINUX-BY-SNMP__LOAD-AVERAGE__LOAD-WARN et LINUX-BY-SNMP__LOAD-AVERAGE__LOAD-CRIT  ),
  • le load average.


Métriques

Nom de la métriqueDescription
load1Moyenne de la charge pendant la dernière minute.
load5Moyenne de la charge pendant les 5 dernières minutes.
load15Moyenne de la charge pendant les 15 dernières minutes.