Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.
Scroll Ignore
scroll-pdftrue
scroll-officetrue
scroll-chmtrue
scroll-docbooktrue
scroll-eclipsehelptrue
scroll-epubtrue
scroll-htmltruefalse
Panel
titleSommaire

Table of Contents
stylenone

Contexte

Le check Load Average by SNMPv1v2 analyse la charge système et l'affiche dans un tableau.

  • Dans ce tableau, les valeurs de charges sont affichées pour :
    • la dernière minute,
    • les 5 dernières minutes,
    • et les 15 dernières minutes.
  • À noter que c'est 3 valeurs sont fournies par l'OS, en tant que moyenne sur la période ciblée ( ex : la charge moyenne sur la dernière minute ).
  • Pour simplifier la lecture, les charges sont aussi affichées aussi en pourcentage par CPU : Load per CPU ( plus facile à appréhender ).
    • Le pourcentage correspond Correspond au ratio entre la charge et le nombre de CPU.
    • Si la charge est inférieure au nombre de CPU, il n'y aura aucun problème.
    • Si la charge est supérieure, les paramètres du check vont vous permettre de décider si ce dépassement va être une alerte ou non.
      • En effet, une charge élevée peut ne pas être un problème sur Linux.
      • Cela va dépendre de la nature des processus qui sont sur la machine.

En résumé, le check ( suivant son paramétrage ) va vous permettre de définir, ce qui est acceptable en termes de charge, et vous alertez alerter lorsque quelque chose d'excessif par rapport à l'utilisation standard sera détecté.



Panel

Image RemovedImage Added

Paramétrage

Le check utilise la ligne de commande suivante :

Code Block
languagebash
themeEmacs
$LINUX-BY-SNMP__SHINKEN__PLUGINSDIR$/check_linux_health_by_snmp_rust --check check_load_average
    -H "$HOSTADDRESS$"
    -p "$_HOSTLINUX-BY-SNMP__PORT$"
    -t "$_HOSTLINUX-BY-SNMP__TIMEOUT$"
    -w "$_HOSTLINUX-BY-SNMP__LOAD-AVERAGE__LOAD-WARN$"
    -c "$_HOSTLINUX-BY-SNMP__LOAD-AVERAGE__LOAD-CRIT$"
    -C
    --snmp_version "2"
    --community "$_HOSTLINUX-BY-SNMP__V1V2-COMMUNITY$"

Données utilisées provenant des modèles

Données communes pour les checks du modèle

Excerpt Include
Modèle linux-by-SNMPv1v2
Modèle linux-by-SNMPv1v2
nopaneltrue

Données spécifiques pour ce check

Donnée
Scroll Title
anchordata_for_external_pack
title
DonnéesModifiable surUnitéValeur par défautDescription
No Format
LINUX-BY-SNMP__LOAD-AVERAGE__LOAD-CRIT

l'Hôte

( Onglet Données )

--

3,3,3

Définit le load average par CPU à partir duquel le check passe en CRITIQUE .

  • pour la dernière minute,
  • pour les 5 dernières minutes,
  • et pour les 15 dernières minutes.
No Format
LINUX-BY-SNMP__LOAD-AVERAGE__LOAD-WARN

l'Hôte

( Onglet Données )

--

1.5,1.5,1.5

Définit le load average par CPU à partir duquel le check passe en ATTENTION .

  • pour la dernière minute,
  • pour les 5 dernières minutes,
  • et pour les 15 dernières minutes.



Info
titleIMPORTANT

Les seuils de charge sont comparés à la moyenne de charge PAR CPU ( load per CPU ).

Le check a besoin de valeurs par rapport à 1 seul CPU.

  • Le check va automatiquement multipliées, les valeurs des données par le nombre de CPU de la machine supervisée
  • Par exempleLes valeurs par défaut ci-dessus indique que
      • à 1,5 fois la charge
  • on déclanche un ATTENTION , et a
      • par CPU, la sonde renvoi un status ATTENTION
      • à 3 fois la charge
  • , il y aura un CRITIQUE,
    • et ceux-ci quelque soit le nombre de CPU.
  • Un warning à 1,1,1 sur une machine avec 4 CPU passera donc à 4,4,4 ( à l'intérieur du check ).
      • par CPU, la sonde renvoi un status CRITIQUE

    • Les seuils sont ensuite comparés à la moyenne de charge par CPU ( load per CPU ) calculé par : load_average / nombre_cpu


Alors les valeurs à configurés ne dépendent pas du nombre de CPU de la machine.

Il n'est pas necessaire de Cette multiplication permet d'avoir un paramétrage assez générique sans se soucier du nombre de CPUs dans la définition des seuils ATTENTION et CRITIQUE du check sur chaque serveur.

Données DFE ( Duplicate Foreach )

Pas de données DFE pour ce check

Données utilisées provenant du check

Pas de données spécifiques pour ce check

Excerpt Include
Disks Usage by SNMPv3 ( pour les modèles linux-by-SNMPv3_( noAuthNoPriv / authNoPriv / authPriv ))
Disks Usage by SNMPv3 ( pour les modèles linux-by-SNMPv3_( noAuthNoPriv / authNoPriv / authPriv ))
nopaneltrue

Excerpt Include
Memory by SNMPv3 ( pour les modèles linux-by-SNMPv3_( noAuthNoPriv / authNoPriv / authPriv ))
Memory by SNMPv3 ( pour les modèles linux-by-SNMPv3_( noAuthNoPriv / authNoPriv / authPriv ))
nopaneltrue

Résultat

Exemple

Panel

Image RemovedImage Added

Interprétation des données

Statut

  • Il peut prendre 4 valeurs  OK / CRITIQUE / ATTENTION / INCONNU .

    • Le statut va dépendre du retour de sonde et de la configuration spécifique du check pour les données suivantes :

      • LINUX-BY-SNMP__LOAD-AVERAGE__LOAD-CRIT
      • LINUX-BY-SNMP__LOAD-AVERAGE__LOAD-WARN
    • Voici un tableau récapitulatif du statut attendu suivant le retour de sonde :

Info

Le texte de la colonne  "Affichage des seuils" montre les paramètres utilisés et leur valeur définie sur l'équipement supervisé.

Panel

Image RemovedImage Added 

Situation

Statut

Exemple

  • Les charges dépassent la valeur de LINUX-BY-SNMP__LOAD-AVERAGE__LOAD-CRIT.

CRITIQUE

Panel
Image Removed

Image Added

  • Les charges dépassent la valeur de LINUX-BY-SNMP__LOAD-AVERAGE__LOAD-WARN

ATTENTION

Panel
Image Removed

Image Added

Résultat

Le résultat contient un message indiquant le statut ainsi que le load average de la minute précédente ainsi que le load average des 5 et 15 dernières minutes.

Résultat Long

Le résultat long contient un tableau qui affiche pour la moyenne a 1 minute, 5 minutes et 15 minutes :

  • le load percent per CPU ( avec la charge et le nombre de CPU ),
  • les seuils ( la valeur des données LINUX-BY-SNMP__LOAD-AVERAGE__LOAD-WARN et LINUX-BY-SNMP__LOAD-AVERAGE__LOAD-CRIT  ),
  • le load average.


Métriques

Définition

Nom de la métriqueUnitéDescriptionSeuil d'avertissementSeuil critique
load1--Moyenne de la charge pendant la dernière minute.LINUX-BY-SNMP__LOAD-AVERAGE__LOAD-WARN * nombre_cpuLINUX-BY-SNMP__LOAD-AVERAGE__LOAD-CRIT * nombre_cpu
load5--Moyenne de la charge pendant les 5 dernières minutes.LINUX-BY-SNMP__LOAD-AVERAGE__LOAD-WARN * nombre_cpuLINUX-BY-SNMP__LOAD-AVERAGE__LOAD-CRIT * nombre_cpu
load15--Moyenne de la charge pendant les 15 dernières minutes.LINUX-BY-SNMP__LOAD-AVERAGE__LOAD-WARN * nombre_cpuLINUX-BY-SNMP__LOAD-AVERAGE__LOAD-CRIT * nombre_cpu

Exemple

Panel

Image Added

Erreurs et pré-requis

Excerpt Include
Erreurs communes du pack linux-by-SNMP__shinken
Erreurs communes du pack linux-by-SNMP__shinken
nopaneltrue