Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.
Comment: Make by tools (01.00.01) - action=clean_corrupted_html
Panel
titleSommaire

Table of Contents
stylenone



Contexte

Le check Load Average by SSH analyse la charge système et l'affiche sous forme de pourcentages dans un tableau.

  • Dans ce tableau, les
moyennes de la charge pendant
  • valeurs de charges sont affichées pour :
    • la dernière minute,
    • les 5 dernières minutes,
    • et les 15 dernières minutes.
  • À noter que c'est 3 valeurs sont fournies par l'OS, en tant que moyenne sur la période ciblée ( ex : la charge moyenne sur la dernière minute ).
  • Pour simplifier la lecture, les charges sont aussi affichées aussi en pourcentage ( plus facile à appréhender ).
    • Le pourcentage correspond au ratio entre la charge et le nombre de CPU.
    • Si la charge est inférieure au nombre de CPU, il n'y aura aucun problème.
    • Si la charge est supérieure, les paramètres du check vont vous permettre de décider si ce dépassement va être une alerte ou non.
      • En effet, une charge élevée peut ne pas être un problème sur Linux.
      • Cela va dépendre de la nature des processus qui sont sur la machine.

En résumé, le check ( suivant son paramétrage ) va vous permettre de définir, ce qui est acceptable en termes de charge, et vous alertez lorsque quelque chose d'excessif par rapport à l'utilisation standard sera détecté.

Panel

Image Added

Paramétrage

Le check utilise la ligne de commande suivante :

Code Block
languagetextbash
themeEmacs
$USERPLUGINSDIR$/linux$LINUXBYSSH_bySHINKEN_sshPLUGINSDIR$/check_loadlinux_averagehealth_by_ssh_rust --check check_load_average
    -H "$HOSTADDRESS$"
    -u "$_HOSTSSH_USER$"
    -p "$_HOSTSSH_PORT$"
    -i "$_HOSTSSH_KEY$"
    -P "$_HOSTSSH_KEY_PASSPHRASE$"
    -C
    -w "$_HOSTLOAD_WARN$"
    -c "$_HOSTLOAD_CRIT$"

Données utilisées provenant du modèle

Données communes pour les checks des modèles

Authentification

Excerpt Include
Modèle linux-by-SSH
Modèle linux-by-SSH
nopaneltrue

Données spécifiques pour ce check

DonnéeModifiable sur
Description
UnitéValeur par défautDescription
No Format
LOAD_CRIT

l'Hôte

( Onglet Données )

--

3,3,3

Définit

le

les valeurs load average à partir duquel le check passe en

critique

CRITIQUE.

  • pour la dernière minute,
  • pour les 5 dernières minutes,
  • et pour les 15 dernières minutes.
No Format
3,3,3
LOAD_WARN

l'Hôte

( Onglet Données )

--

1.5,1.5,1.5

Définit le load average à partir duquel le check passe en

warning

ATTENTION.

  • pour la dernière minute,
  • pour les 5 dernières minutes,
  • et pour les 15 dernières minutes.
1.5,1.5,1.5
Info
titleInformationIMPORTANT

Le check multipliées automatiquement, les Les valeurs des données sont multipliées par le nombre de CPU de la machine supervisé pendant le check, un warning supervisée :

  • un seuil à 1,1,1 sur une machine avec 4 CPU
passera donc à
  • sera interprété en 4,4,4 par la sonde.

Cette multiplication permet de ne pas avoir à d'avoir un paramétrage assez générique sans se soucier du nombre de CPU CPUs dans la définition des seuils de WARNING ATTENTION et CRITIQUE du check sur chaque serveur.

Données utilisées provenant du check

Pas de données spécifiques pour ce check

Résultat

Image Removed

Exemple

Panel


Image Added

Interprétation des données

Statut

:

Le statut

  • Il peut prendre 4 valeurs

différentes (
  •  

OK 
  • OK /

 WARNING 
  • CRITIQUE / ATTENTION / INCONNU .

    • Le statut va dépendre du retour de sonde et de la configuration spécifique du check pour les données suivantes :

      • LOAD_CRIT
      • LOAD_WARN
    • Voici un tableau récapitulatif du statut attendu suivant le retour de sonde :

Info

Le texte de la colonne  "Affichage des seuils" montre les paramètres utilisés et leur valeur définie sur l'équipement supervisé.

Panel

Image Added 

Situation

Statut

Exemple

  • Les charges dépassent la valeur de LOAD_CRIT.

CRITIQUE

Panel

Image Added

  • Les charges dépassent la valeur de LOAD_WARN.

ATTENTION

Panel

Image Added

Résultat

 CRITICAL /  UNKNOWN ).
  • Le seuil du statut WARNING est de 1.5,1.5,1.5
  • Le seuil du statut CRITICAL est 3,3,3
Résultat :

Le résultat contient un message indiquant le statut ainsi que le load average de la minute précédente ainsi que le load average des 5 et 15 dernières minutes.

Résultat Long

:

Le résultat long contient un tableau qui affiche

le load percent, le load average et les seuils pour

pour la moyenne a 1 minute, 5 minutes et 15 minutes :

  • le load percent ( avec la charge et le nombre de CPU ),
  • les seuils ( la valeur des données LOAD_WARN et LOAD_CRIT ),
  • le load average.

Métriques

Définition

Nom de la métriqueUnitéDescriptionSeuil d'avertissementSeuil critique
load1--Moyenne de la charge pendant la dernière minute.LOAD_WARNLOAD_CRIT
load5--Moyenne de la charge pendant les 5 dernières minutes.LOAD_WARNLOAD_CRIT
load15--Moyenne de la charge pendant les 15 dernières minutes.LOAD_WARNLOAD_CRIT

Exemple

Panel

Image Added

Les Erreurs

Excerpt Include
Erreurs du pack linux-by-SSH
Erreurs du pack linux-by-SSH
nopaneltrue