Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.
Panel
titleSommaire

Table of Contents

Contexte

Le check Load Average SSH analyse la charge système et l'affiche sous forme de pourcentages dans un tableau.

  • Dans ce tableau, les moyennes de la charge sont affichées pendant :
    • la dernière minute,
    • les 5 dernières minutes,
    • et les 15 dernières minutes.
  • Pour simplifier la lecture, les charge sont aussi affichées aussi en pourcentage ( plus facile à appréhender ).

Image Added

Paramétrage

Le check utilise la ligne de commande suivante :

Code Block
languagetext
themeEmacs
$USERPLUGINSDIR$/linux$SHINKEN_byLINUXBYSSH_sshPLUGINSDIR$/check_loadlinux_averagehealth_by_ssh_rust --check check_load_average -H "$HOSTADDRESS$" -u "$_HOSTSSH_USER$" -p "$_HOSTSSH_PORT$" -i "$_HOSTSSH_KEY$" -P "$_HOSTSSH_KEY_PASSPHRASE$" -C -w "$_HOSTLOAD_WARN$" -c "$_HOSTLOAD_CRIT$"

Données utilisées provenant du modèle

Données communes pour les checks des modèles

Authentification

Excerpt Include
NEW_PAGE - 004.0 - SEF-10821 - Modèle linux_by_ssh
NEW_PAGE - 004.0 - SEF-10821 - Modèle linux_by_ssh
nopaneltrue

Données spécifiques pour ce check

Donnée
Description
Modifiable surUnitéValeur par défautDescription
No Format
LOAD_CRIT

l'Hôte

Définit le

( Onglet Données )

--

3,3,3

Définit les valeurs load average à partir duquel le check passe en

critique

Critique.

  • pour la dernière minute,
  • pour les 5 dernières minutes,
  • et pour les 15 dernières minutes.
No Format
3,3,3
LOAD_WARN

l'Hôte

( Onglet Données )

--

1.5,1.5,1.5

Définit le load average à partir duquel le check passe en

warning

Warning.

  • pour la dernière minute,
  • pour les 5 dernières minutes,
  • et pour les 15 dernières minutes.
1.5,1.5,1.5
Info
titleInformation

Les Le check multipliées automatiquement, les valeurs des données sont multipliées par le nombre de CPU de la machine supervisé pendant le check, :

  • un warning à 1,1,1 sur une machine avec 4 CPU passera donc à 4,4,4 ( à l'intérieur du check ).

Cette multiplication permet de ne pas avoir à un paramètre assez générique sans se soucier du nombre de CPU dans la définition des seuils de WARNING et CRITIQUE du check sur chaque serveur.

Données utilisées provenant du check

Pas de données spécifiques pour ce check

Résultat


Exemple

Image AddedImage Removed

Interprétation des données

Statut

:

Le statut peut prendre 4 valeurs différentes ( OK / WARNING / CRITICAL /  UNKNOWN ).

  • Le seuil du statut WARNING est de 1.5,1.5,1.5
  • Le seuil du statut CRITICAL est 3,3,3
    • WARNING si une des valeurs de charge dépase le seuil défini .
    • CRITIQUE si une des valeurs de charge dépase le seuil défini.

    Résultat

    Résultat :

    Le résultat contient un message indiquant le statut ainsi que le load average de la minute précédente ainsi que le load average des 5 et 15 dernières minutes.

    Résultat Long

    :

    Le résultat long contient un tableau qui affiche

    le load percent, le load average et les seuils pour

    pour la moyenne a 1 minute, 5 minutes et 15 minutes :

    • le load percent ( avec la charge et le nombre de CPU ),
    • les seuils ( la valeur des données LOAD_WARN et LOAD_CRIT ),
    • le load average.

    Métriques

    Nom de la métriqueDescription
    load1Moyenne de la charge pendant la dernière minute.
    load5Moyenne de la charge pendant les 5 dernières minutes.
    load15Moyenne de la charge pendant les 15 dernières minutes.