Összehasonlított verziók

Kulcs

  • Beillesztett sor.
  • Törölt sor.
  • Formázás megváltoztatva.
Hozzászólás: Make by tools (01.00.01) - action=clean_corrupted_html
Panel
titleSommaire

Table of Contents
stylenone

Contexte

Le check Memory SSH va récupérer des informations concernant la mémoire vive et la mémoire swap de votre machine tel que le pourcentage utilisé et le top 5 des processus consommant le plus de mémoire.

Contrairement aux autres checks le
  • Le statut de
celui-ci
  • ce check possède 2 raisons de changer de statut :
    • Soit
votre
    • la consommation de mémoire RAM est trop
élevé
    • élevée,
soit votre swap
    • Soit l'utilisation de mémoire SWAP est trop
élevé
    • élevée.
  • Le statut du check sera donc le pire
etat
  • état des deux.

Panel

Image Added


Méthode de calcul de la mémoire consommée

La mémoire utilisée ( used ) est différente de la mémoire consommée ( consumed ) que nous utilisons pour la comparaison avec les seuils.

  • En effet, la mémoire d'un serveur Linux peut être utilisée par le système, mais pas consommée, car celle-ci sera gardée en cache par le système.
  • De cette manière, le serveur pourra piocher dans ce cache si besoin.

Image Removed

  • La mémoire utilisée est l'ensemble de la mémoire que le système utilise : mémoire des programmes, mémoire partagés ( shared ) , mémoire tampons ( buffers ), mémoire cache ( cached ). La mémoire utilisée va s'approcher de la mémoire totale, car le système aura tendance à mettre en mémoire cache les fichiers lus et programmes exécutés, pour que les prochaines opérations ne nécessitent pas de relire le disque, mais la RAM, et seront donc bien plus rapide. Si la mémoire utilisée est proche de la mémoire totale de son système, c'est un phénomène normal et pas inquiétant.
  • La mémoire consommée est la mémoire utilisée par le système qui ne peut pas être libéré sans transferts vers la SWAP, qui est une opération lourde qui ralentit le système. Si la mémoire consommée approche de la mémoire totale, alors le système va devoir utiliser la mémoire SWAP et être ralenti. C'est donc la mémoire consommée que la sonde va surveiller et comparer aux seuils

Bien que la mémoire utilisée soit très proche de la mémoire totale du serveur, le serveur peut toujours disposer de mémoire pour son système et les applications.

Nous souhaitons donc ne pas envoyer d'alerte inutile car le serveur peut sembler saturé, alors qu'il dispose encore de plusieurs Go de RAM présents dans le cache par exemple
  • .

Il est également important de noter que la commande free utilisée lors de la récupération des informations de mémoire du serveur a changé depuis la sa version 3.3.9.

  • La version plus récente permet facilement de calculer la mémoire consommée réellement par le serveur via la mémoire totale moins la mémoire available ( ajoutée dans la commande mise à jour ).
  • L'ancienne version ne dispose pas de la mémoire available, il faut se baser sur la mémoire buffed et cached.
    • Ce calcul est une approximation, et peut ne pas refléter la réalité, car toute la mémoire cached n'est pas forcément de la mémoire qui peut être libéré et donc available.

Le check calcule donc la mémoire consommée comme tel :

  • free < 3.3.9 : consumed = used - buffed - cached
  • free > 3.3.9 : consumed = total - available

La sonde saura s'adapter suivant la version de la commande free.

Paramétrage

Le check utilise la ligne de commande suivante :

Code Block
languagetextbash
themeEmacs
$SHINKEN$LINUXBYSSH_LINUXBYSSHSHINKEN_PLUGINSDIR$/check_linux_health_by_ssh_rust --check check_memory
   -H "$HOSTADDRESS$"
   -u "$_HOSTSSH_USER$"
   -p "$_HOSTSSH_PORT$"
   -i "$_HOSTSSH_KEY$"
   -P "$_HOSTSSH_KEY_PASSPHRASE$"
   -w "$_HOSTMEMORY_WARN$"
   -c "$_HOSTMEMORY_CRIT$"
   -m
   -s
   -C "$_HOSTSWAP_CRIT_WHEN_HIGH_PHYSICAL_MEMORY$,$_HOSTSWAP_CRIT$"
   -W "$_HOSTSWAP_WARN_WHEN_HIGH_PHYSICAL_MEMORY$,$_HOSTSWAP_WARN$"

Données utilisées provenant du modèle

Données communes pour les checks des modèles

Authentification

Excerpt Include
NEW_PAGE - 004.0 - SEF-10821 - Modèle linux_-by_sshNEW_PAGE - 004.0 - SEF-10821 - Modèle linux_by_ssh-SSH
Modèle linux-by-SSH
nopaneltrue

Données spécifiques pour ce check

DonnéeModifiable surUnitéValeur par défautDescription
No Format
MEMORY_RAM_CRIT

l'Hôte

( Onglet Données )

%

95Définit le pourcentage de mémoire RAM utilisée à partir duquel le check passe en CRITIQUE .
No Format
MEMORY_RAM_WARN

l'Hôte

( Onglet Données )

%

90Définit le pourcentage de mémoire RAM utilisée à partir duquel le check passe en ATTENTION .
No Format
MEMORY_SWAP_CRIT

l'Hôte

( Onglet Données )

%

90Définit le pourcentage d'utilisation SWAP à partir duquel le check passe en CRITIQUE .
No Format
MEMORY_SWAP_WARN

l'Hôte

( Onglet Données )

%

70Définit le pourcentage d'utilisation SWAP à partir duquel le check passe en ATTENTION .
No Format
MEMORY_
SWAP_CRIT_WHEN_HIGH_
RAM
PHYSICAL_MEMORY

l'Hôte

( Onglet Données )

%

20Définit le pourcentage d'utilisation SWAP à partir duquel le check passe en CRITIQUE si la mémoire RAM est à plus de 90% MEMORY_CRIT.
No Format
MEMORY_SWAP_WARN_WHEN_HIGH_PHYSICAL_RAMMEMORY



l'Hôte

( Onglet Données )

%

15Définit le pourcentage d'utilisation SWAP à partir duquel le check passe en ATTENTION si la mémoire RAM est à plus de 90% MEMORY_WARN.

Données utilisées provenant du check

Pas de données spécifiques pour ce check

Données DFE ( Duplicate Foreach )

Pas de données DFE pour ce check

Données utilisées provenant du check

Résultat

Exemple

Panel
Image Removed

Image Added

Interprétation des données

Statut

Statut :
Le statut

Il peut prendre 4 valeurs différentes

(

    OK  /

 WARNING / CRITICAL 

  CRITIQUE  /  ATTENTION   /  

 UNKNOWN

INCONNU  

)

.

  • Le statut va dépendre du retour de sonde et de la configuration spécifique du check pour les données suivantes :

    • MEMORY_CRIT
    • MEMORY_WARN
    • SWAP_CRIT
    • SWAP_WARN
  • Voici un tableau récapitulatif du statut attendu suivant le retour de sonde :

Info

Le texte de la colonne  "Affichage des seuils" montre les paramètres utilisés et leur valeur définie sur l'équipement supervisé.

Panel

Image Added 

Situation

Statut

Exemple

  • Le pourcentage de RAM consommé dépassent la valeur de MEMORY_CRIT.

CRITIQUE

Panel

Image Added

  • Le pourcentage de SWAP utilisé dépasse la valeur de SWAP_CRIT.

CRITIQUE

Panel

Image Added

  • Le pourcentage de RAM consommé dépassent la valeur de MEMORY_WARN.

ATTENTION

Panel

Image Added




  • Le pourcentage de SWAP utilisé dépasse la valeur de SWAP_WARN.

ATTENTION

Panel

Image Added

  • Les seuils du statut WARNING sont de :
    • 90% pour la mémoire RAM
    • 70% pour la mémoire SWAP
    • 15% pour la mémoire SWAP si la mémoire RAM est à plus de 90%
  • Les seuils du statut CRITICAL sont de :
  • 95% pour la mémoire RAM
  • 90% pour la mémoire SWAP
  • 20% pour la mémoire SWAP si la mémoire RAM est à plus de 90%

    Résultat

    Le résultat contient un message indiquant le statut ainsi qu'une jauge pour la mémoire ram et une jauge pour la mémoire swap si elle est présente.

    Résultat Long

    Le résultat long contient 3 tableaux :

    • Un Le premier tableau qui indique les 5 premiers processus les plus consommateurs.Un tableau qui indique les détails de la consommation de la mémoire RAM.
    • Le second tableau qui indique les cinq premiers processus les plus consommateurs.
    • Le troisième tableau 3eme est optionnel, car il n'apparait que si la mémoire SWAP est présente.
      • il indique les détails de sa consommationl'occupation du SWAP.

    Métriques

    Définition

    Nom de la métrique
    Unités
    UnitéDescription
    Seuil d'avertissementSeuil critique
    consumed%

    Quantité de mémoire consommée ( Mémoire en cours d'utilisation qui n'est pas libérable sans swapping. 100 - available ).

    MEMORY_WARN

    MEMORY_CRIT

    available%

    Quantité de mémoire disponible sans swapping.

    ----
    used
    buffered
    %

    Quantité de mémoire

    tampon utiliséebuffered_absKB

    utilisée  ( en prenant en compte le cache et la mémoire tampon ).

    ----
    buffered%

    Quantité de mémoire tampon utilisée.

    ----
    cached%

    Quantité de mémoire cache

    cached_abs

    .

    ----
    shared%
    KB

    Quantité de mémoire

    cacheconsumed

    partagé ( tmpfs et mémoire partagée du System V  ).

    ----
    free%

    Quantité de mémoire

    consomméeconsumed

    non utilisée.

    ----
    total_abs
    KB
    MB

    Quantité totale de mémoire

    consomméefree%

    Quantité de mémoire non utilisée

    free_absKB

    Quantité de mémoire non utilisée

    RAM disponible sur le serveur.

    ----
    consumed_absMB

    Quantité de mémoire consommée ( Mémoire en cours d'utilisation qui n'est pas libérable sans swapping. 100 - available ).

    total_abs * MEMORY_WARN / 100

    total_abs * MEMORY_CRIT / 100

    available_absMB

    Quantité de mémoire disponible without swapping.

    ----
    used_absMB

    Quantité de mémoire utilisée 

    used%Quantité de mémoire totale utilisée

    ( en prenant en compte le cache et la mémoire tampon )

    used

    .

    ----
    buffered_absMB

    Quantité de mémoire tampon utilisée.

    ----
    cached_absMB

    Quantité de mémoire cache.

    ----
    shared_abs
    KB
    MB

    Quantité de mémoire

    utilisée  ( en prenant en compte le cache et la mémoire tampon )

    partagé ( tmpfs et mémoire partagée du System V  ).

    ----
    free_absMB

    Quantité de mémoire non utilisée.

    ----
    swap_used%

    Quantité de mémoire swap

    utilisée 

    utilisée .

    SWAP_WARNSWAP_CRIT
    swap_free%

    Quantité de mémoire swap libre.

    ----
    swap_free_abs
    KB
    MB

    Quantité de mémoire swap libre.

    ----
    swap_total_abs
    KB
    MB

    Quantité totale de mémoire swap.

    ----
    swap_used_abs
    KB
    MB

    Quantité de mémoire swap utilisée

    total_absKBQuantité totale de mémoire ram disponible sur le serveur

    .

    ----

    Exemple

    Panel

    Image Added

    Les Erreurs

    Excerpt Include
    Erreurs du pack linux-by-SSH
    Erreurs du pack linux-by-SSH
    nopaneltrue