Contexte

Le check Memory by SNMPv3 va récupérer des informations concernant la mémoire vive et la mémoire swap de la machine supervisée, tel que le pourcentage utilisé et le top 5 des processus consommant le plus de mémoire.

  • Le statut de ce check possède 2 raisons de changer de statut :
    • Soit la mémoire RAM est trop élevée,
    • Soit la mémoire SWAP est trop élevée.
  • Le statut du check sera donc le pire état des deux.




Méthode de calcul de la mémoire consommée

La mémoire utilisée ( used ) est différente de la mémoire consommée ( consumed ) que nous utilisons pour la comparaison avec les seuils.

  • En effet, la mémoire d'un serveur Linux peut être utilisée par le système, mais pas consommée, car celle-ci sera gardée en cache par le système.
  • De cette manière, le serveur pourra piocher dans ce cache si besoin.

Bien que la mémoire utilisée soit très proche de la mémoire totale du serveur, le serveur peut toujours disposer de mémoire pour son système et les applications.

  • Nous souhaitons donc ne pas envoyer d'alerte inutile car le serveur peut sembler saturé, alors qu'il dispose encore de plusieurs Go de RAM présents dans le cache par exemple.

Paramétrage

Le check utilise une des lignes de commandes suivantes selon le modèle d'hôte utilisé :


    $LINUX-BY-SNMP__SHINKEN__PLUGINSDIR$/check_linux_health_by_snmp_rust --check check_memory
    -H "$HOSTADDRESS$"
    -p "$_HOSTLINUX-BY-SNMP__PORT$"
    -t "$_HOSTLINUX-BY-SNMP__TIMEOUT$"
    -w "$_HOSTLINUX-BY-SNMP__MEMORY__RAM-WARN$"
    -c "$_HOSTLINUX-BY-SNMP__MEMORY__RAM-CRIT$"
    -W "$_HOSTLINUX-BY-SNMP__MEMORY__SWAP-WARN-WHEN-RAM-IS-CRIT$,$_HOSTLINUX-BY-SNMP__MEMORY__SWAP-WARN$"
    -S "$_HOSTLINUX-BY-SNMP__MEMORY__SWAP-CRIT-WHEN-RAM-IS-CRIT$,$_HOSTLINUX-BY-SNMP__MEMORY__SWAP-CRIT$"
    -s
    -a
    --snmp_version "3"
    --user "$_HOSTLINUX-BY-SNMP__V3-LOGIN$"
    --level "noAuthNoPriv"
    $LINUX-BY-SNMP__SHINKEN__PLUGINSDIR$/check_linux_health_by_snmp_rust --check check_memory
    -H "$HOSTADDRESS$"
    -p "$_HOSTLINUX-BY-SNMP__PORT$"
    -t "$_HOSTLINUX-BY-SNMP__TIMEOUT$"
    -w "$_HOSTLINUX-BY-SNMP__MEMORY__RAM-WARN$"
    -c "$_HOSTLINUX-BY-SNMP__MEMORY__RAM-CRIT$"
    -W "$_HOSTLINUX-BY-SNMP__MEMORY__SWAP-WARN-WHEN-RAM-IS-CRIT$,$_HOSTLINUX-BY-SNMP__MEMORY__SWAP-WARN$"
    -S "$_HOSTLINUX-BY-SNMP__MEMORY__SWAP-CRIT-WHEN-RAM-IS-CRIT$,$_HOSTLINUX-BY-SNMP__MEMORY__SWAP-CRIT$"
    -s
    -a
    --snmp_version "3"
    --user "$_HOSTLINUX-BY-SNMP__V3-LOGIN$"
    --auth_password "$_HOSTLINUX-BY-SNMP__V3-PASSPHRASE-AUTH$"
    --auth_protocol "$_HOSTLINUX-BY-SNMP__V3-PROTOCOL-AUTH$"
    --level "authNoPriv"
    $LINUX-BY-SNMP__SHINKEN__PLUGINSDIR$/check_linux_health_by_snmp_rust --check check_memory
    -H "$HOSTADDRESS$"
    -p "$_HOSTLINUX-BY-SNMP__PORT$"
    -t "$_HOSTLINUX-BY-SNMP__TIMEOUT$"
    -w "$_HOSTLINUX-BY-SNMP__MEMORY__RAM-WARN$"
    -c "$_HOSTLINUX-BY-SNMP__MEMORY__RAM-CRIT$"
    -W "$_HOSTLINUX-BY-SNMP__MEMORY__SWAP-WARN-WHEN-RAM-IS-CRIT$,$_HOSTLINUX-BY-SNMP__MEMORY__SWAP-WARN$"
    -S "$_HOSTLINUX-BY-SNMP__MEMORY__SWAP-CRIT-WHEN-RAM-IS-CRIT$,$_HOSTLINUX-BY-SNMP__MEMORY__SWAP-CRIT$"
    -s
    -a
    --snmp_version "3"
    --user "$_HOSTLINUX-BY-SNMP__V3-LOGIN$"
    --auth_password "$_HOSTLINUX-BY-SNMP__V3-PASSPHRASE-AUTH$"
    --priv_passphrase "$_HOSTLINUX-BY-SNMP__V3-PASSPHRASE-PRIV$"
    --auth_protocol "$_HOSTLINUX-BY-SNMP__V3-PROTOCOL-AUTH$"
    --priv_protocol "$_HOSTLINUX-BY-SNMP__V3-PROTOCOL-PRIV$"
    --level "authPriv"

Données utilisées provenant des modèles

Données communes pour les checks des modèles

Données spécifiques pour ce check

NomModifiable surUnitéValeur par défautDescription
LINUX-BY-SNMP__MEMORY__RAM-CRIT



l'Hôte

( Onglet Données )

%

95Définit le pourcentage de mémoire RAM utilisée à partir duquel le check passe en CRITIQUE .
LINUX-BY-SNMP__MEMORY__RAM-WARN



l'Hôte

( Onglet Données )

%

90Définit le pourcentage de mémoire RAM utilisée à partir duquel le check passe en ATTENTION .
LINUX-BY-SNMP__MEMORY__SWAP-CRIT

l'Hôte

( Onglet Données )

%

90Définit le pourcentage d'utilisation SWAP à partir duquel le check passe en CRITIQUE .
LINUX-BY-SNMP__MEMORY__SWAP-WARN




l'Hôte

( Onglet Données )

%

70Définit le pourcentage d'utilisation SWAP à partir duquel le check passe en ATTENTION .
LINUX-BY-SNMP__MEMORY__SWAP-CRIT-WHEN-RAM-IS-CRIT



l'Hôte

( Onglet Données )

%

20Définit le pourcentage d'utilisation SWAP à partir duquel le status de la swap passe en   CRITIQUE si la mémoire RAM est à plus de LINUX-BY-SNMP__MEMORY__RAM-CRIT.
LINUX-BY-SNMP__MEMORY__SWAP-WARN-WHEN-RAM-IS-CRIT

l'Hôte

( Onglet Données )

%

15Définit le pourcentage d'utilisation SWAP à partir duquel le status de la swap passe en ATTENTION si la mémoire RAM est à plus de LINUX-BY-SNMP__MEMORY__RAM-WARN.

Données DFE ( Duplicate Foreach )

Pas de données DFE pour ce check

Données utilisées provenant du check

Pas de données provenant du check pour ce modèle

Propriétés de l'hôte

NomModifiable surUnitéDéfautValeur par défautDescription
HOSTADDRESS

l'Hôte

( Onglet Général )

--

Nom de l'hôte Nom de l'hôte

Adresse de l'hôte

Résultat

Exemple

Interprétation

Statut

  • Il peut prendre 4 valeurs différentes    OK  /  CRITIQUE  /  ATTENTION   /   INCONNU   .

    • Le statut va dépendre du retour de sonde et de la configuration spécifique du check pour les données suivantes :

      • LINUX-BY-SNMP__MEMORY__RAM-CRIT

      • LINUX-BY-SNMP__MEMORY__RAM-WARN

      • LINUX-BY-SNMP__MEMORY__SWAP-CRIT

      • LINUX-BY-SNMP__MEMORY__SWAP-WARN

    • Voici un tableau récapitulatif du statut attendu suivant le retour de sonde :

Le texte de la colonne  "Affichage des seuils" montre les paramètres utilisés et leur valeur définie sur l'équipement supervisé.

 

Situation

Statut

Exemple

  • Le pourcentage de RAM dépassent la valeur de LINUX-BY-SNMP__MEMORY__RAM-CRIT.

CRITIQUE

  • Le pourcentage de RAM dépassent la valeur de LINUX-BY-SNMP__MEMORY__RAM-WARN.

  ATTENTION

  • Le pourcentage de SWAP dépasse la valeur de LINUX-BY-SNMP__MEMORY__SWAP-CRIT.

CRITIQUE

  • Le pourcentage de SWAP dépasse la valeur de LINUX-BY-SNMP__MEMORY__SWAP-WARN.

ATTENTION

  • Le pourcentage de RAM dépassent la valeur de LINUX-BY-SNMP__MEMORY__RAM-CRIT.et le pourcentage de SWAP est supérieur à LINUX-BY-SNMP__MEMORY__SWAP-CRIT-WHEN-RAM-IS-CRIT.
    ( Cela n'a pas d'effet direct sur le status de la sonde, car elle est déjà en CRITIQUE . Cependant,  une indication visuelle montre l'état aggravé de la swap. )

  CRITIQUE

  • Le pourcentage de RAM dépassent la valeur de LINUX-BY-SNMP__MEMORY__RAM-CRIT.et le pourcentage de SWAP est supérieur à LINUX-BY-SNMP__MEMORY__SWAP-WARN-WHEN-RAM-IS-CRIT.
    ( Cela n'a pas d'effet direct sur le status de la sonde, car elle est déjà en CRITIQUE . Cependant,  une indication visuelle montre l'état aggravé de la swap. )

   CRITIQUE

Résultat

Le résultat contient un message indiquant le statut ainsi que le pourcentage des RAM et de SWAP.

Résultat Long

Le résultat long contient 3 tableaux :

  • Un tableau qui indique les 5 premiers processus les plus consommateurs.
  • Un tableau qui indique les détails de la consommation de la mémoire RAM
  • Le 3eme est optionnel car il n'apparait que si la mémoire SWAP est présente
    • il indique les détails de sa consommation.


Métriques

Définition

Nom de la métriqueUnitésDescriptionSeuil d'avertissementSeuil critique
buffered%

Quantité de mémoire tampon utilisée



buffered_absMB

Quantité de mémoire tampon utilisée



cached%

Quantité de mémoire cache



cached_absMB

Quantité de mémoire cache



consumed%

Quantité de mémoire consommée



consumed_absMB

Quantité de mémoire consommée



free%

Quantité de mémoire non utilisée



free_absMB

Quantité de mémoire non utilisée



used%

Quantité de mémoire totale utilisée ( en prenant en compte le cache et la mémoire tampon )



used_absMB

Quantité de mémoire utilisée  ( en prenant en compte le cache et la mémoire tampon )



swap_used%

Quantité de mémoire swap utilisée 



swap_free%

Quantité de mémoire swap libre



swap_free_absMB

Quantité de mémoire swap libre



swap_totalMB

Quantité totale de mémoire swap



swap_used_absMB

Quantité de mémoire swap utilisée



total_absMB

Quantité totale de mémoire ram disponible sur le serveur



Exemple

Erreurs et pré-requis