Sommaire

Contexte

Le check Memory by SNMPv1v2 va récupérer des informations concernant la mémoire vive et la mémoire swap de votre machine tel que le pourcentage utilisé et le top 5 des processus consommant le plus de mémoire.

  • Le statut de ce check possède 2 raisons de changer de statut :
    • Soit votre mémoire RAM est trop élevée,
    • Soit votre mémoire SWAP est trop élevée.
  • Le statut du check sera donc le pire état des deux.




Méthode de calcul de la mémoire consommée

La mémoire utilisée ( used ) est différente de la mémoire consommée ( consumed ) que nous utilisons pour la comparaison avec les seuils.

  • En effet, la mémoire d'un serveur Linux peut être utilisée par le système, mais pas consommée, car celle-ci sera gardée en cache par le système.
  • De cette manière, le serveur pourra piocher dans ce cache si besoin.

Bien que la mémoire utilisée soit très proche de la mémoire totale du serveur, le serveur peut toujours disposer de mémoire pour son système et les applications.

  • Nous souhaitons donc ne pas envoyer d'alerte inutile, car le serveur peut sembler saturé, alors qu'il dispose encore de plusieurs Go de RAM présents dans le cache par exemple.

Paramétrage

Le check utilise la ligne de commande suivante :

    $LINUX-BY-SNMP__SHINKEN__PLUGINSDIR$/check_linux_health_by_snmp_rust --check check_memory
    -H "$HOSTADDRESS$"
    -p "$_HOSTLINUX-BY-SNMP__PORT$"
    -t "$_HOSTLINUX-BY-SNMP__TIMEOUT$"
    -w "$_HOSTLINUX-BY-SNMP__MEMORY__RAM-WARN$"
    -c "$_HOSTLINUX-BY-SNMP__MEMORY__RAM-CRIT$"
    -W "$_HOSTLINUX-BY-SNMP__MEMORY__SWAP-WARN-WHEN-RAM-IS-CRIT$,$_HOSTLINUX-BY-SNMP__MEMORY__SWAP-WARN$"
    -S "$_HOSTLINUX-BY-SNMP__MEMORY__SWAP-CRIT-WHEN-RAM-IS-CRIT$,$_HOSTLINUX-BY-SNMP__MEMORY__SWAP-CRIT$"
    -s
    -a
    --snmp_version "2"
    --community "$_HOSTLINUX-BY-SNMP__V1V2-COMMUNITY$"

Données utilisées provenant des modèles

Données communes pour les checks des modèles

NomModifiable surUnitéDéfautValeur par défaut à l'installation de Shinken Description
LINUX-BY-SNMP__TIMEOUT

l'Hôte

( Onglet Données )

seconde5 5 Temps maximal en seconde pour réussir une connexion SNMP avant que le check ne renvoi une erreur INCONNU  ( La valeur doit être comprise entre 2 et 60 ).
LINUX-BY-SNMP__PORT

l'Hôte

( Onglet Données )

---

161161Port pour la connexion SNMP.
LINUX-BY-SNMP__V1V2-COMMUNITY

l'Hôte

( Onglet Données )

---public public

La Communauté SNMP v1/v2 défini sur votre linux :

  • En SNMP v1/v2, la communauté est un équivalent à un ID ou à un mot de passe pour se connecter aux équipements.


LINUX-BY-SNMP__V1V2-VERSION

l'Hôte

( Onglet Données )

---22

Sélectionne la version SNMP 1 ou 2 à utiliser.

Données spécifiques pour ce check

NomModifiable surUnitéValeur par défautDescription
LINUX-BY-SNMP__MEMORY__RAM-CRIT



l'Hôte

( Onglet Données )

%

95Définit le pourcentage de mémoire RAM utilisée à partir duquel le check passe en CRITIQUE.
LINUX-BY-SNMP__MEMORY__RAM-WARN



l'Hôte

( Onglet Données )

%

90Définit le pourcentage de mémoire RAM utilisée à partir duquel le check passe en ATTENTION .
LINUX-BY-SNMP__MEMORY__SWAP-CRIT

l'Hôte

( Onglet Données )

%

90Définit le pourcentage d'utilisation SWAP à partir duquel le check passe en CRITIQUE .
LINUX-BY-SNMP__MEMORY__SWAP-WARN

l'Hôte

( Onglet Données )

%

70Définit le pourcentage d'utilisation SWAP à partir duquel le check passe en ATTENTION .
LINUX-BY-SNMP__MEMORY__SWAP-CRIT-WHEN-RAM-IS-CRIT



l'Hôte

( Onglet Données )

%

20Définit le pourcentage d'utilisation SWAP à partir duquel le status de la swap passe en   CRITIQUE si la mémoire RAM est à plus de LINUX-BY-SNMP__MEMORY__RAM-CRIT.
LINUX-BY-SNMP__MEMORY__SWAP-WARN-WHEN-RAM-IS-CRIT

l'Hôte

( Onglet Données )

%

15Définit le pourcentage d'utilisation SWAP à partir duquel le status de la swap passe en ATTENTION si la mémoire RAM est à plus de LINUX-BY-SNMP__MEMORY__RAM-WARN.

Données DFE ( Duplicate Foreach )

Pas de données DFE pour ce check

Données utilisées provenant du check

Pas de données provenant du check pour ce modèle

Données globales

NomModifiable surUnitéDéfautValeur par défaut à l'installationDescription
USERPLUGINSDIR

Non modifiable

( Sauf Admin Shinken )

--/var/lib/shinken/libexec /var/lib/shinken/libexec

Chemin absolu contenant les sondes installés par Shinken

LINUX-BY-SNMP__SHINKEN__VENDOR

Non modifiable

( Sauf Admin Shinken )

--shinken-additional-packs shinken-additional-packs

Dossier fournit par shinken

LINUX-BY-SNMP__SHINKEN__PACKNAME

Non modifiable

( Sauf Admin Shinken )


linux-by-SNMP__shinken linux-by-SNMP__shinken

Dossier contenant les sondes 

LINUX-BY-SNMP__SHINKEN__PLUGINSDIR

Non modifiable

( Sauf Admin Shinken )

--
USERPLUGINSDIR/LINUX-BY-SNMP__SHINKEN__VENDOR/
LINUX-BY-SNMP__SHINKEN__PACKNAME
/var/lib/shinken-user/libexec/shinken-additional-packs/linux-by-SNMP__shinken

Chemin absolu du dossier contenant les sondes du pack linux-by-SNMP__shinken ( non modifiable )

Propriétés de l'hôte

NomModifiable surUnitéDéfautValeur par défautDescription
HOSTADDRESS

l'Hôte

( Onglet Général )

--

Nom de l'hôte Nom de l'hôte

Adresse de l'hôte

Résultat

Exemple


Interprétation

Statut

  • Il peut prendre 4 valeurs différentes    OK  /  CRITIQUE  /  ATTENTION   /   INCONNU   .

    • Le statut va dépendre du retour de sonde et de la configuration spécifique du check pour les données suivantes :

      • LINUX-BY-SNMP__MEMORY__RAM-CRIT

      • LINUX-BY-SNMP__MEMORY__RAM-WARN

      • LINUX-BY-SNMP__MEMORY__SWAP-CRIT

      • LINUX-BY-SNMP__MEMORY__SWAP-WARN

Le texte de la colonne  "Affichage des seuils" montre les paramètres utilisés et leur valeur définie sur l'équipement supervisé.

 

Situation

Statut

Exemple

  • Le pourcentage de RAM dépassent la valeur de LINUX-BY-SNMP__MEMORY__RAM-CRIT.

CRITIQUE

  • Le pourcentage de RAM dépassent la valeur de LINUX-BY-SNMP__MEMORY__RAM-WARN.

ATTENTION

  • Le pourcentage de SWAP dépasse la valeur de LINUX-BY-SNMP__MEMORY__SWAP-CRIT.

CRITIQUE

  • Le pourcentage de SWAP dépasse la valeur de LINUX-BY-SNMP__MEMORY__SWAP-WARN.

ATTENTION

  • Le pourcentage de RAM dépassent la valeur de LINUX-BY-SNMP__MEMORY__RAM-CRIT.et le pourcentage de SWAP est supérieur à LINUX-BY-SNMP__MEMORY__SWAP-CRIT-WHEN-RAM-IS-CRIT.
    ( Cela n'a pas d'effet direct sur le status de la sonde, car elle est déjà en CRITIQUE . Cependant,  une indication visuelle montre l'état aggravé de la swap. )

CRITIQUE

  • Le pourcentage de RAM dépassent la valeur de LINUX-BY-SNMP__MEMORY__RAM-CRIT.et le pourcentage de SWAP est supérieur à LINUX-BY-SNMP__MEMORY__SWAP-WARN-WHEN-RAM-IS-CRIT.
    ( Cela n'a pas d'effet direct sur le status de la sonde, car elle est déjà en CRITIQUE . Cependant,  une indication visuelle montre l'état aggravé de la swap. )

    CRITIQUE




Résultat

Le résultat contient un message indiquant le statut ainsi que le pourcentage des RAM et de SWAP.

Résultat Long

Le résultat long contient 3 tableaux :

  • Un tableau qui indique les 5 premiers processus les plus consommateurs.
  • Un tableau qui indique les détails de la consommation de la mémoire RAM
  • Le 3eme est optionnel car il n'apparait que si la mémoire SWAP est présente
    • il indique les détails de sa consommation.

Métriques

Nom de la métriqueUnitéDescriptionSeuil d'avertissementSeuil critique
consumed%

Quantité de mémoire consommée ( Mémoire en cours d'utilisation qui n'est pas libérable sans swapping. 100 - available ).

LINUX-BY-SNMP__MEMORY__RAM-WARN

LINUX-BY-SNMP__MEMORY__RAM-CRIT

available%

Quantité de mémoire disponible sans swapping.

--

--

used%

Quantité de mémoire utilisée  ( en prenant en compte le cache et la mémoire tampon ).

--

--

buffered%

Quantité de mémoire tampon utilisée.

--

--

cached%

Quantité de mémoire cache.

--

--

shared%

Quantité de mémoire partagé ( tmpfs et mémoire partagée du System V  ).

--

--

free%

Quantité de mémoire non utilisée.

--

--

total_absMB

Quantité totale de mémoire RAM disponible sur le serveur.

--

--

consumed_absMB

Quantité de mémoire consommée ( Mémoire en cours d'utilisation qui n'est pas libérable sans swapping. 100 - available ).

total_abs * LINUX-BY-SNMP__MEMORY__RAM-WARN / 100

total_abs * LINUX-BY-SNMP__MEMORY__RAM-CRIT / 100

available_absMB

Quantité de mémoire disponible without swapping.

--

--

used_absMB

Quantité de mémoire utilisée  ( en prenant en compte le cache et la mémoire tampon ).

--

--

buffered_absMB

Quantité de mémoire tampon utilisée.

--

--

cached_absMB

Quantité de mémoire cache.

--

--

shared_absMB

Quantité de mémoire partagé ( tmpfs et mémoire partagée du System V  ).

--

--

free_absMB

Quantité de mémoire non utilisée.

--

--

swap_used%

Quantité de mémoire swap utilisée .

LINUX-BY-SNMP__MEMORY__SWAP-WARN

LINUX-BY-SNMP__MEMORY__SWAP-WARN

swap_free%

Quantité de mémoire swap libre.

--

--

swap_free_absMB

Quantité de mémoire swap libre.

--

--

swap_total_absMB

Quantité totale de mémoire swap.

--

--

swap_used_absMB

Quantité de mémoire swap utilisée.

--

--

Erreurs et pré-requis

Erreurs de connexion ( communes à tous les checks )

UNKNOWN – Session error: timeout

La connexion SNMP est configuré par défaut pour se couper si aucune réponse n'est perçu après cinq secondes ( paramétrable avec LINUX-BY-SNMP__TIMEOUT ).


Cette erreur peut intervenir lorsque :

  • Aucun accès réseau n'est disponible vers l'hôte.
  • En SNMP v1 ou v2, la communauté utilisée est incorrecte.
  • En SNMP v3, la clef privée ( LINUX-BY-SNMP__V3-PASSPHRASE-PRIV ) utilisée est incorrecte.

UNKNOWN – Failed to create SNMP session. Got error: failed to lookup address information: Name or service not known

La résolution DNS de l'hôte a échoué.

UNKNOWN – Session error: Socket receive error: host unreachable

La tentative de connexion à l'hôte a échoué à atteindre l'hôte.

Cette erreur peut être générée à cause d'une mauvaise configuration de pare-feu.

UNKNOWN – Session error: Socket receive error: connection refused


La tentative de connexion à l'hôte a été refusé.

Cette erreur peut intervenir lorsque :

  • Un pare-feu bloque la requête
  • Le service SNMP du serveur à supervisé n'est pas démarré.

UNKNOWN – Session error: Unexpected report: authentication failure

L'authentification SNMP v3 a échoué.

Cette erreur peut intervenir lorsque :

  • En SNMP v3, le mot de passe ( LINUX-BY-SNMP__V3-PASSPHRASE-AUTH ) utilisée est incorrecte.
  • En SNMP v3, la méthode de hachage ( LINUX-BY-SNMP__V3-PROTOCOL-AUTH ) utilisée est incorrecte.

UNKNOWN – Session error: Unexpected report: unknown user name

L'utilisateur SNMP v3 utilisé n'existe pas.


UNKNOWN – Session error: Unexpected report: unsupported security level.


L'authentification SNMP v3 a échoué. La méthode d'authentification n'est pas authorisé.



Cette erreur peut intervenir lorsque :

Erreurs de configuration de l'hôte à superviser ( communes à tous les checks )

Les erreurs suivantes peuvent arriver sur la version SNMPv2 et SNMPv3.

MONITORED HOST - BAD STATE – No [ ... ] data found. This might be due to :


Deux erreurs sont possibles :

  • La vue SNMP configuré n'a pas les droits suffisants.
  • La configuration SNMP n'inclus pas les options "extend" nécessaires au bon fonctionnement des checks.



RESOLUTION :

Il faut vérifier les deux étapes suivantes de la configuration :

Votre essai Premium est terminéVotre essai Premium est terminéVotre essai Premium est terminé