| Panel | ||||
|---|---|---|---|---|
| ||||
|
Contexte
Le check Memory SSH va récupérer des informations concernant la mémoire vive et la mémoire swap de votre machine tel que le pourcentage utilisé et le top 5 des processus consommant le plus de mémoire.
- Le statut de ce check possède 2 raisons de changer de statut :
- Soit la consommation de mémoire RAM est trop élevée,
- Soit l'utilisation de mémoire SWAP est trop élevée.
- Le statut du check sera donc le pire état des deux.
| Panel |
|---|
Méthode de calcul de la mémoire consommée
La mémoire utilisée ( used ) est différente de la mémoire consommée ( consumed ) que nous utilisons pour la comparaison avec les seuils.
- La mémoire utilisée est l'ensemble de la mémoire que le système utilise : mémoire des programmes, mémoire partagés ( shared ) , mémoire tampons ( buffers ), mémoire cache ( cached ). La mémoire utilisée va s'approcher de la mémoire totale, car le système aura tendance à mettre en mémoire cache les fichiers lus et programmes exécutés, pour que les prochaines opérations ne nécessitent pas de relire le disque, mais la RAM, et seront donc bien plus rapide. Si la mémoire utilisée est proche de la mémoire totale de son système, c'est un phénomène normal et pas inquiétant.
- La mémoire consommée est la mémoire utilisée par le système qui ne peut pas être libéré sans transferts vers la SWAP, qui est une opération lourde qui ralentit le système. Si la mémoire consommée approche de la mémoire totale, alors le système va devoir utiliser la mémoire SWAP et être ralenti. C'est donc la mémoire consommée que la sonde va surveiller et comparer aux seuils.
Il est également important de noter que la commande free utilisée lors de la récupération des informations de mémoire du serveur a changé depuis sa version 3.3.9.
- La version plus récente permet facilement de calculer la mémoire consommée réellement par le serveur via la mémoire totale moins la mémoire available ( ajoutée dans la commande mise à jour ).
- L'ancienne version ne dispose pas de la mémoire available, il faut se baser sur la mémoire buffed et cached.
- Ce calcul est une approximation, et peut ne pas refléter la réalité, car toute la mémoire cached n'est pas forcément de la mémoire qui peut être libéré et donc available.
Le check calcule donc la mémoire consommée comme tel :
- free < 3.3.9 : consumed = used - buffed - cached
- free > 3.3.9 : consumed = total - available
La sonde saura s'adapter suivant la version de la commande free.
Paramétrage
Le check utilise la ligne de commande suivante :
| Code Block | ||||
|---|---|---|---|---|
| ||||
$LINUXBYSSH_SHINKEN_PLUGINSDIR$/check_linux_health_by_ssh_rust --check check_memory -H "$HOSTADDRESS$" -u "$_HOSTSSH_USER$" -p "$_HOSTSSH_PORT$" -i "$_HOSTSSH_KEY$" -P "$_HOSTSSH_KEY_PASSPHRASE$" -w "$_HOSTMEMORY_WARN$" -c "$_HOSTMEMORY_CRIT$" -m -s -C "$_HOSTSWAP_CRIT_WHEN_HIGH_PHYSICAL_MEMORY$,$_HOSTSWAP_CRIT$" -W "$_HOSTSWAP_WARN_WHEN_HIGH_PHYSICAL_MEMORY$,$_HOSTSWAP_WARN$" |
Données utilisées provenant du modèle
Données communes pour les checks des modèles
Authentification
| Excerpt Include | ||||||
|---|---|---|---|---|---|---|
|
Données spécifiques pour ce check
| Donnée | Modifiable sur | Unité | Valeur par défaut | Description | ||
|---|---|---|---|---|---|---|
| l'Hôte ( Onglet Données ) | % | 95 | Définit le pourcentage de mémoire RAM utilisée à partir duquel le check passe en CRITIQUE . | ||
| l'Hôte ( Onglet Données ) | % | 90 | Définit le pourcentage de mémoire RAM utilisée à partir duquel le check passe en ATTENTION . | ||
| l'Hôte ( Onglet Données ) | % | 90 | Définit le pourcentage d'utilisation SWAP à partir duquel le check passe en CRITIQUE . | ||
| l'Hôte ( Onglet Données ) | % | 70 | Définit le pourcentage d'utilisation SWAP à partir duquel le check passe en ATTENTION . | ||
| l'Hôte ( Onglet Données ) | % | 20 | Définit le pourcentage d'utilisation SWAP à partir duquel le check passe en CRITIQUE si la mémoire RAM est à plus de MEMORY_CRIT. | ||
| l'Hôte ( Onglet Données ) | % | 15 | Définit le pourcentage d'utilisation SWAP à partir duquel le check passe en ATTENTION si la mémoire RAM est à plus de MEMORY_WARN. |
Données utilisées provenant du check
Pas de données spécifiques pour ce check
Données DFE ( Duplicate Foreach )
Pas de données DFE pour ce check
Données utilisées provenant du check
Résultat
Exemple
| Panel |
|---|
Interprétation des données
Statut
Il peut prendre 4 valeurs différentes OK / CRITIQUE / ATTENTION / INCONNU .
Le statut va dépendre du retour de sonde et de la configuration spécifique du check pour les données suivantes :
MEMORY_CRIT
MEMORY_WARN
SWAP_CRIT
SWAP_WARN
Voici un tableau récapitulatif du statut attendu suivant le retour de sonde :
| Info | ||
|---|---|---|
Le texte de la colonne "Affichage des seuils" montre les paramètres utilisés et leur valeur définie sur l'équipement supervisé.
|
Situation | Statut | Exemple | ||||
|---|---|---|---|---|---|---|
| CRITIQUE |
| ||||
| ATTENTION |
|
Résultat
Le résultat contient un message indiquant le statut ainsi qu'une jauge pour la mémoire ram et une jauge pour la mémoire swap si elle est présente.
Résultat Long
Le résultat long contient 3 tableaux :
- Le premier tableau qui indique les détails de la consommation de la mémoire RAM.
- Le second tableau qui indique les cinq premiers processus les plus consommateurs.
- Le troisième tableau est optionnel, car il n'apparait que si la mémoire SWAP est présente.
- il indique les détails de l'occupation du SWAP.
Métriques
Définition
| Nom de la métrique | Unité | Description | Seuil d'avertissement | Seuil critique |
|---|---|---|---|---|
| consumed | % | Quantité de mémoire consommée ( Mémoire en cours d'utilisation qui n'est pas libérable sans swapping. 100 - available ). | MEMORY_WARN | MEMORY_CRIT |
| available | % | Quantité de mémoire disponible sans swapping. | -- | -- |
| used | % | Quantité de mémoire utilisée ( en prenant en compte le cache et la mémoire tampon ). | -- | -- |
| buffered | % | Quantité de mémoire tampon utilisée. | -- | -- |
| cached | % | Quantité de mémoire cache. | -- | -- |
| shared | % | Quantité de mémoire partagé ( tmpfs et mémoire partagée du System V ). | -- | -- |
| free | % | Quantité de mémoire non utilisée. | -- | -- |
| total_abs | MB | Quantité totale de mémoire RAM disponible sur le serveur. | -- | -- |
| consumed_abs | MB | Quantité de mémoire consommée ( Mémoire en cours d'utilisation qui n'est pas libérable sans swapping. 100 - available ). | total_abs * MEMORY_WARN / 100 | total_abs * MEMORY_CRIT / 100 |
| available_abs | MB | Quantité de mémoire disponible without swapping. | -- | -- |
| used_abs | MB | Quantité de mémoire utilisée ( en prenant en compte le cache et la mémoire tampon ). | -- | -- |
| buffered_abs | MB | Quantité de mémoire tampon utilisée. | -- | -- |
| cached_abs | MB | Quantité de mémoire cache. | -- | -- |
| shared_abs | MB | Quantité de mémoire partagé ( tmpfs et mémoire partagée du System V ). | -- | -- |
| free_abs | MB | Quantité de mémoire non utilisée. | -- | -- |
| swap_used | % | Quantité de mémoire swap utilisée . | -- | -- |
| swap_free | % | Quantité de mémoire swap libre. | -- | -- |
| swap_free_abs | MB | Quantité de mémoire swap libre. | -- | -- |
| swap_total_abs | MB | Quantité totale de mémoire swap. | -- | -- |
| swap_used_abs | MB | Quantité de mémoire swap utilisée. | -- | -- |
Exemple
| Panel |
|---|






