Le check checkProcessMemory SSH permet de vérifier la consommation de la mémoire d'un seul ou plusieurs processus. Il permet donc de garder un œil sur le ou les processus de votre choix.
Le check utilise une donnée Duplicate Foreach qui permet de générer plusieurs fois le check pour chaque processus ou ensemble de processus à superviser.
|
Le check utilise la ligne de commande suivante :
$LINUXBYSSH_SHINKEN_PLUGINSDIR$/check_linux_health_by_ssh_rust --check check_process
-H "$HOSTADDRESS$"
-u "$_HOSTSSH_USER$"
-p "$_HOSTSSH_PORT$"
-i "$_HOSTSSH_KEY$"
-P "$_HOSTSSH_KEY_PASSPHRASE$"
-w "$_SERVICEPROCESS_WARNING$"
-c "$_SERVICEPROCESS_CRITICAL$"
-C "$ARG1$"
-X "$_SERVICEPROCESS_HIDE_ALL$"
-S "$_SERVICEPROCESS_SUM_ALL$"
-r "$_SERVICEUSE_REGEX_TO_MATCH_PROCESS$"
-x "$_SERVICEPROCESS_MATCH_X_WORDS$"
-T "$_SERVICEUSE_MEMORY_THRESHOLD_ON$"
--min-count "$_SERVICEMIN_PROCESS_COUNT$"
--max-count "$_SERVICEMAX_PROCESS_COUNT$" |
| Donnée | Description | Exemple |
|---|---|---|
| PROCESSES_TO_CHECK | Définit une paire KEY$(VALUE)$, la KEY correspond à la description du processus à vérifier et la VALUE au nom du processus. | SYSTEM$(/usr/lib/systemd/systemd)$, DATABASE$(mongod)$ |
Si vous avez des difficultés à trouver les processus à superviser, essayez en premier lieu de les trouver sur la machine supervisée avec la commande ps et grep :
|
Plus d'information sont disponibles, concernant le mécanisme de Duplicate Foreach, sur la page Dupliquer des checks en fonction d'une liste de valeurs présentes dans la Donnée d'un hôte (duplicate_foreach)
| Donnée | Description | Valeur par défaut | |
|---|---|---|---|
| PROCESS_WARNING | Seuil de consommation mémoire au-dessus duquel un ATTENTION est déclenché | 100MB | |
| PROCESS_CRITICAL | Seuil de consommation mémoire au-dessus duquel un CRITIQUE est déclenché | 200MB | |
| PROCESS_HIDE_ALL | Active/désactive l'affichage des métriques de ce check | False | |
| USE_REGEX_TO_MATCH_PROCESS | Active ou désactive l'utilisation de regex
| False | |
| PROCESS_MATCH_X_WORDS | Lors de la récupération des lignes de commandes de processus, définit le nombre de mots à utiliser pour la comparaison aux filtres et la génération des métriques.
Il permet de tronquer une partie ou l'ensemble des arguments des lignes de commandes. Il est utilisé pour :
| 1 | |
| USE_MEMORY_THRESHOLD_ON | Définit comment sont utilisés les seuils PROCESS_WARNING et PROCESS_CRITICAL. Valeurs possibles :
| group | |
| MIN_PROCESS_COUNT | Nombre minimum de processus à correspondre. | 1 | |
| MAX_PROCESS_COUNT | Nombre maximum de processus à correspondre.
| NONE | |
| PROCESS_SUM_ALL | Active/désactive le calcul de la consommation de la mémoire sur un ensemble de processus. Paramètre déprécié. Utilisez USE_MEMORY_THRESHOLD_ON : sum. | False |
Pour utiliser ce check il vous faudra tout d'abord définir une paire KEY$(VALUE)$ dans la donnée PROCESSES_TO_CHECK. Cette donnée est une donnée DFE (Duplicate Foreach), on peut donc chainer plusieurs paires KEY$(VALUE)$.
|
Il peut prendre quatre valeurs OK / CRITIQUE / ATTENTION / INCONNU
Le statut va dépendre du retour de sonde et de la configuration spécifique du check pour les données suivantes :
Voici un tableau récapitulatif du statut attendu suivant le retour de sonde :
Le texte de la colonne "Affichage des seuils" montre les paramètres utilisés et leur valeur définie sur l'équipement supervisé.
|
Situation | Statut | Exemple |
|---|---|---|
| CRITIQUE |
|
| ATTENTION | ![]() |
| CRITIQUE |
|
| ATTENTION |
|
| CRITIQUE |
|
| ATTENTION |
|
| INCONNU |
|
| INCONNU |
|
| INCONNU |
|
| CRITIQUE |
|
Le résultat long affiche un tableau de la consommation mémoire des processus trouvés correspondant aux filtres.
Le nom des processus trouvés dépend de PROCESS_MATCH_X_WORDS qui définit le nombre de mots que contient le nom du processus à afficher.
Le tableau affiche également des groupes de processus, qui sont un ensemble de processus aillant le même nom.
| Nom de la métrique | Description |
|---|---|
| --_PROCESS_MEMORY_SUM_-- | Somme de la consommation mémoire des processus surveillés en MB. |
| ( nom_du_groupe_de_processus ) | Consommation mémoire d'un groupe de processus en MB. Calculé à partir de la somme de la mémoire RSS de chaque processus au sein du groupe. Généré pour chaque groupe de processus trouvé. |
Il est possible de ne retourner aucune métrique en configurant l'option PROCESS_HIDE_ALL du check. |