Contexte
Le check Processes Memory Matching [ $KEY$ ] by SNMPv1v2 permet de vérifier la consommation de la mémoire d'un seul ou plusieurs processus. Il permet donc de garder un œil sur le ou les processus de votre choix.
Le check peut être configuré pour renvoyer un status INCONNU si un nombre de processus trouvés minimum ou maximum est dépassé.
Le check utilise une donnée Duplicate Foreach qui permet de générer plusieurs fois le check pour chaque processus ou ensemble de processus à superviser.
Paramétrage
$LINUX-BY-SNMP__SHINKEN__PLUGINSDIR$/check_linux_health_by_snmp_rust --check check_processes_memory_matching
-H "$HOSTADDRESS$"
-p "$_HOSTLINUX-BY-SNMP__PORT$"
-t "$_HOSTLINUX-BY-SNMP__TIMEOUT$"
-w "$_SERVICELINUX-BY-SNMP__PROCESSES-MEMORY-MATCHING__MEMORY-WARN$"
-c "$_SERVICELINUX-BY-SNMP__PROCESSES-MEMORY-MATCHING__MEMORY-CRIT$"
-C "$ARG1$"
-X "$_SERVICELINUX-BY-SNMP__PROCESSES-MEMORY-MATCHING__HIDE-ALL$"
-S "$_SERVICELINUX-BY-SNMP__PROCESSES-MEMORY-MATCHING__SUM-ALL$"
-r "$_SERVICELINUX-BY-SNMP__PROCESSES-MEMORY-MATCHING__USE-REGEX-TO-MATCH-PROCESS$"
-x "$_SERVICELINUX-BY-SNMP__PROCESSES-MEMORY-MATCHING__PROCESS-MATCH-X-WORDS$"
-T "$_SERVICELINUX-BY-SNMP__PROCESSES-MEMORY-MATCHING__USE-MEMORY-THRESHOLD-ON$"
--min-count "$_SERVICELINUX-BY-SNMP__PROCESSES-MEMORY-MATCHING__MIN-PROCESS-COUNT$"
--max-count "$_SERVICELINUX-BY-SNMP__PROCESSES-MEMORY-MATCHING__MAX-PROCESS-COUNT$"
--snmp_version "2"
--community "$_HOSTLINUX-BY-SNMP__V1V2-COMMUNITY$"
Données utilisées provenant des modèles
Données communes pour les checks des modèles
l'Hôte ( Onglet Données ) l'Hôte ( Onglet Données ) --- l'Hôte ( Onglet Données ) La Communauté SNMP v1/v2 défini sur votre linux : l'Hôte ( Onglet Données ) Sélectionne la version SNMP 1 ou 2 à utiliser.Nom Modifiable sur Unité Défaut Valeur par défaut à l'installation de Shinken Description LINUX-BY-SNMP__TIMEOUT
seconde 5 5 Temps maximal en seconde pour réussir une connexion SNMP avant que le check ne renvoi une erreur INCONNU ( La valeur doit être comprise entre 2 et 60 ). LINUX-BY-SNMP__PORT
161 161 Port pour la connexion SNMP. LINUX-BY-SNMP__V1V2-COMMUNITY
--- public public LINUX-BY-SNMP__V1V2-VERSION
--- 2 2
Données spécifiques pour ce check
| Nom | Modifiable sur | Unité | Valeur par défaut | Description |
|---|---|---|---|---|
LINUX-BY-SNMP__PROCESSES-MEMORY-MATCHING__MEMORY-WARN | l'Hôte ( Onglet Données ) | MB | 100 | Seuil de consommation mémoire au-dessus duquel un status ATTENTION est déclenché |
LINUX-BY-SNMP__PROCESSES-MEMORY-MATCHING__MEMORY-CRIT | l'Hôte ( Onglet Données ) | MB | 200 | Seuil de consommation mémoire au-dessus duquel un status CRITIQUE est déclenché |
LINUX-BY-SNMP__PROCESSES-MEMORY-MATCHING__MIN-PROCESS-COUNT | l'Hôte ( Onglet Données ) | -- | 1 | Seuil du nombre de processus trouvés au-dessous duquel un INCONNU est déclenché |
LINUX-BY-SNMP__PROCESSES-MEMORY-MATCHING__MAX-PROCESS-COUNT | l'Hôte ( Onglet Données ) | -- | NONE | Seuil du nombre de processus trouvés au-dessus duquel un INCONNU est déclenché |
LINUX-BY-SNMP__PROCESSES-MEMORY-MATCHING__HIDE-ALL | l'Hôte ( Onglet Données ) | -- | false | Active/désactive l'affichage des métriques de ce check |
LINUX-BY-SNMP__PROCESSES-MEMORY-MATCHING__USE-REGEX-TO-MATCH-PROCESS | l'Hôte ( Onglet Données ) | -- | false | Active ou désactive l'utilisation de regex pour l'usage de la variable DFE WINDOWS_BY_WINRM__PROCESSES-MEMORY-MATCHING__PROCESSES-TO-CHECK |
LINUX-BY-SNMP__PROCESSES-MEMORY-MATCHING__USE-MEMORY-THRESHOLD-ON | l'Hôte ( Onglet Données ) | -- | group | Détermine le niveau d’agrégation utilisé pour évaluer les seuils de mémoire.
|
LINUX-BY-SNMP__PROCESSES-MEMORY-MATCHING__PROCESS-MATCH-X-WORDS | l'Hôte ( Onglet Données ) | -- | 1 | Lors de la récupération des lignes de commandes de processus, définit le nombre de mots à utiliser pour la comparaison aux filtres et la génération des métriques.
Il permet de tronquer une partie ou l'ensemble des arguments des lignes de commandes. Il est utilisé pour :
|
LINUX-BY-SNMP__PROCESSES-MEMORY-MATCHING__SUM-ALL | l'Hôte ( Onglet Données ) | -- | false | Active/désactive le calcul de la consommation de la mémoire sur un ensemble de processus. Paramètre déprécié : Utilisez USE_MEMORY_THRESHOLD_ON : sum. |
Remarque
Voici des exemple de regex si LINUX-BY-SNMP__PROCESSES-MEMORY-MATCHING__USE-REGEX-TO-MATCH-PROCESS est à t rue :
- (wsgi:graphite) => \([a-z]+:graphite\)?$$
- /usr/sbin/httpd => /[^/]?+/httpd$$
Données DFE ( Duplicate Foreach )
Pour utiliser ce check il vous faudra tout d'abord définir une paire KEY$(VALUE)$ dans la donnée LINUX-BY-SNMP__PROCESSES-MEMORY-MATCHING__PROCESSES-TO-CHECK. Cette donnée est une donnée DFE (Duplicate Foreach), on peut donc chainer plusieurs paires KEY$(VALUE)$.
| Donnée | Description | Exemple |
|---|---|---|
LINUX-BY-SNMP__PROCESSES-MEMORY-MATCHING__PROCESSES-TO-CHECK | Définit une paire KEY$(VALUE)$, la KEY correspond à la description du processus à vérifier et la VALUE au nom du processus. | DATABASE$(mongod)$ |
Si vous avez des difficultés à trouver les processus à superviser, essayez en premier lieu de les trouver sur la machine supervisée avec la commande ps et grep :
ps ax -o user,pid,command --columns 10000 | grep NOM_DE_PROCESS
Données utilisées provenant du check
Pour éviter de modifier globalement les données de l'hôte, activez la surcharge : cela vous permet d'ajuster les paramètres d'un seul check sans répercussion sur les autres.
Non modifiable ( Sauf Admin Shinken ) Chemin absolu contenant les sondes installés par Shinken Non modifiable ( Sauf Admin Shinken ) Dossier fournit par shinken Non modifiable ( Sauf Admin Shinken ) Dossier contenant les sondes Non modifiable ( Sauf Admin Shinken ) Chemin absolu du dossier contenant les sondes du pack linux-by-SNMP__shinken ( non modifiable )Données globales
Nom Modifiable sur Unité Défaut Valeur par défaut à l'installation Description USERPLUGINSDIR
-- /var/lib/shinken/libexec /var/lib/shinken/libexec LINUX-BY-SNMP__SHINKEN__VENDOR
-- shinken-additional-packs shinken-additional-packs LINUX-BY-SNMP__SHINKEN__PACKNAME
linux-by-SNMP__shinken linux-by-SNMP__shinken LINUX-BY-SNMP__SHINKEN__PLUGINSDIR
-- USERPLUGINSDIR/LINUX-BY-SNMP__SHINKEN__VENDOR/
LINUX-BY-SNMP__SHINKEN__PACKNAME
/var/lib/shinken-user/libexec/shinken-additional-packs/linux-by-SNMP__shinken
l'Hôte ( Onglet Général ) -- Adresse de l'hôtePropriétés de l'hôte
Nom Modifiable sur Unité Défaut Valeur par défaut Description HOSTADDRESS
Nom de l'hôte Nom de l'hôte
Résultat
Exemple
Interprétation
Statut
Il peut prendre quatre valeurs OK / CRITIQUE / ATTENTION / INCONNU
Le statut va dépendre du retour de sonde et de la configuration spécifique du check pour les données suivantes :
- LINUX-BY-SNMP__PROCESSES-MEMORY-MATCHING__MEMORY-WARN
- LINUX-BY-SNMP__PROCESSES-MEMORY-MATCHING__MEMORY-CRIT
- LINUX-BY-SNMP__PROCESSES-MEMORY-MATCHING__MIN-PROCESS-COUNT-WARN
- LINUX-BY-SNMP__PROCESSES-MEMORY-MATCHING__MIN-PROCESS-COUNT-CRIT
- LINUX-BY-SNMP__PROCESSES-MEMORY-MATCHING__MAX-PROCESS-COUNT-WARN
- LINUX-BY-SNMP__PROCESSES-MEMORY-MATCHING__MAX-PROCESS-COUNT-CRIT
Voici un tableau récapitulatif du statut attendu suivant le retour de sonde :
Le texte de la colonne "Affichage des seuils" montre les paramètres utilisés et leur valeur définie sur l'équipement supervisé.
Situation | Statut | Exemple |
|---|---|---|
| CRITIQUE |
|
| ATTENTION |
|
| CRITIQUE |
|
| ATTENTION |
|
| CRITIQUE |
|
| ATTENTION |
|
| INCONNU |
|
| INCONNU |
|
| INCONNU |
|
| CRITIQUE |
|
Résultat
Le résultat contient un message indiquant le status, le nombre de processus trouvés, mais aussi s'il consomme plus ou moins que les seuils indiqués.
Résultat Long
Le résultat long affiche un tableau de la consommation mémoire des processus trouvés correspondant aux filtres.
Le tableau regroupe chaque processus ayant le même nom dans des groupes numérotés, ainsi que la somme de leur mémoire privée.
Le tableau affiche sous chaque groupe, les processus trouvés avec leur consommation de mémoire privée, partagée ainsi que leur PID.
Métriques
Définition
| Nom de la métrique | Unité | Description | Seuil d'avertissement | Seuil critique |
|---|---|---|---|---|
--_PROCESS_MEMORY_SUM_-- | MB | Somme de la consommation mémoire des processus surveillés en MB. | LINUX-BY-SNMP__PROCESSES-MEMORY-MATCHING__MEMORY-WARN. | LINUX-BY-SNMP__PROCESSES-MEMORY-MATCHING__MEMORY-CRIT. |
| ( nom_du_groupe_de_processus ) | MB | Consommation mémoire d'un groupe de processus en MB. Calculé à partir de la somme de la mémoire privée de chaque processus au sein du groupe. Généré pour chaque groupe de processus trouvé. | LINUX-BY-SNMP__PROCESSES-MEMORY-MATCHING__MEMORY-WARN. | LINUX-BY-SNMP__PROCESSES-MEMORY-MATCHING__MEMORY-CRIT. |
Remarque
Il est possible de ne retourner aucune métrique en configurant l'option LINUX-BY-SNMP__PROCESSES-MEMORY-MATCHING__PROCESS-HIDE-ALL du check.
Exemple
Erreurs et pré-requis
La connexion SNMP est configuré par défaut pour se couper si aucune réponse n'est perçu après cinq secondes ( paramétrable avec LINUX-BY-SNMP__TIMEOUT ).
Cette erreur peut intervenir lorsque : La résolution DNS de l'hôte a échoué.
La tentative de connexion à l'hôte a échoué à atteindre l'hôte.
Cette erreur peut être générée à cause d'une mauvaise configuration de pare-feu. La tentative de connexion à l'hôte a été refusé.
Cette erreur peut intervenir lorsque : L'authentification SNMP v3 a échoué.
Cette erreur peut intervenir lorsque : L'utilisateur SNMP v3 utilisé n'existe pas.
L'authentification SNMP v3 a échoué. La méthode d'authentification n'est pas authorisé.
Cette erreur peut intervenir lorsque : Les erreurs suivantes peuvent arriver sur la version SNMPv2 et SNMPv3. Deux erreurs sont possibles :
RESOLUTION : Il faut vérifier les deux étapes suivantes de la configuration :Erreurs de connexion ( communes à tous les checks )
UNKNOWN – Session error: timeout
UNKNOWN – Failed to create SNMP session. Got error: failed to lookup address information: Name or service not known
UNKNOWN – Session error: Socket receive error: host unreachable
UNKNOWN – Session error: Socket receive error: connection refused
UNKNOWN – Session error: Unexpected report: authentication failure
UNKNOWN – Session error: Unexpected report: unknown user name
UNKNOWN – Session error: Unexpected report: unsupported security level.
Erreurs de configuration de l'hôte à superviser ( communes à tous les checks )
MONITORED HOST - BAD STATE – No [ ... ] data found. This might be due to :






















