| Panel | ||||
|---|---|---|---|---|
| ||||
|
Contexte
Le check Load Average by SSH analyse la charge système et l'affiche
dans un tableau.
- Dans ce tableau, les
- valeurs de
- charges sont affichées
- pour :
- la dernière minute,
- les 5 dernières minutes,
- et les 15 dernières minutes.
- À noter que c'est 3 valeurs sont fournies par l'OS, en tant que moyenne sur la période ciblée ( ex : la charge moyenne sur la dernière minute ).
- Pour simplifier la lecture, les
- charges sont aussi affichées aussi en pourcentage ( plus facile à appréhender ).
- Le pourcentage correspond au ratio entre la charge et le nombre de CPU.
- Si la charge est inférieure au nombre de CPU, il n'y aura aucun problème.
- Si la charge est supérieure, les paramètres du check vont vous permettre de décider si ce dépassement va être une alerte ou non.
- En effet, une charge élevée peut ne pas être un problème sur Linux.
- Cela va dépendre de la nature des processus qui sont sur la machine.
En résumé, le check ( suivant son paramétrage ) va vous permettre de définir, ce qui est acceptable en termes de charge, et vous alertez lorsque quelque chose d'excessif par rapport à l'utilisation standard sera détecté.
| Panel |
|---|
Paramétrage
Le check utilise la ligne de commande suivante :
| Code Block | ||||
|---|---|---|---|---|
| ||||
$SHINKEN$LINUXBYSSH_LINUXBYSSHSHINKEN_PLUGINSDIR$/check_linux_health_by_ssh_rust --check check_load_average -H "$HOSTADDRESS$" -u "$_HOSTSSH_USER$" -p "$_HOSTSSH_PORT$" -i "$_HOSTSSH_KEY$" -P "$_HOSTSSH_KEY_PASSPHRASE$" -C -w "$_HOSTLOAD_WARN$" -c "$_HOSTLOAD_CRIT$" |
Données utilisées provenant du modèle
Données communes pour les checks des modèles
Authentification
| Excerpt Include | ||||||
|---|---|---|---|---|---|---|
|
Données spécifiques pour ce check
| Donnée | Modifiable sur | Unité | Valeur par défaut | Description | ||
|---|---|---|---|---|---|---|
| l'Hôte ( Onglet Données ) | -- | 3,3,3 | Définit les valeurs load average à partir duquel le check passe en Critique CRITIQUE.
| ||
| l'Hôte ( Onglet Données ) | -- | 1.5,1.5,1.5 | Définit le load average à partir duquel le check passe en Warning ATTENTION.
|
| Info | ||
|---|---|---|
| ||
Le check multipliées automatiquement, les valeurs des données sont par le nombre de CPU de la machine supervisésupervisée :
Cette multiplication permet d'avoir un paramétrage assez générique sans se soucier du nombre de CPUs dans la définition des seuils de WARNING ATTENTION et CRITIQUE du check sur chaque serveur. |
Données utilisées provenant du check
Pas de données spécifiques pour ce check
Résultat
Exemple
| Panel |
|---|
Interprétation des données
Statut
Le statutIl peut prendre 4 valeurs
OK /
CRITIQUE / ATTENTION / INCONNU .
Le statut va dépendre du retour de sonde et de la configuration spécifique du check pour les données suivantes :
- LOAD_CRIT
- LOAD_WARN
Voici un tableau récapitulatif du statut attendu suivant le retour de sonde :
| Info | ||
|---|---|---|
Le texte de la colonne "Affichage des seuils" montre les paramètres utilisés et leur valeur définie sur l'équipement supervisé.
|
Situation | Statut | Exemple | ||
|---|---|---|---|---|
| CRITIQUE |
| ||
| ATTENTION |
|
- WARNING si une des valeurs de charge dépase le seuil défini .
- CRITIQUE si une des valeurs de charge dépase le seuil défini.
Résultat
Le résultat contient un message indiquant le statut ainsi que le load average de la minute précédente ainsi que le load average des 5 et 15 dernières minutes.
Résultat Long
Le résultat long contient un tableau qui affiche pour la moyenne a 1 minute, 5 minutes et 15 minutes :
- le load percent ( avec la charge et le nombre de CPU ),
- les seuils ( la valeur des données LOAD_WARN et LOAD_CRIT ),
- le load average.
Métriques
Définition
| Nom de la métrique | Unité | Description | Seuil d'avertissement | Seuil critique |
|---|---|---|---|---|
| load1 | -- | Moyenne de la charge pendant la dernière minute. | LOAD_WARN | LOAD_CRIT |
| load5 | -- | Moyenne de la charge pendant les 5 dernières minutes. | LOAD_WARN | LOAD_CRIT |
| load15 | -- | Moyenne de la charge pendant les 15 dernières minutes. | LOAD_WARN | LOAD_CRIT |
Exemple
| Panel |
|---|
Les Erreurs
| Excerpt Include | ||||||
|---|---|---|---|---|---|---|
|




