| Panel | ||
|---|---|---|
| ||
|
Contexte
Le check Load Average SSH analyse la charge système et l'affiche sous forme de pourcentages dans un tableau.
- Dans ce tableau, les moyennes de la charge sont affichées pendant :
- la dernière minute,
- les 5 dernières minutes,
- et les 15 dernières minutes.
- Pour simplifier la lecture, les charge sont aussi affichées aussi en pourcentage ( plus facile à appréhender ).
Paramétrage
Le check utilise la ligne de commande suivante :
| Code Block | ||||
|---|---|---|---|---|
| ||||
$SHINKEN_LINUXBYSSH_PLUGINSDIR$/check_linux_health_by_ssh_rust --check check_load_average -H "$HOSTADDRESS$" -u "$_HOSTSSH_USER$" -p "$_HOSTSSH_PORT$" -i "$_HOSTSSH_KEY$" -P "$_HOSTSSH_KEY_PASSPHRASE$" -C -w "$_HOSTLOAD_WARN$" -c "$_HOSTLOAD_CRIT$" |
Données utilisées provenant du modèle
Données communes pour les checks des modèles
Authentification
| Excerpt Include | ||||||
|---|---|---|---|---|---|---|
|
Données spécifiques pour ce check
| Donnée | Modifiable sur | Unité | Valeur par défaut | Description | ||
|---|---|---|---|---|---|---|
| l'Hôte ( Onglet Données ) | -- | 3,3,3 | Définit les valeurs load average à partir duquel le check passe en Critique.
| ||
| l'Hôte ( Onglet Données ) | -- | 1.5,1.5,1.5 | Définit le load average à partir duquel le check passe en Warning.
|
| Info | ||
|---|---|---|
| ||
Le check multipliées automatiquement, les valeurs des données sont par le nombre de CPU de la machine supervisé:
Cette multiplication permet d'avoir un paramétrage assez générique sans se soucier du nombre de CPUs dans la définition des seuils de WARNING et CRITIQUE du check sur chaque serveur. |
Données utilisées provenant du check
Pas de données spécifiques pour ce check
Résultat
Exemple
Interprétation des données
Statut
Il peut prendre quatre valeurs OK / CRITIQUE / ATTENTION / INCONNU .
Le statut va dépendre du retour de sonde et de la configuration spécifique du check pour les données suivantes :
- LOAD_CRIT
- LOAD_WARN
Voici un tableau récapitulatif du statut attendu suivant le retour de sonde :
| Info | ||
|---|---|---|
Le texte de la colonne "Affichage des seuils" montre les paramètres utilisés et leur valeur définie sur l'équipement supervisé.
|
Situation | Statut | Exemple |
|---|---|---|
| CRITIQUE | |
| ATTENTION | |
Résultat
Le résultat contient un message indiquant le statut ainsi que le load average de la minute précédente ainsi que le load average des 5 et 15 dernières minutes.
Résultat Long
Le résultat long contient un tableau qui affiche pour la moyenne a 1 minute, 5 minutes et 15 minutes :
- le load percent ( avec la charge et le nombre de CPU ),
- les seuils ( la valeur des données LOAD_WARN et LOAD_CRIT ),
- le load average.
Métriques
| Nom de la métrique | Description |
|---|---|
| load1 | Moyenne de la charge pendant la dernière minute. |
| load5 | Moyenne de la charge pendant les 5 dernières minutes. |
| load15 | Moyenne de la charge pendant les 15 dernières minutes. |