Le check Restarts by SSH permet de vérifier le nombre de restarts effectués sur les conteneurs.
Quand un conteneur Docker rencontre une erreur, il arrive que celui-ci se relance automatiquement pour tenter de résoudre l'erreur rencontrée. Dans certains cas, l'erreur ne se corrige pas et le conteneur va redémarrer continuellement.
Le changement de statut repose sur une seule règle :
Ce check permet donc :
de repérer rapidement les conteneurs instables,
d’identifier un conteneur mal configuré,
de repérer une anomalie empêchant l’exécution continue du service.
Pour résumer, ce check est un indicateur utile pour assurer la stabilité des conteneurs.
|
Le check utilise la ligne de commande suivante :
$SHINKEN_DOCKER-ON-LINUX-BY-SSH_PLUGINSDIR$/check_docker_SSH.py -H "$HOSTADDRESS$" -u "$_HOSTDOCKER-ON-LINUX-BY-SSH__SSH-USER$" -p "$_HOSTDOCKER-ON-LINUX-BY-SSH__SSH-PORT$" -k "$_HOSTDOCKER-ON-LINUX-BY-SSH__SSH-KEY$" -x "$_HOSTDOCKER-ON-LINUX-BY-SSH__SSH-PASSPHRASE$" -m "restarts" -w "$_HOSTDOCKER-ON-LINUX-BY-SSH__RESTARTS__RESTARTS-WARN$" -c "$_HOSTDOCKER-ON-LINUX-BY-SSH__RESTARTS__RESTARTS-CRIT$" -e "$_HOSTDOCKER-ON-LINUX-BY-SSH__CONTAINERS-EXCLUDED$" |
| Nom | Modifiable sur | Unité | Défaut | Valeur par défaut à l'installation de Shinken | Description | |
|---|---|---|---|---|---|---|
| l'Hôte ( Onglet Données ) | -- | __ | __ | La liste des conteneurs à exclure des vérifications. Cette donnée n'est utilisée que pour les checks des modèles "all_containers". | |
| l'Hôte ( Onglet Données ) | -- | __ | __ | La liste des images à exclure des vérifications pour lechecks "Image-age". Cette donnée n'est utilisée que pour les checks des modèles "all_containers". | |
| l'Hôte ( Onglet Données ) | -- | 10 | 10 | Définit le nombre de restarts à partir duquel le check passe en CRITIQUE.
| |
| l'Hôte ( Onglet Données ) | -- | 5 | 5 | Définit le nombre de restarts à partir duquel le check passe en ATTENTION.
|
Pas de données DFE pour ce check
Pas de données provenant du check pour ce modèle
|
|
Il peut prendre 3 états OK / CRITIQUE / ATTENTION.
Le statut va dépendre du retour de sonde et de la configuration spécifique du check pour les données suivantes :
Voici un tableau récapitulatif du statut attendu suivant le retour de sonde :
Le texte de la colonne "Affichage des seuils" montre les paramètres utilisés et leur valeur définie sur l'équipement supervisé.
|
| Situation | Statut | Exemple |
|---|---|---|
| ATTENTION |
|
| CRITIQUE | ![]() |
Le résultat court affiche, en une ligne, un résumé de l'état des conteneurs. Ce retour compact permet de pouvoir visualiser l'information même avec la taille des lignes réduites dans l'interface de visualisation.
Le résultat long affiche un tableau regroupant l'ensemble des conteneurs détectés et le nombre de restarts enregistrés.
| Nom de la métrique | Unité | Description | Seuil d'avertissement | Seuil critique |
|---|---|---|---|---|
| (nom-du-container)_restarts | nb_restarts | Retourne le nombre de restarts non intentionnels effectués par un conteneur depuis sa mise en fonctionnement. | DOCKER-ON-LINUX-BY-SSH__RESTARTS__RESTARTS-WARN | DOCKER-ON-LINUX-BY-SSH__RESTARTS__RESTARTS-CRIT |
|