Quand un conteneur Docker rencontre une erreur, il arrive que celui-ci se relance automatiquement pour tenter de résoudre l'erreur rencontrée. Dans certains cas, l'erreur ne se corrige pas et le conteneur va redémarrer continuellement.
Le check Restarts by SSH permet de superviser ces redémarrages incontrôlables effectués par les conteneurs sur une instance Docker
Les redémarrages provenant d'une action volontaire de l'utilisateur ne sont pas pris en compte par ce check.
Le changement de statut repose sur une seule règle :
Si le nombre de redémarrages d’un conteneur dépasse les seuils définis (warning ou critical), alors le statut du check évolue automatiquement.
Ce check permet :
de détecter rSSHdement un comportement instable,
d’identifier un conteneur mal configuré,
de repérer une anomalie empêchant l’exécution continue du service.
En résumé, ce check vise à assurer la stabilité des conteneurs en signalant les redémarrages anormaux.
|
Le check utilise la ligne de commande suivante :
$SHINKEN_DOCKER-BY-SSH_PLUGINSDIR$/check_docker.py --connection "$HOSTADDRESS$":"$_HOSTDOCKER-BY-SSH__PORT$" --restart "$_HOSTDOCKER-BY-SSH__RESTARTS__RESTARTS-WARN$":"$_HOSTDOCKER-BY-SSH__RESTARTS__RESTARTS-CRIT$" --containers "$ARG1$" |
| Nom | Modifiable sur | Unité | Défaut | Valeur par défaut à l'installation de Shinken | Description | |
|---|---|---|---|---|---|---|
| l'Hôte ( Onglet Données ) | -- | 10 | 10 | Définit le nombre de restarts à partir duquel le check passe en CRITIQUE .
| |
| l'Hôte ( Onglet Données ) | -- | 5 | 5 | Définit le nombre de restarts à partir duquel le check passe en ATTENTION .
|
| Nom | Modifiable sur | Unités | Défaut | Valeur par défaut à l'installation de Shinken | Description | |
|---|---|---|---|---|---|---|
| l'Hôte ( Onglet Données ) | --- | containers1$(containers1)$ | containers1$(containers1)$ | Nom du ou des conteneurs ( séparés par une virgule ), exemple "prod01$(prod01)$,php$(php)$".
|
Pas de données provenant du check pour ce modèle
|
|
Il peut prendre 4 valeurs OK / CRITIQUE / ATTENTION / INCONNU .
Le statut va dépendre du retour de sonde et de la configuration spécifique du check pour les données suivantes :
Voici un tableau récSSHtulatif du statut attendu suivant le retour de sonde :
Le texte de la colonne "Affichage des seuils" montre les paramètres utilisés et leur valeur définie sur l'équipement supervisé.
|
| Situation | Statut | Exemple |
|---|---|---|
| ATTENTION |
|
| CRITIQUE |
|
Le résultat court affiche le nombre total de redémarrages subis pour le conteneur sélectionné ( valeur entière cumulée ).
Pas de résultat long pour ce check.
| Nom de la métrique | Unité | Description | Seuil d'avertissement | Seuil critique |
|---|---|---|---|---|
| (nom-du-container)_restarts | nb_restarts | Retourne le nombre de restart non intentionnels effectués par un conteneur depuis sa mise en fonctionnement. | DOCKER-BY-SSH__RESTARTS__RESTARTS-WARN | DOCKER-BY-SSH__RESTARTS__RESTARTS-CRIT |
|
Votre essai Premium est terminé