Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.
Scroll Ignore
scroll-pdftrue
scroll-officetrue
scroll-chmtrue
scroll-docbooktrue
scroll-eclipsehelptrue
scroll-epubtrue
scroll-htmlfalse
Panel
titleSommaire

Table of Contents
stylenone

Contexte

Le check Restarts by SSH permet de vérifier le nombre de restarts effectués sur les conteneurs.

Quand un conteneur Docker rencontre une erreur, il arrive que celui-ci se relance automatiquement pour tenter de résoudre l'erreur rencontrée. Dans certains cas, l'erreur ne se corrige pas et le conteneur va redémarrer continuellement.

Le check Restarts by SSH permet de superviser ces redémarrages incontrôlables effectués par les conteneurs sur une instance Docker

Les redémarrages provenant d'une action volontaire de l'utilisateur ne sont pas pris en compte par ce check.


Le changement de statut repose sur une seule règle :

  • Si le nombre de redémarrages d’un conteneur dépasse les seuils définis ( warning ou critical ), alors le statut du check évolue automatiquement.
  • Les redémarrages provenant d'une action volontaire de l'utilisateur ne sont pas pris en compte par ce check.

Ce check permet donc :

  • de détecter rSSHdement un comportement instablerepérer rapidement les conteneurs instables,

  • d’identifier un conteneur mal configuré,

  • de repérer une anomalie empêchant l’exécution continue du service.

En résuméPour résumer, ce check vise à est un indicateur utile pour assurer la stabilité des conteneurs en signalant les redémarrages anormaux.

Panel

Image RemovedImage Added

Paramétrage

Le check utilise la ligne de commande suivante :

Code Block
languagebash
themeEmacs
$SHINKEN_DOCKER-ON-LINUX-BY-SSH_PLUGINSDIR$/check_docker_SSH.py 
	-H "$HOSTADDRESS$"
	-u "$_HOSTDOCKER-ON-LINUX-BY-SSH__SSH-USER$"
	-p "$_HOSTDOCKER-ON-LINUX-BY-SSH__SSH-PORT$"
	-k "$_HOSTDOCKER-ON-LINUX-BY-SSH__SSH-KEY$"
	-x "$_HOSTDOCKER-ON-LINUX-BY-SSH__SSH-PASSPHRASE$"
	-m "restarts"
	-w "$_HOSTDOCKER-ON-LINUX-BY-SSH__RESTARTS__RESTARTS-WARN$"
	-c "$_HOSTDOCKER-ON-LINUX-BY-SSH__RESTARTS__RESTARTS-CRIT$"
	-e "$_HOSTDOCKER-ON-LINUX-BY-SSH__CONTAINERS-EXCLUDED$"

Données utilisées provenant du modèle

Données communes pour les checks du modèle

Excerpt Include
NEW-PAGE Modèle docker-on-linux-by-SSH__base__shinkenNEW-PAGE
Modèle docker-on-linux-by-SSH__base__shinken
nopaneltrue

Données spécifiques pour ce check

NomModifiable surUnitéDéfautValeur par défaut à l'installation de ShinkenDescription
No Format
_DOCKER-ON-LINUX-BY-SSH__CONTAINERS-EXCLUDED

l'Hôte

( Onglet Données )

--

__

__

La liste des conteneurs à exclure des vérifications.

Cette donnée n'est utilisée que pour les checks des modèles "all_containers".

No Format
_DOCKER-ON-LINUX-BY-SSH__IMAGES-EXCLUDED

l'Hôte

( Onglet Données )

--

__

__

La liste des images à exclure des vérifications pour lechecks "Image-age".

Cette donnée n'est utilisée que pour les checks des modèles "all_containers".

No Format
DOCKER-ON-LINUX-BY-SSH__RESTARTS__RESTARTS-CRIT

l'Hôte

( Onglet Données )

--10 10

Définit le nombre de restarts à partir duquel le check passe en CRITIQUE.

  • Il suffit qu'un d'un des conteneurs franchisse ce seuil pour que le check change d'état.
No Format
DOCKER-ON-LINUX-BY-SSH__RESTARTS__RESTARTS-WARN

l'Hôte

( Onglet Données )

--5 5

Définit le nombre de restarts à partir duquel le check passe en ATTENTION.

  • Il suffit qu'un des conteneurs franchisse ce seuil pour que le check change d'état.

Données DFE ( Duplicate Foreach )

Pas de données DFE pour ce check

Données utilisées provenant du check

Pas de données provenant du check pour ce modèle

Excerpt
Section

Données globales

Section
NomModifiable surUnitéDéfautValeur par défaut à l'installationDescription
No Format
USERPLUGINSDIR

Non modifiable

( Sauf Admin Shinken )

--/var/lib/shinken-user/libexec /var/lib/shinken-user/libexec

Chemin absolu contenant les sondes installés installées par Shinken.

No Format
SHINKEN_DOCKER-ON-LINUX-BY-SSH_VENDOR

Non modifiable

( Sauf Admin Shinken )

--shinken-additional-packs shinken-additional-packs

Dossier fournit fourni par shinkenShinken.

No Format
SHINKEN_DOCKER-ON-LINUX-BY-SSH_PACKNAME

Non modifiable

( Sauf Admin Shinken )


docker-on-linux-by-SSH__shinken docker-on-linux-by-SSH__shinken

Dossier contenant les sondes.

No Format
SHINKEN_DOCKER-ON-LINUX-BY-SSH_PLUGINSDIR

Non modifiable

( Sauf Admin Shinken )

--
No Format
USERPLUGINSDIR$/$SHINKEN_DOCKER-ON-LINUX-BY-SSH_VENDOR$/$SHINKEN_DOCKER-ON-LINUX-BY-SSH_PACKNAME
/var/lib/shinken-user/libexec/shinken-additional-packs/docker-on-linux-by-SSH__shinken

Chemin absolu du dossier contenant les sondes du pack docker-on-linux-by-SSH__shinken  ( non modifiable ).

Section

Propriétés de l'hôte

Section
NomModifiable surUnitéDéfautValeur par défautDescription
No Format
HOSTADDRESS

l'Hôte

( Onglet Général )

--

Nom de l'hôte Nom de l'hôte

Adresse de l'hôte

Résultat

Exemple

Panel

Image RemovedImage Added

Interprétation des données

Statut

  • Il peut prendre 4 valeurs3 états  OK / CRITIQUE / ATTENTION/ INCONNU .

    • Le statut va dépendre du retour de sonde et de la configuration spécifique du check pour les données suivantes :

      • DOCKER-ON-LINUX-BY-SSH__RESTARTS__RESTARTS-WARN 
      • DOCKER-ON-LINUX-BY-SSH__RESTARTS__RESTARTS-CRIT
    • Voici un tableau récSSHtulatif récapitulatif du statut attendu suivant le retour de sonde :


Info

Le texte de la colonne  "Affichage des seuils" montre les paramètres utilisés et leur valeur définie sur l'équipement supervisé.

Panel
Image Removed

Image Added

Situation Statut Exemple
  • Le nombre de restarts dépasse la valeur de :
    • DOCKER-ON-LINUX-BY-SSH__RESTARTS__RESTARTS-WARN 
ATTENTION

Image RemovedImage Added

  • Le nombre de restarts dépasse la valeur de :
    • DOCKER-ON-LINUX-BY-SSH__RESTARTS__RESTARTS-CRIT

CRITIQUE


Image RemovedImage Added

Résultat

Le résultat court affiche la liste des conteneurs détectés, séparés par des points-virgules ;.Pour chaque conteneur, le nombre total de redémarrages subis est indiqué ( valeur entière cumulée ), en une ligne, un résumé de l'état des conteneurs. Ce retour compact permet de pouvoir visualiser l'information même avec la taille des lignes réduites dans l'interface de visualisation.

Résultat Long

Pas de résultat long pour ce checkLe résultat long affiche un tableau regroupant l'ensemble des conteneurs détectés et le nombre de restarts enregistrés.

Métriques

Interprétation des métriques

Nom de la métriqueUnitéDescriptionSeuil d'avertissementSeuil critique
(nom-du-container)_restarts nb_restartsRetourne le nombre de restart restarts non intentionnels effectués par un conteneur depuis sa mise en fonctionnement.

DOCKER-ON-LINUX-BY-SSH__RESTARTS__RESTARTS-WARN 

DOCKER-ON-LINUX-BY-SSH__RESTARTS__RESTARTS-CRIT

Exemple

Panel

Image RemovedImage Added

Erreurs et pré-requis

...

Excerpt Include
Erreurs du pack docker-on-linux-by-SSH__shinken
Erreurs du pack docker-on-linux-by-SSH__shinken
nopaneltrue