Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.
Comment: Make by tools (01.00.01) - action=?
Panel
titleSommaire

Table of Contents

Contexte

Le check Uptime SSH va vérifier la date du dernier redémarrage de votre machine.

Il y a 2 modes de fonctionnement :

  1. S'il est inférieur au seuil minimum, le statut passera en critique ( 1h par défaut ),
    • Cela vous permet d'être notifié qu'un redémarrage vient d'avoir lieu.

  2. s'il est supérieur à un des seuils maximum, le statut passera en CRITIQUE / ATTENTION.
    • Avec ce paramétrage, vous pourrez être informé que cela fait trop longtemps qu'un serveur n'a pas été redémarré.
    • Cette 2ᵉ option peut-être désactivée.
Panel

Paramétrage

Le check utilise la ligne de commande suivante :

Code Block
languagetext
themeEmacs
$USERPLUGINSDIR$/linux_by_ssh/check_uptime_by_ssh_rust -H "$HOSTADDRESS$" -u "$_HOSTSSH_USER$" -p "$_HOSTSSH_PORT$" -i "$_HOSTSSH_KEY$" -P "$_HOSTSSH_KEY_PASSPHRASE$" -c "$_HOSTLINUX_UPTIME_CRIT$" -l "$_HOSTLINUX_UPTIME_HIGH_WARN$","$_HOSTLINUX_UPTIME_HIGH_CRIT$"

Données utilisées provenant du modèle

Données communes pour les checks des modèles

Authentification

Excerpt Include
NEW_PAGE - 005.0 - SEF-10821 - Modèle linux_by_ssh
NEW_PAGE - 005.0 - SEF-10821 - Modèle linux_by_ssh
nopaneltrue

Données spécifiques pour ce check

DonnéeModifiable surUnitéValeur par défautDescription
No Format
LINUX_UPTIME_CRIT

l'Hôte

( Onglet Données )

ms

3600

Temps écoulé depuis le dernier redémarrage en secondes en dessous duquel le check passe en CRITIQUE.

No Format
LINUX_UPTIME_HIGH_CRIT

l'Hôte

( Onglet Données )

ms

0 ( inactif )

Temps écoulé depuis le dernier redémarrage en secondes au-dessus duquel le check passe en CRITIQUE.

Une valeur a 0 permet de ne pas activer cette vérification.


No Format
LINUX_UPTIME_HIGH_WARN

l'Hôte

( Onglet Données )

ms

0 ( inactif )

Temps écoulé depuis le dernier redémarrage en secondes au-dessus duquel le check passe en ATTENTION.

Une valeur a 0 permet de ne pas activer cette vérification.

Données utilisées provenant du check

Pas de données spécifiques pour ce check.

Données DFE ( Duplicate Foreach )

Pas de données DFE pour ce check.

Résultat

Exemple

Panel

Interprétation des données

Statut

Il peut prendre quatre valeurs  OK / CRITIQUE / ATTENTION / INCONNU .

  • Le statut va dépendre du retour de sonde et de la configuration spécifique du check pour les données suivantes :

    • LINUX_UPTIME_CRIT
    • LINUX_UPTIME_HIGH_CRIT   
    • LINUX_UPTIME_HIGH_CRIT
  • Voici un tableau récapitulatif du statut attendu suivant le retour de sonde :

Info

Le texte de la colonne  "Affichage des seuils" montre les paramètres utilisés et leur valeur définie sur l'équipement supervisé.

Panel

 

Situation

Statut

Exemple

  • Le serveur a été redémarré, il y a moins de LINUX_UPTIME_CRIT ( par défaut 200 ms ),

CRITIQUE


  • Si LINUX_UPTIME_HIGH_CRIT est différent de 0, et que le serveur n'a pas été redémarré depuis plus que la valeur de LINUX_UPTIME_HIGH_CRIT en ms.

CRITIQUE

  • Si LINUX_UPTIME_HIGH_WARN est différent de 0, et que le serveur n'a pas été redémarré depuis plus que la valeur de LINUX_UPTIME_HIGH_WARN en ms.

ATTENTION





Résultat

Affiche :

  • soit le fait que l'uptime est bon.
  • soit les raisons de l'alerte:
    • proche du reboot,
    • cela fait trop longtemps que le serveur n'a pas été redémarré.

Résultat long

Pas de résultat long.

Métriques

Nom de la métriqueUnitéDescription
uptimej ( jours )Temps depuis le dernier démarrage