Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.
Comment: Make by tools (01.00.01) - action=clean_corrupted_html
Panel
titleSommaire

Table of Contents
stylenone

Contexte

Le check Uptime SSH by SSH va vérifier la date du dernier redémarrage de votre machine.

Il y a 2 modes de fonctionnement :

  1. S'il est inférieur au seuil minimum, le statut passera en critique CRITIQUE ( 1h par défaut ),
    • Cela vous permet d'être notifié qu'un redémarrage vient d'avoir lieu.

  2. sS'il est supérieur à l'un des seuils maximum, le statut passera en CRITIQUE / ATTENTION ( 0 par défaut, désactivé ).
      • Cela vous permet d'être notifié qu'un redémarrage vient d'avoir lieu.
    Cela per
      • Avec ce paramétrage, vous pourrez être informé si un serveur n'a pas été redémarré depuis trop longtemps.
      • Cette 2ᵉ option peut-être désactivée.
    Panel

    Image Added

    Paramétrage

    Le check utilise la ligne de commande suivante :

    Code Block
    languagetextbash
    themeEmacs
    $USERPLUGINSDIR$/linux$LINUXBYSSH_bySHINKEN_sshPLUGINSDIR$/check_uptimelinux_health_by_ssh_rust --check check_uptime
        -H "$HOSTADDRESS$"
        -u "$_HOSTSSH_USER$"
        -p "$_HOSTSSH_PORT$"
        -i "$_HOSTSSH_KEY$"
        -P "$_HOSTSSH_KEY_PASSPHRASE$"
        -c "$_HOSTLINUX_UPTIME_CRIT$"
        -l "$_HOSTLINUX_UPTIME_HIGH_WARN$","$_HOSTLINUX_UPTIME_HIGH_CRIT$"

    Données utilisées provenant du modèle

    Données communes pour les checks des modèles

    Authentification

    Excerpt Include
    NEW_PAGE - 004.0 - SEF-10821 - Modèle linux_-by_sshNEW_PAGE - 004.0 - SEF-10821 - Modèle linux_by_ssh-SSH
    Modèle linux-by-SSH
    nopaneltrue

    Données spécifiques pour ce check

    DonnéeModifiable surUnitéValeur par défautDescription
    No Format
    LINUX_UPTIME_CRIT

    l'Hôte

    ( Onglet Données )

    %

    ms

    3600

    Temps écoulé depuis le dernier redémarrage en secondes en dessous duquel le check passe en CRITIQUE.

    Pour savoir qu'un redémarrage vient d'avoir lieu )

    No Format
    LINUX_UPTIME_HIGH_CRIT

    l'Hôte

    ( Onglet Données )

    %

    ms

    0 ( inactif )

    Temps écoulé depuis le dernier redémarrage en secondes au-dessus duquel le check passe en CRITIQUE.

    Une valeur à 0 permet de ne pas activer cette vérification.

    ( Pour vérifier que cela ne fait pas trop longtemps que la machine n'a pas été redémarrée )

    No Format
    LINUX_UPTIME_HIGH_WARN

    l'Hôte

    ( Onglet Données )

    --

    ms

    0 ( inactif )

    Temps écoulé depuis le dernier redémarrage en secondes au-dessus duquel le check passe en ATTENTION.

    Une valeur à 0 permet de ne pas activer cette vérification.

    ( Pour vérifier que cela ne fait pas trop longtemps que la machine n'a pas été redémarrée )

    Données utilisées provenant du check

    Pas de données spécifiques pour ce check.

    Résultat

    Données DFE ( Duplicate Foreach )

    Pas de données DFE pour ce check.

    Résultat

    Exemple

    Panel

    Image Added

    Image Removed

    Interprétation des données

    Statut

    :

    Le statut

    Il peut prendre

    4

    quatre valeurs

    différentes (

      OK /

    CRITICAL /  UNKNOWN ).
    • Le seuils du statut CRITICAL est de 3600 secondes, soit 1 heure

    CRITIQUE / ATTENTION / INCONNU .

    • Le statut va dépendre du retour de sonde et de la configuration spécifique du check pour les données suivantes :

      • LINUX_UPTIME_CRIT
      • LINUX_UPTIME_HIGH_WARN
      • LINUX_UPTIME_HIGH_CRIT
    • Voici un tableau récapitulatif du statut attendu suivant le retour de sonde :

    Info

    Le texte de la colonne  "Affichage des seuils" montre les paramètres utilisés et leur valeur définie sur l'équipement supervisé.

    Panel

    Image Added 

    Situation

    Statut

    Exemple

    • Le serveur a été redémarré, il y a moins de LINUX_UPTIME_CRIT en ms.

    CRITIQUE

    Panel

    Image Added

    • Le serveur n'a pas été redémarré depuis plus que LINUX__UPTIME__HIGH_CRIT secondes.
      LINUX__UPTIME__HIGH_CRIT doit être différent de 0.

    CRITIQUE

    Panel

    Image Added

    • Le serveur n'a pas été redémarré depuis plus que LINUX__UPTIME__HIGH_WARN secondes.
      LINUX__UPTIME__HIGH_WARN doit être différent de 0.

    ATTENTION

    Panel

    Image Added

    Résultat

    Affiche le temps depuis lequel la machine supervisée est allumée.

    Résultat long

    Pas de résultat long.

    Métriques

    Définition

    Nom de la métriqueUnitéDescriptionSeuil d'avertissementSeuil critique
    uptimej ( jours )Temps depuis le dernier démarrage

    LINUX_UPTIME_HIGH_WARN

    LINUX_UPTIME_HIGH_CRIT

    LINUX_UPTIME_CRIT

    Exemple

    Panel

    Image Added

    Les Erreurs

    Excerpt Include
    Erreurs du pack linux-by-SSH
    Erreurs du pack linux-by-SSH
    nopaneltrue

    • Résultat :
      Le résultat contient un message indiquant le statut ainsi que la durée de fonctionnement de la machine

    Métriques

    Nom de la métriqueDescriptionuptimeTemps depuis le dernier démarrage (en jours)