Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.
Comment: Make by tools (01.00.01) - action=clean_corrupted_html
Panel
titleSommaire

Table of Contents
stylenone

Contexte

Le check Uptime SSH by SSH va vérifier la date du dernier redémarrage de votre machine.

Il y a 2 modes de fonctionementfonctionnement :

  1. S'il est inférieur au seuil minimum, le statut passera en critique CRITIQUE ( 1h par défaut ),
    • Cela vous permet d'être notifié qu'un redémarrage vient d'avoir lieu.

  2. Ss'il est supérieur à l'un des seuils maximum, le statut passera en critique/warning ( 0 par défaut, désactivé ). CRITIQUE / ATTENTION .
    • Avec ce paramétrage, vous pourrez être informé si un serveur n'a pas été redémarré depuis trop longtemps.
    • Cette 2ᵉ option peut-être désactivée.
Panel

Image Added

Paramétrage

Le check utilise la ligne de commande suivante :

Code Block
languagetextbash
themeEmacs
$USERPLUGINSDIR$/linux$LINUXBYSSH_bySHINKEN_sshPLUGINSDIR$/check_uptimelinux_health_by_ssh_rust --check check_uptime
    -H "$HOSTADDRESS$"
    -u "$_HOSTSSH_USER$"
    -p "$_HOSTSSH_PORT$"
    -i "$_HOSTSSH_KEY$"
    -P "$_HOSTSSH_KEY_PASSPHRASE$"
    -c "$_HOSTLINUX_UPTIME_CRIT$"
    -l "$_HOSTLINUX_UPTIME_HIGH_WARN$","$_HOSTLINUX_UPTIME_HIGH_CRIT$"

Données utilisées provenant du modèle

Données communes pour les checks des modèles

Authentification

Excerpt Include
NEW_PAGE - 004.0 - SEF-10821 - Modèle linux_-by_sshNEW_PAGE - 004.0 - SEF-10821 - Modèle linux_by_ssh-SSH
Modèle linux-by-SSH
nopaneltrue

Données spécifiques pour ce check

DonnéeModifiable surUnitéValeur par défautDescription
No Format
LINUX_UPTIME_CRIT

l'Hôte

( Onglet Données )

%

ms

3600

Temps écoulé depuis le dernier redémarrage en secondes en dessous duquel le check passe en CRITIQUE.

Pour savoir qu'un redémarrage vient d'avoir lieu )

No Format
LINUX_UPTIME_HIGH_CRIT

l'Hôte

( Onglet Données )

%

ms

0 ( inactif )

Temps écoulé depuis le dernier redémarrage en secondes au-dessus duquel le check passe en CRITIQUE.

Une valeur à 0 permet de ne pas activer cette vérification.

( Pour vérifier que cela ne fait pas trop longtemps que la machine n'a pas été redémarrée )

No Format
LINUX_UPTIME_HIGH_WARN

l'Hôte

( Onglet Données )

--

ms

0 ( inactif )

Temps écoulé depuis le dernier redémarrage en secondes au-dessus duquel le check passe en ATTENTION.

Une valeur à 0 permet de ne pas activer cette vérification.

( Pour vérifier que cela ne fait pas trop longtemps que la machine n'a pas été redémarrée )

Données utilisées provenant du check

Pas de données spécifiques pour ce check.

Données DFE ( Duplicate Foreach )

Pas de données DFE pour ce check.

Résultat

Exemple

Panel
Image Removed

Image Added

Interprétation des données

Statut

:

Le statut

Il peut prendre

4

quatre valeurs

différentes (

  OK / CRITIQUE / ATTENTION / INCONNU .

  • Le statut va dépendre du retour de sonde et de la configuration spécifique du check pour les données suivantes :

    • LINUX_UPTIME_CRIT
    • LINUX_UPTIME_HIGH_WARN
    • LINUX_UPTIME_HIGH_CRIT
  • Voici un tableau récapitulatif du statut attendu suivant le retour de sonde :

Info

Le texte de la colonne  "Affichage des seuils" montre les paramètres utilisés et leur valeur définie sur l'équipement supervisé.

Panel

Image Added 

Situation

Statut

Exemple

  • Le serveur a été redémarré, il y a moins de LINUX_UPTIME_CRIT en ms.

CRITIQUE

Panel

Image Added

  • Le serveur n'a pas été redémarré depuis plus que LINUX__UPTIME__HIGH_CRIT secondes.
    LINUX__UPTIME__HIGH_CRIT doit être différent de 0.

CRITIQUE

Panel

Image Added

  • Le serveur n'a pas été redémarré depuis plus que LINUX__UPTIME__HIGH_WARN secondes.
    LINUX__UPTIME__HIGH_WARN doit être différent de 0.

ATTENTION

Panel

Image Added

Résultat

Affiche le temps depuis lequel la machine supervisée est allumée.

Résultat long

Pas de résultat long.

Métriques

Définition

CRITICAL /  UNKNOWN ).
  • Le seuils du statut CRITICAL est de 3600 secondes, soit 1 heure
  • Résultat :
    Le résultat contient un message indiquant le statut ainsi que la durée de fonctionnement de la machine
Métriques

Nom de la métriqueUnitéDescriptionSeuil d'avertissementSeuil critique
uptimej ( jours )Temps depuis le dernier démarrage
(en jours)

LINUX_UPTIME_HIGH_WARN

LINUX_UPTIME_HIGH_CRIT

LINUX_UPTIME_CRIT

Exemple

Panel

Image Added

Les Erreurs

Excerpt Include
Erreurs du pack linux-by-SSH
Erreurs du pack linux-by-SSH
nopaneltrue