Contexte

Le check Uptime by SNMPv1v2 va vérifier la date du dernier redémarrage de votre machine.

Il y a 2 modes de fonctionnement :

  1. S'il est inférieur au seuil minimum, le statut passera en critique ( 1h par défaut ),
    • Cela vous permet d'être notifié qu'un redémarrage vient d'avoir lieu.

  2. S'il est supérieur à l'un des seuils maximum, le statut passera en CRITIQUE / ATTENTION .
    • Avec ce paramétrage, vous pourrez être informé si un serveur n'a pas été redémarré depuis trop longtemps.
    • Cette 2ᵉ option peut-être désactivée.


Paramétrage

Le check utilise la ligne de commande suivante :

$LINUX-BY-SNMP__SHINKEN__PLUGINSDIR$/check_linux_health_by_snmp_rust --check check_uptime
    -H "$HOSTADDRESS$"
    -p "$_HOSTLINUX-BY-SNMP__PORT$"
    -t "$_HOSTLINUX-BY-SNMP__TIMEOUT$"
    -c "$_HOSTLINUX-BY-SNMP__UPTIME__CRIT$"
    -l "$_HOSTLINUX-BY-SNMP__UPTIME__HIGH-WARN$,$_HOSTLINUX-BY-SNMP__UPTIME__HIGH-CRIT$"
    --snmp_version "2"
    --community "$_HOSTLINUX-BY-SNMP__V1V2-COMMUNITY$"

Données utilisées provenant des modèles

Données communes pour les checks des modèles

Données spécifiques pour ce check

NomModifiable surUnitéDéfautValeur par défaut à l'installation de ShinkenDescription
LINUX-BY-SNMP__UPTIME__CRIT

l'Hôte

( Onglet Données )

secondes
s
3600

Temps écoulé depuis le dernier redémarrage en secondes en dessous duquel le check passe en CRITIQUE.

Pour savoir qu'un redémarrage vient d'avoir lieu )

LINUX-BY-SNMP__UPTIME__HIGH-CRIT

l'Hôte

( Onglet Données )

secondes
0
0 ( inactif )

Temps écoulé depuis le dernier redémarrage en secondes au-dessus duquel le check passe en CRITIQUE.

Une valeur à 0 permet de ne pas activer cette vérification.

( Pour vérifier que cela ne fait pas trop longtemps que la machine n'a pas été redémarrée )

LINUX-BY-SNMP__UPTIME__HIGH-WARN

l'Hôte

( Onglet Données )

secondes
0
0 ( inactif )

Temps écoulé depuis le dernier redémarrage en secondes au-dessus duquel le check passe en ATTENTION.

Une valeur à 0 permet de ne pas activer cette vérification.

( Pour vérifier que cela ne fait pas trop longtemps que la machine n'a pas été redémarrée )

Données DFE ( Duplicate Foreach )

Pas de données DFE pour ce check

Données utilisées provenant du check

Pas de données provenant du check pour ce modèle

Résultat

Exemple

Interprétation

Statut

  • Il peut prendre quatre valeurs  OK / CRITIQUE / ATTENTION / INCONNU .

    • Le statut va dépendre du retour de sonde et de la configuration spécifique du check pour les données suivantes :

      • LINUX-BY-SNMP__UPTIME__CRIT
      • LINUX-BY-SNMP__UPTIME__HIGH-WARN
      • LINUX-BY-SNMP__UPTIME__HIGH-CRIT
    • Voici un tableau récapitulatif du statut attendu suivant le retour de sonde :



Le texte de la colonne  "Affichage des seuils" montre les paramètres utilisés et leur valeur définie sur l'équipement supervisé.

 

Situation

Statut

Exemple

  • Le serveur a été redémarré il y a moins de LINUX-BY-SNMP__UPTIME__CRIT secondes

CRITIQUE


  • Le serveur n'a pas été redémarré depuis plus que la valeur de LINUX-BY-SNMP__UPTIME__HIGH-CRIT secondes.
    LINUX-BY-SNMP__UPTIME__HIGH-CRIT doit être différent de 0.

CRITIQUE


  • Le serveur n'a pas été redémarré depuis plus que la valeur de LINUX-BY-SNMP__UPTIME__HIGH-WARN secondes.
    LINUX-BY-SNMP__UPTIME__HIGH-WARN doit être différent de 0.
ATTENTION

Résultat

Affiche le temps depuis lequel la machine supervisée est allumée.

Résultat Long

Pas de résultat long.

Métriques

Définition

Nom de la métriqueUnitéDescriptionSeuil d'avertissementSeuil critique
uptime_in_daysjoursTemps depuis le dernier démarrage

LINUX-BY-SNMP__UPTIME__HIGH-WARN

LINUX-BY-SNMP__UPTIME__HIGH-CRIT
LINUX-BY-SNMP__UPTIME__CRIT

Exemple

Erreurs et pré-requis