Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

Hosts

In Shinken Enterprise, the basic element of supervision is the host.

      • A host represents any object with a network address. 
      • A host is not limited to physical machines, but can also be a virtual machine, a connected object or any object that is accessible and identifiable on a network.

Shinken Enterprise performs checks on each host at regular time intervals, as well as on the checks attached to each host..

      • The control performed on each host allows to verify that the host is reachable by their network address, but may be more complex depending on what has been configured by your Shinken administrator.
      • This verification is of course configurable by the person(s) in charge of setting up the supervision.

Host Groups

Guests can be organized in groups to facilitate handling and packing.

One can imagine for example a "Web" host group that would contain all the servers dedicated to Web hosting, to facilitate their handling and improve readability..

Checks

In addition to the default verification, a set of additional and more precise checks can be performed on each host. This role is fulfilled by the checks.

A check represents a particular verification that will be performed on the host to which it is attached. Multiple checks can be attached to the same host, and a check can be attached to several different hosts.


Info
titleExemple

There is a dedicated web server to make a website available to the public. Host verification allows us to know if the server can be reached by its address on the network. But we would like to hang checks on it to get more information about its operating status.:

  • A check to see if the home page of the site is available,
  • A check to see if the server's performance in terms of speed is acceptable,
  • A check to see how many users are visiting the site.,

These are only examples, but the set of possible checks on a host is not limited and can be extended as needed.


When verified, a check provides a result and a long result, a status, a context and performance data ( optional ). 

Status and context

Once performed, a check first returns a status and a context.

The status ( Critical, Warning, OK, Unknown ) as well as the context of the check ( DOWNTIME, ACKNOWLEDGED, FLAPPING ) indicate the status of the check verification.

The statuses and contexts are described in more detail in the page dedicated to them: Concept: Status & Context


Result and long result

The verification of a check also provides a result and a long result. It is a textual information that provides the detailed information that the check can provide.

This information is separated in 2 parts:

    • The result: This is a brief summary to capture the main information returned by the checklist.
    • The long result: More detailed information allowing to have more precise information on the execution of the check. The long result is optional and often

Les hôtes

Les Hôtes

Dans Shinken Entreprise, l'élément de base de la supervision est l'hôte.

      • Un hôte représente n'importe quel objet possédant une adresse réseau. 
      • Un hôte ne se limite pas aux machines physiques, mais peut également être une machine virtuelle, un objet connecté ou tout objet étant accessible et identifiable sur un réseau.

Shinken Entreprise effectue des vérifications sur chaque hôte à intervalle de temps réguliers, ainsi que sur les checks accrochés à chaque hôte.

      • La vérification effectuée sur chaque hôte permet de vérifié que l'hôte est contactable par leur adresse réseau, mais peut-être plus complexe suivant ce qui a été configuré par votre administrateur Shinken.
      • Cette vérification est bien entendu configurable par la ou les personnes en charge de la mise en place de la supervision.

Les Groupes d'Hôtes

Les hôtes peuvent être organisés en groupes, afin d'en faciliter la manipulation ainsi que leur organisation.

On peut imaginer par exemple un groupe d'hôtes "Web" qui contiendrait tous les serveurs dédiés à l'hébergement Web, pour faciliter leur manipulation et améliore la lisibilité.

Les checks

Il est possible, sur chaque hôte, d'effectuer en plus de la vérification par défaut, un ensemble de vérifications supplémentaires et plus précises. Ce rôle est rempli par les checks.

Un check représente une vérification particulière qui sera effectuée sur l'hôte auquel il est attaché. Plusieurs checks peuvent être attachés au même hôte, et un check peut être attachés sur plusieurs hôtes différents.

Info
titleExemple

On dispose d'un serveur Web dédié à mettre à disposition du public un site Web. La vérification de l'hôte nous permet de savoir si le serveur est joignable par son adresse sur le réseau. Mais on voudrait y accrocher des checks pour obtenir plus d'informations sur son état de fonctionnement:

  • Un check permettant de savoir si la page d'accueil du site est disponible,
  • Un check permettant de savoir si les performances du serveur en terme de vitesse sont acceptables,
  • Un check permettant de savoir combien d'utilisateurs sont entrain de visiter le site,

Il ne s'agit que d'exemples mais l'ensemble des checks possibles sur un hôte n'est pas limité et peut être étendu selon les besoins.

Lors de sa vérification, un check fournit un résultat et un résultat long, un statut, un contexte ainsi que des données de performances (optionnelles).

Statut et contexte

La vérification d'un check renvoie tout d'abord un statut et un contexte.

Le statut (Critique, Attention, OK, Inconnu) ainsi que le contexte du check (Période de maintenance, Flapping ou Prise en compte) indiquent l'état de la vérification du check.

Les statuts et contextes sont décrits de manière plus détaillée dans la page qui leur est dédiée: Notion: Statut & Contexte

Résultat et résultat long

La vérification d'un check fournit aussi un résultat et un résultat long. Il s'agit d'une information textuelle qui permet de fournir des informations détaillées que peut fournir le check.

Cette information est séparée en 2 parties:

    • Le résultat: Il s'agit d'un résumé bref permettant de saisir les informations principales renvoyées par le check.
    • Le résultat long: Informations plus détaillées permettant d'avoir des informations plus précises sur l'exécution du check. Le résultat long est facultatif et souvent absent.


Info
titleExemple

Le The check "Poller - Performance", qui permet de superviser le bon fonctionnement de Shinken, possède un Résultat et un Résultat Longwhich allows to supervise the good functioning of Shinken, has a Result and a Long Result.

Panel

Image Modified

Ce check possède un Résultat, qui expose quelques informations sur les statistiques du

This check has a Result, which shows some information about the statistics of the Poller.

Le résultat long fournit ensuite un tableau récapitulatif comportant des données supplémentaires.

Données de performance

The long Result then provides a summary table with additional data.


Performance data

A check can also provide performance data. This is data returned by the check that will be stored and can be reused to draw graphs for example.

The "Poller - Performance" check returns data on CPU usage, CPU load, and the number of checks the CPU is able to perform.

This performance data is stored and can later be used to obtain a curve like the following one

Un check peut également fournir des données de performances. Il s'agit de données renvoyées par le check qui vont être stockées et qui pourront être réutilisées pour tracer des graphes par exemple.

Le check "Poller - Performance" renvoie à chaque vérification des données sur l'utilisation du processeur, sa charge et le nombre de check qu'il arrive a effectuer.

Ces données de performance sont stockées et permettent par la suite d'obtenir une courbe comme la suivante:


Panel


Status Confirmation du statut


AIn order to confirm that the status returned when verifying a check is reliable, Shinken Enterprise can perform several checks of the same check..

    • If a check returns an OK status, Shinken considers directly that this status is reliable.
    • If, on the other hand, the verification of the check returns a status different from OK, Shinken restarts the check to confirm by a new verification that the status is different from OK.
      • The reason for this re-check is to prevent the sending of notifications on an uncertain state. 
      • We then wait until we are assured that there is an incident before notifying users.
        ( more details on notifications in the associated page: Basic - notifications

Afin de confirmer que le statut renvoyé lors de la vérification d'un check est fiable, Shinken Entreprise peut effectuer plusieurs vérifications du même check.

    • Si un check renvoie un statut OK, Shinken considère que ce statut est fiable.
    • Si par contre la vérification du check renvoie un statut différent de OK, Shinken relance le check pour confirmer par une nouvelle vérification que le statut est bien différent de OK.
      • La raison pour cette double vérification est de prévenir l'envoi de notifications sur un état incertain. 
      • On attend alors d'être assuré qu'il y aie bien un incident avant de prévenir les utilisateurs.
        (plus de détails sur les notifications dans la page associée: ENNotion - Logique de notification ).