| Scroll Ignore | ||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ||||||||||||||
|
Contexte
L'interface de Visualisation fournit une représentation de l'état d'un élément et de son taux de disponibilité. Le taux de disponibilité doit être configuré en fonction du statut d'un élément et de votre organisation.
- La configuration est globale à l'installation donc elle n'est pas configurable de manière indépendante sur les hôtes.
- Cette page fournit une description des options de configuration de ce calcul.
Les parties de l'interface de Visualisation impactées par cette configuration sont les suivantes :
Configuration du calcul du taux de disponibilité
On peut définir le taux de disponibilité dans Shinken Entreprise par le pourcentage de temps sur une période donnée pendant lequel l'élément est en statut OK. Tout statut différent de OK va donc faire baisser le taux de disponibilité.
Il est possible de choisir si certains statuts sont interprétés comme OK dans le cadre du calcul de taux de disponibilité.
- Par exemple, un statut Warning peut être interprété comme un OK, car le service est rendu, mais de manière dégradée, ou comme un Critique car le service n'est pas rendu de manière optimale.
- On veut donc pouvoir configurer, pour les différents statuts et contextes, comment ils vont être interprétés dans le calcul du taux de disponibilité.
La configuration du calcul du taux de disponibilité s'effectue directement par fichier de configuration. La modification des paramètres de calcul s'effectue dans la configuration du Module SLA , qui est chargé par le Broker.
Description des paramètres de configuration du calcul
Ici nous décrirons les différents paramètres de la configuration du calcul du taux de disponibilité.
Chaque paramètre permet de modifier le comportement du calcul du taux de disponibilité en fonction du statut ou contexte rencontré. Aussi, chaque paramètre est indépendant.
Paramétrage des états Avertissement ( Warning )
L'état Avertissement ( Warning ) peut avoir deux significations, selon comment il est interprété.
Nom | Valeur de l'option | Effet sur le taux de disponibilité | Explication | ||
|---|---|---|---|---|---|
| 1 |
| On considère que le service est toujours rendu même de manière potentiellement dégradée | ||
| 0 ( Par défaut ) |
| On considère que si le service n'est pas rendu de manière optimale, il n'est pas bien rendu et donc fait baisser le taux de disponibilité. |
Paramétrage des états Inconnu ( Unknown )
L'état Inconnu ( Unknown ) peut être configuré de 3 manières différentes :
| Nom | Valeur de l'option | Effet sur le taux de disponibilité | Explication | ||
|---|---|---|---|---|---|
| ok |
| On considère que le service a donné un état donc le service est encore rendu même de manière potentiellement dégradée | ||
| include ( Par défaut ) |
| On considère que si l'on ne peut savoir si le service est rendu c'est qu'il n'est pas rendu. | |||
| exclude |
| On considère l'état trop imprécis pour modifier le taux de disponibilité. |
Paramétrage des états Données manquantes ( Missing data ) et Shinken inactif ( Shinken inactive )
Les états Données manquantes ( Missing data ) et Shinken inactif ( Shinken inactive ) a été regroupée dans un paramètre. Ce paramètre correspond à la période durant laquelle Shinken n'a pas effectué les vérifications pour un check (plateforme Shinken éteinte, ou vérification du check désactivée grâce aux Périodes de temps). Le statut de ces checks est donc Données manquantes ( "Missing data" ) ou Shinken inactif ( "Shinken inactive" ).
L'état sans données peut être configuré de 3 manières différentes :
| Nom | Valeur de l'option | Effet sur le taux de disponibilité | Explication | ||
|---|---|---|---|---|---|
| ok |
| On considère que même si la supervision ne l'a pas confirmé, le service est rendu | ||
| include ( Par défaut ) |
| On considère que si l'on ne peut pas savoir si le service est rendu, c'est qu'il n'est pas rendu | |||
| exclude |
| On considère que l'état de la supervision (de Shinken) n'impacte pas le taux de disponibilité |
Paramétrage du contexte Période de maintenance ( Downtime )
Le contexte Période de maintenance ( Downtime ) peut être configuré de 4 manières différentes:
| Nom | Valeur de l'option | Effet sur le taux de disponibilité | Explication | ||
|---|---|---|---|---|---|
| ok |
| On considère que les périodes de maintenance planifiées font partie du service, donc le service est rendu | ||
| critical |
| On considère que lors d'une maintenance planifiée, le service n'est plus rendu | |||
| exclude |
| On considère que la maintenance est planifiée et donc que cette période n'impacte pas le service | |||
| include ( Par défaut ) |
| On considère que seul l'état du service compte pour le taux de disponibilité |
Paramétrage de recalcul des taux de disponibilité archivés
Le taux de disponibilité des éléments est archivé quotidiennement.
Par défaut un changement de paramétrage du calcul n'impactera pas les taux de disponibilité des jours précédant la modification.
L'option recompute_old_sla permet de mettre à jour les taux de disponibilité archivés à jour à chaque changement de configuration.
| nom | type | défaut | commentaire | ||
|---|---|---|---|---|---|
| Booléen | 0 |
|
Exemple d'un paramétrage du calcul du taux de disponibilité
Le réglage de ces paramètres s'effectue au niveau du module SLA du Broker.
Le fichier de configuration concerné est /etc/shinken/modules/sla.cfg. Voir la page Module SLA pour avoir une description de l'ensemble des paramètres.
Voici ci-dessous un exemple de configuration pour le calcul du taux de disponibilité. Dans cette configuration:
- L'option de recalcule des anciennes données est commentée. La valeur par défaut sera donc prise, en l’occurrence, les taux de disponibilités déjà archivés ne seront pas recalculés.
- Un statut Avertissement ( Warning ) est compté positivement dans le calcul
- Un statut Inconnu ( Unknown ) est aussi compté positivement dans le calcul
- Les statuts Données manquantes ( Missing data ) et Shinken inactif ( Shinken inactive ) sont exclus du calcul. Si on a une période de 2 heures avec un statut Données manquantes ( Missing data ) et Shinken inactif (Shinken inactive ), le taux de disponibilité de la journée n'est calculé que sur 22 heures.
- Les périodes de maintenances sont comptées négativement dans le calcul.
| Note |
|---|
Par défaut, les options sont commentées dans le fichier ( précédées d'un dièse # ). Pour qu'elles soient prises en compte, il faudra donc les dé-commenter. |
| Code Block | ||||
|---|---|---|---|---|
| ||||
# ┌─────────────────────────────────────────────────────────────────────────────────────────────────────┐ # # │ ────────────────────────────────────── SLA CALCULATION ────────────────────────────────────── │ # # └─────────────────────────────────────────────────────────────────────────────────────────────────────┘ # # ─── Some status can impact ─── # ─── -> positively (counted as OK/UP) ─── # ─── -> negatively (counted as CRITICAL/DOWN) ─── # ─── -> not impact the SLA ─── # ─── (is not counted, meaning the period of study is reduced by the period that is not counted). ─── # ─── This configuration aims at giving Shinken administrators a way to configure ─── # ─── how the SLA are calculated. ─── # ─── SLA are computed on a daily basis. ─── # ─── SLA of the current day are always recomputed after a configuration change. ─── # ─── SLA from days before are by default not recomputed. ─── # ─── # Default : 0 => Disable ( old SLA will not be recalculated ) ─── # ... : 1 => Enable ( old SLA will be recomputed with current settings ) ─── # ─── # recompute_old_sla 0 # ─── Warning periods ─── # ─── # Default : 0 => Warning counts as DOWN ─── # ... : 1 => Warning counts as UP ─── # ─── # warning_counts_as_ok 0 # ─── Unknown periods ─── # ─── # Default : include => "Unknown" status is counted negatively in the SLA. ─── # ... : exclude => "Unknown" are not counted from SLA considered period. ─── # ... : ok => "Unknown" are considered as UP periods ─── # ─── # unknown_period include # ─── No_data periods ( "Missing data" and "Shinken inactive" status ) ─── # ─── # Default : include => Only status is considered. "Missing data" and "Shinken inactive" ─── # status are counted negatively in the SLA. ─── # ... : exclude => No_data are not counted from SLA considered period. ─── # ... : ok => No_data are considered as UP periods. ─── # ─── # no_data_period include # ─── Downtime periods ─── # ─── # Default : include => Only status is considered. ─── # ... : exclude => Downtimes are not counted from SLA considered period. ─── # ... : ok => Downtimes are considered as UP periods. ─── # ... : critical => Downtimes are considered as DOWN periods. ─── # ─── # downtime_period include |
Pour appliquer un changement de cette configuration, un redémarrage de l'Arbiter est nécessaire:
| Code Block |
|---|
service shinken-arbiter restart |