| Scroll Ignore | ||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ||||||||||||||||
|
Contexte
ExplicationLe module SLA permet de peut être accroché à deux endroits : le Broker et la WebUI.
L'accrocher sur le Broker permet :
- De calculer les valeurs de SLA ( Service Level Agreement ) des éléments supervisés et les stocker dans la base de données Mongodb définie dans le fichier de configuration ci-dessous.
- De modifier la méthode de calcul des SLA ( par exemple, choisir de considérer un
- statut "Avertissement" comme une période positive de SLA, ou encore d'exclure les périodes de maintenance dans le calcul ).
Afin de ne pas casser la base et vos données de SLA, si le module à une erreur inattendu comme un crash alors le module s’arrête et n'est pas automatiquement redémarré. Vous trouverez une erreur FATAL avec la commande shinken-healthcheck.
Configuration
Voici le fichier CFG de configuration présent dans : /etc/shinken/modules/sla.cfg
| Code Block | ||
|---|---|---|
| ||
#===============================================================================
# sla
#===============================================================================
# Daemons that can load this module:
# - broker (to save sla information into a mongodb database)
# Modules that can load this module:
# - WebUI (to display sla data to the users)
# This module compute and save SLA values into a mongodb database
#===============================================================================
define module {
# Shinken Enterprise. Lines added by import core. Do not remove it, it's used by Shinken Enterprise to update your objects if you re-import them.
_SE_UUID core-module-d05cd3505adb11e5884b080027f08538
_SE_UUID_HASH 05d3d1d1cce1f5e03b43936aad25e68f
# End of Shinken Enterprise part
#======== Module identity =========
# Module name. Must be unique
module_name sla
# Module type (to load module code). Do not edit.
module_type sla
#======== Database connection =========
# mongodb uri definition for connecting to the mongodb database. You can find the mongodb uri
# syntax at https://docs.mongodb.com/manual/reference/connection-string/
uri mongodb://localhost/?w=1&fsync=false
# If you want to securize your mongodb connection you can enable the ssh use_ssh_tunnel that will
# allow all mongodb to be encrypted & authentificated with SSH
# Should use a SSH tunnel (Default 0=False)
# use_ssh_tunnel 0
# If the SSH connection goes wrong, then retry use_ssh_retry_failure time before_shinken_inactive
# Default: 1
# use_ssh_retry_failure 1
# SSH user/keyfile in order to connect to the mongodb server.
# Default: shinken
# ssh_user shinken
# Default: ~shinken/.ssh/id_rsa
# ssh_keyfile ~shinken/.ssh/id_rsa
# SSH Timeout used to test if the SSH tunnel is viable or not, in seconds
# Default: 5
# ssh_tunnel_timeout 5
# Which database is used to store sla data
database shinken
#======== Module options =========
# Raw SLA can be kept during X days. In case of issue, these data will be used to re-perform SLA computation.
# The drawback of this feature is that it takes more disk space.
# keep_raw_sla_day 7 ;optional, defaults to 7
# Duration in day to keep SLA info,
# Default value, if not set, is -1. It means that SLA are kept forever ; in this case the mongo database will grow endlessly.
# Minimal value is 7 day
# If SLA are not meant to be kept forever, the following value is recommended (corresponds to 18 months)
# nb_stored_days 547
# Time of day the SLA archive cleanup is performed
# Default value, if unset, is 03:02
# Daily cleanup is done at requested time when nb_stored_days is set
# format is HH:MM with
# - HH is the hour of the day (an integer between 0 and 23)
# - MM are the minutes (an integer between 0 and 59)
# time_when_delete_old_SLA 03:02
# SLA are computed on a daily basis. SLA of the current day are always recomputed after a configuration change. SLA from days before are by default not recomputed.
# If 1, old SLA will be recomputed with current settings.
# If 0, old SLA will not be recalculated [default]
# recompute_old_sla 0
#======== SLA calculation ========
# Some status can impact positively (counted as OK/UP), negatively (counted as CRITICAL/DOWN) or not impact the SLA
# (is not counted, meaning the period of study is reduced by the period that is not counted).
# This configuration aims at giving Shinken administrators a way to configure how the SLA are calculated.
# If 1, Warning counts as UP
# If 0, Warning counts as DOWN [default]
# warning_counts_as_ok 0
# == Unknown periods ==
# - include: Only status is considered. "Unknown" status is counted negatively in the SLA. [default]
# - exclude: Unknown are not counted from SLA considered period
# - ok: Unknown are considered as UP periods
# unknown_period include
# == No_data periods ("Missing data" and "Shinken inactive" status) ==
# - include: Only status is considered. "Missing data" and "Shinken inactive" status are counted negatively in the SLA. [default]
# - exclude: No_data are not counted from SLA considered period
# - ok: No_data are considered as UP periods
# no_data_period include
# == Downtime periods ==
# - include: Only status is considered. [default]
# - exclude: Downtimes are not counted from SLA considered period
# - ok: Downtimes are considered as UP periods
# - critical: Downtimes are considered as DOWN periods
# downtime_period include
#======== SLA stored output ========
# This option enables or disables storing sla outputs.
# If 1, the output will be stored (Default value)
# If 0, the output and long output will not be stored (downtime and acknowledge will still be stored)
# store_output 1
# This option enables or disables storing sla long outputs.
# If 1, the long output will be stored (Default value)
# If 0, the long output will not be stored (output, downtime and acknowledge will still be stored)
# store_long_output 1
# This option will be used to filter which outputs and long outputs to store depending on the status of the sla.
# Possible values are : OK, WARNING, CRITICAL, UNKNOWN
# Seperator is : ,
# Default value : empty (all output states are stored)
# Example to only store OK and UNKNOWN outputs : list_of_stored_output_status OK,UNKNOWN
# list_of_stored_output_status
#======== Workers in the broker ========
# This module will use workers in the broker, each worker will manage a shard of all hosts/checks.
# This parameter is used by the broker to set the number of workers. Each worker will use one CPU, which will balance the sla processing load among CPUs.
# default: 1
broker_module_nb_workers 1
#======== INTERNAL options =========
#INTERNAL : DO NOT EDIT FOLLOWING PARAMETER WITHOUT YOUR DEDICATED SUPPORT
# == time of inactivation of the broker before considering that shinken is inactive (in sec) ==
#time_before_shinken_inactive 30
# == maximum number of elements archived in one bulk pass ==
#size_chunk_to_archive 10 000
# == time between two chunk to archive ==
#time_between_two_chunks 0.1
# == default value of the interval check (in minutes) ==
#default_check_interval 5
# == delay before the creation of missing data period (in check intervale) ==
#margin_create_new_range 1.5
# == max delay before creating missing data period (in minutes) ==
#margin_create_new_range_max 10
# == max number of sla remove each daily_clean_pause_time. Use if nb_stored_days is not -1. ==
#daily_clean_batch_size 10000
# == delay between 2 sla clean. Use if nb_stored_days is not -1. (in second) ==
#daily_clean_pause_time 2
# == max number of sla archive migrate save at same time. ==
#broker_module_sla_migration_batch_size 1000
# == delay between 2 migrating batch save. ==
#broker_module_sla_migration_pause_time 0.1
# Explanatory example of the property margin_create_new_range
# For an element with a check interval at 1min and margin_create_new_range at 1.5 which equals 1min30s of time delay.
# If the interval check is at 1h the delay would be at 1h30 but the delay is limited by margin_create_new_range_max which limits the delay to 10min.
#
# An OK status is given by the scheduler at 12h30
# A new OK status is given by the scheduler at 12h40
# The scheduler should have given a new status at 12h31 but it gave it at 12h40 which is 9min of time delay.
# So that 9min > 1min30s a missing data period is created.
} |
Configurer l'accès à la base MongoDB
| Info |
|---|
Les deux modules étant complémentaires ( le module SLA sur le Broker étant l'écrivain et celui de la WebUI étant le lecteur ), Shinken fournit un seul fichier de configuration commun entre les deux, ceci permettant de garder une cohérence entre l'écriture et la lecture des SLA. Avoir le même fichier, évitera de répéter la même valeur dans deux fichiers de configuration dans le cas des paramètres communs. |
Architecture du module d'écriture
Le module SLA d'écriture se compose de trois parties, incarné par trois processus :
- Worker(s)
- Ce processus se charge de gérer le flux de données, qu'il enregistre sous un format brut ( raw_sla ).
- Il est possible d'ajouter des Workers pour gérer le flux de données.
- Archive
- Ce processus se charge d'agrégées dans un nouveau format ( sla_archive ) les données au format brut ( raw_sla ) pour accélérer la lecture et réduire l'espace de stockage nécessaire.
- Migration
- Ce processus se charge de mettre à jour le format des entrées à la suite d'une mise à jour.
- Il s'occupe aussi de la rotation des données ( voir le chapitre : Sauvegarde des SLA brut ).
Activation du module
Les modules de type "sla" sont des modules qui doivent être activés sur le démon Broker, qu'on appellera le démon parent.
- L'activation du module s'effectue en ajoutant le nom du module dans la configuration du démon parent.
- Pour cela, il faut ouvrir le fichier de configuration du démon parent et ajouter dans le paramètre démon, le nom du module de type
"sla".
- Pour cela, il faut ouvrir le fichier de configuration du démon parent et ajouter dans le paramètre démon, le nom du module de type
- Il est possible de faire plusieurs modules de type
"sla".- Cela permet, par exemple, d'avoir des configurations différentes en fonction des royaumes.
- Cela permet, par exemple, d'avoir des configurations différentes en fonction des royaumes.
- Contraintes :
- Ce module est activable sur un démon Broker, mais aussi sur les modules de type webui ( voir la page Module WebUI ).
- Sur une architecture distribuée, il faut qu'un seul des démons de type Broker ait un module de type par "
sla" par royaume. - Il est possible d'activer plusieurs modules de type "
sla" sur un Broker pour les faire écrire dans différentes bases ( réplication ), mais Shinken conseille FORTEMENT d'utiliser la réplication par cluster Mongo à la place (voir la page Haute disponibilité de la base MongoDB (mise en place d'un cluster) ).
Pour prendre en compte le changement de configuration, il faut redémarrer l'Arbiter :
| Code Block | ||||
|---|---|---|---|---|
| ||||
service shinken-arbiter restart |
Exemple d'activation du module nommé "sla" sur le démon "broker-master" ( configuration livrée par défaut par Shinken )
L'exemple suivant
- active le module
"sla", - sur le démon
"broker-master",dont la configuration est dans le fichier /etc/shinken/brokers/broker-master.cfg.
Modification dans le fichier du module/etc/shinken/brokers/broker-master.cfg:
| Code Block | ||||
|---|---|---|---|---|
| ||||
define broker {
[...]
modules Module 1, Module 2, Module 3, sla
[...]
} |
Puis redémarrage de l'Arbiter
| Code Block | ||||
|---|---|---|---|---|
| ||||
service shinken-arbiter restart |
Créer un nouveau module de type SLA
Pour pouvoir configurer un module de type "sla", il faut faire un nouveau fichier de configuration grâce au fichier d'exemple fourni par défaut.
- Pour commencer, il faut choisir le nom du nouveau module.
- Pour l'exemple, on l'appelle "
Mon-Module-Sla". - Remplacer dans l'exemple le mot "
Mon-Module-Livedata-Sla-Provider" par le nom qui a été choisi.
- Pour l'exemple, on l'appelle "
- Puis il faut créer le fichier de configuration :
Copier le fichier de définition du module d'exemple : /etc/shinken-user-example/configuration/daemons/brokers/modules/sla/sla-example.cfg dans le répertoire de définition des modules /etc/shinken/modules/ .
( Exemple : /etc/shinken/modules/Mon-Module-Sla.cfg )
cp /etc/shinken-user-example/configuration/daemons/brokers/modules/sla/sla-example.cfg /etc/shinken/modules/Mon-Module-Sla.cfg
- Ensuite, il faut modifier le fichier nouvellement créé pour configurer le nouveau module.
Il faut vérifier que le fichier appartienne à l'utilisateur shinken et qu'il possède le droit d'édition. Si ce n'est pas le cas, il faut effectuer les commandes suivante :
chown -R shinken:shinken /etc/shinken/modules/Mon-Module-Sla.cfgchmod u+w /etc/shinken/modules/Mon-Module-Sla.cfgOn change le nom du module en
"Mon-Module-Sla"dans le fichier /etc/shinken/modules/Mon-Module-Sla.cfg...# ─── Module name [ Must be unique ] [ MANDATORY ] ───# ─── ───module_name Mon-Module-Sla...
Ensuite, il faut ajouter le nouveau module dans le module de type
"sla"correspondant.Dans notre exemple, on ajoute le module
"Mon-Module-Sla"au démon Broker définie dans le fichier /etc/shinken/brokers/broker-master.cfgdefine broker {[...]modules Module 1, Module 2, Module 3,Mon-Module-Sla[...]}
Puis pour finir il faut redémarrer l'Arbiter pour que le Broker puisse prendre en compte ce nouveau module.
Configuration
La configuration du module se trouve par défaut dans le fichier /etc/shinken/modules/sla.cfg
- Un exemple dans /etc/shinken-user-example/configuration/daemons/brokers/modules/sla/sla-example.cfg
Exemple de fichier de configuration
| Code Block | ||||
|---|---|---|---|---|
| ||||
#================================================================================
# sla
#================================================================================
# Daemons that can load this module:
# - broker (to save sla information into a mongodb database)
# Modules that can load this module:
# - WebUI (to display sla data to the users)
# This module compute and save SLA values into a mongodb database
#================================================================================
define module {
# ┌─────────────────────────────────────────────────────────────────────────────────────────────────────┐ #
# │ ────────────────────────────────────── MODULE IDENTITY ────────────────────────────────────── │ #
# └─────────────────────────────────────────────────────────────────────────────────────────────────────┘ #
# ─── Module name [ Must be unique ] [ MANDATORY ] ───
# ─── ───
module_name sla
# ─── Module type [ Do not edit ] [ MANDATORY ] ───
# ─── ───
module_type sla
# ┌─────────────────────────────────────────────────────────────────────────────────────────────────────┐ #
# │ ────────────────────────────────────── MODULE OPTIONS ─────────────────────────────────────── │ #
# └─────────────────────────────────────────────────────────────────────────────────────────────────────┘ #
# ─── Duration in day to keep SLA info. ───
# ─── If value is -1 (kept forever) the MongoDB database will grow endlessly. ───
# ───
# Default : -1 => kept forever ( days ) ───
# ─── -> Recommended : 547 ( corresponds to 18 months ) ───
# ───
# nb_stored_days 547
# ─── Time of day when cleanup of SLA is performed ───
# ─── When nb_stored_days is set : daily cleanup is done at requested time ───
# ───
# Default : 03:02 ───
# ─── -> format is HH:MM with |
Cette configuration s'effectue dans le fichier de configuration du module SLA
| Code Block | ||
|---|---|---|
| ||
define module{ ... ... ... #======== Database connection ========= # mongodb uri definition for connecting to the mongodb database. You can find the mongodb uri # syntax at https://docs.mongodb.com/manual/reference/connection-string/ uri mongodb://localhost/?w=1&fsync=false # If you want to securize your mongodb connection you can enable the ssh use_ssh_tunnel that will # allow all mongodb to be encrypted & authentificated with SSH # Should use a SSH tunnel (Default 0=False) # use_ssh_tunnel 0 # If the SSH connection goes wrong, then retry use_ssh_retry_failure time before_shinken_inactive # Default: 1 # use_ssh_retry_failure 1 # SSH user/keyfile in order to connect to the mongodb server. # Default: shinken # ssh_user shinken # Default: ~shinken/.ssh/id_rsa # ssh_keyfile ~shinken/.ssh/id_rsa # SSH Timeout used to test if the SSH tunnel is viable or not, in seconds─── # Default: 5─── -> HH: are the hour of the day (an integer between 0 and 23) ─── # ssh_tunnel_timeout ─── -> MM: are the minutes (an integer between 0 and 59) 5─── # Which database is used to store sla data database shinken ... ... ... } |
Les données SLA sont stockées dans la base Mongo locale au Broker
Pour se connecter au serveur Mongo utilisé pour le stockage des données SLA, 2 méthodes sont disponibles:
- Connexion directe: Par défaut, mais non sécurisée.
- Tunnel SSH: Shinken se connecte au serveur Mongo au travers d'un module SSH pour plus de sécurité
Connexion directe au serveur Mongo
Par défaut, le module SLA se connecte de manière directe au serveur Mongo pour y lire et écrire les données SLA.
Dans la configuration du module SLA, on sait que la connexion se fait de manière directe lorsque le paramètre "use_ssh_tunnel" est à 0.
| Code Block | ||
|---|---|---|
| bash | bash | define module { ─── # time_when_delete_old_SLA ... ... 03:02 # ─── Days to keep raw SLA. ─── # ─── In case of issue, these data will be used to re-perform SLA computation. ─── # ─── The drawback of this feature is that it takes more disk space. ...─── #======== Module identity ========= # Module name. Must be unique ─── # Default : 7 ( days ) module_name sla ─── # ─── ... use_ssh_tunnel 0 ... ─── # keep_raw_sla_day 7 # ┌─────────────────────────────────────────────────────────────────────────────────────────────────────┐ # # │ ────────────────────────────────────── SLA CALCULATION ────────────────────────────────────── │ # # └─────────────────────────────────────────────────────────────────────────────────────────────────────┘ # # ─── Some status can impact ─── # ─── -> positively (counted as OK/UP) ... ... } |
Cette méthode de connexion a pour avantage d'être facile à configurer au niveau de Shinken. Par contre, elle oblige à permettre l'accès à la base Mongo au monde extérieur, et donc s'exposer à des problèmes de sécurité.
La sécurisation de la base Mongo est bien sur toujours possible (voir Sécurisation des connexions aux bases MongoDB) mais bien plus complexe à mettre en place. La méthode de connexion par SSH est donc préférable pour des raisons pratiques et de sécurité.
Connexion par SSH au serveur Mongo
Le module SLA peut également se connecter par tunnel SSH au serveur Mongo, pour des raisons de sécurité.
En effet, le paramétrage de mongoDB permet de définir sur quel adresse ce dernier écoute les requêtes.En n'autorisant seulement l'adresse 127.0.0.1, cela évite d'ouvrir la base au monde extérieur.Dans la configuration du serveur Mongo (/etc/mongod.conf), assurez-vous que le paramètre "bind_ip" est positionné pour n'écouter que sur l'interface locale:
bind_ip=127.0.0.1Dans cette configuration, pour que le module mongoDB se connecte, il faut activer les options suivantes :
use_ssh_tunneluse_ssh_retry_failureSpécifie le nombre supplémentaire de tentatives lors de l'établissement du tunnel SSH si ce dernier n'arrive pas à être établi
ssh_userssh_keyfile- Le tunnel SSH va permettre au module de se connecter comme si ses requêtes étaient local au serveur mongo ( en 127.0.0.1 )
- Connectez-vous avec le user lançant le démon sur le serveur Shinken
- Générez la paire de clés SSH si nécessaire
- Copiez la clé publique sur le serveur mongo
root@serveur_shinken # su - shinkenshinken@serveur_shinken $ ssh-keygenshinken@serveur_shinken $ ssh-copy-id user_distant@serveur_mongo[...]shinken@serveur_shinken $ ssh user_distant@serveur_mongouser_distant@serveur_mongo $
- Cette manipulation est aussi nécessaire dans le cas ou la base mongoDB est sur le même serveur que le module SLA, meme si le tunnel est ouvert localement.
Gestion de l'auto reconnexion avec un cluster MongoDB
Dans le cas de l'utilisation d'un cluster MongoDB, lorsque le membre PRIMAIRE devient inaccessible une nouvelle élection est déclenché ce qui provoque une coupure temporaire de l'accès à la base.
Voir : Haute disponibilité de la base Mongo
Dans le but de ne pas interrompre le service, le module SLA va se reconnecter automatiquement au cluster MongoDB.
Pour ce faire il va faire auto_reconnect_max_try essais avec une pause de auto_reconnect_sleep_between_try entre chaque essais.
Par défaut le temps maximum avant qu'un membre PRIMAIRE soit considéré comme indisponible et qu'une nouvelle élection ait lieu est de 10 secondes.
Voir : "heartbeatTimeoutSecs" donné par la commande rs.conf(); dans un shell de mongo.
Les valeurs par défauts du fichier laisse 12 secondes, ce qui est amplement suffisant avec la configuration par défaut de MongoDB.
auto_reconnect_max_try auto_reconnect_sleep_between_try Temps entre chaque essais en seconde
| Info |
|---|
Il est conseillé de ne pas modifier ces valeurs. |
Utilisation des workers du module SLA
| Code Block |
|---|
#======== Workers in the broker ========
# This module will use workers in the broker, each worker will manage a shard of all hosts/checks.
# This parameter is used by the broker to set the number of workers. Each worker will use one CPU, which will balance the sla processing load among CPUs.
# default: 1
broker_module_nb_workers 1 |
Ce paramètre va déterminer combien de fois le module SLA va se cloner pour gérer le flux de donnée à enregistrer afin de repartir cette charge sur plusieurs CPU. Il est possible de changer ce paramètre si l’utilisation CPU du processus : "NOM DU BROKER [ - Module: sla ][ Worker: 0 ]" est trop élever. Note : ne pas dépassé le nombre de core cpu de la machine cela serais contre productif pour les performances.
───
# ─── -> negatively (counted as CRITICAL/DOWN) ───
# ─── -> not impact the SLA ───
# ─── (is not counted, meaning the period of study is reduced by the period that is not counted). ───
# ─── This configuration aims at giving Shinken administrators a way to configure ───
# ─── how the SLA are calculated. ───
# ─── SLA are computed on a daily basis. ───
# ─── SLA of the current day are always recomputed after a configuration change. ───
# ─── SLA from days before are by default not recomputed. ───
# ───
# Default : 0 => Disable ( old SLA will not be recalculated ) ───
# ... : 1 => Enable ( old SLA will be recomputed with current settings ) ───
# ─── ───
# recompute_old_sla 0
# ─── Warning periods ───
# ───
# Default : 0 => Warning counts as DOWN ───
# ... : 1 => Warning counts as UP ───
# ─── ───
# warning_counts_as_ok 0
# ─── Unknown periods ───
# ───
# Default : include => "Unknown" status is counted negatively in the SLA. ───
# ... : exclude => "Unknown" are not counted from SLA considered period. ───
# ... : ok => "Unknown" are considered as UP periods ───
# ─── ───
# unknown_period include
# ─── No_data periods ( "Missing data" and "Shinken inactive" status ) ───
# ───
# Default : include => Only status is considered. "Missing data" and "Shinken inactive" ───
# status are counted negatively in the SLA. ───
# ... : exclude => No_data are not counted from SLA considered period. ───
# ... : ok => No_data are considered as UP periods. ───
# ─── ───
# no_data_period include
# ─── Downtime periods ───
# ───
# Default : include => Only status is considered. ───
# ... : exclude => Downtimes are not counted from SLA considered period. ───
# ... : ok => Downtimes are considered as UP periods. ───
# ... : critical => Downtimes are considered as DOWN periods. ───
# ─── ───
# downtime_period include
# ┌─────────────────────────────────────────────────────────────────────────────────────────────────────┐ #
# │ ───────────────────────────────────── SLA STORED OUTPUT ───────────────────────────────────── │ #
# └─────────────────────────────────────────────────────────────────────────────────────────────────────┘ #
# ─── This option enables or disables storing sla outputs. ───
# ───
# Default : 1 => Enable ( the output will be stored ) ───
# ... : 0 => Disable ( the output and long output will not be stored ───
# downtime and acknowledge will still be stored ) ───
# ─── ───
# store_output 1
# ─── This option enables or disables storing sla long outputs. ───
# ───
# Default : Enable => 1 ( the long output will be stored ) ───
# ... : Disable => 0 ( the long output will not be stored ───
# output, downtime and acknowledge will still be stored ) ───
# ─── ───
# store_long_output 1
# ─── This option will be used to filter which outputs and long outputs ───
# ─── to store depending on the status of the sla. ───
# ───
# Default : empty => ( all output states are stored ) ───
# ... : list of status => ( format is State1, State2, ... ) ───
# ─── -> State ok :OK ───
# ─── -> State warning :WARNING ───
# ─── -> State critical:CRITICAL ───
# ─── -> State unknown :UNKNOWN ───
# ─── Example : OK, UNKNOWN ───
# ───
# list_of_stored_output_status
# ┌─────────────────────────────────────────────────────────────────────────────────────────────────────┐ #
# │ ──────────────────────────────────── DATABASE CONNECTION ──────────────────────────────────── │ #
# └─────────────────────────────────────────────────────────────────────────────────────────────────────┘ #
# ───────────────── MongoDB parameters ──────────────────────────────────────────────────────────────── #
# ─── MongoDB uri definition . You can find the mongodb uri syntax at ───
# ─── https://docs.mongodb.com/manual/reference/connection-string/ ───
# ───
# Default : mongodb://localhost/?w=1&fsync=false ───
# ─── ───
# uri mongodb://localhost/?w=1&fsync=false
# ─── Which database contains sla data ───
# ───
# Default : shinken ───
# ─── ───
# database shinken
# ─── username/password to authenticate to MongoDB. ───
# ─── Both parameters must be provided for authentication to function correctly. ───
# ─── ───
# database__username
# ─── ───
# database__password
# ─── SSH tunnel activation to secure your mongodb connection ───
# ─── That will allow all mongodb to be encrypted & authenticated with SSH ───
# ───
# Default : 0 => Disable ( disable ssh tunnel ) ───
# ... : 1 => Enable ( enable ssh tunnel ) ───
# ─── ───
# use_ssh_tunnel 0
# ─── If the SSH connection goes wrong, then retry use_ssh_retry_failure time before_shinken_inactive ───
# ───
# Default : 1 ( number of retry ) ───
# ─── ───
# use_ssh_retry_failure 1
# ─── SSH user to connect to the mongodb server. ───
# ───
# Default : shinken ───
# ─── ───
# ssh_user shinken
# ─── SSH keyfile to connect to the mongodb server. ───
# ───
# Default : ~shinken/.ssh/id_rsa ───
# ─── ───
# ssh_keyfile ~shinken/.ssh/id_rsa
# ─── SSH Timeout used to test if the SSH tunnel is viable or not, in seconds. ───
# ───
# Default : 10 ( seconds ) ───
# ─── ───
# ssh_tunnel_timeout 10
# ────────────── AutoReconnect Management ───────────────────────────────────────────────────────────── #
# ─── When MongoDB require you to reconnect ( For example, It can occur when a new PRIMARY is elected ───
# ─── in a MongoDB cluster ), it will raised the MongoDB AutoReconnect exception. ───
# ─── How many try to reconnect before module go in error ───
# ───
# Default : 4 ( number of try ) ───
# ─── ───
# auto_reconnect_max_try 4
# ─── Time between each try ───
# ───
# Default : 3 ( seconds ) ───
# ─── ───
# auto_reconnect_sleep_between_try 3
# ─── NOTE: Change these values only if you have a MongoDB cluster and you change the ───
# ─── heartbeatTimeoutSecs of your MongoDB replica set ───
# ─── The value of auto_reconnect_max_try * auto_reconnect_sleep_between_try must be higher than ───
# ─── heartbeatTimeoutSecs in the rs.conf(); of your MongoDB replica set. ───
# ┌─────────────────────────────────────────────────────────────────────────────────────────────────────┐ #
# │ ─────────────────────────────────── WORKERS IN THE BROKER ─────────────────────────────────── │ #
# └─────────────────────────────────────────────────────────────────────────────────────────────────────┘ #
# ─── This module will use workers in the broker, each worker will manage a shard of all hosts/checks. ───
# ─── This parameter is used by the broker to set the number of workers. ───
# ─── Each worker will use one CPU, which will balance the sla processing load among CPUs. ───
# ───
# Default : 1 => X workers ───
# ─── ───
# broker_module_nb_workers 1
# ┌─────────────────────────────────────────────────────────────────────────────────────────────────────┐ #
# │ ───────────────────────────────────── INTERNAL OPTIONS ────────────────────────────────────── │ #
# └─────────────────────────────────────────────────────────────────────────────────────────────────────┘ #
# ─── INTERNAL : DO NOT EDIT FOLLOWING PARAMETER WITHOUT YOUR DEDICATED SUPPORT ───
# ─── Broker idle time before considering that Shinken is inactive. ───
# ─── Use this if you have Broker loop time that exceeds 30 seconds ───
# ───
# Default : 30 ( seconds ) ───
# ─── ───
# time_before_shinken_inactive 30
# ─── Maximum number of elements archived in one bulk pass. ───
# ─── Use this if at 00:05 (archive time) your MongoDB is saturated ───
# ───
# Default : 10 000 ( number of elements ) ───
# ─── ───
# size_chunk_to_archive 10000
# ─── Time between two chunk to archive. ───
# ─── Use this if at 00:05 (archive time) your MongoDB is saturated ───
# ───
# Default : 0.1 ( seconds ) ───
# ─── ───
# time_between_two_chunks 0.1
# ─── Max number of sla remove each daily_clean_pause_time. ───
# ─── Use if nb_stored_days is not -1. ( Daily clean time is activated ) ───
# ─── Use this if at 03:02 (daily clean time) your MongoDB is saturated. ───
# ───
# Default : 10 000 ( number of sla ) ───
# ─── ───
# daily_clean_batch_size 10000
# ─── Delay between 2 sla clean. ───
# ─── Use if nb_stored_days is not -1. ( Daily clean time is activated ) ───
# ─── Use this if at 03:02 (daily clean time) your MongoDB is saturated. ───
# ───
# Default : 2 ( seconds ) ───
# ─── ───
# daily_clean_pause_time 2
# ─── Max number of sla archive migrate save at same time. ───
# ─── Use this if after an Shinken update your MongoDB is saturated. ───
# ───
# Default : 1 000 ( sla ) ───
# ─── ───
# broker_module_sla_migration_batch_size 1000
# ─── Delay between 2 migrating batch save. ───
# ─── Use this if after an Shinken update your MongoDB is saturated. ───
# ───
# Default : 0.1 ( seconds ) ───
# ─── ───
# broker_module_sla_migration_pause_time 0.1
# ─── Split historical sla_archive collection in daily archive collections ───
# ─── As this may require extra disk space to run, you can disable it here in order to delay it until ───
# ─── more disk space is available. ───
# ─── After completion, performance and disk space management will be greatly improved ───
# ───
# Default : 1 => Enable ───
# ... : 0 => Disable ───
# ─── ───
# broker__module_sla__enable_migration_sla_archive_in_daily_collections 1
} |
Détails des sections composant le fichier de configuration
Identification du module
Il est possible de définir plusieurs instances de module de type "sla" dans l'architecture Shinken.
- Chaque instance devra avoir un nom unique.
| Scroll Title | |||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| |||||||||||||||||||
|
Suppression des anciennes entrées dans la base d'archives du module SLA
| Code Block | ||||
|---|---|---|---|---|
| ||||
# ─── Duration in day to keep SLA info. ───
# ─── If value is kept forever the MongoDB database will grow endlessly. ───
# ───
# Default : -1 => kept forever ( days ) ───
# ─── -> Recommended : 547 ( corresponds to 18 months ) ───
# ───
# nb_stored_days 547
# ─── Time of day when cleanup of SLA is performed ───
# ─── When nb_stored_days is set : daily cleanup is done at requested time ───
# ───
# Default : 03:02 ───
# ─── -> format is HH:MM with ───
# ─── -> HH: are the hour of the day (an integer between 0 and 23) ───
# ─── -> MM: are the minutes (an integer between 0 and 59) ───
# ───
# time_when_delete_old_SLA 03:02 |
Les entrées dans la base d'archives du module SLA sont supprimées toutes les 24h.
| Scroll Title | |||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| |||||||||||||||||||
|
| Info |
|---|
Si le Broker est éteint et que la suppression n'est pas faite depuis plus de 24 h, elle se fera automatiquement au démarrage du Broker. |
| Info |
|---|
S'il n'y a aucune trace du dernier nettoyage ou que le dernier nettoyage date de plus de 24 heures, le nettoyage de la base d'archives du module SLA s'exécutera de nouveau. |
Sauvegarde des SLA brut
| Code Block | ||||
|---|---|---|---|---|
| ||||
# ─── Days to keep raw SLA. ───
# ─── In case of issue, these data will be used to re-perform SLA computation. ───
# ─── The drawback of this feature is that it takes more disk space. ───
# ───
# Default : 7 ( days ) ───
# ───
# keep_raw_sla_day 7 |
Afin de gérer le flux de données, on enregistre sous un format brut ( raw_sla ) les informations de SLA. Toutes les nuits, ces données sont agrégées dans un nouveau format ( sla_archive ) pour accélérer la lecture et réduire l'espace de stockage nécessaire.
S’il y a une erreur lors du passage entre les deux formats, des données peuvent être irrémédiablement perdues. Afin d'éviter de perdre des données lorsque survient ce type d'erreur, il est possible de conserver les données brutes quelque temps.
Le paramètre "keep_raw_sla_day" permet de choisir combien de temps garder ces données.
Il est possible de diminuer ce paramètre si on manque d'espace disque et que les données SLA ne sont pas primordiales. Inversement, si les données SLA sont critiques, il est possible d'augmenter ce nombre, ce qui permettra de limiter la perte de données SLA.
| Scroll Title | ||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ||||||||||||
|
| Info |
|---|
La récupération n'est possible qu'avec l'aide du support dédié |
Option de calcul du taux de SLA
| Code Block | ||||
|---|---|---|---|---|
| ||||
# ┌─────────────────────────────────────────────────────────────────────────────────────────────────────┐ #
# │ ────────────────────────────────────── SLA CALCULATION ────────────────────────────────────── │ #
# └─────────────────────────────────────────────────────────────────────────────────────────────────────┘ #
# ─── Some status can impact ───
# ─── -> positively (counted as OK/UP) ───
# ─── -> negatively (counted as CRITICAL/DOWN) ───
# ─── -> not impact the SLA ───
# ─── (is not counted, meaning the period of study is reduced by the period that is not counted). ───
# ─── This configuration aims at giving Shinken administrators a way to configure ───
# ─── how the SLA are calculated. ───
# ─── SLA are computed on a daily basis. ───
# ─── SLA of the current day are always recomputed after a configuration change. ───
# ─── SLA from days before are by default not recomputed. ───
# ───
# Default : 0 => Disable ( old SLA will not be recalculated ) ───
# ... : 1 => Enable ( old SLA will be recomputed with current settings ) ───
# ───
# recompute_old_sla 0
# ─── Warning periods ───
# ───
# Default : 0 => Warning counts as DOWN ───
# ... : 1 => Warning counts as UP ───
# ───
# warning_counts_as_ok 0
# ─── Unknown periods ───
# ───
# Default : include => "Unknown" status is counted negatively in the SLA. ───
# ... : exclude => "Unknown" are not counted from SLA considered period. ───
# ... : ok => "Unknown" are considered as UP periods ───
# ───
# unknown_period include
# ─── No_data periods ( "Missing data" and "Shinken inactive" status ) ───
# ───
# Default : include => Only status is considered. "Missing data" and "Shinken inactive" ───
# status are counted negatively in the SLA. ───
# ... : exclude => No_data are not counted from SLA considered period. ───
# ... : ok => No_data are considered as UP periods. ───
# ───
# no_data_period include
# ─── Downtime periods ───
# ───
# Default : include => Only status is considered. ───
# ... : exclude => Downtimes are not counted from SLA considered period. ───
# ... : ok => Downtimes are considered as UP periods. ───
# ... : critical => Downtimes are considered as DOWN periods. ───
# ───
# downtime_period include |
| Scroll Title | ||||||||||||||||||||||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ||||||||||||||||||||||||||||||||||||||||
|
| Info |
|---|
Plus de détails sur ces paramètres et sur le fonctionnement des SLA sur cette page : Calcul du taux de SLA |
Option de stockage des Resultats et Resultats longs
| Code Block | ||||
|---|---|---|---|---|
| ||||
# ┌─────────────────────────────────────────────────────────────────────────────────────────────────────┐ #
# │ ───────────────────────────────────── SLA STORED OUTPUT ───────────────────────────────────── │ #
# └─────────────────────────────────────────────────────────────────────────────────────────────────────┘ #
# ─── This option enables or disables storing sla outputs. ───
# ───
# Default : 1 => Enable ( the output will be stored ) ───
# ... : 0 => Disable ( the output and long output will not be stored ───
# downtime and acknowledge will still be stored ) ───
# ───
# store_output 1
# ─── This option enables or disables storing sla long outputs. ───
# ───
# Default : Enable => 1 ( the long output will be stored ) ───
# ... : Disable => 0 ( the long output will not be stored ───
# output, downtime and acknowledge will still be stored ) ───
# ───
# store_long_output 1
# ─── This option will be used to filter which outputs and long outputs ───
# ─── to store depending on the status of the sla. ───
# ───
# Default : empty => ( all output states are stored ) ───
# ... : list of status => ( format is State1, State2, ... ) ───
# ─── -> State ok :OK ───
# ─── -> State warning :WARNING ───
# ─── -> State critical:CRITICAL ───
# ─── -> State unknown :UNKNOWN ───
# ─── Example : OK, UNKNOWN ───
# ───
# list_of_stored_output_status |
Afin de limiter l'espace pris par la base des SLA, il est possible de filtrer les résultats et les résultats longs sauvegardés dans la base.
Il est possible de monitorer l'espace pris par la base grâce au modèle d'hôte ( voir la page Modèle shinken-broker-module-sla-writer ).
Les résultats et les résultats longs des sondes ne sont que les textes donnés par la commande de vérification.
Exemple : PING CRITICAL - Packet loss = 100%
| Scroll Title | ||||||||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ||||||||||||||||||||||||||
|
| Info |
|---|
Shinken conseille pour limiter l'espace pris par la base des SLA. Il est possible de limiter le nombre de jours sauvegardés via l'option "nb_stored_days" plutôt que de ne pas sauvegarder les résultats et les résultats longs très utiles lors de l'analyse d'incident. |
Accès à la base MongoDB
Cette configuration s'effectue dans le fichier de configuration du module.
Pour se connecter à la base MongoDB utilisée pour le stockage des données, 2 méthodes sont disponibles :
- Connexion directe : Par défaut, mais non sécurisée.
- Tunnel SSH : Shinken se connecte à la base MongoDB au travers d'un module SSH pour plus de sécurité
Configuration de l'URI de connexion et de l'authentification par mot de passe
| Code Block | ||||
|---|---|---|---|---|
| ||||
# ┌─────────────────────────────────────────────────────────────────────────────────────────────────────┐ #
# │ ──────────────────────────────────── DATABASE CONNECTION ──────────────────────────────────── │ #
# └─────────────────────────────────────────────────────────────────────────────────────────────────────┘ #
# ───────────────── MongoDB parameters ──────────────────────────────────────────────────────────────── #
# ─── MongoDB uri definition . You can find the mongodb uri syntax at ───
# ─── https://docs.mongodb.com/manual/reference/connection-string/ ───
# ───
# Default : mongodb://localhost/?w=1&fsync=false ───
# ─── ───
# uri mongodb://localhost/?w=1&fsync=false
# ─── Which database contains sla data ───
# ───
# Default : shinken ───
# ─── ───
# database shinken
# ─── username/password to authenticate to MongoDB. ───
# ─── Both parameters must be provided for authentication to function correctly. ───
# ─── ───
# database__username
# ─── ───
# database__password |
| Scroll Title | |||||||||||||||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| |||||||||||||||||||||||||||||||||
|
Connexion directe au serveur MongoDB
Par défaut, le module se connecte de manière directe à la base MongoDB, définie avec les paramètres communs listés ci-dessus, car le paramètre "use_ssh_tunnel" est à 0.
Connexion par SSH au serveur MongoDB
Par défaut, le module se connecte de manière directe à la base MongoDB pour y lire et écrire les données.
Dans la configuration du module, on sait que la connexion se fait de manière directe lorsque le paramètre "use_ssh_tunnel" est à 0.
- Cette méthode de connexion a pour avantage d'être facile à configurer au niveau de Shinken.
- Par contre, elle oblige à permettre l'accès à la base MongoDB au monde extérieur, et donc s'exposer à des problèmes de sécurité.
La sécurisation de la base MongoDB est bien sûr toujours possible ( voir la page Sécurisation des connexions aux bases MongoDB ), mais bien plus complexe à mettre en place.
La méthode de connexion par SSH est ainsi préférable pour des raisons pratiques et de sécurité.
| Code Block | ||||
|---|---|---|---|---|
| ||||
# ─── SSH tunnel activation to secure your mongodb connection ───
# ─── That will allow all mongodb to be encrypted & authenticated with SSH ───
# ───
# Default : 0 => Disable ( disable ssh tunnel ) ───
# ... : 1 => Enable ( enable ssh tunnel ) ───
# ───
# use_ssh_tunnel 0
# ─── If the SSH connection goes wrong, then retry use_ssh_retry_failure time before_shinken_inactive ───
# ───
# Default : 1 ( number of retry ) ───
# ───
# use_ssh_retry_failure 1
# ─── SSH user to connect to the mongodb server. ───
# ───
# Default : shinken ───
# ───
# ssh_user shinken
# ─── SSH keyfile to connect to the mongodb server. ───
# ───
# Default : ~shinken/.ssh/id_rsa ───
# ───
# ssh_keyfile ~shinken/.ssh/id_rsa
# ─── SSH Timeout used to test if the SSH tunnel is viable or not, in seconds. ───
# ───
# Default : 10 ( seconds ) ───
# ───
# ssh_tunnel_timeout 10 |
Le module peut également se connecter par tunnel SSH à la base MongoDB, pour des raisons de sécurité.
En effet, le paramétrage de MongoDB permet de définir sur quelle interface réseau ce dernier écoute les requêtes.
En n'autorisant seulement interface réseau avec l'adresse 127.0.0.1, cela évite d'ouvrir la base au monde extérieur.
Dans la configuration de la base MongoDB ( /etc/mongod.conf ), il faut que le paramètre "bind_ip" est positionné pour n'écouter que sur l'interface locale :
bind_ip=127.0.0.1
Dans cette configuration, la base MongoDB écoute que sur l'interface réseau local, pour que le module se connecte, il faut passer par un tunnel SSH. Pour ce faire, activer les options suivantes :
| Scroll Title | ||||||||||||||||||||||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ||||||||||||||||||||||||||||||||||||||||
|
Gestion de l'auto reconnexion avec un cluster MongoDB
| Code Block | ||||
|---|---|---|---|---|
| ||||
# ────────────── AutoReconnect Management ───────────────────────────────────────────────────────────────
# ─── When MongoDB require you to reconnect ( For example, It can occur when a new PRIMARY is elected ───
# ─── in a MongoDB cluster ), it will raised the MongoDB AutoReconnect exception. ───
# ─── How many try to reconnect before module go in error ───
# ───
# Default : 4 ( number of try ) ───
# ───
# auto_reconnect_max_try 4
# ─── Time between each try ───
# ───
# Default : 3 ( seconds ) ───
# ───
# auto_reconnect_sleep_between_try 3
# ─── NOTE: Change these values only if you have a MongoDB cluster and you change the ───
# ─── heartbeatTimeoutSecs of your MongoDB replica set ───
# ─── The value of auto_reconnect_max_try * auto_reconnect_sleep_between_try must be higher than ───
# ─── heartbeatTimeoutSecs in the rs.conf(); of your MongoDB replica set. ─── |
| Info | ||
|---|---|---|
| ||
Primaire : nom de MongoDB pour désigner un serveur maître, le serveur sur lequel il est possible de faire des requêtes d'écriture dans la base. Élection : processus de MongoDB pour choisir un nouveau membre Primaire si le membre Primaire devient inaccessible. ( Voir la page Haute disponibilité de la base MongoDB (mise en place d'un cluster) ) |
Dans le cas de l'utilisation d'un cluster MongoDB, lorsque le membre Primaire devient inaccessible, une nouvelle élection est déclenchée, ce qui provoque une coupure temporaire de l'accès à la base.
Dans le but de ne pas interrompre le service, le module SLA va se reconnecter automatiquement au cluster MongoDB.
Pour ce faire, il va faire un nombre d'essais égal au paramètre "auto_reconnect_max_try " avec une pause de X secondes entre chaque essai ( correspondant au paramètre "auto_reconnect_sleep_between_try" ).
Par défaut pour MongoDB le temps maximum avant qu'un membre Primaire soit considéré comme indisponible et qu'une nouvelle élection ait lieu est de 10 secondes.
Voir : "heartbeatTimeoutSecs" donné par la commande rs.conf(); dans un shell de MongoDB.
| Scroll Title | |||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| |||||||||||||||||||
|
Les valeurs par défauts du fichier laissent 12 secondes, ce qui est amplement suffisant avec la configuration par défaut de MongoDB.
| Warning |
|---|
Il est conseillé de ne pas modifier ces valeurs. |
Utilisation des workers du module SLA
| Code Block | ||||
|---|---|---|---|---|
| ||||
# ┌─────────────────────────────────────────────────────────────────────────────────────────────────────┐ #
# │ ─────────────────────────────────── WORKERS IN THE BROKER ─────────────────────────────────── │ #
# └─────────────────────────────────────────────────────────────────────────────────────────────────────┘ #
# ─── This module will use workers in the broker, each worker will manage a shard of all hosts/checks. ───
# ─── This parameter is used by the broker to set the number of workers. ───
# ─── Each worker will use one CPU, which will balance the sla processing load among CPUs. ───
# ───
# Default : 1 => X workers ───
# ───
# broker_module_nb_workers 1 |
Le paramètre "broker_module_nb_workers" va déterminer combien de fois le module SLA va se cloner pour gérer le flux de donnée à enregistrer afin de repartir cette charge sur plusieurs CPU.
Il est possible de changer ce paramètre si l’utilisation CPU du processus : "NOM DU BROKER [ - Module: sla ][ Worker: 0 ]" est trop élevé.
| Scroll Title | ||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ||||||||||||
|
| Info |
|---|
Ne pas dépasser le nombre de core cpu de la machine : cela serait contre-productif pour les performances. |
Options internes
| Code Block | ||||
|---|---|---|---|---|
| ||||
# ┌─────────────────────────────────────────────────────────────────────────────────────────────────────┐ #
# │ ───────────────────────────────────── INTERNAL OPTIONS ────────────────────────────────────── │ #
# └─────────────────────────────────────────────────────────────────────────────────────────────────────┘ #
# ─── INTERNAL : DO NOT EDIT FOLLOWING PARAMETER WITHOUT YOUR DEDICATED SUPPORT ───
# ─── Broker idle time before considering that Shinken is inactive. ───
# ─── Use this if you have Broker loop time that exceeds 30 seconds ───
# ───
# Default : 30 ( seconds ) ───
# ───
# time_before_shinken_inactive 30
# ─── Maximum number of elements archived in one bulk pass. ───
# ─── Use this if at 00:05 (archive time) your MongoDB is saturated ───
# ───
# Default : 10 000 ( number of elements ) ───
# ───
# size_chunk_to_archive 10000
# ─── Time between two chunk to archive. ───
# ─── Use this if at 00:05 (archive time) your MongoDB is saturated ───
# ───time_before_shinken_inactive # Default : 0.1 ( seconds ) ───
# ───
# time_between_two_chunks 0.1
# ─── Max number of sla remove each daily_clean_pause_time. ───
# ─── Use if nb_stored_days is not -1. ( Daily clean time is activated ) ───
# ─── Use this if at 03:02 (daily clean time) your MongoDB is saturated. ───
# ───
# Default : 10 000 ( number of sla ) ───
# ───
# daily_clean_batch_size 10000
# ─── Delay between 2 sla clean. ───
# ─── Use if nb_stored_days is not -1. ( Daily clean time is activated ) ───
# ─── Use this if at 03:02 (daily clean time) your MongoDB is saturated. ───
# ───
# Default : 2 ( seconds ) ───
# ───
# daily_clean_pause_time 2
# ─── Max number of sla archive migrate save at same time. ───
# ─── Use this if after an Shinken update your MongoDB is saturated. ───
# ───
# Default : 1 000 ( sla ) ───
# ───
# broker_module_sla_migration_batch_size 1000
# ─── Delay between 2 migrating batch save. ───
# ─── Use this if after an Shinken update your MongoDB is saturated. ───
# ───
# Default : 0.1 ( seconds ) ───
# ───
# broker_module_sla_migration_pause_time 0.1
# ─── Split historical sla_archive collection in daily archive collections ───
# ─── As this may require extra disk space to run, you can disable it here in order to delay it until ───
# ─── more disk space is available. ───
# ─── After completion, performance and disk space management will be greatly improved ───
# ───
# Default : 1 => Enable ───
# ... : 0 => Disable ───
# ───
# broker__module_sla__enable_migration_sla_archive_in_daily_collections 1
|
| Warning |
|---|
Ces paramètres sont dédiés au fonctionnement interne au module, il est fortement recommandé de ne pas les modifier sans le support dédié. |
| Scroll Title | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Erreurs dans le Module
Afin de ne pas casser la base et les données de SLA, si le module à une erreur inattendue comme un crash, alors le module s’arrête et n'est pas automatiquement redémarré.
Lancer la commande shinken-healthcheck pour trouver l'erreur Fatale
| Panel |
|---|
Suppression des anciennes entrées dans la base d'archives du module SLA
Les entrées dans la base d'archives du module SLA sont supprimées toutes les 24h.
| Info |
|---|
Si le Broker est éteint et que la suppression n'est pas faite depuis plus de 24 h, elle se fera automatiquement au démarrage du Broker. |
| Info |
|---|
| S'il n'y a aucune trace du dernier nettoyage de la base d'archives du module SLA, le nettoyage s'exécutera. |

