| Scroll Ignore | ||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ||||||||||||||
|
Contexte
Le check Broker - $KEY$ - Module Event Manager Writer permet de superviser la partie écriture du module SLA Event Manager ( voir la page Module event-manager-writer ) au niveau du démon démon Broker ( voir la page Le Broker ).
| Panel |
|---|
Paramétrage
Le check utilise la ligne de commande suivante :
| Code Block | ||||
|---|---|---|---|---|
| ||||
$PLUGINSDIR$/check_shinken_module_event_slamanager_writer.py -H "$HOSTADDRESS$" -p "$ARG1$" --shinkenversion "$SHINKENVERSION$" -m "$_HOSTMINUTES_OF_STATS$" --workerwarning "$_HOSTWORKER_WARNING$" --workercritical "$_HOSTWORKER_CRITICAL$" --storagewarning "$_HOSTSTORAGE_WARNING$" --storagecritical "$_HOSTSTORAGE_CRITICAL$" --timeout "$_HOSTCHECK_SHINKEN_TIMEOUT$" |
Données utilisées provenant du modèle
Données communes pour les checks du modèle
Nom | Modifiable sur | Défaut | Valeur par défaut à l'installation de Shinken | Description |
|---|---|---|---|---|
CHECK_SHINKEN_TIMEOUT | l'Hôte ( Onglet Données ) | 3 | 3 | Temps maximum durant lequel les checks peuvent s'exécuter ( en secondes ). |
Données spécifiques pour ce check
| Nom | Modifiable sur | Unités | Défaut | Valeur par défaut à l'installation de Shinken | Description | ||
|---|---|---|---|---|---|---|---|
| Modèle d'hôte ( Onglet Données ) | --- | 1 | 1 | Nombre des X dernières minutes utilisées pour calculer les statistiques | ||
| Modèle d'hôte ( Onglet Données ) | % | 40 | 40 | Seuil d’avertissement pour la charge d’un Worker | ||
| Modèle d'hôte ( Onglet Données ) | % | 80 | 80 | Seuil de critique pour la charge d’un Worker | ||
| Modèle d'hôte ( Onglet Données ) | MB | 0 ( inactif ) | 0 ( inactif ) | Seuil d’avertissement pour la taille de stockage | ||
| Modèle d'hôte ( Onglet Données ) | MB | 0 ( inactif ) | 0 ( inactif ) | Seuil de critique pour la taille de stockage |
Les données DFE ( Duplicate Foreach )
Excerpt Include Modèle shinken-broker-module-event-visualisationmanager-uiwriter Modèle shinken-broker-module-event-visualisationmanager-uiwriter nopanel true
Données utilisées provenant du check
Pas de données spécifiques pour ce check.
Données globales
| Excerpt Include | ||||||
|---|---|---|---|---|---|---|
|
Propriétés de l'hôte
| Excerpt Include | ||||||
|---|---|---|---|---|---|---|
|
Résultat
Exemple
| Panel |
|---|
Interprétation
Statut
Il peut prendre deux valeurs OK / CRITIQUE / ATTENTION / INCONNU .
- Le statut va dépendre du retour de sonde et de la configuration spécifique du check pour les données suivantes :
- WORKER_CRITICAL
- WORKER_WARNING
- STORAGE_CRITICAL STORAGE_WARNING
- CHECK_SHINKEN_TIMEOUT
Voici un tableau récapitulatif du statut attendu suivant le retour de sonde :
Les vérifications spécifiques
Situation | Statut | |
|---|---|---|
En fonction du pourcentage de la charge du Worker CPU volé :
| CRITIQUE | |
En fonction de la taille stockage :
| CRITIQUE | |
En fonction du pourcentage de la charge du Worker CPU volé :
| ATTENTION | |
ATTENTION | Le Broker est en cours d'arrêt | ATTENTION |
Si la sonde n'a pas eu de réponse avant le temps maximum
| INCONNU |
Résultat
Renvoi au format texte :
- Si le module fonctionne correctement
- statistique du nombre d'événements géré dans la dernière minute
Résultat Long
Le résultat
du check de supervision de l'écriture du module SLA se compose en 5 catégories d'informations :- SLA - Writer : Ecriture des SLA,
- SLA - Archive: Archivage des SLA,
- SLA - Migration : Migration des données SLA,
- SLA - Database cleanup : Suppression des anciennes données SLA,
- Les métriques du check: Affiche les informations sur les métriques du check.
Écriture des SLA
Cette partie SLA - Writer du résultat du check indique dans la première puce le nombre d'éléments total dans le module.
Puis les autres puces indique pour chaque worker :
- Le nombre géré d'éléments dans le worker
- Les statistiques sur x minutes
- Le temps d'écriture
- Le nombre d’éléments écrit
- La charge sur la dernière minute
| Panel |
|---|
Archivage des SLA
La partie SLA - Archive indique les informations sur l'archivage des SLA.
La première puce présente les informations sur la dernière archive avec :
- La date de début de l'archive
- Le temps d’exécution de l'archive
- Le nombre de SLA archivés
Dans la deuxième puce indique la date de la plus ancienne archive de stocker. Cette date est la limite à partir de laquelle on ne peut pas générer un rapport SLA ou visualiser un SLA dans l'onglet Historique/SLA du volet détail de l'interface de visualisation plus ancienne que cette date.
| Panel |
|---|
Migration des données
La partie SLA - Migration indique les informations sur le statut du processus de migration des données de SLA.
Pour rappel, la migration des données SLA permet de migrer toutes les données SLA d'un format de donnée vers un nouveau qui pourrait être mise en place lors d'une mise à jour de Shinken
Lorsque la migration des données est en cours le résultat du check indique :
- Si la base de donnée a été migré
Avec le nombre de données utilisant l'ancien format de données
Panel title Migration terminée
- Le statut de la migration
La progression de la migration avec le pourcentage et le nombre de données migré et sur le nombre total de donnée.
Panel title Migration en cours
Si la base de données est au bon format, le résultat du check indique la durée de la dernière migration effectuée
long donne le détail des informations traitées par le module.
La partie Global contient :
- Le nombre d'éléments gérés par le module event manager
- Un résumé sur la dernière minute de l'activité du module ( voir ci-dessus : Description du résultat )
Les parties Worker contient par worker :
- Le nombre d'éléments gérés par workers
- Un résumé de l'activité sur worker
- La charge du worker : C'est à dire le temps que le worker a effectivement travaillé sur la dernière minute
- Exemple : si sur la dernière minute le module a reçu 5000 broks et qu'il a mis 10ms par broks cela fera ( 5000 * 0.01 ) / 60 = 0.83 soit 83% de charge.
La partie Database contient :
- Le nombre de jours durant lequel sont gardés les événements. Au-delà de cette limite, les événements sont supprimés.
- Le nombre d'événements sauvegardés et la taille de la base.
- Date du dernier événement sauvegardé.
Rotation des données
La partie SLA - Database cleanup indique les informations sur la rotation des données.
Pour rappel, la rotation des données est un système de suppression des données afin d'éviter que la base de données ne grossisse trop. Cette rotation supprime les données à partir d'un certain nombre de jours. Exemple ci-contre seul les 300 derniers jours de SLA sont conservés.
Le nombre de jours a conservé et paramétrable dans le fichier de configuration du Module SLA sur le paramètre nb_stored_days. Si souhaiter ne pas mettre de jours maximaux de conservation, il faut mettre la valeur -1 au paramètre
Lorsque la rotation est en cours, le résultat du check indique :
- La date limite de conservation des SLA
- Avec le nombre de SLA à supprimer
- La progression de la rotation
- Avec le pourcentage d'avancement
- La taille totale de la base de données SLA
- Avec le nombre d'éléments supervisé qui correspond au total d'élément affiché dans la partie "écriture"
Le nombre d'éléments qui ne sont plus supervisés, mais toujours stocké ( calculé grâce au nombre total d'éléments dans la base archive par le module SLA que l'on peut suivre via le chapitre [ UNIQUE ELEMENTS IN ARCHIVE ] des logs du broker : Broker - Les logs du module SLA
Panel title Rotation en cours
Lorsque la rotation est désactivée, voici les informations affichées :
- Affiche que les SLA sont conservés pour toujours
- La taille totale de la base de données SLA
Avec le nombre d'éléments supervisé qui correspond au total d'élément affiché dans la partie "écriture"
Le nombre d'éléments qui ne sont plus supervisés, mais toujours stocké
Panel title Rotation désactivé
Description des erreurs
Le Broker est en cours d'arrêt
Lorsque le Broker est en cours d'arrêt, le check le signale, et les informations relatives au module ne sont plus disponibles
| Panel |
|---|
Métriques
| Nom | Unité | Description | |||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|
| --- | Charge du worker, entre 0 et 1. | |||||||||
| --- | Nombre d'événements écrits sur la dernière minute par le worker. charge du worker sur la dernière minute ( comme dans l'ouput du check ) | |||||||||
| --- | Nombre de SLA écrit broks traités sur la dernière minute par le worker. | |||||||||
| --- | Nombre total d'événements écrits sur la dernière minute _write_time | |||||||||
| --- | Nombre total de broks traités | seconde | Temps passé sur la dernière minute à écrire les SLA | |||||||
| octet | Taille de la base | |||||||||
| --- | Nombre total d'événements en base | |||||||||
| --- | Nombre total d'éléments géréstaille des données SLA en base |









