Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.
Comment: Make by tools (01.00.01) - action=same_as_next_version
Scroll Ignore
scroll-pdftrue
scroll-officetrue
scroll-chmtrue
scroll-docbooktrue
scroll-eclipsehelptrue
scroll-epubtrue
scroll-htmltrue
Panel
titleSommaire

Table of Contents
stylenone

Contexte

Le modèle shinken

Description du modèle

Une fois sur l'hôte, le modèle va crée un check shinken-broker-module-event-manager-writer pour chaque webui présent sur le démon Broker sur l'élément supervisé.

Panel

Table of Contents
maxLevel4

Description des checks

Le check shinken

-broker-module-event-manager-writerpermet de superviser un hôte hébergeant le Module event-manager-writer ( voir la page Module event-manager-writer ).

Sommaire des checks

Nom

Description

Ce check permet de

supervisé

superviser la partie écriture du module Event manager au niveau du démon

 broker.

Description du résultat

Le résultat du check donne le statut de l'écriture des données de l'event manager.

Le résumé sur la dernière minute contient  : 

  • Le nombre d'événements écrits dans la dernière minute
  • Le nombre de broks écrit dans la dernière minute avec le temps de traitement moyen d'un brok
Info
titleBrok

Les broks sont les informations de chaque vérification envoyée par le Scheduler au Broker

Panel
titleRésultat

Image Removed

Description du résultat long

Le résultat long donne le détail des informations traitées par le module.

La partie Global contient : 

  • Le nombre d'éléments gérés par l'event manager 
  • Un résumé sur la dernière minute de l'activité du module (voir ci-dessus : résultat)

Les parties Worker contient par worker :

  • Le nombre d'éléments gérés par workers
  • Un résumé de l'activité sur worker
  • La charge du worker : C'est à dire le temps que le worker a effectivement travaillé sur la dernière minute
    • Exemple : si sur la dernière minute le module a reçu 5000 broks et qu'il a mis 10ms par broks cela fera (5000 * 0.01) / 60 = 0.83 soit 83% de charge.

La partie Database contient : 

  • Le nombre de jours durant lequel sont gardés les événements. Au delà de cette limite les événements sont supprimés.
  • Le nombre d'événements sauvegardés et la taille de la base.
  • Date du dernier événement sauvegardé.
Panel
titleRésultat long

Image Removed

Les métriques

Voici les métriques disponibles :

Broker ( voir la page Le Broker ).

Les données

Les données communes pour tous les checks

Provenant du modèle shinken

Excerpt Include
Modèle shinken
Modèle shinken
nopaneltrue

Provenant du modèle shinken-broker-module-event-manager-writer

Excerpt Include
Le Broker
Le Broker
nopaneltrue

Les données spécifiques

Pour le check "Broker - $KEY$ - Module Event Manager Writer"

Excerpt Include
Broker - $KEY$ - Module Event Manager Writer
Broker - $KEY$ - Module Event Manager Writer
nopaneltrue

Les données DFE ( Duplicate Foreach )

Excerpt
Scroll Title
anchordata_for_check_sup_de_sup
title
NomModifiable sur UnitéDéfautValeur par défaut à l'installation de ShinkenDescription
No Format
MODULE_EVENT_MANAGER_LIST

l'Hôte

( Onglet Données )

---broker-master$($_HOSTBROKER_PORT$)$broker-master$($_HOSTBROKER_PORT$)$

Liste des machines ayant les modules Event Manager Writer

Check(s) impacté(s) :

Comment appliquer un modèle d'hôte à un hôte

Excerpt Include
Comment appliquer un modèle d'hôte à un hôte - Pack shinken
Comment appliquer un modèle d'hôte à un hôte - Pack shinken
nopaneltrue

Nom de la métriqueDescriptionworker_[X]_load_in_last_minCharge du worker, entre 0 et 1.worker_[X]_event_write_in_last_minNombre d'événements écrits sur la dernière minute par le worker.worker_[X]_brok_handle_in_last_minNombre de broks traités sur la dernière minute par le worker.global_event_write_in_last_minNombre total d'événements écrits sur la dernière minuteglobal_brok_handle_in_last_min Nombre total de broks traités sur la dernière minutetotal_base_size Taille de la base en octettotal_event_number Nombre total d'événements en basetotal_element Nombre total d'éléments gérés

Comment interpréter les données des métriques

Taille de la base

Durant les 30 premiers jours d'activité du module, il est grandement recommandé de surveiller la taille de la base (avec la métrique : total_base_size), car la taille de la base ne fera que monter durant cette période. 
Si la taille de la base se rapproche trop vite de la limite de votre disque, vous pouvez réduire le nombre de jours sauvegardés à l'aide de la clé : day_keep_data situé dans le fichier /etc/shinken/modules/event_manager_writer.cfg ou augmenter la capacité de votre disque.

Passé cette période, Shinken ne gardera que le x derniers jours définie par la clé day_keep_data afin de limité la taille de la base. 

Warning

Une augmentation du nombre d'éléments supervisés fera grandir la taille de la base. 

Gestion du nombre d'événement écrits et du nombre de brok gérés

Le nombre d'événements doit être sensiblement inférieur au nombre de brok gérés, c'est pourquoi il faut surveiller les métriques global_brok_handle_in_last_min et global_event_write_in_last_min, car si c'est deux métriques sont proches cela signifie qu'à chaque vérifications, vos éléments changent d'état et donc que tout les éléments supervisés sont en flapping.

Gestion des workers

Ajout d'un worker 

Pour ajouter un worker, il suffit de modifier la clé broker_module_nb_workers dans /etc/shinken/modules/event_manager_writer.cfg en augmentant ou diminuant le nombre de worker utilisé. 
tinymce.emotions_dlg.warning Chaque worker ajouté utilisera un CPU sur le serveur où se situe le démon Broker. Ajouter ou diminuer le nombre de worker permet de mieux répartir la charge de travailler pour les autres worker.

Gestion de la charge des workers
ConditionsOrigineSolutionSi les métrique total_event_number, global_event_write_in_last_min, global_brok_handle_in_last_min et worker_[X]_load_in_last_min croissent et que le temps de traitement des broks devient élevé Il est probable que le nombre d'éléments supervisés ont augmentésIl est alors conseillé d'augmenter le nombre de worker utilisés.Si la métrique total_event_number est stable mais que la métrique global_brok_handle_in_last_min monteIl est probable que vous avez changé le check intervalle sur vos checksSurveiller la charge des workers et ajouter un si besoin.Si la métrique global_brok_handle_in_last_min est stable mais que la métrique global_event_write_in_last_min monteC'est que votre infrastructure passe une période d'instabilité (mise à jour sur les serveurs, changement de switch ...)Surveiller la charge des workers et la taille de la base. Si le problème est temporaire la charge du worker va retrouver un niveau stableSi la métrique global_brok_handle_in_last_min et global_event_write_in_last_min sont stable mais que la métrique worker_[X]_load_in_last_min monteIl est possible que machine qui exécute Shinken a un problème (swap, stealing CPU ...)Dans ce cas, lancer la commande shinken-healthcheck puis top afin de vérifier l'état de votre infrastructure shinken et des performance du serveur.