Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.


Scroll Ignore
scroll-pdftrue
scroll-officetrue
scroll-chmtrue
scroll-docbooktrue
scroll-eclipsehelptrue
scroll-epubtrue
scroll-htmltrue


Panel
titleSommaire

Table of Contents
maxLevel4
stylenone



Les logs propres au module

Erreurs lors du lancement du module WebUI

Le port de la WebUI est déjà ouvert

Si une autre WebUI utilise déjà le port ( sûrement un problème de configuration ), alors on aura les WARNING suivants:

Code Block
themeEmacs
[YYYY-MM-DD HH:MM:SS] WARNING: [ WebUI2WebUI-name ] [TRY 1/10] The webui named [WebUI2 WebUI-name ] can not start because the address 0.0.0.0:7767 is already in use
[YYYY-MM-DD HH:MM:SS] WARNING: [ WebUI2WebUI-name ] [TRY 2/10] The webui named [WebUI2 WebUI-name ] can not start because the address 0.0.0.0:7767 is already in use

[YYYY-MM-DD HH:MM:SS] WARNING: [ WebUI2WebUI-name ] [TRY 3/10] The webui named [WebUI2 WebUI-name ] can not start because the address 0.0.0.0:7767 is already in use

[YYYY-MM-DD HH:MM:SS] WARNING: [ WebUI2WebUI-name ] [TRY 4/10] The webui named [WebUI2 WebUI-name ] can not start because the address 0.0.0.0:7767 is already in use

[YYYY-MM-DD HH:MM:SS] WARNING: [ WebUI2WebUI-name ] [TRY 5/10] The webui named [WebUI2 WebUI-name ] can not start because the address 0.0.0.0:7767 is already in use

[YYYY-MM-DD HH:MM:SS] WARNING: [ WebUI2WebUI-name ] [TRY 6/10] The webui named [WebUI2 WebUI-name ] can not start because the address 0.0.0.0:7767 is already in use

[YYYY-MM-DD HH:MM:SS] WARNING: [ WebUI2WebUI-name ] [TRY 7/10] The webui named [WebUI2 WebUI-name ] can not start because the address 0.0.0.0:7767 is already in use

[YYYY-MM-DD HH:MM:SS] WARNING: [ WebUI2WebUI-name ] [TRY 8/10] The webui named [WebUI2 WebUI-name ] can not start because the address 0.0.0.0:7767 is already in use

[YYYY-MM-DD HH:MM:SS] WARNING: [ WebUI2WebUI-name ] [TRY 9/10] The webui named [WebUI2 WebUI-name ] can not start because the address 0.0.0.0:7767 is already in use


Puis lors du dernier essai une ERROR (le module s'arrête):

Code Block
themeEmacs
[YYYY-MM-DD HH:MM:SS] ERROR : [ WebUI2WebUI-name ] [ CRASH - INSIDE MODULE PROCESS ] [TRY 10/10] The webui named [WebUI2 WebUI-name ] can not start because the address 0.0.0.0:7767 is already in use

Enfin l'erreur sera rapportée par le Broker qui va s'assurer que le module est éteint, et tenter de le relancer plus tard:


Code Block
themeEmacs
[YYYY-MM-DD HH:MM:SS] ERROR : [ broker-mastername ] [ MODULES-MANAGER ] [ MODULE-INSTANCE-CRASH ] [ WebUI2WebUI-name ] [ module_type=webui ] The module WebUI2 just stopped. Last ERROR received:

[YYYY-MM-DD HH:MM:SS] ERROR : [ broker-mastername ] [ MODULES-MANAGER ] [ MODULE-INSTANCE-CRASH ] [ WebUI2WebUI-name ] [ module_type=webui ] [TRY 10/10] The webui named [WebUI2]  WebUI-name ] can not start because the address 0.0.0.0:7767 is already in use


Erreurs issues d'un problème de changement dans le code de l'interface de visualisation

Si le fichier index.html est cassé chez un client, ou qu'un développeur a changé ce fichier sans faire attention, on aura des erreurs spécifiques.


Si le fichier index.html est manquant:

Code Block
themeEmacs
[YYYY-MM-DD HH:MM:SS] ERROR : [ WebUI2WebUI-name ] [ CRASH - INSIDE MODULE PROCESS ] The file /var/lib/shinken/modules/webui/htdocs/ui/index.html is missing: there is a critical error with your installation. Please open a ticket to your support.


Si le fichier index.html n'a pas les bons droits (l'utilisateur shinken ne peux pas l'ouvrir):

Code Block
themeEmacs
[YYYY-MM-DD HH:MM:SS] ERROR : [ WebUI2WebUI-name ] [ CRASH - INSIDE MODULE PROCESS ] Cannot open the file /var/lib/shinken/modules/webui/htdocs/ui/index.html with the error "ERROR": there is a critical error with your installation. Please open a ticket to your support.


Si le fichier index.html n'a pas la bonne variable de langue

Code Block
themeEmacs
[YYYY-MM-DD HH:MM:SS] ERROR : [ WebUI2WebUI-name ] [ CRASH - INSIDE MODULE PROCESS ] The __shinken_lang__ variable was not found in the file /var/lib/shinken/modules/webui/htdocs/ui/index.html: there is a critical error with your installation. Please open a ticket to your support.


Erreurs de paramétrage

Si certains paramètres sont mal définis, la WebUI ne peut pas démarrer et va s'arrêter sur une erreur critique, qui sera affichée dans le check du Broker ainsi que dans le healthcheck.


Si son paramètre "lang" n'est pas dans la liste autorisé ( fr, en ), on aura l'erreur suivante:

Code Block
themeEmacs
[YYYY-MM-DD HH:MM:SS] ERROR : [ WebUI-name ] [ CRASH - INSIDE MODULE PROCESS ] For the parameter "lang" the value "XXX" is not allowed. Values can be : "fr, en"


La configuration des Graphite backends

Port du Graphite backend invalide

L'adresse d'un graphite_backends contient un port non correct et est remplacé par le port par défaut ( 80 ) :

Code Block
themeEmacs
[YYYY-MM-DD HH:MM:SS] WARNING: [ WEBUI_NAMEWebUI-name     ] [ CONFIGURATION ] The Graphite backend [ BACKEND ] is incorrect : The port [ INVALID_PORT ] is not valid. Valid values are integers from 0 to 65535.


Adresse du Graphite backend vide

Lorsqu'il n'y a pas d'adresse fournie dans un Graphite backend ( exemple : France::8080 ), son adresse est remplacée par une adresse par défaut ( 0.0.0.0 ) :


Code Block
themeEmacs
[YYYY-MM-DD HH:MM:SS] WARNING: [ WEBUI_NAMEWebUI-name     ] [ CONFIGURATION    ] The Graphite backend [ BACKEND ] is incorrect : The hostname or IP address is empty or not found.


Backend mal formé

Lorsqu'un backend est mal formé, par exemple si il n'a pas de royaume et de port renseigné, un message est remonté au démarrage de la WebUI.

Exemple de graphite_backends erroné :

Code Block
themeEmacs
graphite_backends			192.168.1.23


Code Block
themeEmacs
[YYYY-MM-DD HH:MM:SS] ERROR  : [ WEBUI_NAMEWebUI-name     ] [ CONFIGURATION    ] The Graphite backend [ BACKEND ] is not well formatted. It needs at least a realm and a host : <REALM>:<HOSTNAME>

Rappel de format attendu : <REALM>:<ADDRESS>:<PORT>

Exemple : France:192.168.1.23:8080

Protocole du Backend invalide

Si dans la définition du Backend, le protocole fourni n'est pas valide, un log au démarrage nous en averti.

Exemple de graphite_backends erroné :


Code Block
themeEmacs
graphite_backends			France:htt://192.168.1.23:8080


Code Block
themeEmacs
[YYYY-MM-DD HH:MM:SS] ERROR  : [ WEBUI_NAMEWebUI-name     ] [ CONFIGURATION    ] The Graphite backend [ BACKEND ] is incorrect : The [ PROTOCOL ] protocol is unknown.


Création des index en base de données au démarrage

Au démarrage du module, les index permettant d'assurer de bonnes performances pour les requêtes à la base de données sont créés s'ils n'existent pas.

Le temps pris pour la mise en place de chaque index est également détaillé.

Code Block
themeEmacs
[YYYY-MM-DD HH:MM:DD] INFO   : [ WebUI           -name ] [ Index ] Need to ensure indexes are present in Mongodb ( 2 indexes )
[YYYY-MM-DD HH:MM:DD] INFO   : [ WebUI           -name ] [ Index ]   1 - COLLECTION_NAME1::FIELD2 ( INDEX_NAME ) was created/checked in X.XXXXs
[YYYY-MM-DD HH:MM:DD] INFO   : [ WebUI           -name ] [ Index ]   2 - COLLECTION_NAME2::FIELD1,FIELD2 ( INDEX_NAME ) was created/checked in X.XXXXs
[YYYY-MM-DD HH:MM:DD] INFO   : [ WebUI           -name ] [ Index ] All Mongodb indexes were created/checked in X.XXXs


Code Block
themeEmacs
titleExemple
[2021-11-25 16:38:47] INFO   : [ WebUI           ] [ Index ] Need to ensure indexes are present in Mongodb ( 1 indexes )
[2021-11-25 16:38:47] INFO   : [ WebUI           ] [ Index ]   1 - dashboard::uuid ( uuid_1 ) was created/checked in 0.0005s
[2021-11-25 16:38:47] INFO   : [ WebUI           ] [ Index ] All Mongodb indexes were created/checked in 0.0005s


Cas d'erreur

Si une erreur survient lors de la tentative d'indexation, le module essaiera à nouveau lors de son prochain démarrage, et le log suivant est généré

Code Block
themeEmacs
[YYYY-MM-DD HH:MM:SS] WARNING: [ WebUI           -name] Mongodb ERREUR PYTHON
[YYYY-MM-DD HH:MM:SS] WARNING: [ WebUI-name] Mongodb index building could not      ] Mongodb index building could not be be done, will retry at next restart


Code Block
themeEmacs
titleExemple
[2021-10-21 17:05:52] WARNING: [ WebUI           ] Mongodb ERROR stack : Traceback (most recent call last):
[2021-10-21 17:05:52] WARNING: [ WebUI           ] Mongodb   File "/var/lib/shinken/modules/webui/module.py", line 379, in main
[2021-10-21 17:05:52] WARNING: [ WebUI           ] Mongodb     raise IOError
[2021-10-21 17:05:52] WARNING: [ WebUI           ] Mongodb IOError
[2021-10-21 17:05:52] WARNING: [ WebUI           ] Mongodb index building could not be done, will retry at next restart


Chargement des broks initiaux par un regenerator ( créateur d'objets des modules de broker ) et vérifier que c'est bien la même configuration charger entre les regenerators / Scheduler / Arbiter

Les logs suivants permettent de suivre le chargement de la configuration de supervision entre l'Arbiter , les Schedulers jusqu'aux interfaces : webui / livestatus / livedata

Il existe 2 types d'identifiants de configuration (représentation de la configuration)

  • configuration_uuid:  uuid de configuration totale générée par l'Arbiter
  • configuration_partshard_id:  id de la partie de configuration géré par un Scheduler

Quand un module de broker avec un regenerator charge une nouvelle configuration :


Code Block

[2020-05-15 16:29:49]  INFO :  [WebUI3] [ CONFIGURATION ] [ NEW ] [ REGENERATOR ]  configuration part retrieved: [ configuration_part_id= configuration_part_id, scheduler=scheduler_name configuration_uuid=configuration_uuid, arbiter=arbiter_name date=creation_date ]

themeEmacs
[ YYYY-MM-DD HH:MM:SS ] INFO   : [ WebUI-name ] [ REGENERATOR ] [ scheduler=scheduler_name ] Creating new configuration for [shard_id= shard_id , scheduler= scheduler_name , configuration_uuid= configuration_uuid , arbiter= arbiter_name , architecture= architecture_name , date= creation_date , active= active ]


  • shard_configuration_part_id: id de la partie de configuration gérée par le Scheduler (unique par Scheduler)
  • scheduler_name:  nom du Scheduler qui gère cette partie de la configuration
  • configuration_uuid:  uuid créée crée lors du démarrage de l'Arbiter qui correspond donc à l'id de la configuration gérée par l'Arbiter
  • creation_date: date du démarrage de l'Arbiter
  • arbiter_name:  nom de l'Arbiter qui a créé cette configuration
  • architecture_name: nom de l'architecture, unique par installation de Shinken
  • active: Est a False si le Scheduler est pas actif (en attente d'une configuration)


Code Block
themeEmacs
titleExemple Log Broker - module WebUI3 chargement de la nouvelle configuration
[YYYY2022-MM01-DD26 HH13:MM01:SS43] INFO   : [WebUI3] [ CONFIGURATION WebUI3          ] [ NEWREGENERATOR ] [ REGENERATORscheduler=scheduler-dev2 ] configurationCreating partnew retrievedconfiguration :for [ configuration_partshard_id=8256, scheduler=scheduler-masterdev2, configuration_uuid=fe5982b29bfb48cdadb35523799f7ceca549db11b51d4aeb8548b43b088112e9, arbiter=arbiter-master1 dev2, architecture=Shinken-dev2, date=1526-0501-20202022 1613:1300:4028, active=True]


Quand un module de broker avec un regenerator rejette une configuration :

Dans le cas où la configuration d'un Scheduler est déjà gérée par un regenerator ( cas qui arrive si par exemple un module crash ) , on redemande les broks initiaux. Tous les modules vont recevoir la nouvelle configuration, mais ceux qui la gère déjà, ne vont pas la recharger et vont loguer :

Code Block
themeEmacs
[YYYY-MM-DD HH:MM:SS] INFO INFO :  [WebUI3WebUI-name] [ CONFIGURATION ] [ NEW ] [ REGENERATOR ] No need to reload the configuration part because I already handle it [ configuration_partshard_id=configuration_partshard_id, scheduler=scheduler_name, configuration_uuid=configuration_uuid, arbiter=arbiter_name, architecture=architecture_name, date=creation_date, active=active]

  • configuration_partshard_id: id de la partie de configuration gérée par le Scheduler (unique par Scheduler)
  • scheduler_name: nom  nom du Scheduler qui gère cette partie de la configuration
  • configuration_uuid:  uuid créée crée lors du démarrage de l'Arbiter qui correspond donc à l'id de la configuration gérée par l'Arbiter
  • creation_date:   date du démarrage de l'Arbiter
  • arbiter_name:  nom de l'Arbiter qui a créé cette configuration
  • architecture_name: nom de l'architecture, unique par installation de Shinken
  • active: Est a False si le Scheduler est pas actif (en attente d'une configuration)


Code Block
themeEmacs
titleExemple Log Broker - module WebUI3 chargement de la nouvelle configuration
[YYYY-MM-DD HH:MM:SS] WARNING: [WebUI3] [ CONFIGURATION ] [ NEW ] [ REGENERATOR ] No need to reload the configuration part because I already handle it [ configuration_partshard_id=8256, scheduler=scheduler-masterdev2, configuration_uuid=fe5982b29bfb48cdadb35523799f7ceca549db11b51d4aeb8548b43b088112e9, arbiter=arbiter-master1-dev2, architecture=Shinken-dev2, date=1526-0501-20202022 1613:1300:4028, active=True]

Temps de locks trop long entre la consommation des Broks et les requêtes de l'interface de Visualisation


Quand un module de broker avec un regenerator fini de charger une configuration :

Quand un Scheduler a fini d'envoyer une configuration, le regenerator charge cette configuration les log suivant montre les étapes de ce chargement.

Le début du chargement est montré par le log suivant :

Code Block
themeEmacs
titleExemple Log Broker - module WebUI3 chargement de la nouvelle configuration
[YYYY-MM-DD HH:MM:SS] INFO   : [ WebUI3          ] [ REGENERATOR ] [ scheduler=scheduler-dev2 ] [ LOADING ] Loading configuration part : [shard_id=256, scheduler=scheduler-dev2, configuration_uuid=a549db11b51d4aeb8548b43b088112e9, arbiter=arbiter-dev2, architecture=Shinken-dev2, date=26-01-2022 13:00:28, active=True]


Les différentes étapes avec les logs suivants : 

Code Block
themeEmacs
titleExemple Log Broker - module WebUI3 chargement de la nouvelle configuration
[2022-01-26 13:01:43] INFO   : [ WebUI3          ] [ REGENERATOR ] [ scheduler=scheduler-dev2 ] [ LOADING ] [ PERF ] Merging incoming hostgroup with already existing ones --------------------- : 0.00
[2022-01-26 13:01:43] INFO   : [ WebUI3          ] [ REGENERATOR ] [ scheduler=scheduler-dev2 ] [ LOADING ] [ PERF ] Linking hosts => hostgroups / command / timeperiod / contacts ------------- : 0.00
[2022-01-26 13:01:43] INFO   : [ WebUI3          ] [ REGENERATOR ] [ scheduler=scheduler-dev2 ] [ LOADING ] [ PERF ] Merging incoming service groups with already existing ones ---------------- : 0.00
[2022-01-26 13:01:43] INFO   : [ WebUI3          ] [ REGENERATOR ] [ scheduler=scheduler-dev2 ] [ LOADING ] [ PERF ] Linking services => host / servicegroups / command / timeperiod / contact - : 0.00
[2022-01-26 13:01:43] INFO   : [ WebUI3          ] [ REGENERATOR ] [ scheduler=scheduler-dev2 ] [ LOADING ] [ PERF ] Linking service groups => services ---------------------------------------- : 0.00
[2022-01-26 13:01:43] INFO   : [ WebUI3          ] [ REGENERATOR ] [ scheduler=scheduler-dev2 ] [ LOADING ] [ PERF ] Linking hostgroups => hosts ----------------------------------------------- : 0.00
[2022-01-26 13:01:43] INFO   : [ WebUI3          ] [ REGENERATOR ] [ scheduler=scheduler-dev2 ] [ LOADING ] [ PERF ] Build realm list ---------------------------------------------------------- : 0.00
[2022-01-26 13:01:43] INFO   : [ WebUI3          ] [ REGENERATOR ] [ scheduler=scheduler-dev2 ] [ LOADING ] [ PERF ] Linking host => host & check dependencies ( parents / childs ) ------------ : 0.00
[2022-01-26 13:01:43] INFO   : [ WebUI3          ] [ REGENERATOR ] [ scheduler=scheduler-dev2 ] [ LOADING ] [ PERF ] Linking checks => host & check dependencies ( parents / childs ) ---------- : 0.00
[2022-01-26 13:01:43] INFO   : [ WebUI3          ] [ REGENERATOR ] [ scheduler=scheduler-dev2 ] [ LOADING ] [ PERF ] Linking timeperiod => excluded timeperiod --------------------------------- : 0.00
[2022-01-26 13:01:43] INFO   : [ WebUI3          ] [ REGENERATOR ] [ scheduler=scheduler-dev2 ] [ LOADING ] [ PERF ] Merging incoming contactgroups with already existing ones ----------------- : 0.00
[2022-01-26 13:01:43] INFO   : [ WebUI3          ] [ REGENERATOR ] [ scheduler=scheduler-dev2 ] [ LOADING ] [ PERF ] Linking contactgroups => contacts ----------------------------------------- : 0.00


Puis lors que le chargement est fini l'on donne la taille de la configuration total chargé dans le regenerator et le temps pris pour ce chargement.

Code Block
themeEmacs
titleExemple Log Broker - module WebUI3 chargement de la nouvelle configuration
[2022-01-26 13:01:43] INFO   : [ WebUI3          ] [ REGENERATOR ] [ scheduler=scheduler-dev2 ] [ LOADING ] Configuration size
[2022-01-26 13:01:43] INFO   : [ WebUI3          ] [ REGENERATOR ] [ scheduler=scheduler-dev2 ] [ LOADING ] - hosts -------------- : 1
[2022-01-26 13:01:43] INFO   : [ WebUI3          ] [ REGENERATOR ] [ scheduler=scheduler-dev2 ] [ LOADING ] - checks ------------- : 27
[2022-01-26 13:01:43] INFO   : [ WebUI3          ] [ REGENERATOR ] [ scheduler=scheduler-dev2 ] [ LOADING ] - contacts ----------- : 1
[2022-01-26 13:01:43] INFO   : [ WebUI3          ] [ REGENERATOR ] [ scheduler=scheduler-dev2 ] [ LOADING ] - notificationways --- : 1
[2022-01-26 13:01:43] INFO   : [ WebUI3          ] [ REGENERATOR ] [ scheduler=scheduler-dev2 ] [ LOADING ] - hostgroups --------- : 0
[2022-01-26 13:01:43] INFO   : [ WebUI3          ] [ REGENERATOR ] [ scheduler=scheduler-dev2 ] [ LOADING ] - servicegroups ------ : 0
[2022-01-26 13:01:43] INFO   : [ WebUI3          ] [ REGENERATOR ] [ scheduler=scheduler-dev2 ] [ LOADING ] - contactgroups ------ : 1
[2022-01-26 13:01:43] INFO   : [ WebUI3          ] [ REGENERATOR ] [ scheduler=scheduler-dev2 ] [ LOADING ] - timeperiods -------- : 1
[2022-01-26 13:01:43] INFO   : [ WebUI3          ] [ REGENERATOR ] [ scheduler=scheduler-dev2 ] [ LOADING ] - commands ----------- : 219
[2022-01-26 13:01:43] INFO   : [ WebUI3          ] [ REGENERATOR ] [ scheduler=scheduler-dev2 ] [ LOADING ] - realms ------------- : 1
[2022-01-26 13:01:43] INFO   : [ WebUI3          ] [ REGENERATOR ] [ scheduler=scheduler-dev2 ] [ LOADING ] The configuration with shard_id=256 was fully load in 0.004s


Il y aura une série de log comme ca pour chaque Scheduler contactés par le Broker.

Temps de locks trop long entre la consommation des Broks et les requêtes de l'interface de Visualisation

Actuellement on ne sait pas consommer les broks et répondre aux requêtes de l'interface de Visualisation en même temps. On a donc une concurrence entre deux parties:

  • Récupération, consommation des broks depuis le broker et mise à

Actuellement on ne sait pas consommer les broks et répondre aux requêtes de l'interface de Visualisation en même temps. On a donc une concurrence entre deux parties:

  • Récupération, consommation des broks depuis le broker et mise à jour des hôtes/checks/clusters (et tous les autres objets) depuis les informations des broks
  • Réponses aux requêtes de l'interface de Visualisation ( parcours des hôtes, checks, clusters ... )


Un des principaux risques est une famine d'un des deux groupes d'actions:

  • Si on ne fait qu'avaler des broks et ne jamais répondre à l'interface, ceci va poser problème
  • Symétriquement, si on ne fait que répondre aux utilisateurs, et jamais avaler des broks, on va avoir des informations périmées, voir, on ne finira jamais de consommer de nouvelles configurations


Le gestionnaire de lock essaie de partager au mieux le temps d'exécution entre les deux groupes, en cas de forte charge, des logs vont remonter les lenteurs observées.


Quand on a trop de requêtes de lectures, et qu'elles ne rendent pas la main pendant plus de 30 sec aux broks, on aura un log suivant ( Brok BLOQUE par les requêtes ):un log suivant ( Brok BLOQUE par les requêtes ):

Code Block
themeEmacs
ERROR: [ ITEMS ACCESS ORDONNANCER ] [ LONG LOCK ] Broks management are waiting (1 thread) since 30s (> log error limit=30s) because HTTP requests (20 threads) has the LOCK


Quand on a trop de consommation de Broks, et que les requêtes sont bloquées ( Requêtes de l'interface BLOQUÉES par les Broks )

Code Block
themeEmacs
ERROR: [ ITEMS ACCESS ORDONNANCER ] [ LONG LOCK ] BroksHTTP managementrequests are waiting (15 threadthreads) since 30s (> log error limit=30s) because HTTPBroks requestsmanagement (201 threadsthread) has the LOCK


Quand

on a

les requêtes en lecture mettent trop de

consommation

temps à rendre la main au consommateur de Broks

,

et que

les requêtes sont bloquées ( Requêtes de l'interface BLOQUÉES par les Broks )

d'autres requêtes en lecture attendent de pouvoir s'exécuter depuis trop longtemps :

Code Block
themeEmacs
ERROR: [ ITEMS ACCESS ORDONNANCER ] [ LONG LOCK ] Still have 9 running tasks ongoing (HTTP requests). => ( 1 ) Broks management and then ( 11 )
Code Block
themeEmacs
ERROR: [ ITEMS ACCESS ORDONNANCER ] [ LONG LOCK ] HTTP requests are waiting (5 threads) since 30s (>= log error limit=30s) because Broks management (1 thread) has the LOCK:30s)


Quand la consommation de Broks met Quand les requêtes en lecture mettent trop de temps à rendre la main au consommateur de Broks pour la gestion de requêtes en lecture, et que d'autres requêtes en lecture consommateurs attendent de pouvoir s'exécuter depuis trop longtemps ( cas théorique, n'est pas supposé survenir en fonctionnement normal ) :

Code Block
themeEmacs
ERROR: [ ITEMS ACCESS ORDONNANCER ] [ LONG LOCK ] Still have 91 running tasks ongoing (HTTPBroks requestsmanagement). => ( 112 ) BroksHTTP management andrequests then ( 111 ) HTTPBroks requestsmanagement are waiting since 30s (>= log error limit:30s)


Gestion des broks

Information sur l'absorption des broks

Statistiques sur un traitement

Des broks ont été traités, affichage de statistiques :

Quand la consommation de Broks met trop de temps à rendre la main pour la gestion de requêtes en lecture, et que d'autres consommateurs attendent de s'exécuter depuis trop longtemps ( cas théorique, n'est pas supposé survenir en fonctionnement normal ) :
  • nombre de broks traités
  • temps d'attente du premier brok set
  • nombre de brok set en retard récupérés, et le temps que ça a pris de les récupérer
  • temps passé à désérialiser les broks
  • temps d'attente du lock avant de traiter les broks 
  • temps passé pour traiter les broks 
  • temps total


Code Block
themeEmacs
ERROR:[YYYY-MM-DD HH:MM:SS] INFO   : [ WebUI-name ] [ ITEMSMANAGE ACCESSBROKS ORDONNANCER] [PERF]  [ LONGXXXX LOCKbroks ] Still[ havewait 1and runningget tasksfirst ongoingset (Broks management). => ( 12 ) HTTP requests then ( 1 ) Broks management are waiting since 30s (>= log error limit:30s)

Gestion des broks

Information sur l'absorption des broks

Statistiques sur un traitement

on queue=X.XXXs ] [ get 0 late sets on=X.XXXs ] [ unserialize=X.XXXs ] [ wait write lock=X.XXXs ] [ manage broks=X.XXXs ] [ total=X.XXXs ]


Nature des broks traités

Affichage du type des broks traités : en quantité et en temps

Des broks ont été traités, affichage de statistiques :

  • nombre de broks traités
  • temps d'attente du premier brok set
  • nombre de brok set en retard récupérés, et le temps que ça a pris de les récupérer
  • temps passé à désérialiser les broks
  • temps d'attente du lock avant de traiter les broks 
  • temps passé pour traiter les broks 
  • temps total

    Code Block
    themeEmacs
    [YYYY-MM-DD HH:MM:SS] INFO   : [ WebUI-6         name ] [ MANAGE BROKS ] [PERF]   [  XXXX  broks  ]  [  wait  and get first set on queue=0.000s ] [ get 0 late sets on=0.000s ] [ unserialize=0.000s ] [ wait write lock=0.000s ] [ manage broks=0.000s ] [ total=0.000s ]

    Nature des broks traités

       => handled broks -> count by types : [brok_type_1=XXXX] [brok_type_2=XX] [...]


    Affichage du type des broks  à traités

    Code Block
    themeEmacs
    [YYYY-MM-DD HH:MM:SS] INFO   : [ WebUI-6         name ] [ MANAGE BROKS ] [PERF]                  => handled        =broks -> managetime broksby types : [brok_type_1=XXXX] [brok_type_2=XX] [...]


    Exemple de log


    Code Block
    themeEmacs
    [YYYY2022-MM01-DD26 HH13:MM01:SS43] INFO   : [ WebUI-6         ] [ MANAGE BROKS ] [ PERF ] => handled                => manage broksbroks -> count by types : [initial_command_status=1374] [initial_hostgroupcommand_status=657219] [serviceupdate_nextbroker_schedulestatus=26773] [update_program_status=211] [program_status=31] [hostinitial_checkcontact_resultstatus=5681] [clean_all_my_instance_id=3...] [initial_service_status=67969] [initial_contactgroup_status=24] [initial_timeperiod_status=15] [initial_broks_done=3] [initial_contact_status=1644] [initial_host_status=1960] [host_next_schedule=508] [log_monitoring=36] [update_service_status=2] [service_check_result=3271] [proxy_items_graph=3
    [2022-01-26 13:01:43] INFO : [ WebUI ] [ MANAGE BROKS ] [ PERF ] => handled broks -> time by types : [initial_command_status=0.022] [update_broker_status=0.000] [update_program_status=0.000] [program_status=0.001] [initial_contact_status=0.000] [...]


    L'absorption des broks a pris du retard

    En cas de forte charge sur le serveur ou lorsque des requêtes HTTP durent trop longtemps, le module peut prendre du retard sur la gestion des broks.

    L'algorithme d'absorption des broks peut être paramétré via les paramètres webui_broks_getter_XXX  du fichier de configuration du Module WebUI

    Le mode de rattrapage pour récupérer les broks en retard s'active

    Activation du rattrapage des broks en retard, on prend un brok set supplémentaire à traiter, on affiche :

    • le nombre de broks dans le brok set 
    • le temps passé pour récupérer le brok set sur la queue
    • le nombre actuel de broks à traiter
    • le nombre maximal de broks qu'on peut récupérer avant de les traiter
    • le nombre de brok set encore en attente

    Code Block
    themeEmacs
    [YYYY-MM-DD HH:MM:SS] INFO   : [ WebUI-6         name ] [ MANAGE BROKS ] [PERF] [LATE BROKS SETS]  Getting brok set with XX broks in 0X.000sXXXs [time for read queue size=0X.000sXXXs]. Total broks to process= XXX/max:XXXX. Broks sets in queue: X.


    Le mode rattrapage a suffisamment de broks à traiter 

    Rattrapage des broks en retard en cours, on a atteint/dépassé le nombre maximal de broks à récupérer, on les traite : 

    Code Block
    themeEmacs
    [YYYY-MM-DD HH:MM:SS] INFO   : [ WebUI-6         name ] [ MANAGE BROKS ] [PERF] [LATE BROKS SETS] Late brok taken => limit reach : XX / limit: XXXXXX.


    Après avoir traiter des broks, il en reste encore trop en attente

    Après avoir traité des broks, il reste trop de brok set en attente, on garde le lock et on continue l'absorption des broks en retard :

    Code Block
    themeEmacs
    [YYYY-MM-DD HH:MM:SS] INFO   : [ WebUI-6        name ] [ MANAGE BROKS ] [PERF] Broks sets in queue after manage broks is XX. We keep the lock and continue the brok managing.


    Demande des broks initiaux lors du redémarrage d'un module externe du Broker

    Lors du redémarrage d'un module externe du broker, une demande est envoyée par le Broker aux Schedulers pour récupérer de nouveaux broks initiaux ( une demande par Scheduler ).

    Code Block
    themeEmacs
    [YYYY-MM-DD HH:MM:SS] INFO   : [ broker-mastername ] [ GET BROKS        ] [ NEED DATA ] [ scheduler-name ] I ask for a initial broks generation to the scheduler with new daemon incarnation {u'shard_id': XXXX, u'configuration_incarnation_uuid': UUID} (old incarnation was {})


    log de performance de la liste

    Note ce Ce log s'affichera si l'appel à la liste prend plus de 1s :

    Code Block
    themeEmacs
    [YYYY-MM-DD HH:MM:SS] WARNING : [ WebUI           -name ]  [ CP Server Thread-74    ] [ user= 30067cfe5adf11e59a28080027f08538user-uuid ] [ get_data_visualisation_list ] [ PERF ] [ 1X.007sXXXs ] elements:[ in broker= 54XX filtered= 54XX total= 54XX in page= 54XX ] page:[ 1 / 1 ] filter:[  ] sort:[  ]


    Les logs des sous-modules

    Les logs du module MongoDB

    Erreurs

    Si le module MongoDB n'arrive pas à se connecter à la base mongo définit dans son fichier cfg :

    Code Block
    themeEmacs
    [YYYY-MM-DD HH:MM:SS] ERROR  : [ WebUI           -name ] Mongodb Module: Error : [ WebUI            -name ] [ MONGODB          ]   - mongo connection failure to 192.168.1.87:27017


    Les logs du module SLA

    Initialisation du module SLA - CHAPITRE [ INITIALISATION ]

    Création du module


    Code Block
    themeEmacs
    [YYYY-MM-DD HH:MM:SS] INFO   : [ WebUI          -name ] [ sla              ] [ INITIALISATION ] =============          Starting module initialisation     ==============
    [YYYY-MM-DD HH:MM:SS] INFO   : [ WebUI           -name ] [ sla              ] [ INITIALISATION ] Reading configuration for sla archive building
    [YYYY-MM-DD HH:MM:SS] INFO   : [ WebUI           -name ] [ sla              ] [ INITIALISATION ]    - time_before_shinken_inactive ----------------------------------:〖 30 〗
    [YYYY-MM-DD HH:MM:SS] INFO   : [ WebUI           -name ] [ sla              ] [ INITIALISATION ]    - minimal_time_before_an_element_become_missing_data ------------:〖 0 〗
    [YYYY-MM-DD HH:MM:SS] INFO   : [ WebUI          -name ] [ sla              ] [ INITIALISATION ]    - minimal_time_before_an_element_become_missing_data_at_startup -:〖 0 〗
    [YYYY-MM-DD HH:MM:SS] INFO   : [ WebUI        : [ WebUI-name ] [ sla              ] [ INITIALISATION ] Reading module configuration
    


    Paramètre de connexion à la base mongo


    Code Block
    themeEmacs
    [YYYY-MM-DD HH:MM:SS] INFO   : [ WebUI           -name ] [ sla              ] [ INITIALISATION ] [ MONGO ] Creating connection to sla database [shinken]
    [YYYY-MM-DD HH:MM:SS] INFO   : [ WebUI           -name ] [ sla              ] [ INITIALISATION ] [ MONGO ] Parameter load for database connection
    [YYYY-MM-DD HH:MM:SS] INFO   : [ WebUI           -name ] [ sla              ] [ INITIALISATION ] [ MONGO ]    - database ------------------------- :〖 shinken 〗
    [YYYY-MM-DD HH:MM:SS] INFO   : [ WebUI          -name ] [ sla              ] [ INITIALISATION ] [ MONGO ]    - uri ------------------------------ :〖 mongodb://localhost/?w=1&fsync=false 〗
    [YYYY-MM-DD HH:MM:SS] INFO   : [ WebUI           -name ] [ sla              ] [ INITIALISATION ] [ MONGO ]    - replica_set ---------------------- :〖 〗
    [YYYY-MM-DD HH:MM:SS] INFO   : [ WebUI           -name ] [ sla              ] [ INITIALISATION ] [ MONGO ]    - use_ssh_tunnel ------------------- :〖 False 〗
    [YYYY-MM-DD HH:MM:SS] INFO   : [ WebUI           -name ] [ sla              ] [ INITIALISATION ] [ MONGO ]    - ssh_keyfile ---------------------- :〖 ~shinken/.ssh/id_rsa 〗
    [YYYY-MM-DD HH:MM:SS] INFO   : [ WebUI          -name ] [ sla              ] [ INITIALISATION ] [ MONGO ]    - ssh_user ------------------------- :〖 root 〗
    [YYYY-MM-DD HH:MM:SS] INFO   : [ WebUI     INFO   : [  WebUI-name ] [ sla              ] [ INITIALISATION ] [ MONGO ]    - ssh_tunnel_timeout --------------- :〖 2 〗
    [YYYY-MM-DD HH:MM:SS] INFO   : [ WebUI           -name ] [ sla              ] [ INITIALISATION ] [ MONGO ]    - use_ssh_retry_failure ------------ :〖 1 〗
    [YYYY-MM-DD HH:MM:SS] INFO   : [ WebUI           -name ] [ sla              ] [ INITIALISATION ] [ MONGO ]    - auto_reconnect_max_try ----------- :〖 3 〗
    [YYYY-MM-DD HH:MM:SS] INFO   : [ WebUI          -name ] [ sla              ] [ INITIALISATION ] [ MONGO ]    - auto_reconnect_sleep_between_try - :〖 3 〗
    [YYYY-MM-DD HH:MM:SS] INFO   : [ WebUI           -name ] [ sla              ] [ INITIALISATION ] [ MONGO ] Try to open a Mongodb connection to mongodb://localhost/?w=1&fsync=false:shinken
    [YYYY-MM-DD HH:MM:SS] INFO   : [ WebUI           -name ] [ sla              ] [ INITIALISATION ] [ MONGO ] Mongo connection established in 2.59ms
    [YYYY-MM-DD HH:MM:SS] INFO   : [ WebUI           -name ] [ sla              ] [ INITIALISATION ] [ MONGO ] Ensure mongo index done in 2.15ms


    Fin de l'initialisation du module


    Code Block
    themeEmacs
    [YYYY-MM-DD HH:MM:SS] INFO   : [ WebUI           -name ] [ sla              ] [ INITIALISATION ] Load from collection 28 elements info in cache done in 0.65ms
    [YYYY-MM-DD HH:MM:SS] INFO   : [ WebUI          -name ] [ sla              ] [ INITIALISATION ] =============           Module initialized in 16.38ms     ==============
    [YYYY-MM-DD HH:MM:SS] INFO   : [ WebUI          -name ] [ sla              ] [ INITIALISATION ] Found first element monitoring at 03-08-2020 10:16:38


    Erreurs - La connexion au serveur Mongo n'est pas établie
    Avec Tunnel SSH


    Code Block
    themeEmacs
    [YYYY-MM-DD HH:MM:SS] ERROR : [ WebUI           -name ] [ sla              ] [ INITIALISATION ] Initialisation Module: Error : [ WebUI   -sla ] [ SSH TUNNEL ] [ MONGODB          ]  - mongo connection failure : localhost:43577 ==(ssh tunnel)==> 192.168.1.87:22 ==(mongodb)==> 192.168.1.87:27017.


    Sans Tunnel SSH


    Code Block
    themeEmacs
    [YYYY-MM-DD HH:MM:SS] ERROR : [ WebUI           -name ] [ sla              ] [ INITIALISATION ] Initialisation Module: Error : [ WebUI   -sla ] [ MONGODB          ]   - mongo connection failure to 192.168.1.87:27017


    Les logs du module event-manager-reader

    Erreurs

    Dans le cas où un utilisateur demande une requête trop grande aux évents ( en tapant un filtre trop large dans le nom, matchant plus de 50000 hosts/checks/clusters ), alors la WebUI va générer un log de WARNING alertant que la recherche est trop large, et que MongoDB risque de refuser la requête si elle est effectuée avec des uuids. Elle sera donc faite avec des regexp côté base de données, ce qui est très lent.

    Code Block
    themeEmacs
    [YYYY-MM-DD HH:MM:SS] WARNING: [ WebUI-name ] [ event_container ] [ FAST-SEARCH ] [user=admin] [filter=type:check^^host~host_name:BiBi] The filter match too much uuids to query mongodb (101 > 100000) we must fallback to the slower regexp based query.


    log de performance du conteneur d'événements

    Note

    • ce log s'affichera si l'appel à la liste prend plus de 1s :
    • ces logs sont désactivés par défaut voir la page : Activation/Désactivation des parties de log pour les activer.

    Code Block
    themeEmacs
    [2021YYYY-04MM-08DD 13HH:34MM:47SS] WARNING: [ WebUI          -name ] [ event-manager-reader ] [ user=30067cfe5adf11e59a28080027f08538 user-id] [ get_events ] [ PERF ] [ 31XX.064sXXXs ] 100 events returned with filter:[{"filter0":"type:host","filter1":"event_since:latest|3600~type:check~realm:All"}]


    Les logs du module SLA

    Création du sous-module


    Code Block
    themeEmacs
    [2021YYYY-04MM-13DD 15HH:50MM:24SS] INFO   : [ WebUI           -name ] [ sla              ] [ INITIALISATION ] =============          Starting module initialisation     ==============
    [2021YYYY-04MM-13DD 15HH:50MM:24SS] INFO   : [ WebUI          -name ] [ sla              ] [ INITIALISATION ] Reading configuration for sla archive building
    [2021YYYY-04MM-13DD 15HH:50MM:24SS] INFO   : [ WebUI           -name ] [ sla              ] [ INITIALISATION ]    - time_before_shinken_inactive ----------------------------------:〖 30 〗
    [2021YYYY-04MM-13DD 15HH:50MM:24SS] INFO   : [ WebUI           -name ] [ sla              ] [ INITIALISATION ]    - minimal_time_before_an_element_become_missing_data ------------:〖 0 〗
    [2021YYYY-04MM-13DD 15HH:50MM:24SS] INFO   : [ WebUI           -name ] [ sla              ] [ INITIALISATION ]    - minimal_time_before_an_element_become_missing_data_at_startup -:〖 0 〗
    [2021YYYY-04MM-13DD 15HH:50MM:24SS] INFO   : [ WebUI           -name ] [ sla              ] [ INITIALISATION ] Reading module configuration


    Paramètre de connexion à la base mongo


    Code Block
    themeEmacs
    [2021-04-13 15:50:24] INFO   : [ WebUI          -name ] [ sla              ] [ INITIALISATION ] [ MONGO ] Creating connection to sla database [shinken]
    [2021-04-13 15:50:24] INFO   : [ WebUI           [ WebUI-name ] [ sla              ] [ INITIALISATION ] [ MONGO ] Parameter load for database connection
    [2021-04-13 15:50:24] INFO   : [ WebUI           -name ] [ sla              ] [ INITIALISATION ] [ MONGO ]    - database ------------------------- :〖 shinken 〗
    [2021-04-13 15:50:24] INFO   : [ WebUI           -name ] [ sla              ] [ INITIALISATION ] [ MONGO ]    - uri ------------------------------ :〖 mongodb://localhost/?w=1&fsync=false 〗
    [2021-04-13 15:50:24] INFO   : [ WebUI           -name ] [ sla              ] [ INITIALISATION ] [ MONGO ]    - replica_set ---------------------- :〖 〗
    [2021-04-13 15:50:24] INFO   : [ WebUI          -name ] [ sla              ] [ INITIALISATION ] [ MONGO ]    - use_ssh_tunnel ------------------- :〖 False 〗
    [2021-04-13 15:50:24] INFO   : [ WebUI          -name ] [ sla              ] [ INITIALISATION ] [ MONGO ]    - ssh_keyfile ---------------------- :〖 ~shinken/.ssh/id_rsa 〗
    [2021-04-13 15:50:24] INFO   : [ WebUI           -name ] [ sla              ] [ INITIALISATION ] [ MONGO ]    - ssh_user ------------------------- :〖 root 〗
    [2021-04-13 15:50:24] INFO   : [ WebUI           -name ] [ sla              ] [ INITIALISATION ] [ MONGO ]    - ssh_tunnel_timeout --------------- :〖 2 〗
    [2021-04-13 15:50:24] INFO   : [ WebUI          -name ] [ sla              ] [ INITIALISATION ] [ MONGO ]    - use_ssh_retry_failure ------------ :〖 1 〗
    [2021-04-13 15:50:24] INFO   : [ WebUI      INFO   : [ WebUI-name ] [ sla              ] [ INITIALISATION ] [ MONGO ]    - auto_reconnect_max_try ----------- :〖 3 〗
    [2021-04-13 15:50:24] INFO   : [ WebUI           -name ] [ sla              ] [ INITIALISATION ] [ MONGO ]    - auto_reconnect_sleep_between_try - :〖 3 〗
    [2021-04-13 15:50:24] INFO   : [ WebUI           -name ] [ sla              ] [ INITIALISATION ] [ MONGO ] Try to open a Mongodb connection to mongodb://localhost/?w=1&fsync=false:shinken
    [2021-04-13 15:50:24] INFO   : [ WebUI           -name ] [ sla              ] [ INITIALISATION ] [ MONGO ] Mongo connection established in 4.09ms
    [2021-04-13 15:50:24] INFO   : [ WebUI           -name ] [ sla              ] [ INITIALISATION ] [ MONGO ] Ensure mongo index done in 3.35ms
    [2021-04-13 15:50:24] INFO   : [ WebUI           -name ] [ sla              ] [ INITIALISATION ] Load from collection 28 elements info in cache done in 0.85ms


    Fin de l'initialisation du module


    Code Block
    themeEmacs
    [2021YYYY-04MM-13DD 15HH:50MM:24SS] INFO   : [ WebUI           -name ] [ sla              ] [ INITIALISATION ] =============           Module initialized in 24.19ms     ==============
    [2021YYYY-04MM-13DD 15HH:50MM:24SS] INFO   : [ WebUI          -name ] [ sla              ] [ INITIALISATION ] Found first element monitoring at 17-06-2020 10:42:52