| Scroll Ignore | ||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ||||||||||||||
|
Les logs propres au module
Erreurs lors du lancement du module WebUI
Le port de la WebUI est déjà ouvert
Si une autre WebUI utilise déjà le port ( sûrement un problème de configuration ), alors on aura les WARNING suivants:
| Code Block | ||
|---|---|---|
| ||
[YYYY-MM-DD HH:MM:SS] WARNING: [ WebUI2WebUI-name ] [TRY 1/10] The webui named [WebUI2 WebUI-name ] can not start because the address 0.0.0.0:7767 is already in use [YYYY-MM-DD HH:MM:SS] WARNING: [ WebUI2WebUI-name ] [TRY 2/10] The webui named [WebUI2 WebUI-name ] can not start because the address 0.0.0.0:7767 is already in use [YYYY-MM-DD HH:MM:SS] WARNING: [ WebUI2WebUI-name ] [TRY 3/10] The webui named [WebUI2 WebUI-name ] can not start because the address 0.0.0.0:7767 is already in use [YYYY-MM-DD HH:MM:SS] WARNING: [ WebUI2WebUI-name ] [TRY 4/10] The webui named [WebUI2 WebUI-name ] can not start because the address 0.0.0.0:7767 is already in use [YYYY-MM-DD HH:MM:SS] WARNING: [ WebUI2WebUI-name ] [TRY 5/10] The webui named [WebUI2 WebUI-name ] can not start because the address 0.0.0.0:7767 is already in use [YYYY-MM-DD HH:MM:SS] WARNING: [ WebUI2WebUI-name ] [TRY 6/10] The webui named [WebUI2 WebUI-name ] can not start because the address 0.0.0.0:7767 is already in use [YYYY-MM-DD HH:MM:SS] WARNING: [ WebUI2WebUI-name ] [TRY 7/10] The webui named [WebUI2 WebUI-name ] can not start because the address 0.0.0.0:7767 is already in use [YYYY-MM-DD HH:MM:SS] WARNING: [ WebUI2WebUI-name ] [TRY 8/10] The webui named [WebUI2 WebUI-name ] can not start because the address 0.0.0.0:7767 is already in use [YYYY-MM-DD HH:MM:SS] WARNING: [ WebUI2WebUI-name ] [TRY 9/10] The webui named [WebUI2 WebUI-name ] can not start because the address 0.0.0.0:7767 is already in use |
Puis lors du dernier essai une ERROR (le module s'arrête):
| Code Block | ||
|---|---|---|
| ||
[YYYY-MM-DD HH:MM:SS] ERROR : [ WebUI2WebUI-name ] [ CRASH - INSIDE MODULE PROCESS ] [TRY 10/10] The webui named [WebUI2 WebUI-name ] can not start because the address 0.0.0.0:7767 is already in use |
Enfin l'erreur sera rapportée par le Broker qui va s'assurer que le module est éteint, et tenter de le relancer plus tard:
| Code Block | ||
|---|---|---|
| ||
[YYYY-MM-DD HH:MM:SS] ERROR : [ broker-mastername ] [ MODULES-MANAGER ] [ MODULE-INSTANCE-CRASH ] [ WebUI2WebUI-name ] [ module_type=webui ] The module WebUI2 just stopped. Last ERROR received: [YYYY-MM-DD HH:MM:SS] ERROR : [ broker-mastername ] [ MODULES-MANAGER ] [ MODULE-INSTANCE-CRASH ] [ WebUI2WebUI-name ] [ module_type=webui ] [TRY 10/10] The webui named [WebUI2] WebUI-name ] can not start because the address 0.0.0.0:7767 is already in use |
Erreurs issues d'un problème de changement dans le code de l'interface de visualisation
Si le fichier index.html est cassé chez un client, ou qu'un développeur a changé ce fichier sans faire attention, on aura des erreurs spécifiques.
Si le fichier index.html est manquant:
| Code Block | ||
|---|---|---|
| ||
[YYYY-MM-DD HH:MM:SS] ERROR : [ WebUI2WebUI-name ] [ CRASH - INSIDE MODULE PROCESS ] The file /var/lib/shinken/modules/webui/htdocs/ui/index.html is missing: there is a critical error with your installation. Please open a ticket to your support. |
Si le fichier index.html n'a pas les bons droits (l'utilisateur shinken ne peux pas l'ouvrir):
| Code Block | ||
|---|---|---|
| ||
[YYYY-MM-DD HH:MM:SS] ERROR : [ WebUI2WebUI-name ] [ CRASH - INSIDE MODULE PROCESS ] Cannot open the file /var/lib/shinken/modules/webui/htdocs/ui/index.html with the error "ERROR": there is a critical error with your installation. Please open a ticket to your support. |
Si le fichier index.html n'a pas la bonne variable de langue
| Code Block | ||
|---|---|---|
| ||
[YYYY-MM-DD HH:MM:SS] ERROR : [ WebUI2WebUI-name ] [ CRASH - INSIDE MODULE PROCESS ] The __shinken_lang__ variable was not found in the file /var/lib/shinken/modules/webui/htdocs/ui/index.html: there is a critical error with your installation. Please open a ticket to your support. |
Erreurs de paramétrage
Si certains paramètres sont mal définis, la WebUI ne peut pas démarrer et va s'arrêter sur une erreur critique, qui sera affichée dans le check du Broker ainsi que dans le healthcheck.
Si son paramètre "lang" n'est pas dans la liste autorisé ( fr, en ), on aura l'erreur suivante:
| Code Block | ||
|---|---|---|
| ||
[YYYY-MM-DD HH:MM:SS] ERROR : [ WebUI-name ] [ CRASH - INSIDE MODULE PROCESS ] For the parameter "lang" the value "XXX" is not allowed. Values can be : "fr, en" |
La configuration des Graphite backends
Port du Graphite backend invalide
L'adresse d'un graphite_backends contient un port non correct et est remplacé par le port par défaut ( 80 ) :
| Code Block | ||
|---|---|---|
| ||
[YYYY-MM-DD HH:MM:SS] WARNING: [ WEBUI_NAMEWebUI-name ] [ CONFIGURATION ] The Graphite backend [ BACKEND ] is incorrect : The port [ INVALID_PORT ] is not valid. Valid values are integers from 0 to 65535. |
Adresse du Graphite backend vide
Lorsqu'il n'y a pas d'adresse fournie dans un Graphite backend ( exemple : France::8080 ), son adresse est remplacée par une adresse par défaut ( 0.0.0.0 ) :
| Code Block | ||
|---|---|---|
| ||
[YYYY-MM-DD HH:MM:SS] WARNING: [ WEBUI_NAMEWebUI-name ] [ CONFIGURATION ] The Graphite backend [ BACKEND ] is incorrect : The hostname or IP address is empty or not found. |
Backend mal formé
Lorsqu'un backend est mal formé, par exemple si il n'a pas de royaume et de port renseigné, un message est remonté au démarrage de la WebUI.
Exemple de graphite_backends erroné :
| Code Block | ||
|---|---|---|
| ||
graphite_backends 192.168.1.23 |
| Code Block | ||
|---|---|---|
| ||
[YYYY-MM-DD HH:MM:SS] ERROR : [ WEBUI_NAMEWebUI-name ] [ CONFIGURATION ] The Graphite backend [ BACKEND ] is not well formatted. It needs at least a realm and a host : <REALM>:<HOSTNAME> |
Rappel de format attendu : <REALM>:<ADDRESS>:<PORT>
Exemple : France:192.168.1.23:8080
Protocole du Backend invalide
Si dans la définition du Backend, le protocole fourni n'est pas valide, un log au démarrage nous en averti.
Exemple de graphite_backends erroné :
| Code Block | ||
|---|---|---|
| ||
graphite_backends France:htt://192.168.1.23:8080 |
| Code Block | ||
|---|---|---|
| ||
[YYYY-MM-DD HH:MM:SS] ERROR : [ WEBUI_NAMEWebUI-name ] [ CONFIGURATION ] The Graphite backend [ BACKEND ] is incorrect : The [ PROTOCOL ] protocol is unknown. |
Création des index en base de données au démarrage
Au démarrage du module, les index permettant d'assurer de bonnes performances pour les requêtes à la base de données sont créés s'ils n'existent pas.
Le temps pris pour la mise en place de chaque index est également détaillé.
| Code Block | ||
|---|---|---|
| ||
[YYYY-MM-DD HH:MM:DD] INFO : [ WebUI -name ] [ Index ] Need to ensure indexes are present in Mongodb ( 2 indexes ) [YYYY-MM-DD HH:MM:DD] INFO : [ WebUI -name ] [ Index ] 1 - COLLECTION_NAME1::FIELD2 ( INDEX_NAME ) was created/checked in X.XXXXs [YYYY-MM-DD HH:MM:DD] INFO : [ WebUI -name ] [ Index ] 2 - COLLECTION_NAME2::FIELD1,FIELD2 ( INDEX_NAME ) was created/checked in X.XXXXs [YYYY-MM-DD HH:MM:DD] INFO : [ WebUI -name ] [ Index ] All Mongodb indexes were created/checked in X.XXXs |
| Code Block | ||||
|---|---|---|---|---|
| ||||
[2021-11-25 16:38:47] INFO : [ WebUI ] [ Index ] Need to ensure indexes are present in Mongodb ( 1 indexes ) [2021-11-25 16:38:47] INFO : [ WebUI ] [ Index ] 1 - dashboard::uuid ( uuid_1 ) was created/checked in 0.0005s [2021-11-25 16:38:47] INFO : [ WebUI ] [ Index ] All Mongodb indexes were created/checked in 0.0005s |
Cas d'erreur
Si une erreur survient lors de la tentative d'indexation, le module essaiera à nouveau lors de son prochain démarrage, et le log suivant est généré
| Code Block | ||
|---|---|---|
| ||
[YYYY-MM-DD HH:MM:SS] WARNING: [ WebUI -name] Mongodb ERREUR PYTHON [YYYY-MM-DD HH:MM:SS] WARNING: [ WebUI-name] Mongodb index building could not ] Mongodb index building could not be be done, will retry at next restart |
| Code Block | ||||
|---|---|---|---|---|
| ||||
[2021-10-21 17:05:52] WARNING: [ WebUI ] Mongodb ERROR stack : Traceback (most recent call last): [2021-10-21 17:05:52] WARNING: [ WebUI ] Mongodb File "/var/lib/shinken/modules/webui/module.py", line 379, in main [2021-10-21 17:05:52] WARNING: [ WebUI ] Mongodb raise IOError [2021-10-21 17:05:52] WARNING: [ WebUI ] Mongodb IOError [2021-10-21 17:05:52] WARNING: [ WebUI ] Mongodb index building could not be done, will retry at next restart |
Chargement des broks initiaux par un regenerator ( créateur d'objets des modules de broker ) et vérifier que c'est bien la même configuration charger entre les regenerators / Scheduler / Arbiter
Les logs suivants permettent de suivre le chargement de la configuration de supervision entre l'Arbiter , les Schedulers jusqu'aux interfaces : webui / livestatus / livedata
Il existe 2 types d'identifiants de configuration (représentation de la configuration)
- configuration_uuid: uuid de configuration totale générée par l'Arbiter
- configuration_partshard_id: id de la partie de configuration géré par un Scheduler
Quand un module de broker avec un regenerator charge une nouvelle configuration :
| Code Block |
|---|
[2020-05-15 16:29:49] INFO : [WebUI3] [ CONFIGURATION ] [ NEW ] [ REGENERATOR ] configuration part retrieved: [ configuration_part_id= configuration_part_id, scheduler=scheduler_name configuration_uuid=configuration_uuid, arbiter=arbiter_name date=creation_date ]
| ||
[ YYYY-MM-DD HH:MM:SS ] INFO : [ WebUI-name ] [ REGENERATOR ] [ scheduler=scheduler_name ] Creating new configuration for [shard_id= shard_id , scheduler= scheduler_name , configuration_uuid= configuration_uuid , arbiter= arbiter_name , architecture= architecture_name , date= creation_date , active= active ] |
- shard_configuration_part_id: id de la partie de configuration gérée par le Scheduler (unique par Scheduler)
- scheduler_name: nom du Scheduler qui gère cette partie de la configuration
- configuration_uuid: uuid créée crée lors du démarrage de l'Arbiter qui correspond donc à l'id de la configuration gérée par l'Arbiter
- creation_date: date du démarrage de l'Arbiter
- arbiter_name: nom de l'Arbiter qui a créé cette configuration
- architecture_name: nom de l'architecture, unique par installation de Shinken
- active: Est a False si le Scheduler est pas actif (en attente d'une configuration)
| Code Block | ||||
|---|---|---|---|---|
| ||||
[YYYY2022-MM01-DD26 HH13:MM01:SS43] INFO : [WebUI3] [ CONFIGURATION WebUI3 ] [ NEWREGENERATOR ] [ REGENERATORscheduler=scheduler-dev2 ] configurationCreating partnew retrievedconfiguration :for [ configuration_partshard_id=8256, scheduler=scheduler-masterdev2, configuration_uuid=fe5982b29bfb48cdadb35523799f7ceca549db11b51d4aeb8548b43b088112e9, arbiter=arbiter-master1 dev2, architecture=Shinken-dev2, date=1526-0501-20202022 1613:1300:4028, active=True] |
Quand un module de broker avec un regenerator rejette une configuration :
Dans le cas où la configuration d'un Scheduler est déjà gérée par un regenerator ( cas qui arrive si par exemple un module crash ) , on redemande les broks initiaux. Tous les modules vont recevoir la nouvelle configuration, mais ceux qui la gère déjà, ne vont pas la recharger et vont loguer :
| Code Block | ||
|---|---|---|
| ||
[YYYY-MM-DD HH:MM:SS] INFO INFO : [WebUI3WebUI-name] [ CONFIGURATION ] [ NEW ] [ REGENERATOR ] No need to reload the configuration part because I already handle it [ configuration_partshard_id=configuration_partshard_id, scheduler=scheduler_name, configuration_uuid=configuration_uuid, arbiter=arbiter_name, architecture=architecture_name, date=creation_date, active=active] |
- configuration_partshard_id: id de la partie de configuration gérée par le Scheduler (unique par Scheduler)
- scheduler_name: nom nom du Scheduler qui gère cette partie de la configuration
- configuration_uuid: uuid créée crée lors du démarrage de l'Arbiter qui correspond donc à l'id de la configuration gérée par l'Arbiter
- creation_date: date du démarrage de l'Arbiter
- arbiter_name: nom de l'Arbiter qui a créé cette configuration
- architecture_name: nom de l'architecture, unique par installation de Shinken
- active: Est a False si le Scheduler est pas actif (en attente d'une configuration)
| Code Block | ||||
|---|---|---|---|---|
| ||||
[YYYY-MM-DD HH:MM:SS] WARNING: [WebUI3] [ CONFIGURATION ] [ NEW ] [ REGENERATOR ] No need to reload the configuration part because I already handle it [ configuration_partshard_id=8256, scheduler=scheduler-masterdev2, configuration_uuid=fe5982b29bfb48cdadb35523799f7ceca549db11b51d4aeb8548b43b088112e9, arbiter=arbiter-master1-dev2, architecture=Shinken-dev2, date=1526-0501-20202022 1613:1300:4028, active=True] |
Temps de locks trop long entre la consommation des Broks et les requêtes de l'interface de Visualisation
Quand un module de broker avec un regenerator fini de charger une configuration :
Quand un Scheduler a fini d'envoyer une configuration, le regenerator charge cette configuration les log suivant montre les étapes de ce chargement.
Le début du chargement est montré par le log suivant :
| Code Block | ||||
|---|---|---|---|---|
| ||||
[YYYY-MM-DD HH:MM:SS] INFO : [ WebUI3 ] [ REGENERATOR ] [ scheduler=scheduler-dev2 ] [ LOADING ] Loading configuration part : [shard_id=256, scheduler=scheduler-dev2, configuration_uuid=a549db11b51d4aeb8548b43b088112e9, arbiter=arbiter-dev2, architecture=Shinken-dev2, date=26-01-2022 13:00:28, active=True] |
Les différentes étapes avec les logs suivants :
| Code Block | ||||
|---|---|---|---|---|
| ||||
[2022-01-26 13:01:43] INFO : [ WebUI3 ] [ REGENERATOR ] [ scheduler=scheduler-dev2 ] [ LOADING ] [ PERF ] Merging incoming hostgroup with already existing ones --------------------- : 0.00
[2022-01-26 13:01:43] INFO : [ WebUI3 ] [ REGENERATOR ] [ scheduler=scheduler-dev2 ] [ LOADING ] [ PERF ] Linking hosts => hostgroups / command / timeperiod / contacts ------------- : 0.00
[2022-01-26 13:01:43] INFO : [ WebUI3 ] [ REGENERATOR ] [ scheduler=scheduler-dev2 ] [ LOADING ] [ PERF ] Merging incoming service groups with already existing ones ---------------- : 0.00
[2022-01-26 13:01:43] INFO : [ WebUI3 ] [ REGENERATOR ] [ scheduler=scheduler-dev2 ] [ LOADING ] [ PERF ] Linking services => host / servicegroups / command / timeperiod / contact - : 0.00
[2022-01-26 13:01:43] INFO : [ WebUI3 ] [ REGENERATOR ] [ scheduler=scheduler-dev2 ] [ LOADING ] [ PERF ] Linking service groups => services ---------------------------------------- : 0.00
[2022-01-26 13:01:43] INFO : [ WebUI3 ] [ REGENERATOR ] [ scheduler=scheduler-dev2 ] [ LOADING ] [ PERF ] Linking hostgroups => hosts ----------------------------------------------- : 0.00
[2022-01-26 13:01:43] INFO : [ WebUI3 ] [ REGENERATOR ] [ scheduler=scheduler-dev2 ] [ LOADING ] [ PERF ] Build realm list ---------------------------------------------------------- : 0.00
[2022-01-26 13:01:43] INFO : [ WebUI3 ] [ REGENERATOR ] [ scheduler=scheduler-dev2 ] [ LOADING ] [ PERF ] Linking host => host & check dependencies ( parents / childs ) ------------ : 0.00
[2022-01-26 13:01:43] INFO : [ WebUI3 ] [ REGENERATOR ] [ scheduler=scheduler-dev2 ] [ LOADING ] [ PERF ] Linking checks => host & check dependencies ( parents / childs ) ---------- : 0.00
[2022-01-26 13:01:43] INFO : [ WebUI3 ] [ REGENERATOR ] [ scheduler=scheduler-dev2 ] [ LOADING ] [ PERF ] Linking timeperiod => excluded timeperiod --------------------------------- : 0.00
[2022-01-26 13:01:43] INFO : [ WebUI3 ] [ REGENERATOR ] [ scheduler=scheduler-dev2 ] [ LOADING ] [ PERF ] Merging incoming contactgroups with already existing ones ----------------- : 0.00
[2022-01-26 13:01:43] INFO : [ WebUI3 ] [ REGENERATOR ] [ scheduler=scheduler-dev2 ] [ LOADING ] [ PERF ] Linking contactgroups => contacts ----------------------------------------- : 0.00 |
Puis lors que le chargement est fini l'on donne la taille de la configuration total chargé dans le regenerator et le temps pris pour ce chargement.
| Code Block | ||||
|---|---|---|---|---|
| ||||
[2022-01-26 13:01:43] INFO : [ WebUI3 ] [ REGENERATOR ] [ scheduler=scheduler-dev2 ] [ LOADING ] Configuration size
[2022-01-26 13:01:43] INFO : [ WebUI3 ] [ REGENERATOR ] [ scheduler=scheduler-dev2 ] [ LOADING ] - hosts -------------- : 1
[2022-01-26 13:01:43] INFO : [ WebUI3 ] [ REGENERATOR ] [ scheduler=scheduler-dev2 ] [ LOADING ] - checks ------------- : 27
[2022-01-26 13:01:43] INFO : [ WebUI3 ] [ REGENERATOR ] [ scheduler=scheduler-dev2 ] [ LOADING ] - contacts ----------- : 1
[2022-01-26 13:01:43] INFO : [ WebUI3 ] [ REGENERATOR ] [ scheduler=scheduler-dev2 ] [ LOADING ] - notificationways --- : 1
[2022-01-26 13:01:43] INFO : [ WebUI3 ] [ REGENERATOR ] [ scheduler=scheduler-dev2 ] [ LOADING ] - hostgroups --------- : 0
[2022-01-26 13:01:43] INFO : [ WebUI3 ] [ REGENERATOR ] [ scheduler=scheduler-dev2 ] [ LOADING ] - servicegroups ------ : 0
[2022-01-26 13:01:43] INFO : [ WebUI3 ] [ REGENERATOR ] [ scheduler=scheduler-dev2 ] [ LOADING ] - contactgroups ------ : 1
[2022-01-26 13:01:43] INFO : [ WebUI3 ] [ REGENERATOR ] [ scheduler=scheduler-dev2 ] [ LOADING ] - timeperiods -------- : 1
[2022-01-26 13:01:43] INFO : [ WebUI3 ] [ REGENERATOR ] [ scheduler=scheduler-dev2 ] [ LOADING ] - commands ----------- : 219
[2022-01-26 13:01:43] INFO : [ WebUI3 ] [ REGENERATOR ] [ scheduler=scheduler-dev2 ] [ LOADING ] - realms ------------- : 1
[2022-01-26 13:01:43] INFO : [ WebUI3 ] [ REGENERATOR ] [ scheduler=scheduler-dev2 ] [ LOADING ] The configuration with shard_id=256 was fully load in 0.004s |
Il y aura une série de log comme ca pour chaque Scheduler contactés par le Broker.
Temps de locks trop long entre la consommation des Broks et les requêtes de l'interface de Visualisation
Actuellement on ne sait pas consommer les broks et répondre aux requêtes de l'interface de Visualisation en même temps. On a donc une concurrence entre deux parties:
- Récupération, consommation des broks depuis le broker et mise à
Actuellement on ne sait pas consommer les broks et répondre aux requêtes de l'interface de Visualisation en même temps. On a donc une concurrence entre deux parties:
- Récupération, consommation des broks depuis le broker et mise à jour des hôtes/checks/clusters (et tous les autres objets) depuis les informations des broks
- Réponses aux requêtes de l'interface de Visualisation ( parcours des hôtes, checks, clusters ... )
Un des principaux risques est une famine d'un des deux groupes d'actions:
- Si on ne fait qu'avaler des broks et ne jamais répondre à l'interface, ceci va poser problème
- Symétriquement, si on ne fait que répondre aux utilisateurs, et jamais avaler des broks, on va avoir des informations périmées, voir, on ne finira jamais de consommer de nouvelles configurations
Le gestionnaire de lock essaie de partager au mieux le temps d'exécution entre les deux groupes, en cas de forte charge, des logs vont remonter les lenteurs observées.
Quand on a trop de requêtes de lectures, et qu'elles ne rendent pas la main pendant plus de 30 sec aux broks, on aura un log suivant ( Brok BLOQUE par les requêtes ):un log suivant ( Brok BLOQUE par les requêtes ):
| Code Block | ||
|---|---|---|
| ||
ERROR: [ ITEMS ACCESS ORDONNANCER ] [ LONG LOCK ] Broks management are waiting (1 thread) since 30s (> log error limit=30s) because HTTP requests (20 threads) has the LOCK |
Quand on a trop de consommation de Broks, et que les requêtes sont bloquées ( Requêtes de l'interface BLOQUÉES par les Broks )
| Code Block | ||
|---|---|---|
| ||
ERROR: [ ITEMS ACCESS ORDONNANCER ] [ LONG LOCK ] BroksHTTP managementrequests are waiting (15 threadthreads) since 30s (> log error limit=30s) because HTTPBroks requestsmanagement (201 threadsthread) has the LOCK |
Quand
on ales requêtes en lecture mettent trop de
consommationtemps à rendre la main au consommateur de Broks
,et que
les requêtes sont bloquées ( Requêtes de l'interface BLOQUÉES par les Broks )d'autres requêtes en lecture attendent de pouvoir s'exécuter depuis trop longtemps :
| Code Block | ||
|---|---|---|
| ||
ERROR: [ ITEMS ACCESS ORDONNANCER ] [ LONG LOCK ] Still have 9 running tasks ongoing (HTTP requests). => ( 1 ) Broks management and then ( 11 ) | ||
| Code Block | ||
| ||
ERROR: [ ITEMS ACCESS ORDONNANCER ] [ LONG LOCK ] HTTP requests are waiting (5 threads) since 30s (>= log error limit=30s) because Broks management (1 thread) has the LOCK:30s) |
Quand la consommation de Broks met Quand les requêtes en lecture mettent trop de temps à rendre la main au consommateur de Broks pour la gestion de requêtes en lecture, et que d'autres requêtes en lecture consommateurs attendent de pouvoir s'exécuter depuis trop longtemps ( cas théorique, n'est pas supposé survenir en fonctionnement normal ) :
| Code Block | ||
|---|---|---|
| ||
ERROR: [ ITEMS ACCESS ORDONNANCER ] [ LONG LOCK ] Still have 91 running tasks ongoing (HTTPBroks requestsmanagement). => ( 112 ) BroksHTTP management andrequests then ( 111 ) HTTPBroks requestsmanagement are waiting since 30s (>= log error limit:30s) |
Gestion des broks
Information sur l'absorption des broks
Statistiques sur un traitement
Des broks ont été traités, affichage de statistiques :
Quand la consommation de Broks met trop de temps à rendre la main pour la gestion de requêtes en lecture, et que d'autres consommateurs attendent de s'exécuter depuis trop longtemps ( cas théorique, n'est pas supposé survenir en fonctionnement normal ) :- nombre de broks traités
- temps d'attente du premier brok set
- nombre de brok set en retard récupérés, et le temps que ça a pris de les récupérer
- temps passé à désérialiser les broks
- temps d'attente du lock avant de traiter les broks
- temps passé pour traiter les broks
- temps total
| Code Block | ||
|---|---|---|
| ||
ERROR:[YYYY-MM-DD HH:MM:SS] INFO : [ WebUI-name ] [ ITEMSMANAGE ACCESSBROKS ORDONNANCER] [PERF] [ LONGXXXX LOCKbroks ] Still[ havewait 1and runningget tasksfirst ongoingset (Broks management). => ( 12 ) HTTP requests then ( 1 ) Broks management are waiting since 30s (>= log error limit:30s) |
Gestion des broks
Information sur l'absorption des broks
Statistiques sur un traitement
on queue=X.XXXs ] [ get 0 late sets on=X.XXXs ] [ unserialize=X.XXXs ] [ wait write lock=X.XXXs ] [ manage broks=X.XXXs ] [ total=X.XXXs ] |
Nature des broks traités
Affichage du type des broks traités : en quantité et en temps
Des broks ont été traités, affichage de statistiques :
| Code Block | ||
|---|---|---|
| ||
[YYYY-MM-DD HH:MM:SS] INFO : [ WebUI-6 name ] [ MANAGE BROKS ] [PERF] [ XXXX broks ] [ wait and get first set on queue=0.000s ] [ get 0 late sets on=0.000s ] [ unserialize=0.000s ] [ wait write lock=0.000s ] [ manage broks=0.000s ] [ total=0.000s ] |
Nature des broks traités
=> handled broks -> count by types : [brok_type_1=XXXX] [brok_type_2=XX] [...] |
Affichage du type des broks à traités
| Code Block | ||
|---|---|---|
| ||
[YYYY-MM-DD HH:MM:SS] INFO : [ WebUI-6 name ] [ MANAGE BROKS ] [PERF] => handled =broks -> managetime broksby types : [brok_type_1=XXXX] [brok_type_2=XX] [...] |
Exemple de log
| Code Block | ||
|---|---|---|
| ||
[YYYY2022-MM01-DD26 HH13:MM01:SS43] INFO : [ WebUI-6 ] [ MANAGE BROKS ] [ PERF ] => handled => manage broksbroks -> count by types : [initial_command_status=1374] [initial_hostgroupcommand_status=657219] [serviceupdate_nextbroker_schedulestatus=26773] [update_program_status=211] [program_status=31] [hostinitial_checkcontact_resultstatus=5681] [clean_all_my_instance_id=3...] [initial_service_status=67969] [initial_contactgroup_status=24] [initial_timeperiod_status=15] [initial_broks_done=3] [initial_contact_status=1644] [initial_host_status=1960] [host_next_schedule=508] [log_monitoring=36] [update_service_status=2] [service_check_result=3271] [proxy_items_graph=3 [2022-01-26 13:01:43] INFO : [ WebUI ] [ MANAGE BROKS ] [ PERF ] => handled broks -> time by types : [initial_command_status=0.022] [update_broker_status=0.000] [update_program_status=0.000] [program_status=0.001] [initial_contact_status=0.000] [...] |
L'absorption des broks a pris du retard
En cas de forte charge sur le serveur ou lorsque des requêtes HTTP durent trop longtemps, le module peut prendre du retard sur la gestion des broks.
L'algorithme d'absorption des broks peut être paramétré via les paramètres webui_broks_getter_XXX du fichier de configuration du Module WebUI
Le mode de rattrapage pour récupérer les broks en retard s'active
Activation du rattrapage des broks en retard, on prend un brok set supplémentaire à traiter, on affiche :
- le nombre de broks dans le brok set
- le temps passé pour récupérer le brok set sur la queue
- le nombre actuel de broks à traiter
- le nombre maximal de broks qu'on peut récupérer avant de les traiter
- le nombre de brok set encore en attente
| Code Block | ||
|---|---|---|
| ||
[YYYY-MM-DD HH:MM:SS] INFO : [ WebUI-6 name ] [ MANAGE BROKS ] [PERF] [LATE BROKS SETS] Getting brok set with XX broks in 0X.000sXXXs [time for read queue size=0X.000sXXXs]. Total broks to process= XXX/max:XXXX. Broks sets in queue: X. |
Le mode rattrapage a suffisamment de broks à traiter
Rattrapage des broks en retard en cours, on a atteint/dépassé le nombre maximal de broks à récupérer, on les traite :
| Code Block | ||
|---|---|---|
| ||
[YYYY-MM-DD HH:MM:SS] INFO : [ WebUI-6 name ] [ MANAGE BROKS ] [PERF] [LATE BROKS SETS] Late brok taken => limit reach : XX / limit: XXXXXX. |
Après avoir traiter des broks, il en reste encore trop en attente
Après avoir traité des broks, il reste trop de brok set en attente, on garde le lock et on continue l'absorption des broks en retard :
| Code Block | ||
|---|---|---|
| ||
[YYYY-MM-DD HH:MM:SS] INFO : [ WebUI-6 name ] [ MANAGE BROKS ] [PERF] Broks sets in queue after manage broks is XX. We keep the lock and continue the brok managing. |
Demande des broks initiaux lors du redémarrage d'un module externe du Broker
Lors du redémarrage d'un module externe du broker, une demande est envoyée par le Broker aux Schedulers pour récupérer de nouveaux broks initiaux ( une demande par Scheduler ).
| Code Block | ||
|---|---|---|
| ||
[YYYY-MM-DD HH:MM:SS] INFO : [ broker-mastername ] [ GET BROKS ] [ NEED DATA ] [ scheduler-name ] I ask for a initial broks generation to the scheduler with new daemon incarnation {u'shard_id': XXXX, u'configuration_incarnation_uuid': UUID} (old incarnation was {}) |
log de performance de la liste
Note ce Ce log s'affichera si l'appel à la liste prend plus de 1s :
| Code Block | ||
|---|---|---|
| ||
[YYYY-MM-DD HH:MM:SS] WARNING : [ WebUI -name ] [ CP Server Thread-74 ] [ user= 30067cfe5adf11e59a28080027f08538user-uuid ] [ get_data_visualisation_list ] [ PERF ] [ 1X.007sXXXs ] elements:[ in broker= 54XX filtered= 54XX total= 54XX in page= 54XX ] page:[ 1 / 1 ] filter:[ ] sort:[ ] |
Les logs des sous-modules
Les logs du module MongoDB
Erreurs
Si le module MongoDB n'arrive pas à se connecter à la base mongo définit dans son fichier cfg :
| Code Block | ||
|---|---|---|
| ||
[YYYY-MM-DD HH:MM:SS] ERROR : [ WebUI -name ] Mongodb Module: Error : [ WebUI -name ] [ MONGODB ] - mongo connection failure to 192.168.1.87:27017 |
Les logs du module SLA
Initialisation du module SLA - CHAPITRE [ INITIALISATION ]
Création du module
| Code Block | ||
|---|---|---|
| ||
[YYYY-MM-DD HH:MM:SS] INFO : [ WebUI -name ] [ sla ] [ INITIALISATION ] ============= Starting module initialisation ============== [YYYY-MM-DD HH:MM:SS] INFO : [ WebUI -name ] [ sla ] [ INITIALISATION ] Reading configuration for sla archive building [YYYY-MM-DD HH:MM:SS] INFO : [ WebUI -name ] [ sla ] [ INITIALISATION ] - time_before_shinken_inactive ----------------------------------:〖 30 〗 [YYYY-MM-DD HH:MM:SS] INFO : [ WebUI -name ] [ sla ] [ INITIALISATION ] - minimal_time_before_an_element_become_missing_data ------------:〖 0 〗 [YYYY-MM-DD HH:MM:SS] INFO : [ WebUI -name ] [ sla ] [ INITIALISATION ] - minimal_time_before_an_element_become_missing_data_at_startup -:〖 0 〗 [YYYY-MM-DD HH:MM:SS] INFO : [ WebUI : [ WebUI-name ] [ sla ] [ INITIALISATION ] Reading module configuration |
Paramètre de connexion à la base mongo
| Code Block | ||
|---|---|---|
| ||
[YYYY-MM-DD HH:MM:SS] INFO : [ WebUI -name ] [ sla ] [ INITIALISATION ] [ MONGO ] Creating connection to sla database [shinken] [YYYY-MM-DD HH:MM:SS] INFO : [ WebUI -name ] [ sla ] [ INITIALISATION ] [ MONGO ] Parameter load for database connection [YYYY-MM-DD HH:MM:SS] INFO : [ WebUI -name ] [ sla ] [ INITIALISATION ] [ MONGO ] - database ------------------------- :〖 shinken 〗 [YYYY-MM-DD HH:MM:SS] INFO : [ WebUI -name ] [ sla ] [ INITIALISATION ] [ MONGO ] - uri ------------------------------ :〖 mongodb://localhost/?w=1&fsync=false 〗 [YYYY-MM-DD HH:MM:SS] INFO : [ WebUI -name ] [ sla ] [ INITIALISATION ] [ MONGO ] - replica_set ---------------------- :〖 〗 [YYYY-MM-DD HH:MM:SS] INFO : [ WebUI -name ] [ sla ] [ INITIALISATION ] [ MONGO ] - use_ssh_tunnel ------------------- :〖 False 〗 [YYYY-MM-DD HH:MM:SS] INFO : [ WebUI -name ] [ sla ] [ INITIALISATION ] [ MONGO ] - ssh_keyfile ---------------------- :〖 ~shinken/.ssh/id_rsa 〗 [YYYY-MM-DD HH:MM:SS] INFO : [ WebUI -name ] [ sla ] [ INITIALISATION ] [ MONGO ] - ssh_user ------------------------- :〖 root 〗 [YYYY-MM-DD HH:MM:SS] INFO : [ WebUI INFO : [ WebUI-name ] [ sla ] [ INITIALISATION ] [ MONGO ] - ssh_tunnel_timeout --------------- :〖 2 〗 [YYYY-MM-DD HH:MM:SS] INFO : [ WebUI -name ] [ sla ] [ INITIALISATION ] [ MONGO ] - use_ssh_retry_failure ------------ :〖 1 〗 [YYYY-MM-DD HH:MM:SS] INFO : [ WebUI -name ] [ sla ] [ INITIALISATION ] [ MONGO ] - auto_reconnect_max_try ----------- :〖 3 〗 [YYYY-MM-DD HH:MM:SS] INFO : [ WebUI -name ] [ sla ] [ INITIALISATION ] [ MONGO ] - auto_reconnect_sleep_between_try - :〖 3 〗 [YYYY-MM-DD HH:MM:SS] INFO : [ WebUI -name ] [ sla ] [ INITIALISATION ] [ MONGO ] Try to open a Mongodb connection to mongodb://localhost/?w=1&fsync=false:shinken [YYYY-MM-DD HH:MM:SS] INFO : [ WebUI -name ] [ sla ] [ INITIALISATION ] [ MONGO ] Mongo connection established in 2.59ms [YYYY-MM-DD HH:MM:SS] INFO : [ WebUI -name ] [ sla ] [ INITIALISATION ] [ MONGO ] Ensure mongo index done in 2.15ms |
Fin de l'initialisation du module
| Code Block | ||
|---|---|---|
| ||
[YYYY-MM-DD HH:MM:SS] INFO : [ WebUI -name ] [ sla ] [ INITIALISATION ] Load from collection 28 elements info in cache done in 0.65ms [YYYY-MM-DD HH:MM:SS] INFO : [ WebUI -name ] [ sla ] [ INITIALISATION ] ============= Module initialized in 16.38ms ============== [YYYY-MM-DD HH:MM:SS] INFO : [ WebUI -name ] [ sla ] [ INITIALISATION ] Found first element monitoring at 03-08-2020 10:16:38 |
Erreurs - La connexion au serveur Mongo n'est pas établie
Avec Tunnel SSH
| Code Block | ||
|---|---|---|
| ||
[YYYY-MM-DD HH:MM:SS] ERROR : [ WebUI -name ] [ sla ] [ INITIALISATION ] Initialisation Module: Error : [ WebUI -sla ] [ SSH TUNNEL ] [ MONGODB ] - mongo connection failure : localhost:43577 ==(ssh tunnel)==> 192.168.1.87:22 ==(mongodb)==> 192.168.1.87:27017. |
Sans Tunnel SSH
| Code Block | ||
|---|---|---|
| ||
[YYYY-MM-DD HH:MM:SS] ERROR : [ WebUI -name ] [ sla ] [ INITIALISATION ] Initialisation Module: Error : [ WebUI -sla ] [ MONGODB ] - mongo connection failure to 192.168.1.87:27017 |
Les logs du module event-manager-reader
Erreurs
Dans le cas où un utilisateur demande une requête trop grande aux évents ( en tapant un filtre trop large dans le nom, matchant plus de 50000 hosts/checks/clusters ), alors la WebUI va générer un log de WARNING alertant que la recherche est trop large, et que MongoDB risque de refuser la requête si elle est effectuée avec des uuids. Elle sera donc faite avec des regexp côté base de données, ce qui est très lent.
| Code Block | ||
|---|---|---|
| ||
[YYYY-MM-DD HH:MM:SS] WARNING: [ WebUI-name ] [ event_container ] [ FAST-SEARCH ] [user=admin] [filter=type:check^^host~host_name:BiBi] The filter match too much uuids to query mongodb (101 > 100000) we must fallback to the slower regexp based query. |
log de performance du conteneur d'événements
Note
- ce log s'affichera si l'appel à la liste prend plus de 1s :
- ces logs sont désactivés par défaut voir la page : Activation/Désactivation des parties de log pour les activer.
| Code Block | ||
|---|---|---|
| ||
[2021YYYY-04MM-08DD 13HH:34MM:47SS] WARNING: [ WebUI -name ] [ event-manager-reader ] [ user=30067cfe5adf11e59a28080027f08538 user-id] [ get_events ] [ PERF ] [ 31XX.064sXXXs ] 100 events returned with filter:[{"filter0":"type:host","filter1":"event_since:latest|3600~type:check~realm:All"}] |
Les logs du module SLA
Création du sous-module
| Code Block | ||
|---|---|---|
| ||
[2021YYYY-04MM-13DD 15HH:50MM:24SS] INFO : [ WebUI -name ] [ sla ] [ INITIALISATION ] ============= Starting module initialisation ============== [2021YYYY-04MM-13DD 15HH:50MM:24SS] INFO : [ WebUI -name ] [ sla ] [ INITIALISATION ] Reading configuration for sla archive building [2021YYYY-04MM-13DD 15HH:50MM:24SS] INFO : [ WebUI -name ] [ sla ] [ INITIALISATION ] - time_before_shinken_inactive ----------------------------------:〖 30 〗 [2021YYYY-04MM-13DD 15HH:50MM:24SS] INFO : [ WebUI -name ] [ sla ] [ INITIALISATION ] - minimal_time_before_an_element_become_missing_data ------------:〖 0 〗 [2021YYYY-04MM-13DD 15HH:50MM:24SS] INFO : [ WebUI -name ] [ sla ] [ INITIALISATION ] - minimal_time_before_an_element_become_missing_data_at_startup -:〖 0 〗 [2021YYYY-04MM-13DD 15HH:50MM:24SS] INFO : [ WebUI -name ] [ sla ] [ INITIALISATION ] Reading module configuration |
Paramètre de connexion à la base mongo
| Code Block | ||
|---|---|---|
| ||
[2021-04-13 15:50:24] INFO : [ WebUI -name ] [ sla ] [ INITIALISATION ] [ MONGO ] Creating connection to sla database [shinken] [2021-04-13 15:50:24] INFO : [ WebUI [ WebUI-name ] [ sla ] [ INITIALISATION ] [ MONGO ] Parameter load for database connection [2021-04-13 15:50:24] INFO : [ WebUI -name ] [ sla ] [ INITIALISATION ] [ MONGO ] - database ------------------------- :〖 shinken 〗 [2021-04-13 15:50:24] INFO : [ WebUI -name ] [ sla ] [ INITIALISATION ] [ MONGO ] - uri ------------------------------ :〖 mongodb://localhost/?w=1&fsync=false 〗 [2021-04-13 15:50:24] INFO : [ WebUI -name ] [ sla ] [ INITIALISATION ] [ MONGO ] - replica_set ---------------------- :〖 〗 [2021-04-13 15:50:24] INFO : [ WebUI -name ] [ sla ] [ INITIALISATION ] [ MONGO ] - use_ssh_tunnel ------------------- :〖 False 〗 [2021-04-13 15:50:24] INFO : [ WebUI -name ] [ sla ] [ INITIALISATION ] [ MONGO ] - ssh_keyfile ---------------------- :〖 ~shinken/.ssh/id_rsa 〗 [2021-04-13 15:50:24] INFO : [ WebUI -name ] [ sla ] [ INITIALISATION ] [ MONGO ] - ssh_user ------------------------- :〖 root 〗 [2021-04-13 15:50:24] INFO : [ WebUI -name ] [ sla ] [ INITIALISATION ] [ MONGO ] - ssh_tunnel_timeout --------------- :〖 2 〗 [2021-04-13 15:50:24] INFO : [ WebUI -name ] [ sla ] [ INITIALISATION ] [ MONGO ] - use_ssh_retry_failure ------------ :〖 1 〗 [2021-04-13 15:50:24] INFO : [ WebUI INFO : [ WebUI-name ] [ sla ] [ INITIALISATION ] [ MONGO ] - auto_reconnect_max_try ----------- :〖 3 〗 [2021-04-13 15:50:24] INFO : [ WebUI -name ] [ sla ] [ INITIALISATION ] [ MONGO ] - auto_reconnect_sleep_between_try - :〖 3 〗 [2021-04-13 15:50:24] INFO : [ WebUI -name ] [ sla ] [ INITIALISATION ] [ MONGO ] Try to open a Mongodb connection to mongodb://localhost/?w=1&fsync=false:shinken [2021-04-13 15:50:24] INFO : [ WebUI -name ] [ sla ] [ INITIALISATION ] [ MONGO ] Mongo connection established in 4.09ms [2021-04-13 15:50:24] INFO : [ WebUI -name ] [ sla ] [ INITIALISATION ] [ MONGO ] Ensure mongo index done in 3.35ms [2021-04-13 15:50:24] INFO : [ WebUI -name ] [ sla ] [ INITIALISATION ] Load from collection 28 elements info in cache done in 0.85ms |
Fin de l'initialisation du module
| Code Block | ||
|---|---|---|
| ||
[2021YYYY-04MM-13DD 15HH:50MM:24SS] INFO : [ WebUI -name ] [ sla ] [ INITIALISATION ] ============= Module initialized in 24.19ms ============== [2021YYYY-04MM-13DD 15HH:50MM:24SS] INFO : [ WebUI -name ] [ sla ] [ INITIALISATION ] Found first element monitoring at 17-06-2020 10:42:52 |