| Panel | ||||
|---|---|---|---|---|
| ||||
|
Les fichiers de log du broker sont situés dans le dossier /var/log/shinken/. Pour plus d'informations, consultez la page Fichiers Logs.
Démarrage du broker
| Code Block | ||
|---|---|---|
| ||
[XXXXXXXXXXYYYY-MM-DD HH:MM:SS] INFO : [ broker]-name ] Using the local log file '/var/log/shinken/brokerd.log' [XXXXXXXXXXYYYY-MM-DD HH:MM:SS] INFO : [ broker-name ] Printing stored debug messages prior to our daemonization [XXXXXXXXXXYYYY-MM-DD HH:MM:SS] INFO: [ broker-name :] [broker] SYSTEM System limit number of process/threads is set to maximum available: 22392/22392 [XXXXXXXXXX] INFOSystem resource number :of [broker]open Systemfiles limit number of open files is set to maximum available: 131070/131070 [XXXXXXXXXX] INFO : [broker] Starting HTTP daemon [XXXXXXXXXX(soft:131070 / hard:131070 ) (set at system max values) [YYYY-MM-DD HH:MM:SS] INFO: [ broker] |---------------------------------------name ] [ SYSTEM ] System resource number of processes/threads is set to (soft:unlimited / hard:unlimited ) (set at system max values) [YYYY-MM-DD HH:MM:SS] INFO: [ broker-name ] Starting HTTP daemon [YYYY-MM-DD HH:MM:SS] INFO: [ broker-name ] |--------------------------------------------------------------------------------------------------| [XXXXXXXXXX] INFO: [brokerYYYY-MM-DD HH:MM:SS] INFO: [ broker-name ] broker is starting [XXXXXXXXXXYYYY-MM-DD HH:MM:SS] INFO: [ broker-name ] |--------------------------------------------------------------------------------------------------| |
Avec affichage:
- du Du fichier de log défini dans sa configuration (broker.ini)
- du nombres Du nombre de processus/threads maximum autorisé par le système pour ce daemondémon
- du nombres Du nombre de fichiers ouverts maximum autorisé par le système
Chargement d'une configuration
Premier chargement de la configuration
Lorsque le Broker reçoit sa configuration pour la première fois deux logs INFO sont affichés.
Le premier indiquant que nous rentrons dans la phase de chargement d'une nouvelle configuration.
Code Block theme Emacs [YYYY-MM-DD HH:MM
:SS] INFO : [ broker-
name ] [ CONFIGURATION ]
-----
Loading the new configuration from the arbiter
Le deuxième indiquant que nous avons reçu la configuration de l'Arbiter.
Code Block theme Emacs [YYYY-MM-DD HH:MM:SS] INFO : [ broker-name ] [ CONFIGURATION ] The arbiter send us a new configuration: [configuration_uuid=configuration-uuid, arbiter=arbiter-name, architecture=architecture-name, date=YYYY-MM-DD HH:MM:SS]Dans le cas où le broker n'est pas de la même version que l'arbiter et que l'option *mismatch_version_error* est activé sur l'arbiter:
Code Block theme Emacs [YYYY-MM-DD HH:MM:SS] ERROR : [ broker-name ] Incompatible daemon version : Your Arbiter daemon is in version [XX.XX.XX-release.fr culmulative-patch-YY] while this daemon is in version [XX.XX.XX-release.fr culmulative-patch-YY]. Refusing this configuration.
Dans le cas où le broker n'est pas de la même version que l'arbiter et que l'option *mismatch_version_error* est désactivé sur l'arbiter:
Code Block theme Emacs [YYYY-MM-DD HH:MM:SS] WARNING
: [ broker-
name
]
Incompatible
daemon
version
:
Your
Arbiter
daemon
is
in
Un tour de boucle
Début d'un tour
version [XX.XX.XX-release.fr culmulative-patch-YY] while this daemon is in version [XX.XX.XX-release.fr culmulative-patch-YY].
Mise à jour de la configuration
Lorsque qu'il y a une mise à jour de la configuration, deux logs en INFO sont affichés.
Le premier indiquant que nous rentrons dans la phase de chargement d'une nouvelle configuration.
Code Block theme Emacs [YYYY-MM-DD HH:MM:SS] INFO : [ broker-name ] [ CONFIGURATION ] [ UPDATE ] ----- Loading a configuration update from the arbiter
Le deuxième indiquant que nous avons reçu la nouvelle configuration de l'Arbiter.
Code Block theme Emacs [YYYY-MM-DD HH:MM:SS] INFO : [ broker-name ] [ CONFIGURATION ] [ UPDATE ] The arbiter send us a new configuration: [configuration_uuid=configuration-uuid, arbiter=arbiter-name, architecture=architecture-name, date=YYYY-MM-DD HH:MM:SS]Dans le cas où le broker n'est pas de la même version que l'arbiter et que l'option *mismatch_version_error* est activé sur l'arbiter:
Code Block theme Emacs [YYYY-MM-DD HH:MM:SS] ERROR : [ broker-name ] Incompatible daemon version : Your Arbiter daemon is in version [XX.XX.XX-release.fr culmulative-patch-YY] while this daemon is in version [XX.XX.XX-release.fr culmulative-patch-YY]. Refusing this configuration.Dans le cas où le broker n'est pas de la même version que l'arbiter et que l'option *mismatch_version_error* est désactivé sur l'arbiter:
Code Block theme Emacs
[YYYY-MM-DD HH:MM:SS] WARNING
: [ broker-
name ]
Incompatible
daemon
version
:
Your
Arbiter
daemon
is
in
Récupération des broks des schedulers et arbiters
version [XX.XX.XX-release.fr culmulative-patch-YY] while this daemon is in version [XX.XX.XX-release.fr culmulative-patch-YY].
Cas d'un démon recevant un nouveau démon spare ou une assignation d'un démon master
Dans le cas où un master reçoit le nom de son démon spare, on aura:
| Code Block | ||
|---|---|---|
|
L'arbiter envoi ses broks vers le broker:
[YYYY-MM-DD HH:MM:SS] INFO : [ broker-master ] [RECEIVE CONFIGURATION BROKS] [ arbiterMASTER ] My spare daemon is now "broker-spare" |
Dans le cas où un spare reçoit le nom de son démon master, on aura:
| Code Block | ||
|---|---|---|
| ||
[YYYY-MM-DD HH:MM:SS] INFO : [ broker-spare ] [PERF CONFIGURATION ] [ 0.000SPARE ]s -I Addam 1now the broks into INTERNAL queue (new size=18) and the EXTERNAL queue (new size=18) [YYYY-MM-DD HH:spare of the master daemon "broker-master" |
Par rapport au paramètre broker__manage_spare__spare_must_have_the_same_list_of_module_type , le démon va mettre dans le cas où le paramètre change:
Dans le cas où désormais il en a besoin:
Code Block theme Emacs [YYYY-MM-DD HH:MM:SS] INFO
: [ broker-master
] [
CONFIGURATION
] [
MASTER ] The spare daemon "broker-spare-useless" is now requiring the same modules types as
the masterDans le cas où désormais le spare n'a pas besoin d'avoir les mêmes modules (s'affichera notamment au démarrage du démon si le paramètre est désactivé)
Code Block theme Emacs
Le broker récupère les broks depuis un scheduler:
code[YYYY-MM-DD HH:MM:SS] INFO
: [ broker-master
] [
CONFIGURATION ] [ MASTER ]
The
spare daemon "broker-spare-useless" is now NOT requiring the same modules types as the master
Mise à jour des liens vers d'autres démons
Lorsque que l'Arbiter détecte un changement de lien entre les démons quatre logs en INFO seront affichés.
- Les deux premiers logs affichent le(les) lien(s) du(des) démon(s) supprimé(s).
| Code Block | ||
|---|---|---|
| ||
] [PERF] [ 0.007 ]s - Add 16 broks into INTERNAL queue (new size=16) and the EXTERNAL queue (new size=16) [YYYY-MM-DD HH:MM:SS] INFO : [ broker-master ] [GET BROKSCONFIGURATION ] [The scheduler-masterarbiter asked us ]to remove daemons: [YYYY-MM-DD HH:MM:SS] INFO : [ broker-master ] [ CONFIGURATION ] - REMOVED scheduler ----- 16 composed of: host_check_result=10, host_next_schedule=6 |
Avec pour les deux cas:
- affichage du nombre de broks récupérés sur le daemon, et affichage de la taille des files d'attentes une fois rajoutés
- affichage du type de broks récupérés, ainsi que leur nombre
Envoie des broks aux modules externes
Statut des files d'envoi
: [name=scheduler1-name] [shard_id= XXX] [uri=http://scheduler_address:port/] |
- Les deux premiers logs affichent le(les) lien(s) du(des) démon(s) ajouté(s).
| Code Block | ||
|---|---|---|
| ||
[YYYY-MM-DD HH:MM:SS] INFO : [ broker-master ] [MANAGE BROKSCONFIGURATION ] [The EXTERNALarbiter MODULEsend ]us =>new Number of "Broks Sets" not eaten in MODULE queues (WebUI5-ha): 11 (WebUI3-ha): 11 (WebUI7-ha): 11 (WebUI4-ha): 11 (WebUI8-ha): 11 (WebUI1-ha): 11 (WebUI2-ha): 11 (WebUI6-ha): 11 |
A chaque tour de boucle, le broker envoie 1 ensemble de broks à chaque WebUI. 1 ensemble est composé d'autant de broks qu'il a reçus dans le tour.
Si le nombre est plus gros que 1, c'est que les WebUIs mettent du temps à digérer les ensembles.
- C'est courant au démarrage car les broks initiaux sont longs à être digéré,
- mais cela ne devrait pas arriver après.
Préparation des Broks pour l'envoi
daemons:
[YYYY-MM-DD HH:MM:SS] INFO : [ broker-master ] [ CONFIGURATION ] + ADDED scheduler : [name=scheduler2-name] [shard_id= XXX] [uri=http://scheduler_address:port/] |
Application par le démon de la propriété satellitemap (remaping d'adresse pour gérer un VLan)
Quand un démon a un paramètre satellitemap, il va changer l’adresse d'un autre démon par une autre (pour par exemple gérer le cas où il tourne dans un vlan avec un plan d’adressage particulier). Cette application se voit via le log suivant:
| Code Block | ||
|---|---|---|
| ||
[YYYY-MM-DD HH:MM:SS] INFO : [ broker-master ] [MANAGE BROKSCONFIGURATION ] [ PREPARINGSATELLITEMAP BROKS] Replacing the daemon ] [PERF] [ 0.001 ]s, preparing broks lists for INTERNAL and EXTERNAL modules |
Chaque tour de boucle le broker préparer les listes d'envoi avec les nouveaux broks reçus.
Envoi vers les modules externes
scheduler-secondary to address:port from localhost:8768 => 192.168.1.124:8768 as defined in our daemon .cfg file (satellitemap property) |
Ici le Scheduler scheduler-secondary est passé de l'adresse localhost:8768 à 192.168.1.124:8768.
Un tour de boucle
Début d'un tour
| Code Block | ||
|---|---|---|
| ||
| Code Block | ||
[YYYY-MM-DD HH:MM:SS] INFO: [ broker-master name ] [MANAGEBROKER BROKSTIME ] [ EXTERNAL=== MODULELoop start === ] - PUSHED [ 0.331s, limit=5.000s ]s, EXTERNAL queue evolution: [ 424 broks => 0 broks remaining ] [ 424 broks managed ] [ Push average speed = 1928 broks/s] |
Le broker a envoyé 424 broks en 0.331s, et avait laissé une limite de temps de 5s pour cet envoi (calcul basé sur la vitesse moyenne des derniers envois, ici 1928broks/s, et une marge de sécurité).
A noter: si le nombre de broks remaining est différent de zéro, ceci signifie que le broker a reçu des broks pendant la phase d'envoi, et qu'il les enverra le prochain tour.
Envoie des broks aux modules internes (sans leur propre processus)
===-===-===-===-===-===-===-===-===-===-===-===-=== |
Récupération des broks des Schedulers et Arbiters
L'Arbiter envoie ses broks vers le broker:
| Code Block | ||
|---|---|---|
| ||
[YYYY-MM-DD HH:MM:SS] INFO: : [ broker-master name ] [MANAGERECEIVE BROKS ] [ INTERNAL MODULE arbiter ] - EXECUTED[PERF] [ 0.239000 ]s, INTERNAL- queue evolution: [Add 1 424 broks =>into INTERNAL queue 238 broks remaining ] [ 424 broks managed ](new size=18) and the EXTERNAL queue (new size=18) [YYYY-MM-DD HH:MM:SS] INFO : [ broker-mastername ] [RECEIVE BROKS] [ arbiter ] ----- 1 composed of: architecture_export_map=1 |
Le broker récupère les broks depuis un Scheduler:
| Code Block | ||
|---|---|---|
| ||
[YYYY-MM-DD HH:MM:SS] INFO : [ broker-name ] [GET BROKS ] [ scheduler-master ] [PERF] [ 0.007 ]s - Add 16 broks into INTERNAL queue (new size=16) and the EXTERNAL queue (new size=16)
[YYYY-MM-DD HH:MM:SS] INFO : [ broker-name ] [GET BROKS ] [ scheduler-master ] ----- 16 composed of: host_check_result=10, host_next_schedule=6 |
Avec pour les deux cas:
- Affichage du nombre de broks récupérés sur le démon, et affichage de la taille des files d'attente une fois rajoutés
- Affichage du type de broks récupérés, ainsi que leur nombre
Quand on a une erreur de transfert qui faisait perdre des broks dans le passé, on a cette entrée dans les logs:
| Code Block | ||
|---|---|---|
| ||
[YYYY-MM-DD HH:MM:SS] WARNING: [ broker-name ] [ GIVE BROKS ] [ broker-master ] Did fail to transfer broks from the scheduler "scheduler-master": [[Connexion error to https://192.80.10.220:7768/ : Operation timed out after 120000 milliseconds with 802816 out of 22791250 bytes received]. THESES BROKS ARE LOST AND CANNOT BE RETRIEVED |
Elle disparaitra quand on aura bien testé le mécanisme de reprise sur erreur dans une future version.
Envoie des broks aux modules externes
Statut des files d'envoi
| Code Block | ||
|---|---|---|
| ||
[YYYY-MM-DD HH:MM:SS] INFO: [ broker-name ] [MANAGE BROKS ] [ EXTERNAL MODULE ] => Number of "Broks Sets" not eaten in MODULE queues (WebUI5-ha): 11 (WebUI3-ha): 11 (WebUI7-ha): 11 (WebUI4-ha): 11 (WebUI8-ha): 11 (WebUI1-ha): 11 (WebUI2-ha): 11 (WebUI6-ha): 11 |
À chaque tour de boucle, le broker envoie 1 ensemble de broks à chaque WebUI. 1 ensemble est composé d'autant de broks qu'il a reçus dans le tour.
Si le nombre est plus gros que 1, c'est que les WebUIs mettent du temps à digérer les ensembles.
- C'est courant au démarrage, car les broks initiaux sont longs à être traités
- Mais cela ne devrait pas arriver après
Préparation des Broks pour l'envoi
| Code Block | ||
|---|---|---|
| ||
[YYYY-MM-DD HH:MM:SS] INFO: [ broker-name ] [MANAGE BROKS ] [ PREPARING BROKS ] [PERF] [ 0.001 ]s, preparing broks lists for INTERNAL and EXTERNAL modules |
Chaque tour de boucle le broker préparer les listes d'envoi avec les nouveaux broks reçus.
Envoi vers les modules externes
| Code Block | ||
|---|---|---|
| ||
[YYYY-MM-DD HH:MM:SS] INFO: [ broker-name ] [MANAGE BROKS ] [ EXTERNAL MODULE ] - PUSHED [ 0.331s, limit=5.000s ]s, EXTERNAL queue evolution: [ 424 broks => 0 broks remaining ] [ 424 broks managed ] [ Push average speed = 1928 broks/s] |
Le broker a envoyé 424 broks en 0.331s , et avait laissé une limite de temps de 5s pour cet envoi (calcul basé sur la vitesse moyenne des derniers envois, ici 1928 broks/s , et une marge de sécurité).
À noter: si le nombre de broks remaining est différent de zéro, ceci signifie que le broker a reçu des broks pendant la phase d'envoi, et qu'il les enverra le prochain tour.
Envoie des broks aux modules internes (sans leur propre processus)
| Code Block | ||
|---|---|---|
| ||
[YYYY-MM-DD HH:MM:SS] INFO: [ broker-name ] [MANAGE BROKS ] [ INTERNAL MODULE ] - EXECUTED [ 0.239 ]s, INTERNAL queue evolution: [ 424 broks => 238 broks remaining ] [ 424 broks managed ]
[YYYY-MM-DD HH:MM:SS] INFO: [ broker-name ] ----- Details of INTERNAL brok deserialization time:0.010s modules execution time: (Graphite-Perfdata=0.071s), (Simple-log=0.010s), (sla=0.086s) |
Le broker a fourni 424 broks aux modules internes (ceux qui n'ont pas leur propre processus), en 0.239s au total. Ici le nombre de broks remaining est différent de zéro, ceci signifie que le broker a reçu des broks pendant la phase d'envoi, et qu'il les enverra le prochain tour.
Il fournit ensuite le temps passé à désérialiser les broks ainsi que le détail de temps de chaque module interne.
Récupération des commandes (demande de prise en compte, demande pour relancer une vérification, etc)
| Code Block | ||
|---|---|---|
| ||
[YYYY-MM-DD HH:MM:SS] INFO: [ broker-name ] [MODULES ] [ BUS COMMANDS ] [PERF] [ 0.001 ]s Did read 0 ----- Details of INTERNAL modules execution time: (Graphite-Perfdata=0.071s), (Simple-log=0.010s), (sla=0.086s) |
Le broker a fourni 424 broks aux modules internes (ceux qui n'ont pas leur propre processus), en 0.239s au total. Ici le nombre de broks remaining est différent de zéro, ceci signifie que le broker a reçu des broks pendant la phase d'envoi, et qu'il les enverra le prochain tour.
Il fourni ensuite le détail de temps de chaque module interne.
Récupération des commandes (demande de prise en compte, demande pour relancer une vérification, etc)
internal commands (like recheck, set acknowledge, etc) from modules |
Le broker récupère les commandes (comme une création de périodes de maintenance, etc.) et le temps que ceci lui a demandé.
Cas d'erreur
Si le broker ne parvient pas à récupérer les commandes d'un de ses modules, le log suivant est produit :
| Code Block | ||
|---|---|---|
| ||
[YYYY-MM-DD HH:MM:SS] INFOWARNING: [ broker-master name ] [MODULES ] [ EXTERNALBUS COMMANDS ] [PERF] [ 0.001 ]s DidCannot read 0shinken externalinternal commands (like recheck, set acknowledge, etc) from modules |
, etc) from module [MODULE-NAME]. We will retry it. |
Appel au modules internes chaque seconde
Chaque fin de tour, un appel est lancé vers les modules internes afin qu'ils puissent faire des actions spécifiques (par exemple vérifier un cache, vider leur leurs éléments pas encore envoyés, etc.)
| Code Block | ||
|---|---|---|
| ||
[YYYY-MM-DD HH:MM:SS] INFO: [ broker-master name ] [MODULES ] [ TIME IN BROKER ] [PERF] [ 0.025 ]s All modules "ticks" are done. Execution times by modules: (Graphite-Perfdata=0.001s), (sla=0.024s) |
Avec:
- le Le temps total
- le Le temps passé par chaque module
Fin d'un tour
| Code Block | ||
|---|---|---|
| ||
[YYYY-MM-DD HH:MM:SS] INFO: [ broker-master name ] [BROKER TIME ] [ === Loop stop === ] [ Loop number=XX ] [PERF] [ 0.397 ]s |
Le broker donne le temps qu'il a passé sur ce tour de boucle. Ce dernier doit rester sous la seconde sauf pendant la phase de reception réception d'une nouvelle configuration où il peux peut dépasser ce temps.
Surcharge serveur en activité disque, ralentissant l'écriture des logs
Si le serveur hébergeant le daemon démon est surchargé en terme termes d'IO disques sur le volume qui héberge le fichier de log, alors ce dernier va mettre du temps à s'écrire et va ralentir tout le daemondémon. Il faut alors si c'est faisable dans la mesure du possible, isoler le volume des disques sur un disque moins chargé pour ne pas ralentir le daemondémon.
En cas de soucis, vous aurez dans les lots l'entrée suivante:
| Code Block | ||
|---|---|---|
| ||
2020YYYY-05MM-04DD 00HH:00MM:51SS WARNING : [ LOGGER ] 2020YYYY-05MM-04DD 00HH:00MM:51SS WARNING : [ LOGGER ] ---------------------------------------------------------------------------------------------------- 2020YYYY-05MM-04DD 00HH:00MM:51SS WARNING : [ LOGGER ] [ WRITING ] The log writewrites time is very high (1.87s). Please look at your log disk performance. 2020YYYY-05MM-04DD 00HH:00MM:51SS WARNING : [ LOGGER ] ---------------------------------------------------------------------------------------------------- YYYY-MM-DD HH:MM:SS WARNING : [ LOGGER ] |
Arrêt d'un module
Quand le broker doit éteindre un de ses modules, le log suivant est généré :
| Code Block | ||
|---|---|---|
| ||
[YYYY------------ 2020-05-04 00:00:51 WARNING : [ LOGGER ]MM-DD HH:MM:SS] INFO : [ BROKER-NAME ] [MODULES ] [MODULE-NAME] Stopping module process pid=6505 |