| Scroll Ignore | ||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ||||||||||||||
|
Contexte
Le check Arbiter Broker - $KEY$ DB - Alive vérifie que le démon Arbiter peut être correctement contacté sur le réseau.
Il donne également la version du démon ( Résultat court ) et ainsi que les modules opérationnels ( Résultat long ).
Last Flush Time vérifie la durée du dernier "Flush" de la base de données.
La version V02.07.00 de Shinken est accompagnée d'une mise à jour de Mongodb. Cette nouvelle version comporte notamment un changement de la méthode de sauvegarde des objets au sein de Mongo.
Sur une installation neuve de Shinken, le nouveau format ( WiredTiger ) est utilisé, ce qui rend le check non pertinent. Dans ce cas, ce check aura le résultat suivant :
| Panel |
|---|
Pour les versions inférieures, le check retournera le temps de connexion
| Panel |
|---|
| Panel |
Paramétrage
Le check utilise la ligne de commande suivante :
| Code Block | ||||
|---|---|---|---|---|
| ||||
$PLUGINSDIR$/check_shinkenshinkendb.py -D -H "$HOSTADDRESS$" -pP "$ARG2$$_HOSTDB_PORT$" --shinkenversionconnection-method "$SHINKENVERSION$$_HOSTDB_CONNECTION_METHOD$" --ssh-t arbiter -m $ARG1$ --user "$_HOSTDB_SSH_USER$" --ssh-keyfile "$_HOSTDB_SSH_KEY$" --ssh-tunnel-timeout "$_HOSTDB_HOSTCHECKSSH_SHINKENTUNNEL_TIMEOUT$" -A last_flush_time -wW "$_HOSTTHRESHOLDHOSTDB_LAST_CPUFLUSH_STOLENTIME_WARNING$WARN$" -cC "$_HOSTDB_HOSTTHRESHOLDLAST_CPUFLUSH_STOLENTIME_CRITICAL$CRIT$" |
Données utilisées provenant du modèle
Données communes pour les checks du modèle
Nom | Modifiable sur | Défaut | Valeur par défaut à l'installation de Shinken | Description |
|---|---|---|---|---|
CHECK_SHINKEN_TIMEOUT | l'Hôte ( Onglet Données ) | 3 | 3 | Temps maximum durant lequel les checks peuvent s'exécuter ( en secondes ). |
Données spécifiques pour ce check
| Nom | Modifiable sur | Unités | Défaut | Valeur par défaut à l'installation de Shinken | Description | |||||
|---|---|---|---|---|---|---|---|---|---|---|
| Modèle d'hôte ( Onglet Données ) | --- | 27017 | 27017 | Port de la base de données Autres check(s) impacté(s) :
| |||||
| Modèle d'hôte ( Onglet Données ) | --- | ssh | ssh | Méthode de connexion au serveur MongoDB ( "direct" ou "ssh" ) Autres check(s) impacté(s) :
| |||||
| Modèle d'hôte ( Onglet Données ) | --- | shinken | shinken | Utilisateur distant avec lequel se connecter au serveur hébergeant MongoDB Autres check(s) impacté(s) :
| |||||
| Modèle d'hôte ( Onglet Données ) | --- | ~/.ssh/id_rsa | ~/.ssh/id_rsa | Clé SSH privée permettant la connexion au serveur hébergeant MongoDB | 7770 | 7770 | Configuration du port de communication avec l'Arbiter. Autres check(s) impacté(s) :
Note : Cette valeur remplacera dans la commande la valeur $ARG2$ |
Les données DFE ( Duplicate Foreach )
| |||||||
| Modèle d'hôte ( Onglet Données ) | seconde | 5 | 5 | Temps d'attente maximum autorisé à la connexion au serveur hébergeant MongoDB Autres check(s) impacté(s) :
| ||
| Modèle d'hôte ( Onglet Données ) | milliseconde | 8000 | 8000 | Seuil d'avertissement pour le temps de flush de la base de données | ||
| Modèle d'hôte ( Onglet Données ) | milliseconde | 10000 | 10000 | Seuil critique pour le temps de flush de la base de données |
Les données DFE ( Duplicate Foreach )
Pas de données DFE pour ce check. Excerpt Include
Données utilisées provenant du check
Pas de données spécifiques pour ce check.
Données globales
| Excerpt Include | ||||||
|---|---|---|---|---|---|---|
|
Propriétés de l'hôte
| Excerpt Include | ||||||
|---|---|---|---|---|---|---|
|
Résultat
Exemple
| Panel |
|---|
Interprétation
Statut
Il peut prendre deux valeurs OK / CRITIQUE / ATTENTION / INCONNU .
- Le statut va dépendre du retour de sonde et de la configuration spécifique du check pour les données suivantes :
- DB_LAST_FLUSH_TIME_CRIT
- DB_LAST_FLUSH_TIME_WARN
- DB_SSH_TUNNEL_TIMEOUT
- CHECK
- HOSTCHECK_SHINKEN_TIMEOUT
Voici un tableau récapitulatif du statut attendu suivant le retour de sonde :
Situation | Statut |
|---|---|
En fonction temps de connection à la base mongo :
| CRITIQUE |
En fonction temps de connection à la base mongo :
| ATTENTION |
Si la sonde n'a pas eu de réponse du tunnel SSH avant le temps maximum
| INCONNU |
Si un démon est bloqué et doit être redémarré | CRITIQUE |
Si erreur de surcharge des disques de logs | ATTENTION |
Si le démon a bloqué une tentative de chargement d'objet malveillant | ATTENTION |
Si le démon est en cours d'arrêt | ATTENTION |
Si la sonde n'a pas eu de réponse avant le temps maximum
| |
| |
| INCONNU |
Résultat
Renvoi au format texte :
- Si le démon fonctionne correctement, la version installée et le temps qu'a pris le check pour établir la communication avec le checkla durée du dernier "Flush" de la base de données.
Résultat Long
Précise le fonctionnement des modules de l'Arbiter, leur statut, le nombre de redémarrages lors des 24 dernières heures, la date de dernier redémarrage et les sous-modules
Description des erreurs
Démon est bloqué et doit être redémarré
- Si un démon est dans un état bloqué, il doit être redémarré. Si c'est le cas :
- les checks seront en ERROR avec le message suivant,
- il faut ouvrir un ticket à votre support pour analyser le blocage
| Panel |
|---|
Pas de résultat long pour ce check.
Métriques
Pas de métriques pour ce check
Erreur de surcharge des disques de logs
- En cas de disques trop lent sur le volume des logs, le check sera mis en WARNING avec l'erreur suivante.
| Panel |
|---|
Le démon a bloqué une tentative de chargement d'objet malveillant
Il est possible qu'un démon puisse détecter et bloquer une tentative d'injection d'objet malveillant par le biais de l'une de ses routes.
Un message est remonté :
- le nombre total de ces tentatives que le démon a bloqué ce jour ( le compte commence à minuit ) ;
- pour chacune des tentatives ( maximum 3 ) :
- descriptif de l'objet que l'attaquant essaye de charger,
- sa provenance de l'attaque, par exemple le nom de la route utilisée, et l'IP à la source de l'attaque,
- sa date.
| Panel |
|---|
Le démon est en cours d'arrêt
Lorsque le démon est en cours d'arrêt, le check le signale, et les informations relatives aux modules ne sont plus disponibles
| Panel |
|---|
Métriques
| No Format | ||||
|---|---|---|---|---|
| ||||
connexion_time |
.






