Shinken Enterprise s’appuie sur des programmes externes appelés "sondes" ( plugins dans l'univers de la supervision en anglais ) pour pouvoir superviser une large variété d'éléments.
Un certain nombre de sondes sont incluses lorsque de l'installation de Shinken Enterprise, mais il est également possible d'utiliser celle de la communauté ou de développer les vôtres du moment qu'elle respecte les règles décrites dans cette page ( hérité de l'univers nagios ).
Si vous développez vos sondes :
Shinken Enterprise est livré avec un ensemble de sondes par défaut.
Elles représentent les chemins des répertoires des sondes :
| Variable | Chemin | Description | |
|---|---|---|---|
$PLUGINSDIR$ | /var/lib/shinken/libexec | Ce répertoire contient des sondes adaptées et utilisées spécifiquement pour Shinken Enterprise.
| |
$USERPLUGINSDIR$ | /var/lib/shinken-user/libexec | Ce répertoire contient vos propres sondes. Ce répertoire ne sera jamais modifié lors de mises à jour. | |
$NAGIOSPLUGINS$ | /var/lib/shinken-user/libexec | Ce répertoire contient des sondes issues de Nagios |
Dans les répertoires $NAGIOSPLUGINS$ et $PLUGINSDIR$, il y a des sondes pour surveiller tout type d'éléments et services.
Elles utilisent des protocoles standard comme : WMI, SNMP, SSH, TCP, UDP, ICMP, LDAP et plus encore.
Cela permet de surveiller à peu près tout :
Unix/Linux, Windows
Routeurs, Switches
services réseau : "HTTP", "POP3", "IMAP", "FTP", "SSH", "DHCP"
Charge CPU, utilisation disque, utilisation mémoire…
Applications, Bases de données, logs et plus.
Il est possible de créer votre propre variable globale qui représentera un chemin personnalisé. Par exemple pour un Poller Windows, vous pouvez rajouter : $WINPLUGINSDIR$=C:\shinken\libexec |
Les sondes sont utilisées par les commandes Shinken. Commandes qui peuvent être rattachées directement à des hôtes et des checks ( via leurs commandes de vérification ), ou encore à des méthodes de notifications ( voir la page Créer une méthode de notification spécifique - bonnes pratiques ) ou commandes lancées par le gestionnaire d'événements ( voir la page Gestionnaire d'événements ).
Suivant le cas, elles seront donc exécutées par le Poller ( pour les hôtes et checks ) ou par le Reactionner ( pour les notifications et les gestionnaires d'évènements ).
Le démon correspondant exécutera alors la commande de son répertoire de sonde. Les processus Shinken des démons, lancés en tant qu'utilisateur Unix "shinken", utiliseront donc l'utilisateur "shinken" pour l'exécution des sondes.
Pour la bonne exécution des sondes, il est donc important de s'assurer que l'utilisateur shinken puisse correctement accéder en exécution aux scripts/sondes.
Pour cela, si besoin, rajoutez les droits UNIX correspondants :
chmod 755 ma_sonde.py |
ou
chmod +x ma_sonde.py |
Aussi, les droits propriétaires des scripts peuvent rester root/root, il n'est pas nécessaire de changer le "propriétaire" ( ownership ) du fichier à l'utilisateur "shinken" via la commande chown.
La plupart des sondes possèdent une option pour afficher l'aide dans la ligne de commande : "-h" ou "--help".
Comme vu précédemment, les scripts sont exécutés via l'utilisateur UNIX shinken, il faut donc effectuer les tests à partir de cet utilisateur :
su - shinken |
Par exemple, pour savoir comment fonctionne la sonde check_http ( sonde du répertoire $NAGIOSPLUGINS$ qui vérifie le statut du port HTTP d'un serveur ) ou pour savoir quelles options sont possibles, il est possible de lancer la commande suivante :
/usr/lib64/nagios/plugins/check_http --help |
Voici un extrait de l'aide de la commande :
Options:
-h, --help
Print detailed help screen
-V, --version
Print version information
--extra-opts=[section][@file]
Read options from an ini file. See
https://www.nagios-plugins.org/doc/extra-opts.html
for usage and examples.
-H, --hostname=ADDRESS
Host name argument for servers using host headers (virtual host)
Append a port to include it in the header (eg: example.com:5000) |
On peut lire que l'option "-H" permet de préciser le nom de l'hôte à tester, donc pour tester la réponse http de www.google.fr, on peut faire la commande suivante :
/usr/lib64/nagios/plugins/check_http -H www.google.fr |
Qui donne le retoure suivante :
HTTP OK: HTTP/1.1 200 OK - 11837 bytes in 0.313 second response time |time=0.312690s;;;0.000000 size=11837B;;;0 |
Ici la ligne de retour contient deux parties séparées par le symbole pipe |.
Le chapitre suivant présente comment se compose le retour d'une sonde pour la création des scripts de sonde.
Voici comment créer des sondes ! Ces sondes seront à placer dans le répertoire $USERPLUGINSDIR$.
Les scripts et les exécutables doivent faire au moins deux choses :
Le fonctionnement interne de la sonde importe peu à Shinken Enterprise, c'est l'interface entre eux deux qui compte.
La sonde peut vérifier le statut d'un port TCP, lancer une requête sur une base de données, ou faire tout ce qui est nécessaire pour vérifier un élément sur un réseau LAN ou WAN ou encore sur Internet.
Les détails dépendront de ce qui doit être vérifié.
Shinken Enterprise détermine le statut d'un hôte ou d'un check en évaluant le code retour de la sonde.
La table suivante montre la liste des codes retour valides, avec leur statut correspondant, suivante si la commande est attachée à un check ou à un hôte :
| Code retour | Statut du Check | Statut de l'hôte |
|---|---|---|
| 0 | OK | UP |
| 1 | WARNING | DOWN |
| 2 | CRITICAL | DOWN |
| 3 | UNKNOWN | DOWN |
Au minimum, la sonde doit retourner une ligne de texte sur la sortie standard ( STDOUT ).
La sonde peut également retourner en option des données de performance pour la métrologie.
Le format standard de sortie d'une sonde est donc le suivant :
TEXT OUTPUT | OPTIONAL_PERFDATA
Les données de performance sont optionnelles. Si une sonde retourne des données de performance, elles doivent être séparées du reste du texte par le symbole pipe | .
Voici quelques exemples possibles.
Cas 1: une ligne de retour ( texte seulement )
Imaginons une sonde qui retourne une ligne telle que décrite en dessous :
DISK OK - free space: /var 3326 MB (56%); |
Si cette sonde est utilisée pour réaliser une vérification de service, la totalité de la ligne retour sera stockée dans $SERVICEOUTPUT$ .
Cas 2: une ligne de retour ( texte et données de performance )
La sonde peut retourner en option des données de performance utilisables par Graphite. Dans ce cas, les données de performance doivent être séparées par le symbole pipe " | " :
DISK OK - used space: /var 3326 MB (56%); | /var=3326 |
Si cette sonde est utilisée pour vérifier un service, la partie à gauche du symbole sera stockée dans $SERVICEOUTPUT$ et la partie à droite du séparateur sera stockée dans $SERVICEPERFDATA$
Cas 3: plusieurs lignes de retour ( texte et données de performance )
En plus de retourner des données de performances, la sonde peut retourner un résultat long à l'aide d'un saut de ligne.
À ce moment-là, le retour de la sonde sera divisé en trois parties :
DISK OK - used space: /var 3326 MB (56%); | /var=3326 |
Il est tout à fait possible de retourner du HTML/CSS dans le retour des sondes.
De cette manière, il est possible d'insérer du style et donc d'améliorer le retour des sondes affiché dans l'Interface de Configuration ( évaluation des checks ), dans l'Interface de Visualisation ( liste et panneau de détails ) et dans les mails de notification.
Voici un exemple :
<span style="color:#e48c19;font-weight: bold;">[WARNING]</span> 1 disk uses more than 95% of his total disk space :<br/><li>/ (97%)</li>
<style type="text/css"> .disks-table, .disks-table td, .disks-table th { border: 1px solid #000000 !important; border-collapse: collapse !important; color: #000000 !important; } .disks-table { width: 90% !important; } .disks-table-th { background-color: #E8E7E7 !important; width: auto !important; max-width: 20% !important; padding: 2px !important; word-break: break-word !important; background-color: #E8E7E7 !important; text-align: center;}.disks-table-td { padding: 2px !important; width: auto !important; max-width: 20% !important; font-weight: normal !important; word-break: break-word !important; background-color: #FFFFFF !important; } .disks-host-command { font-style: italic !important; color: #7F7F7F !important; } .disks-table-center { text-align: center; } </style><br/>More than 95% of total disk space used :<br/> <table class="disks-table"><tr><th class="disks-table-th">Disk</th><th class="disks-table-th">Usage</th><th class="disks-table-th">Used</th><th class="disks-table-th">Total</th></tr>
<tr> <td class="disks-table-td">/</td> <td class="disks-table-td">97%</td><td class="disks-table-td">68.9GB</td><td class="disks-table-td">75.2GB</td></tr>
</table><br> | "/boot_used_pct"=16%;95%;98%;0%;100% "/boot_used"=0.069993019104GB;0.441808128357;0.455759963989;0;0.465061187744 "/_used_pct"=97%;95%;98%;0%;100% "/_used"=68.8651046753GB;71.4608747482;73.7175339508;0;75.2219734192 |
Attention aux différentes méthodes de notification, la plupart des clients mail pourront interpréter le HTML, mais par exemple une notification par SMS ne sera pas interpréter sur le téléphone. |
Exemple de retour de sonde en HTML depuis l'Interface de Configuration :
|
Exemple de retour de sonde en HTML depuis l'Interface de Visualisation :
|
Dans la sortie d’une sonde, les données de performance se trouvent après le caractère |, selon le format : TEXT OUTPUT | OPTIONAL_PERFDATA. Ces données sont facultatives. Une sonde peut retourner une ou plusieurs données de performance.
Les données de performance sont sauvegardées dans la base de données Graphite ( voir la page Base de métrologie ( Graphite ) )
Les données de performance sont accessibles depuis le widget Graphique ( voir la page Widget Graphique ), l'onglet Graphiques ( voir la page Onglet Graphiques ) et les outils tiers capables de traiter les données de Graphite. Shinken assure la compatibilité avec Grafana ( voir la page Grafana - v8.3.2 )
La syntaxe de Shinken se rapproche de la syntaxe des données de performance utilisée par Nagios ( voir la documentation de nagios https://nagios-plugins.org/doc/guidelines.html#AEN200 ). Contrairement à Nagios, Shinken ne gère pas les intervalles pour les seuils critique et d'avertissement. Par conséquent, les intervalles de seuils d'une sonde compatible Nagios ne seront pas pris en charge par Shinken.
La syntaxe d’une donnée de performance est la suivante : 'label'=valueUNIT;warning;critical;minimumvalue;maximalvalue
Les différents champs sont séparés par un point virgule ( ; ).
Exemple
Ok: | 'metric'=14;90;9 |
| Nom | Explication | Règle syntaxique | Commentaire | |
|---|---|---|---|---|
| label | Nom de la métrique | Caractères interdits : le signe égal ( = ) la barre verticale ( | ) et les guillemets ( ' ou " ) Caractères transformés : Les caractères non alphabétiques ou numériques sont automatiquement convertis en un underscore ( |
| |
| value | Valeur de la métrique | Accepte les entiers ou réels, et peut être précédé d'un signe plus ou moins ( + ou - ). Il est possible d'écrire les puissances de 10 à l'aide du symbole 'e' ou 'E' ( par exemple 1e3 pour 1000 ) | ||
| UNIT | Unité | Accepte les caractères alphabétiques, les chiffres et le caractère % | Il faut préciser l'unité que pour la value. Pour l'instant cette valeur n'est pas sauvegardée par Shinken. | |
| warning | Seuil de warning affiché | Accepte les entiers ou réels, et peut être précédé d'un signe plus ou moins ( + ou - ). Il est possible d'écrire les puissances de 10 à l'aide du symbole 'e' ou 'E' ( par exemple 1e3 pour 1000 ) | S'affiche dans les graphiques des interfaces. | |
| critical | Seuil de critique affiché | Accepte les entiers ou réels, et peut être précédé d'un signe plus ou moins ( + ou - ). Il est possible d'écrire les puissances de 10 à l'aide du symbole 'e' ou 'E' ( par exemple 1e3 pour 1000 ) | S'affiche dans les graphiques des interfaces. | |
| minimumvalue | Valeur minimale que pourra retourner la sonde | Accepte les entiers ou réels, et peut être précédé d'un signe plus ou moins ( + ou - ). Il est possible d'écrire les puissances de 10 à l'aide du symbole 'e' ou 'E' ( par exemple 1e3 pour 1000 ) | Pour l'instant cette valeur n'est pas sauvegardée par Shinken. | |
| maximalvalue | Valeur maximale que pourra retourner la sonde | Accepte les entiers ou réels, et peut être précédé d'un signe plus ou moins ( + ou - ). Il est possible d'écrire les puissances de 10 à l'aide du symbole 'e' ou 'E' ( par exemple 1e3 pour 1000 ) | Pour l'instant cette valeur n'est pas sauvegardée par Shinken. |
Pour renvoyer plusieurs données de performance, les données doivent se suivre, séparées par des espaces.
Exemple :
Ok: | 'metric_1'=14;90;95 'metric_2'=44;90;95 |
| Si le nom de la métrique ( label ) change, une nouvelle métrique sera sauvegardée. L'ancienne métrique est conservée dans la base de données, ce qui fera apparaître à la fois l'ancienne et la nouvelle métrique dans les graphiques. |
Dans l'Interface de Visualisation, l'ordre des métriques est constant et suit l'ordre lexicographique. Une particularité : le caractère slash ( / ) est traité comme la chaîne de caractères SLASH.
Grafana préserve le même ordre, mais le slash ( / ) est traduit en SLASH dans l'interface ( le label /var est traduit en SLASHvar ).
Exemple de l'ordre d'affichage dans l'Interface de Visualisation ( le / étant traité comme la chaine de caractère SLASH se trouve lexicographiquement entre RLASH et TLASH ) :
|
Ok: | 'metric~'=14;90;95 'metric!'=44;90;95 |
Ok: | 'shinken-broker [ master ]'=14;90;95 |
Ok: | 'shinken-broker [ master ]'=45.5B;70;80 |
Ok: | 'shinken-broker [ master ]'=-7;-25;-5 |
Shinken Enterprise va seulement lire les premiers 64 KB de données qu'une sonde retourne. Cela évite de surcharger la base de données et le flux d'échange entre les démons.
Voici un exemple simple et basique d'une sonde écrite en Python afin de vérifier la présence du fichier /tmp/test_file :
#!/usr/bin/env python
import os
import sys
# Shinken return values
shinkenRetValOk = 0
shinkenRetValWarn = 1
shinkenRetValCritical = 2
try:
os.stat("/tmp/test_file")
except:
print "CRITICAL! Unable to open test_file"
sys.exit(shinkenRetValCritical)
print "OK! The file /tmp/test_file exists"
sys.exit(shinkenRetValOk) |
Voici un exemple simple et basique d'une sonde check_file_exists.vbs écrite en VBS afin de vérifier la présence d'un fichier passé en argument ( avec retour d'une donnée de performance ):
Dim strfilepath
Dim wsh
Dim Perf_Data
'##########################################################'
Set objFSO = CreateObject("Scripting.FileSystemObject")
Set wsh = CreateObject("WScript.Shell")
'##########################################################'
If Wscript.Arguments.Count = 1 Then
strfilepath = Wscript.Arguments(0)
If (objFSO.FileExists(strfilepath)) Then
Perf_Data = "|'path_file_existance'=1"
Wscript.Echo "OK: the file with path " & strfilepath & " exists" & Perf_Data
Wscript.Quit(0)
else
Perf_Data = "|'path_file_existance'=0"
Wscript.Echo "CRITICAL: the file with path " & strfilepath & " does NOT exist" & Perf_Data
Wscript.Quit(2)
End If
else
Wscript.Echo "UNKNOWN"
Wscript.Quit(3)
End If |
Pour utiliser cette sonde sur un Poller sur Windows, la ligne de commande devra être définie comme tel :
C:\WINDOWS\SysWOW64\cscript.exe //nologo $WINPLUGINSDIR$\check_file_exists.vbs "$_HOSTFILEPATH$" |
Il est possible de dupliquer les sondes présente dans les répertoires $NAGIOSPLUGINS$ et $PLUGINSDIR$ et les placer dans le répertoire $USERPLUGINSDIR$ pour les personnaliser.
Beaucoup d'autres sondes sont disponibles dans la communauté Nagios, et plus particulièrement sur les sites suivants :
Shinken Monitoring Plugins: http://www.shinken.io/ - Des informations pour l'installation de pack Shinken IO Installer un pack de supervision
Monitoring Plugins Project: https://www.monitoring-plugins.org
Nagios Plugins Exchange: https://exchange.nagios.org/
Une fois la sonde réalisée ou téléchargée, il faut maintenant la mettre en place dans Shinken afin de pouvoir facilement l'utiliser via des checks appliqués à des modèles d'hôtes. Il est préférable de passer par des modèles d'hôtes et des checks dédiés à ces modèles pour pouvoir réutiliser ce check le plus simplement possible.