Mon ami Jim Serrano me dit qu’il a des problèmes de disponibilité avec son infrastructure, des problèmes qui arrivent de manière aléatoire, répétitive et non régulière …

C’est bien connu dans le métier IT, pour régler un problème il faut commencer par régler d’autres problèmes d’abord.

Voici donc une série de 2 articles :

Monitoring, Simplement

Quand on évoque monitoring ou supervision, on pense tout de suite à Nagio, mais non, pas de ça ici et voici pourquoi, d’ailleurs c’est valable aussi pour les autres dinos genre Zabbix.

Voici à quoi resemble une supervision moderne :

grafana-prometheus-telegraf

Les composants

Les curieux auront remarqué d’eux-même : tous ces éléments sont écrités en golang.

Entre les 3 sites, on ne veut pas de VPN (trop de contraintes, des fournisseurs différents, pas envie etc …), et la solution la plus simple pour communiquer entre eux, de manière sécurisée, c’est l’https avec une authentification par un Json Web Token – JWT, et c’est rendu possible par la flexibilité de Caddy – voyez vous-même sur la page de download – et par un plugin telegraf : gobhttp spécialement conçu par votre serviteur pour l’ocassion.

L’infrastructure

Mise en marche

Le déploiement est simplissime : on copy les 4 binaires, leurf fichier de conf, on lancer le docker et pis c’est tout. (je le détaillerais un peu plus un de ces jours).

Actions !

screenshot-grafana

Et ce n’est pas tous : à l’origine, on été parti pour régler les problèmes de l’ami Jim, voici donc 2nd partie : Tcpdump, dit-moi tout