KVM Monitoring avec Prometheus et Grafana

Que se passe t-il au cœur d’un hyperviseur KVM ? Comment se rendre compte de l’activité des appels système ? Est-ce la folie et l’effervescence digne des rues de Tokyo ou plutôt celle d’un village tranquille avec un petit port de pêche ?

Si vous êtes un fan du modèle UNIX – et je sais que vous l’êtes – vous voulez qu’un outil fasse une chose et qu’il le fasse bien.

Alors pour découvrir ce qui se passe dans notre hyperviseur, nous allons utiliser 3 outils open source, le tout interconnecté via des api pour exporter où l’on veut :

  • collectd : collecte les statistiques de libvirt
  • promotheus : stock les statistiques
  • grafana : présente les statistiques sous forme de graphique ou de conteur

Installation des outils

Première étape, installer nos 3 outils depuis l’open build service. Nous allons ajouter le dépôt dédié aux outils de monitoring et installer via zypper (rpm)

zypper ar http://download.opensuse.org/repositories/server:/monitoring/openSUSE_Factory/server:monitoring.repo
zypper in collectd collectd-plugin-virt
zypper in golang-github-prometheus-prometheus
zypper in grafana

Configuration de collectd

Dans collectd il est nécessaire de renseigner le chemin vers la socket libvirt, puis présenter les statistiques au format prometheus.

Dans le fichier /etc/collectd.conf ajouter les lignes suivantes :

LoadPlugin virt
<Plugin virt>
    Connection "qemu:///system"
    HostnameFormat "name"
</Plugin>

LoadPlugin write_prometheus
<Plugin write_prometheus>
    Port "9103"
</Plugin>

Puis relancer le service :

systemctl restart collectd

Configuration de prometheus

La configuration de prometheus est assez simple. Il suffit de créer un nouveau job pour stocker les statistiques présentées par collectd.

Dans le fichier /etc/prometheus/prometheus.yml ajouter :

- job_name: collectd
    static_configs:
    - targets:
        - 'localhost:9103'

Puis relancer le service.

systemctl start prometheus.service

Configuration de grafana

Comme une image vaut 1000 mots, un graphique coloré peut facilement nous raconter l’histoire d’un système.

La définition du compte admin se fait dans le fichier /etc/grafana/grafana.ini :

admin_user = admin
admin_password = strongsecret

Puis relancer le service.

systemctl start grafana-server.service

Vous pouvez maintenant vous connecter à l’interface web de grafana via l’url : https://mon_serveur:3000/ Ajout d’une datasource

Depuis l’interface web de grafana, la première étape est de récupérer les statistiques stockées dans prometheus. Pour cela il faut créer une datasource :

  • Name: collectd
  • Type: Prometheus
  • URL: http://localhost:9090
  • Access: Proxy

Ajout d’un dashboard

La seconde étape, est d’ajouter un dashboard pour transformer les statistiques en graphique.

Le site de grafana recense plusieurs dashboards créés par la communauté. Voici le lien pour le dashboard que j’utilise. Importer le dashboard grace à l’ID 8396

Lors de l’importation, sélectionner la datasource créer précédemment.

Profit

Maintenant grace à grafana, vous pouvez faire parler les chiffres. Que ce soit un vert apaisant signe que tout va bien ou un rouge criant : « on a besoin de plus de ressources ».

Written on October 17, 2018