Aller au contenu

Centréon : superviser un cluster Ceph


Ldfa

Messages recommandés

Posté(e)

Ce mémo décrit la mise en place d’une supervision basée sur Centréon pour superviser un cluster Ceph haute disponibilité sous Proxmox.

Pour ce faire, j’ai configuré le plugin check-ceph-dash sur Centréon et installé ceph-dash sur chaque nœud qui compose mon cluster Ceph.

Mon choix s’est porté sur cette solution car ce couple de scripts m’apporte une grande souplesse pour la mise en service et me permet d’avoir un tableau de bord sur chacun de mes nœuds en plus de ma plateforme de supervision.

Installation de ceph-dash sur les nœuds du cluster Ceph

  • Cloner le script sur chaque nœud :
cd opt/
git clone https://github.com/Crapworks/ceph-dash.git
Tester le script :
cd ceph-dash/
./ceph-dash.py
  • Exemple de résultat :
OK: ceph cluster operates with no problems|bytes_total=71872285999104 num_pgs=1088 data_bytes=13828199913 read_op_per_sec=0 bytes_used=40517853184 num_osds=18 num_up_osds=18 num_in_osds=18 write_op_per_sec=0 read_bytes_sec=0 write_bytes_sec=2040 bytes_avail=71831768145920
Test de l’interface web de ceph-dash : http://IP_cluster-01:5000

ceph-dashboard-496x500.png

Créer un service pour exécuter ceph-dash automatiquement sur les nœuds avec systemd

  • Se placer dans le répertoire des services :
cd /etc/systemd/system
Créer un service portant le nom du script ceph-dash :
nano ceph-dash.service
Coller le contenu :
[Unit]
Description=Monitoring Cluster Ceph

[Service]
Type=simple

ExecStart=/opt/ceph-dash/ceph-dash.py -d

Restart=on-failure

[Install]
WantedBy=multi-user.target
Rendre le service exécutable :
chmod +x ceph-dash.service
Activer le service au démarrage du système :
systemctl enable ceph-dash.service
Démarrer le service :
systemctl start ceph-dash.service
Vérifier son statut :
systemctl status ceph-dash.service
● ceph-dash.service - Monitoring Cluster Ceph
   Loaded: loaded (/etc/systemd/system/ceph-dash.service; enabled)
   Active: active (running) since Wed 2017-03-29 13:21:27 CEST; 1min 9s ago
 Main PID: 147177 (python)
   CGroup: /system.slice/ceph-dash.service
           ├─147177 python /opt/ceph-dash/ceph-dash.py -d
           └─147182 /usr/bin/python /opt/ceph-dash/ceph-dash.py -d

Mar 29 13:21:27 pve-02 systemd[1]: Started Monitoring Cluster Ceph.
Mar 29 13:21:27 pve-02 ceph-dash.py[147177]: * Running on http://0.0.0.0:5000/
Mar 29 13:21:27 pve-02 ceph-dash.py[147177]: * Restarting with reloader

Installation du plugin check_ceph_dash sur Centréon

  • Se placer dans le répertoire des plugins :
cd /usr/lib/nagios/plugins
Cloner le plugin check_ceph_dash :
git clone https://github.com/Crapworks/check_ceph_dash.git
Tester le plugin :
cd check_ceph_dash/
./check-ceph-dash.py --url http://IP-cluster-01:5000
  • Exemple de résultat :
OK: ceph cluster operates with no problems|bytes_total=71872285999104 num_pgs=1088 data_bytes=13828597225 read_op_per_sec=0 bytes_used=40509227008 num_osds=18 num_up_osds=18 num_in_osds=18 write_op_per_sec=0 read_bytes_sec=2040 write_bytes_sec=2040 bytes_avail=71831776772096

Création et configuration d’un service pour superviser un cluster Ceph dans Centréon

  • Créer la commande :

centreon-check_ceph-commande-550x150.png

Créer le service :

centreon_check-ceph-service-550x168.png

Associer le service à un modèle d’hôte :

centreon-check_ceph-model-hote-550x211.p

Redémarrer le collecteur :

centreon-restart-collecteur-550x246.png

Résultat après quelques minutes quand tout est OK :

centreon-check-cluster-ceph-550x388.png

Résultat avec des soucis sur le cluster Ceph :

centreon-check_ceph-warning-550x371.png

Afficher l’article complet

Archivé

Ce sujet est désormais archivé et ne peut plus recevoir de nouvelles réponses.

×
×
  • Créer...

Information importante

Nous avons placé des cookies sur votre appareil pour aider à améliorer ce site. Vous pouvez choisir d’ajuster vos paramètres de cookie, sinon nous supposerons que vous êtes d’accord pour continuer.