Ldfa Posté(e) le 30 décembre 2019 Posté(e) le 30 décembre 2019 Ce mémo décrit la mise en place d’une supervision basée sur Centréon pour superviser un cluster Ceph haute disponibilité sous Proxmox. Pour ce faire, j’ai configuré le plugin check-ceph-dash sur Centréon et installé ceph-dash sur chaque nœud qui compose mon cluster Ceph. Mon choix s’est porté sur cette solution car ce couple de scripts m’apporte une grande souplesse pour la mise en service et me permet d’avoir un tableau de bord sur chacun de mes nœuds en plus de ma plateforme de supervision. Installation de ceph-dash sur les nœuds du cluster Ceph Cloner le script sur chaque nœud : cd opt/ git clone https://github.com/Crapworks/ceph-dash.gitTester le script : cd ceph-dash/ ./ceph-dash.py Exemple de résultat : OK: ceph cluster operates with no problems|bytes_total=71872285999104 num_pgs=1088 data_bytes=13828199913 read_op_per_sec=0 bytes_used=40517853184 num_osds=18 num_up_osds=18 num_in_osds=18 write_op_per_sec=0 read_bytes_sec=0 write_bytes_sec=2040 bytes_avail=71831768145920 Test de l’interface web de ceph-dash : http://IP_cluster-01:5000 Créer un service pour exécuter ceph-dash automatiquement sur les nœuds avec systemd Se placer dans le répertoire des services :cd /etc/systemd/systemCréer un service portant le nom du script ceph-dash :nano ceph-dash.serviceColler le contenu : [Unit] Description=Monitoring Cluster Ceph [Service] Type=simple ExecStart=/opt/ceph-dash/ceph-dash.py -d Restart=on-failure [Install] WantedBy=multi-user.target Rendre le service exécutable :chmod +x ceph-dash.serviceActiver le service au démarrage du système :systemctl enable ceph-dash.serviceDémarrer le service :systemctl start ceph-dash.serviceVérifier son statut :systemctl status ceph-dash.service ● ceph-dash.service - Monitoring Cluster Ceph Loaded: loaded (/etc/systemd/system/ceph-dash.service; enabled) Active: active (running) since Wed 2017-03-29 13:21:27 CEST; 1min 9s ago Main PID: 147177 (python) CGroup: /system.slice/ceph-dash.service ├─147177 python /opt/ceph-dash/ceph-dash.py -d └─147182 /usr/bin/python /opt/ceph-dash/ceph-dash.py -d Mar 29 13:21:27 pve-02 systemd[1]: Started Monitoring Cluster Ceph. Mar 29 13:21:27 pve-02 ceph-dash.py[147177]: * Running on http://0.0.0.0:5000/ Mar 29 13:21:27 pve-02 ceph-dash.py[147177]: * Restarting with reloader Installation du plugin check_ceph_dash sur Centréon Se placer dans le répertoire des plugins :cd /usr/lib/nagios/pluginsCloner le plugin check_ceph_dash :git clone https://github.com/Crapworks/check_ceph_dash.gitTester le plugin : cd check_ceph_dash/ ./check-ceph-dash.py --url http://IP-cluster-01:5000 Exemple de résultat : OK: ceph cluster operates with no problems|bytes_total=71872285999104 num_pgs=1088 data_bytes=13828597225 read_op_per_sec=0 bytes_used=40509227008 num_osds=18 num_up_osds=18 num_in_osds=18 write_op_per_sec=0 read_bytes_sec=2040 write_bytes_sec=2040 bytes_avail=71831776772096 Création et configuration d’un service pour superviser un cluster Ceph dans Centréon Créer la commande :Créer le service :Associer le service à un modèle d’hôte :Redémarrer le collecteur :Résultat après quelques minutes quand tout est OK :Résultat avec des soucis sur le cluster Ceph : Afficher l’article complet
Messages recommandés
Archivé
Ce sujet est désormais archivé et ne peut plus recevoir de nouvelles réponses.