{{tag>Lucid tutoriel haute_disponibilité}} ---- ====== Cluster de deux machines ip virtuelle + supervision d'un service====== Ce tutoriel est une sous-partie de la documentation pacemaker. Il décrit les différentes étapes de configuration du cluster par l'intermédiaire de la commande crm. Je vous conseille néanmoins de configurer les ressources avec l'interface java de Linbit. Le but de cette configuration est de créer un cluster de serveur web (ou de reverse proxy) de deux machines. Une adresse virtuelle est partagée entre les deux machines, lorsque l'une d'entre elle est hors ligne l'autre machine peut prendre le relai automatiquement. Détail des étapes de la configuration: - Adresse ip virtuelle partagée entre les deux membres du cluster ici 192.168.1.100 - Lancement, arrêt et supervision d'un service par l'intermédiaire d'un script d'initialisation compatible LSB (ici nginx) - Clonage du service, nginx sera démarré sur les deux machines - Ordonnancement des ressources le service, nginx devra être démarré pour que l'adresse ip virtuelle soit attribuée à un membre du cluster | ^ Nom de poste ^ Adresse ip ^ ^ pc 1 | machine1 | 192.168.1.101 | ^ pc 2 | machine2 | 192.168.1.102 | ===== Pré-requis ===== * Bien connaître le principe de fonctionnement de [[:pacemaker]]. * Comprendre le principe de la norme LSB pour les scripts d'initialisation. Les scripts d'initialisation sont ceux disponibles dans le répertoire /etc/init.d/. Pacemaker va les utiliser pour démarrer, arrêter et superviser l'état du service. C'est pourquoi ces scripts doivent respecter les normes lsb. Pacemaker a par exemple besoin que les scripts possèdent un argument status. Pour plus d'informations visitez cette [[http://wiki.debian.org/LSBInitScripts|page]] * Avoir effectué le tutoriel officiel en anglais est une bonne chose. [[http://www.clusterlabs.org/doc/en-US/Pacemaker/1.1/html/Clusters_from_Scratch/index.html|lien]] * Ne pas avoir peur de lire la documentation officielle de pacemaker qui se trouve [[http://www.clusterlabs.org/doc/en-US/Pacemaker/1.1/html/Pacemaker_Explained/index.html|ici]]. ===== Configuration ===== Entrer dans le mode de configuration du cluster sudo crm configure ==== Paramétrage des options générales ==== Premierement nous allons désactiver deux fonctionnalités inutile pour notre cluster * mode stonith "shot the other node in the head" permet lorsqu'une machine n'est plus joignable d'être sur que cette machine soit bien hors ligne * quorum indique le nombre minimal de membres pour prendre une décision. Ce paramètre est utile pour les cluster de plus de deux machines Désactivation du mode stonith property stonith-enabled=false Désctivation du paramètre quorum property no-quorum-policy=ignore ==== Paramétrage du service nginx ==== Avant toute chose pensez à désactiver le démarrage automatique du démon avec la commande ci dessous sudo update-rc.d -f nginx remove Ensuite nous allons indiquer à pacemaker de superviser le processus nginx. Pour cela il est nécessaire que le logiciel possède un script de démarrage et d'arrêt dans le répertoire /etc/init.d. Ce script doit en outre respecter les normes LSB (si il est est déjà présent il doit sûrement les respecter). A l'avenir c'est pacemaker qui démarrera nginx par intermédiaire de ce script. Instruction permettant à pacemaker de superviser un programme par l'intermédiaire de son script systemV (init script) Syntaxe de base primitive lsb:: op monitor interval=5s Dans notre cas primitive reverse-proxy lsb::nginx op monitor interval=5s Clonage de la ressource pour que le démon nginx soit démarré sur les deux machines en même temps. Cela permet une migration plus rapide. Pacemaker n'ayant pas à démarrer le processus puis à faire migrer l'adresse ip. Syntaxe de base clone Dans notre cas clone clone_reverse_proxy reverse-proxy ==== Paramétrage de l'ip virtuelle ==== Création d'une ip virtuelle partagée entre les deux membres du cluster primitive ocf:heartbeat:IPaddr2 params ip="" broadcast="" cidr_netmask="" nic="" meta target-role="started" migration-threshold="2" resource-stickiness="100" op monitor interval="" explications: ^ Options ^ explications ^ | target-role | started ou stopped l'état dans lequel pacemaker doit maintenir la ressource | | migration-threshold | nombre maximal d'échec de la ressource, après lesquels la machine est déclarée inéligible pour recevoir la ressource | | resource-stickiness | Ce paramètre est utile lorsque l'on définit une règle "location" indiquant la machine élue par défaut pour héberger la ressource. Nous ferons une configuration de ce type plus tard. Ce paramètre empêche la ressource de retourner sur la machine élue par défaut après que celle ci est défaillit et soit revenue en ligne. La ressource devra être migrée manuellement. La valeure numérique attribuée à ce paramètre doit être supérieure à celle attribuée dans la règle "location". | Dans notre cas primitive ip_virtuelle ocf:heartbeat:IPaddr2 params ip="192.168.1.100" broadcast="192.168.1.255" cidr_netmask="24" nic="eth0:0" meta target-role="started" migration-threshold="2" resource-stickiness="100" op monitor interval="10s" ==== Lien entre les ressources ==== Par défaut pacemaker répartie les ressources entre les membres du cluster. Bien qu'ici une des ressources soit clonée il est préférable de créér un lien entre les deux ressources //clone_reverse_proxy// et //ip_virtuelle// Syntaxe de base colocation link-ressources INFINITY: Dans notre cas colocation link-ressources INFINITY: ip_virtuelle clone_reverse_proxy Il est aussi nécessaire d'établir un ordre de démarrage entre les ressources. En effet l'ip virtuelle ne doit être activée que si le démon nginx est lancée Syntaxe de base order mandatory: Dans notre cas order demon_before mandatory: clone_reverse_proxy ip_virtuelle Il peut aussi être intéressant de choisir une machine préférée pour accueillir la ressource. Ici nous voulons que l'adresse ip virtuelle soit activée par défaut sur la machine1. Syntaxe de base location : Dans notre cas location node-master ip_virtuelle 50: machine1 ==== Vérification et application de la configuration ==== Vérifier que votre configuration est correcte, normalement l'analyse ne doit pas rapporter d'erreurs verify Puis appliquez votre configuration au cluster commit ==== Afficher l'état du cluster ==== Affichage de l'état du cluster, avec les compteurs d'échecs sudo crm_mon -1f Vous devriez voir un résultat semblable Online: [ machine1 machine2 ] Clone Set: clone_reverse_proxy Started: [ machine1 machine2 ] ip_virtuelle (ocf::heartbeat:IPaddr2): Started machine1 ===== Tester sa configuration ===== Vous pouvez facilement vous rendre compte des migrations de ressources dans le cluster en personnalisant les pages internet des serveurs webs nginx. Le chemin de la page d'accueil est ///var/www/nginx-default/index.html// . ==== Meurtre du processus nginx ==== Effectuer les commandes sur le poste hébergeant l'adresse ip virtuelle. ps -aux | grep nginx kill Vous devriez voir que le compteur d'échec a été incrémenté Online: [ machine1 machine2 ] Clone Set: clone_reverse_proxy Started: [ machine1 machine2 ] ip_virtuelle (ocf::heartbeat:IPaddr2): Started machine1 Migration summary: * Node machine2: * Node machine1: reverse-proxy:0: migration-threshold=1000000 fail-count=1 et si vous effectuez cette commande sudo /etc/init.d/nginx status Elle devrait vous retourner ce retour nginx is running Le processus a bien été redémarré après qu'il a été tué. Il n'y a pas eu de migration de l'adresse ip. ==== Blocage du redémarrage du serveur nginx ==== Cette fois ci nous allons être un peu plus pervers. Nous allons empêcher le serveur nginx de redémarrer. Normalement l'adresse ip devrait migrer vers l'autre machine. Éditer le fichier /etc/nginx/nginx.conf et ajouter cette ligne au début du fichier plop ! Tuer à nouveau le processus du démon nginx Vous devriez obtenir ce résultat Online: [ machine1 machine2 ] Clone Set: clone_reverse_proxy Started: [ machine2 ] Stopped: [ reverse-proxy:0 ] ip_virtuelle (ocf::heartbeat:IPaddr2): Started machine2 Migration summary: * Node machine2: * Node machine1: reverse-proxy:0: migration-threshold=1000000 fail-count=1000000 On peut voir que l'adresse ip virtuelle a été migrée vers la machine 2 et que le compteur d'échec a été fixé à sa valeur maximale. ===== Voir aussi ===== * **(fr)** [[:pacemaker|fiche du logiciel pacemaker]] ---- //Contributeurs principaux : [[:utilisateurs:Miam Miam]].//