Le matériel

Assurer la surveillance entre machines du cluster

Plusieurs solutions :

  • Soit utiliser le réseau existant entre les machines, mais alors l'ensemble du réseau risque d'être pollué par des messages UDP,

  • Soit utiliser de nouvelles cartes réseaux pour relier les différents noeuds du cluster (leur propre réseau de surveillance),

  • Soit utiliser un câble NULL MODEM pour relier les deux noeuds du cluster par l'interface série (pour seulement deux machines).

Il est preferable de privilégier une communication spécifique entre les noeuds du cluster, afin de ne pas polluer le réseau avec les diffusions UDP associées au service Heartbeat. Ce faisant, on rencontre le problème suivant : On ne teste pas la rupture du câble réseau, ou un problème de carte réseau. Seul l'arrêt complet de la machine est testé (plus de signal sur le port série).

La surveillance sur le réseau de production

Cette méthode a l'inconvénient de polluer le réseau, et de modifier les éventuelles règles du firewall, car Heartbeat utilise des trames UDP sur le port 694 (configurable). Cet inconvénient est compensé par la surveillance de la rupture du câble, ou d'une défaillance quelconque du réseau en lui-même.

Le NULL-MODEM sur le port série

Le câble NULL MODEM permet d'échanger des données sur les prises séries de deux machines. Sous Linux, le port série est accessible (/dev/ttyS0 ) comme tout périphérique. Pour le tester, envoyez des données par une redirection :

Example 44.2. Après avoir connecté le NULL MODEM

Sur la première machine, lire le port série :

cat /dev/ttyS0

Sur l'autre machine, envoyer des données dans le port série :

echo "test" > /dev/ttyS0

Sur la première machine, le mot test devrait apparaître...

Le réseau de surveillance

Vous pouvez choisir de monter un réseau spécifique chargé de faire circuler les informations de contrôle des différents noeuds. Grâce à des cartes réseaux et un hub ou un switch (voir un simple câble croisé si il n'y a que deux noeuds). Dans ce cas, vous pouvez choisir par exemple d'adresser ce réseau en 10.0.0.0, et de construire la structure suivante :

Example 44.3. le cluster en réseau doublé

le cluster (virtuel) www : 192.168.1.100

la première machine srv-principal :

  • eth0 : 192.168.1.1

  • eth1 : 10.0.0.1

la deuxième machine srv-secours

  • eth0 : 192.168.1.2

  • eth1 : 10.0.0.2

Ici, le contrôle du fonctionnement de votre réseau de surveillance se fera par les outils habituels tel que ping,nmap,iptraf, comme pour le réseau de production.