内容概要: 1. 准备工作 注:heartbeat3 在centos6.4上不好用,所以我的实验环境时centos5.9,版本为heartbeat2 HA的心跳监测可以通过串口连接监测也可以通过网线监测,前者需要服务器有一个串口,后者需要有一个空闲网卡。 HA架构中需要有一个共享的存储设备 首先需要在两台机器上安装mysql服务,并架设好共享存储资源(NFS), 共享的目录应该是datadir HA需要两台机器配置一个相同的vip 理论上每台机器要配置三个ip,一个是vip(eth0:0),一个是心跳线监测使用的ip(eth1),还有一个是服务使用的ip(eth0) 我们设定如下环境: vip(eth0:0): 192.168.0.100 机器1 eth0:192.168.0.21 eth1: 192.168.200.128 机器2 eth0:192.168.0.22 eth1: 192.168.200.129 机器1 我们简称node1, 机器2我们简称node2 配置hosts, 两台机器一样: 192.168.0.21 node1 192.168.0.22 node2 node1 & node2 关闭防火墙,关闭selinux 2. 配置NFS安装mysql NFS由第三台机器(192.168.0.11)提供 NFS上:vim /etc/exports //内容如下 /data/share 192.168.0.0/24(rw,sync,no_root_squash) NFS上: /etc/init.d/rpcbind start; /etc/init.d/nfs start node1 & node2上以下步骤同: mkdir -p /data/mysql mount -t nfs 192.168.0.11:/data/share/ /data/mysql/ groupadd -g 27 mysql useradd -u 27 -g mysql mysql chown -R mysql:mysql /data/mysql 下载免编译的二进制mysql包 tar zxvf mysql-5.1.40-linux-i686-icc-glibc23.tar.gz; mv mysql-5.1.40-linux-i686-icc-glibc23 /usr/local/mysqlcd /usr/local/mysql cp support-files/my-large.cnf /etc/my.cnf cp support-files/mysql.server /etc/init.d/mysqld vim /etc/init.d/mysqld //更改datadir 以及 basedir node1上指定,node2 上不用执行这一步 ./scripts/mysql_install_db --user=mysql --datadir=/data/mysql node1 上先启动mysql,node2上暂时先不启动 /etc/init.d/mysqld start 如果想启动node2上的mysql,必须先停掉node1上的mysql,因为这两个mysql共同用一个datadir有共享的资源,会产生冲突,而在heartbeat服务中,如果node1正常则node2默认就停止mysql服务,只有当node1宕机,node2才会自动启动mysql服务 3. 安装配置heartbeat node1 & node2 : yum install -y heartbeat yum install -y heartbeat-* libnet 以下配置在node1: cd /usr/share/doc/heartbeat-2.1.3/; cp authkeys haresources ha.cf /etc/ha.d/ cd /etc/ha.d vim authkeys// 增加: auth 3 3 md5 Hello! 保存后更改它的权限: chmod 600 authkeys vim haresources //增加一行: node1 192.168.0.100/24/eth0:0 mysqld vim ha.cf //更改或增加如下内容 logfile /var/log/ha.log #bcast eth1 #心跳使用以太网广播方式,eth1为广播地址 ucast eth1 192.168.200.129 #单播形式与对方机器通信,与上者二选一 keepalive 2 #每2秒发一次广播 warntime 10 # 这个时间为警告时间,10s钟内没有收到对方节点的信号,则会发警告信息记录到日志里 deadtime 30 #30s内没有收到对方节点的信号则认为对方节点宕机,然后立即接管对方节点的服务 initdead 120 #这个时间是给重启系统留出来的等待时间,如果系统重启了那么网络服务不会立即正常使用 udpport 694 # 广播通信使用的端口 auto_failback on # 如果是on, 则当主节点故障恢复后,服务还会切换回来 node node1 #主节点主机名 node node2 #从节点主机名 ping 192.168.0.1 #仲裁节点,最好是一个比较强健的设备,比如说交换机 respawn hacluster /usr/lib/heartbeat/ipfail #当heartbeat启动时也会随着一起启动的进程放到这里,ipfail是用来检测网络连通性的工具,hacluster为启动该程序的用户 debugfile /var/log/ha-debug.log 把node1上的三个配置文件拷贝至node2 node1上执行: cd /etc/ha.d; scp ha.cf haresources authkeys node2:/etc/ha.d/ node2上修改 vim /etc/ha.d/ha.cf //把 ucast eth1 192.168.200.129改为 ucast eth1 192.168.200.128 启动heartbeat, node1 & node2 : service heartbeat start 4. 测试heartbeat node1 上把icmp禁止: iptables -I input -p icmp -j DROP tail -f /var/log/ha-log.log ifconfig 看,已经没有了 eth0:0 node2 上ifconfig 开启了eth0:0 在node1上解除防火墙 iptables -D input -p icmp -j DROP tail -f /var/log/ha-log.log ifconfig 看eth0:0 会开启,而node2上eth0:0会自动关闭 在node1上killall heartbeat, node2上也会自动开启eth0:0
本文转自 linuxpp 51CTO博客,原文链接:http://blog.51cto.com/1439337369/1717762,如需转载请自行联系原作者