http://www.ibm.com/developerworks/cn/linux/l-cn-hatesting/index.html
Linux 集群环境中高可用性实施和测试
什么是高可用性集群系统
通常,可用性采用
“
每年故障时间
”
进行衡量。常规的容错系统可以达到
99.99%
的可
故障
1
小时
(
每天故障
10
秒钟
)
。但高可用性系统则有望达到
99.999%
的业务时间
即每天故障
1
秒钟。这意味着当故障出现时,系统必须能自动处理
,无需人为干预
纠错。因为操作人员难以在很短的时间内移除或掩盖任何故障。
高可用性集群系统是基于两个或两个以上节点的环境,用于合作处理同一任务的系
点出现故障时,集群服务器会自动把某些资源转移到其它节点,使得客户机可以继
达到提供不间断服务的目的,用以提高系统的稳定性、可靠性等。
高可用性集群系统支持多种操作系统平台,本文着重介绍在
Linux
上高可用性集群
在
Linux
集群系统中实现对高可用性支持的常用方法
并不是所有的
Linux
集群系统都具有高可用性的功能,这需要提供额外的设计来支
硬件或软件出现故障时重新启动这些服务。通常,可通过增加冗余硬件或软件的方
以便针对这些常用方法来进行自动化测试的最佳实践。
多机就绪模式
所谓多机,即集群中的多台机器都是主服务器,共享文件系统,各自运行着一些服
器节点上,安装着完全相同的软件且共享文件系统。主服务器节点
node1
和
node2
的命令行利用
ifconfig
命令查看
CNFS IP
:
node1:~ # ifconfig
bond0:0 Link encap:Ethernet HWaddr 00:1A:64:C7:4C:0C
inet addr:9.11.124.11 Bcast:9.11.125.255 Mask:255.255.254.0
UP BROADCAST RUNNING MASTER MULTICAST MTU:1500 Metric:1
node2:~ # ifconfig
bond0:0 Link encap:Ethernet HWaddr 00:1A:64:C7:4C:54
inet addr:9.11.124.12 Bcast:9.11.125.255 Mask:255.255.254.0
UP BROADCAST RUNNING MASTER MULTICAST MTU:1500 Metric:1
评论0