IBM HACMP高可用性技术笔记

需积分: 10 1 下载量 18 浏览量 更新于2024-07-23 收藏 386KB PDF 举报
"IBM HACMP听课笔记.pdf" IBM High Availability Cluster Multiprocessing (HACMP) 是一种集群解决方案,专门设计用于提高AIX操作系统的可用性和稳定性。HACMP通过监测和处理潜在的单点故障(SPOF)来确保系统的高可用性。它能够动态地处理硬件故障,例如在多CPU环境中,如果一个CPU出现故障,HACMP会禁用该CPU以防止系统崩溃。 在HACMP 5.4版本中,引入了应用监控容错机制,这使得即使在特定应用出现故障时也能保持服务的连续性。此外,该版本还支持动态核心更新,即添加模块或驱动程序无需重启系统。HACMP的切换速度相当快,大约在30秒内完成基础切换,加上应用程序的准备,总耗时通常在3到4分钟之间。 AIX 5.3版本之后,HACMP开始支持网络聚合,允许将多个网络接口聚合在一起,提高带宽并提供冗余。HACMP的配置信息存储在Object Description Manager (ODM) 中,因此在多节点集群中,配置的同步至关重要。为了减少风险,建议使用RAC(Redundant Array of Independent Computers)集群时保持双节点配置,因为节点数量过多可能会影响性能。 HACMP 5.41之后,日志文件`hacmp.out`的位置发生了变化,现在位于`/var/hacmp/log/`目录下。值得注意的是,HACMP 5.4仅支持在Power架构的Linux上运行。对于异地容灾,IBM提供了HACMP XD选件,但费用较高,需要基于HACMP基础功能来实现。 在数据库高可用性方面,IBM DB2 提供了HADR(High Availability Disaster Recovery)功能,而Oracle则有Data Guard作为其灾备解决方案。Oracle的Automatic Storage Management (ASM) 类似于HA管理卷组,但它在出现问题时可能更难处理。HACMP主要关注三种类型的故障:节点、网络和网卡故障,并且建议尽量减少切换操作以降低风险。 资源组(RG)是HACMP中的一个重要概念,它是一组关联资源的集合,可以在节点之间迁移。每个资源只能属于一个资源组,每个资源组可以有独立的策略。集群可容纳64个资源组,32个节点,256个IP地址和16个物理网络。物理网络指如VLAN这样的实际网络基础设施,而逻辑网络则可能指的是网络段。HACMP并不负责备份恢复或时间同步,这些需要单独进行管理。 HACMP追求的目标是零停机时间,但这可能导致安全性降低,特别是当启用某些高级安全特性如TCB时。在非常不稳定或需要严格安全级别的环境中,可能不适合使用HA。同时,HACMP的并发资源管理(CRM)在5.1版本之后得到了整合。配置文件和应用软件应分别放置在每个节点上,以实现滚动升级和独立配置,尽管这需要在每个节点上重复工作。RAC(Real Application Clusters)与互备的主要区别在于,RAC允许共享资源的并发访问,而互备则是在一个节点失效时由另一个节点接管所有资源。共享存储保护技术,如Resilient Storage for Clusters Technology (RSCT),是IBM提供的一种用于保护集群存储的技术。