建设银行Oracle10gRAC高可用性故障模拟测试预案

4星 · 超过85%的资源 需积分: 49 192 下载量 69 浏览量 更新于2024-07-27 收藏 178KB DOC 举报
"建设银行Oracle10gRAC高可用性功能测试AdvancedCustomerService" 这篇文档是关于Oracle数据库的应急处理预案,特别针对建设银行使用的Oracle 10g RAC(Real Application Clusters)集群环境。Oracle RAC是一种高可用性和容错解决方案,允许数据库在多台服务器上同时运行,以提高服务连续性和性能。文档的设计人是Oracle技术顾问,旨在通过一系列故障模拟测试来验证RAC系统的稳定性与恢复能力。 测试环境包括一个双节点RAC配置,操作系统为HP-UX,并使用两台千兆交换机来支持节点间的Inter-connect通信。这些硬件配置确保了RAC的正常运作,但同时也需要对可能发生的故障情况进行预判和准备。 文档中详述了多种可能的故障场景及对应的应急处理措施: 1. **重启单个RAC节点**:在不影响整体服务的情况下,模拟节点故障并测试系统的自动接管和恢复机制。 2. **网络故障模拟**: - **公用网络故障**:测试当连接客户端的网络出现问题时,RAC如何保持数据服务。 - **Inter-connect网卡故障**:Inter-connect是RAC内部通信的关键,测试其故障时的数据同步和故障转移。 - **ORACLE监听程序crash**:监听程序崩溃会影响到客户端连接,测试如何快速恢复监听服务。 3. **ORACLE CRS(Cluster Ready Services)故障模拟**:CRS是RAC的核心组件,负责监控和管理集群资源。 - **CRSD进程crash**:测试CRS守护进程失败后的恢复策略。 - **OCSSD进程crash**:OCSSD负责节点间的心跳检测,测试其故障后的处理。 - **EVMD进程crash**:EVMD管理集群的命名和发现,其崩溃影响节点识别,测试恢复步骤。 - **OCR(Oracle Cluster Registry)故障模拟**:OCR存储集群配置信息,测试如何处理丢失或损坏的OCR。 - **Voting Disk故障模拟**:Voting Disks用于决策集群状态,测试在丢失投票磁盘时的系统响应。 文档还包括了变更记录、审阅人和发行信息,以及一个详细的目录结构,方便用户查找和理解测试内容。通过对这些故障的模拟测试,可以确保在实际环境中遇到问题时,能够迅速有效地进行故障排查和恢复,从而最大化Oracle RAC系统的可用性,保障银行业务的连续性。