Oracle集群故障排查与IO优化配置

需积分: 46 18 下载量 48 浏览量 更新于2024-08-09 收藏 2.11MB PDF 举报
本文档主要介绍了在AIX操作系统环境下,关于信息技术服务运行维护中的数据中心规范,特别是异步IO的配置以及Oracle Grid Infrastructure(包括ASM和RAC)的安装与故障排查。其中提到了AIX系统的一些性能调优参数,以及在启动Oracle Clusterware时遇到的问题。 在AIX系统中,异步IO在版本6.1默认是启用的,可以通过`ioo`命令来调整相关参数,如`aio_maxservers`设置最大异步IO服务器数量为80,`aio_minservers`设置最小异步IO服务器数量为40。这些参数可以优化系统对I/O操作的处理能力,提高系统性能。 在系统调优方面,通过`smitty`命令可以进入虚拟内存管理参数的调整菜单,需要修改的参数包括: 1. `MINPERM%`:最小永久内存百分比,从3%调整到更适合系统的值。 2. `MAXPERM%`:最大永久内存百分比,从90%调整,以适应更大的内存需求。 3. `MAXCLIENT%`:每个用户允许的最大进程数百分比,从90%调整,确保多用户环境下的稳定性。 4. `Maximum number of PROCESSES allowed for each user`:每个用户允许的最大进程数,从2048增加到至少8192,以支持更大规模的应用。 5. `Lru_file_repage`:从1调整为0,可能涉及页面替换策略。 6. `strict_maxclient`:保持为1,确保严格限制最大客户端连接。 在Oracle Grid Infrastructure的部署过程中,文档提到了删除和创建`npohasd`文件,以及改变其权限的步骤,这是Oracle集群软件初始化的一部分。然而,在尝试启动Clusterware时遇到了问题,日志显示了以下错误: - CRS-2101:表明OLR(Oracle Local Registry)使用了旧版本,可能需要升级或重新格式化。 - CRS-2317和CRS-2316:涉及到GPnP(Generic Plug and Play)的致命错误,无法获取本地GPnP安全密钥或初始化GPnP,这可能与Oracle Wallet或网络配置有关。 - CRS-1013:OCR(Oracle Configuration Registry)在ASM磁盘组中的位置不可访问,建议检查 `/grid/app/11.2.0/grid/log/easdb1/client/clscfg.log` 日志文件以获取更多详细信息。 解决这些问题可能需要检查Oracle Wallet的配置,确认所有必要的安全证书和文件都正确无误,并且系统网络配置能够支持GPnP功能。同时,OCR的访问问题可能涉及到ASM磁盘组的健康状况,需要检查磁盘状态和ASM实例是否正常。 该文档涵盖了AIX系统中异步IO的管理、系统性能调优,以及Oracle Grid Infrastructure(包括ASM和RAC)的安装和故障排查,对于管理和维护AIX上的Oracle数据库环境具有重要参考价值。