IBM AIX小机巡检要点与故障排查

需积分: 9 5 下载量 90 浏览量 更新于2024-09-22 收藏 23KB DOCX 举报
本文档主要介绍了IBM AIX小机的全面巡检方法,包括以下几个关键知识点: 1. 机器型号确认:通过运行`#uname -uM`命令,可以查看小机型号和版本信息,如`IBM,7029-6E3IBM,01100550A`,这对于设备管理至关重要。 2. 硬件设备状态检查:关注主机、7133磁盘阵列和磁带机的故障灯。黄色告警灯代表可能存在故障,如主机面板上的数字显示异常,7133磁盘阵列故障或磁带机需要清理。 3. 系统错误报告:通过`#errpt-dH-TPERM`检查硬件错误,如果有故障,将结果保存至`/tmp/harderror.log`,并分析后提供给客户;软件错误则用`#errpt-dS-TPERM`进行检查,结果保存在`/tmp/softerror.log`。 4. root用户错误报告监控:通过`#mail`命令查看未读消息,尤其是diagela相关消息,并根据提示进行深入分析,形成详细报告。 5. 查看关键日志文件:`hacmp.out`记录了HACMP(High Availability Computing Multiprocessing)系统的状态,`smit.log`是System Management Interface Tool的日志,而`bootlog`记录启动过程中的信息。通过`#lssrc-gcluster`命令定位这些文件,检查是否存在异常。 6. 文件系统监控:使用`#df -k`命令查看各文件系统的使用情况,监控空间占用,避免超过80%的使用率,提醒用户进行优化。 7. 逻辑卷状态检查:通过`#lsvg -l rootvg`命令查看逻辑卷(Logical Volume Group)的状态,确保LVNAMETYPELPsPPsPVsLVSTATEMO各项参数正常,避免"stale"状态。 这份巡检指南提供了IBM AIX小机维护过程中所需关注的重要指标和操作步骤,对于保障系统的稳定性和高效运行具有实际指导价值。