AIX系统故障排查与管理技巧合集

需积分: 9 0 下载量 147 浏览量 更新于2024-07-28 收藏 571KB PDF 举报
"这篇文章是关于AIX操作系统的常见问题汇总,包含了从2002年至2006年间收集的各类技术问题及其解决方案。涵盖了硬件故障、系统管理、磁盘管理、性能监控、用户权限、错误日志分析等多个方面。" 在AIX系统管理中,以下是一些关键知识点: 1. 关闭IBM小型机面板告警灯:在某些情况下,可能需要关闭IBM小型机(如pSeries)前面板的告警灯。这通常涉及对硬件管理控制台的配置,或者通过特定的系统管理工具进行设置。 2. 安装时间查询:可以使用`oslevel`或`lslpp -L`命令来检查AIX系统的安装时间和已安装软件包的版本信息。 3. 杀进程的shell程序:在AIX中,`kill`或`pkill`命令用于终止进程,而`killall`可以用于根据进程名称杀死所有相关进程。 4. 安装Linux Bash:AIX允许安装兼容的Linux命令,如Bash shell,以增强其功能。通常需要通过编译源代码或使用预编译的二进制包来实现。 5. 扩展 `/tmp` 空间:`/tmp` 目录的大小可以通过调整文件系统或创建新的临时文件系统来扩展。 6. HACMP FAQ:高可用性集群多处理(HACMP)的相关问题,可能涉及配置、故障转移和监控等方面。 7. 确定磁带库与设备文件的关系:使用`lsdev`命令可以列出系统中的磁带设备,通过设备名称和物理路径关联到磁带库。 8. `du` 和 `df` 命令的区别:`du`用于估算文件和目录占用的磁盘空间,而`df`则显示文件系统的总空间、已用空间和可用空间。 9. 卷组设备文件丢失:如果卷组的设备文件丢失,可能导致系统无法启动。恢复方法包括从备份恢复或使用`metadisk`命令重新创建。 10. `varyonvg` 参数问题:`-s` 参数用于静默模式,如果不正确使用可能会导致文件系统无法挂载。 11. 修改telnet端口:通过编辑`/etc/inetd.conf`文件并重新启动`inetd`服务,可以更改telnet的默认端口。 12. `feprom_update`:这个命令用于升级系统的固件(Firmware),确保系统硬件的最新和稳定运行。 13. 错误日志分析:使用`errpt`命令查看和分析系统错误日志,可以帮助识别和解决硬件或软件问题。 14. 非root用户执行系统命令:通过设置sudoers文件,可以让非root用户获得执行特定命令的权限。 15. PTF与APAR:PTF(Program Temporary Fix)是IBM提供的临时修复程序,而APAR(Authorized Program Analysis Report)是IBM用于记录和跟踪问题的编号。 以上只是部分知识点,AIX的管理涉及到许多其他领域,如系统监控、网络配置、安全设置、备份恢复等,都需要深入理解和实践才能熟练掌握。这篇汇总提供了丰富的学习资源,对于AIX管理员来说是宝贵的参考资料。