Domino系统宕机处理策略:原因、数据保护与恢复技巧

需积分: 48 7 下载量 111 浏览量 更新于2024-07-22 收藏 1.54MB PDF 举报
在本篇关于处理Domino系统宕机的经验分享中,作者曹小勤作为IBM Lotus软件工程师,详细讨论了在服务器出现无法重启问题时的应对策略。会议议程主要分为三个部分:常见的服务器无法重启原因、保护服务器并收集数据以及如何尽快恢复服务器。 首先,常见的服务器宕机原因包括但不限于: 1. 数据库损坏,如Names.nsf、events4.nsf、admin4.nsf或log.nsf等系统数据文件受损。 2. 事务日志损坏,这对恢复操作至关重要。 3. 网络故障,如路由器发送邮件过程中出现问题。 4. 内存故障,导致系统资源不足。 5. 磁盘空间不足,可能由于垃圾文件未清理或数据积累。 6. Domino系统配置文件(notes.ini和server.id)丢失或损坏。 在保护服务器和收集数据阶段,曹小勤强调了以下几点: 1. 避免在服务器宕机后立即强制关闭,因为这可能导致数据进一步损坏。 2. 在服务器停止响应时,允许NSD(Notes Server Diagnostics)运行完所有任务,然后按照操作系统不同使用任务管理器(Windows)、命令行工具(Unix/Linux)或Workserverjobs(OS400)来监控进程。 3. 收集关键日志文件,如NSD运行记录(包含时间戳的nsd_XXX_serverName_YYYY-MM-DD@HH-MM-SS.log),Consolelog(记录服务器启动时间的console_ServerName_YYYY-MM-DD@HH-MM-SS.log),以及SEMDEBUG(与服务器启动时间相关的调试日志)。 最后,恢复服务器的步骤通常涉及修复或替换损坏的文件,根据收集的数据进行诊断,可能需要IBM技术支持来协助解决更深层次的问题。通过这些经验分享,读者可以了解到处理Domino系统宕机时的关键步骤和注意事项,从而提高故障应对能力。