同程旅游运维安全实践:巡风系统详解

需积分: 5 0 下载量 186 浏览量 更新于2024-06-21 收藏 10.56MB PDF 举报
"藏经阁-巡风系统在同程运维安全的实践.pdf" 这篇文档讲述了同程旅游在运维安全方面的发展历程以及巡风系统在其中的重要作用。巡风系统是同程运维安全策略的关键组成部分,旨在提升服务器和应用的安全性,防止各种安全威胁。 同程运维安全的发展可以分为三个阶段: 1. 初期阶段:在这个阶段,同程只有数十到数百台服务器,运维工作主要由兼职人员手工完成,安全措施较为薄弱。系统没有防火墙,服务器之间没有隔离,密码管理不严格,导致Web安全问题频发。安全主要依赖于开发人员,缺乏专门的安全规划和管理。 2. 中期阶段:随着业务扩展,同程拥有数千台服务器,开始采用一定的自动化运维系统,并划分了不同的资源区域(如RHaJ)。此时,引入了基础的防火墙,有专门的运维人员和安全人员,但特殊配置仍耗费时间和成本,存在开放不应开放的服务等问题。 3. 当前阶段:同程的服务器数量进一步增长至数万台,具备成熟的自动化运维系统和专业的安全团队。然而,随着系统的复杂性和历史遗留问题,运维和安全面临更多挑战,自动化运维成为解决这些问题的关键。 巡风系统在此过程中起到了核心作用,它是一款针对服务器和应用安全的解决方案,设计上注重资源消耗的可控性和轻量级特性,采用插件化架构,能够自我监控并预测潜在风险。系统的主要功能包括: - Web安全事件检测:支持HTTP异常状态码(如404、500、200等)的检测。 - 异常网络行为检测:监控网络流量中的异常活动。 - 进程/命令监控:跟踪和控制服务器上的进程和命令执行。 - 文件操作监控:检测对文件的异常修改或删除。 - 安全基线核查:确保服务器配置符合安全标准。 - 安全事件阻断:当发现潜在安全威胁时,可以即时阻断。 - 日志收集:汇总系统日志以进行分析和审计。 - 系统信息收集:收集开机启动项、服务列表、计划任务、开放端口、用户列表等信息。 - 执行服务推送:自动化推送更新和安全修复。 - 漏洞补丁升级:自动检测并应用最新的安全补丁。 巡风系统的部署和使用极大地提升了同程的运维安全水平,通过自动化监控和响应机制,有效减少了未经授权的访问、系统漏洞、配置不当等问题,同时也降低了运维工作的复杂性和人为错误。这使得同程能够更好地应对日益复杂的网络安全环境,保护其业务和用户数据的安全。