太平洋保险Zabbix智能监控体系构建

需积分: 8 1 下载量 24 浏览量 更新于2024-06-27 收藏 2.62MB PDF 举报
"太平洋保险在2022年的Zabbix中国峰会上分享了其基于Zabbix构建的智能监控体系。该体系旨在替代原有的BMC等商业软件,采用Zabbix开源监控产品加上自研组件的方式,实现了故障预警和智能分析。监控平台的建设历程历经多个阶段,从早期的手工操作逐渐发展到智能化运维。目前,太保运维工具体系包括SaaS能力、运维能力中台以及各类功能平台,利用低代码平台和私有云门户实现个性化运维场景。Zabbix在太保的使用中实现了两地三中心分布式部署,管理大量主机和网络设备,并利用其触发器功能和模板机制进行高效监控。" 在太平洋保险的监控平台建设过程中,Zabbix扮演了关键角色。从2008年开始,他们逐步引入了商业软件如BMC,但随着时间的推移,他们开始探索更经济且高效的替代方案。在2017年,公司决定采用Zabbix作为BMC的替换产品,这标志着一个重要的转变。Zabbix以其开源、灵活和强大的监控能力,成功地适应了太保的复杂IT环境,覆盖了测试、灾备和生产三套环境,管理了超过60000台主机和4600多台网络设备,同时支持209种不同的网络设备型号,监控指标数量达到2200+。 Zabbix的特性和功能在太保的智能监控体系中发挥了重要作用。例如,触发器功能允许设置复杂的告警规则,通过组合多个阈值来触发警告,提高故障识别的精确度。此外,模板机制则极大地简化了配置工作,通过将常用监控项设定为模板,可以快速应用到大量设备上,降低了运维复杂度和工作量。Zabbix代理服务的使用则确保了对网络设备的快速响应和高效监控。 在运维工具平台的建设上,太平洋保险经历了四个阶段:从手工操作到脚本化,再到自动化和智能化。随着2014年的ITIL和SOP操作级标准化,到2018年的工具级标准化,他们逐步实现了批量操作、运维开发的前台化、可视化和自动化。当前,他们正致力于数据、模型和算法层面的决策级标准化,这表明他们的运维体系正朝着更加智能和自动化的方向发展。 太保的运维能力中台是这一过程中的重要成果,它封装了运维能力和数据,提供了统一的服务接口。同时,他们还构建了一个自研的低代码平台,结合私有云门户,能够快速定制和实施个性化的运维场景。各类功能平台与软件产品相结合,形成了全面的运维工具生态系统,进一步提升了运维效率和问题解决能力。 太平洋保险基于Zabbix的智能监控体系展示了开源监控工具在大型企业中的广泛应用和价值,以及如何通过不断演进的运维策略和技术,实现更高效、智能的IT管理。这一案例对于其他寻求转型或优化监控体系的企业具有重要的参考价值。