2023年监控系统APM选型对比:开源与主流厂商深度解析

5星 · 超过95%的资源 需积分: 49 132 下载量 5 浏览量 更新于2024-07-21 3 收藏 15MB PDF 举报
监控系统(APM)对比概述 在2009年,徐继峰作为广州中软IT管控事业部的副总经理,开始了对IDC设备及环境的全面监控工作,并主导开发了公司的IT集中运行监控系统和综合监控系统,基于开源工具Cacti。他负责了众多大型项目的实施,例如南网、南方电网、广东电网和贵州电网的IT监控系统,累积项目金额超过1亿元。这些经历促使他分享自己的知识,为同行解决运维自动化和监控系统的选型问题。 当前IT运维管理中面临的主要挑战包括新设备接入、网络优化、业务系统的扩展以及复杂的基础平台监控。24/7的无间断监测至关重要,但同时也存在设备添加后的问题定位困难和状态数据难以统计的问题。为了提升运维效率,业界引入了多种监控技术和解决方案。 业界的监控系统厂商主要分为四类:大型厂商如HP OpenView、IBM Tivoli、CA Unicenter和BMC Patrol,以及"小四大厂商"Zenoss、Nagios、HypericHQ和Qlusters OpenQRM。国内和其他厂商如北塔、摩卡、Microsoft SCOM和卓豪(艾德威特)也占据一席之地。这些产品涵盖了从网络设备到应用系统的全方位监控,包括: 1. 监控对象广泛:涉及网络设备(如路由器、交换机、防火墙等)、操作系统(AIX、BSD、HPUX、Linux、Solaris、Windows等)、硬件设备的物理指标(如温度、电压、风扇状态)、系统软件(数据库、中间件、Web服务等)、存储设备(磁盘阵列、光纤交换机)以及应用系统(MIS、OA、Email等)。 2. 监控技术:SNMP(简单网络管理协议)是其中一种重要技术,它专为网络节点管理设计,可监控服务器、工作站等设备。其他技术可能还包括WMI(Windows Management Instrumentation)、JMX(Java Management Extensions)等,用于监控Java应用或云计算环境。 3. 监控系统对比:这些产品在功能、易用性、性能、扩展性和成本等方面都有所差异,企业需根据自身需求选择最适合的监控系统。对比分析时,除了基础的监控功能,还应考虑系统的报警机制、报表生成、故障诊断和自动化运维能力。 4. 自动化产品交流:监控系统往往结合自动化工具,如自动化部署、告警规则设置、性能优化等功能,以减少人工干预,提高运维效率。此外,API和仪表板集成也是现代监控系统的重要组成部分,它们允许与其他业务系统无缝协作。 在选择监控系统时,企业需关注监控深度、广度、实时性、准确性以及是否支持定制化和扩展,同时结合成本效益进行综合评估。通过对比分析和实践经验分享,可以帮助企业在监控与运维自动化方面做出明智的决策。