DevOps统一运维监控平台：系统监控全面解析

127 浏览量更新于2024-08-27 收藏 732KB PDF 举报

"本文主要探讨了在DevOps背景下如何构建统一运维监控平台，重点关注系统监控的挑战和解决方案。文章提到了面对多样的机器、应用和服务，现有监控系统可能难以应对，需要一套统一的策略来快速收集和分析各种来源的指标数据。文章结构包括统一监控平台的架构解析、系统监控的技术栈、开源监控软件对比、容器云环境下的监控实践以及Prometheus在容器时代的作用。" 在建设DevOps统一运维监控平台的过程中，全面的系统监控是关键。随着技术的发展，系统的复杂性日益增加，需要一个强大的监控体系来确保服务的稳定性和效率。文章首先回顾了统一监控平台的基本架构，包括监控源、数据采集、数据存储、数据分析、数据展现、预警中心和CMDB。监控源覆盖业务应用、中间件和基础设施三个层次，涵盖广泛。在数据采集环节，文章指出需要处理各种类型的数据，如业务指标、应用指标、系统软件监控指标和系统指标，并介绍了接口采集、客户端agent采集和网络协议抓取等不同的采集方法。数据存储则涉及到文件系统、索引系统、指标库和消息队列等多种存储形式，以满足不同数据特性的需求。接着，文章探讨了开源系统监控软件的选择，比较了Zabbix、Nagios和Open-Falcon的优缺点，为企业在选择监控工具时提供了参考。此外，针对Kubernetes（k8s）容器云背景，文章介绍了cAdvisor、Heapster和Influxdb的组合，用于容器内的系统监控实践，强调了它们在监控容器资源使用和性能上的价值。最后，文章提到了Prometheus，这是一款在容器时代备受推崇的监控利器，能够有效地监控微服务架构下的各种指标，提供灵活的查询语言和强大的告警规则设置，适应了现代云原生环境的监控需求。全面的系统监控涉及到多个层面，包括合理的监控架构设计、选择适合的技术栈以及充分利用开源工具。在DevOps的推动下，建立这样一个统一的运维监控平台对于保障服务质量和提升运维效率至关重要。

建设建设DevOps统一运维监控平台，全面的系统监控你做好了统一运维监控平台，全面的系统监控你做好了

吗？吗？

前言

随着Devops、云计算、微服务、容器等理念的逐步落地和大力发展，机器越来越多，应用越来越多，服务越来越微，应用运

行基础环境越来多样化，容器、虚拟机、物理机不一而足。面对动辄几百上千个虚拟机、容器，数十种要监控的对象，现有的

监控系统还能否支撑的住？来自于容器、虚拟机、物理机、网络设备、中间件的指标数据如何采用同一套方案快速、完整的收

集和分析告警？怎样的架构、技术方案才更适合如此庞大繁杂的监控需求呢？

上篇文章《建设DevOps统一运维监控平台，先从日志监控说起》主要从日志监控的方面进行了分享，本篇文章则是重点在系

统监控层面进行分享。

一、统一监控平台架构解析

二、系统监控的技术栈

三、开源系统监控软件 Zabbix VS Nagios VS Open-Falcon

四、基于k8s容器云背景下的系统监控实践：cAdvisor+Heapster+Influxdb

五、容器时代的监控利器： Prometheus

一、统一监控平台架构解析

先做一下回顾，统一监控平台由七大角色构成：监控源、数据采集、数据存储、数据分析、数据展现、预警中心、CMDB(企

业软硬件资产管理)。

监控源：

从层次上来分，大致可以分为三层，业务应用层、中间件层、基础设施层。业务应用层主要包括应用软件、企业消息总线等，

中间件层包括数据库、缓存、配置中心、等各种系统软件，基础设施层主要有物理机、虚拟机、容器、网络设备、存储设备等

等。

数据采集：

数据源如此多样，数据采集的任务自然轻松不了。数据采集从指标上划分可以分为业务指标、应用指标、系统软件监控指标、

系统指标。应用监控指标如：可用性、异常、吞吐量、响应时间、当前等待笔数、资源占用率、请求量、日志大小、性能、队

列深度、线程数、服务调用次数、访问量、服务可用性等，业务监控指标如大额流水、流水区域、流水明细、请求笔数、响应

时间、响应笔数等，系统监控指标如：CPU负载、内存负载、磁盘负载、网络IO、磁盘IO、tcp连接数、进程数等。

从采集方式来说通常可以分为接口采集、客户端agent采集、通过网络协议主动抓取（http、snmp等）

数据存储：

采集到的数据一般都会存储到文件系统（如HDFS）、索引系统（如elasticsearch）、指标库（如influxdb）、消息队列（如

kafka，做消息临时存储或者缓冲）、数据库（如mysql）

数据分析：

下载后可阅读完整内容，剩余6页未读，立即下载

weixin_38710323

粉丝: 1
资源: 953

DevOps统一运维监控平台：系统监控全面解析

建设DevOps统一运维监控平台.doc

建设DevOps统一运维监控平台.docx

建设DevOps统一运维监控平台.pdf

DevOps统一运维监控平台构建与实践

DevOPS:运维管理系统

DevOps开发运维一体化平台建设解决方案共36页.ppt

DevOps开发运维一体化平台建设解决方案共36页.pptx

devops:运维自动化

devops开发运维一体化平台

基于java的贝儿米幼儿教育管理系统答辩PPT.pptx

最新资源