360容器平台监控升级:从Open-Falcon到Prometheus

0 下载量 23 浏览量 更新于2024-08-28 收藏 543KB PDF 举报
"360容器平台在应对容器化趋势时,从原有的基于Open-Falcon的Wonder监控系统转向了基于Prometheus的新监控解决方案。新系统能够适应Kubernetes的动态服务发现,满足容器环境下的弹性扩展需求。360拥有5个分布于北京、上海和深圳的k8s线上集群以及GPU集群,容器化带来了资源节省、效率提升、高可用性和减轻运维负担的优势。监控系统关注的维度包括容器、Pod和应用,并且支持自定义监控,允许业务根据需求引入Prometheus SDK进行打点。对于未使用Prometheus的老系统,可以通过sidecar模式添加监控功能。" 在360的容器化转型中,传统的Wonder监控系统由于无法跟踪Kubernetes中动态创建的服务,被逐渐淘汰。Prometheus作为新的监控工具,因其强大的服务发现能力与容器化环境相契合。Prometheus是一个流行的开源监控和警报工具,它能够有效地抓取、存储和处理时间序列数据,特别适合监控动态变化的微服务架构。 360的监控系统设计主要围绕三个层次:容器、Pod和应用。容器是最基本的监控单元,Pod作为一个逻辑上的部署单位,可能包含多个共享相同生命周期的容器。应用层则关注更高层面的业务逻辑,通常由多个Pod组成。这种分层设计使得监控系统能够全面地覆盖从基础到应用层面的各种性能指标。 容器平台的实施显著提高了资源利用率和效率。通过容器化,一台物理机或虚拟机可以承载更多的服务实例,减少了流程中的等待时间,并实现了自动弹性扩容和缩容,确保在高流量期间能快速响应需求,低流量时则可优化资源分配,执行其他任务。 高可用性是容器平台的另一大优势。系统能够保证服务的预期运行数量,减少因硬件故障导致的服务中断。同时,容器化的自动化部署降低了运维复杂性,开发人员可以直接管理自己的镜像,实现快速部署。 为了满足多样化业务需求,360的监控系统支持自定义监控,这意味着业务可以根据自身特性添加特定的监控指标。例如,通过集成Prometheus的SDK,业务可以记录接口调用延迟和次数等信息。对于那些没有原生Prometheus支持的旧系统,可以采用sidecar模式,即在同一Pod中部署额外的监控代理容器,以实现对原有服务的监控接入。 360容器平台基于Prometheus的监控实践是应对云原生环境挑战的有效策略,它提供了一套灵活、可扩展且全面的监控体系,既保证了系统的稳定运行,也促进了业务的创新和发展。