Kaleido:敏捷灵活的定制化业务监控解决方案

需积分: 16 3 下载量 127 浏览量 更新于2024-07-23 收藏 369KB PPTX 举报
Kaleido.pptx是一个关于淘宝内部监控系统的详细讨论,特别是针对如何解决在现有监控框架(如哈勃、CSP、NAGIOS和Centreon)中遇到的灵活性和敏捷性问题。淘宝监控系统分为两个主要部分:全网监控和核心业务监控。 全网监控,如哈勃,负责监控淘宝网站的运行状态,包括硬件、网络、操作系统、中间件、基础服务和应用系统,确保整个平台的稳定性和效率。哈勃的设计初衷是效仿CSP的监控模式,但CSP未来可能会侧重于系统流量关系的分析,而不是持续扩展新的监控功能。北斗专注于数据库监控,而XRAY则关注于关键数据和接口的监控,此外,各业务线还存在其他分散的监控系统。 开源系统如NAGIOS,是一款企业级的网络监控工具,能够监控Linux服务器上多种服务的状态,是淘宝监控团队采用的一种解决方案。然而,NAGIOS的灵活性和敏捷性可能无法满足淘宝日益复杂的需求,这促使他们寻找更定制化的解决方案。 Centreon作为NAGIOS的补充,提供了更全面的管理界面,通过第三方组件支持更广泛的监控范围,包括网络、操作系统和应用程序。然而,这样的依赖仍然无法满足团队追求的高效和灵活度。 Kaleido的出现旨在打破这种困境。它是一个轻量级、低风险的监控解决方案,强调快速、敏捷和灵活。Kaleido并不直接提供监控功能,而是作为一个组件容器,集成了调度管理器、脚本管理器和消息管理等功能,为监控系统的定制化搭建提供了基础。Kaleido采用了诸如Java、JavaScript、Ruby、Python、Groovy、MVEL和JEXL等多种编程语言,使得开发者能够在不侵犯现有系统的基础上进行创新和试验。 Kaleido的核心优势在于其开源性质,这意味着任何人都可以参与并贡献,这有助于快速迭代和完善。事实上,Kaleido已经在汇金系统和物流宝项目中得到了应用,并且已经公开源代码,欢迎更多开发者加入,共同推动监控技术的发展。 总结来说,Kaleido.pptx中的内容探讨了淘宝监控系统面临的挑战、现有的监控解决方案及其局限性,以及Kaleido如何通过提供一个灵活的容器平台来解决这些问题,成为一种潜在的行业革新者。