Sina ELK:从运维到服务的演进与自动化平台建设
需积分: 3 54 浏览量
更新于2024-07-20
收藏 20.56MB PPTX 举报
"sina elk,从运维到服务之路 -凌霄"
本文主要介绍了新浪ELK团队在运维和服务方面的经验分享,由前新浪MySQL DBA、大数据工程师凌霄讲述。ELK是Elasticsearch、Logstash和Kibana的组合,常用于日志管理和数据分析。在2015年的ES国内开发者会议上,凌霄分享了他们的运维实践和架构演进历程。
首先,文章提到了一个拥有50多个节点的ELK集群运维。运维这样一个大规模的集群需要面对诸多挑战,包括架构的设计、性能优化和自动化平台的构建。在架构演进过程中,经历了三个主要阶段:
1. 第一阶段,直接使用FILE作为日志输入,但面临实时性不足和上游日志堆积的问题。
2. 第二阶段,引入Rsyslog,改进了日志推送的实时性,但依然存在存储空间和单点压力问题。
3. 第三阶段,采用Kafka作为日志中间件,极大地提高了吞吐量,实现服务解耦,并利用Kafka的高性能和零拷贝特性来优化系统。
Kafka的引入解决了性能可扩展性和硬盘顺序写速度的问题,同时提供了基于Topic的发布订阅机制。通过这些优化,ELK集群能够更好地支持更丰富的计算模式,进行计算迁移和预分析,以及长时间保存统计结果,以提升并发性能。
在构建自动化与平台化的过程中,团队面临着不断增长的业务需求。他们逐步建立了整体架构,包括日志格式的标准化协商,数据管理系统的完善,以及移动端日志服务的提供。此外,他们还推动了服务的docker化,以提高部署和管理的灵活性。
为了辅助运维工作,团队使用了一些工具,如KOPF用于Elasticsearch集群的可视化管理,Bigdesk用于节点性能监控,Gork Debugger帮助调试Logstash的Grok语法,Cursor用于Elasticsearch索引管理,这些工具大大提升了运维效率。
这个分享展示了新浪如何从最初的ELK运维逐步发展到提供成熟服务的过程,其中包括架构的迭代升级、运维工具的选用和自动化平台的构建,这些经验对于其他从事日志管理和大数据分析的团队具有很高的参考价值。
2023-06-13 上传
2023-09-25 上传
2023-09-20 上传
2023-05-31 上传
2024-09-12 上传
2023-06-01 上传
2024-09-20 上传
2024-05-17 上传
Wang_Zhenwei
- 粉丝: 316
- 资源: 33
最新资源
- 磁性吸附笔筒设计创新,行业文档精选
- Java Swing实现的俄罗斯方块游戏代码分享
- 骨折生长的二维与三维模型比较分析
- 水彩花卉与羽毛无缝背景矢量素材
- 设计一种高效的袋料分离装置
- 探索4.20图包.zip的奥秘
- RabbitMQ 3.7.x延时消息交换插件安装与操作指南
- 解决NLTK下载停用词失败的问题
- 多系统平台的并行处理技术研究
- Jekyll项目实战:网页设计作业的入门练习
- discord.js v13按钮分页包实现教程与应用
- SpringBoot与Uniapp结合开发短视频APP实战教程
- Tensorflow学习笔记深度解析:人工智能实践指南
- 无服务器部署管理器:防止错误部署AWS帐户
- 医疗图标矢量素材合集:扁平风格16图标(PNG/EPS/PSD)
- 人工智能基础课程汇报PPT模板下载