"腾讯看点实时数据分析系统实践:Flink与ClickHouse的应用"
需积分: 0 48 浏览量
更新于2023-12-19
收藏 2.55MB PDF 举报
2020年10月12日,腾讯看点高级工程师王展雄汇报了基于Flink和ClickHouse的实时数据系统的实践。腾讯看点作为一个拥有万亿条/天实时数据的系统,对于数据分析平台的需求非常严苛。在这个报告中,王展雄针对实时计算引擎和实时数据仓库进行了详细的介绍,以及腾讯看点实时数据分析系统目前面临的痛点和解决方案。
在实时数据分析平台的调研中,王展雄指出当前的实时数据分析平台无法满足离线数据分析平台的要求,因此需要对方案进行选型和架构设计。针对实时数据分析系统中的实时计算引擎,王展雄介绍了业界常用的Flink、Spark Streaming和Storm等引擎的优缺点。他指出,Flink在准确性、容错机制、延时吞吐量以及易用性方面都具备较大优势,特别是在Exactly-once语义和轻量级快照的支持上。相对而言,Spark Streaming和Storm在这些方面表现不及Flink。因此,腾讯看点选择了基于Flink的实时数据分析系统。
在实时数仓方面,王展雄介绍了业界常用的大规模数据处理架构的灵活性。他提到,实时数仓的灵活性对于处理万亿条/天的实时数据至关重要。在这个背景下,腾讯看点基于ClickHouse搭建了实时数仓,以满足系统对于大规模数据处理的需求。
同时,王展雄也提到了腾讯看点实时数据分析系统的痛点。比如,运营、审核、作者等不同角色需要针对不同的需求进行实时数据分析,但现有系统无法满足这些需求。例如,运营可能需要了解不同人群的推荐效果,而审核可能需要按照举报数、曝光数降序的内容列表进行分析。针对这些痛点,王展雄提出了解决方案,并介绍了腾讯看点正在进行的项目工作,包括调研实时数据分析平台、方案选型和架构设计等。
总的来说,腾讯看点的实时数据分析系统在处理万亿条/天的实时数据方面面临着巨大的挑战,但通过选用Flink作为实时计算引擎和基于ClickHouse构建实时数仓,系统已经取得了一定的进展。同时,腾讯看点也正在积极探索更好的方案来解决实时数据分析系统的痛点,以满足不同角色的需求。在未来,随着实时数据分析技术的不断发展,相信腾讯看点的实时数据分析系统将会迎来更大的突破和进步。
2018-01-19 上传
2021-12-10 上传
2021-05-19 上传
2021-11-17 上传
2021-05-12 上传
2020-05-12 上传
2021-09-26 上传
食色也
- 粉丝: 38
- 资源: 351
最新资源
- express-simple-template:是一个简单的模板,用于日志记录和测试bdd
- flopbox:通过 HTTP 传输文件,只需将您的文件翻过来
- 待办事项清单:待办事项清单
- 界面专业的VC++流量监控程序
- 这是一个仅供个人学习的电商项目(Spring Cloud 2+MySql+JPA+Redis+ Golang+Gin.zip
- 物联网湿度和温度显示-项目开发
- blog-template
- AndreyC101-GAME2005-F2020-FinalTest-101255069:GAME2005-游戏物理决赛
- meteor-mailchimp-custom:自定义和添加的表单字段操作
- 这是我在学习java时候写的一个最最简单的小爬虫,用来爬知乎的标题,然后存储的在mysql.zip
- VC++ TCP 方式实现MYQQ
- action-notify:涡轮行动通知
- react-reality-holokit:Holokit绑定用于React现实
- riemann-test-prototype:编写和测试 Riemann 配置的另一种方法
- terraform-azure-poc
- haku0x666