淘宝"双11"海量数据产品技术架构解析
39 浏览量
更新于2024-08-28
收藏 363KB PDF 举报
淘宝应对"双11"的技术架构分析
淘宝海量数据产品技术架构是淘宝应对"双11"的技术架构分析的核心部分。该架构可以分为五层:数据源、计算层、存储层、查询层和产品层。
数据源层是淘宝海量数据产品技术架构的第一层,该层主要是淘宝主站的用户、店铺、商品和交易等数据库,还有用户的浏览、搜索等行为日志等。这一系列的数据是数据产品最原始的生命力所在。
计算层是淘宝海量数据产品技术架构的第二层,该层主要是通过淘宝自主研发的数据传输组件DataX、DbSync和Timetunnel准实时地传输到一个有1500个节点的Hadoop集群上,该集群我们称之为“云梯”。在“云梯”上,我们每天有大约40000个作业对1.5PB的原始数据按照产品需求进行不同的MapReduce计算。
存储层是淘宝海量数据产品技术架构的第三层,该层主要是基于MySQL的分布式关系型数据库集群MyFOX和基于HBase的NoSQL存储集群Prom。该层的主要作用是为前端产品提供实时的数据查询服务。
查询层是淘宝海量数据产品技术架构的第四层,该层主要是为前端产品提供实时的数据查询服务。该层的主要作用是将计算层和存储层的数据进行聚合和处理,以便为前端产品提供实时的数据查询服务。
产品层是淘宝海量数据产品技术架构的第五层,该层主要是淘宝的前端产品,例如淘宝主站、淘宝商城等。该层的主要作用是将查询层的数据进行展示和处理,以便为用户提供实时的数据查询服务。
淘宝海量数据产品技术架构的设计理念是基于数据的非实时写入特点,认为在一定的时间段内,整个系统的数据是只读的。这为我们设计缓存奠定了非常重要的基础。该架构的设计也考虑到了实时计算和存储的需求,采用了“云梯”和“银河”两种不同的计算平台,以满足不同的计算需求。
淘宝海量数据产品技术架构是一个复杂的分布式系统,需要考虑到数据的非实时写入、计算、存储和查询等多个方面,以便为用户提供实时的数据查询服务。
2017-01-18 上传
点击了解资源详情
点击了解资源详情
点击了解资源详情
点击了解资源详情
2014-08-12 上传
点击了解资源详情
点击了解资源详情
weixin_38540819
- 粉丝: 7
- 资源: 830
最新资源
- 基于Python和Opencv的车牌识别系统实现
- 我的代码小部件库:统计、MySQL操作与树结构功能
- React初学者入门指南:快速构建并部署你的第一个应用
- Oddish:夜潜CSGO皮肤,智能爬虫技术解析
- 利用REST HaProxy实现haproxy.cfg配置的HTTP接口化
- LeetCode用例构造实践:CMake和GoogleTest的应用
- 快速搭建vulhub靶场:简化docker-compose与vulhub-master下载
- 天秤座术语表:glossariolibras项目安装与使用指南
- 从Vercel到Firebase的全栈Amazon克隆项目指南
- ANU PK大楼Studio 1的3D声效和Ambisonic技术体验
- C#实现的鼠标事件功能演示
- 掌握DP-10:LeetCode超级掉蛋与爆破气球
- C与SDL开发的游戏如何编译至WebAssembly平台
- CastorDOC开源应用程序:文档管理功能与Alfresco集成
- LeetCode用例构造与计算机科学基础:数据结构与设计模式
- 通过travis-nightly-builder实现自动化API与Rake任务构建