淘宝海量数据技术架构-Glider与HBase应用

需积分: 10 57 浏览量更新于2024-08-13 收藏 811KB PPT 举报

"Glider架构是淘宝海量数据产品技术架构中的一个重要组成部分，旨在解决大规模数据查询和处理的挑战。该架构主要包括Dispatcher、Controller、配置解析、请求解析、一级缓存、action、MyFOX、Prom、二级缓存以及datasource等组件。Glider作为数据中间层，用于隔离前端查询和后端存储，提升数据查询效率和系统性能。同时，它还涉及到JOIN和UNION操作，以及filter功能，以满足复杂的数据处理需求。" 在淘宝的海量数据场景下，Glider架构发挥了关键作用。面对30亿店铺和宝贝浏览、10亿在线商品、千万级别的交易笔数，以及数据产品相关的50G统计汇总结果和千万量级数据查询请求，Glider需要保证平均20.8毫秒的响应时间。在这种高并发、大数据量的环境下，计算速度、处理吞吐量、存储效率以及查询性能都是巨大的挑战。 Glider架构中的Dispatcher负责任务调度，Controller进行流程控制，配置解析和请求解析确保了数据请求的正确性和高效性。一级缓存和二级缓存则通过存储常用数据，减少了对底层存储的访问，提高查询速度。MyFOX和Prom可能是特定的中间件或组件，它们在系统中扮演着特定角色，例如数据处理或监控。datasource则是数据源管理，用于连接和管理不同的数据存储。JOIN和UNION操作支持了多表数据的整合，而filter则用于根据条件过滤数据。淘宝选择了关系型数据库作为基础，如Oracle RAC，因为它们提供成熟稳定的开源产品和强大的SQL查询能力。然而，NoSQL数据库也被视为SQL的有效补充，它们在处理特定类型的大数据问题上表现出色。Glider架构通过中间层将这两种数据库的优势结合，降低了前端应用直接操作数据库的压力，同时也优化了缓存策略，使之成为系统化工程，从而提升了整体系统的性能和响应速度。此外，实时流数据处理也是架构的重要部分，通过DataX、DbSync和TimeTunnel等工具进行数据同步和流处理，确保了数据的实时性。Hadoop集群（云梯）则承担了离线批量计算的任务，每天处理大量数据，结果存储在Glider中供查询使用。总结来说，Glider架构是淘宝应对海量数据挑战的关键技术，它融合了传统关系型数据库和NoSQL的优势，利用缓存策略和数据中间层来优化查询效率，同时通过各种工具和组件实现数据的实时处理和存储，为淘宝的数据产品提供了高效、稳定的支持。

黄宇韬

粉丝: 20
资源: 2万+

淘宝海量数据技术架构-Glider与HBase应用

Glider-JS 创建优美的页面滑动效果

Glider Screen-crx插件

Glider-JS 基于Prototype的页面滑块效果.zip

js实现轮播图_高性能轻量级零依赖的轮播图组件——Glider.js

glider 中转 https socks

滑翔伞的飞行轨迹模拟matlab代码

veh_version=2002; % version of ADVISOR for which the file was generated veh_proprietary=0; % 0=> non-proprietary, 1=> proprietary, do not distribute veh_validation=0; % 0=> no validation, 1=> data agrees with source data,

滑翔伞曲线模拟matlab

yolov8 算法原理子标题

利用SIMULINK建立的四转子动力学模型.rar

最新资源