互联网公司数据处理系统架构设计

需积分: 0 33 浏览量更新于2024-08-04 收藏 87KB DOCX 举报

"这篇文档是关于互联网公司如何构建综合数据处理系统的架构设计，涉及数据仓库的各个层次（ODS、DWD、DWS、ADS），任务调度和元数据管理，并提出了设计目标和系统环境的要求。" 在当前互联网时代，许多公司如外卖平台、电商平台、教育平台等，依赖线上业务来驱动其核心运营。为了对用户的访问行为、消费行为和业务操作进行深度分析，以支持业务运营、精准营销和个性化推荐，这些公司需要构建一个强大的数据处理系统。该文档首先介绍了系统设计的背景，强调了数据分析和数据挖掘在提高业务转化率和优化运营效果中的重要性。文档中详细解释了数据仓库的四个主要层次： 1. ODS层（Operational Data Store）：存储原始数据，起到数据备份的作用。在这个系统的第一版本中，ODS直接存储日志数据。 2. DWD层（Data Warehouse Detail）：对ODS层的数据进行清洗，生成结构和粒度相同的明细表。粒度保持与ODS层一致，例如按小时或天划分数据。 3. DWS层（Data Warehouse Summary）：基于DWD层进行轻度聚合，形成更高级别的汇总数据，例如按天聚合的数据。 4. ADS层（Application Data Service）：以DWS或DWT（Data Warehouse Transition）为基础，为报表和可视化提供数据，直接服务于业务应用和决策。此外，文档还提到了任务调度和元数据管理两个关键组件： - 任务调度负责管理有依赖关系的任务执行顺序，确保在任务失败时能自动重启，保证整个数据处理流程的顺畅。 - 元数据管理则通过对Hive表的数据进行血缘分析，以便在出现问题时快速定位问题源头，简化问题排查过程。设计目标包括实现特定的功能（详细需求见需求文档），确保数据精确度、时间特性和适应性： - 数据精确度：保证录入数据的准确无误，显示的数据与原始数据一致。 - 时间特性：在网络正常情况下，用户请求应在5秒内得到响应。 - 适应性：系统应兼容主流浏览器，确保图表和报表的正常显示。系统环境部分列出了所需的软硬件配置： - 软件栈包括Hadoop、Spark、Flume、Kafka、Sqoop、Azkaban、Atlas和Echarts等大数据处理和可视化工具，以及SpringBoot作为应用开发框架。 - 硬件配置为每台节点拥有8GB内存、6核CPU和300GB硬盘，整个集群由三台节点组成。最后，文档提及了数据规模的预期，但未给出具体数值，这表明系统需要具备扩展性和灵活性，以应对未来可能增长的数据量。这个架构设计文档为构建一个高效、可靠且适应性强的互联网数据处理系统提供了全面的指导。

一、背景

现在随着互联网的发展，好多公司的主营业务在线上(app/网站)（外卖公司、各类

app，比如：下厨房；头条；安居客；内涵段子；斗鱼；每日优鲜>、页游、唯品会、拼

多多、当当、苏宁易购、国美在线、网易严选、携程、中华会计网校、多易教育、小

象学院、慕课网、尚德教育、有钱花、上哪借 ……）

这类公司，都需要针对用户的线上访问行为、消费行为、业务操作行为进行统计分

析，数据挖掘！以支撑公司的业务运营、精准画像营销、个性化推荐等，来提高业务转

化率，改善公司运营效果！这些需求，都需要通过构建一个综合数据处理系统来支撑！

二、名词解释

ODS 层：存放原始数据，它的作用就是备份。在我们这个第一版的系统里就是直接存放

日志数据。

DWD 层：对 ODS 层的数据进行数据清洗，同时对清洗后的数据生成结构与粒度相同的

明细表。粒度举例：如果 ODS 层每条数据代表一小时的数据，那么 DWD 的每条数据就是一

小时数据，如果 ODS 是一天的数据，DWD 就是一天的数据。结构不太理解

DWS 层：以 DWD 为基础，进行轻度聚合的表。举例：如果 DWD 的每条数据代表一小时

的数据，那么 DWS 就可以是按照天来聚合的数据。

ADS 层：以 DWS 或 DWT 为基础，为各种统计报表提供数据。统计报表就是要进行展示

的表。

任务调度：任务管理就是指在具有依赖关系的多个任务里，先做哪个任务，后做哪个任

务，当某个任务失败时怎么实现自动重启。

元数据管理：元数据管理就是对 hive 表中的数据进行血缘分析。作用是在表多的时候，

如果某一个表出问题了，可以通过可视化的形式快速找出该表时怎么来的，从而解决问题，

如果在表少的情况下则用处不太大。

三、设计目标

3.1 实现功能

下载后可阅读完整内容，剩余3页未读，立即下载

shashashalalala

粉丝: 26
资源: 285

互联网公司数据处理系统架构设计

《软件架构设计文档》ADMEMS模板v2.docx

XXX软件架构设计文档.pdf

java 架构设计示例文档

12. 架构决策与优化实践

构建大型应用：Vue2.x的组织和架构设计

12. 开发技术文档更新

微服务架构的文档化与知识管理

企业架构中的数据架构设计

软件架构设计文档doc下载

免费的软件架构设计文档

最新资源