大数据技术体系图谱:数据采集、传输、存储及处理的全面概览
61 浏览量
更新于2024-01-03
收藏 2.08MB PPTX 举报
大数据技术体系图谱是一份96页的PPT文档,涵盖了数据采集、数据传输、数据存储、数据处理、数据应用和数据治理等方面的内容。以下是对文档内容的总结:
第1页是目录页,介绍了本文档的结构和分类。
01.数据采集:第3页开始介绍了数据采集的内容。其中包括了日志采集和外部数据采集两部分。在日志采集方面,介绍了采集方式和相关的采集框架,如Logstash、Flume、Fluentd和Chukwa等。在外部数据采集方面,介绍了爬虫技术和相关的爬虫框架,例如Nutch、Heritrix、Scrapy和WebCollector等。此外还涉及到了数据采集与IoT设备、传感器以及探针等的关系。
02.数据传输:第7页开始介绍了数据传输的相关内容。主要包括消息队列、数据同步和数据订阅等方面。列举了一些常用的消息队列工具,如Kafka、ActiveMQ、RabbitMQ和RocketMQ等。同时还提到了一些数据同步工具,如DataX、Kettle、Cannal、Sqoop、SymmetricDS和OGG(Oracle Golden Gate)等。最后还介绍了一些数据订阅相关的工具,如Databus、Wormhole、Otter和阿里云DTS等。此外,还介绍了常用的数据传输序列化工具,包括JSON、Protobuf、Hessian、FST、MessagePack和Avro等。
03.数据存储:第14页开始介绍了数据存储的相关内容。主要涵盖了分布式文件/对象存储、物理存储、分布式关系型数据库、分析型数据库、搜索引擎和K-V存储等方面。在分布式文件/对象存储方面,介绍了几个常见的工具和框架。在物理存储方面,介绍了一些常用的存储方式。在分布式关系型数据库方面,列举了一些常见的数据库工具和框架。在分析型数据库方面,提到了一些常用的工具和技术。在搜索引擎和K-V存储方面,也介绍了一些相关的工具和框架。
总体来说,该大数据技术体系图谱全面覆盖了大数据技术体系的各个方面,包括数据采集、传输、存储、处理、应用和治理等。对于从事大数据领域的技术人员和研究人员来说,这份图谱是一个很好的参考资料,可以帮助他们了解和掌握大数据技术体系的全貌和关键要点。
点击了解资源详情
点击了解资源详情
点击了解资源详情
2021-10-14 上传
2021-10-14 上传
2021-06-25 上传
2021-09-03 上传
2021-10-14 上传
2022-04-26 上传
是空空呀
- 粉丝: 192
- 资源: 3万+
最新资源
- 深入浅出:自定义 Grunt 任务的实践指南
- 网络物理突变工具的多点路径规划实现与分析
- multifeed: 实现多作者间的超核心共享与同步技术
- C++商品交易系统实习项目详细要求
- macOS系统Python模块whl包安装教程
- 掌握fullstackJS:构建React框架与快速开发应用
- React-Purify: 实现React组件纯净方法的工具介绍
- deck.js:构建现代HTML演示的JavaScript库
- nunn:现代C++17实现的机器学习库开源项目
- Python安装包 Acquisition-4.12-cp35-cp35m-win_amd64.whl.zip 使用说明
- Amaranthus-tuberculatus基因组分析脚本集
- Ubuntu 12.04下Realtek RTL8821AE驱动的向后移植指南
- 掌握Jest环境下的最新jsdom功能
- CAGI Toolkit:开源Asterisk PBX的AGI应用开发
- MyDropDemo: 体验QGraphicsView的拖放功能
- 远程FPGA平台上的Quartus II17.1 LCD色块闪烁现象解析