实战Azure数据工厂:大数据与高级分析的运营化
需积分: 9 18 浏览量
更新于2023-03-16
收藏 19.01MB PDF 举报
"Understanding Azure Data Factory: Operationalizing Big Data" 是一本由 Sudhir Rawat 和 Abhishek Narain 合著的书籍,主要聚焦于如何在微软的云服务平台上利用 Azure Data Factory 实现大数据和高级分析的运营化。这本书详细介绍了如何构建和运营 Azure Data Factory(ADF)的数据管道,以及如何将数据仓库现代化,同时关注性能和安全性。
在本书中,读者将学习到以下关键知识点:
1. **Azure Data Factory 概览**:这是一个混合 ETL/ELT(提取、转换、加载/提取、加载)编排服务,专为在 Azure 上处理大规模数据集成而设计。ADF 允许用户在云端和本地环境中构建、安排和管理数据处理工作流。
2. **数据移动与连接能力**:ADF 支持从各种异构源(如本地、云端或 SaaS 应用程序)进行混合数据集成。书中详细介绍了如何有效地从这些不同来源移动数据。
3. **数据转换与控制流**:ADF 提供了强大的数据转换功能,允许用户对数据进行预处理、清洗和转换。此外,书中还涵盖了如何构建和管理控制流程,确保数据处理按照预期进行。
4. **SSIS(SQL Server Integration Services)与 ADF 结合**:对于已经使用 SSIS 的组织,本书将指导如何在 Azure Data Factory 中运行现有的 SSIS 包,实现 ETL 过程的现代化和云迁移。
5. **性能和安全考量**:在数据移动过程中,性能和安全性是至关重要的因素。书中提供了关于优化数据传输速度和确保数据安全性的策略和最佳实践。
6. **监控与警报**:了解如何使用 ADF 监控复杂的管道,设置警报,并根据组织的特定需求扩展自定义监控功能,这是构建高效数据分析和大数据管道的关键部分。
7. **端到端监控**:通过创建单一的监控视图,读者可以学习如何实现对整个数据处理流程的全面监控,这对于管理和调试大型数据项目至关重要。
这本书面向的是希望在 Azure 平台上提升其数据平台能力,解决大数据和高级分析操作难题的专业人士。无论您是数据工程师、数据科学家还是 IT 专业人员,都可以从中获取宝贵的实践经验,以便更好地利用 Azure Data Factory 来驱动业务洞察和决策。
2021-03-25 上传
128 浏览量
127 浏览量
165 浏览量
160 浏览量
2021-05-23 上传
2024-08-18 上传
2021-05-26 上传
173 浏览量
THESUMMERE
- 粉丝: 23
- 资源: 328
最新资源
- 2007年4月全国计算机等级考试二级C笔试试题及答案
- 11 Steps To Create A Successful Website Ebook.pdf
- Beginning Linux Programming 4th Edition
- ArcGIS Desktop快速入门.ppt
- Windows CE 6.0搭建开发环境及模拟器的使用
- c语言最经典的100个实例集
- 编写软件测试用例文档的例子
- jboss4编程起步.pdf
- ACCESS-VBA编程
- oracle函数大全
- ModelSim使用版本
- myeclipse乱码
- IBM电信业商业智能解决方案.pdf
- 12C总线接口模块在数据采集中的应用.pdf
- 高质量C++编程——林锐博士
- 内存模型-多线程内存模型