实战Azure数据工厂:大数据与高级分析的运营化

需积分: 9 19 下载量 18 浏览量 更新于2023-03-16 收藏 19.01MB PDF 举报
"Understanding Azure Data Factory: Operationalizing Big Data" 是一本由 Sudhir Rawat 和 Abhishek Narain 合著的书籍,主要聚焦于如何在微软的云服务平台上利用 Azure Data Factory 实现大数据和高级分析的运营化。这本书详细介绍了如何构建和运营 Azure Data Factory(ADF)的数据管道,以及如何将数据仓库现代化,同时关注性能和安全性。 在本书中,读者将学习到以下关键知识点: 1. **Azure Data Factory 概览**:这是一个混合 ETL/ELT(提取、转换、加载/提取、加载)编排服务,专为在 Azure 上处理大规模数据集成而设计。ADF 允许用户在云端和本地环境中构建、安排和管理数据处理工作流。 2. **数据移动与连接能力**:ADF 支持从各种异构源(如本地、云端或 SaaS 应用程序)进行混合数据集成。书中详细介绍了如何有效地从这些不同来源移动数据。 3. **数据转换与控制流**:ADF 提供了强大的数据转换功能,允许用户对数据进行预处理、清洗和转换。此外,书中还涵盖了如何构建和管理控制流程,确保数据处理按照预期进行。 4. **SSIS(SQL Server Integration Services)与 ADF 结合**:对于已经使用 SSIS 的组织,本书将指导如何在 Azure Data Factory 中运行现有的 SSIS 包,实现 ETL 过程的现代化和云迁移。 5. **性能和安全考量**:在数据移动过程中,性能和安全性是至关重要的因素。书中提供了关于优化数据传输速度和确保数据安全性的策略和最佳实践。 6. **监控与警报**:了解如何使用 ADF 监控复杂的管道,设置警报,并根据组织的特定需求扩展自定义监控功能,这是构建高效数据分析和大数据管道的关键部分。 7. **端到端监控**:通过创建单一的监控视图,读者可以学习如何实现对整个数据处理流程的全面监控,这对于管理和调试大型数据项目至关重要。 这本书面向的是希望在 Azure 平台上提升其数据平台能力,解决大数据和高级分析操作难题的专业人士。无论您是数据工程师、数据科学家还是 IT 专业人员,都可以从中获取宝贵的实践经验,以便更好地利用 Azure Data Factory 来驱动业务洞察和决策。
128 浏览量
Understanding Big Data: Analytics for Enterprise Class Hadoop and Streaming Data Big Data represents a new era in data exploration and utilization, and IBM is uniquely positioned to help clients navigate this transformation. This book reveals how IBM is leveraging open source Big Data technology, infused with IBM technologies, to deliver a robust, secure, highly available, enterprise-class Big Data platform. The three defining characteristics of Big Data–volume, variety, and velocity–are discussed. You’ll get a primer on Hadoop and how IBM is hardening it for the enterprise, and learn when to leverage IBM InfoSphere BigInsights (Big Data at rest) and IBM InfoSphere Streams (Big Data in motion) technologies. Industry use cases are also included in this practical guide. Learn how IBM hardens Hadoop for enterprise-class scalability and reliability Gain insight into IBM’s unique in-motion and at-rest Big Data analytics platform Learn tips and tricks for Big Data use cases and solutions Get a quick Hadoop primer Table of Contents Part I: Big Data: From the Business Perspective Chapter 1 What Is Big Data? Hint: You’re a Part of it Every Day Chapter 2 Why is Big Data Important? Chapter 3 Why IBM for Big Data? Part II: Big Data: From the Technology Perspective Chapter 4 All About Hadoop: The Big Data Lingo Chapter Chapter 5 InfoSphere BigInsights: Analytics for Big Data at Rest Chapter 6 IBM InfoSphere Streams: Analytics for Big Data in Motion Book Details Title: Understanding Big Data Author: Chris Eaton, IBM, Paul Zikopoulos Length: 176 pages Edition: 1 Language: English Publisher: McGraw-Hill Osborne Media Publication Date: 2011-10-19 ISBN-10: 0071790535 ISBN-13: 9780071790536
手机看
程序员都在用的中文IT技术交流社区

程序员都在用的中文IT技术交流社区

专业的中文 IT 技术社区,与千万技术人共成长

专业的中文 IT 技术社区,与千万技术人共成长

关注【CSDN】视频号,行业资讯、技术分享精彩不断,直播好礼送不停!

关注【CSDN】视频号,行业资讯、技术分享精彩不断,直播好礼送不停!

客服 返回
顶部