Hadoop权威指南第4版:构建大规模分布式系统详解
5星 · 超过95%的资源 需积分: 39 159 浏览量
更新于2024-07-22
17
收藏 11.08MB PDF 举报
《Hadoop:权威指南》第四版是由Tom White所著,是一本专为程序员和管理员设计的全面指南,旨在帮助读者理解和构建可靠的、可扩展的分布式系统,特别是使用Apache Hadoop。本书针对的是数据分析师和Hadoop集群管理者,特别强调在Hadoop 2版本的基础上,介绍了新章节如YARN(Yet Another Resource Negotiator)和相关项目如Parquet、Flume、Crunch和Spark。
书中涵盖了Hadoop的基础组件,如MapReduce、Hadoop分布式文件系统(HDFS)、YARN以及它们的工作原理。作者深入探讨了MapReduce,包括开发应用程序的步骤,以及不同类型的格式和特性。对于Hadoop操作,读者可以学习如何设置和维护Hadoop集群,包括HDFS和MapReduce在YARN上的运行。此外,书还介绍了两种数据格式:Avro用于序列化数据,Parquet则适合处理嵌套数据。
数据导入工具如Flume(用于流数据)和Sqoop(用于批量数据转移)也在本书中有所涉及。同时,高级数据处理工具如Pig、Hive、Crunch和Spark与Hadoop的集成也被详细讲解。HBase分布式数据库和ZooKeeper分布式配置服务是其他关键主题,后者用于协调集群中的配置和协调工作。
本书还包含两个实际案例研究,展示了Hadoop在医疗系统和基因组数据分析中的应用。附录部分提供了安装Apache Hadoop的指南,以及使用Cloudera发行版的信息,还包括如何准备NCDC天气数据和对比旧版与新版Java MapReduce API。
《Hadoop:权威指南》第四版不仅是一个技术手册,也是对Hadoop生态系统全面而深入的理解指南,适合那些希望在这个领域深入学习和实践的专业人士。随着技术的不断更新,这本书不仅能帮助读者掌握基础知识,还能紧跟Hadoop技术的发展趋势。
2018-04-20 上传
2018-06-16 上传
2018-01-31 上传
2024-01-29 上传
2017-02-13 上传
2018-03-22 上传
142 浏览量
2018-05-25 上传
2019-03-19 上传
ramissue
- 粉丝: 354
- 资源: 1487
最新资源
- ES管理利器:ES Head工具详解
- Layui前端UI框架压缩包:轻量级的Web界面构建利器
- WPF 字体布局问题解决方法与应用案例
- 响应式网页布局教程:CSS实现全平台适配
- Windows平台Elasticsearch 8.10.2版发布
- ICEY开源小程序:定时显示极限值提醒
- MATLAB条形图绘制指南:从入门到进阶技巧全解析
- WPF实现任务管理器进程分组逻辑教程解析
- C#编程实现显卡硬件信息的获取方法
- 前端世界核心-HTML+CSS+JS团队服务网页模板开发
- 精选SQL面试题大汇总
- Nacos Server 1.2.1在Linux系统的安装包介绍
- 易语言MySQL支持库3.0#0版全新升级与使用指南
- 快乐足球响应式网页模板:前端开发全技能秘籍
- OpenEuler4.19内核发布:国产操作系统的里程碑
- Boyue Zheng的LeetCode Python解答集