《云计算(第二版)》:Hadoop详解与开源实现
需积分: 9 160 浏览量
更新于2024-08-21
收藏 1.68MB PPT 举报
《云计算第二版》是一本由解放军理工大学刘鹏教授和华东交通大学刘鹏共同编著的关于云计算领域的教材,其配套课件详细介绍了Hadoop这一Google云计算的开源实现。本书适合对云计算特别是Hadoop技术感兴趣的读者深入学习。Hadoop是一个重要的分布式计算框架,它在Apache开源组织下发展,能够在廉价硬件集群上运行,提供高可靠性和扩展性的服务。
第六章的核心内容围绕Hadoop展开,包括Hadoop简介、Hadoop分布式文件系统(HDFS)、分布式数据处理模型MapReduce、分布式结构化数据表HBase以及它们的安装和使用方法。Hadoop与Google的云计算系统——GFS(Google File System)、MapReduce和Bigtable之间有紧密的关系,Hadoop借鉴了Google的这些设计理念和技术,但进行了开源和社区化的改造。
Hadoop的特点包括高度的可扩展性,通过简单的编程接口实现大数据处理;经济性,利用廉价硬件实现成本效益;可靠性,通过设计使得硬件故障不再是系统的瓶颈;以及高效性,支持处理大规模数据集并提供实时流式数据访问。
书中还提到了Hadoop项目的组成部分,如Hadoop Common、Avro、Chukwa等工具,以及Hadoop生态系统的其他组件,如Hive用于数据仓库,Pig进行数据处理,以及ZooKeeper用于协调和管理分布式环境中的节点。
设计目标是确保系统在面对常态下的硬件错误时仍能保持正常运行,并强调了移动计算的简化处理,以及在异构软硬件平台间的兼容性。此外,Hadoop的学习还包括了安装步骤和实际操作技巧,例如如何正确配置和使用HDFS和HBase,以及如何编写MapReduce程序来处理分布式数据。
对于想要深入了解Hadoop及其在云计算实践中的应用的读者,《云计算第二版》是一个很好的学习资源,而其配套课件则提供了实用的教学材料。同时,书中提到的姊妹作品《实战Hadoop》也为深入学习者提供了更多实践机会。可以参考当当网和京东商城的购买链接获取书籍和相关资料。
2012-11-01 上传
207 浏览量
2012-11-01 上传
2024-04-22 上传
134 浏览量
101 浏览量
101 浏览量
137 浏览量
105 浏览量
速本
- 粉丝: 20
- 资源: 2万+
最新资源
- 51单片机汇编程序-LED点阵实现简易俄罗斯方块游戏
- wormhole-0.7.0.tar.gz
- random-starred-repository:返回由用户加注星标的随机存储库
- File_Hunter:使用文件玩俄罗斯轮盘! :))
- CSS3灯光闪烁动画文字特效特效代码
- MyBlog:这是一个基于SSM的博客系统
- Sweet Puzzle Time-crx插件
- crbclientregisterand:CRB 客户端注册和。 是一个 android 客户端,它从 android 捕获客户端详细信息并通过restful web 服务将其持久化到 CRB 客户端注册播放框架应用程序
- gRPC中Java和node进行异构通信-互为客户端和服务端示例代码.rar
- Briefwechsel.github.io
- react_spotify:React我们Spotify Stats应用程序的一面
- semantic_logger:Semantic Logger是功能丰富的日志记录框架,可替代现有的Ruby&Rails记录器
- lablabtop
- rest-api-springboot
- 测试工程师学习路线.zip
- MozStumbler:适用于Mozilla的Android Stumbler