Google云计算核心技术：GFS、MapReduce、Chubby与Bigtable

版权申诉

144 浏览量更新于2024-07-02 收藏 890KB DOC 举报

"本文档介绍了Google云计算的基本原理和核心组件，包括Google文件系统GFS、MapReduce、Chubby和Bigtable。重点讲述了GFS作为分布式文件系统的重要角色及其与其他技术的交互，同时对比了其他主流分布式文件系统的特点和局限性。" 在Google云计算的架构中，解决海量数据存储和快速处理的关键技术是Google云计算的四大核心组件：Google文件系统（GFS）、分布式计算编程模型MapReduce、分布式锁服务Chubby和分布式结构化数据存储系统Bigtable。 2.1 Google文件系统GFS GFS是Google为支持其大规模服务而设计的一个分布式文件系统，它的主要目标是处理和存储非常庞大的数据集。GFS的设计理念是高可用性、容错性和可扩展性，能够支持数以百万计的廉价服务器协同工作。GFS的架构包括一个主服务器（Master），负责元数据管理和客户端的文件操作，以及多个Chunk服务器（Chunkserver），实际存储数据块。通过主服务器的协调，GFS保证了文件的一致性和完整性，同时提供了一种高效的数据访问模式。尽管GFS的具体实现细节并未开源，但公开的技术文档提供了对其基本概念和设计原则的深入了解。 2.2 MapReduce MapReduce是Google提出的一种处理大数据的编程模型，它简化了并行编程，允许开发者将复杂的数据处理任务分解为两个阶段：Map（映射）和Reduce（规约）。Map阶段将大任务拆分为小任务，在多台机器上并行处理；Reduce阶段则聚合这些小任务的结果，生成最终的输出。这种模型特别适合于批处理任务，如网页索引构建、数据分析等。 2.3 Chubby Chubby是一种分布式锁服务，它提供了一种在分布式环境中实现强一致性的机制。Chubby为其他Google服务（如GFS和Bigtable）提供了一个可靠的分布式协调服务，确保在多台机器之间进行并发操作时的同步和一致性。 2.4 Bigtable Bigtable是Google的分布式结构化数据存储系统，设计用于存储和管理结构化的半结构化数据。它支持大规模的数据表，可以高效地支持PB级别的数据。Bigtable可以看作是一个分布式的、多维度排序的映射表，键值对中的键可以是多维的，这使得它非常适合存储和查询大数据。与其他主流分布式文件系统相比，如Red Hat的GFS、IBM的GPFS和Sun的Lustre，虽然它们在高性能计算和大型数据中心方面表现出色，但在容错性和可扩展性方面可能不如GFS。例如，Lustre文件系统的容错性主要依赖于硬件层面的解决方案，对硬件设施的要求较高，而GFS则通过软件层面的设计实现了更高级别的容错和数据恢复能力。 Google云计算的核心组件构成了一套强大的技术栈，它们相互协作，为Google的各类服务提供了坚实的基础，同时也为全球范围内的大规模数据处理和实时服务提供了可能。

Google 云计算简介

好像磁盘空间的利用率不高，但综合比较多种因素，加之磁盘的成本不断下降，

采用副本无疑是最简单、最可靠、最有效，而且实现的难度也最小的一种方法。

GFS 中的每一个文件被划分成多个 Chunk，Chunk 的默认大小是 64MB，这是

因为 Google 应用中处理的文件都比较大，以 64MB 为单位进行划分，是一个较为

合理的选择。Chunk Server 存储的是 Chunk 的副本，副本以文件的形式进行存储。

每一个 Chunk 以 Block 为单位进行划分，大小为 64KB，每一个 Block 对应一个

32bit 的校验和。当读取一个 Chunk 副本时，Chunk Server 会将读取的数据和校

验和进行比较，如果不匹配，就会返回错误，从而使 Client 选择其他 Chunk

Server 上的副本。

2.1.3 系统管理技术

严格意义上来说，GFS 是一个分布式文件系统，包含从硬件到软件的整套解

决方案。除了上面提到的 GFS 的一些关键技术外，还有相应的系统管理技术来支

持整个 GFS 的应用，这些技术可能并不一定为 GFS 所独有。

1．大规模集群安装技术

安装 GFS 的集群中通常有非常多的节点，文献[1]中最大的集群超过 1000 个

节点，而现在的 Google 数据中心动辄有万台以上的机器在运行。那么，迅速地

安装、部署一个 GFS 的系统，以及迅速地进行节点的系统升级等，都需要相应的

技术支撑。

2．故障检测技术

GFS 是构建在不可靠的廉价计算机之上的文件系统，由于节点数目众多，故

障发生十分频繁，如何在最短的时间内发现并确定发生故障的 Chunk Server，需

要相关的集群监控技术。

3．节点动态加入技术

当有新的 Chunk Server 加入时，如果需要事先安装好系统，那么系统扩展

将是一件十分烦琐的事情。如果能够做到只需将裸机加入，就会自动获取系统并

安装运行，那么将会大大减少 GFS 维护的工作量。

4．节能技术

有关数据表明，服务器的耗电成本大于当初的购买成本，因此 Google 采用

了多种机制来降低服务器的能耗，例如对服务器主板进行修改，采用蓄电池代替

Google 云计算简介

昂贵的 UPS（不间断电源系统），提高能量的利用率。Rich Miller 在一篇关于数

据中心的博客文章中表示，这个设计让 Google 的 UPS 利用率达到 99.9%，而一

般数据中心只能达到 92%～95%。

2.2 并行数据处理 MapReduce

MapReduce 是 Google 提出的一个软件架构，是一种处理海量数据的并行编

程模式，用于大规模数据集（通常大于 1TB）的并行运算。“Map（映射）”、

“Reduce（化简）”的概念和主要思想，都是从函数式编程语言和矢量编程语言

借鉴来的

[5]

。正是由于 MapReduce 有函数式和矢量编程语言的共性，使得这种编

程模式特别适合于非结构化和结构化的海量数据的搜索、挖掘、分析与机器智能

学习等。

2.2.1 产生背景

MapReduce 这种并行编程模式思想最早是在 1995 年提出的，文献[6]首次

提出了 “ map ” 和 “ fold ” 的概念，和现在 Google 所使用的 “ Map ” 和

“Reduce”思想是相吻合的。

与传统的分布式程序设计相比，MapReduce 封装了并行处理、容错处理、本

地化计算、负载均衡等细节，还提供了一个简单而强大的接口。通过这个接口，

可以把大尺度的计算自动地并发和分布执行，从而使编程变得非常容易。还可以

通过由普通 PC 构成的巨大集群来达到极高的性能。另外，MapReduce 也具有较

好的通用性，大量不同的问题都可以简单地通过 MapReduce 来解决。

MapReduce 把对数据集的大规模操作，分发给一个主节点管理下的各分节点

共同完成，通过这种方式实现任务的可靠执行与容错机制。在每个时间周期，主

节点都会对分节点的工作状态进行标记，一旦分节点状态标记为死亡状态，则这

个节点的所有任务都将分配给其他分节点重新执行。

据相关统计，每使用一次 Google 搜索引擎，Google 的后台服务器就要进行

次运算。这么庞大的运算量，如果没有好的负载均衡机制，有些服务器的利

用率会很低，有些则会负荷太重，有些甚至可能死机，这些都会影响系统对用户

的服务质量。而使用 MapReduce 这种编程模式，就保持了服务器之间的均衡，提

高了整体效率。

剩余31页未读，继续阅读

是空空呀

粉丝: 198
资源: 3万+

Google云计算核心技术：GFS、MapReduce、Chubby与Bigtable

谷歌云计算

google云计算体系架构详解

2Google云计算与Amazon云计算对比.doc

1Google云计算与Amazon云计算对比.doc

Google云计算原理.doc编程资料

云计算的架构-–-从技术角度剖析云计算-.doc.doc

详解云计算技术.doc

武汉理工云计算重点.doc

大作业(云计算).doc

[详细完整版]云计算描述.doc

最新资源