Google GFS中文翻译：大规模分布式文件系统

中文译本

大数据存储

需积分: 50 78 浏览量更新于2024-07-18 收藏 758KB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

"The Google File System (GFS) 是谷歌设计和实现的一种大规模分布式文件系统，专注于处理数据密集型应用。GFS旨在提供高可伸缩性、高性能、可靠性和可用性，尤其针对大规模分布式环境。它运行在经济实惠的硬件上，并具有容错能力，即使在组件频繁失效的情况下也能正常运作。此中文译本详细介绍了GFS的设计原则、接口扩展、性能测试以及在实际生产环境中的应用。" GFS（Google FileSystem）是谷歌为了应对快速增长的数据处理需求而构建的分布式文件系统。与传统文件系统类似，GFS追求高性能、可伸缩性、可靠性和可用性，但其设计特别考虑了谷歌自身应用的负载特性和技术环境。由于谷歌的应用场景涉及大量普通且廉价的硬件设备，因此GFS的设计预期组件失效是常态，而非异常。 GFS的架构由大量存储节点组成，这些节点由成千上万台服务器和硬盘构建，服务于数百个客户机。每个节点都有可能出现故障，如软件错误、操作系统问题、人为操作失误，甚至是硬件故障，如硬盘、内存、网络设备和电源的失效。系统通过持续监控和错误检测机制来确保服务的连续性。文件系统接口在GFS中进行了扩展，以适应分布式应用的需求。这包括对大型文件的高效读写操作，以及对并发访问和数据一致性的管理。GFS的设计重点在于简化一致性模型，以换取更高的系统吞吐量和可用性，而不是绝对的强一致性。在性能方面，GFS通过并行化和数据复制策略实现了高性能。数据被分割成大块（chunks），每个chunk通常有多个副本，分布在整个集群中，以提高读取速度和容错能力。当某个chunk服务器失效时，系统能够快速切换到其他副本，保证服务不中断。 GFS的可伸缩性体现在它可以轻松地扩展到数千台机器，提供数百TB的存储容量。这种扩展性不仅局限于硬件，也包括软件层面，使得系统能够处理日益增长的用户和数据需求。测试结果表明，GFS在大规模集群环境中表现出了优秀的性能，能够有效地支持谷歌的各种内部服务和大数据处理任务。 GFS的成功在于其独特的设计理念，即以大规模分布式环境的实际需求为导向，克服了传统文件系统在处理大数据和高并发场景下的局限。这一设计思路对于后来的大数据存储系统，如Hadoop的HDFS，产生了深远影响。

资源详情

资源推荐

服务器的状态，并且不用担心 Master 服务器崩溃导致数据不一致的风险。

Master 服务器不会持久保存 Chunk 位置信息。Master 服务器在启动时，或者

有新的 Chunk 服务器加入时，向各个 Chunk 服务器轮询它们所存储的 Chunk

的信息。

2.6.1 内存中的数据结构

因为元数据保存在内存中，所以 Master 服务器的操作速度非常快。并且，Master

服务器可以在后台简单而高效的周期性扫描自己保存的全部状态信息。这种周期

性的状态扫描也用于实现 Chunk 垃圾收集、在 Chunk 服务器失效的时重新复

制数据、通过 Chunk 的迁移实现跨 Chunk 服务器的负载均衡以及磁盘使用状

况统计等功能。4.3 和 4.4 章节将深入讨论这些行为。

将元数据全部保存在内存中的方法有潜在问题：Chunk 的数量以及整个系统的

承载能力都受限于 Master 服务器所拥有的内存大小。但是在实际应用中，这并

不是一个严重的问题。Master 服务器只需要不到 64 个字节的元数据就能够管

理一个 64MB 的 Chunk。由于大多数文件都包含多个 Chunk，因此绝大多数

Chunk 都是满的，除了文件的最后一个 Chunk 是部分填充的。同样的，每个

文件的在命名空间中的数据大小通常在 64 字节以下，因为保存的文件名是用前

缀压缩算法压缩过的。

即便是需要支持更大的文件系统，为 Master 服务器增加额外内存的费用是很少

的，而通过增加有限的费用，我们就能够把元数据全部保存在内存里，增强了系

统的简洁性、可靠性、高性能和灵活性。

2.6.2 Chunk 位置信息

Master 服务器并不保存持久化保存哪个 Chunk 服务器存有指定 Chunk 的副本

的信息。Master 服务器只是在启动的时候轮询 Chunk 服务器以获取这些信息。

Master 服务器能够保证它持有的信息始终是最新的，因为它控制了所有的

Chunk 位置的分配，而且通过周期性的心跳信息监控 Chunk 服务器的状态。

最初设计时，我们试图把 Chunk 的位置信息持久的保存在 Master 服务器上，

但是后来我们发现在启动的时候轮询 Chunk 服务器，之后定期轮询更新的方式

更简单。这种设计简化了在有 Chunk 服务器加入集群、离开集群、更名、失效、

以及重启的时候，Master 服务器和 Chunk 服务器数据同步的问题。在一个拥

有数百台服务器的集群中，这类事件会频繁的发生。

可以从另外一个角度去理解这个设计决策：只有 Chunk 服务器才能最终确定一

个 Chunk 是否在它的硬盘上。我们从没有考虑过在 Master 服务器上维护一个

这些信息的全局视图，因为 Chunk 服务器的错误可能会导致 Chunk 自动消失

(比如，硬盘损坏了或者无法访问了)，亦或者操作人员可能会重命名一个 Chunk

服务器。

2.6.3 操作日志

操作日志包含了关键的元数据变更历史记录。这对 GFS 非常重要。这不仅仅是

因为操作日志是元数据唯一的持久化存储记录，它也作为判断同步操作顺序的逻

辑时间基线

（

alex

注：也就是通过逻辑日志的序号作为操作发生的逻辑时间，

类似于事务系统中的

LSN

）

。文件和 Chunk，连同它们的版本(参考 4.5 节)，

都由它们创建的逻辑时间唯一的、永久的标识。

操作日志非常重要，我们必须确保日志文件的完整，确保只有在元数据的变化被

持久化后，日志才对客户端是可见的。否则，即使 Chunk 本身没有出现任何问

题，我们仍有可能丢失整个文件系统，或者丢失客户端最近的操作。所以，我们

会把日志复制到多台远程机器，并且只有把相应的日志记录写入到本地以及远程

机器的硬盘后，才会响应客户端的操作请求。Master 服务器会收集多个日志记

录后批量处理，以减少写入磁盘和复制对系统整体性能的影响。

Master 服务器在灾难恢复时，通过重演操作日志把文件系统恢复到最近的状态。

为了缩短 Master 启动的时间，我们必须使日志足够小

（

alex

注：即重演系统

操作的日志量尽量的少）。

Master 服务器在日志增长到一定量时对系统状态做

一次 Checkpoint(alex

注：

Checkpoint

是一种行为，一种对数据库状态作一

次快照的行为

)

，

将所有的状态数据写入一个 Checkpoint 文件

（

alex

注：并删

除之前的日志文件）。

在灾难恢复的时候，Master 服务器就通过从磁盘上读取

这个 Checkpoint 文件，以及重演 Checkpoint 之后的有限个日志文件就能够

恢复系统。Checkpoint 文件以压缩 B-树形势的数据结构存储，可以直接映射

到内存，在用于命名空间查询时无需额外的解析。这大大提高了恢复速度，增强

了可用性。

由于创建一个 Checkpoint 文件需要一定的时间，所以 Master 服务器的内部状

态被组织为一种格式，这种格式要确保在 Checkpoint 过程中不会阻塞正在进行

的修改操作。Master 服务器使用独立的线程切换到新的日志文件和创建新的

Checkpoint 文件。新的 Checkpoint 文件包括切换前所有的修改。对于一个包

含数百万个文件的集群，创建一个 Checkpoint 文件需要 1 分钟左右的时间。

创建完成后，Checkpoint 文件会被写入在本地和远程的硬盘里。

Master 服务器恢复只需要最新的 Checkpoint 文件和后续的日志文件。旧的

Checkpoint 文件和日志文件可以被删除，但是为了应对灾难性的故障

（

alex

注：

catastrophes

，数据备份相关文档中经常会遇到这个词，表示一种超出预

期范围的灾难性事件），

我们通常会多保存一些历史文件。Checkpoint 失败不

会对正确性产生任何影响，因为恢复功能的代码可以检测并跳过没有完成的

Checkpoint 文件。

2.7 一致性模型

GFS 支持一个宽松的一致性模型，这个模型能够很好的支撑我们的高度分布的

应用，同时还保持了相对简单且容易实现的优点。本节我们讨论 GFS 的一致性

的保障机制，以及对应用程序的意义。我们也着重描述了 GFS 如何管理这些一

致性保障机制，但是实现的细节将在本论文的其它部分讨论。

2.7.1 GFS 一致性保障机制

文件命名空间的修改（例如，文件创建）是原子性的。它们仅由 Master 节点的

控制：命名空间锁提供了原子性和正确性（4.1 章）的保障；Master 节点的操

作日志定义了这些操作在全局的顺序（2.6.3 章）。

剩余30页未读，继续阅读

graykeel

粉丝: 0
资源: 4

Google GFS中文翻译：大规模分布式文件系统

The Google File System中文版.docx

Google-File-System中文版_1.0.zip

Google File System中文版

The Google File System要解决的问题是否重要

Hadoop Distributed File System

linux how to Install the app Chrome using the locally downloaded .deb file and dpkg Start the application

N: Ignoring file 'google-chrome.list.1' in directory '/etc/apt/sources.list.d/' as it has an invalid filename extension

unknown error: DevToolsActivePort file doesn't exist

使用谷歌服务把音频pcm识别成文字的java代码

Could not resolve host: mirrorlist.centos.org

Java视频转文字

用JAVA写一个语音识别的代码

生成一段AI配音的python代码

android AppID

java 将本地文件转为外部能访问的的url

利用java-diff-utils与katalon对接，实现自动化针对两个文件夹下的同名文件做比较

unity3d怎么将文本生成音频

使用java实现语音转文字

pycharm 更换谷歌

最新资源