Google GFS：大规模分布式文件系统中文翻译

需积分: 20 96 浏览量更新于2024-07-18 收藏 368KB DOCX 举报

"Google File System论文中文翻译版" Google文件系统（Google File System，简称GFS）是一个专为大规模数据密集型应用设计的可伸缩分布式文件系统。它旨在在经济实惠的通用硬件设备上运行，同时提供高可用性和灾难冗余功能，服务于大量并发的客户端。GFS的设计理念虽与传统的分布式文件系统有共同之处，但其具体实现是根据Google自身的应用负载和技术环境分析定制的，这使得GFS与早期的分布式文件系统在许多方面存在显著差异。 GFS的独特设计主要体现在以下几个方面： 1. **故障常态化**：GFS预设组件故障是正常现象，而非异常情况。由于系统由成百上千的普通低价设备组成，并面临大量客户端的访问，硬件故障的概率非常高，包括硬盘、内存、网络连接等问题。因此，GFS强调持续监控、错误检测、容错和自动恢复机制的集成。 2. **大文件处理**：GFS处理的文件尺寸以GB计，远超传统文件系统。这种设计适应了大数据处理的需求，如海量日志分析和大规模计算任务。 3. **单主服务器模型**：GFS采用主/从结构，有一个主服务器负责元数据管理，如文件和块的映射，以及协调写入操作。这种集中式的设计简化了系统复杂性，但也需要主服务器具有高可用性。 4. **大块存储**：文件被分割成64MB的大块，并在多台机器上冗余存储，以提高读写性能和容错能力。 5. **优化的写操作**：写操作通常以追加方式进行，减少对昂贵的随机写入的需求。如果需要修改已存在的数据，GFS会创建新的数据块，而不是覆盖旧的，从而简化了恢复过程。 6. **高性能读取**：通过块缓存策略，GFS可以快速响应常见数据的读取请求，提升整体性能。 7. **可伸缩性**：GFS能够轻松扩展到数千台机器，提供PB级别的存储容量，并能服务于数百个并发客户端。论文详细阐述了GFS的扩展性接口、设计选择、实现细节以及性能评估。通过实际测试和生产环境中的数据，展示了系统在大规模分布式应用中的表现。GFS在Google内部广泛应用于数据存储和服务，支撑着各种数据密集型服务和研究项目。总结来说，GFS是Google应对大规模数据处理挑战的关键技术，其设计理念和实现方式对于理解和构建现代分布式存储系统具有深远的影响。这篇论文的中文翻译版为学习和研究分布式文件系统提供了宝贵的资料。

数据（命名空间、文件和 Chunk 的对应关系）同时也会以记录变更日志的方式记录在操作系

统的系统日志文件中，日志文件存储在本地磁盘上，同时日志会被复制到其它的远程 Master

服务器上。采用保存变更日志的方式，我们能够简单可靠的更新 Master 服务器的状态，并且

不用担心 Master 服务器崩溃导致数据不一致的风险。Master 服务器不会持久保存 Chunk 位

置信息。Master 服务器在启动时，或者有新的 Chunk 服务器加入时，向各个 Chunk 服务器

轮询它们所存储的 Chunk 的信息。

2.6.1 内存中的数据结构

因为元数据保存在内存中，所以 Master 服务器的操作速度非常快。并且，Master 服务器可以

在后台简单而高效的周期性扫描自己保存的全部状态信息。这种周期性的状态扫描也用于实现

Chunk 垃圾收集、在 Chunk 服务器失效的时重新复制数据、通过 Chunk 的迁移实现跨

Chunk 服务器的负载均衡以及磁盘使用状况统计等功能。4.3 和 4.4 章节将深入讨论这些行为。



将元数据全部保存在内存中的方法有潜在问题：Chunk 的数量以及整个系统的承载能力都受限

于 Master 服务器所拥有的内存大小。但是在实际应用中，这并不是一个严重的问题。Master

服务器只需要不到 64 个字节的元数据就能够管理一个 64MB 的 Chunk。由于大多数文件都包

含多个 Chunk，因此绝大多数 Chunk 都是满的，除了文件的最后一个 Chunk 是部分填充的。

同样的，每个文件的在命名空间中的数据大小通常在 64 字节以下，因为保存的文件名是用前

缀压缩算法压缩过的。



即便是需要支持更大的文件系统，为 Master 服务器增加额外内存的费用是很少的，而通过增

加有限的费用，我们就能够把元数据全部保存在内存里，增强了系统的简洁性、可靠性、高性

能和灵活性。

2.6.2 Chunk 位置信息

Master 服务器并不保存持久化保存哪个 Chunk 服务器存有指定 Chunk 的副本的信息。

Master 服务器只是在启动的时候轮询 Chunk 服务器以获取这些信息。Master 服务器能够保

证它持有的信息始终是最新的，因为它控制了所有的 Chunk 位置的分配，而且通过周期性的

心跳信息监控 Chunk 服务器的状态。

最初设计时，我们试图把 Chunk 的位置信息持久的保存在 Master 服务器上，但是后来我们发

现在启动的时候轮询 Chunk 服务器，之后定期轮询更新的方式更简单。这种设计简化了在有

Chunk 服务器加入集群、离开集群、更名、失效、以及重启的时候，Master 服务器和 Chunk

服务器数据同步的问题。在一个拥有数百台服务器的集群中，这类事件会频繁的发生。

可以从另外一个角度去理解这个设计决策：只有 Chunk 服务器才能最终确定一个 Chunk 是否

在它的硬盘上。我们从没有考虑过在 Master 服务器上维护一个这些信息的全局视图，因为

Chunk 服务器的错误可能会导致 Chunk 自动消失(比如，硬盘损坏了或者无法访问了)，亦或

者操作人员可能会重命名一个 Chunk 服务器。

2.6.3 操作日志

操作日志包含了关键的元数据变更历史记录。这对 GFS 非常重要。这不仅仅是因为操作日志是

元数据唯一的持久化存储记录，它也作为判断同步操作顺序的逻辑时间基线

（

alex

注：也就是

通过逻辑日志的序号作为操作发生的逻辑时间，类似于事务系统中的

LSN

）

。文件和 Chunk，

连同它们的版本(参考 4.5 节)，都由它们创建的逻辑时间唯一的、永久的标识。

操作日志非常重要，我们必须确保日志文件的完整，确保只有在元数据的变化被持久化后，日

志才对客户端是可见的。否则，即使 Chunk 本身没有出现任何问题，我们仍有可能丢失整个

文件系统，或者丢失客户端最近的操作。所以，我们会把日志复制到多台远程机器，并且只有

把相应的日志记录写入到本地以及远程机器的硬盘后，才会响应客户端的操作请求。Master

服务器会收集多个日志记录后批量处理，以减少写入磁盘和复制对系统整体性能的影响。

Master 服务器在灾难恢复时，通过重演操作日志把文件系统恢复到最近的状态。为了缩短

Master 启动的时间，我们必须使日志足够小

（

alex

注：即重演系统操作的日志量尽量的少）。

Master 服务器在日志增长到一定量时对系统状态做一次 Checkpoint(alex

注：

Checkpoint

是一种行为，一种对数据库状态作一次快照的行为

)

，

将所有的状态数据写入一个 Checkpoint

文件

（

alex

注：并删除之前的日志文件）。

在灾难恢复的时候，Master 服务器就通过从磁盘

上读取这个 Checkpoint 文件，以及重演 Checkpoint 之后的有限个日志文件就能够恢复系统。

Checkpoint 文件以压缩 B-树形势的数据结构存储，可以直接映射到内存，在用于命名空间查

询时无需额外的解析。这大大提高了恢复速度，增强了可用性。

剩余42页未读，继续阅读

zkspirit

粉丝: 0
资源: 8

Google GFS：大规模分布式文件系统中文翻译

Google文件系统(Google_File_System)论文

GOOGLE的TPU论文

The_Google_File_System_中文版论文

哪些存储计算架构是基于Google公司架构开源设计的

头歌Hadoop 大数据基础

hadoop的设计思想

什么是hdfs，hdfs的特点，发展历史

Hadoop的国内外研究的历史及现状

大数据技术文献有哪些

GADOOP是干嘛的

最新资源