Google Bigtable：分布式结构化数据存储系统解析

需积分: 14 76 浏览量更新于2024-07-24 收藏 509KB PDF 举报

"Bigtable: A Distributed Storage System for Structured Data" 这篇论文主要介绍了Google的分布式存储系统——Bigtable，它是一个用于存储结构化数据的系统，由Google的工程师团队设计和实现。Bigtable的设计目标是处理大规模的数据集，并提供高可用性和可扩展性。以下是对论文内容的详细阐述： 1. **数据模型**： - **行（Rows）**：Bigtable中的数据以行的形式组织，每行都有一个唯一的行键，这使得数据可以根据行键进行快速定位。 - **列族（Column Families）**：数据按照列族分组，每个列族包含一系列相关的列。列族允许数据的存储和访问策略进行预配置，如压缩和存储级别。 - **时间戳（Timestamps）**：在Bigtable中，同一行、同一列族的不同版本的数据可以通过时间戳来区分。这使得系统可以支持多个历史版本，并实现数据的时序管理。 2. **应用程序接口（API）**： - Bigtable提供了一个简单的API，允许用户通过行键、列名和时间戳来读写数据。API还支持范围扫描和条件查询，便于对大量数据进行高效操作。 3. **构建块（Building Blocks）**： - Bigtable利用了Google的其他基础架构组件，如GFS（Google File System）用于存储数据，Chubby作为分布式锁服务保证数据一致性。 - **Tablets**：数据被分割成称为Tablets的逻辑单元，每个Tablet对应一部分行的范围。Tablets的设计使得数据可以在集群中的不同节点之间进行分布和迁移。 4. **实现细节**： - **Tablet Location**：Tablets在集群中的位置由一个名为Master的服务管理，它负责Tablet的分配和分区。 - **Tablet Assignment**：当Tablet服务器启动或停止时，Master会重新分配Tablets，确保服务的连续性。 - **Tablet Serving**：Tablet服务器处理来自客户端的请求，包括读写操作，它们负责保持Tablets的内存缓存和磁盘持久化。 5. **性能和扩展性**： - 为了处理大规模数据，Bigtable设计为水平扩展，可以通过添加更多的硬件节点来增加系统的容量和处理能力。 - 冗余和复制机制保证了系统的高可用性，即使在部分节点故障的情况下也能继续服务。 Bigtable是Google为解决大规模结构化数据存储而设计的一种分布式存储解决方案。其数据模型、API设计以及内部的构建和实现策略，使其成为处理海量数据的高效工具，广泛应用于Google的各种服务，如Google Search、Google Analytics和Google App Engine等。

本翻译论文源于厦门大学计算机系数据库实验室林子雨老师的云数据库技术资料专区

http://dblab.xmu.edu.cn/cloud_database_view

第 5 页 /共 23 页翻译：厦门大学计算机系教师林子雨 http://www.cs.xmu.edu.cn/linziyu

本数据并且创建衍生的列家族，一些应用则只被允许浏览现有的数据（甚至，如果出于隐私

保护考虑，无法浏览全部列家族）。

Timestamps

在 BigTable 中的每个单元格当中，都包含相同数据的多个版本，这些版本采用时间戳

进行索引。BitTable 时间戳是 64 位整数。BigTable 对时间戳进行分配，时间戳代表了真实

时间，以微秒来计算。客户应用也可以直接分配时间戳。需要避免冲突的应用必须生成唯一

的时间戳。一个单元格的不同版本是根据时间戳降序的顺序进行存储的，这样，最新的版本

可以被最先读取。

为了减轻版本数据的管理负担，我们支持两种“每列家族”设置，它会告诉 BigTable

来自动垃圾收集（garbage-collect）单元格版本。用户可以设定只保存单元格中数据的最近 n

个版本，或者只保存足够新版本（比如只保存最近 7 天内的数据版本）。

在我们的 Webtable 实例当中，我们为存储在 contents:column 中的网页设置时间戳，时

间戳的数值就是这个网页的这个版本被抓取的真实时间。上面所描述的垃圾收集机制，允许

我们只保留每个网页的最近三个版本。

3 API

BigTable 的 API 提供了删除和创建表和列家族的功能。它还提供了改变簇、表和列家族

的元数据，比如访问控制权限。

客户应用可以书写和删除 BigTable 中的值，从单个行中查询值，或者对表中某个数据

子集进行遍历。图 2 显示了一段 C++代码，它使用了 RowMutation 来执行一系列的更新（为

了更好地理解这个例子，已经忽略了不相关的细节）。对 Apply 的调用，会执行一个针对

Webtable 的原子更新操作：它增加一个 anchor 到 www.cnn.com 中去，并且删除一个不同的

anchor。

// Open the table

Table *T = OpenOrDie("/bigtable/web/webtable");

// Write a new anchor and delete an old anchor

RowMutation r1(T, "com.cnn.www");

r1.Set("anchor:www.c-span.org", "CNN");

r1.Delete("anchor:www.abc.com");

Operation op;

Apply(&op, &r1);

Figure 2: Writing to Bigtable.

图 3 显示了一段 C++代码，它使用了 Scanner 来遍历某个行中的所有 anchor。客户端可

以遍历多个列家族，并且有几种机制可以用来对一次扫描中所产生的行、列和时间戳的数量

进行限制。例如，我们可以对上面的扫描进行限制，让所产生的 anchor 所在的列与正则表

达式匹配 anchor:*.cnn.com，或者只产生那些时间戳距离当前时间 10 天以内的 anchor。

Scanner scanner(T);

ScanStream *stream;

stream = scanner.FetchColumnFamily("anchor");

stream->SetReturnAllVersions();

scanner.Lookup("com.cnn.www");

for (; !stream->Done(); stream->Next()) {

printf("%s %s %lld %s\n",

scanner.RowName(),

stream->ColumnName(),

stream->MicroTimestamp(),

剩余22页未读，继续阅读

Tech_Hog

粉丝: 69
资源: 17

Google Bigtable：分布式结构化数据存储系统解析

Bigtable: A Distributed Storage System for Structured Data中文翻译

Bigtable：A Distributed Storage System for Structured Data

BigTable A Distributed Storage System for Structured Data

hbase来源于哪篇博文

大数据技术文献有哪些

Datagear如何正确配置JDBC连接Bigtable？

阐述BigTable的系统架构

Hadoop、Spark

Hadoop，habse，spark 参考文献

说明Bigtable数据模型和具体架构

最新资源