"Google BigTable：灵活、高性能的分布式存储系统"

需积分: 10 10 浏览量更新于2024-01-15 收藏 721KB DOCX 举报

Google BigTable 是一种分布式存储系统，可以扩展到非常大的尺寸，支持存储PB级别的数据，并能够在数千个商用服务器上运行。该系统被广泛应用于Google的许多项目中，包括WEB索引、Google Earth和Google Finance等。这些不同的应用对BigTable提出了不同的需求，无论是数据量还是延迟需求方面都有所不同。然而，BigTable已经成功为所有Google产品提供了灵活且高性能的解决方案。在本文中，我们将介绍BigTable所提供的简单数据模型，该模型允许客户端对数据的部署和格式进行动态控制。同时，我们还将详细描述BigTable的设计和实施过程。在BigTable中，数据被组织成一个无限大的多维表，每个表由行键（row key）、列键（column key）和时间戳（timestamp）标识。这种表格结构使得数据的访问非常高效，可以根据行键和列键进行快速定位，同时，时间戳可以用来实现数据版本控制。此外，BigTable还支持不同数据类型的存储，包括字符串、整数、浮点数等。 BigTable采用了分布式的存储和计算架构，可以通过横向扩展来应对处理大规模数据的需求。具体来说，BigTable将数据划分为多个区域，每个区域存储在一组服务器上。每个区域都有一个主服务器负责处理读写请求，同时还有若干个副本服务器用于冗余和容错。这种分布式的架构不仅允许数据在不同的服务器之间进行负载均衡，还可以提供高可用性和容错能力。为了提高读写性能，BigTable还使用了各种优化技术。例如，它将热点数据放在内存中进行缓存，以加速读取操作。同时，BigTable也支持批量写入，将多个写入操作合并成一次写入，从而提高写入性能。此外，BigTable还支持快照功能，可以将表格数据在不影响正常运行的情况下进行备份和恢复。 BigTable还提供了灵活的数据一致性和事务处理机制。在BigTable中，数据的一致性可以通过时间戳和版本控制来实现，用户可以根据自己的需求选择不同的一致性级别。此外，BigTable还支持原子操作和事务处理，可以保证多个操作的原子性和一致性。为了方便用户使用，Google还开发了一系列与BigTable相关的工具和接口。例如，用户可以使用HBase API来访问BigTable中的数据，还可以使用Google Cloud Platform提供的管理工具来管理和监控BigTable实例。总之，Google BigTable是一个强大的分布式存储系统，可以支持存储和处理PB级别的数据。它提供了灵活的数据模型和高性能的访问机制，可以满足各种不同应用的需求。通过横向扩展和优化技术，BigTable能够提供高可用性、高性能和高可扩展性。同时，BigTable还提供了灵活的一致性和事务处理机制，使得用户可以根据自己的需求选择不同的数据一致性级别。总的来说，Google BigTable是一种非常强大和有用的分布式存储系统，对于处理大规模数据的应用具有重要意义。

ScanStream *stream;

stream = scanner.FetchColumnFamily(“anchor”);

stream->SetReturnAllVersions();

scanner.Lookup(“com.cnn.www”);

for (; !stream->Done(); stream->Next()) {

printf(“%s %s %lld %sn”,

scanner.RowName(),

stream->ColumnName(),

stream->MicroTimestamp(),

stream->Value());

}

图 3: Reading from Bigtable.

 BigTable 支持几种其他的功能，允许用户以更加复杂的方式来操作数据。首先，

BigTable 支持单行事务，可以允许对存储在某个行键下面的数据执行原子的“读-修改-写”操

作。BigTable 当前不支持通用的跨行键的事务，虽然它在客户端提供了跨行键批量写入数

据的接口。其次，BigTable 允许单元格被用来作为整数计数器。最后，BigTable 支持在服

务器的地址空间内执行客户端提供的脚本。这种脚本是用称为 Sawzall 的语言开发的，这

种语言是 Google 开发出来进行数据处理的。目前，基于 Sawzall 的 API 不允许客户端脚本

对 BigTable 执行回写操作，但是，它确实允许不同类型的数据转换、基于任意表达式的过

滤以及针对不同类型操作符的总结。

 BigTable 可以和 MapReduce[12]一起使用，MapReduce 是 Google 开发的、用来运行大

规模并行计算的框架。我们已经书写了一个 Wrapper 集合，它允许 BigTable 被用来作为一

个 MapReduce 作业的输入源或者输出目标。



4 Building Blocks

 BigTable 是构建在其他几个 Google 基础设施之上的。BigTable 使用了分布式 Google 文

件系统（GFS[17]）来存储日志和数据文件。BigTable 的一个簇通常在一个共享机器池内进

行操作，这个共享机器池会运行其他一些分布式应用。BigTable 的进程通常和其他应用的

进程共享同样的机器。BigTable 依赖一个簇管理系统来调度作业、在共享机器上调度资源、

处理机器失败和监督机器状态。

 Google SSTable 文件格式作为存储 BigTable 数据的内部格式。一个 SSTable 提供一个

持久化的、排序的、不可变的、从键到值的映射，其中，键和值都是任意的字节字符串。

BigTable 提供了查询与一个指定键相关的值的操作，以及在一个指定的键区间内遍历所有

的“键/值对”的操作。在内部，每个 SSTable 都包含一个块序列。通常，每个块是 64KB，不

过块尺寸是可配置的。存储在 SSTable 结尾的块索引，可以用来快速定位块的位置。当

SSTable 被打开时，块索引就会被读入内存。一个查询操作只需要进行一次磁盘扫描，我

们首先在内存的块索引当中使用二分查找方法找到合适的块，然后从磁盘中读取相应的块。

可选地，一个 SSTable 可以被完全读入内存，这样，我们在进行查找操作时，就不需要读

取磁盘。

 BigTable 依赖一个高可用的、持久性的分布式锁服务 Chubby[8]。一个 Chubby 服务包

含 5 个动态副本，其中一个被选作主副本对外提供服务。当大部分副本处于运行状态并且

能够彼此通信时，这个服务就是可用的。Chubby 使用 Paxos 算法[9][23]来使它的副本在失

剩余19页未读，继续阅读

MHuiG

粉丝: 19
资源: 9

"Google BigTable：灵活、高性能的分布式存储系统"

GNU libdbh - Disk based hashtables-开源

谷歌论文 big table 中文版

Guava学习-----弱鸡晋级之路

Google Big Table：分布式结构化数据存储系统

Prototype-Google-Big-Table

谷歌三大论文（GFS，big Table,map reduce）

dataux：与Elasticsearch，Mongo，Cassandra，Big-Table，Google DataStore联合的mysql兼容代理

Google技术与思想：Hadoop详解——GFS、MAP-REDUCE与BIG-TABLE

Building.Your.Next.Big.Thing.with.Google.Cloud.Platform.1484210050

14-Work-with-big-data_Rlanguage_datascience_Big!_

最新资源