HBase操作详解：从创建表到数据删除

需积分: 10 28 浏览量更新于2024-09-15 收藏 200KB PDF 举报

"这篇文档提供了一些HBase的实际操作示例，适合初学者了解和学习HBase的基本操作，如创建、删除表，插入、获取、删除数据，以及浏览表内容和理解锁机制。" HBase是一种分布式、列式存储的NoSQL数据库，它基于Apache Hadoop的HDFS文件系统构建，设计目标是为了支持大规模数据集的实时读写。HBase的灵感来源于Google的Bigtable论文，提供了高度的扩展性、线性可伸缩性和高可用性。在HBase中，表是基本的存储单元，由行和列族组成。每行由行键（Row Key）唯一标识，列族包含一系列列，列族内的列可以通过列限定符（Column Qualifier）来区分。HBase的主要操作包括： 1. **表管理**：使用`HBaseAdmin`类，你可以创建、删除和修改表。表一旦创建，可以通过`HTable`实例进行访问和操作。 2. **插入数据**：通过创建`Put`对象并指定行键、列族和列限定符，以及相应的值和时间戳，然后调用`HTable.put()`方法提交操作。行键在创建`Put`对象时必须提供。 3. **获取数据**：使用`Get`对象，通常传入行键以获取特定行的数据，然后调用`HTable.get()`方法。`Get`对象允许设置各种条件以获取特定的列或时间戳范围内的数据。 4. **浏览数据**：通过`Scan`对象可以遍历表中的多行数据，它类似于游标，使用`next()`方法逐行获取数据。`HTable.getScanner(Scan)`返回`ResultScanner`，用于迭代`Result`对象，每个`Result`包含一行的`KeyValue`。 5. **删除数据**：使用`Delete`对象标记要删除的记录，然后调用`HTable.delete()`执行删除。需要注意，HBase的删除不是立即的，而是通过版本标记为已删除，后续扫描和获取操作会忽略这些标记为删除的版本。 6. **锁机制**：在执行插入、获取和删除操作时，HBase会对涉及的行进行锁定，确保并发操作的正确性。然而，浏览操作不加锁，以提高性能。 7. **集群访问**：客户端通过ZooKeeper发现和连接到HBase集群。ZooKeeper的配置信息（如quorum）应存在于客户端的类路径中，且客户端需要能够找到`hbase-site.xml`配置文件。示例代码段展示了如何操作HBase中的表`myTable`，其中有一个列族`myColumnFamily`。在实际应用中，开发者需要根据具体需求和场景调整这些操作，例如设置不同的过滤器、批处理操作或者进行复杂查询。通过深入理解和实践这些基本操作，初学者可以逐步掌握HBase的核心功能，并进一步探索其高级特性，如 Region 分区、Compaction、Bulk Load、以及与MapReduce和Spark的集成等。

Base 使用例子（中文翻译）

通过编码（java）的形式对 HBase 进行一系列的管理涉及到对表的管理、数据的操作等。

1、对表的创建、删除、显示以及修改等，可以用 HBaseAdmin，一旦创建了表，那么可

以通过 HTable 的实例来访问表，每次可以往表里增加数据。

2、插入数据

创建一个 Put 对象，在这个 Put 对象里可以指定要给哪个列增加数据，以及当前的时间戳

等值，然后通过调用 HTable.put(Put)来提交操作，子猴在这里提请注意的是：在创建

Put 对象的时候，你必须指定一个行(Row)值，在构造 Put 对象的时候作为参数传入。

3、获取数据

要获取数据，使用 Get 对象，Get 对象同 Put 对象一样有好几个构造函数，通常在构造的

时候传入行值，表示取第几行的数据，通过 HTable.get(Get)来调用。

4、浏览每一行

通过 Scan 可以对表中的行进行浏览，得到每一行的信息，比如列名，时间戳等，Scan 相

当于一个游标，通过 next()来浏览下一个，通过调用 HTable.getScanner(Scan) 来返回

一个 ResultScanner 对象。HTable.get(Get)和 HTable.getScanner(Scan) 都是返回

一个 Result。 Result 是一个 KeyValue 的链表，

5、删除

使用 Delete 来删除记录，通过调用 HTable.delete(Delete)来执行删除操作。（注：

删除这里有些特别，也就是删除并不是马上将数据从表中删除。）

6、锁

7、新增、获取、删除在操作过程中会对所操作的行加一个锁，而浏览却不会。

8、簇（cluster）的访问

客户端代码通过 ZooKeeper 来访问找到簇，也就是说 ZooKeeper quorum 将被使用，那么

相关的类（包）应该在客户端的类（classes）目录下，即客户端一定要找到文件 hbase-

site.xml。

下面是一个例子，假定你已经创建了一个表：myTable，还有一个 column family（这

个找不到合适的翻译词语）：myColumnFamily：

HBase 是 Hadoop 的一个子项目,HBase 采用了 Google BigTable 的稀疏的,面向

列的数据库实现方式的理论,建立在 hadoop 的 hdfs 上,一方面里用了 hdfs 的高

可靠性和可伸缩行,另外一方面里用了 BigTable 的高效数据组织形式.可以说

HBase为海量数据的 real-time相应提供了很好的一个开源解决方案.据说在某运

营商中使用类似于 BigTable(个人猜测应该就是 HBase)的技术可以在两秒时间

下载后可阅读完整内容，剩余4页未读，立即下载

only_ping

粉丝: 1
资源: 9

HBase操作详解：从创建表到数据删除

HBase实例演习

Flume+Kafka+HBase实例

java链接及操作hbase实例代码

plugin-hbase:使用 Graphdat 监控您的 HBase 实例

hbase 开发实例

HBase实战实例

Graphdat监控HBase实例的plugin-hbase插件使用指南

Hbase项目实例相关资料

HBase MapReduce完整实例

shell 命令行中操作HBase数据库实例详解

最新资源