HBase入门教程：从零开始探索分布式列式数据库

需积分: 10 85 浏览量更新于2024-07-09 收藏 2.85MB PDF 举报

"Hbase0基础入门教程" HBase是一个开源的分布式数据库，源自Google的Bigtable，主要构建在Hadoop的HDFS之上，专为处理大规模数据设计。它提供了高可靠性、高性能、列式存储、可伸缩和近实时读写的特性，特别适合于大数据场景下的非结构化和半结构化数据存储。与传统的关系型数据库如MySQL、Oracle等不同，HBase属于NoSQL数据库，这意味着它不遵循严格的SQL语法规则，而是以键值对的形式存储数据。 HBase的核心特性包括： 1. **实时读写**：与Hadoop的批处理不同，HBase支持实时的读写操作，这对于需要快速响应的应用非常重要。 2. **列式存储**：不同于关系型数据库的行存储，HBase采用列式存储，允许高效地处理大量稀疏数据。 3. **分布式**：数据分布在多台服务器上，通过RegionServer进行管理，实现水平扩展，能处理PB级别的数据。 4. **多版本**：每个数据项可以有多个版本，这在追踪历史数据或实现并发控制时很有用。 5. **无固定字段**：HBase的表没有预定义的列结构，用户可以在运行时动态添加列。 6. **行键唯一**：每行都有一个唯一的行键，且行键是字节数组，保证数据的唯一性。 7. **列簇**：数据按列簇划分，相同列簇的数据物理存储在一起，便于高效访问。 8. **不支持强事务**：HBase对事务的支持较弱，适用于对一致性的要求不高的场景。在实际应用中，HBase常被用于日志分析、实时监控、互联网广告、基因序列分析等领域，尤其是在需要对海量数据进行快速查询和分析的场景。 HBase的体系结构由Master节点、RegionServer节点和HDFS组成。Master负责集群的全局管理和元数据维护，RegionServer则负责具体的数据存储和处理。数据在RegionServer上的分布是通过Region来划分的，每个Region包含一组连续的行键范围。对比关系型数据库的表模型，HBase的表模型更为灵活。在关系型数据库中，表有固定的列结构，而在HBase中，表没有固定的列定义，用户可以自由添加列族。每行数据由行键和一系列的列族构成，每个列族下又可以有多个列。列族是物理存储的单位，不同列族的数据存储在不同的文件中。在学习HBase时，了解其基本概念、安装方法、Shell命令以及读写流程是非常重要的。掌握这些知识后，可以进一步深入研究HBase的配置优化、数据模型设计、故障恢复和监控等高级主题，以更好地应用于实际项目中。

7）(可选)：开启或停止其他RegionServer

[root@qianfeng01 local]$ local-regionservers.sh start 2 3 4 5

[root@qianfeng01 local]$ local-regionservers.sh stop [num]

3.3 全分布式安装

3.3.1 简介

HBASE是一个分布式系统

其中有一个管理角色： HMaster(一般2台，一台active，一台backup)

其他的数据节点角色： HRegionServer(很多台，看数据容量)

实际上，您需要一个完全分布式的配置来全面测试HBase，并在实际场景中使用它。在分布式配置中，集群包含多个节点，每

个节点运行一个或多个HBase守护进程。这些包括主实例和备份主实例、多个ZooKeeper节点和多个RegionServer节点。

3.3.2 环境准备

1）角色分配

qianfeng01: hmaster regionserver

qianfeng02: backup master regionserver

qianfeng03: regionserver

2）配置hbase的环境变量

[root@qianfeng01 ~]# tar -zxvf hbase-1.2.1-bin.tar.gz -C /usr/local/

[root@qianfeng01 ~]# cd /usr/local/

[root@qianfeng01 local]# mv hbase-1.2.1 hbase

[root@qianfeng01 local]# vi /etc/profile

.......省略.......

#hbase environment

export HBASE_HOME=/usr/local/hbase

export PATH=$HBASE_HOME/bin:$PATH

[root@qianfeng01 local]# source /etc/profile

[root@qianfeng01 local]# hbase version

3）配置ssh无密码登陆(一般情况下，都在搭建HDFS时，完成)

4）配置时间同步(非常重要，也应该在搭建HDFS时，完成,时间差不能超过30s)

5）确认hbase-env.sh禁用内置的zookeeper

剩余77页未读，继续阅读

qq_39901808

粉丝: 0
资源: 2

HBase入门教程：从零开始探索分布式列式数据库

HBase入门教程：核心概念与RowKey设计

HBase入门教程与配置详解

Hbase基础教程：轻松入门指南

一条数据的HBase之旅，简明HBase入门教程-Write全流程

HBase入门教程 - 英文版

HBase入门教程：从安装到Java编程实践

HBase入门教程：概念、使用与特性解析

HBase入门教程：安装配置详解及实战指南

HBase入门教程：基于Hadoop的分布式列式数据库

简单了解Hbase及快速入手之入门教程_01.docx

最新资源