HBase在Ubuntu上安装及编程实战教程

需积分: 9 0 下载量 134 浏览量 更新于2024-08-10 收藏 944KB DOCX 举报
本篇文档是一份关于HBase安装与应用编程的大数据技术课程实验报告,由学生姚能燕撰写,学号为2018764325,于2020年10月30日完成。实验报告详细记录了在Ubuntu Linux 20.04.1操作系统环境下,配置Hadoop 2.10.1版本和JDK 1.8.0_261,使用Eclipse 2020-06作为Java开发工具,以及Putty 0.74和FileZillaClient 3.50.0进行网络管理,同时安装和配置HBase 2.2.6(2020年9月4日稳定版)的过程。 实验的核心内容包括: 1. **HBase安装**:在实验环境中,学生首先确保了必要的软件环境,如Hadoop和JDK的最新版本,这是HBase运行的基础。HBase是Google Bigtable的开源实现,它是一个分布式、面向列的NoSQL数据库,特别适合处理大规模数据,通过Hadoop框架提供高吞吐量的数据存储和读取。 2. **IDE集成**:使用Eclipse 2020-06作为Java开发环境,这使得开发者能够编写、调试和管理HBase相关的Java应用程序,例如客户端API的调用和服务器端的表操作。 3. **远程连接工具**:Putty和FileZillaClient被用于SSH连接HBase集群,以便进行远程管理和维护,这在分布式系统中是必不可少的。 4. **版本确认**:实验中明确指出HBase的版本为2.2.6,这可能涉及到特定的功能特性和优化,对于理解HBase的最新特性以及如何在实际项目中应用至关重要。 5. **实践操作**:实验报告中应包含了创建HBase表、插入数据、查询数据、行和列族的操作,以及可能涉及到的数据模型设计和性能优化等实践性内容。 6. **学习目标**:这份报告旨在帮助学生深入理解HBase的安装、配置和使用,以及如何将其应用于大数据处理场景,提升他们对分布式数据库和云计算的理解。 通过这份实验报告,读者可以了解到一个实际的HBase部署和使用的完整流程,这对于大数据专业人员或者想要学习Hadoop生态系统的开发者来说,具有很高的参考价值。

org.apache.hadoop.hbase.DoNotRetryIOException: Unable to load configured region split policy 'org.apache.phoenix.schema.MetaDataSplitPolicy' for table 'SYSTEM.CATALOG' Set hbase.table.sanity.checks to false at conf or table descriptor if you want to bypass sanity checks at org.apache.hadoop.hbase.util.TableDescriptorChecker.warnOrThrowExceptionForFailure(TableDescriptorChecker.java:296) at org.apache.hadoop.hbase.util.TableDescriptorChecker.sanityCheck(TableDescriptorChecker.java:109) at org.apache.hadoop.hbase.master.HMaster.createTable(HMaster.java:2025) at org.apache.hadoop.hbase.master.MasterRpcServices.createTable(MasterRpcServices.java:657) at org.apache.hadoop.hbase.shaded.protobuf.generated.MasterProtos$MasterService$2.callBlockingMethod(MasterProtos.java) at org.apache.hadoop.hbase.ipc.RpcServer.call(RpcServer.java:413) at org.apache.hadoop.hbase.ipc.CallRunner.run(CallRunner.java:133) at org.apache.hadoop.hbase.ipc.RpcExecutor$Handler.run(RpcExecutor.java:338) at org.apache.hadoop.hbase.ipc.RpcExecutor$Handler.run(RpcExecutor.java:318) org.apache.hadoop.hbase.DoNotRetryIOException: Unable to load configured region split policy 'org.apache.phoenix.schema.MetaDataSplitPolicy' for table 'SYSTEM.CATALOG' Set hbase.table.sanity.checks to false at conf or table descriptor if you want to bypass sanity checks at org.apache.hadoop.hbase.util.TableDescriptorChecker.warnOrThrowExceptionForFailure(TableDescriptorChecker.java:296) at org.apache.hadoop.hbase.util.TableDescriptorChecker.sanityCheck(TableDescriptorChecker.java:109) at org.apache.hadoop.hbase.master.HMaster.createTable(HMaster.java:2025) at org.apache.hadoop.hbase.master.MasterRpcServices.createTable(MasterRpcServices.java:657) at org.apache.hadoop.hbase.shaded.protobuf.generated.MasterProtos$MasterService$2.callBlockingMethod(MasterProtos.java) at org.apache.hadoop.hbase.ipc.RpcServer.call(RpcServer.java:413) at org.apache.hadoop.hbase.ipc.CallRunner.run(CallRunner.java:133) at org.apache.hadoop.hbase.ipc.RpcExecutor$Handler.run(RpcExecutor.java:338) at org.apache.hadoop.hbase.ipc.RpcExecutor$Handler.run(RpcExecutor.java:318)

2023-07-14 上传