Hadoop 3.3.5与HBase 1.4.5环境搭建与配置指南

需积分: 5 6 下载量 24 浏览量 更新于2024-11-14 收藏 796.78MB RAR 举报
资源摘要信息:"Hadoop3.3.5+HBase1.4.5.rar+winutils.exe" 1. Hadoop 3.3.5安装与配置: - Hadoop是一个开源的分布式存储和计算框架,用于存储大量数据并处理大规模计算任务。版本3.3.5是Hadoop的一个稳定版本,包含了最新的功能改进和错误修复。 - 环境准备:首先在D盘创建一个名为“Environment”的目录,然后将Hadoop 3.3.5的安装包解压到该目录中。 - 环境变量配置:将Hadoop的安装路径(D:\Environment\hadoop-3.3.5)设置为环境变量HADOOP_HOME。接着,将HADOOP_HOME的路径添加到系统的PATH环境变量中,确保可以在任何命令行窗口中访问Hadoop命令。 - winutils.exe配置:Hadoop在Windows环境下运行时需要winutils.exe文件,该文件模拟Unix系统下的工具。需要将winutils.exe文件移动到Hadoop安装目录下的bin文件夹内。 - JAVA_HOME配置:由于Hadoop是用Java编写的,需要配置JAVA_HOME环境变量指向Java的安装目录,如D:\Environment\Java\jdk1.8.0_351,并确保这个路径正确指向了JDK的安装目录。 2. HBase 1.4.5安装与配置: - HBase是一个开源的非关系型分布式数据库(NoSQL),建立在Hadoop文件系统之上,用于支持大量行和列的稀疏数据表。 - 在HBase的安装和配置之前,需要先安装和配置好Hadoop环境,因为HBase依赖于Hadoop环境。 - 配置文件hbase-site.xml:在HBase的配置目录(D:\Environment\hadoop-3.3.5\etc\hbase)下找到hbase-site.xml文件,并修改配置以满足需求。通常需要添加或修改的配置项包括指定HBase的数据存储目录,比如root、zoo和tmp目录。 - 需要注意的是,安装HBase前需要确保本地文件系统已经配置好,因为HBase存储目录需要正确配置才能正常启动和工作。 3. Hadoop和HBase的综合应用: - Hadoop和HBase经常联合使用,在大数据处理场景中发挥各自的优势。Hadoop主要用于大规模数据分析,而HBase作为Hadoop生态系统的一部分,用于高效地进行随机读写访问。 - 在部署HBase之前,需要确保Hadoop环境稳定运行,因为HBase会使用Hadoop的HDFS作为底层存储系统。 - 在实际应用中,通过HBase可以快速访问Hadoop存储的海量数据,为实时查询和在线分析提供了可能。 【重要提示】: - 在配置Hadoop和HBase时,应按照文档说明逐步进行,并检查每一步是否配置正确,以确保系统的稳定性和可用性。 - 配置Hadoop和HBase的环境变量是确保系统能够正确找到相关程序和执行文件的关键步骤,不正确的设置可能会导致系统启动失败或运行错误。 - 安装和配置过程中,需要根据实际的安装目录和需求调整配置文件中的设置,以保证Hadoop和HBase能够正确地读写数据和进行计算。 - 在进行任何修改之前,建议备份原始配置文件,以便在出现配置错误时能够快速恢复到初始状态。

org.apache.hadoop.hbase.DoNotRetryIOException: Unable to load configured region split policy 'org.apache.phoenix.schema.MetaDataSplitPolicy' for table 'SYSTEM.CATALOG' Set hbase.table.sanity.checks to false at conf or table descriptor if you want to bypass sanity checks at org.apache.hadoop.hbase.util.TableDescriptorChecker.warnOrThrowExceptionForFailure(TableDescriptorChecker.java:296) at org.apache.hadoop.hbase.util.TableDescriptorChecker.sanityCheck(TableDescriptorChecker.java:109) at org.apache.hadoop.hbase.master.HMaster.createTable(HMaster.java:2025) at org.apache.hadoop.hbase.master.MasterRpcServices.createTable(MasterRpcServices.java:657) at org.apache.hadoop.hbase.shaded.protobuf.generated.MasterProtos$MasterService$2.callBlockingMethod(MasterProtos.java) at org.apache.hadoop.hbase.ipc.RpcServer.call(RpcServer.java:413) at org.apache.hadoop.hbase.ipc.CallRunner.run(CallRunner.java:133) at org.apache.hadoop.hbase.ipc.RpcExecutor$Handler.run(RpcExecutor.java:338) at org.apache.hadoop.hbase.ipc.RpcExecutor$Handler.run(RpcExecutor.java:318) org.apache.hadoop.hbase.DoNotRetryIOException: Unable to load configured region split policy 'org.apache.phoenix.schema.MetaDataSplitPolicy' for table 'SYSTEM.CATALOG' Set hbase.table.sanity.checks to false at conf or table descriptor if you want to bypass sanity checks at org.apache.hadoop.hbase.util.TableDescriptorChecker.warnOrThrowExceptionForFailure(TableDescriptorChecker.java:296) at org.apache.hadoop.hbase.util.TableDescriptorChecker.sanityCheck(TableDescriptorChecker.java:109) at org.apache.hadoop.hbase.master.HMaster.createTable(HMaster.java:2025) at org.apache.hadoop.hbase.master.MasterRpcServices.createTable(MasterRpcServices.java:657) at org.apache.hadoop.hbase.shaded.protobuf.generated.MasterProtos$MasterService$2.callBlockingMethod(MasterProtos.java) at org.apache.hadoop.hbase.ipc.RpcServer.call(RpcServer.java:413) at org.apache.hadoop.hbase.ipc.CallRunner.run(CallRunner.java:133) at org.apache.hadoop.hbase.ipc.RpcExecutor$Handler.run(RpcExecutor.java:338) at org.apache.hadoop.hbase.ipc.RpcExecutor$Handler.run(RpcExecutor.java:318)

2023-07-14 上传

23/07/23 16:19:48 ERROR AsyncProcess: Failed to get region location org.apache.hadoop.hbase.DoNotRetryIOException: java.lang.NoClassDefFoundError: Could not initialize class org.apache.hadoop.hbase.util.ByteStringer at org.apache.hadoop.hbase.client.RpcRetryingCaller.translateException(RpcRetryingCaller.java:241) at org.apache.hadoop.hbase.client.RpcRetryingCaller.callWithoutRetries(RpcRetryingCaller.java:214) at org.apache.hadoop.hbase.client.ScannerCallableWithReplicas$RetryingRPC.call(ScannerCallableWithReplicas.java:364) at org.apache.hadoop.hbase.client.ScannerCallableWithReplicas$RetryingRPC.call(ScannerCallableWithReplicas.java:338) at org.apache.hadoop.hbase.client.RpcRetryingCaller.callWithRetries(RpcRetryingCaller.java:137) at org.apache.hadoop.hbase.client.ResultBoundedCompletionService$QueueingFuture.run(ResultBoundedCompletionService.java:65) at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149) at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624) at java.lang.Thread.run(Thread.java:748) Caused by: java.lang.NoClassDefFoundError: Could not initialize class org.apache.hadoop.hbase.util.ByteStringer at org.apache.hadoop.hbase.protobuf.RequestConverter.buildRegionSpecifier(RequestConverter.java:1041) at org.apache.hadoop.hbase.protobuf.RequestConverter.buildScanRequest(RequestConverter.java:492) at org.apache.hadoop.hbase.client.ClientSmallReversedScanner$SmallReversedScannerCallable.call(ClientSmallReversedScanner.java:291) at org.apache.hadoop.hbase.client.ClientSmallReversedScanner$SmallReversedScannerCallable.call(ClientSmallReversedScanner.java:276) at org.apache.hadoop.hbase.client.RpcRetryingCaller.callWithoutRetries(RpcRetryingCaller.java:212) ... 7 more

2023-07-24 上传