将HDFS中的信息读入到Hbase

要将HDFS中的信息读入到HBase，可以使用HBase提供的工具类，如TableMapReduceUtil和HFileOutputFormat2等。下面是一个简单的示例： 1. 创建一个MapReduce程序，并在mapper中读取HDFS中的文件，将数据写入到HBase中： ```java public class HDFS2HBaseMapper extends Mapper<LongWritable, Text, ImmutableBytesWritable, Put> { private final static byte[] CF = "cf".getBytes(); private final static byte[] ATTR1 = "attr1".getBytes(); private final static byte[] ATTR2 = "attr2".getBytes(); public void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException { String[] fields = value.toString().split(","); String rowKey = fields[0]; Put put = new Put(rowKey.getBytes()); put.addColumn(CF, ATTR1, fields[1].getBytes()); put.addColumn(CF, ATTR2, fields[2].getBytes()); context.write(new ImmutableBytesWritable(rowKey.getBytes()), put); } } ``` 2. 在Driver中配置HBase表和HDFS输入路径，并设置HFileOutputFormat2的输出路径： ```java public class HDFS2HBaseDriver { public static void main(String[] args) throws Exception { Configuration conf = HBaseConfiguration.create(); conf.set("hbase.zookeeper.quorum", "localhost"); conf.set("hbase.zookeeper.property.clientPort", "2181"); conf.set(TableOutputFormat.OUTPUT_TABLE, "mytable"); Job job = Job.getInstance(conf, "HDFS2HBase"); job.setJarByClass(HDFS2HBaseDriver.class); job.setMapperClass(HDFS2HBaseMapper.class); job.setOutputFormatClass(HFileOutputFormat2.class); job.setMapOutputKeyClass(ImmutableBytesWritable.class); job.setMapOutputValueClass(Put.class); FileInputFormat.setInputPaths(job, new Path("/input")); FileOutputFormat.setOutputPath(job, new Path("/output")); HFileOutputFormat2.configureIncrementalLoad(job, new HTable(conf, "mytable")); System.exit(job.waitForCompletion(true) ? 0 : 1); } } ``` 3. 运行MapReduce程序，并将输出的HFile文件导入到HBase中： ```shell $ hbase org.apache.hadoop.hbase.mapreduce.LoadIncrementalHFiles /hbase/output mytable ``` 以上就是将HDFS中的信息读入到HBase的基本步骤，具体可根据实际需求进行调整。

阅读全文

将HDFS中的信息读入到Hbase

相关推荐

Hadoop入门：HDFS、MapReduce与HBase解析

HDFS与HBaseShell操作指南

Hadoop生态系统详解：从HDFS到HBase

如何将HDFS中的文件读入到Hbase

将HDFS中的学生信息读入到Hbase

如何将HDFS上的文件读入到Hbase，用java

如何将HDFS上的文件读入到Hbase，用java。调用insertrow方法

将HDFS的学生信息读入到hbase ，学号作为行键，姓名和学科作为列族，有语文数学英语三个学科，以及对应的分数，用java API，写一个while 循环，给我代码

java操作Hbase之从Hbase中读取数据写入hdfs中源码

HBase实践之MOB使用指南未翻译.pdf

Hadoop技术交流：深入解析HDFS设计特点

HDFS文件读入并行控制技术：提升大数据吞吐量的关键步骤

HDFS文件读入权限管理深度解析：安全与性能的平衡艺术

HBase与机器学习：在大数据分析中的应用实践

HDFS压缩技术：存储与传输成本的节约之道

【数据挖掘技巧】：高效利用HDFS列式存储进行数据分析

大家在看

暗通道去雾算法_何凯明去雾_matlab_去雾_去雾算法_暗通道算法_

基于YOLOv10+DeepSort实现视频中目标跟踪算法Python源码+详细使用说明.zip

电信设备-一种血糖数据查询方法及移动终端.zip

FAST FACTORIZED_FFBP论文_FFBP_后向投影.zip

威布尔参数估计，可靠性与寿命预测方向，机械工程,威布尔分布寿命预测,matlab源码.rar

最新推荐

Python连接HDFS实现文件上传下载及Pandas转换文本文件到CSV操作

分布式数据库HBase安装配置与实践.doc

自动删除hal库spendsv、svc以及systick中断

世界地图Shapefile文件解析与测试指南

Python环境监控高可用构建：可靠性增强的策略

需要在matlab当中批量导入表格数据的指令

Sqlcipher 3.4.0版本发布，优化SQLite兼容性

Python环境监控性能监控与调优：专家级技巧全集

simulinlk怎么插入线

Java项目中standard.jar压缩包的处理与使用