使用java程序语言实现：利用编程从HBASE中读取学生成绩，并实现计算每个学生成绩平均分和每门课程成绩平均分的功能，要求使用Mapper和Reducer，将计算的结果输出到hadoop文件系统下的result表中，然后在HDFS中查询程序运行结果。学生的成绩表如下示例图如下： student_id student_Name subject score 0001 Tom C 82 0001 Tom Cplus 90 0001 Tom Java 91 0001 Tom Linux 85 0002 Alice C 86 0002 Alice Cplus 75 0002 Alice Java 80 0002 Alice Linux 88 0003 Bob C 72 0003 Bob Cplus 85 0003 Bob Java 71 0003 Bob Linux 65 0004 David C 81 0004 David Cplus 83 0004 David Java 75 0004 David Linux 80 0005 Steven C 66 0005 Steven Cplus 80 0005 Steven Java 63 0005 Steven Linux 70 0006 Jone C 63 0006 Jone Cplus 71 0006 Jone Java 67 0006 Jone Linux 73 0007 Jack C 69 0007 Jack Cplus 62 0007 Jack Java 74 0007 Jack Linux 62 0008 Jesse C 59 0008 Jesse Cplus 67 0008 Jesse Java 61 0008 Jesse Linux 65 0009 Lucy C 82 0009 Lucy Cplus 84 0009 Lucy Java 89 0009 Lucy Linux 79 0010 Frank C 63 0010 Frank Cplus 66 0010 Frank Java 62 0010 Frank Linux 61

时间: 2024-02-27 13:58:49 浏览: 117

好的，这里提供一个简单的Java程序实现，使用HBase作为数据源，实现计算每个学生成绩平均分和每门课程成绩平均分的功能，并将计算结果输出到HDFS中的result表中。首先，需要安装Hadoop和HBase，并创建一个HBase表，表名为“scores”，列族为“info”，列名为“score”。接下来是Java程序的实现： ```java import java.io.IOException; import java.util.*; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.Path; import org.apache.hadoop.hbase.*; import org.apache.hadoop.hbase.client.*; import org.apache.hadoop.hbase.mapreduce.TableInputFormat; import org.apache.hadoop.hbase.mapreduce.TableMapReduceUtil; import org.apache.hadoop.hbase.mapreduce.TableOutputFormat; import org.apache.hadoop.hbase.util.Bytes; import org.apache.hadoop.io.*; import org.apache.hadoop.mapreduce.*; import org.apache.hadoop.util.*; public class ScoreAverage { public static class Map extends TableMapper<Text, DoubleWritable> { public void map(ImmutableBytesWritable rowkey, Result result, Context context) throws IOException, InterruptedException { String student_id = Bytes.toString(rowkey.get()); String subject = Bytes.toString(result.getValue(Bytes.toBytes("info"), Bytes.toBytes("subject"))); double score = Double.parseDouble(Bytes.toString(result.getValue(Bytes.toBytes("info"), Bytes.toBytes("score")))); context.write(new Text(student_id), new DoubleWritable(score)); context.write(new Text(subject), new DoubleWritable(score)); } } public static class Reduce extends Reducer<Text, DoubleWritable, ImmutableBytesWritable, Put> { public void reduce(Text key, Iterable<DoubleWritable> values, Context context) throws IOException, InterruptedException { double sum = 0.0; int count = 0; for (DoubleWritable value : values) { sum += value.get(); count++; } double average = sum / count; Put put = new Put(Bytes.toBytes(key.toString())); put.addColumn(Bytes.toBytes("info"), Bytes.toBytes("average"), Bytes.toBytes(Double.toString(average))); context.write(null, put); } } public static void main(String[] args) throws Exception { Configuration conf = HBaseConfiguration.create(); conf.set(TableInputFormat.INPUT_TABLE, "scores"); conf.set(TableOutputFormat.OUTPUT_TABLE, "result"); Job job = Job.getInstance(conf, "ScoreAverage"); job.setJarByClass(ScoreAverage.class); job.setMapperClass(Map.class); job.setReducerClass(Reduce.class); job.setOutputFormatClass(TableOutputFormat.class); job.setOutputKeyClass(ImmutableBytesWritable.class); job.setOutputValueClass(Put.class); TableMapReduceUtil.initTableMapperJob("scores", new Scan(), Map.class, Text.class, DoubleWritable.class, job); TableMapReduceUtil.initTableReducerJob("result", Reduce.class, job); System.exit(job.waitForCompletion(true) ? 0 : 1); } } ``` 在上面的程序中，首先定义了一个Mapper类和一个Reducer类，Mapper类用于从HBase表中读取学生成绩数据，Reducer类用于计算平均分并将结果写入HBase表中。在Mapper类中，先从HBase中读取学生ID、科目和成绩信息，然后将学生ID和科目作为key，成绩作为value，写入到context中。在Reducer类中，对每个key对应的value进行求和，计算平均分，并将结果写入HBase表中。最后，在main方法中，配置输入和输出表，设置Mapper和Reducer类，调用initTableMapperJob和initTableReducerJob方法，将计算结果输出到result表中。希望这个程序对你有所帮助！

阅读全文

相关推荐

"hadoop上课笔记：java编程和HBase的API和类介绍

Havrobase实现：利用Avro在HBase中存储自定义值

HBase编程指南：Java与多语言访问

利用编程从HBASE中读取学生成绩，并实现计算每个学生成绩平均分和每门课程成绩平均分，用MapReduce方法，使用Java API编程

利用编程从HBASE中读取学生成绩,并实现计算每门课程成绩平均分,用MapReduce方法,使用Java API编程。调用getData方法获得数据

利用编程从Hbase读取学生成绩，并实现每个学生成绩平均分和每门课程成绩平均分。要求用MapReduce Java API编程

HBase编程实践：从安装到Shell与Java API操作

Java实现：海量图片存储HBase与SequenceFile处理

毕设和企业适用springboot企业数据管理平台类及跨境电商管理平台源码+论文+视频.zip

基于net的超市管理系统源代码（完整前后端+sqlserver+说明文档+LW）.zip

LABVIEW程序实例-公式节点.zip

毕设和企业适用springboot社交应用平台类及用户数据分析平台源码+论文+视频.zip

大米商城开源版damishop(适合外贸)

LABVIEW程序实例-通过全局变量接收数据.zip

毕设和企业适用springboot生鲜鲜花类及生物识别平台源码+论文+视频.zip

毕设和企业适用springboot企业健康管理平台类及视觉识别平台源码+论文+视频.zip

最新推荐

hadoop中实现java网络爬虫(示例讲解)

大数据实验Hbase安装部署和使用javaapi调用.pdf

毕设和企业适用springboot企业数据管理平台类及跨境电商管理平台源码+论文+视频.zip

基于net的超市管理系统源代码（完整前后端+sqlserver+说明文档+LW）.zip

LABVIEW程序实例-公式节点.zip

Windows平台下的Fastboot工具使用指南

管理建模和仿真的文件

DLMS规约深度剖析：从基础到电力通信标准的全面掌握

修改代码，使其正确运行

Python机器学习基础入门与项目实践