生成一篇带代码的MapReduce的编程开发-求和实训报告

以下是关于MapReduce编程开发-求和的实训报告：一、实训目的本次实训的目的是学习MapReduce编程开发的基本原理和技术，掌握基本的MapReduce编程开发技能，并实现一个求和操作的MapReduce程序。二、实训环境本次实训所使用的环境为Hadoop 2.7.3和Java SE Development Kit 8。三、实训过程 1.实现Map函数在MapReduce中，Map函数将输入数据分成若干个键值对。对于本次实训，我们需要将输入文件中的数字分成一个个键值对，其中键为"sum"，值为输入文件中的数字的和。下面是我们实现的Map函数代码： ``` public class SumMapper extends Mapper<LongWritable, Text, Text, IntWritable> { private final static Text KEY = new Text("sum"); private final static IntWritable VALUE = new IntWritable(); public void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException { String line = value.toString(); int sum = 0; StringTokenizer tokenizer = new StringTokenizer(line); while (tokenizer.hasMoreTokens()) { String token = tokenizer.nextToken(); sum += Integer.parseInt(token); } VALUE.set(sum); context.write(KEY, VALUE); } } ``` 在这个代码中，我们定义了一个SumMapper类，继承了Mapper类。我们定义了一个KEY和一个VALUE，分别代表键和值。在map()函数中，我们将输入的每一行字符串转换成一个整数，并将其加入到sum变量中。最后，我们将键值对输出到context中。 2.实现Reduce函数在MapReduce中，Reduce函数对Map函数输出的键值对进行聚合操作。对于本次实训，我们需要对输入文件中的数字进行求和操作。下面是我们实现的Reduce函数代码： ``` public class SumReducer extends Reducer<Text, IntWritable, Text, IntWritable> { private IntWritable result = new IntWritable(); public void reduce(Text key, Iterable<IntWritable> values, Context context) throws IOException, InterruptedException { int sum = 0; for (IntWritable val : values) { sum += val.get(); } result.set(sum); context.write(key, result); } } ``` 在这个代码中，我们定义了一个SumReducer类，继承了Reducer类。我们定义了一个result变量，用于存储最终求和结果。在reduce()函数中，我们对输入的每一个值进行求和操作，并将结果输出到context中。 3.实现主函数在MapReduce中，我们需要定义一个Job类来管理整个MapReduce作业。我们需要设置输入文件和输出文件的路径，以及Map和Reduce函数所在的类。下面是我们实现的主函数代码： ``` public class SumJob { public static void main(String[] args) throws Exception { Configuration conf = new Configuration(); Job job = Job.getInstance(conf, "sum"); job.setJarByClass(SumJob.class); job.setMapperClass(SumMapper.class); job.setReducerClass(SumReducer.class); job.setOutputKeyClass(Text.class); job.setOutputValueClass(IntWritable.class); FileInputFormat.addInputPath(job, new Path(args[0])); FileOutputFormat.setOutputPath(job, new Path(args[1])); System.exit(job.waitForCompletion(true) ? 0 : 1); } } ``` 在这个代码中，我们定义了一个SumJob类，用于管理整个MapReduce作业。我们设置了输入文件和输出文件的路径，以及Map和Reduce函数所在的类。最后，我们调用job.waitForCompletion()方法来执行作业，并等待作业完成。四、实训总结通过本次实训，我们学习了MapReduce编程开发的基本原理和技术，并掌握了基本的MapReduce编程开发技能。我们实现了一个求和操作的MapReduce程序，对于提高我们的编程能力和实际应用能力都有很大的帮助。

阅读全文

生成一篇带代码的MapReduce的编程开发-求和实训报告

相关推荐

并行挖掘：基于MapReduce的Top-k高效用模式算法

使用MapReduce实现TF-IDF算法详细步骤

WebCollector-Hadoop: 支持分布式爬虫与MapReduce编程

08.mapreduce编程案例--流量统计求和--自定义数据类型.mp4

MapReduce编程--ppt

13.mapreduce编程案例--流量统计安归属地输出--代码实现--自定义Partitioner的实现.mp4

Hadoop 3.x（MapReduce）----【MapReduce 概述】---- 代码

01.mapreduce编程模型--及hadoop中的具体实现框架--复习.mp4

Hadoop-2.8.0-Day04-MapReduce编程案例-课件与资料.zip

大数据学习（八）：mapreduce编程案例-倒排索引创建

大数据学习（八）：mapreduce编程案例-求两人之间的共同好友

Hadoop 3.x（MapReduce）----【Hadoop 序列化】---- 代码

matlab20行代码-MapReduce-Based-Deep-Learning:2013年NerveCloud的秋季云计算项目小组：基于M

Hadoop-MapReduce-Cookbook-Example-Code:Hadoop MapReduce Cookbook 示例代码

大数据学习（八）：mapreduce编程案例-计算每个手机号访问网站请求流量、相应流量和流量总和根据手机号判断省份进行分类

MapReduce-implementation-on-AWS

MapReduce---CS6240:使用 MapReduce 进行并行数据处理

MapReduce-algorithms-for-Text-Processing-Tasks-

MapReduce-Engine-and-Distributed-File-System

MapReduce-File-Search

大家在看

MSC.MARC python后处理库py_post（数据提取）

WebBrowser脚本错误的完美解决方案

RealityCapture中文教程

二维Hilbert-Huang变换及其在图像增强中的应用 (2009年)

matlab-基于互相关的亚像素图像配准算法的matlab仿真-源码

最新推荐

MapReduce下的k-means算法实验报告广工（附源码）

Hadoop大数据实训，求最高温度最低温度实验报告

hadoop mapreduce编程实战

爬虫代码+MapReduce代码+可视化展示代码.docx

基于MapReduce的Apriori算法代码

RStudio中集成Connections包以优化数据库连接管理

管理建模和仿真的文件

Keil uVision5全面精通指南

flink提交给yarn19个全量同步MYsqlCDC的作业，flink的配置参数怎样设置

PHP博客旅游的探索之旅