编写一个最基本的wordcount单词统计的mapreduce,要求写出自定义的maper类和reducer类.

好的，下面是一个基本的Word Count MapReduce程序，包括自定义的Mapper和Reducer类。 Mapper类： ```java import java.io.IOException; import org.apache.hadoop.io.LongWritable; import org.apache.hadoop.io.Text; import org.apache.hadoop.mapreduce.Mapper; public class WordCountMapper extends Mapper<LongWritable, Text, Text, LongWritable> { private final static LongWritable ONE = new LongWritable(1); private Text word = new Text(); @Override protected void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException { String[] words = value.toString().split("\\s+"); for (String s : words) { word.set(s); context.write(word, ONE); } } } ``` Reducer类： ```java import java.io.IOException; import org.apache.hadoop.io.LongWritable; import org.apache.hadoop.io.Text; import org.apache.hadoop.mapreduce.Reducer; public class WordCountReducer extends Reducer<Text, LongWritable, Text, LongWritable> { @Override protected void reduce(Text key, Iterable<LongWritable> values, Context context) throws IOException, InterruptedException { long sum = 0; for (LongWritable value : values) { sum += value.get(); } context.write(key, new LongWritable(sum)); } } ``` 主程序： ```java import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.Path; import org.apache.hadoop.io.LongWritable; import org.apache.hadoop.io.Text; import org.apache.hadoop.mapreduce.Job; import org.apache.hadoop.mapreduce.lib.input.FileInputFormat; import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat; public class WordCount { public static void main(String[] args) throws Exception { Configuration conf = new Configuration(); Job job = Job.getInstance(conf, "Word Count"); job.setJarByClass(WordCount.class); job.setMapperClass(WordCountMapper.class); job.setReducerClass(WordCountReducer.class); job.setOutputKeyClass(Text.class); job.setOutputValueClass(LongWritable.class); FileInputFormat.addInputPath(job, new Path(args[0])); FileOutputFormat.setOutputPath(job, new Path(args[1])); System.exit(job.waitForCompletion(true) ? 0 : 1); } } ``` 在运行时，需要将输入文件和输出文件的路径作为参数传递给程序。例如： ```sh hadoop jar WordCount.jar WordCount input output ``` 其中，WordCount.jar是打包好的程序文件，input是输入文件路径，output是输出文件路径。

阅读全文

编写一个最基本的wordcount单词统计的mapreduce,要求写出自定义的maper类和reducer类.

相关推荐

Hadoop- 单词计数(Word Count)的MapReduce实现.doc

python MapReduce的wordcount

mapreduce wc单词计数 自定义分区 自定义排序实现

Hadoop集群（WordCount）词频统计 MapReduce 词频统计 MapReduce案例 Linux

08.mapreduce编程案例--流量统计求和--自定义数据类型.mp4

大数据实验报告Hadoop编程实现wordcount单词统计程序附源码.doc

03.mapreduce实现wordcount的逻辑代码.mp4

MapReduce模型--自定义数据类型

Packtpub.Hadoop.MapReduce.Cookbook.Jan.2013

MapReduce之自定义OutPutFormat.md

云计算与大数据 MapReduce实验 WordCount.jar

Hadoop.MapReduce.分析

wordcount-mapreduce:Hadoop MapReduce WordCount 示例应用程序

Hadoop.MapReduce.v2.Cookbook pdf

MapReduce WordCount

最新推荐

第二章 分布式文件系统HDFS+MapReduce（代码实现检查文件是否存在&WordCount统计）.docx

使用python实现mapreduce（wordcount）.doc

《大数据导论》MapReduce的应用.docx

使用Eclipse编译运行MapReduce程序.doc

Hadoop源代码分析（包org.apache.hadoop.mapreduce）

WordPress作为新闻管理面板的实现指南

管理建模和仿真的文件

函数与模块化编程宝典：J750编程高效之路

用C语言求有4个圆塔，圆心分别为（2，2)，(2，-2)，(-2，2)，(-2，-2)圆半径为1， 这4个塔的高度为10m 塔以外无建筑物接输入任意点的坐标 求该点的建筑高度（塔外的高度为零)的程序

NPC_Generator：使用Ruby打造的游戏角色生成器

mapreduce wc单词计数自定义分区自定义排序实现

第二章分布式文件系统HDFS+MapReduce（代码实现检查文件是否存在&WordCount统计）.docx

用C语言求有4个圆塔，圆心分别为（2，2)，(2，-2)，(-2，2)，(-2，-2)圆半径为1，这4个塔的高度为10m 塔以外无建筑物接输入任意点的坐标求该点的建筑高度（塔外的高度为零)的程序