Hadoop的wordcout代码

Hadoop的WordCount程序是一个经典的MapReduce程序，它的作用是统计文本中单词的出现次数。下面是一个简单的WordCount代码示例： ``` import java.io.IOException; import java.util.StringTokenizer; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.Path; import org.apache.hadoop.io.IntWritable; import org.apache.hadoop.io.Text; import org.apache.hadoop.mapreduce.Job; import org.apache.hadoop.mapreduce.Mapper; import org.apache.hadoop.mapreduce.Reducer; import org.apache.hadoop.mapreduce.lib.input.FileInputFormat; import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat; public class WordCount { public static class TokenizerMapper extends Mapper<Object, Text, Text, IntWritable>{ private final static IntWritable one = new IntWritable(1); private Text word = new Text(); public void map(Object key, Text value, Context context ) throws IOException, InterruptedException { StringTokenizer itr = new StringTokenizer(value.toString()); while (itr.hasMoreTokens()) { word.set(itr.nextToken()); context.write(word, one); } } } public static class IntSumReducer extends Reducer<Text,IntWritable,Text,IntWritable> { private IntWritable result = new IntWritable(); public void reduce(Text key, Iterable<IntWritable> values, Context context ) throws IOException, InterruptedException { int sum = 0; for (IntWritable val : values) { sum += val.get(); } result.set(sum); context.write(key, result); } } public static void main(String[] args) throws Exception { Configuration conf = new Configuration(); Job job = Job.getInstance(conf, "word count"); job.setJarByClass(WordCount.class); job.setMapperClass(TokenizerMapper.class); job.setCombinerClass(IntSumReducer.class); job.setReducerClass(IntSumReducer.class); job.setOutputKeyClass(Text.class); job.setOutputValueClass(IntWritable.class); FileInputFormat.addInputPath(job, new Path(args[0])); FileOutputFormat.setOutputPath(job, new Path(args[1])); System.exit(job.waitForCompletion(true) ? 0 : 1); } } ``` 这段代码实现了一个简

阅读全文

Hadoop的wordcout代码

相关推荐

深入解析Hadoop源代码

Hadoop源代码深度解析

深入探索Hadoop源代码分析

Hadoop代码-Hadoop代码

hadoop 操作代码

hadoop测试代码

hadoop源代码

Hadoop 源代码

hadoop资料,hadoop基础,Hadoop源代码eclipse编译教程

hadoop源代码部分

Hadoop源代码分析

hadoop源代码归档

hadoop源代码存档

实战hadoop源代码

hadoop源代码分析

hadoop文档代码栗子

hadoop 源代码归档

hadoop 资源代码归档

深入解析Hadoop源代码：分布式计算基石

PHP语言基础知识详解及常见功能应用.docx

最新推荐

Hadoop源代码分析（一九）

Hadoop源代码分析（一三）

Hadoop源代码分析（一 一）

Hadoop源代码分析（一二）

Hadoop源代码分析（包org.apache.hadoop.mapreduce）

火炬连体网络在MNIST的2D嵌入实现示例

管理建模和仿真的文件

L2正则化的终极指南：从入门到精通，揭秘机器学习中的性能优化技巧

如何构建一个符合GB/T19716和ISO/IEC13335标准的信息安全事件管理框架，并确保业务连续性规划的有效性？

Angular插件增强Application Insights JavaScript SDK功能

Hadoop源代码分析（一一）