编写并运行MapReduce程序WordCount

WordCount是MapReduce中最基本的程序之一，它用于计算文本中每个单词的出现次数。下面是WordCount的Java代码： ```java import java.io.IOException; import java.util.StringTokenizer; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.Path; import org.apache.hadoop.io.IntWritable; import org.apache.hadoop.io.Text; import org.apache.hadoop.mapreduce.Job; import org.apache.hadoop.mapreduce.Mapper; import org.apache.hadoop.mapreduce.Reducer; import org.apache.hadoop.mapreduce.lib.input.FileInputFormat; import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat; public class WordCount { public static class TokenizerMapper extends Mapper<Object, Text, Text, IntWritable>{ private final static IntWritable one = new IntWritable(1); private Text word = new Text(); public void map(Object key, Text value, Context context) throws IOException, InterruptedException { StringTokenizer itr = new StringTokenizer(value.toString()); while (itr.hasMoreTokens()) { word.set(itr.nextToken()); context.write(word, one); } } } public static class IntSumReducer extends Reducer<Text,IntWritable,Text,IntWritable> { private IntWritable result = new IntWritable(); public void reduce(Text key, Iterable<IntWritable> values, Context context) throws IOException, InterruptedException { int sum = 0; for (IntWritable val : values) { sum += val.get(); } result.set(sum); context.write(key, result); } } public static void main(String[] args) throws Exception { Configuration conf = new Configuration(); Job job = Job.getInstance(conf, "word count"); job.setJarByClass(WordCount.class); job.setMapperClass(TokenizerMapper.class); job.setCombinerClass(IntSumReducer.class); job.setReducerClass(IntSumReducer.class); job.setOutputKeyClass(Text.class); job.setOutputValueClass(IntWritable.class); FileInputFormat.addInputPath(job, new Path(args[0])); FileOutputFormat.setOutputPath(job, new Path(args[1])); System.exit(job.waitForCompletion(true) ? 0 : 1); } } ``` 这个程序的输入是一个文本文件，输出是每个单词出现的次数。在运行之前，你需要安装Hadoop并将输入文件放入HDFS。运行MapReduce程序的命令如下： ``` hadoop jar WordCount.jar WordCount /input /output ``` 其中，WordCount.jar是你打包好的Java程序，input是输入文件的路径，output是输出目录的路径。执行这个命令后，MapReduce作业就会在Hadoop集群上运行。

阅读全文

编写并运行MapReduce程序WordCount

相关推荐

Eclipse中运行MapReduce：WordCount实战指南

Ubuntu下VMwareTools与Hadoop MapReduce（WordCount）安装教程

MapReduce入门：探索WordCount程序的奥秘

编写一个mapreduce的wordcount程序

Hadoop mapreduce实现wordcount

python MapReduce的wordcount

MapReduce之wordcount范例代码

wordcount-mapreduce:Hadoop MapReduce WordCount 示例应用程序

使用python实现mapreduce（wordcount）.doc

WordCount_MapReduce:在 Hadoop 上运行的 MapReduce 程序

MapReduce WordCount

使用Java编写MapReduce WordCount示例程序

MapReduce WordCount程序简介与基础概念解析

运行mapreduce wordcount

SecureCRT运行mapreduce wordcount程序,统计单词词频,将结果输出到/tmp/result目

mapreduce 的wordcount本地运行出现了Process finished with exit code 1问题

用文字阐述用Eclipse-Hadoop插件，进行MapReduce编程WordCount的代码运行过程

mapreduce实现wordcount案例，用visual studio写c语言

c++版本的mapreduce里wordcount测试中的build.xml

在Hadoop环境下，编写并运行WordCount程序的详细步骤和Java代码实现过程是什么？

大家在看

西安石油大学2019-2023 计算机考研808数据结构真题卷

海思芯片规格对比.pdf

PCIe 6.0官方协议英文版

微机原理与嵌入式实验讲义1

Audio Sink Application Configuration User Guide

最新推荐

使用Eclipse编译运行MapReduce程序.doc

使用python实现mapreduce（wordcount）.doc

Hadoop的单机伪分布式搭建和运行第一个WordCount程序

hadoop mapreduce编程实战

基于java+springboot+mysql+微信小程序的流浪动物救助小程序 源码+数据库+论文(高分毕业设计).zip

WildFly 8.x中Apache Camel结合REST和Swagger的演示

管理建模和仿真的文件

【声子晶体模拟全能指南】：20年经验技术大佬带你从入门到精通

2024-07-27怎么用python转换成农历日期

FDFS客户端Python库1.2.6版本发布

基于java+springboot+mysql+微信小程序的流浪动物救助小程序源码+数据库+论文(高分毕业设计).zip