mapreduce 项目实例

以下是一个简单的MapReduce项目实例，实现了对文本中单词出现次数的统计： 1. 定义自己的三个类：DcMapper，DcReducer，DcDriver ```java public class DcMapper extends Mapper<LongWritable, Text, Text, IntWritable> { private final static IntWritable one = new IntWritable(1); private Text word = new Text(); public void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException { String line = value.toString(); StringTokenizer tokenizer = new StringTokenizer(line); while (tokenizer.hasMoreTokens()) { word.set(tokenizer.nextToken()); context.write(word, one); } } } public class DcReducer extends Reducer<Text, IntWritable, Text, IntWritable> { private IntWritable result = new IntWritable(); public void reduce(Text key, Iterable<IntWritable> values, Context context) throws IOException, InterruptedException { int sum = 0; for (IntWritable val : values) { sum += val.get(); } result.set(sum); context.write(key, result); } } public class DcDriver { public static void main(String[] args) throws Exception { Configuration conf = new Configuration(); Job job = Job.getInstance(conf, "word count"); job.setJarByClass(DcDriver.class); job.setMapperClass(DcMapper.class); job.setCombinerClass(DcReducer.class); job.setReducerClass(DcReducer.class); job.setOutputKeyClass(Text.class); job.setOutputValueClass(IntWritable.class); FileInputFormat.addInputPath(job, new Path(args[0])); FileOutputFormat.setOutputPath(job, new Path(args[1])); System.exit(job.waitForCompletion(true) ? 0 : 1); } } ``` 2. 编写完代码后，将其打包成JAR文件。 3. 将JAR文件上传到Hadoop集群中，并执行以下命令： ```shell hadoop jar wordcount.jar com.xijing.mapreduce.DcDriver /input /output ``` 其中，/input是输入文件路径，/output是输出文件路径。

阅读全文

mapreduce 项目实例

相关推荐

mapreduce示例

mapreduce例子

mapreduce实例

基于MapReduce的Hadoop实例.zip

Hadoop集群MapReduce实例详解与应用

eclipse mapreduce编程实例导包

mapreduce项目文件

MapReduce数据统计简单实例

Windows下实现MapReduce的程序实例.zip

javashuffle源码-MapReduce-Demo:Hadoop，MapReduce编程学习练手实例

实验项目 MapReduce 编程

YarnExamples仓库：Hadoop 2 YARN API与MapReduce实例

部署Hadoop 3.0.0与HDFS交互及MapReduce实例操作

Hadoop MapReduce示例项目演示

Hadoop MapReduce详解：单词计数实例

Hadoop MapReduce实用指南：实例驱动的数据分析

深入探究MapReduce工作原理及HBase应用实例

MapReduce编程模型解析：从WordCount实例入门

MapReduce并行计算框架原理与实例分析

大家在看

应用手册 - SoftMove.pdf

Adobe_Flash_Player_ActiveX_v34_0_0_211

子程序参数传递学习总结.docx

VITA 62.0.docx

年终活动抽奖程序，随机动画变化

最新推荐

第二章 分布式文件系统HDFS+MapReduce（代码实现检查文件是否存在&WordCount统计）.docx

Hadoop学习文档笔记，基本原理 HDFS

毕业设计-IaaS与大数据平台方案设计与实施.docx

解读IBM InfoSphere大数据分析平台

【java】ssm+jsp+mysql+LD算法在线考试系统.zip

降低成本的oracle11g内网安装依赖-pdksh-5.2.14-1.i386.rpm下载

管理建模和仿真的文件

云计算术语全面掌握：从1+X样卷A卷中提炼精华

. 索读取⼀幅图像，让该图像拼接⾃身图像，分别⽤⽔ 平和垂直 2 种。要求运⾏结果弹窗以⾃⼰的名字全拼命名。

Java基础实验教程Lab1解析

第二章分布式文件系统HDFS+MapReduce（代码实现检查文件是否存在&WordCount统计）.docx

. 索读取⼀幅图像，让该图像拼接⾃身图像，分别⽤⽔平和垂直 2 种。要求运⾏结果弹窗以⾃⼰的名字全拼命名。