liunx Hadoop 集群运行Hadoo.jar代码中主类名为WordCountMain的代码格式

WordCountMain的代码格式与Java编程规范无异，以下是一个示例： ```java import java.io.IOException; import java.util.StringTokenizer; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.Path; import org.apache.hadoop.io.IntWritable; import org.apache.hadoop.io.Text; import org.apache.hadoop.mapreduce.Job; import org.apache.hadoop.mapreduce.Mapper; import org.apache.hadoop.mapreduce.Reducer; import org.apache.hadoop.mapreduce.lib.input.FileInputFormat; import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat; public class WordCountMain { public static class TokenizerMapper extends Mapper<Object, Text, Text, IntWritable>{ private final static IntWritable one = new IntWritable(1); private Text word = new Text(); public void map(Object key, Text value, Context context ) throws IOException, InterruptedException { StringTokenizer itr = new StringTokenizer(value.toString()); while (itr.hasMoreTokens()) { word.set(itr.nextToken()); context.write(word, one); } } } public static class IntSumReducer extends Reducer<Text,IntWritable,Text,IntWritable> { private IntWritable result = new IntWritable(); public void reduce(Text key, Iterable<IntWritable> values, Context context ) throws IOException, InterruptedException { int sum = 0; for (IntWritable val : values) { sum += val.get(); } result.set(sum); context.write(key, result); } } public static void main(String[] args) throws Exception { Configuration conf = new Configuration(); Job job = Job.getInstance(conf, "word count"); job.setJarByClass(WordCountMain.class); job.setMapperClass(TokenizerMapper.class); job.setCombinerClass(IntSumReducer.class); job.setReducerClass(IntSumReducer.class); job.setOutputKeyClass(Text.class); job.setOutputValueClass(IntWritable.class); FileInputFormat.addInputPath(job, new Path(args[0])); FileOutputFormat.setOutputPath(job, new Path(args[1])); System.exit(job.waitForCompletion(true) ? 0 : 1); } } ``` 在这个示例代码中，我们定义了两个类：TokenizerMapper和IntSumReducer。TokenizerMapper是一个Mapper类，用于将输入文件中的数据拆分成单词，并将单词作为key，将数字1作为value输出。IntSumReducer是一个Reducer类，用于将相同的单词合并，并将它们的数量相加，输出最终结果。在main函数中，我们设置了MapReduce作业的各种参数，包括输入路径、输出路径、Mapper和Reducer类等。最后，我们使用System.exit来退出程序，并将MapReduce作业的状态作为参数传递给它。如果作业成功完成，返回0；否则，返回1。

阅读全文

liunx Hadoop 集群运行Hadoo.jar代码中主类名为WordCountMain的代码格式

相关推荐

Hadoop的配置及运行WordCount.docx

hadoop中Wordcount代码

Hadoop集群中WordCount示例

liunx Hadoop 集群运行jar代码格式

hadoop-2.7.1.tar.gz.zip

Hadoop2.7.2LIUNX集群(1)所需hadoop.gz.rar

liunx下的jdk和zookeeper.zip

liunx常用命令[参考].pdf

LIUNX环境合规修复shell脚本.zip

liunx编写脚本（循环）.pdf

liunx下部署hadoop.txt

中国移动liunx操作系统安全配置规.doc

Hadoop2.7.2LIUNX集群(2)所需JDK1.8.gz

liunx内核.part2.rar源代码

Hadoop2.7.2LIUNX集群(3)集群搭建详解及配置文件一键成功

毕设&课设&项目&实训-基于liunx0.11内核理解操作系统.zip

Hadoop2.7.2LIUNX集群(4)集群JAVA上传和下载实例及需要的包

Hadoop2.7.2LIUNX集群(5)集群hdfs-over-ftp重构2.7.2，直接使用

excel转换成pdf的spire.xls包，包含spire.xls.free-2.2.0.jar版本的jar，和Spire.Xls.jar 3.9.1

JDK8 local_policy.jar和US_export_policy.jar

最新推荐

win10环境下vscode Linux C++开发代码自动提示配置(基于WSL)

red head liunx安装 Oracle SOA集群中文文档

mobaxterm无法连接到liunx的解决办法.doc

liunx 安装oracle SOA集群 配置中文手册

PHP语言基础知识详解及常见功能应用.docx

火炬连体网络在MNIST的2D嵌入实现示例

管理建模和仿真的文件

L2正则化的终极指南：从入门到精通，揭秘机器学习中的性能优化技巧

如何构建一个符合GB/T19716和ISO/IEC13335标准的信息安全事件管理框架，并确保业务连续性规划的有效性？

Angular插件增强Application Insights JavaScript SDK功能

liunx 安装oracle SOA集群配置中文手册