用Java代码在WordCount基础上进行修改，能够完成以下的任务。根据给定的输入文件，统计每个人的薪资总额。能够在伪分布式集群和IDE环境下，实现功能。

好的，以下是Java代码实现： ```java import java.io.IOException; import java.util.StringTokenizer; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.Path; import org.apache.hadoop.io.*; import org.apache.hadoop.mapreduce.*; import org.apache.hadoop.mapreduce.lib.input.FileInputFormat; import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat; public class SalaryCount { public static class SalaryMapper extends Mapper<LongWritable, Text, Text, IntWritable>{ private Text name = new Text(); private IntWritable salary = new IntWritable(); public void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException { String line = value.toString(); StringTokenizer tokenizer = new StringTokenizer(line); name.set(tokenizer.nextToken()); // 人名作为键 salary.set(Integer.parseInt(tokenizer.nextToken())); // 薪资作为值 context.write(name, salary); } } public static class SalaryReducer extends Reducer<Text,IntWritable,Text,IntWritable> { private IntWritable result = new IntWritable(); public void reduce(Text key, Iterable<IntWritable> values, Context context) throws IOException, InterruptedException { int sum = 0; for (IntWritable val : values) { sum += val.get(); } result.set(sum); context.write(key, result); // 输出每个人的薪资总额 } } public static void main(String[] args) throws Exception { Configuration conf = new Configuration(); Job job = Job.getInstance(conf, "salary count"); job.setJarByClass(SalaryCount.class); job.setMapperClass(SalaryMapper.class); job.setCombinerClass(SalaryReducer.class); job.setReducerClass(SalaryReducer.class); job.setOutputKeyClass(Text.class); job.setOutputValueClass(IntWritable.class); FileInputFormat.addInputPath(job, new Path(args[0])); FileOutputFormat.setOutputPath(job, new Path(args[1])); System.exit(job.waitForCompletion(true) ? 0 : 1); } } ``` 在这个程序中，我们定义了一个SalaryMapper类和一个SalaryReducer类，分别实现了Map和Reduce函数。在Map函数中，我们将每一行数据中的人名和薪资提取出来，并将其作为键值对进行输出；在Reduce函数中，我们统计每个人的薪资总额，并将结果输出。我们通过在main函数中设置job的相关参数来启动MapReduce作业并执行任务。在伪分布式集群和IDE环境下，我们可以通过运行该程序来实现对每个人薪资总额的统计。

用Java代码在WordCount基础上进行修改，能够完成以下的任务。 根据给定的输入文件，统计每个人的薪资总额。 能够在伪分布式集群和IDE环境下，实现功能。

相关推荐

WordCount:此代码使用Java在文本文件中查找重复的单词

第二章 分布式文件系统HDFS+MapReduce（代码实现检查文件是否存在&WordCount统计）.docx

Spark：用Scala和Java实现WordCount

在以上代码的基础上使其从文件outer.txt文件中统计英文单词个数，并显示结果。

使用PyCharm编程实现SparkCore的WordCount单词统计基础，并保存在HDFS或本地文件中

Java版统计文件中的每个单词出现次数

写一段java代码，用hash函数统计一句话中每个单词的个数

在java中，对于给定的文件sample.txt，统计其中单词的个数，以及给定单词出现的次数。

用Java写代码：输入一串英文句子，统计句子里面出现的相同单词个数并对这些单词相应出现的次数进行排序

用java实现 wordcount代码

任务：words是一个含有10个字符串以上的列表（内容自选）,使用字典wordcount统计每个单词出现的次数

java代码，从文件outer.txt文件中统计英文单词个数，并显示结果。

写一个python 代码，每隔一秒自动向文件夹里写入一个包含随机单词的文件，写一个spark streaming的代码，监控这个文件，统计wordcount

用java编程序对于给定的文件sample.txt，统计其中单词的个数，以及给定单词出现的次数。

对于给定的文件sample.txt，统计其中单词的个数，以及给定单词出现的次数。用java实现

统计一个文本文件中每个单词出现的次数，输出结果按照单词的字典序排序。scala代码

请创建一个scala代码读入该文件并统计每个单词的数量，按照数量的降序排序输出。

运用字节流对于给定的文件sample.txt，统计其中单词的个数，以及给定单词出现的次数。用java实现

输入一串字符串统计共有几个单词，单词以空格分开，Java代码

最新推荐

第二章 分布式文件系统HDFS+MapReduce（代码实现检查文件是否存在&WordCount统计）.docx

基于springboot+vue开发社区医疗服务系统--附毕业论文+源代码+sql（毕业设计）.rar

基于 Java 实现的仿windows扫雷小游戏课程设计

利用迪杰斯特拉算法的全国交通咨询系统设计与实现

管理建模和仿真的文件

【实战演练】基于TensorFlow的卷积神经网络图像识别项目

CD40110工作原理

全国交通咨询系统C++实现源码解析

"互动学习：行动中的多样性与论文攻读经历"

【实战演练】使用Seaborn和Plotly进行数据可视化项目

用Java代码在WordCount基础上进行修改，能够完成以下的任务。根据给定的输入文件，统计每个人的薪资总额。能够在伪分布式集群和IDE环境下，实现功能。

第二章分布式文件系统HDFS+MapReduce（代码实现检查文件是否存在&WordCount统计）.docx

第二章分布式文件系统HDFS+MapReduce（代码实现检查文件是否存在&WordCount统计）.docx