使用idea编写hadoop 2020年研究生招生考试分数线统计 2020年高校考研平均分数线充计2020年考研各专业平均分数线统计2020年考研各高校开放专业数量统计搜索某所大学的所有专业以及分数线，进行排名

以下是使用IDEA编写Hadoop实现对2020年研究生招生考试分数线统计、2020年高校考研平均分数线统计、2020年考研各专业平均分数线统计、2020年考研各高校开放专业数量统计以及搜索某所大学的所有专业以及分数线，进行排名的步骤： 1. 准备数据需要准备包含研究生招生考试分数线、高校考研平均分数线、考研各专业平均分数线、考研各高校开放专业数量以及各高校各专业的分数线信息的数据文件。文件格式根据需要进行设计。 2. 创建Hadoop项目在IDEA中创建一个新的Maven项目，并添加hadoop的依赖。 3. 编写Mapper类根据需要进行设计，Mapper类负责将数据按照一定的规则进行切分和处理，以便后续的Reducer类进行统计。具体代码如下： ```java public class ScoreMapper extends Mapper<LongWritable, Text, Text, IntWritable> { private Text outKey = new Text(); private IntWritable outValue = new IntWritable(); @Override protected void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException { String[] tokens = value.toString().split(" "); outKey.set(tokens[0]); outValue.set(Integer.parseInt(tokens[1])); context.write(outKey, outValue); } } ``` 4. 编写Reducer类根据需要进行设计，Reducer类负责接收Mapper类输出的数据，并进行相应的统计。具体代码如下： ```java public class ScoreReducer extends Reducer<Text, IntWritable, Text, DoubleWritable> { private DoubleWritable outValue = new DoubleWritable(); @Override protected void reduce(Text key, Iterable<IntWritable> values, Context context) throws IOException, InterruptedException { int sum = 0; int count = 0; for (IntWritable value : values) { sum += value.get(); count++; } double average = (double) sum / count; outValue.set(average); context.write(key, outValue); } } ``` 5. 配置Job并运行在主函数中配置Job的相关参数，并将Mapper和Reducer类设置到Job中。具体代码如下： ```java public class ScoreJob { public static void main(String[] args) throws Exception { Configuration conf = new Configuration(); Job job = Job.getInstance(conf, "ScoreJob"); job.setJarByClass(ScoreJob.class); job.setMapperClass(ScoreMapper.class); job.setReducerClass(ScoreReducer.class); job.setOutputKeyClass(Text.class); job.setOutputValueClass(DoubleWritable.class); FileInputFormat.addInputPath(job, new Path(args[0])); FileOutputFormat.setOutputPath(job, new Path(args[1])); System.exit(job.waitForCompletion(true) ? 0 : 1); } } ``` 其中，args[0]代表输入文件路径，args[1]代表输出文件路径。最后，运行该程序即可得到相应的统计结果。对于搜索某所大学的所有专业以及分数线，进行排名，可以编写一个独立的程序，读取包含所有数据的文件，根据需要进行处理并输出结果。具体代码如下： ```java public class ScoreRank { public static void main(String[] args) throws IOException { String file = args[0]; String university = args[1]; BufferedReader br = new BufferedReader(new FileReader(file)); String line; Map<String, Integer> scores = new HashMap<>(); Map<String, List<String>> universities = new HashMap<>(); while ((line = br.readLine()) != null) { String[] tokens = line.split(" "); String name = tokens[0]; String universityName = name.split("-")[0]; int score = Integer.parseInt(tokens[1]); if (!universities.containsKey(universityName)) { List<String> majors = new ArrayList<>(); majors.add(name); universities.put(universityName, majors); } else { List<String> majors = universities.get(universityName); majors.add(name); universities.put(universityName, majors); } scores.put(name, score); } List<String> majors = universities.get(university); majors.sort((o1, o2) -> scores.get(o2) - scores.get(o1)); for (int i = 0; i < majors.size(); i++) { String major = majors.get(i); int score = scores.get(major); System.out.println(String.format("%d. %s: %d", i + 1, major, score)); } } } ``` 其中，args[0]代表包含所有数据的文件路径，args[1]代表需要搜索的大学名称。运行该程序即可得到该大学所有专业以及分数线的排名结果。

阅读全文

使用idea编写hadoop 2020年研究生招生考试分数线统计 2020年高校考研平均分数线充计2020年考研各专业平均分数线统计2020年考研各高校开放专业数量统计 搜索某所大学的所有专业以及分数线，进行排名

相关推荐

用于计算学生的平均成绩，采用的平台是hadoop分布式平台

flink 网站访问量pv 独立访客数uv 计算

基于Hadoop MapReduce的高校考研分数线统计分析项目代码+数据集.rar

用idea编写hadoop实现对2020高校考研平均分数线的统计

hadoop编写2020年高校考研平均分数线统计

使用java语言实现hadoop编写2020年考研各高校开放专业数量统计

Hadoop 分析统计学生考试成绩1

在Windows上使用eclipse编写Hadoop应用程序

在Windows上使用eclipse编写Hadoop应用程序.docx

idea的hadoop插件.rar

hadoop idea插件

2020年hadoop简历模板.doc

idea-hadoop-plugin.zip

idea-hadoop-plugins.zip

大数据背景下基于Hadoop的高校大学生行为研究.pdf

大数据背景下基于Hadoop的高校大学生行为研究.docx

idea hadoop-hdfs插件

基于Hadoop的高校学生行为预警决策系统研究.docx

statreduce:一个库，用于在 Java 中使用 map step 编写 Hadoop MapReduce 作业并在 R 中减少 step 以进行统计计算

hadoop使用

大家在看

煤矿井下图像型早期火灾探测

PDK安装及cdl文件和gds文件的导入

SAP各模块字段与表的对应关系

蓝牙室内定位服务源码！

Cadence Allegro16.6高级进阶教程

最新推荐

IDEA最新版2020.1的maven工程本地依赖仓库无法使用问题(已解决)

基于hadoop的词频统计.docx

使用hadoop实现WordCount实验报告.docx

Hadoop大数据实训，求最高温度最低温度实验报告

手把手教你Hadoop环境搭建、词频统计demo及原理

虚拟串口软件：实现IP信号到虚拟串口的转换

【Python进阶篇】：掌握这些高级特性，让你的编程能力飞跃提升

后端调用ragflow api

IE6下实现PNG图片背景透明的技术解决方案

【欧姆龙触摸屏故障诊断全攻略】

使用idea编写hadoop 2020年研究生招生考试分数线统计 2020年高校考研平均分数线充计2020年考研各专业平均分数线统计2020年考研各高校开放专业数量统计搜索某所大学的所有专业以及分数线，进行排名