用Java编写MapReduce对2月商品A 325 1月商品A 235 1月商品B 234 2月商品C 572 3月商品A 123 1月商品C 321 2月商品B 573 3月商品C 876进行排序，要求先按月份升序排序，再按销售量降序排序，结果输出的是：1月商品C 321 1月商品A 235 1月商品B 234 2月商品B 573 2月商品C 572 2月商品A 325 3月商品C 876 3月商品B 648 3月商品A 123在Hadoop上运行

首先，需要在Hadoop上搭建好MapReduce的开发环境，然后按照以下步骤进行编写： 1. 编写Mapper类，将每一行数据拆分成key-value对，key为月份，value为商品和销售量。 ```java public class SortMapper extends Mapper<LongWritable, Text, Text, Text> { private Text outKey = new Text(); private Text outValue = new Text(); @Override protected void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException { String[] fields = value.toString().split(" "); String month = fields[1]; String product = fields[2]; String sales = fields[3]; outKey.set(month); outValue.set(product + " " + sales); context.write(outKey, outValue); } } ``` 2. 编写Reducer类，对每个月份的商品销售量进行降序排序。 ```java public class SortReducer extends Reducer<Text, Text, Text, Text> { private Text outValue = new Text(); @Override protected void reduce(Text key, Iterable<Text> values, Context context) throws IOException, InterruptedException { List<String> list = new ArrayList<String>(); for (Text value : values) { list.add(value.toString()); } Collections.sort(list, new Comparator<String>() { public int compare(String o1, String o2) { int s1 = Integer.parseInt(o1.split(" ")[1]); int s2 = Integer.parseInt(o2.split(" ")[1]); return s2 - s1; } }); for (String str : list) { outValue.set(str); context.write(key, outValue); } } } ``` 3. 编写Driver类，设置Mapper类、Reducer类、输入输出路径和运行参数等。 ```java public class SortDriver { public static void main(String[] args) throws Exception { Configuration conf = new Configuration(); Job job = Job.getInstance(conf, "sort"); job.setJarByClass(SortDriver.class); job.setMapperClass(SortMapper.class); job.setReducerClass(SortReducer.class); job.setOutputKeyClass(Text.class); job.setOutputValueClass(Text.class); FileInputFormat.addInputPath(job, new Path(args[0])); FileOutputFormat.setOutputPath(job, new Path(args[1])); System.exit(job.waitForCompletion(true) ? 0 : 1); } } ``` 4. 在Hadoop上运行MapReduce任务，命令为： ``` hadoop jar your_jar_path your_main_class_path input_path output_path ``` 其中，your_jar_path为打包好的jar包路径，your_main_class_path为主类路径，input_path为输入路径，output_path为输出路径。运行完成后，输出文件中的内容就是按照要求排序后的结果。

阅读全文

相关推荐

电商网站用户收藏商品数量MapReduce统计

深入浅出Hive编程实用指南-2013年12月版

MapReduce：分布式计算模型详解

Hadoop大数据处理技术-java操作MapReduce（实验报告完整版）.doc

java大数据案例_5Mapreduce、数据挖掘

java操作hadoop之mapreduce分析年气象数据最低温度实战源码

Mapreduce编程.docx

基于Hadoop平台使用MapReduce统计某银行信用卡违约用户数量+java源码+文档说明

MapReduce编程实践：IntSumReducer详解

Oozie中的MapReduce任务管理

MapReduce中的过滤与筛选操作

使用MapReduce读取序列化文件,统计竞赛网站用户在2021年1月份和2月份每日的登录次数; 要求最终的输出结果根据月份分别保存到两个不同的文件中; 同时要求分别统计输入记录中1月份和2月份的记录数以及输出结果中1月

Python实现MapReduce：mrjob与Spark的深度应用

Apache Hadoop MapReduce实现朴素贝叶斯文本分类器教程

oozie中的MapReduce作业调度与优化

日志分析利器：MapReduce的应用与实践

MapReduce进阶必读：掌握Reduce阶段的核心技术

用Java编写代码：通过MapReduce对2月 商品A 325 1月 商品A 235 1月 商品B 234 2月 商品C 572 3月 商品A 123 1月 商品C 321 2月 商品B 573 3月 商品C 876进行排序，要求先按月份升序排序，再按销售量降序排序

构建倒排索引的MapReduce项目实现及运行指南

大家在看

暗通道去雾算法_何凯明去雾_matlab_去雾_去雾算法_暗通道算法_

基于YOLOv10+DeepSort实现视频中目标跟踪算法Python源码+详细使用说明.zip

电信设备-一种血糖数据查询方法及移动终端.zip

FAST FACTORIZED_FFBP论文_FFBP_后向投影.zip

威布尔参数估计，可靠性与寿命预测方向，机械工程,威布尔分布寿命预测,matlab源码.rar

最新推荐

自动删除hal库spendsv、svc以及systick中断

流量主小程序 多功能工具箱小程序源码-操作简单实用.zip

基于Simulink的PEMFC燃料电池机理模型（密歇根大学开发，涵盖空压机、空气路、氢气路及电堆仿真）,基于Simulink的PEMFC燃料电池机理模型（密歇根大学开发，涵盖空压机、空气路、氢气路及

OBC车载充电机硬件原理图和软件源码解析：6.6kw充电功率领先国内标准，符合国标规定,符合最新国标的高质量OBC车载充电机6.6kw 国产领导者源码全硬图解表现最佳技术标杆,OBC车载充电机6.6k

Rust开发环境选型指南：主流IDE介绍与配置教程

世界地图Shapefile文件解析与测试指南

Python环境监控高可用构建：可靠性增强的策略

需要在matlab当中批量导入表格数据的指令

Sqlcipher 3.4.0版本发布，优化SQLite兼容性

Python环境监控性能监控与调优：专家级技巧全集

用Java编写代码：通过MapReduce对2月商品A 325 1月商品A 235 1月商品B 234 2月商品C 572 3月商品A 123 1月商品C 321 2月商品B 573 3月商品C 876进行排序，要求先按月份升序排序，再按销售量降序排序

流量主小程序多功能工具箱小程序源码-操作简单实用.zip