mapreduce根据提示，在右侧编辑器补充代码，计算出每个手机号码的一年总流量。 main 方法已给出，其中 Job 和输入输出路径已配置完成，无需更改； map 和 reduce 的输入输出 key、value 已给出；编程中直接写 map 与 reduce 过程的主要内容即可。获取输入的行,并以 , 分开成列表。将当月的上行流量和下行流量相加。将key为手机号，value为当月的总流量传入至reduce中

时间: 2024-02-25 14:58:21 浏览: 28

以下是代码实现： ```java import java.io.IOException; import org.apache.hadoop.fs.Path; import org.apache.hadoop.io.LongWritable; import org.apache.hadoop.io.Text; import org.apache.hadoop.mapreduce.Job; import org.apache.hadoop.mapreduce.Mapper; import org.apache.hadoop.mapreduce.Reducer; import org.apache.hadoop.mapreduce.lib.input.FileInputFormat; import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat; public class MobileFlow { public static class MobileFlowMapper extends Mapper<LongWritable, Text, Text, FlowBean> { private Text phoneNum = new Text(); private FlowBean flow = new FlowBean(); @Override protected void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException { String line = value.toString(); String[] fields = line.split(","); phoneNum.set(fields[0]); flow.setUpFlow(Long.parseLong(fields[1])); flow.setDownFlow(Long.parseLong(fields[2])); flow.setUpCount(Long.parseLong(fields[3])); flow.setDownCount(Long.parseLong(fields[4])); context.write(phoneNum, flow); } } public static class MobileFlowReducer extends Reducer<Text, FlowBean, Text, FlowBean> { private FlowBean result = new FlowBean(); @Override protected void reduce(Text key, Iterable<FlowBean> values, Context context) throws IOException, InterruptedException { long upFlowTotal = 0; long downFlowTotal = 0; long upCountTotal = 0; long downCountTotal = 0; for (FlowBean value : values) { upFlowTotal += value.getUpFlow(); downFlowTotal += value.getDownFlow(); upCountTotal += value.getUpCount(); downCountTotal += value.getDownCount(); } result.setUpFlow(upFlowTotal); result.setDownFlow(downFlowTotal); result.setUpCount(upCountTotal); result.setDownCount(downCountTotal); context.write(key, result); } } public static void main(String[] args) throws Exception { Job job = Job.getInstance(); job.setJarByClass(MobileFlow.class); job.setMapperClass(MobileFlowMapper.class); job.setReducerClass(MobileFlowReducer.class); job.setMapOutputKeyClass(Text.class); job.setMapOutputValueClass(FlowBean.class); job.setOutputKeyClass(Text.class); job.setOutputValueClass(FlowBean.class); FileInputFormat.setInputPaths(job, new Path(args[0])); FileOutputFormat.setOutputPath(job, new Path(args[1])); job.waitForCompletion(true); } public static class FlowBean { private Long upFlow; private Long downFlow; private Long upCount; private Long downCount; public void setUpFlow(Long upFlow) { this.upFlow = upFlow; } public Long getUpFlow() { return upFlow; } public void setDownFlow(Long downFlow) { this.downFlow = downFlow; } public Long getDownFlow() { return downFlow; } public void setUpCount(Long upCount) { this.upCount = upCount; } public Long getUpCount() { return upCount; } public void setDownCount(Long downCount) { this.downCount = downCount; } public Long getDownCount() { return downCount; } @Override public String toString() { return upFlow + "\t" + downFlow + "\t" + upCount + "\t" + downCount; } } } ``` 在 Mapper 中，我们将每行数据按逗号分隔后，第一列作为 key，后面四列作为 value（这里我们自定义了一个 FlowBean 类来封装这四列）。在 Reducer 中，我们将每个手机号的所有数据累加起来，计算出总流量和总通话次数，并将结果输出。最后在 main 方法中设置 mapper、reducer、输入输出路径等信息后，提交到集群并等待任务完成即可。

相关推荐

大数据学习（八）：mapreduce编程案例-计算每个手机号访问网站请求流量、相应流量和流量总和根据手机号判断省份进行分类

使用MapReduce对日志文件进行分析, 找出其中的热点词并统计其出现次数

MapReduce模型在并行式计算机数据挖掘中的应用.pdf

根据手机流量数据，编写 MapReduce 程序来统计出每个手机号码的一年总流量。

本关任务：根据手机流量数据，编写 MapReduce 程序来统计出每个手机号码的一年总流量。

计算出每个手机号码的一年总流量。 main 方法已给出，其中 Job 和输入输出路径已配置完成，无需更改； map 和 reduce 的输入输出 key、value 已给出； 编程中直接写 map 与 reduce 过程的主要内容即可

使用mapreduce写一个词频统计，并给出每行代码的注释

mapreduce去重计算每个网络访问的手机数量完整代码

java编写话费统计的MR程序，计算每个电话号码的总流量，包括上行流量，下行流量

java编写话费统计的MR程序，计算每个电话号码的总流量，包括上行流量，下行流量。

根据衔7.3和7.4通过MapReduce框架编写程序，统计出每个学生的考试总成绩。

将学科作为行键，分数作为列族。求每个学科的平均分，mapreduce方法，用Hbase读入的表，给出代码

用java编写话费统计的MR程序，计算每个电话号码的总流量，包括上行流量，下行流量。

编写话费统计的MR程序，计算每个电话号码的总流量，包括上行流量，下行流量。

通过MapReduce框架编写程序统计出每个学生的考试总成绩 用java实现

云计算-MapReduce计算模型下数据倾斜处理方法的研究.pdf

分布式计算框架MapReduce

基于Hadoop,MapReduce粒计算，对肝病数据集进行属性约简，在集群上运行，用信息熵，和重要度+源代码+文档说明

最新推荐

爬虫代码+MapReduce代码+可视化展示代码.docx

基于MapReduce的Apriori算法代码

在Hadoop的MapReduce任务中使用C程序的三种方法

Java开发案例-springboot-19-校验表单重复提交-源代码+文档.rar

基于android的公司员工考勤综合信息平台源码.zip

zigbee-cluster-library-specification

管理建模和仿真的文件

MATLAB柱状图在信号处理中的应用：可视化信号特征和频谱分析

HSV转为RGB的计算公式

JSBSim Reference Manual

计算出每个手机号码的一年总流量。 main 方法已给出，其中 Job 和输入输出路径已配置完成，无需更改； map 和 reduce 的输入输出 key、value 已给出；编程中直接写 map 与 reduce 过程的主要内容即可

通过MapReduce框架编写程序统计出每个学生的考试总成绩用java实现