使用java运用hadoop统计文档phone_data(3)手机号耗费的总上行流量、下行流量、总流量(序列化)

首先，需要在Hadoop中准备好phone_data(3)文件，可以使用HDFS命令将文件上传到HDFS中。然后，可以使用Java编写MapReduce程序来统计手机号的上行流量、下行流量和总流量，并将结果序列化输出。下面是示例代码： Mapper代码： ``` public class PhoneDataMapper extends Mapper<LongWritable, Text, Text, PhoneDataWritable> { private PhoneDataWritable phoneDataWritable = new PhoneDataWritable(); private Text phoneNum = new Text(); @Override protected void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException { String[] fields = value.toString().split(","); if (fields.length == 7) { phoneNum.set(fields[1]); phoneDataWritable.setUpFlow(Long.parseLong(fields[4])); phoneDataWritable.setDownFlow(Long.parseLong(fields[5])); phoneDataWritable.setTotalFlow(Long.parseLong(fields[6])); context.write(phoneNum, phoneDataWritable); } } } ``` Reducer代码： ``` public class PhoneDataReducer extends Reducer<Text, PhoneDataWritable, Text, PhoneDataWritable> { private PhoneDataWritable phoneDataWritable = new PhoneDataWritable(); @Override protected void reduce(Text key, Iterable<PhoneDataWritable> values, Context context) throws IOException, InterruptedException { long upFlow = 0; long downFlow = 0; long totalFlow = 0; for (PhoneDataWritable value : values) { upFlow += value.getUpFlow(); downFlow += value.getDownFlow(); totalFlow += value.getTotalFlow(); } phoneDataWritable.setUpFlow(upFlow); phoneDataWritable.setDownFlow(downFlow); phoneDataWritable.setTotalFlow(totalFlow); context.write(key, phoneDataWritable); } } ``` PhoneDataWritable代码： ``` public class PhoneDataWritable implements Writable { private long upFlow; private long downFlow; private long totalFlow; public PhoneDataWritable() { } public PhoneDataWritable(long upFlow, long downFlow, long totalFlow) { this.upFlow = upFlow; this.downFlow = downFlow; this.totalFlow = totalFlow; } public long getUpFlow() { return upFlow; } public void setUpFlow(long upFlow) { this.upFlow = upFlow; } public long getDownFlow() { return downFlow; } public void setDownFlow(long downFlow) { this.downFlow = downFlow; } public long getTotalFlow() { return totalFlow; } public void setTotalFlow(long totalFlow) { this.totalFlow = totalFlow; } @Override public void write(DataOutput out) throws IOException { out.writeLong(upFlow); out.writeLong(downFlow); out.writeLong(totalFlow); } @Override public void readFields(DataInput in) throws IOException { upFlow = in.readLong(); downFlow = in.readLong(); totalFlow = in.readLong(); } @Override public String toString() { return upFlow + "\t" + downFlow + "\t" + totalFlow; } } ``` Driver代码： ``` public class PhoneDataDriver { public static void main(String[] args) throws Exception { Configuration conf = new Configuration(); Job job = Job.getInstance(conf, "PhoneData"); job.setJarByClass(PhoneDataDriver.class); job.setMapperClass(PhoneDataMapper.class); job.setReducerClass(PhoneDataReducer.class); job.setOutputKeyClass(Text.class); job.setOutputValueClass(PhoneDataWritable.class); FileInputFormat.addInputPath(job, new Path(args[0])); FileOutputFormat.setOutputPath(job, new Path(args[1])); System.exit(job.waitForCompletion(true) ? 0 : 1); } } ``` 然后在命令行中运行以下命令即可启动MapReduce作业： ``` hadoop jar PhoneData.jar PhoneDataDriver phone_data(3) output ``` 其中，PhoneData.jar是打包好的MapReduce程序的jar包，phone_data(3)是输入文件路径，output是输出文件路径。最后，在output目录中可以找到序列化后的结果文件。

阅读全文

使用java运用hadoop统计文档phone_data(3)手机号耗费的总上行流量、下行流量、总流量(序列化)

相关推荐

Java Object & Hadoop序列化深度解析：持久化与通信的关键技术

Hadoop项目：手机流量统计分析

Hadoop网站流量分析系统课程设计源码解析

Big-Data_hadoop_Yelp_Data_Analysis

hdfs.rar_hadoop_hadoop ubuntu_hdfs_分布式系统_基于hadoop

Hadoop教学使用java_jdk

1大数据之Hadoop.rar_Java编程_Java__Java编程_Java_

hdfs-webdav.rar_hadoop_hadoop webdav_hadoop 系统_hadoop2.0 d_hdfs

java-Hadoop序列化

hdfs_design.rar_HDFS-OPERATE_hadoop_hadoop java_hdfs

在ubuntu下搭建hadoop环境搭建__说明文档

Big_problems_with_big_data_-_Hadoop_interfaces_security.pdf

hadoop_dll2.6.0_64bit_windows_dll_hadoop_

hadoop2.7_winutils_exe和hadoop_dll

hadoop_data_analysis:基于Hadoop Streaming的数据分析工具

Big_Data_Analytics_with_Spark_and_Hadoop-Packt_Publishing2016

在Windows上安装Hadoop教程.zip_YJVH_hadoop_hadoop book

hadoop2.7.x_winutils_exe&&hadoop_dll

Hw1Grp2_hdfsjava_hadoopjava_

hadoop_program_java

大家在看

主生產排程員-SAP主生产排程

Canoe NM操作文档

surfer教程

地图分幅制作生产方法

Arduino仿生机械鱼-电路方案

最新推荐

基于hadoop的词频统计.docx

解决-BASH: /HOME/JAVA/JDK1.8.0_221/BIN/JAVA: 权限不够问题

Flume+Kafka+Storm+Hbase实现日志抓取和实施网站流量统计

hadoop项目--网站流量日志分析--5.docx

使用hadoop实现WordCount实验报告.docx

Java实现的门面模式及其UML设计图解析

MATLAB多线程编程终极指南：揭秘性能提升10大技巧

请用python制作一个200行左右的商品信息管理系统

韩国风格房地产广告模板赏析

深入Trello API与Notion高级功能：打造定制化信息管理系统