hadoop MapReduce工资统计代码

以下是一个使用Hadoop MapReduce框架来统计工资数据的简单示例代码：

Mapper部分：

public class SalaryMapper extends Mapper<LongWritable, Text, Text, IntWritable> {

    private final static IntWritable one = new IntWritable(1);
    private Text word = new Text();

    public void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {
        String line = value.toString();
        String[] fields = line.split(",");
        int salary = Integer.parseInt(fields[2]);

        // 将薪资范围映射为对应的key
        if (salary < 10000) {
            word.set("<10000");
        } else if (salary < 20000) {
            word.set("10000-20000");
        } else if (salary < 30000) {
            word.set("20000-30000");
        } else {
            word.set(">30000");
        }

        context.write(word, one);
    }
}

Reducer部分：

public class SalaryReducer extends Reducer<Text, IntWritable, Text, IntWritable> {

    private IntWritable result = new IntWritable();

    public void reduce(Text key, Iterable<IntWritable> values, Context context)
            throws IOException, InterruptedException {
        int sum = 0;
        for (IntWritable val : values) {
            sum += val.get();
        }
        result.set(sum);
        context.write(key, result);
    }
}

Driver部分：

public class SalaryCount {

    public static void main(String[] args) throws Exception {
        Configuration conf = new Configuration();
        Job job = Job.getInstance(conf, "Salary Count");

        job.setJarByClass(SalaryCount.class);
        job.setMapperClass(SalaryMapper.class);
        job.setCombinerClass(SalaryReducer.class);
        job.setReducerClass(SalaryReducer.class);

        job.setOutputKeyClass(Text.class);
        job.setOutputValueClass(IntWritable.class);

        FileInputFormat.addInputPath(job, new Path(args[0]));
        FileOutputFormat.setOutputPath(job, new Path(args[1]));

        System.exit(job.waitForCompletion(true) ? 0 : 1);
    }
}

以上代码用于统计薪资范围在<10000, 10000-20000, 20000-30000, >30000之间的员工数量。输入文件为CSV格式的员工信息文件，每行为一个员工的id、姓名和薪资。输出文件为每个薪资范围对应的员工数量。

阅读全文

向AI提问

hadoop MapReduce工资统计代码

相关推荐

hadoop中 MapReduce学习代码WordCount

大数据 hadoop mapreduce 词频统计

基于Hadoop MapReduce的高校考研分数线统计分析项目代码+数据集.rar

工资统计，利用Hadoop框架进行部门工资的统计，让你更好的理解hadoop

Hadoop框架下的部门工资统计分析

hadoop实验三.实验三教程步骤

Hadoop+JavaWeb大数据分析可视化系统.docx

Hadoop数据处理教程：emp.csv与dept.csv文件解析

Hadoop生态系统深度剖析

Hadoop分布式计算模型与框架的选择

高效处理数据：MapReduce案例研究与最佳实践

案例分析与解决方案比较：MapReduce大文件处理指南

Avro：Hadoop中的数据序列化与反序列化

【Anaconda与大数据】：轻松集成Hadoop和Spark的实战指南

MapReduce排序与分组优化：10个实战技巧，打造高效的处理流程

大数据处理技术：从 Hadoop 到 Spark，探索数据处理新范式

Hive 数据分析基础：数据统计与分组查询

统计与聚合：Hive on Spark的高级数据操作指南

风光氢储+VSG并网系统仿真【附带参考文献】 仿真控制结构：风光储单独通过逆变器VSG控制并网，然后母线经过整流器+Buck变器连接PEM电解水制氢系统 1、PEM电解水制氢：采用功率外环加电流内环

大家在看

富士施乐Fuji Xerox DocuPrint CM215 f 驱动.rar

Python tkinter模块弹出窗口及传值回到主窗口操作详解

ktxToPng.rar

免费下载道客巴巴文档工具

Word文档合并工具，在一段英语后面加一段中文，形成双语对照文本

最新推荐

hadoop mapreduce编程实战

基于hadoop的词频统计.docx

Hadoop源代码分析（包org.apache.hadoop.mapreduce）

Hadoop_MapReduce教程.doc

风光氢储+VSG并网系统仿真【附带参考文献】 仿真控制结构：风光储单独通过逆变器VSG控制并网，然后母线经过整流器+Buck变器连接PEM电解水制氢系统 1、PEM电解水制氢：采用功率外环加电流内环

全面介绍酒店设施的培训纲要

Qt零基础到精通系列：全面提升轮播图开发技能的15堂必修课

创建的conda环境无法配置到pycharm

Java与JS结合实现动态下拉框搜索提示功能

【LVGL快速入门与精通】：10个实用技巧，让你从新手到专家

风光氢储+VSG并网系统仿真【附带参考文献】仿真控制结构：风光储单独通过逆变器VSG控制并网，然后母线经过整流器+Buck变器连接PEM电解水制氢系统 1、PEM电解水制氢：采用功率外环加电流内环

风光氢储+VSG并网系统仿真【附带参考文献】仿真控制结构：风光储单独通过逆变器VSG控制并网，然后母线经过整流器+Buck变器连接PEM电解水制氢系统 1、PEM电解水制氢：采用功率外环加电流内环