package edu.mr; import org.apache.hadoop.io.LongWritable; import org.apache.hadoop.io.NullWritable; import org.apache.hadoop.io.Text; import org.apache.hadoop.mapreduce.Mapper; import java.io.IOException; public class QuotesMapper extends Mapper<LongWritable,Text,NullWritable,Text>{ @Override protected void map(LongWritable key,Text value,Context context)throws IOException,InterruptedException{ //读取文件中的一行,去掉前后的空格 String line=value.toString().trim(); //通过\t 进行切分,转换成字符串数组 String[] arrLine=line.split("\\t"); if(arrLine.length < 3){ return; } //ID String id=arrLine[0]; //名人名言 String text=arrLine[1]; //作者 String author=arrLine[2]; //默认标签为 none String tags="none"; //如果标签不为空,标签进行重新赋值 if(arrLine.length>3){ tags=arrLine[3]; } //构造新的字符串 StringBuffer sb=new StringBuffer(); sb.append(id).append("\t").append(text).append("\t").append(author).append("\t").append(tags); //写入context context.write(NullWritable.get(),new Text(sb.toString())); } }

时间: 2024-02-14 16:35:25 浏览: 82

这是一个基于Hadoop的MapReduce程序的Mapper类，用于处理名人名言数据集，并将数据写入context中。其中，map()方法接收的是LongWritable、Text类型的输入，输出的是NullWritable、Text类型的键值对。在map()方法中，首先将读取到的一行数据进行切分，获取其中的ID、名人名言、作者和标签等信息，然后通过StringBuffer拼接成新的字符串，最后写入context中。值得注意的是，如果读取到的数据中标签为空，则默认将标签赋值为none。

import java.io.IOException; import org.apache.hadoop.io.IntWritable; import org.apache.hadoop.io.LongWritable; import org.apache.hadoop.io.Text; import org.apache.hadoop.mapreduce.Mapper; public class MyMapper extends Mapper<LongWritable, Text, Text, Int

Writable> { private final static IntWritable one = new IntWritable(1); private Text word = new Text(); public void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException { // Splitting the input line into words String[] words = value.toString().split(" "); // Mapping each word with a count of 1 for (String w : words) { word.set(w); context.write(word, one); } } } 这是一个 Hadoop MapReduce 程序中的 Mapper 类，用于对输入的文本进行分词，并对每个单词进行计数。其中 LongWritable 表示输入的键类型，Text 表示输入的值类型，Text 表示输出的键类型，IntWritable 表示输出的值类型。在 map 方法中，将输入的文本按空格切分成单词，然后将每个单词映射成键值对，键为单词，值为 1。最后通过 context.write 方法输出键值对。

package hadoop9999.training.exp1; import com.alibaba.fastjson.JSON; import org.apache.commons.logging.Log; import org.apache.commons.logging.LogFactory; import org.apache.hadoop.io.LongWritable; import org.apache.hadoop.io.NullWritable; import org.apache.hadoop.io.Text; import org.apache.hadoop.mapreduce.Mapper; import java.io.IOException; public class ActorBestMoviesMapper extends Mapper<LongWritable, Text, MovieInfo, NullWritable>{ public static final Log log = LogFactory.getLog(ActorBestMoviesMapper.class); @Override protected void map(LongWritable key1, Text value1, Context context) throws IOException, InterruptedException { String val=value1.toString(); MovieInfo m=JSON.parseObject(val, MovieInfo.class); if(m.getActorSet().contains("李治廷")){ log.info(m.getTitle()); context.write(m, NullWritable.get()); } } }

这是一个Hadoop MapReduce程序中的Mapper类，用于实现从输入数据中筛选出演员“李治廷”参演的电影，并将其输出。具体来说，它接受的输入键值对类型为LongWritable和Text，表示输入文件中每行的偏移量和内容。在map()方法中，它首先将输入数据解析成一个MovieInfo对象，然后检查该电影的演员列表中是否包含“李治廷”，如果包含，则输出该电影对象作为键，NullWritable.get()作为值，以便在Reduce过程中对电影进行排序和去重。同时，它还使用了Log4j2日志框架记录每个被筛选出的电影标题，以便进行调试和监控。

阅读全文

import java.io.IOException; import org.apache.hadoop.io.IntWritable; import org.apache.hadoop.io.LongWritable; import org.apache.hadoop.io.Text; import org.apache.hadoop.mapreduce.Mapper; public class MyMapper extends Mapper<LongWritable, Text, Text, Int

相关推荐

解决MapReduce程序运行错误：org.apache.hadoop.conf不存在

Hadoop 3.2.1版本winutils.exe和hadoop.dll文件使用指南

Hadoop DLL与Winutils.exe资源包下载指南

java. lang . UnsatisfiedLinkError: org. apache . hadoop. io. nativeio. NativeIOSWindows . access0

org.apache.hadoop.io.nativeio

java.lang.Exception: java.io.IOException: Type mismatch in key from map: expected org.apache.hadoop.io.Text, received org.apache.hadoop.io.LongWritable

import org.apache.hadoop.io.LongWritable;报错:The package org is not accessible怎么解决

将org.apache.hadoop.io.Text类型的对象转换为org.apache.hadoop.hive.serde2.io.DateWritableV2类型的对象

IDEA中通过Java的API操作MapReducer报错org.apache.hadoop.io.nativeio.NativeIO$Windows...的解决办法(进来看一下)-附件资源

Hadoop DLL与Winutils.exe压缩包深度解析

Hadoop2.x安装实战教程

ningyaozhongguogeshui

时间控件，timer controller, 桌面小时间控件，简单的时间控件

基于 DWT 的 STM32（或任何 ARM）的微秒级延迟库.zip

大家在看

STM8L051F3P6使用手册（中文）.zip

千方百剂服务器及客户端安装白皮书

ORACLE RMAN备份恢复指南

批量标准矢量shp互转txt工具

LTE软件使用介绍

最新推荐

Caused by: java.lang.ClassNotFoundException: org.apache.commons.collections.Transformer异常

Android程序报错程序包org.apache.http不存在问题的解决方法

java.lang.NoClassDefFoundError错误解决办法

Hadoop源代码分析（包org.apache.hadoop.mapreduce）

IDEA最新版2020.1的maven工程本地依赖仓库无法使用问题(已解决)

海康无插件摄像头WEB开发包(20200616-20201102163221)

PCNM空间分析新手必读：R语言实现从入门到精通

生成一个自动打怪的脚本

CarMarker-Animation: 地图标记动画及转向库

5G核心网元性能瓶颈揭秘