没有合适的资源?快使用搜索试试~ 我知道了~
首页Hadoop中MapReduce基本案例及代码(一)
概念 MapReduce是hadoop分布式计算框架。 MapReduce意味着在计算过程中实际分为两大步,Map过程和Reduce过程。 下面以一个统计单词次数简单案例为例: 数据源 Map类 import java.io.IOException; import org.apache.hadoop.io.LongWritable; import org.apache.hadoop.io.Text; import org.apache.hadoop.mapreduce.Mapper; // 案例:统计每一个单词出现的次数 // KEYIN - 这一行的偏移量 --- // VALUEIN
资源详情
资源评论
资源推荐

Hadoop中中MapReduce基本案例及代码(一)基本案例及代码(一)
概念概念
MapReduce是是hadoop分布式计算框架。分布式计算框架。
MapReduce意味着在计算过程中实际分为两大步,Map过程和Reduce过程。
下面以一个统计单词次数简单案例为例:
数据源数据源
Map类类
import java.io.IOException;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Mapper;
// 案例:统计每一个单词出现的次数
// KEYIN - 这一行的偏移量 ---
// VALUEIN - 读取到这一行的数据
// KEYOUT - 输出的键的类型 --- 这一行中的每一个单词
// VALUEOUT - 输出的值的类型 --- 表示这一行中这个单词出现的次数
public class WordCountMapper extends Mapper{
@Override
// key -- 这一行的偏移量
// value --- 这一行的数据
protected void map(LongWritable key, Text value, Mapper.Context context)
throws IOException, InterruptedException {
System.err.println(value);
// 获取到一行数据
String str = value.toString();
// 以空格为单位进行切分
String[] arr = str.split(" ");


















安全验证
文档复制为VIP权益,开通VIP直接复制

评论0