hadoop计算pi的源码及注释

以下是Hadoop计算Pi的源代码及注释： ```java // PiMapper.java import java.io.IOException; import java.util.Random; import org.apache.hadoop.io.*; import org.apache.hadoop.mapreduce.*; public class PiMapper extends Mapper<Object, Text, IntWritable, IntWritable> { private final static IntWritable one = new IntWritable(1); private static Random rndm = new Random(); public void map(Object key, Text value, Context context) throws IOException, InterruptedException { int numThrows = 10000; // 每个Mapper的投掷次数 int inCircle = 0; // 落在圆内的次数 for (int i = 0; i < numThrows; i++) { // 在 [-1, 1] 的范围内随机生成一个点 double x = 2 * rndm.nextDouble() - 1.0; double y = 2 * rndm.nextDouble() - 1.0; // 判断该点是否落在圆内 if (x * x + y * y <= 1.0) { inCircle++; } } // 将落在圆内的次数作为Key，1作为Value写入Context context.write(new IntWritable(inCircle), one); } } ``` ```java // PiReducer.java import java.io.IOException; import org.apache.hadoop.io.*; import org.apache.hadoop.mapreduce.*; public class PiReducer extends Reducer<IntWritable, IntWritable, IntWritable, DoubleWritable> { private DoubleWritable result = new DoubleWritable(); public void reduce(IntWritable key, Iterable<IntWritable> values, Context context) throws IOException, InterruptedException { int sum = 0; int count = 0; // 统计Key对应的Value的总和 for (IntWritable val : values) { sum += val.get(); count++; } // 计算Pi的近似值 double pi = ((double) sum / (double) count) * 4.0; // 将近似值作为Value写入Context result.set(pi); context.write(key, result); } } ``` ```java // PiDriver.java import java.io.IOException; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.Path; import org.apache.hadoop.io.*; import org.apache.hadoop.mapreduce.*; public class PiDriver { public static void main(String[] args) throws Exception { Configuration conf = new Configuration(); Job job = Job.getInstance(conf, "Pi Estimation"); // 设置Mapper job.setMapperClass(PiMapper.class); job.setMapOutputKeyClass(IntWritable.class); job.setMapOutputValueClass(IntWritable.class); // 设置Reducer job.setReducerClass(PiReducer.class); job.setOutputKeyClass(IntWritable.class); job.setOutputValueClass(DoubleWritable.class); // 设置InputFormat job.setInputFormatClass(TextInputFormat.class); // 设置OutputFormat job.setOutputFormatClass(TextOutputFormat.class); // 设置输入路径和输出路径 FileInputFormat.addInputPath(job, new Path(args[0])); FileOutputFormat.setOutputPath(job, new Path(args[1])); // 提交作业并等待完成 System.exit(job.waitForCompletion(true) ? 0 : 1); } } ``` 注释： 1. `PiMapper`类是一个Mapper类，它继承自`Mapper<Object, Text, IntWritable, IntWritable>`。它的输入键是`Object`，输入值是`Text`，输出键是`IntWritable`，输出值是`IntWritable`。 2. 在`PiMapper`类中，我们首先定义了一个`IntWritable`类型的常量`one`，它的值为1。接着，我们使用`java.util.Random`类创建了一个随机数生成器`rndm`。 3. `map`方法是`Mapper`类中的一个重要方法，它的作用是将输入键值对转换为输出键值对。在`PiMapper`类中，我们将每个Mapper的投掷次数设置为10000，然后在这个范围内随机生成一个点，判断该点是否落在圆内。如果是，我们将`inCircle`变量加1。最后，将落在圆内的次数作为Key，1作为Value写入Context。 4. `PiReducer`类是一个Reducer类，它继承自`Reducer<IntWritable, IntWritable, IntWritable, DoubleWritable>`。它的输入键是`IntWritable`，输入值是`IntWritable`，输出键是`IntWritable`，输出值是`DoubleWritable`。 5. 在`PiReducer`类中，我们首先定义了一个`DoubleWritable`类型的变量`result`。在`reduce`方法中，我们统计了Key对应的Value的总和和Value的数量。然后，根据公式计算Pi的近似值，将近似值作为Value写入Context。 6. `PiDriver`类是一个驱动程序。在`main`方法中，我们首先创建了一个`Configuration`对象和一个`Job`对象。然后，我们设置了Mapper、Reducer、InputFormat和OutputFormat。接着，我们设置了输入路径和输出路径。最后，我们提交作业并等待完成。

阅读全文

hadoop计算pi的源码及注释

相关推荐

计算pi的并行实验源代码

Hadoop编程实例源码

Hadoop-2.7.2源码及编译jar包.zip

hadoop2.7.3源码包，hadoop2.7.3zip源码包

hadoop 1.2.1核心源码

hadoop-2.8.4源码

Hadoop 2.4 开源码

hadoop 权威指南源码

hadoop-2.8.1源码

hadoop-2.6.4 源码

hadoop 分布式缓存源码

hadoop简单示例源码

Hadoop MapReduce Cookbook 源码

Hadoop2.6.4的源码包

实战hadoop中的源码

hadoop-3.3.4源码包

hadoop2.7.3的源码包

白色卡通风格响应式游戏应用商店企业网站模板.zip

48页-智慧工地监管平台解决方案.pdf

基于卷积神经网络的AV1视频编码环路滤波技术

大家在看

Pr1Wire2432Eng_reset_2432_

郑轻大计通院考研专业课考纲.pdf

SIMATIC S71200和1500安全编程指南

【微电网】基于Matlab实现孤岛和并网的状态下的微电网潮流计算 上传.zip

定向耦合器与三分贝电桥.pdf

最新推荐

hadoop源码分析-HDFS部分

ambari安装及搭建hadoop大数据集群

hadoop+spark分布式集群搭建及spark程序示例.doc

Hadoop源码的入门解析

Eclipse中编译运行Hadoop-0.20.1源码

掌握HTML/CSS/JS和Node.js的Web应用开发实践

管理建模和仿真的文件

计算机体系结构概述：基础概念与发展趋势

int a[][3]={{1,2},{4}}输出这个数组

勒玛算法研讨会项目：在线商店模拟与Qt界面实现

【微电网】基于Matlab实现孤岛和并网的状态下的微电网潮流计算上传.zip