hadoop简单程序

以下是一个简单的Hadoop WordCount程序的示例： 1. 首先，创建一个名为WordCount.java的Java文件，包含以下代码： ```java import java.io.IOException; import java.util.StringTokenizer; import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.Path; import org.apache.hadoop.io.IntWritable; import org.apache.hadoop.io.Text; import org.apache.hadoop.mapreduce.Job; import org.apache.hadoop.mapreduce.Mapper; import org.apache.hadoop.mapreduce.Reducer; import org.apache.hadoop.mapreduce.lib.input.FileInputFormat; import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat; public class WordCount { public static class TokenizerMapper extends Mapper<Object, Text, Text, IntWritable>{ private final static IntWritable one = new IntWritable(1); private Text word = new Text(); public void map(Object key, Text value, Context context ) throws IOException, InterruptedException { StringTokenizer itr = new StringTokenizer(value.toString()); while (itr.hasMoreTokens()) { word.set(itr.nextToken()); context.write(word, one); } } } public static class IntSumReducer extends Reducer<Text,IntWritable,Text,IntWritable> { private IntWritable result = new IntWritable(); public void reduce(Text key, Iterable<IntWritable> values, Context context ) throws IOException, InterruptedException { int sum = 0; for (IntWritable val : values) { sum += val.get(); } result.set(sum); context.write(key, result); } } public static void main(String[] args) throws Exception { Configuration conf = new Configuration(); Job job = Job.getInstance(conf, "word count"); job.setJarByClass(WordCount.class); job.setMapperClass(TokenizerMapper.class); job.setCombinerClass(IntSumReducer.class); job.setReducerClass(IntSumReducer.class); job.setOutputKeyClass(Text.class); job.setOutputValueClass(IntWritable.class); FileInputFormat.addInputPath(job, new Path(args[0])); FileOutputFormat.setOutputPath(job, new Path(args[1])); System.exit(job.waitForCompletion(true) ? 0 : 1); } } ``` 2. 将该文件打包成一个JAR文件，例如WordCount.jar。 3. 将输入文件放入HDFS中，例如input.txt。 4. 运行以下命令来运行WordCount程序： ```shell hadoop jar WordCount.jar WordCount input.txt output ``` 其中，WordCount.jar是你打包的JAR文件，WordCount是你的Java类名，input.txt是你的输入文件名，output是你的输出目录名。 5. 程序运行完成后，可以在output目录中找到输出文件。

阅读全文

相关推荐

Hadoop WordCount程序详解：从入门到实践

Hadoop MapReduce实践：WordCount程序

Hadoop应用程序

Hadoop Streaming程序实例

动手实验 Oracle Hadoop装载程序

一个简单的 Hadoop MapReduce 程序示例.rar

Map-Reduce:Hadoop MR 程序

HadoopMapReduce:奇怪的人hadoop MapReduce程序

在Windows上使用eclipse编写Hadoop应用程序

eclipse运行hadoop2.7.3程序依赖的jar包

hadoop-arch-book:O'Reilly Hadoop 应用程序架构书的代码库

hadoop-movierating:这是一个简单的 Hadoop 应用程序，可在特定用户组中创建评分最高的电影列表

在Windows上使用eclipse编写Hadoop应用程序.docx

hadoop流量统计程序

windows下开发hadoop2.4.1程序需要覆盖的本地库文件

深入解析Hadoop应用程序架构代码库

hadoop 运行程序统计text单词出现的次数

hadoop程序运行平台

hadoop编写java程序

最新推荐

hadoop+spark分布式集群搭建及spark程序示例.doc

详解搭建ubuntu版hadoop集群

在Hadoop的MapReduce任务中使用C程序的三种方法

Hadoop单机模式的配置与安装

Hadoop在win7详细安装

正整数数组验证库：确保值符合正整数规则

管理建模和仿真的文件

【损失函数与随机梯度下降】：探索学习率对损失函数的影响，实现高效模型训练

在ADS软件中，如何选择并优化低噪声放大器的直流工作点以实现最佳性能？

系统移植工具集：镜像、工具链及其他必备软件包