hadoop jar /usr/local/src/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.1.jar wordcount ~/input/data.txt ~/output
时间: 2024-10-16 14:10:22 浏览: 56
hadoop-mapreduce-examples-2.7.1.jar
5星 · 资源好评率100%
好的,Hadoop的命令行工具`hadoop jar`用于执行Hadoop MapReduce任务。在这个例子中:
```sh
hadoop jar /usr/local/src/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.1.jar wordcount ~/input/data.txt ~/output
```
这个命令的意思是:
1. `/usr/local/src/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.1.jar` 是指定的主类路径,即MapReduce示例程序的JAR文件,通常包含wordcount等预打包的MapReduce任务。
2. `wordcount` 是要执行的具体MapReduce任务名,这里是Hadoop自带的一个经典示例,用于计算文本文件中单词的频率。
3. `~/input/data.txt` 是输入数据文件,这是wordcount任务需要读取的数据源,`~` 表示用户的家目录。
4. `~/output` 是输出结果会保存的目录,MapReduce任务完成后,单词及其计数的结果会被写入这里。
运行这个命令,Hadoop会在后台启动一个JobTracker(在Hadoop 2.x之后改名为YARN Resource Manager)来调度和管理MapReduce作业,并从给定的输入文件生成统计结果,存储在指定的输出目录下。
阅读全文