mapreduce运行命令
时间: 2023-08-20 19:25:58 浏览: 54
MapReduce 是 Hadoop 分布式计算框架的核心组件之一,以下是 MapReduce 运行命令:
```
hadoop jar <path-to-hadoop-examples-jar> <input-path> <output-path> <mapper-class> <reducer-class>
```
其中:
- `<path-to-hadoop-examples-jar>`:Hadoop 安装目录下 `share/hadoop/mapreduce/hadoop-mapreduce-examples-<version>.jar`(版本号根据实际情况替换)。
- `<input-path>`:MapReduce 作业的输入路径。
- `<output-path>`:MapReduce 作业的输出路径。
- `<mapper-class>`:自定义的 Mapper 类的完整类名。
- `<reducer-class>`:自定义的 Reducer 类的完整类名。
例如:
```
hadoop jar /usr/local/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.2.2.jar wordcount /input /output com.example.WordCountMapper com.example.WordCountReducer
```
以上命令会运行一个名为 `wordcount` 的 MapReduce 作业,从输入路径 `/input` 读取数据,将结果输出到路径 `/output`,使用自定义的 Mapper 类 `com.example.WordCountMapper` 和 Reducer 类 `com.example.WordCountReducer`。