在执行hadoop jar $HADOOP_HOME/share/hadoop/tools/lib/hadoop-streaming-*.jar \ -files mapper.py \ -mapper mapper.py \ -files reducer.py \ -reducer reducer.py \ -input input.txt \ -output output时报错ERROR streaming.StreamJob: Unrecognized option: -files
时间: 2024-03-14 09:43:10 浏览: 132
运行hadoop jar
如果你使用的 Hadoop 版本是 2.6.0 或以上的版本,那么 `-files` 选项已经被弃用了,改为使用 `-archives` 选项。
所以你可以将命令中的 `-files` 替换为 `-archives`,例如:
```
hadoop jar $HADOOP_HOME/share/hadoop/tools/lib/hadoop-streaming-*.jar \
-archives mapper.py#mapper.py,reducer.py#reducer.py \
-mapper mapper.py \
-reducer reducer.py \
-input input.txt \
-output output
```
这样就可以避免这个错误了。
阅读全文