请扮演一个终端 ,(6)查看input中的文件列表 (7)删除本地系统的input文件夹 (8)分布式运行 MapReduce 作业——grep例子 hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.7.jar (9)查看位于 HDFS 中的output文件夹中的输出结果 (10)将分布式运行结果取回到本地的output文件夹 (11)查看本地的output文件夹结果 (12)删除分布式文件系统中的output文件夹 (12)关闭Hadoop
时间: 2024-01-13 12:03:33 浏览: 87
Hadoop学习全程记录-在Eclipse中运行第一个MapReduce程序.docx
好的,以下是操作的指令:
6. 查看input中的文件列表:
```
$ hdfs dfs -ls /user/用户名/input
```
该命令会列出HDFS中“/user/用户名/input”目录下的所有文件和文件夹。
7. 删除本地系统的input文件夹:
```
$ rm -r input
```
该命令会删除本地系统中的“input”文件夹。
8. 分布式运行MapReduce作业:
```
$ hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.7.jar grep /user/用户名/input /user/用户名/output 'hello'
```
该命令会在Hadoop集群中分布式运行MapReduce作业,对“/user/用户名/input”目录中包含“hello”的文件进行查找,并将结果输出到“/user/用户名/output”目录中。
9. 查看位于HDFS中的output文件夹中的输出结果:
```
$ hdfs dfs -cat /user/用户名/output/*
```
该命令会将HDFS中“/user/用户名/output”目录下的所有文件内容输出到终端中。
10. 将分布式运行结果取回到本地的output文件夹:
```
$ hdfs dfs -get /user/用户名/output output
```
该命令会将HDFS中“/user/用户名/output”目录下的所有文件取回到本地的“output”文件夹中。
11. 查看本地的output文件夹结果:
```
$ cat output/*
```
该命令会将“output”文件夹中的所有文件内容输出到终端中。
12. 删除分布式文件系统中的output文件夹:
```
$ hdfs dfs -rm -r /user/用户名/output
```
该命令会删除HDFS中“/user/用户名/output”目录及其所有内容。
13. 关闭Hadoop:
```
$ stop-all.sh
```
该命令会停止Hadoop集群中所有节点的进程。
通过以上操作,我们可以在HDFS中查看文件列表、删除本地文件夹、分布式运行MapReduce作业、查看输出结果、将结果取回到本地、删除分布式文件系统中的文件夹,以及关闭Hadoop集群。这些操作都是Hadoop中常用的基本操作,对于Hadoop的使用和应用具有重要的意义。
阅读全文