Hadoop命令详解：从基础到高级操作

5星 · 超过95%的资源需积分: 21 8 浏览量更新于2024-09-13 收藏 334KB PDF 举报

Hadoop命令大全是针对大数据处理框架Hadoop的关键工具集合，它提供了一系列命令来管理和监控Hadoop集群中的分布式文件系统（HDFS）以及MapReduce计算框架。以下是部分重要的Hadoop命令及其用途： 1. **hadoopfs-help**：这个命令用于列出Hadoop Shell支持的所有内置命令，帮助用户了解可用的文件系统操作。 2. **hadoopfs-help command-name**：对于特定的HDFS命令，例如查看历史日志，可以通过这个格式获取详细的帮助信息。 3. **查看历史日志**：`$bin/hadoopjob-historyoutput-dir` 和 `hadoopjob-historyalloutput-dir` 命令允许用户查看作业的历史记录，包括失败和终止任务的详细信息，以及成功任务的尝试次数。 4. **格式化分布式文件系统（HDFS）**：`$bin/hadoopnamenode-format` 是用于初始化新的HDFS命名节点的命令，确保文件系统的正确配置。 5. **启动HDFS**：通过`$bin/start-dfs.sh` 命令可以在指定的NameNode节点上启动分布式文件系统服务，并在配置文件指定的-slaves文件中列出的DataNode节点上启动DataNode进程。 6. **启动Map/Reduce**：类似地，`$bin/start-mapred.sh` 用于在分配的JobTracker上启动MapReduce服务，并启动TaskTracker守护进程。 7. **停止HDFS和服务**：`$bin/stop-dfs.sh` 和 `bin/stop-mapred.sh` 分别用于在NameNode和JobTracker上停止HDFS和MapReduce服务，同时会关闭相应守护进程。 8. **创建HDFS目录**：`$bin/hadoopdfs-mkdir /foodir` 是用来在HDFS中创建新目录的基本命令，这对于数据存储和组织非常重要。以上这些命令是Hadoop管理员和开发者进行日常运维、数据管理以及执行MapReduce任务时不可或缺的工具。熟练掌握这些命令能够极大地提升在Hadoop环境中工作的效率和问题解决能力。通过实践和深入理解这些命令的工作原理，用户可以更好地构建、管理和优化大规模数据处理工作流程。

Hadoop 命令大全

(2010-04-19 22:10:17)

1、列出所有 Hadoop Shell 支持的命令

$ bin/hadoop fs -help

2、显示关于某个命令的详细信息

$ bin/hadoop fs -help command-name

3、用户可使用以下命令在指定路径下查看历史日志汇总

$ bin/hadoop job -history output-dir

这条命令会显示作业的细节信息，失败和终止的任务细节。

4、关于作业的更多细节，比如成功的任务，以及对每个任务的所做的尝试次数等可以用下

面的命令查看

$ bin/hadoop job -history all output-dir

5、格式化一个新的分布式文件系统：

$ bin/hadoop namenode -format

6、在分配的 NameNode 上，运行下面的命令启动 HDFS：

$ bin/start-dfs.sh

bin/start-dfs.sh 脚本会参照 NameNode 上${HADOOP_CONF_DIR}/slaves 文件的内容，在所有

列出的 slave 上启动 DataNode 守护进程。

7、在分配的 JobTracker 上，运行下面的命令启动 Map/Reduce：

$ bin/start-mapred.sh

bin/start-mapred.sh 脚本会参照 JobTracker 上${HADOOP_CONF_DIR}/slaves 文件的内容，在

所有列出的 slave 上启动 TaskTracker 守护进程。

8、在分配的 NameNode 上，执行下面的命令停止 HDFS：

$ bin/stop-dfs.sh

bin/stop-dfs.sh 脚本会参照 NameNode 上${HADOOP_CONF_DIR}/slaves 文件的内容，在所有

列出的 slave 上停止 DataNode 守护进程。

9、在分配的 JobTracker 上，运行下面的命令停止 Map/Reduce：

$ bin/stop-mapred.sh

bin/stop-mapred.sh 脚本会参照 JobTracker 上${HADOOP_CONF_DIR}/slaves 文件的内容，在

所有列出的 slave 上停止 TaskTracker 守护进程。

DFSShell

10、创建一个名为 /foodir 的目录

$ bin/hadoop dfs -mkdir /foodir

11、创建一个名为 /foodir 的目录

$ bin/hadoop dfs -mkdir /foodir

12、查看名为 /foodir/myfile.txt 的文件内容

$ bin/hadoop dfs -cat /foodir/myfile.txt

DFSAdmin

13、将集群置于安全模式

$ bin/hadoop dfsadmin -safemode enter

14、显示 Datanode 列表

下载后可阅读完整内容，剩余4页未读，立即下载

njyspring

粉丝: 0
资源: 1

Hadoop命令详解：从基础到高级操作

hadoop 命令大全

hadoop命令大全

Hadoop命令

Hadoop命令手册

hadoop命令手册

Hadoop命令大全

hadoop命令集

安装hadoop命令

hadoop命令hadoop classpath

重启hadoop命令

最新资源