Hadoop常用命令汇总:从创建目录到作业管理

需积分: 21 1 下载量 127 浏览量 更新于2024-09-12 收藏 334KB PDF 举报
Hadoop命令大全是一份详尽的指南,包含了Hadoop集群管理与操作的各类命令,对于理解和管理大规模分布式计算环境至关重要。以下是一些关键的Hadoop命令及其功能概述: 1. **列出所有Hadoop Shell支持的命令**:`$bin/hadoopfs-help` 命令用于显示Hadoop File System (HDFS) 的所有可用命令及其帮助信息,便于用户快速了解和学习。 2. **查看特定命令详情**:`$bin/hadoopfs-help command-name` 用于获取指定命令的详细说明,如查看作业历史记录的相关命令。 3. **查看作业历史日志**:`$bin/hadoopjob-historyoutput-dir` 和 `$bin/hadoopjob-historyalloutput-dir` 分别提供了作业详细信息和所有任务的尝试次数,包括成功和失败任务。 4. **格式化分布式文件系统**:`$bin/hadoopnamenode-format` 是初始化Hadoop NameNode的重要步骤,用于清除并创建新的文件系统结构。 5. **启动HDFS和Map/Reduce服务**:`$bin/start-dfs.sh` 和 `$bin/start-mapred.sh` 分别用于在分配的NameNode和JobTracker上启动分布式文件系统和MapReduce服务,这些守护进程会在奴隶节点上启动相应的进程。 6. **停止HDFS和Map/Reduce服务**:`$bin/stop-dfs.sh` 和 `$bin/stop-mapred.sh` 对应地用于关闭服务,通过引用配置文件中的奴隶节点列表来停止各个节点上的守护进程。 7. **创建目录**:`$bin/hadoopdfs-mkdir /foodir` 是在HDFS上创建目录的基本操作,这对于数据组织和管理至关重要。 这些命令覆盖了Hadoop集群的生命周期管理、文件系统操作和任务监控等多个方面。掌握这些命令能帮助Hadoop管理员有效地维护和优化分布式计算环境。在实际操作中,根据具体的业务需求和配置,可能还需要结合其他辅助工具和配置文件进行操作。