Hadoop面试精华:3种运行模式详解与关键配置

需积分: 0 4 下载量 44 浏览量 更新于2024-09-12 收藏 27KB DOCX 举报
Hadoop面试题涵盖了Hadoop框架的核心概念、部署模式和配置细节。在面试中,候选人可能会被问到以下几个关键知识点: 1. **集群模式**: - Hadoop支持三种运行模式:单机(本地)模式、伪分布式模式和全分布式模式。 - 单机模式主要用于开发阶段,所有组件在同一个JVM中运行,无DFS,使用本地文件系统。 - 伪分布式模式适合开发和测试,所有守护进程在同一台机器上运行,但模拟了部分分布式特性。 - 全分布式模式是生产环境的标准,通过多台主机组建集群,有独立的NameNode、DataNode和TaskTracker。 2. **注意事项**: - 在单机模式中,要注意没有守护进程和DFS,仅用于快速开发。 - 伪分布式模式需要注意的是它并非真正的分布式,而是为了方便测试和调试。 3. **Hadoop与Unix模式**: - Hadoop遵循Unix模式,比如使用"conf"目录来管理配置。 4. **安装位置**: - Cloudera和Apache Hadoop的默认安装路径通常是`/usr/lib/hadoop-0.20/`或类似路径,但现代版本可能有所不同。 5. **端口信息**: - Namenode的默认端口是70,Jobtracker是30,Tasktracker是60。 6. **配置文件**: - 早期版本使用hadoop-default.xml和hadoop-site.xml,现已被core-site.xml、hdfs-site.xml和mapred-site.xml取代,存储于conf/子目录下。 7. **内存管理**: - 溢出因子(Spillfactor)指临时文件的大小,用于控制内存使用情况。 8. **fs.mapr.working.dir**: - 这是一个单一的目录,用于Hadoop MapReduce任务的工作目录设置。 9. **hdfs-site.xml属性**: - 提及的三个主要属性可能是关于HDFS的配置,如DFS数据块大小、副本策略等,具体属性名需要根据实际版本查阅。 在面试时,对这些概念的理解和实践经验非常重要,面试官可能会提问候选人在实际项目中的应用、配置优化、性能调优等方面的问题。掌握这些知识点能帮助求职者在Hadoop领域脱颖而出。