没有合适的资源?快使用搜索试试~ 我知道了~
首页高级大数据工程师面试题库
资源详情
资源评论
资源推荐

1
编者 QQ:10401952
大数据面试
为了让大家更有针对性的学习和复习,对 hadoop 面试题有个大概的了解,
超人学院特将学员面试过程中遇到的面试题汇集成篇。在此,非常感谢大家对超人
学院工作的鼎力支持与配合,尤其要感谢(包含但不限于)飞哥、然月枕流君、北
京-南桑、彩虹伴相思雨、Clouds、小萝卜、北京-大数、象夫、随心、mo•
mo ring• 、aboutyun、happy、闪客、找自己、炎帝初始化.........截至 2014 年
7 月 25 日为止,本次共收集了 336 道 hadoop 相关的面试题。随着面试学员数
的增加,我们将不定期更新面试题库, 欢迎大家持续关注超人学院的官网
www.crxy.cn 和 QQ 交流群 204069925,确保第一时间获取免费的公开课信息
和其他学习资料。
更多学员面试经验请关注超人学院官网:http://www.crxy.cn/。
1、10 年工作经验罗同学由月薪 18k 飙升至 45k: http://www.crxy.cn/detail/news/12;
2 、 14 届 应 届 本 科 生 入 职 中 国 航 天 集 团 , 基 本 年 薪 20w , 年 终 奖 10w : http://www.c
rxy.cn/detail/jobinfo/31;
3、入职腾讯学员告诉你 hadoop 学习方法:http://www.crxy.cn/detail/jobinfo/10;
4、揭秘大专生月薪 6.5k 翻番至 13k:http://www.crxy.cn/detail/jobinfo/8;
5、美女研究生 hadoop 工作经验分享:http://www.crxy.cn/detail/jobinfo/6。
一、来自****提供的面试题 14 道:

2
编者 QQ:10401952
3

3
编者 QQ:10401952

4
编者 QQ:10401952
第一题:1.创建 hadoop 帐户。
2.setup.改 IP。
3.安装 java,并修改/etc/profile 文件,配置 java 的环境变量。
4.修改 Host 文件域名。
5.安装 SSH,配置无密钥通信。
6.解压 hadoop。
7.配置 conf 文件下 hadoop-env.sh、core-site.sh、mapre-site.sh、hdfs-site.sh。
8.配置 hadoop 的环境变量。9.
Hadoop namenode -format 10.S
tart-all
第二题:namenode:管理集群,并记录 datanode 文件信息。
Secondname:可以做冷备,对一定范围内数据做快照性备份。
Datanode:存储数据
Jobtracker :管理任务,并将任务分配给 tasktracker。T
asktracker:任务执行方。
第三题:可能的原因:1.hdfs 没有启动成功,通过查看 jps 确认下。
2.确认文件是否存在。
第四题:hadoop job -list 拿到 job-id ,hadoop job -kill job-id H
adoop fs -rmr /tmp/aaa
加新节点时:
Hadoop-daemon.sh start datanode

5
编者 QQ:10401952
Hadoop-daemon.sh start tasktracker 删
除时:
Hadoop mradmin -refreshnodes Ha
doop dfsadmin -refreshnodes
第五题:
Fifo schedular :默认,先进先出的原则
Capacity schedular :计算能力调度器,选择占用最小、优先级高的先执行,依此类推。F
air schedular:公平调度,所有的 job 具有相同的资源。
第六题:java、python、hive
第七题:wordcount。。。
第 八 题 : 就 用 过 java 和 hiveQL 。Java
写 mapreduce 可以实现复杂的逻辑,如果需求简单,则显得繁琐。
HiveQL 基本都是针对 hive 中的表数据进行编写,但对复杂的逻辑很难进行实现。写
起来简单。
第九题:三种:内存数据库 derby,挺小,不常用 。
本地 mysql。。常用
远程端 mysql。。不常用
上网上找了下专业名称:single user mode..multi user mode...remote user mode 第
十题:在源码中有个例子。。不过我没看。。。
第十一题:貌似好几种来着,像 mapjoin ..reducejon..还有其它的来着吧。。可以去网上查一
下,我常用的就是 mapjoin,可以将小表的数据加载到内存中使用,然后匹配的大表的
剩余55页未读,继续阅读













安全验证
文档复制为VIP权益,开通VIP直接复制

评论1