"大数据技术高频面试题详解:项目涉及技术、Linux必备知识"

需积分: 5 1 下载量 139 浏览量 更新于2024-03-24 收藏 24.5MB DOCX 举报
操作系统………………………………………………………………………………………………………………………...………...121.2 Hadoop……………………………………………………………………………………………………………………………………..….….131.3 MapReduce…………………………………………………………………………………………………………………………………………141.4 Spark……………………………………………………………………………………………………………………………………………...….151.5 Hive…………………………………………………………………………………………………………………………………………………...161.6 HBase………………………………………………………………………………………………………………………………………………..171.7 Kafka………………………………………………………………………………………………………………………………………………...181.8 Flume………………………………………………………………………………………………………………………………………………...191.9 Sqoop………………………………………………………………………………………………………………………………………………....201.10 Oozie………………………………………………………………………………………………………………………………………………..211.11 ZooKeeper…………………………………………………………………………………………………………………………………………...221.12 ElasticSearch……………………………………………………………………………………………………………………………………….231.13 Storm………………………………………………………………………………………………………………………………………………..241.14 Flink………………………………………………………………………………………………………………………………………………….25第 2 章 基础知识面试题………………………………………………………………………………………………………………………….......….26 2.1 什么是大数据?大数据特点有哪些?.....................................................................................................................26 2.2 什么是数据仓库?它与数据库有什么区别?...........................................................................................................272.3 什么是分布式计算?其优缺点是什么?……………………………………………………………………………………………………………...282.4 什么是并行计算?其作用及优势是什么?…………………………………………………………………………………………………………….292.5 谈谈数据清洗的重要性及方法?……………………………………………………………………………………………………………………….3第 3 章 Linux 操作系统面试题………………………………………………………………………………………………………………...…..303.1 什么是 Linux 操作系统?其优点有哪些?………………………………………………………………………………………………………………303.2 Linux 下如何查看文件内容?………………………………………………………………………………………………………………………...313.3 Linux 中如何查找文件及文件内容?…………………………………………