厦门大学大数据技术详解:Hadoop到Google Dremel

5星 · 超过95%的资源 需积分: 0 116 下载量 195 浏览量 更新于2024-07-23 2 收藏 6.07MB PDF 举报
《大数据技术基础》是一本由厦门大学计算机科学系教师林子雨编著的系统性教程,旨在为计算机专业的研究生提供对大数据技术的深入理解。该教程涵盖了大数据技术的广泛领域,包括但不限于: 1. 大数据概述:第1章简要介绍大数据的基本概念、特征和处理的挑战,帮助学生建立起对大数据的整体认识。 2. 关键技术与挑战:第2章深入探讨大数据处理的关键技术,如分布式计算、数据存储和管理,以及如何应对数据规模、多样性和高速度带来的技术难题。 3. Hadoop生态系统:第3至7章分别介绍Hadoop框架的核心组件——Hadoop MapReduce,分布式文件系统HDFS,以及Zookeeper、HBase这些关键服务,它们构成了大数据处理的基础架构。 4. 流计算与图计算:第8章介绍实时数据处理的流计算技术,而第9章则讲解图计算在大数据分析中的应用,展示数据复杂关系的处理方法。 5. NoSQL数据库:在第10章,作者详细讲解了非关系型数据库(NoSQL)的原理和在大数据环境下的优势,适应不断增长的数据规模和灵活性需求。 6. 云数据库与Google产品:第11章和第12章特别关注云数据库,如Google Spanner的分布式事务管理和Google Dremel的列式存储查询优化器,这些都是大数据存储和查询的重要工具。 7. 作者贡献与协作:教程由林子雨老师主导,其他研究生如蔡珉星、李雨倩和叶林宝等人也积极参与编写和资料支持,体现了团队合作的重要性。 8. 版权与使用:教程强调学术交流性质,所有内容大部分源于网络和书籍,部分内容由作者原创,版权归属林子雨老师。读者可以在http://dblab.xmu.edu.cn/node/422 下载PDF文档和教学PPT,但需注意仅限于学术用途。 9. 教学应用与反馈:本教程已应用于厦门大学计算机科学系的研究生课程,并设有专门的网站http://dblab.xmu.edu.cn/node/423,鼓励读者提出宝贵的意见和建议。 通过《大数据技术基础》,学生不仅能掌握大数据技术的基本理论,还能了解到最新的实践应用和未来发展趋势。林子雨老师的联系方式为ziyulin@xmu.edu.cn,以便于进一步交流和咨询。