中南民族大学大数据期末复习要点:4V特性,关键技术与云计算解析

需积分: 0 16 下载量 50 浏览量 更新于2024-06-25 2 收藏 2.61MB DOCX 举报
"这是一份中南民族大学大数据技术原理与应用课程的期末复习资料,包含重要的知识点概览,参考了相关网课和文献。资料中特别标记了课后习题涉及的内容,强调了大数据的4V特性,关键技术和计算模式,并简述了大数据产业的层次结构以及云计算的相关概念。" 在大数据领域,"三次信息化浪潮"是指个人计算机时代(侧重信息处理)、互联网时代(侧重信息传输)以及当前的大数据物联网时代(导致信息爆炸)。数据作为信息的基础,其量(Volume)、种类(Variety)、速度(Velocity)和价值(Value,即4V特性)是大数据的核心特征。数据类型包括结构化和非结构化数据,如关系数据库、日志、图像、音频等。 大数据的影响体现在思维方式的变化,如全样本分析而非抽样、追求效率而非绝对精确、关注相关性而非因果关系。关键技术涉及数据采集与预处理、数据存储和管理(如分布式数据库如BigTable和分布式文件系统如GFS)、数据处理与分析(如MapReduce和Spark)、以及数据安全与隐私保护。 计算模式涵盖批处理计算(如MapReduce和Spark)、流计算(Flink、Puma)、图计算(Pregel)以及查询分析计算(如Hive、Dremel)。大数据产业的结构包括基础设施层、数据源层、数据管理层(如HDFS、GFS、Hadoop、MySQL)、数据分析层(MapReduce、数据挖掘工具Weka等)、以及数据应用层(如智能物流、智慧交通等)。 此外,资料也提及了云计算,它无需自建IT基础设施,提供廉价且可伸缩的服务。云计算分为公有云、混合云和私有云,服务模式包括IaaS(基础设施即服务)、PaaS(平台即服务)和SaaS(软件即服务),分别面向不同的用户群体和服务场景。 这份资料是期末复习的理想资源,特别标记的重点和链接的视频资料有助于学生更有效地理解和掌握大数据的关键概念和技术。