南开大学大数据导论在线作业详解及知识点总结

0 下载量 161 浏览量 更新于2024-08-04 收藏 26KB DOC 举报
南开大学19春学期的《大数据导论》在线作业是一份针对该课程的测验,旨在检验学生对大数据相关概念和技术的理解。这份作业共包含14个选择题,涵盖了云计算服务模式、数据管理、数据处理技术、数据可视化以及医疗健康数据分析等多个知识点。 第1题和第4题考核了云服务模型,IaaS(基础设施即服务)是指提供基础计算资源,如服务器、存储和网络,而PaaS(平台即服务)则提供开发和运行应用程序的平台。正确答案分别为C和B。 第2题测试了大数据产业发展基础,选项D“大数据产业支撑薄弱”表明这不是中国发展大数据的有利条件。 第3题涉及数据分散情况的描述,分布图通常用于展示数据在不同类别或区间内的分布,答案可能是A。 第5题提到Google File System (GFS)中的文件块大小,GFS将文件划分为128MB的块进行存储。 第6题和第8题强调了大数据的特点,其中第6题的答案是A,数据规模大;第8题可能对应折线图,用于展示随时间变化的趋势。 第7题考查存储网络,SAN(Storage Area Network)是一种专为数据存储设计的网络架构。 第9题是关于R语言扩展包的,选项D animation 可用于制作动画,适合这一描述。 第10题列出医疗健康数据类别,公共安全数据不属于个人健康管理数据,所以答案是C。 第11题列出了数据可视化工具的特性,选项D过于绝对,数据可视化通常需要支持多种数据格式。 第12题关于数据仓库,正确的说法是数据仓库随时间增加新内容,不会覆盖旧数据,选项B和C错误。 第13题中,DAS(Direct Attached Storage)指的是直接连接存储,选项D正确。 第14题考察大数据的特点,价值密度低是大数据的一个显著特点,所以答案是B。 通过这份在线作业,学生可以测试自己对大数据概念、技术及其在实际场景中的应用的理解程度,加深对云计算、数据管理、分析和可视化等方面的知识掌握。