大数据时代:特点、应用与误区解析

版权申诉
0 下载量 194 浏览量 更新于2024-08-20 收藏 51KB DOC 举报
《我们的大数据时代》是一份针对大数据理论与应用的考试题目及答案文档,涵盖了大数据的基本概念、特点、分析方法、信息技术发展历程、智慧城市构建、数据科学中的因果关系理解、数据交易市场以及计算机存储容量等相关知识点。以下是部分试题及其解析: 1. 舍恩伯格对大数据的特点描述中,错误的是数据价值密度高(D)。大数据的特点通常包括数据规模大、类型多样、处理速度快,而价值密度低是大数据的一个特征,意味着在海量数据中找到有价值信息的难度增加。 2. 大数据分析理念强调整体而非抽样(A),注重相关分析而非因果分析(B),追求效率而非绝对精确(C),并且关注相对数据而非绝对数据(D)。 3. 万维网之父是蒂姆·伯纳斯—李(C),他发明了超文本传输协议(HTTP)和超文本标记语言(HTML),使得互联网信息共享成为可能。 4. 普查的缺点在于工作量大、易导致遗漏和重复(A),这限制了其在大规模数据收集中的应用。 5. 聚类挖掘技术是无监督学习方法,不预先设定类别,同类数据内容相似度高,不同类数据相似度低(C),目的是发现数据内在的结构。 6. 智慧城市构建包含了数字城市(A)、物联网(B)和云计算(D),但不包括联网监控(C),联网监控可能是智慧城市的一部分,但不是构成整体智慧城市的全部要素。 7. 大数据起源于互联网(C),随着互联网的快速发展和产生的海量数据,大数据的概念应运而生。 8. 智慧城市的智慧之源是大数据(C),因为大数据提供了决策支持和优化城市管理的必要信息。 9. 基因与行为和健康的关系中,如果一种基因导致抽烟和肺癌,那么这种关系是因果关系(A),而吸烟和肺癌之间通常存在相关关系。 10. 数据交易市场是大数据产业发展的产物(A、D),它促进了商业化数据交易和资源化利用,而并非生产或研发数据(C)。 11. 计算机存储容量单位的基本单位是字节(B),一个汉字需要两个字节的存储空间(C),一个英文字符占用一个字节。 12. 当前大数据技术的基础是由谷歌(C)提出的,如MapReduce和Hadoop等分布式计算模型。 13. 在各国大数据发展策略中,集中体现“重视基础、首都先行”的是(D),虽然没有具体指出是哪个国家,但可以理解为一些国家以首都地区作为大数据技术研发和应用的先驱。 以上内容概述了《我们的大数据时代》考试题目涉及的关键知识点,适合用于教学或个人学习参考。