2017大数据试题解析与技术概览

版权申诉
0 下载量 91 浏览量 更新于2024-06-25 收藏 397KB PDF 举报
"这份资料是2017年大数据试题及答案的PDF文件,包含了多项选择题目,涵盖了大数据的基础知识、起源、数据分析角色、数据清洗、数据采集技术、数据重组、智慧城市构建以及大数据的特征和应用案例等内容。" 知识点详细说明: 1. 大数据基础:大数据技术的基础由谷歌首先提出,表现为谷歌的三篇技术论文,包括GFS(Google File System)、MapReduce和Bigtable,这些奠定了现代大数据处理的基础。 2. 起源:大数据的起源在于互联网行业,随着互联网的发展,数据量迅速膨胀,催生了大数据的概念。 3. 数据分析角色:数据科学家是根据业务需求建立数据模型并决定分析方法的角色,他们负责从数据中发现有价值的信息。 4. 数据价值:数据的颗粒度反映了数据的精细化程度,颗粒度越细,数据的价值通常越高,因为它能提供更深入的洞察。 5. 数据清洗:数据清洗包括处理缺失值、清除噪声数据、进行一致性检查等步骤,但不包括重复数据记录处理,后者是数据清洗的一个环节,而非排除项。 6. 数据采集技术:智能健康手环应用开发中的数据采集主要依赖于传感器技术,用于实时监测用户的健康状况。 7. 数据重组:数据重组不是重新生产和采集数据,而是对已有数据进行重新组合和利用,以创造新价值,它依赖于多源数据融合和数据集成,并可以促进新颖的数据模式创新。 8. 智慧城市构建:智慧城市包括数字城市、物联网和云计算,但不包含联网监控,尽管监控系统可能是智慧城市的一部分。 9. 大数据特征:大数据的最显著特征是数据规模大,此外还包括数据类型多样、处理速度快和价值密度低。 10. 大数据分析理念:莫里分析航海日志的例子体现了大数据分析更注重相关分析而不是因果分析,即通过找出数据间的关联预测未来趋势。 11. 舍恩伯格的大数据特点:舍恩伯格认为大数据的特点包括大规模、多样性和快速处理,而数据价值密度高是传统数据处理的特点,不是大数据的特点。 12. 当今大数据环境:互联网是目前最突出的大数据环境,产生了海量的用户行为、社交媒体和交易数据。 13. 数据生命周期管理:在实践中,数据存储和备份是确保数据完整性和可用性的重要环节,它涉及到数据的保存、保护和恢复。 以上内容详细解释了试题中的关键知识点,涵盖了大数据的基础、应用、分析方法和管理等多个方面,有助于理解和掌握大数据的基本概念和实践应用。