大数据知识复习:从基础到实践

版权申诉
5星 · 超过95%的资源 1 下载量 191 浏览量 更新于2024-07-17 收藏 25KB PDF 举报
该资源是一份关于大数据复习的完整版试题及答案,涵盖了大数据的基础概念、特点、技术应用以及相关的数据分析理念。 1. 大数据的起源:大数据起源于互联网行业,随着互联网的快速发展,数据量急剧增长,催生了大数据这一概念。(B) 2. 大数据的特点:大数据的最显著特征是数据规模大,其次是数据类型多样、数据处理速度快以及数据价值密度低。(B) 3. 数据使用的关键:在大数据时代,数据的再利用成为最关键的因素,通过数据分析和挖掘,可以发掘数据的潜在价值。(D) 4. 云计算分层架构:IaaS(基础设施即服务)、PaaS(平台即服务)、SaaS(软件即服务)是云计算的三层架构,不包括Yaas。(D) 5. 大数据技术起源:大数据技术最初由谷歌公司提出,包括分布式计算框架如MapReduce等。(C) 6. 数据精细化程度:数据的精细化程度指的是数据的颗粒度,颗粒度越细,数据的价值通常越高。(C) 7. 数据清洗方法:数据清洗涉及噪声数据清除、一致性检查、缺失值处理等,不包括重复数据记录处理,因为重复数据通常是需要保留的。(C) 8. 智能手环应用开发:智能手环利用传感器采集用户健康数据,体现了传感器数据采集技术的应用。(C) 9. 数据重组:数据重组是指对已有数据进行重新整合,不是重新生产和采集,它能创造新的数据价值并促进创新。(A) 10. 莫里航海路线图:这例子体现了大数据分析中更注重相关分析,通过历史数据找出模式,而不是寻求因果关系。(B) 11. 维思伯格大数据特点:维思伯格提出的四大特点包括数据规模大、类型多、处理速度快和价值密度低,所以“价值密度高”是错误的。(D) 12. 当今最突出的大数据环境:互联网是目前大数据应用最广泛和突出的领域,包括社交媒体、电子商务等。(A) 13. 数据生命周期管理实践:数据管理和维护是执行方法,包括数据的存储、备份、清理和更新等。(B) 14. 网络用户行为:用户的数字轨迹通常会被网络公司捕获并用于分析,这可能导致用户隐私难以得到充分保护。(C) 15. 聚类挖掘技术:聚类挖掘是一种无监督学习方法,不预设分类,但错误的说法是它要求同类数据数量相同,实际上同类数据数量可以不同。(B) 这份复习题涵盖了大数据的基础知识,从起源、特点到应用和分析理念,对于理解大数据的概念和技术发展具有很好的指导意义。同时,它也提醒我们在大数据时代,数据的收集、清洗、管理和分析的重要性,以及隐私保护等问题。