大数据分析与应用期末考试重点整理

DOCX格式 | 36KB | 更新于2024-06-27 | 179 浏览量 | 3 下载量 举报
1 收藏
"大数据分析与应用期末考试涵盖了大数据的基础知识、技术应用以及相关概念的理解。考试涉及大数据技术的起源、数据分析角色、数据价值、数据清洗、数据采集技术、数据重组、智慧城市、大数据特征、舍恩伯格的大数据观点、Hadoop生态系统、数据生命周期管理、网络用户行为、计算机存储容量单位等多方面内容。 1. 大数据技术基础由谷歌首先提出,起源于互联网,其最显著特征是数据规模大。 2. 数据分析角色中,研究科学家负责根据业务需求建立数据模型并决定选取哪种方法。 3. 数据的“颗粒度”反映了数据的精细化程度,细化的数据具有更高的价值。 4. 数据清洗过程不包括重复数据记录处理,主要包括缺失值处理、噪声数据清除和一致性检查。 5. 智能健康手环的应用开发展示了传感器数据采集技术的应用。 6. 数据重组不是数据的重新生产和采集,而是数据的再利用,有助于创新数据模式和发掘新价值。 7. 智慧城市构建包含数字城市、物联网和云计算,但不包含联网监控。 8. 大数据的四个V特征:Volume(大量)、Variety(多样)、Velocity(快速)、Value(价值),其中数据价值密度低是大数据的一个特点。 9. 莫里通过航海日志分析绘制新路线图,体现了从全体数据中找规律而非因果分析的大数据分析理念。 10. 舍恩伯格认为大数据的特点包括大规模、多样性和处理速度,但不强调数据价值密度高。 11. 当前社会中,互联网是最为突出的大数据环境。 12. 数据生命周期管理实践中,数据管理和维护是执行方法,包括数据存储、备份、发现和利用。 这些题目涉及的知识点广泛,从大数据的起源到实际应用,再到数据处理和管理策略,反映出大数据分析与应用课程对学生全面理解大数据技术的要求。考试内容也突出了大数据在各个领域的实际应用,如智慧城市、健康监测和市场营销等。同时,强调了对数据质量和价值的认识,以及数据安全和隐私保护的重要性。

相关推荐