2022全国大学生数据分析竞赛:题库与答案解析

8 下载量 38 浏览量 更新于2024-06-23 收藏 20KB DOCX 举报
"2022年全国大学生数据分析科普知识竞赛题库及答案" 这篇文档是2022年全国大学生数据分析科普知识竞赛的题库及答案,主要涵盖了计算机科学特别是数据分析领域的基础概念。以下是根据部分内容解析的一些关键知识点: 1. 数据类型: - 结构化数据:具有明确逻辑关系,如数据库中的表格数据。 - 半结构化数据:介于结构化和非结构化之间,如XML或JSON文件。 - 非结构化数据:没有固定模式,如文本、图片、音频、视频等。 2. 大数据处理: - 大数据能够处理PB级别的海量数据,远超MB和GB。 3. 数据分类: - 传感数据:来自传感器的实时数据,如温度、湿度等。 - 交互数据:用户交互产生的数据,如网页点击、指纹打卡等。 - 交易数据:商业交易记录,如购物订单。 4. 数据库相关: - 关系型数据库的“关系”指的是满足一定条件的二维表格式。 - MySQL适合存储数据库里的财务数据,不适合存储非结构化数据如图片和声音。 - ACID原则包括原子性、一致性、隔离性和持久性,相对性不是其中之一。 - 淘宝的自动化分布式存储系统是Oceanbase,BeansDB是由豆瓣社区开发的。 - NewSQL数据库如MemSQL,不同于NoSQL数据库如Bigtable和Dynamo,而DB2是传统的关系型数据库。 5. 数据挖掘: - 数据挖掘涉及数据预处理、模式发现、知识表示等多个步骤。 - 数据源应真实、大量且可能含有噪声,但发现的知识并非总是绝对的。 - 数据挖掘知识方法包括数学方法、归纳方法等,实验方法通常在科学研究中使用,而不是数据挖掘。 6. 舆情监测: - 舆情监测通常涉及网络监控,但不包括对单位相关法律案件的全面收集和分析,那属于法律信息管理范畴。 这些知识点涵盖了数据类型、大数据、数据库系统、数据挖掘和信息监控等计算机科学的重要领域,对于参赛者或对数据分析感兴趣的大学生来说,是非常有价值的复习资料。