Python数据挖掘选择题
时间: 2025-01-04 17:36:04 浏览: 8
### Python 数据挖掘选择题练习
#### 题目一
下列哪一项不是Python中常用的数据结构?
- A. 列表 (List)
- B. 字典 (Dictionary)
- C. 向量 (Vector)
- D. 元组 (Tuple)
正确答案是C. 向量 (Vector),因为虽然NumPy库中的ndarray可以被视作一种向量形式,但在标准Python语言层面,“向量”并不是内置的一种独立数据类型[^1]。
```python
import numpy as np
vector_example = np.array([1, 2, 3]) # 使用numpy创建一个类似于向量的对象
```
#### 题目二
在进行数据预处理时,哪种方法用于填补缺失值最常见?
- A. 删除含有缺失值的记录
- B. 填充平均数/众数/中位数
- C. 插入随机数值
- D. 不做任何处理
正确选项为B. 填充平均数/众数/中位数,在实际应用中这是非常普遍的做法之一,尤其是在保持原始数据分布特征的情况下[^2]。
#### 题目三
下面哪个算法不属于监督学习范畴?
- C. 主成分分析(PCA)
- D. 决策树
正确答案是C. 主成分分析(PCA), 这是一种无监督降维技术而不是监督学习的一部分。
#### 题目四
对于大规模稀疏矩阵的操作,通常会采用什么类型的存储格式来节省内存空间并提高计算效率?
- A. 密集型矩阵(Dense Matrix)
- B. CSR/CSC压缩格式(CSR/CSC Format)
- C. 对角线矩阵(Diagonal Matrix)
- D. 上三角形矩阵(Upper Triangular Matrix)
正确答案应选B. CSR/CSC压缩格式(CSR/CSC Format)[^3]。
阅读全文