python中SimpleImputer运用
时间: 2023-06-01 22:02:27 浏览: 167
SimpleImputer是scikit-learn库中的一个类,用于对缺失值进行处理。它的主要作用是用指定的统计量(如平均值、中位数、众数)来填补缺失值。
下面是一个简单的示例:
```python
from sklearn.impute import SimpleImputer
import numpy as np
X = np.array([[1, 2, np.nan], [3, np.nan, 4], [5, 6, 7]])
imputer = SimpleImputer(strategy='mean')
X_imputed = imputer.fit_transform(X)
print(X_imputed)
```
运行结果:
```
[[1. 2. 5.5]
[3. 4. 4. ]
[5. 6. 7. ]]
```
在这个例子中,我们创建了一个包含缺失值的矩阵X,其中np.nan表示缺失值。我们使用SimpleImputer类的mean策略来填充缺失值。因此,缺失值被替换为每列的平均值。最后,我们使用fit_transform方法来执行填充,并将结果存储在X_imputed中。
阅读全文