python的SimpleImputer怎样使用
时间: 2024-05-09 13:17:13 浏览: 160
python相关资料sklearn中文版
5星 · 资源好评率100%
SimpleImputer是sklearn库中一个用于填充缺失值的方法,可以通过以下步骤来使用:
1. 导入库和数据:
``` python
from sklearn.impute import SimpleImputer
import pandas as pd
df = pd.read_csv('data.csv')
```
2. 实例化SimpleImputer对象并设置参数:
``` python
imputer = SimpleImputer(strategy='mean')
```
参数strategy有四种可能的值:
- mean:用列均值填充缺失值
- median:用列中位数填充缺失值
- most_frequent:用列中出现最频繁的值填充缺失值
- constant:用指定常数填充缺失值
例如:
``` python
imputer = SimpleImputer(strategy='most_frequent', fill_value=-999)
```
3. 使用fit_transform()方法填充缺失值:
``` python
df_filled = imputer.fit_transform(df)
```
4. 将填充后的数组转换为DataFrame对象:
``` python
df_filled = pd.DataFrame(df_filled, columns=df.columns)
```
这样就完成了填充缺失值的操作。
阅读全文