将类别型数据中的缺失值填补为“未知”,将数值型缺失值填补为其对应特生的均值
时间: 2024-03-09 15:47:42 浏览: 90
不完备或缺失数据的补全方法
5星 · 资源好评率100%
可以使用 Pandas 库中的 fillna() 方法来实现这个需求。具体代码如下:
```python
import pandas as pd
df = pd.read_csv('data.csv')
# 将类别型数据中的缺失值填补为“未知”
df.fillna('未知', inplace=True)
# 将数值型缺失值填补为其对应特征的均值
num_cols = df.select_dtypes(include=['float', 'int']).columns.tolist() # 获取数值型特征的列名
for col in num_cols:
mean_val = df[col].mean() # 计算均值
df[col].fillna(mean_val, inplace=True) # 填补缺失值
```
其中,`select_dtypes()` 方法可以选择指定数据类型的特征,这里选择了 float 和 int 类型的特征。然后,对于每个数值型特征,使用 `mean()` 方法计算平均值,并使用 `fillna()` 方法填补缺失值。
阅读全文