python填充缺失值titanic
时间: 2023-10-01 18:10:18 浏览: 73
python数据清洗
5星 · 资源好评率100%
在Python中,可以使用pandas库来填充缺失值。假设我们有一个名为titanic的数据集,我们可以使用以下代码来填充缺失值:
```python
import pandas as pd
# 读取数据集
titanic = pd.read_csv('titanic.csv')
# 检查缺失值
print(titanic.isnull().sum())
# 填充缺失值
titanic['Age'].fillna(titanic['Age'].mean(), inplace=True)
titanic['Embarked'].fillna(titanic['Embarked'].mode()[0], inplace=True)
# 再次检查缺失值
print(titanic.isnull().sum())
```
在这个例子中,我们假设titanic数据集中有两个列存在缺失值:Age和Embarked。对于Age列,我们使用平均值来填充缺失值;对于Embarked列,我们使用众数来填充缺失值。最后,我们再次检查数据集中是否还有缺失值。
阅读全文