用数据替换 csv中缺失值 python
时间: 2023-12-23 13:02:51 浏览: 80
在Python中,我们可以使用pandas库来处理CSV文件中的缺失值。pandas是一个强大的数据处理库,它提供了许多方便的函数来处理数据。
以下是一个简单的例子,演示如何使用pandas库来读取CSV文件中的数据,并使用平均值来替换其中的缺失值:
```python
import pandas as pd
# 读取CSV文件并创建一个DataFrame对象
df = pd.read_csv('input.csv')
# 使用平均值来替换缺失值
df = df.fillna(df.mean())
# 将DataFrame对象写入新的CSV文件中
df.to_csv('output.csv', index=False)
```
在上面的代码中,我们使用`pd.read_csv`函数读取了一个名为`input.csv`的CSV文件,并将其存储在一个名为`df`的DataFrame对象中。然后,我们使用`df.fillna`函数将DataFrame对象中的缺失值替换为平均值。最后,我们使用`df.to_csv`函数将DataFrame对象写入了一个名为`output.csv`的新CSV文件中。
需要注意的是,`fillna`函数只能替换缺失值为数值类型的列,如果缺失值为字符串类型的列,可以使用`fillna`函数的`method`参数来指定替换方式,例如:
```python
df['column_name'].fillna(method='ffill', inplace=True)
```
上面的代码将DataFrame对象中名为`column_name`的列中的缺失值使用前向填充法来替换。
阅读全文