用python写一个数据缺失值处理程序
时间: 2023-11-25 22:07:23 浏览: 126
Python数据分析中缺失值处理方法
5星 · 资源好评率100%
好的,以下是一个简单的数据缺失值处理程序的示例代码:
```python
import pandas as pd
import numpy as np
# 读取数据
data = pd.read_csv('data.csv')
# 查看缺失值情况
print('数据缺失值统计:')
print(data.isnull().sum())
# 缺失值处理方法1:删除缺失值所在行
data1 = data.dropna()
# 缺失值处理方法2:用平均值填充缺失值
data2 = data.fillna(data.mean())
# 缺失值处理方法3:用中位数填充缺失值
data3 = data.fillna(data.median())
# 缺失值处理方法4:用众数填充缺失值
data4 = data.fillna(data.mode().iloc[0])
# 缺失值处理方法5:用插值法进行填充
data5 = data.interpolate()
# 输出处理后的数据
print('删除缺失值所在行后的数据:')
print(data1)
print('用平均值填充缺失值后的数据:')
print(data2)
print('用中位数填充缺失值后的数据:')
print(data3)
print('用众数填充缺失值后的数据:')
print(data4)
print('用插值法填充缺失值后的数据:')
print(data5)
```
这个程序可以读取一个名为"data.csv"的数据文件,并使用5种不同的方法来处理数据中的缺失值。这些方法包括:
- 删除缺失值所在行
- 用平均值填充缺失值
- 用中位数填充缺失值
- 用众数填充缺失值
- 用插值法进行填充
程序输出缺失值处理后的数据,以供进一步分析使用。
阅读全文