(4)自定义一个能够自动实现数据去重、缺失值中位数填补的函数。
时间: 2023-05-27 18:04:23 浏览: 177
自定义函数
以下是一个基于Python的自定义函数,能够实现数据去重和缺失值中位数填补:
```python
def clean_data(data):
# 数据去重
data = data.drop_duplicates()
# 缺失值中位数填补
for col in data.columns:
median = data[col].median()
data[col].fillna(median, inplace=True)
return data
```
该函数接收一个数据集作为参数,首先对数据进行去重处理,然后逐列计算该列的中位数并将缺失值进行中位数填补,最后返回处理后的数据集。可根据实际需求对函数进行进一步修改。
阅读全文