定义一个能自动实现数据去重,缺失值中位数补充的函数
时间: 2024-05-02 16:21:51 浏览: 49
如何使用 一行代码 搞定一组数据的(极值、平均值、中位数、四分位数、数量统计和标准差)
5星 · 资源好评率100%
以下是一个Python函数,可以自动实现数据去重和缺失值中位数补充:
```python
import numpy as np
def dedup_and_fill(data):
# 去重
data = np.unique(data)
# 中位数填充缺失值
median = np.median(data)
data = np.where(np.isnan(data), median, data)
return data
```
这个函数接受一个numpy数组作为输入,并返回一个处理过的numpy数组。函数先使用np.unique()函数去重,然后使用np.median()函数计算中位数,最后使用np.where()函数将缺失值替换为中位数。
阅读全文