深度数据预处理中清洗数据去除异常值python代码示例
时间: 2024-05-08 07:18:53 浏览: 96
以下是一个处理异常值的示例代码:
```python
import pandas as pd
import numpy as np
# 生成一个包含异常值的 DataFrame
data = pd.DataFrame({'col1': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10],
'col2': [10, 9, 8, 7, 6, 5, 4, 3, 2, np.nan]})
# 用中位数替换异常值
median = data['col2'].median()
data['col2'] = np.where(abs(data['col2'] - median) > 3 * data['col2'].std(), median, data['col2'])
# 输出处理后的数据
print(data)
```
这个代码使用中位数来替换所有超出标准差三倍的异常值。
阅读全文