首页深度数据预处理中清洗数据去除异常值python代码示例

深度数据预处理中清洗数据去除异常值python代码示例

时间: 2024-05-08 07:18:53 浏览: 96

以下是一个处理异常值的示例代码： ```python import pandas as pd import numpy as np # 生成一个包含异常值的 DataFrame data = pd.DataFrame({'col1': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10], 'col2': [10, 9, 8, 7, 6, 5, 4, 3, 2, np.nan]}) # 用中位数替换异常值 median = data['col2'].median() data['col2'] = np.where(abs(data['col2'] - median) > 3 * data['col2'].std(), median, data['col2']) # 输出处理后的数据 print(data) ``` 这个代码使用中位数来替换所有超出标准差三倍的异常值。

阅读全文