python 箱型图所有列异常值去除
时间: 2023-09-15 22:20:06 浏览: 90
在 Python 中,可以使用 Pandas 和 Matplotlib 库来绘制箱型图并去除异常值。
首先,使用 Pandas 读取数据并绘制箱型图:
```python
import pandas as pd
import matplotlib.pyplot as plt
data = pd.read_csv('data.csv')
data.boxplot()
plt.show()
```
然后,使用 Pandas 的 `quantile` 函数计算出箱型图的上下限:
```python
Q1 = data.quantile(0.25)
Q3 = data.quantile(0.75)
IQR = Q3 - Q1
upper_limit = Q3 + 1.5 * IQR
lower_limit = Q1 - 1.5 * IQR
```
最后,使用 Pandas 的筛选功能去除异常值:
```python
data = data[(data > lower_limit) & (data < upper_limit)]
```
完整代码如下:
```python
import pandas as pd
import matplotlib.pyplot as plt
data = pd.read_csv('data.csv')
data.boxplot()
plt.show()
Q1 = data.quantile(0.25)
Q3 = data.quantile(0.75)
IQR = Q3 - Q1
upper_limit = Q3 + 1.5 * IQR
lower_limit = Q1 - 1.5 * IQR
data = data[(data > lower_limit) & (data < upper_limit)]
```
阅读全文