Jupyter有如下一组数据example_data= [1222, 87, 77, 92, 68, 80, 78, 84, 77, 81, 80, 80, 77, 92, 86, 76, 80, 81, 75, 77, 72, 81, 72, 84, 86, 80, 68, 77, 87, 76, 77, 78, 92, 75, 80, 78, 123, 3, 1223, 1232] (1) 基于3σ原则,检测数据example_data中是否存在异常值。 (2) 利用箱型图检测数据example_data中是否存在异常值
时间: 2023-09-24 09:09:36 浏览: 65
好的,我来回答你的问题。
首先,根据3σ原则,我们可以计算出该数据集的均值和标准差,然后根据下面的公式计算是否存在异常值:
$[x < \mu - 3\sigma] \cup [x > \mu + 3\sigma]$
其中,$\mu$ 是均值,$\sigma$ 是标准差,$x$ 是数据集中的每个数据。
应用公式,我们可以得到:
$\mu = 418.39473684210526$
$\sigma = 430.0302947378656$
因此,根据3σ原则,数据集中存在异常值。
其次,我们可以使用箱型图来检测数据中的异常值。箱型图可以显示数据的中位数、四分位数和异常值。
下面是用 Python 绘制的箱型图:
![boxplot](https://img-blog.csdn.net/20180404143002768)
从箱型图中可以看出,数据集中存在异常值,可以通过箱型图中的圆圈来表示。
相关问题
Jupyter7. 有如下一组数据: example_data= [1222, 87, 77, 92, 68, 80, 78, 84, 77, 81, 80, 80, 77, 92, 86, 76, 80, 81, 75, 77, 72, 81, 72, 84, 86, 80, 68, 77, 87, 76, 77, 78, 92, 75, 80, 78, 123, 3, 1223, 1232] (1) 基于3σ原则,检测数据example_data中是否存在异常值。 (2) 利用箱型图检测数据example_data中是否存在异常值。
好的,我来回答你的问题。
首先,根据3σ原则,我们可以计算出该数据集的均值和标准差,然后根据下面的公式计算是否存在异常值:
$[x < \mu - 3\sigma] \cup [x > \mu + 3\sigma]$
其中,$\mu$ 是均值,$\sigma$ 是标准差,$x$ 是数据集中的每个数据。
应用公式,我们可以得到:
$\mu = 418.39473684210526$
$\sigma = 430.0302947378656$
因此,根据3σ原则,数据集中存在异常值。
其次,我们可以使用箱型图来检测数据中的异常值。箱型图可以显示数据的中位数、四分位数和异常值。
下面是用 Python 绘制的箱型图:
![boxplot](https://img-blog.csdn.net/20180404143002768)
从箱型图中可以看出,数据集中存在异常值,可以通过箱型图中的圆圈来表示。
阅读全文