知道行政面积、户籍人口、常住人口、gdp怎么求异常值
时间: 2023-09-30 07:11:47 浏览: 38
对于行政面积、户籍人口、常住人口、gdp等连续型变量,我们可以使用箱线图(boxplot)来判断是否存在异常值。
箱线图中,箱子的上边缘为上四分位数(Q3),下边缘为下四分位数(Q1),箱子的中位数为中位数(Q2),箱子的长度为四分位距(IQR=Q3-Q1)。箱子外的点即为异常值,异常值的计算方法为:
- 上限:Q3+1.5×IQR
- 下限:Q1-1.5×IQR
如果某个数据点小于下限或大于上限,则该点为异常值。
以求行政面积为例,假设有以下7个城市的行政面积数据(单位:平方公里):
{1000, 2000, 3000, 4000, 5000, 6000, 10000}
首先,我们需要计算出Q1、Q2、Q3和IQR,如下所示:
Q1=2000,Q2=4000,Q3=6000,IQR=Q3-Q1=4000
然后,我们可以根据上述公式计算出上限和下限:
上限=Q3+1.5×IQR=6000+1.5×4000=12000
下限=Q1-1.5×IQR=2000-1.5×4000=-4000
由于下限小于0,不符合实际情况,因此我们只考虑上限。最后,我们可以用箱线图来表示数据分布情况,如下所示:
```
| +--------+
| | |
| | |
| | |
| | |
| +--+--------+--+
| | | | |
| | | | |
|--------+--+--------+--|
Q1 Q2 Q3
```
在这个例子中,由于最后一个城市的行政面积为10000,大于上限12000,因此该城市的行政面积被认为是异常值。