p1:1,1; p2:1,2; p3:2,1; p4:2,2; p5:2,3; p6:2,5; p7:3,2; p8:3,3; p9:4,3; p10:5,3; p11:5,5; p12:6,3;取k=2,计算p6,p11的局部邻域密度及相对密度 ,哪个点更可能是离群点(OF2)? (欧式距离)
时间: 2023-06-17 11:03:17 浏览: 51
首先,我们需要计算每个点到其他点的距离:
| | p1 | p2 | p3 | p4 | p5 | p6 | p7 | p8 | p9 | p10 | p11 | p12 |
|---|----|----|----|----|----|----|----|----|----|----|----|----|
| p1 | 0 | 1 | √2 | √5 | √10| √20| √5 | √10| √13| √20| √41| √29|
| p2 | 1 | 0 | 1 | √2 | √5 | √17| √2 | √5 | √10| √17| √40| √26|
| p3 | √2 | 1 | 0 | 1 | √2 | √10| 1 | √2 | √5 | √10| √29| √17|
| p4 | √5 | √2 | 1 | 0 | 1 | √13| √2 | √5 | √10| √13| √34| √20|
| p5 | √10| √5 | √2 | 1 | 0 | √10| √5 | √2 | √5 | 1 | √26| √10|
| p6 | √20| √17| √10| √13| √10| 0 | √13| √10| √5 | 1 | √10| √10|
| p7 | √5 | √2 | 1 | √2 | √5 | √13| 0 | 1 | √2 | √5 | √26| √13|
| p8 | √10| √5 | √2 | √5 | √2 | √10| 1 | 0 | 1 | 2 | √17| √5 |
| p9 | √13| √10| √5 | √10| √5 | √5 | √2 | 1 | 0 | 1 | √10| √5 |
|p10| √20| √17| √10| √13| 1 | √10| √5 | 2 | 1 | 0 | √17| √13|
|p11| √41| √40| √29| √34| √26| √10| √26| √17| √10| √17| 0 | √10|
|p12| √29| √26| √17| √20| √10| √10| √13| √5 | √5 | √13| √10| 0 |
然后,对于每个点,我们需要计算其与其它点的距离是否小于等于给定的 k 值(这里 k=2)。同时,我们还需要计算其邻域内点的个数。
对于 p6:
- 与其它点的距离小于 2 的点有 p2、p3、p4、p5、p6、p7、p8、p9、p10。
- 其邻域内点的个数为 9。
对于 p11:
- 与其它点的距离小于 2 的点有 p5、p10、p11、p12。
- 其邻域内点的个数为 4。
接下来,我们需要计算每个点的相对密度。相对密度的计算方式为:
$$\frac{\text{邻域内点的个数}}{\text{邻域内点到该点的距离的平均值}}$$
对于 p6:
- 邻域内点到该点的距离的平均值为 $\frac{1+1+\sqrt{2}+\sqrt{5}+2+2+\sqrt{5}+2+\sqrt{10}}{9}=1.56$。
- 相对密度为 $\frac{9}{1.56}=5.77$。
对于 p11:
- 邻域内点到该点的距离的平均值为 $\frac{\sqrt{26}+2+\sqrt{10}+\sqrt{10}}{4}=2.47$。
- 相对密度为 $\frac{4}{2.47}=1.62$。
因此,p6 的相对密度更大,更可能是离群点。