举一个k均值聚类算法的计算过程实例
时间: 2023-11-25 07:08:03 浏览: 53
假设有以下8个数据点:
```
(2, 10), (2, 5), (8, 4), (5, 8), (7, 5), (6, 4), (1, 2), (4, 9)
```
现在我们要将这8个数据点分为k=3个簇。
首先,我们需要随机选择3个簇中心点。假设我们选择的中心点分别为:
```
(2, 10), (5, 8), (1, 2)
```
接下来,我们将每个数据点分配到离它最近的簇中心点所在的簇。比如:
- (2, 10)离第一个簇中心点最近,因此分配给第一个簇。
- (2, 5)离第三个簇中心点最近,因此分配给第三个簇。
- (8, 4)离第二个簇中心点最近,因此分配给第二个簇。
- (5, 8)离第二个簇中心点最近,因此分配给第二个簇。
- (7, 5)离第二个簇中心点最近,因此分配给第二个簇。
- (6, 4)离第二个簇中心点最近,因此分配给第二个簇。
- (1, 2)离第三个簇中心点最近,因此分配给第三个簇。
- (4, 9)离第二个簇中心点最近,因此分配给第二个簇。
这样,我们得到了3个簇:
```
第一个簇:(2, 10)
第二个簇:(8, 4), (5, 8), (7, 5), (6, 4), (4, 9)
第三个簇:(2, 5), (1, 2)
```
接下来,我们需要重新计算每个簇的中心点。比如:
- 第一个簇的中心点为(2, 10)。
- 第二个簇的中心点为(6, 6).
- 第三个簇的中心点为(1.5, 3.5)。
然后,我们重复上述步骤,直到簇的分配不再改变为止。最终,我们得到了3个簇:
```
第一个簇:(2, 10)
第二个簇:(8, 4), (5, 8), (7, 5), (6, 4), (4, 9)
第三个簇:(2, 5), (1, 2)
```
这就是k均值聚类算法的一个计算过程实例。