k均值聚类算法python
时间: 2023-06-29 19:20:31 浏览: 100
好的,我可以为您提供关于k均值聚类算法的Python实现。
首先,您需要导入必要的库和数据集。这里我们使用sklearn库中的make_blobs方法生成一个随机数据集。
```python
from sklearn.datasets import make_blobs
import matplotlib.pyplot as plt
# 生成随机数据集
X, _ = make_blobs(n_samples=200, centers=4, random_state=42)
plt.scatter(X[:, 0], X[:, 1])
plt.show()
```
接下来,我们可以定义k均值聚类算法的函数。
```python
import numpy as np
def kmeans(X, k, max_iters=100):
# 随机初始化k个中心点
centroids = X[np.random.choice(len(X), k, replace=False)]
for i in range(max_iters):
# 计算每个样本到每个中心点的距离
distances = np.sqrt(((X - centroids[:, np.newaxis])**2).sum(axis=2))
# 根据最小距离的中心点聚类
labels = np.argmin(distances, axis=0)
# 更新中心点
for j in range(k):
centroids[j] = X[labels == j].mean(axis=0)
return centroids, labels
```
最后,我们可以调用这个函数并绘制聚类结果。
```python
centroids, labels = kmeans(X, k=4)
plt.scatter(X[:, 0], X[:, 1], c=labels)
plt.scatter(centroids[:, 0], centroids[:, 1], marker='x', s=200, linewidths=3, color='r')
plt.show()
```
这里的k值为4,可以根据实际情况进行调整。运行代码后,您将看到一个带有红色叉的散点图,表示聚类中心点,以及四个不同颜色的散点,表示四个不同的聚类。
阅读全文
相关推荐
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![zip](https://img-home.csdnimg.cn/images/20241231045053.png)
![zip](https://img-home.csdnimg.cn/images/20241231045053.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![docx](https://img-home.csdnimg.cn/images/20241231044901.png)
![pdf](https://img-home.csdnimg.cn/images/20241231044930.png)
![-](https://img-home.csdnimg.cn/images/20241231045053.png)
![-](https://img-home.csdnimg.cn/images/20241226111658.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)