python k-means聚类代码
时间: 2023-08-01 22:13:25 浏览: 87
下面是一个使用sklearn库实现KMeans聚类算法的Python代码示例:
```python
from sklearn.cluster import KMeans
import numpy as np
import matplotlib.pyplot as plt
# 生成随机数据集
np.random.seed(0)
X = np.random.randn(100, 2)
# 使用KMeans聚类算法
kmeans = KMeans(n_clusters=3)
kmeans.fit(X)
# 绘制聚类结果
plt.scatter(X[:, 0], X[:, 1], c=kmeans.labels_, cmap='viridis')
plt.scatter(kmeans.cluster_centers_[:, 0], kmeans.cluster_centers_[:, 1], marker='x', s=200, linewidths=3, color='r')
plt.show()
```
该代码首先生成了一个二维的随机数据集X,然后使用KMeans聚类算法将数据集分为3类。最后绘制了聚类结果,其中每个点的颜色表示其所属的类别,红色的x表示每个类别的中心点。
相关问题
k-means聚类python代码
以下是一个简单的k-means聚类的Python代码示例:
```python
import numpy as np
from sklearn.cluster import KMeans
# 生成数据
X = np.array([[1, 2], [1, 4], [1, 0], [4, 2], [4, 4], [4, 0]])
# k-means 聚类
kmeans = KMeans(n_clusters=2, random_state=0).fit(X)
# 聚类结果
print(kmeans.labels_)
```
在这个例子中,我们生成了一个 6x2 的数据集 X,其中每一行代表一个样本点。我们使用 sklearn 库中的 KMeans 类执行聚类,将数据分成两个集群。最后,我们打印出每个样本点所属的类别标签。
请注意,k-means算法会在每次运行时给出不同的结果,因为它的初始化是随机的。因此,我们可以通过设置 random_state 参数来控制随机种子,以便在每次运行时获得相同的结果。
k-means聚类算法代码python
以下是Python中的k-means聚类算法示例代码:
```python
import numpy as np
import matplotlib.pyplot as plt
def kmeans(X, K, max_iters):
centroids = X[np.random.choice(len(X), K, replace=False)]
for i in range(max_iters):
# 计算每个点属于哪个簇
C = np.argmin(np.sqrt(((X - centroids[:, np.newaxis])**2).sum(axis=2)), axis=0)
# 重新计算簇中心点
centroids = np.array([X[C == k].mean(axis=0) for k in range(K)])
return C, centroids
# 生成数据
np.random.seed(42)
X = np.random.randn(50, 2)
# 聚类
C, centroids = kmeans(X, K=3, max_iters=100)
# 可视化
plt.scatter(X[:, 0], X[:, 1], c=C)
plt.scatter(centroids[:, 0], centroids[:, 1], marker='X', s=200, linewidths=3, color='r')
plt.show()
```
说明:
- `X`:需要聚类的数据,每一行代表一个样本;
- `K`:簇的数量;
- `max_iters`:最大迭代次数;
- `centroids`:簇中心点;
- `C`:每个点属于的簇的索引。
阅读全文