用python不使用函数实现K均值聚类
时间: 2024-02-04 20:45:15 浏览: 21
可以使用以下代码实现K均值聚类:
```python
import numpy as np
# 生成数据
X = np.random.randn(100, 2)
# 初始化聚类中心
k = 3
centers = X[:k, :]
# 迭代聚类
for i in range(10):
# 分配数据点到最近的聚类中心
labels = np.argmin(np.sum((X[:, np.newaxis, :] - centers) ** 2, axis=2), axis=1)
# 更新聚类中心
for j in range(k):
centers[j] = np.mean(X[labels == j], axis=0)
# 打印聚类结果
print(labels)
```
其中,`X`是输入数据,`k`是聚类中心的数量,`centers`是初始化的聚类中心。代码中使用循环迭代聚类,每次循环中先将数据点分配到最近的聚类中心,然后更新聚类中心。最后打印出聚类结果。
相关问题
使用python实现k均值聚类
以下是使用Python实现k均值聚类的示例代码:
```python
import numpy as np
import matplotlib.pyplot as plt
# 生成数据集
np.random.seed(123)
X = np.random.randn(50, 2)
# 定义k均值聚类算法
def k_means(X, k, max_iters=100):
# 随机选择k个聚类中心
centroids = X[np.random.choice(X.shape[0], k, replace=False)]
for i in range(max_iters):
# 计算每个样本到聚类中心的距离
distances = np.sqrt(((X - centroids[:, np.newaxis])**2).sum(axis=2))
# 分配样本到最近的聚类中心
labels = np.argmin(distances, axis=0)
# 更新聚类中心
new_centroids = np.array([X[labels == j].mean(axis=0) for j in range(k)])
# 如果聚类中心不再变化,则停止迭代
if np.allclose(centroids, new_centroids):
break
centroids = new_centroids
return centroids, labels
# 聚类并可视化结果
centroids, labels = k_means(X, k=3)
plt.scatter(X[:, 0], X[:, 1], c=labels)
plt.scatter(centroids[:, 0], centroids[:, 1], marker='x', s=200, linewidths=3, color='r')
plt.show()
```
在本例中,我们使用numpy和matplotlib库生成和可视化数据集。然后,我们定义了一个k_means函数来实现k均值聚类算法。在函数中,我们首先随机选择k个聚类中心,然后在循环中进行以下步骤:
1. 计算每个样本到聚类中心的距离;
2. 分配样本到最近的聚类中心;
3. 更新聚类中心。
在每次循环后,我们检查聚类中心是否发生变化。如果聚类中心不再变化,则停止迭代。
最后,我们调用k_means函数并使用matplotlib库可视化聚类结果。
使用Python中的scikit-learn库来实现k均值聚类模型
好的,下面是一个完整的Python代码示例,使用scikit-learn库来实现k均值聚类模型:
```python
from sklearn.cluster import KMeans
from sklearn.datasets import make_blobs
import matplotlib.pyplot as plt
# 创建一个模拟数据集
X, y = make_blobs(n_samples=300, centers=4, cluster_std=0.60, random_state=0)
# 创建k均值聚类模型
kmeans = KMeans(n_clusters=4)
# 拟合模型
kmeans.fit(X)
# 预测每个样本所属的簇
y_kmeans = kmeans.predict(X)
# 绘制聚类结果
plt.scatter(X[:, 0], X[:, 1], c=y_kmeans, s=50, cmap='viridis')
centers = kmeans.cluster_centers_
plt.scatter(centers[:, 0], centers[:, 1], c='black', s=200, alpha=0.5)
plt.show()
```
这个代码示例创建了一个模拟数据集,并使用KMeans类创建了一个k均值聚类模型。然后,模型被拟合到数据集上,并使用predict()函数预测每个样本所属的簇。最后,使用matplotlib库绘制了聚类结果。
你可以根据需要对代码进行修改,例如改变数据集或者调整模型参数。希望能对你有所帮助!