Python实现kmeans聚类算法
时间: 2023-06-23 16:57:26 浏览: 63
好的,以下是Python实现kmeans聚类算法的示例代码:
```python
import numpy as np
import random
def kmeans(X, k, max_iterations=100):
# 随机初始化k个中心点
centroids = X[random.sample(range(len(X)), k)]
for i in range(max_iterations):
# 计算每个样本点距离哪个中心点最近
distances = np.linalg.norm(X[:, None, :] - centroids, axis=2)
labels = np.argmin(distances, axis=1)
# 更新中心点为各个簇的平均值
for j in range(k):
centroids[j] = np.mean(X[labels == j], axis=0)
return labels, centroids
```
其中,X是样本数据,k是簇的数量,max_iterations是最大迭代次数。函数返回每个样本点所属的簇的标签和最终的中心点坐标。
相关问题
用python实现kmeans聚类算法
KMeans是一种基于距离计算的聚类算法。在Python中,可以使用Scikit-learn库来实现KMeans。以下是一个简单的KMeans聚类算法的示例代码:
```python
from sklearn.cluster import KMeans
import numpy as np
# 创建样本数据
X = np.array([[1, 2], [1, 4], [1, 0],
[4, 2], [4, 4], [4, 0]])
# 创建KMeans模型对象
kmeans = KMeans(n_clusters=2)
# 拟合样本数据
kmeans.fit(X)
# 打印聚类中心
print(kmeans.cluster_centers_)
# 打印聚类结果
print(kmeans.labels_)
```
在这个示例中,首先我们创建样本数据,然后创建一个KMeans模型对象,指定要聚类的簇数。接着使用拟合方法将样本数据拟合到模型中,随后通过访问 cluster_centers_ 和 labels_ 属性来获得聚类中心和聚类结果。
基于python实现kmeans聚类算法
K-means聚类算法是一种常用的无监督学习算法,可以用于将数据集划分为预先确定的K个簇。对于Python实现K-means聚类算法,可以使用scikit-learn(简称sklearn)库中的KMeans类。下面是一个示例代码:
```python
from sklearn.cluster import KMeans
import numpy as np
# 准备输入数据
X = np.array([[1, 2], [1, 4], [1, 0], [10, 2], [10, 4], [10, 0]])
# 初始化KMeans模型并进行聚类
kmeans = KMeans(n_clusters=2, random_state=0).fit(X)
# 获取每个点所属的簇
labels = kmeans.labels_
print("每个点所属的簇:", labels)
# 预测新的数据属于哪个簇
new_data = np.array([[0, 0], [12, 3]])
predictions = kmeans.predict(new_data)
print("预测结果:", predictions)
# 获取每个簇的中心点
centers = kmeans.cluster_centers_
print("每个簇的中心点:", centers)
```