完成K-means算法的代码实现(同时提交源代码)及数据(至少测试5个数据集,数据集来源建议采用UCI数据集)测试结果
时间: 2024-12-10 18:38:46 浏览: 23
算法的python实现代码、测试数据集及结果
完成K-means聚类算法的代码实现通常涉及到选择一种编程语言,比如Python,因为它有许多强大的库如scikit-learn方便地支持机器学习。以下是使用Python和scikit-iris数据集的一个简化示例:
```python
from sklearn.cluster import KMeans
import pandas as pd
from sklearn.datasets import load_iris
# 加载数据集
data = load_iris()
X = data.data
y = data.target
# 初始化KMeans模型
kmeans = KMeans(n_clusters=3) # 我们知道 iris 数据集有3个类别
# 训练模型
kmeans.fit(X)
# 预测簇标签
labels = kmeans.labels_
# 打印预测结果
print("Cluster labels for each observation:")
print(labels)
# 测试其他数据集,例如使用digits数据集
from sklearn.datasets import load_digits
digits_data = load_digits()
digits_X = digits_data.data
digits_kmeans = KMeans(n_clusters=10) # digits有10个数字类别
digits_kmeans.fit(digits_X)
digits_labels = digits_kmeans.labels_
# 对于更多的数据集,可以类似地加载和运行KMeans。
阅读全文