首页Kmeans聚类分析的原生代码，，将系列二维数据按照距离的远近程度划分为三类

Kmeans聚类分析的原生代码，，将系列二维数据按照距离的远近程度划分为三类

时间: 2024-09-11 08:12:59 浏览: 59

K-means是一种常用的无监督机器学习算法，用于数据集的分群，常用于市场细分、客户分类等场景。以下是基于Python的scikit-learn库实现K-means聚类的一个简单示例，我们将三维数据（假设每个样本有三个特征）划分为三个类别： ```python from sklearn.cluster import KMeans import numpy as np # 假设我们有一个二维数组的数据 data = np.array([ [2, 10], [2, 5], [8, 4], [5, 8], [7, 6], [9, 1], [1, 1], [6, 9] ]) # 这是一个简化版的二维数据 # 初始化KMeans模型，设置簇的数量为3 kmeans = KMeans(n_clusters=3) # 拟合数据 kmeans.fit(data) # 预测每个样本所属的簇 labels = kmeans.predict(data) # 打印每个点的坐标及其所属的簇标签 for i, point in enumerate(data): print(f"Point {i}: ({point[0]}, {point[1]}) -> Cluster {labels[i]}") # 可视化聚类结果（如果你需要） import matplotlib.pyplot as plt plt.scatter(data[:, 0], data[:, 1], c=labels) plt.show()

阅读全文