Kmeans聚类分析的原生代码,,将系列二维数据按照距离的远近程度划分为三类
时间: 2024-09-11 08:12:59 浏览: 59
K-means是一种常用的无监督机器学习算法,用于数据集的分群,常用于市场细分、客户分类等场景。以下是基于Python的scikit-learn库实现K-means聚类的一个简单示例,我们将三维数据(假设每个样本有三个特征)划分为三个类别:
```python
from sklearn.cluster import KMeans
import numpy as np
# 假设我们有一个二维数组的数据
data = np.array([
[2, 10], [2, 5], [8, 4], [5, 8],
[7, 6], [9, 1], [1, 1], [6, 9]
]) # 这是一个简化版的二维数据
# 初始化KMeans模型,设置簇的数量为3
kmeans = KMeans(n_clusters=3)
# 拟合数据
kmeans.fit(data)
# 预测每个样本所属的簇
labels = kmeans.predict(data)
# 打印每个点的坐标及其所属的簇标签
for i, point in enumerate(data):
print(f"Point {i}: ({point[0]}, {point[1]}) -> Cluster {labels[i]}")
# 可视化聚类结果(如果你需要)
import matplotlib.pyplot as plt
plt.scatter(data[:, 0], data[:, 1], c=labels)
plt.show()
阅读全文
相关推荐












