将数据聚类,并将聚类结果可视化python代码
时间: 2024-12-14 11:01:09 浏览: 63
在Python中,数据聚类是一种无监督学习技术,用于自动将相似的数据分组。K-Means算法是一个常见的例子,它通过迭代计算每个点到各个簇中心的距离并分配给最近的簇来进行聚类。对于聚类结果的可视化,通常我们会使用matplotlib或seaborn库。
下面是一个简单的K-Means聚类加二维散点图可视化的示例:
```python
import numpy as np
import matplotlib.pyplot as plt
from sklearn.cluster import KMeans
# 假设我们有二维数据
data = np.random.rand(100, 2) # 创建随机数据
# 使用KMeans
kmeans = KMeans(n_clusters=3)
kmeans.fit(data)
# 获取聚类标签
labels = kmeans.labels_
# 绘制原始数据和聚类结果
plt.scatter(data[:, 0], data[:, 1], c=labels, cmap='viridis') # 'viridis' 是颜色映射
centers = kmeans.cluster_centers_
plt.scatter(centers[:, 0], centers[:, 1], s=300, c='red', marker='x') # 簇中心标记为红色X
plt.title('K-Means Clustering Result')
plt.xlabel('Feature 1')
plt.ylabel('Feature 2')
plt.show()
```
在这个例子中,我们首先创建了一个二维数组作为输入数据,然后应用了KMeans算法,最后画出每个样本点的聚类颜色以及聚类中心的位置。
阅读全文