模式识别聚类分析代码
时间: 2024-07-16 18:01:10 浏览: 127
模式识别聚类分析
模式识别聚类分析是一种数据挖掘技术,用于将一组数据分成不同的组或类别,每个类别内的数据相似度较高,而不同类别的数据差异较大。常见的聚类算法有K-means、层次聚类(如凝聚层次聚类和分裂层次聚类)、DBSCAN等。
下面是一个简单的Python示例,使用K-means算法进行聚类分析:
```python
from sklearn.cluster import KMeans
import numpy as np
# 假设我们有一个二维的数据集
data = np.array([[1, 2], [1.5, 1.8], [5, 8], [8, 8], [1, 0.6], [9, 11]])
# 创建KMeans模型,设定簇的数量为3
kmeans = KMeans(n_clusters=3)
# 训练模型
kmeans.fit(data)
# 获取聚类结果
labels = kmeans.labels_
# 输出每个样本所属的簇
for i in range(len(data)):
print(f"Sample {i}: Cluster {labels[i]}")
# 可视化聚类结果
plt.scatter(data[:, 0], data[:, 1], c=labels)
```
在这个例子中,`fit`函数训练模型,`labels_`变量包含了每个样本的聚类标签。然后可以根据标签对数据进行分组处理。
阅读全文