系统聚类分析实例python
时间: 2024-09-17 19:09:08 浏览: 99
系统聚类分析是一种无监督学习技术,它用于将数据集中的对象分组成相似的组,也就是我们通常所说的“簇”。Python中有许多库可以实现这个过程,比如scikit-learn就是其中一个常用的选择。
一个简单的系统聚类分析实例,我们可以使用K-means算法,步骤如下:
1. 导入必要的库:
```python
import numpy as np
from sklearn.cluster import KMeans
import matplotlib.pyplot as plt
```
2. 准备示例数据,比如二维的鸢尾花数据集(Iris dataset):
```python
from sklearn.datasets import load_iris
data = load_iris().data
```
3. 创建KMeans模型并指定簇的数量:
```python
kmeans = KMeans(n_clusters=3)
```
4. 拟合数据:
```python
kmeans.fit(data)
```
5. 获取簇标签和中心点:
```python
labels = kmeans.labels_
centroids = kmeans.cluster_centers_
```
6. 可视化结果:
```python
plt.scatter(data[:, 0], data[:, 1], c=labels, cmap='viridis')
plt.scatter(centroids[:, 0], centroids[:, 1], s=300, c='red', alpha=0.5)
plt.xlabel('Feature 1')
plt.ylabel('Feature 2')
plt.show()
```
在这个例子中,我们根据两个特征对鸢尾花进行了聚类,并通过散点图展示了结果。
阅读全文