python系统聚类分析代码
时间: 2023-05-04 16:04:58 浏览: 334
Python系统聚类分析代码,可以通过使用scikit-learn的库来实现。
首先,我们需要导入相关的库和数据集。这里我们以Iris数据集为例。
```python
from sklearn import datasets
import pandas as pd
iris = datasets.load_iris()
X = iris.data
df = pd.DataFrame(data=X, columns=iris.feature_names)
```
数据集的特征名称以及每个样本的特征值都存储在数据框df中。
接下来,我们使用scikit-learn中的AgglomerativeClustering()函数来进行系统聚类分析。这里我们设定n_clusters为3,表示我们要将Iris数据集分成3个簇。
```python
from sklearn.cluster import AgglomerativeClustering
agg = AgglomerativeClustering(n_clusters=3)
agg.fit(X)
```
我们可以使用labels_属性来获取每个样本所属的簇号。
```python
labels = agg.labels_
print(labels)
```
最后,我们可以将结果可视化。这里我们仍然选择使用Iris数据集,仅画出前两个特征值的图形。
```python
import matplotlib.pyplot as plt
plt.scatter(X[:,0], X[:,1], c=labels)
plt.xlabel('Sepal length')
plt.ylabel('Sepal width')
plt.show()
```
通过上述代码,我们可以轻松实现Python系统聚类分析,可视化结果也使得我们更好地理解聚类后的数据结构。
阅读全文