写出层次聚类后每个簇样本数的柱状图代码
时间: 2024-05-10 19:18:13 浏览: 115
下面是使用Python的scikit-learn库进行层次聚类并绘制每个簇样本数柱状图的示例代码:
```python
import numpy as np
import matplotlib.pyplot as plt
from sklearn.cluster import AgglomerativeClustering
# 生成随机数据集
X = np.random.rand(100, 2)
# 进行层次聚类
clustering = AgglomerativeClustering(n_clusters=None, distance_threshold=0.5).fit(X)
# 获取每个样本所属的簇的标签
labels = clustering.labels_
# 统计每个簇的样本数
unique_labels, counts = np.unique(labels, return_counts=True)
# 绘制柱状图
plt.bar(unique_labels, counts)
plt.xlabel('Cluster Label')
plt.ylabel('Number of Samples')
plt.show()
```
这个示例代码中,我们首先生成了一个包含100个样本的二维随机数据集,然后使用`AgglomerativeClustering`类进行层次聚类。这里我们设置`n_clusters=None`,表示不限定簇的数量,而是使用`distance_threshold`参数来指定合并簇的最大距离。聚类完成后,我们使用`labels_`属性获取每个样本所属的簇的标签,然后使用`np.unique`函数统计每个簇的样本数,并绘制柱状图。
注意,由于层次聚类的簇数量不固定,因此每个簇的标签可能是任意非负整数,因此我们需要使用`np.unique`函数将标签去重后才能统计每个簇的样本数。
阅读全文