sklearn层次聚类
时间: 2023-09-04 15:11:17 浏览: 78
sklearn的层次聚类是通过AgglomerativeClustering这个类来实现的。在这个类中,可以通过设置参数来控制层次聚类的具体行为。这个类提供了以下参数:n_clusters表示要聚类的簇的数量,默认为2;affinity表示距离度量的方法,默认为"euclidean";linkage表示连接方式,默认为"ward";distance_threshold表示聚类停止的距离阈值,默认为None。
下面是一个使用sklearn进行层次聚类的示例代码:
```python
from sklearn.cluster import AgglomerativeClustering
import numpy as np
# 创建数据集
data = np.array([[1, 2], [2, 3], [-3, 3], [-2, -1], [5, -1]])
# 训练模型
ac = AgglomerativeClustering(n_clusters=3, affinity='euclidean', linkage='average')
clustering = ac.fit(data)
# 输出结果
print("每个数据所属的簇编号", clustering.labels_)
print("每个簇的成员", clustering.children_)
```
这段代码中,先创建了一个数据集data,然后通过AgglomerativeClustering类创建了一个层次聚类模型ac,设置了簇的数量为3,距离度量的方法为euclidean,连接方式为average。然后使用fit方法对数据进行训练,最后输出每个数据点所属的簇编号和每个簇的成员信息。
希望这个解答能够帮到你!如果有任何问题,请随时提问。<span class="em">1</span><span class="em">2</span><span class="em">3</span>
#### 引用[.reference_title]
- *1* *2* *3* [机器学习 — python(sklearn / scipy) 实现层次聚类,precomputed自定义距离矩阵](https://blog.csdn.net/pentiumCM/article/details/105695414)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 100%"]
[ .reference_list ]