系统聚类法Jupyter实现代码
时间: 2024-10-01 12:11:51 浏览: 25
ensemble_clustering
系统聚类法,通常指K-means聚类算法,它是一种无监督学习方法,用于将数据集分成几个预定义数量的簇。在Jupyter Notebook中实现K-means算法,可以使用Python的sklearn库,这是一个广泛使用的机器学习工具包。
以下是一个简单的K-means聚类实现示例:
```python
# 导入所需的库
import numpy as np
from sklearn.cluster import KMeans
import matplotlib.pyplot as plt
# 假设我们有一个二维的数据集
X = [[5, 1], [1, 1], [7, 10], [10, 4], [1, 18], [15, 16]]
# 使用KMeans模型
kmeans = KMeans(n_clusters=2) # 需要指定簇的数量
# 拟合数据
kmeans.fit(X)
# 获取簇中心和每个样本的所属簇
centroids = kmeans.cluster_centers_
labels = kmeans.labels_
# 可视化结果
plt.scatter(X[:, 0], X[:, 1], c=labels, cmap='viridis')
plt.scatter(centroids[:, 0], centroids[:, 1], color='red', marker='x', s=200)
plt.title('K-Means Clustering Results')
plt.xlabel('Feature 1')
plt.ylabel('Feature 2')
plt.show()
```
在这个例子中,我们首先创建了一个KMeans实例,并设定簇的数量为2。然后通过`fit`方法训练模型,得到每个样本的簇标签。最后,我们将数据点按照簇标签颜色编码并绘制出来,红色十字表示簇中心。
阅读全文