python 聚类分析实战
时间: 2023-09-15 14:20:12 浏览: 113
【项目实战】Python基于KMeans算法进行文本聚类项目实战
5星 · 资源好评率100%
聚类分析是一种常用的无监督学习方法,可以根据数据的相似性将其分为不同的群组或簇。在 Python 中,有多个库可以用于实现聚类分析,例如 scikit-learn 和 scipy。
下面是一个使用 scikit-learn 库进行聚类分析的实例:
```python
import numpy as np
from sklearn.cluster import KMeans
from sklearn.datasets import make_blobs
import matplotlib.pyplot as plt
# 生成模拟数据
X, y_true = make_blobs(n_samples=300, centers=4, cluster_std=0.6, random_state=0)
# 使用 KMeans 算法进行聚类
kmeans = KMeans(n_clusters=4)
kmeans.fit(X)
# 预测每个样本所属的簇
y_pred = kmeans.predict(X)
# 绘制聚类结果
plt.scatter(X[:, 0], X[:, 1], c=y_pred)
plt.title("Cluster Analysis")
plt.show()
```
在这个例子中,我们使用 `make_blobs` 函数生成了一个包含 300 个样本的模拟数据集,其中有 4 个簇。然后使用 `KMeans` 类进行聚类,并将聚类结果可视化。
除了 KMeans,scikit-learn 还提供了其他的聚类算法,如层次聚类(Agglomerative Clustering)、DBSCAN 等。你可以根据具体的需求选择适合的算法进行聚类分析。
阅读全文