写一份基于python的聚类分析的代码
时间: 2024-09-08 14:00:41 浏览: 69
基于Python的聚类分析通常可以使用`scikit-learn`库中的各种算法来实现。以下是一个简单的K-means聚类算法的示例代码,它用于对数据集进行聚类分析。
```python
# 导入必要的库
from sklearn.cluster import KMeans
import matplotlib.pyplot as plt
from sklearn.datasets import make_blobs
from sklearn.preprocessing import StandardScaler
# 创建示例数据集
X, y = make_blobs(n_samples=300, centers=4, cluster_std=0.60, random_state=0)
# 数据标准化
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)
# 创建KMeans实例
kmeans = KMeans(n_clusters=4, random_state=42)
# 拟合模型
kmeans.fit(X_scaled)
# 预测每个点的簇成员情况
y_kmeans = kmeans.predict(X_scaled)
# 可视化结果
plt.scatter(X_scaled[:, 0], X_scaled[:, 1], c=y_kmeans, s=50, cmap='viridis')
centers = kmeans.cluster_centers_
plt.scatter(centers[:, 0], centers[:, 1], c='black', s=200, alpha=0.5)
plt.show()
```
这段代码首先创建了一个包含四个簇的合成数据集,然后使用`KMeans`类对数据进行聚类,并通过散点图将聚类结果可视化。
阅读全文