kmeans聚类算法python项目
时间: 2024-12-28 14:21:01 浏览: 18
### KMeans聚类算法 Python 实现示例
为了展示如何利用 `scikit-learn` 庌库中的KMeans模块来执行聚类分析,下面提供了一个简单的实例。此案例旨在帮助理解基本工作流程。
#### 安装依赖包
确保环境中已安装必要的软件包。如果尚未完成安装,则可以运行如下命令:
```bash
pip install scikit-learn matplotlib numpy pandas
```
#### 导入所需库并准备数据集
加载所需的Python库,并创建或导入用于测试的数据集。
```python
import numpy as np
from sklearn.cluster import KMeans
import matplotlib.pyplot as plt
import pandas as pd
# 创建随机样本点作为演示用途
X = np.random.rand(100, 2)
df = pd.DataFrame(X, columns=['Feature_1', 'Feature_2'])
```
#### 执行KMeans聚类操作
初始化模型对象,并调用fit方法训练模型;之后预测类别标签。
```python
kmeans = KMeans(n_clusters=3) # 设置簇的数量为3
kmeans.fit(df)
predicted_labels = kmeans.predict(df)
centers = kmeans.cluster_centers_
```
#### 可视化结果
绘制散点图以直观显示不同群组之间的分布情况。
```python
plt.figure(figsize=(8, 6))
plt.scatter(df['Feature_1'], df['Feature_2'], c=predicted_labels, s=50, cmap='viridis')
plt.scatter(centers[:, 0], centers[:, 1], c='red', s=200, alpha=0.75);
plt.title('K-means Clustering')
plt.xlabel('Feature 1')
plt.ylabel('Feature 2')
plt.show()
```
上述代码片段展示了完整的基于Python的KMeans聚类过程[^1]。
阅读全文