jupyter notebook聚类ais
时间: 2024-12-30 22:32:00 浏览: 7
### 如何在 Jupyter Notebook 中实现 AI 聚类算法
#### 准备工作
为了能够在 Jupyter Notebook 中执行 K-means 聚类分析,需要先确保已经安装了必要的 Python 库。这些库包括 `numpy`、`matplotlib` 和 `scikit-learn`[^2]。
```bash
pip install numpy matplotlib scikit-learn
```
#### 导入所需模块
启动 Jupyter Notebook 后,在一个新的笔记本单元格内导入所需的 Python 模块:
```python
import numpy as np
from sklearn.cluster import KMeans
import matplotlib.pyplot as plt
```
#### 创建数据集
可以创建一个简单的二维数据集用于测试目的。这里使用 NumPy 来生成一组随机分布的数据点作为样本集合。
```python
# 设定随机种子以便重现结果
np.random.seed(0)
# 构建两个簇中心位置以及它们周围的标准差
centers = [[1, 1], [-1, -1]]
std_deviation = 0.7
# 使用 make_blobs 方法构建具有特定数量的特征和类别标签的数据集
from sklearn.datasets import make_blobs
data_points, true_labels = make_blobs(n_samples=300, centers=centers,
cluster_std=std_deviation)
```
#### 执行 K-Means 聚类
定义并训练 K-Means 模型对象;指定要寻找的簇的数量(本例中为 2),并对之前准备好的数据调用 fit() 方法完成聚类过程。
```python
kmeans_model = KMeans(n_clusters=2).fit(data_points)
predicted_labels = kmeans_model.labels_
cluster_centers = kmeans_model.cluster_centers_
```
#### 可视化结果
最后一步是绘制散点图展示原始数据及其对应的预测分类情况,并标记出各个簇心的位置。
```python
plt.scatter(data_points[:, 0], data_points[:, 1],
c=predicted_labels, s=50, cmap='viridis')
plt.scatter(cluster_centers[:, 0], cluster_centers[:, 1],
marker="*", color="red", s=200, alpha=0.75);
plt.show()
```
通过上述步骤可以在 Jupyter Notebook 上成功运行一次完整的 K-Means 聚类实验。值得注意的是,除了有监督的学习方法之外,还有其他类型的无监督学习算法可用于不同的应用场景下处理未标注的数据集[^3]。
阅读全文