jupyter 的k-means聚类分析程序代码
时间: 2024-09-08 22:00:48 浏览: 119
Jupyter Notebook是一个交互式的计算环境,常用于数据科学和机器学习项目。在Jupyter中运行K-means聚类算法,首先你需要导入必要的库,如`pandas`处理数据,`sklearn`进行聚类分析。以下是一个简单的K-means聚类分析的Python代码示例:
```python
# 导入所需的库
import numpy as np
import pandas as pd
from sklearn.cluster import KMeans
import matplotlib.pyplot as plt
# 假设你有一个名为data的DataFrame,包含需要聚类的数据
# data = pd.read_csv('your_data.csv') # 请替换为实际数据路径
# 准备数据(假设最后一列是数值特征)
X = data.iloc[:, :-1].values
# 设置K-means模型,比如设置簇的数量为3
n_clusters = 3
kmeans = KMeans(n_clusters=n_clusters)
# 运行聚类
kmeans.fit(X)
# 获取聚类中心
centroids = kmeans.cluster_centers_
# 添加聚类标签到原始数据
data['cluster'] = kmeans.labels_
# 可视化结果
plt.scatter(X[:, 0], X[:, 1], c=data['cluster'], cmap='viridis')
plt.scatter(centroids[:, 0], centroids[:, 1], s=300, c='red', marker='x')
plt.xlabel('Feature 1')
plt.ylabel('Feature 2')
plt.title('K-means Clustering Result')
plt.show()
阅读全文