sklearn中K-means聚类算法代码,输入数据是csv文件
时间: 2024-02-23 19:58:51 浏览: 152
k-means 聚类代码
以下是使用sklearn中K-means聚类算法对输入为csv文件的数据进行聚类的示例代码:
```python
import pandas as pd
from sklearn.cluster import KMeans
# 读取csv文件
data = pd.read_csv('data.csv')
# 选择需要进行聚类的特征列
X = data[['feature1', 'feature2', 'feature3']]
# 构建KMeans模型
kmeans = KMeans(n_clusters=3, random_state=0)
# 训练模型并进行聚类
kmeans.fit(X)
# 将聚类结果添加到原始数据中
data['cluster'] = kmeans.labels_
# 输出聚类结果
print(data)
```
上述代码中,我们首先使用pandas库的`read_csv`函数读取csv文件,然后从数据中选择需要进行聚类的特征列构建特征矩阵X。接着,我们使用KMeans模型对特征矩阵进行聚类,并将聚类结果存储在`labels_`属性中。最后,我们将聚类结果添加到原始数据中,并输出聚类结果。请注意,上述代码中的特征列和csv文件路径需要根据实际情况进行修改。
阅读全文