数据合并,建立kmeans聚类的代码
时间: 2023-12-06 17:03:13 浏览: 84
KMeans聚类算法+代码
5星 · 资源好评率100%
以下代码是基于Python中的pandas和sklearn库实现数据合并和kmeans聚类的示例:
```python
import pandas as pd
from sklearn.cluster import KMeans
# 读入数据集1
df1 = pd.read_csv('data1.csv')
# 读入数据集2
df2 = pd.read_csv('data2.csv')
# 数据合并
df = pd.merge(df1, df2, on='ID')
# 选择需要聚类的特征
features = ['Feature1', 'Feature2', 'Feature3']
# 构建kmeans模型
kmeans = KMeans(n_clusters=3, random_state=0)
# 训练模型
kmeans.fit(df[features])
# 获取聚类结果
labels = kmeans.labels_
# 将聚类结果加入到原数据集中
df['Cluster'] = labels
# 输出聚类结果
print(df)
```
在上述代码中,我们首先使用pandas库读入两个数据集,然后通过merge()方法将它们按照ID这一列进行合并。接着,我们选择了Feature1、Feature2和Feature3这三个特征进行聚类,并构建了一个kmeans模型。训练模型后,我们通过labels_属性获取了聚类结果,并将其加入原数据集中。最后,我们输出了聚类结果。
需要注意的是,上述代码中的数据集和特征名称只是示例,请根据实际情况进行修改。同时,kmeans的聚类数量n_clusters也需要根据实际情况进行调整。
阅读全文