kmeans聚类算法python代码(涉及多个特征)
时间: 2023-08-14 13:05:13 浏览: 208
kmeans聚类算法python实现
下面是使用K-means聚类算法进行多特征聚类的Python代码示例:
```python
import pandas as pd
from sklearn.cluster import KMeans
# 读取数据集
data = pd.read_csv('data.csv')
# 选择需要进行聚类的特征列
features = ['feature1', 'feature2', 'feature3']
# 提取特征列的数据
X = data[features]
# 创建K-means模型并进行训练
kmeans = KMeans(n_clusters=3) # 设置聚类的簇数
kmeans.fit(X)
# 获取每个样本所属的簇标签
labels = kmeans.labels_
# 将簇标签添加到数据集中
data['cluster'] = labels
# 打印每个簇的样本数量
cluster_counts = data['cluster'].value_counts()
print(cluster_counts)
# 打印每个簇的中心点坐标
cluster_centers = kmeans.cluster_centers_
print(cluster_centers)
```
在上述代码中,首先从数据集中选择需要进行聚类的特征列,将这些特征列存储在`X`中。然后创建一个K-means模型,并使用`fit()`方法对数据进行训练。训练完成后,可以使用`labels_`属性获取每个样本所属的簇标签,并将簇标签添加到数据集中。
最后,通过`value_counts()`方法获取每个簇的样本数量,通过`cluster_centers_`属性获取每个簇的中心点坐标。
请注意,上述代码中的`data.csv`是示例数据集的文件名,你需要根据实际情况将其替换为你的数据集文件名,并根据实际情况调整簇数和特征列的选择。
阅读全文