利用k-means算法对UCI数据库中Car Evaluation数据集聚类的代码
时间: 2024-02-22 09:58:31 浏览: 96
以下是利用k-means算法对UCI数据库中Car Evaluation数据集聚类的Python代码:
```python
import pandas as pd
from sklearn.cluster import KMeans
from sklearn.preprocessing import LabelEncoder
# 读取数据集
data = pd.read_csv('car.data', header=None)
data.columns = ['buying', 'maint', 'doors', 'persons', 'lug_boot', 'safety', 'class']
# 将分类变量转换为数值变量
le = LabelEncoder()
for col in data.columns:
data[col] = le.fit_transform(data[col])
# 聚类
kmeans = KMeans(n_clusters=4, random_state=0).fit(data.iloc[:, :-1])
# 输出聚类结果
print(kmeans.labels_)
```
其中,'car.data'是Car Evaluation数据集的文件名。在代码中,先用Pandas库读取数据集,然后用LabelEncoder将分类变量转换为数值变量,最后使用sklearn库中的KMeans算法进行聚类。聚类时选择4个簇,输出聚类结果。
阅读全文