首页利用k-means算法对UCI数据库中Car Evaluation数据集聚类的代码

利用k-means算法对UCI数据库中Car Evaluation数据集聚类的代码

时间: 2024-02-22 09:58:31 浏览: 96

以下是利用k-means算法对UCI数据库中Car Evaluation数据集聚类的Python代码： ```python import pandas as pd from sklearn.cluster import KMeans from sklearn.preprocessing import LabelEncoder # 读取数据集 data = pd.read_csv('car.data', header=None) data.columns = ['buying', 'maint', 'doors', 'persons', 'lug_boot', 'safety', 'class'] # 将分类变量转换为数值变量 le = LabelEncoder() for col in data.columns: data[col] = le.fit_transform(data[col]) # 聚类 kmeans = KMeans(n_clusters=4, random_state=0).fit(data.iloc[:, :-1]) # 输出聚类结果 print(kmeans.labels_) ``` 其中，'car.data'是Car Evaluation数据集的文件名。在代码中，先用Pandas库读取数据集，然后用LabelEncoder将分类变量转换为数值变量，最后使用sklearn库中的KMeans算法进行聚类。聚类时选择4个簇，输出聚类结果。

阅读全文