1、使用pandas读取wine.csv，赋给数据框wine_data 2、wine_data中Class列为酒的类别，其余列为酒的相应成分 3、构建K-Means模型，聚集成3个簇 3、使用TSNE进行数据降维，降成2维 3、将原始数据转换为DataFrame，并将聚类结果存储进df数据表 4、提取不同标签的数据 5、设置画布大小为20*12，并使用scatter函数对以上聚类结果进行可视化 6、使用FMI评价法评价建立的K-Means模型，并在聚类数目为1-5时，确定最优聚类数目

时间: 2024-03-21 11:37:42 浏览: 107

好的，下面是实现的代码： ```python import pandas as pd from sklearn.cluster import KMeans from sklearn.manifold import TSNE from sklearn.metrics import fowlkes_mallows_score import matplotlib.pyplot as plt # 读取wine.csv文件，赋给数据框wine_data wine_data = pd.read_csv('wine.csv') # 分离出特征和目标列 X = wine_data.iloc[:, 1:] y = wine_data['Class'] # 构建K-Means模型，聚集成3个簇 kmeans = KMeans(n_clusters=3) kmeans.fit(X) # 使用TSNE进行数据降维，降成2维 tsne = TSNE(n_components=2) X_tsne = tsne.fit_transform(X) # 将原始数据转换为DataFrame，并将聚类结果存储进df数据表 df = pd.DataFrame(X_tsne, columns=['x', 'y']) df['labels'] = kmeans.labels_ # 提取不同标签的数据 df0 = df[df.labels == 0] df1 = df[df.labels == 1] df2 = df[df.labels == 2] # 设置画布大小为20*12，并使用scatter函数对以上聚类结果进行可视化 plt.figure(figsize=(20, 12)) plt.scatter(df0['x'], df0['y'], c='r', label='Cluster 0') plt.scatter(df1['x'], df1['y'], c='g', label='Cluster 1') plt.scatter(df2['x'], df2['y'], c='b', label='Cluster 2') plt.legend() # 使用FMI评价法评价建立的K-Means模型，并在聚类数目为1-5时，确定最优聚类数目 scores = [] for k in range(1, 6): kmeans = KMeans(n_clusters=k) kmeans.fit(X) score = fowlkes_mallows_score(y, kmeans.labels_) scores.append(score) plt.figure(figsize=(10, 6)) plt.plot(range(1, 6), scores, marker='o') plt.xlabel('Number of clusters') plt.ylabel('Fowlkes-Mallows Index') plt.show() ``` 首先，我们使用pandas库的read_csv()函数读取wine.csv文件，并将数据赋值给wine_data数据框。然后，我们将特征列和目标列分别赋值给变量X和y。接着，我们使用sklearn库的KMeans()函数构建K-Means模型，并将聚成3个簇。然后，我们使用fit()函数对模型进行训练，然后使用labels_属性获取聚类结果。接着，我们使用sklearn库的TSNE()函数进行数据降维，并将降维后的结果存储在X_tsne变量中。然后，我们将降维后的结果转换为DataFrame，并将聚类结果存储在df数据表中。接着，我们根据不同的标签提取出不同的数据，并使用matplotlib库的scatter()函数对聚类结果进行可视化。最后，我们使用FMI评价法评价建立的K-Means模型，并在聚类数目为1-5时，确定最优聚类数目，并使用matplotlib库的plot()函数将结果可视化。希望对您有帮助。

阅读全文

相关推荐

解决Python中pandas读取*.csv文件出现编码问题

eq_data_30_day_m1.rar

Salary_Data.csv

1、使用pandas读取wine.csv，赋给数据框wine_data 2、wine_data中Class列为酒的类别，其余列为酒的相应成分 3、构建K-Means模型，聚集成3个簇

使用svm对红酒数据进行分类，数据集为wine.csv

如何使用sklearn库中的葡萄酒数据集(wine.csv)实现一个完整的分类任务并展示相应的代码示例？

如何使用葡萄酒数据集（例如UCI Wine Dataset）进行训练与测试（8:2比例），并展示生成的决策树模型的可视化结果？

利用k-means算法对UCI数据库中wine数据集聚类的代码

对UCI数据库中wine数据集用k-means算法聚类并可视化的代码

请仔细阅读右侧代码，结合相关知识，在 Begin-End 区域内进行代码补充，完使用 sklearn 中的K-means模型实现红酒聚类任务。

可以出图的红酒数据集代码

关于红葡萄酒的数据集，如何利用决策树进行分析和预测？

如果要打印每次迭代后数据点与质心之间的距离，该如何修改，请给出完整修改后的代码

帮我用Python实现用多项逻辑回归解决红酒分类问题

机器学习 白葡萄酒代码

基于K-means算法的红酒聚类代码

大家在看

zlg的Python应用

UART.rar_2407 串口_F2407_TMS320LF2407_uart c语言

cam350导出smt坐标

TA-Lib的whl文件

本科-OOAD-原婷婷-2015212109-188013989281

最新推荐

基于Andorid的音乐播放器项目改进版本设计.zip

uniapp-machine-learning-from-scratch-05.rar

game_patch_1.30.21.13250.pak

【毕业设计-java】springboot-vue计算机学院校友网源码（完整前后端+mysql+说明文档+LunW）.zip

机器学习-特征工程算法

Windows下操作Linux图形界面的VNC工具

【SketchUp Ruby API：从入门到精通】

VMware虚拟机打开虚拟网络编辑器出现由于找不到vnetlib.dll,无法继续执行代码。重新安装程序可能会解决问题

基于Preact的高性能PWA实现定期天气信息更新

从停机到上线，EMC VNX5100控制器SP更换的实战演练

机器学习白葡萄酒代码