plt.scatter(data.iloc[:, 2], data.iloc[:, 1], c=kmeans_labels)

这是一个使用matplotlib库中scatter函数进行散点图绘制的代码片段。其中，"data"是一个pandas DataFrame，".iloc[:, 2]"选取了所有行的第三列作为x轴数据，".iloc[:, 1]"选取了所有行的第二列作为y轴数据，"c=kmeans_labels"表示将k-means聚类算法的标签作为颜色参数来区分不同的数据点。

import numpy as np import matplotlib.pyplot as plt from sklearn.preprocessing import StandardScaler from sklearn.decomposition import PCA from sklearn.cluster import KMeans from scipy.spatial import Voronoi, voronoi_plot_2d # 生成示例数据 data = df.iloc[:,1:15] # 标准化处理 scaler = StandardScaler() data_scaled = scaler.fit_transform(data) # 主成分分析 pca = PCA(n_components=5) data_pca = pca.fit_transform(data_scaled) # 聚类分析 kmeans = KMeans(n_clusters=3) kmeans.fit(data_pca) labels = kmeans.labels_ centers = kmeans.cluster_centers_ # 绘制Voronoi图 vor = Voronoi(centers) voronoi_plot_2d(vor) # 绘制样本点 plt.scatter(data_pca[:, 0], data_pca[:, 1], c=labels) # 设置坐标轴标签和标题 plt.xlabel('PC1') plt.ylabel('PC2') plt.title('Voronoi Diagram') # 显示图形 plt.show()

您的代码看起来几乎是正确的，但有一点需要注意。Voronoi图是在原始数据空间中绘制的，而不是在主成分空间中。因此，在绘制Voronoi图之前，我们需要将主成分投影回原始数据空间。以下是修改后的代码： ```python import numpy as np import matplotlib.pyplot as plt from sklearn.preprocessing import StandardScaler from sklearn.decomposition import PCA from sklearn.cluster import KMeans from scipy.spatial import Voronoi, voronoi_plot_2d # 生成示例数据 data = df.iloc[:, 1:15] # 标准化处理 scaler = StandardScaler() data_scaled = scaler.fit_transform(data) # 主成分分析 pca = PCA(n_components=5) data_pca = pca.fit_transform(data_scaled) # 聚类分析 kmeans = KMeans(n_clusters=3) kmeans.fit(data_pca) labels = kmeans.labels_ centers = kmeans.cluster_centers_ # 将主成分投影回原始数据空间 data_projected = pca.inverse_transform(data_pca) # 绘制Voronoi图 vor = Voronoi(centers) voronoi_plot_2d(vor) # 绘制样本点 plt.scatter(data_projected[:, 0], data_projected[:, 1], c=labels) # 设置坐标轴标签和标题 plt.xlabel('Feature 1') plt.ylabel('Feature 2') plt.title('Voronoi Diagram') # 显示图形 plt.show() ``` 请确保在代码中替换`df.iloc[:, 1:15]`为您实际的数据。这段代码将绘制投影回原始数据空间后的样本点，并在Voronoi图上显示聚类结果。

逐句注释import matplotlib.pyplot as plt from sklearn.cluster import KMeans from sklearn.metrics import silhouette_score import pandas as pd data = pd.read_csv('xigua.csv') # 加载数据 print(data) print(data.shape) X = data.iloc[: ,1:3].values print(X) print(X.shape) plt.scatter(X[:, 0], X[:, 1], c = "red", marker = 'o', label = 'None') plt.ylabel('Sugar content') plt.xlabel('density') plt.legend(loc = 2) plt.show() #运用数学方法计算k的取值 score = [] for i in range(10): model = KMeans(n_clusters = i + 2) model.fit(X[:, 1:3]) #计算轮廓系数，系数取值范围[-1,1]，越接近1的，k的值越好 score.append(silhouette_score(X[:, 0:2], model.labels_, metric = 'euclidean')) plt.figure(figsize = (5, 4)) plt.plot(range(2, 12, 1), score) plt.show() #n_clusters表示k的取值，也就是聚成簇的数量 #fit()函数：做的就是模型训练 kmeans = KMeans(n_clusters = 3, random_state = 0, ).fit(X[:, 1:3]) label_pred = kmeans.labels_#获取聚类标签 print(label_pred) centroids = kmeans.cluster_centers_ #获取聚类簇心 print(centroids) #绘制结果 x0 = X[label_pred == 0] x1 = X[label_pred == 1] plt.scatter(x0[:, 0], x0[:, 1], c = "red", marker = 'o', label = 'label0') plt.scatter(x1[:, 0], x1[:, 1], c = "green", marker = '*', label = 'label1') plt.ylabel('Sugar content') plt.xlabel('density') plt.legend(loc = 2) plt.show()

这份代码主要是对西瓜数据集进行聚类分析，下面是逐行的注释： ``` import matplotlib.pyplot as plt # 导入绘图库 from sklearn.cluster import KMeans # 导入kmeans聚类算法 from sklearn.metrics import silhouette_score # 导入轮廓系数评价指标 import pandas as pd # 导入数据处理库 data = pd.read_csv('xigua.csv') # 加载数据 print(data) # 打印数据 print(data.shape) # 打印数据的形状 X = data.iloc[:, 1:3].values # 取第2列和第3列作为特征 print(X) # 打印特征 print(X.shape) # 打印特征的形状 plt.scatter(X[:, 0], X[:, 1], c="red", marker='o', label='None') # 绘制散点图 plt.ylabel('Sugar content') # y轴标签 plt.xlabel('density') # x轴标签 plt.legend(loc=2) # 图例位置 plt.show() # 显示图像 score = [] # 初始化轮廓系数列表 for i in range(10): # 循环计算轮廓系数 model = KMeans(n_clusters=i + 2) # 聚类模型 model.fit(X[:, 1:3]) # 训练模型 # 计算轮廓系数，系数取值范围[-1,1]，越接近1的，k的值越好 score.append(silhouette_score(X[:, 0:2], model.labels_, metric='euclidean')) plt.figure(figsize=(5, 4)) # 创建图像 plt.plot(range(2, 12, 1), score) # 绘制轮廓系数图像 plt.show() # 显示图像 kmeans = KMeans(n_clusters=3, random_state=0).fit(X[:, 1:3]) # 聚类模型 label_pred = kmeans.labels_ # 获取聚类标签 print(label_pred) # 打印聚类标签 centroids = kmeans.cluster_centers_ # 获取聚类簇心 print(centroids) # 打印聚类簇心 x0 = X[label_pred == 0] # 获取第一类样本 x1 = X[label_pred == 1] # 获取第二类样本 plt.scatter(x0[:, 0], x0[:, 1], c="red", marker='o', label='label0') # 绘制第一类样本的散点图 plt.scatter(x1[:, 0], x1[:, 1], c="green", marker='*', label='label1') # 绘制第二类样本的散点图 plt.ylabel('Sugar content') # y轴标签 plt.xlabel('density') # x轴标签 plt.legend(loc=2) # 图例位置 plt.show() # 显示图像 ``` 这段代码的目的是对西瓜数据集进行聚类分析，首先通过读取数据集获取特征，然后绘制散点图观察数据的分布情况，接着通过计算轮廓系数来确定最优的聚类簇数，再利用KMeans算法进行聚类分析，并绘制聚类结果的散点图。

阅读全文

plt.scatter(data.iloc[:, 2], data.iloc[:, 1], c=kmeans_labels)

相关推荐

python matplotlib:plt.scatter() 大小和颜色参数详解

Python matplotlib通过plt.scatter画空心圆标记出特定的点方法

read-and-show-color-image.rar_show_site:www.pudn.com_spyder read

AI_bighomework_kmeans实现wine数据集分类_wine_ai_wine数据_

机器学习算法之使用Python实现KMeans算法.zip

Python-Kmeans

KMeans Python代码

【聚类技术大比拼】：KMeans与层次聚类的对比分析及Python数据分群策略

【数据探索性分析】：用kmeans洞悉数据，揭秘初步分析的奥秘

金融分析中的KMeans聚类应用：风险评估与资产配置的智慧选择

kmeans聚类实例

大家在看

协同物流商务信息系统及其开发模式研究

空调室外机气动与声学特性的数值分析 (2013年)

SD Specifications Part 1 - Physical Layer Specification 4.0

泛函分析第二版课后习题参考答案孙炯

坐标提取lisp程序分享.pdf

最新推荐

mozillazg_python-pinyin_1741402107.zip

jfinal-undertow 用于开发、部署由 jfinal 开发的 web 项目

基于Andorid的音乐播放器项目设计（国外开源）.zip

Cyclone IV硬件配置详细文档解析

【WinCC与Excel集成秘籍】：轻松搭建数据交互桥梁（必读指南）

华为模拟互联地址配置

Java游戏开发简易实现与地图控制教程

【超市销售数据深度分析】：从数据库挖掘商业价值的必经之路

在ubuntu中安装ros时出现updating datebase of manual pages...怎么解决

Laravel Monobullet Monolog处理与Pushbullet API通知集成