import numpy as np import pandas as pd X=pd.read_excel(r"C:\Users\Lenovo\Desktop\3.xlsx",header=None) #均方值规范化 from sklearn.preprocessing import StandardScaler scaler = StandardScaler() X=scaler.fit_transform(X) #给类别分类 from sklearn.cluster import KMeans model = KMeans(n_clusters = 2, random_state=0, max_iter = 500) #分类数,随机种子,最大迭代数 model.fit(X) c=model.labels_ c=c.reshape((31,1)) X=np.hstack((X,c)) x0=X[X[:,10]==0,0] y0=X[X[:,10]==0,1] x1=X[X[:,10]==1,0] y1=X[X[:,10]==1,1] import matplotlib.pyplot as plt plt.plot(x0,y0,'r*') plt.plot(x1,y1,'bo') plt.show()
时间: 2024-03-31 12:32:58 浏览: 88
python数据分析与可视化 import pandas as pd import numpy as np import m
这段代码是用 Python 对数据进行聚类分析的,主要使用了 sklearn 库中的 KMeans 模型和 matplotlib 库进行可视化。
首先,使用 pandas 库中的 read_excel 函数读取一个 Excel 文件,然后使用 StandardScaler 类进行均方值规范化,将数据进行标准化处理。接下来,使用 KMeans 模型对标准化后的数据进行分类,指定分类数为 2,随机种子为 0,最大迭代次数为 500。然后,将分类结果与原始数据合并,使用 numpy 库中的 hstack 函数将分类结果添加到原始数据的最后一列。
最后,使用 matplotlib 库中的 plot 函数将分类结果可视化,将第一列和第二列分别作为 x 轴和 y 轴,将分类结果为 0 的样本标记为红色的星号,将分类结果为 1 的样本标记为蓝色的圆点。最后调用 show 函数显示图像。
阅读全文