data = pd.read_excel('data_with_labels.xlsx')

这行代码使用 Pandas 库中的 read_excel 函数读取名为 "data_with_labels.xlsx" 的 Excel 文件，并将其存储为一个 Pandas 数据框（DataFrame）对象，命名为 data。该文件必须位于当前工作目录下，否则需要提供完整的文件路径。如果该文件包含多个工作表，可以通过在函数中指定 sheet_name 参数来选择要读取的工作表。

import matplotlib.pyplot as plt import numpy as np import pandas as pd df = pd.read_excel("taobao_data_matplolib.xlsx") data = df["成交量"].values labels = df["位置"].values plt.bar(labels, data) plt.show()

这段代码使用了Python中的matplotlib库来绘制一个简单的柱状图。首先，通过pandas库的read_excel()函数读取了一个名为taobao_data_matplolib.xlsx的Excel文件，并将其中的成交量和位置两列数据分别存储到data和labels变量中。然后，使用matplotlib库的plt.bar()函数绘制了一个柱状图，x轴为位置，y轴为成交量。最后，使用plt.show()函数显示出这张图表。这段代码的作用是用柱状图展示不同位置的成交量，以便于比较和分析。

import pandas as pd import numpy as np from sklearn.cluster import KMeans import matplotlib.pyplot as plt def data_input(): data=pd.read_excel('22AI1.xlsx') data=data.dropna(axis=0) data = data.reset_index(drop=True) X=data.身高 Y=data.体重 X=np.array(X).reshape(-1,1) Y=np.array(Y).reshape(-1,1) return X,Y X,Y=data_input()[0],data_input()[1] X_trian=np.concatenate((X,Y),axis=1) clf=KMeans(n_clusters=3) clf.fit(X_trian) print(clf.labels_) plt.scatter(X,Y,c=clf.labels_) plt.show() ,报错ValueError: c of shape (35,) not acceptable as a color sequence for x with size 38, y with size 38

这个报错的原因是 `plt.scatter` 函数的参数 `c` 的形状与输入的 `X` 和 `Y` 的形状不相符。具体来说，`X` 和 `Y` 分别包含了 38 个身高和体重的数值，而 `clf.labels_` 包含了 35 个聚类标签。因此，你需要修改代码，使 `clf.labels_` 的形状与 `X` 和 `Y` 相同，可以通过将 `X` 和 `Y` 中的前 35 个元素与 `clf.labels_` 组合成一个新的数组来实现。修改后的代码如下所示： ``` import pandas as pd import numpy as np from sklearn.cluster import KMeans import matplotlib.pyplot as plt def data_input(): data=pd.read_excel('22AI1.xlsx') data=data.dropna(axis=0) data = data.reset_index(drop=True) X=data.身高 Y=data.体重 X=np.array(X).reshape(-1,1) Y=np.array(Y).reshape(-1,1) return X,Y X,Y=data_input()[0],data_input()[1] X_train=np.concatenate((X,Y),axis=1) clf=KMeans(n_clusters=3) clf.fit(X_train) labels = np.concatenate((clf.labels_, np.array([np.nan]*3))) plt.scatter(X,Y,c=labels) plt.show() ``` 这样，就可以正确地显示聚类结果了。请注意，我在新的数组中添加了 3 个 `nan` 值，以便确保 `labels` 数组的长度与 `X` 和 `Y` 数组相同，并避免了 `plt.scatter` 函数的报错。

阅读全文

data = pd.read_excel('data_with_labels.xlsx')

import matplotlib.pyplot as plt import numpy as np import pandas as pd df = pd.read_excel("taobao_data_matplolib.xlsx") data = df["成交量"].values labels = df["位置"].values plt.bar(labels, data) plt.show()

相关推荐

数据.xlsx

data.xlsx

数据文件.xls

data = pd.read_excel(r"E:\1作业与文件\绿色交通系统\大作业\1-3及od\OD.xlsx", header=None).values # print(data) #行向量 for i in range(3, 8): kmeans = KMeans(n_clusters=i, random_state=0, n_init=10).fit(data) print(kmeans.labels_) #列向量 for j in range(3, 8): kmean

vue.js v2.5.17

DM8-SQL语言详解及其数据管理和查询操作指南

1108_ba_open_report.pdf

anslow_02_0109.pdf

大家在看

SCSI-ATA-Translation-3_(SAT-3)-Rev-01a

Surface pro 7 SD卡固定硬盘X64驱动带数字签名

实验2.Week04_通过Console线实现对交换机的配置和管理.pdf

景象匹配精确制导中匹配概率的一种估计方法

Low-cost high-gain differential integrated 60 GHz phased array antenna in PCB process

最新推荐

vue.js v2.5.17

DM8-SQL语言详解及其数据管理和查询操作指南

1108_ba_open_report.pdf

anslow_02_0109.pdf

以下是OpenCV在不同操作系统下的下载与安装教程

FileAutoSyncBackup：自动同步与增量备份软件介绍

C语言内存管理：动态分配策略深入解析，内存不再迷途

严格来说一维不是rnn

基于MFC和OpenCV的USB相机操作示例

C语言基础精讲：掌握指针，编程新手的指路明灯