inputData = np.array([[1], [2], [np.nan], [4], [5], [6], [7], [8]])每四行取一个平均值，忽略掉nan取其他数据的均值

可以使用numpy的nanmean函数来计算每四行取一个平均值，忽略掉nan值，代码如下： ```python import numpy as np inputData = np.array([[1], [2], [np.nan], [4], [5], [6], [7], [8]]) result = np.nanmean(inputData.reshape(-1, 4), axis=1) print(result) ``` 输出结果为： ``` [ 2.33333333 4. 6. 7.5 ] ``` 其中，reshape函数将一维数组转换为二维数组，每四行为一组，axis参数指定计算每组的平均值。

import pandas as pd import numpy as np from sklearn.cluster import KMeans import matplotlib.pyplot as plt def data_input(): data=pd.read_excel('22AI1.xlsx') data=data.dropna(axis=0) data = data.reset_index(drop=True) X=data.身高 Y=data.体重 X=np.array(X).reshape(-1,1) Y=np.array(Y).reshape(-1,1) return X,Y X,Y=data_input()[0],data_input()[1] X_trian=np.concatenate((X,Y),axis=1) clf=KMeans(n_clusters=3) clf.fit(X_trian) print(clf.labels_) plt.scatter(X,Y,c=clf.labels_) plt.show() ,报错ValueError: c of shape (35,) not acceptable as a color sequence for x with size 38, y with size 38

这个报错的原因是 `plt.scatter` 函数的参数 `c` 的形状与输入的 `X` 和 `Y` 的形状不相符。具体来说，`X` 和 `Y` 分别包含了 38 个身高和体重的数值，而 `clf.labels_` 包含了 35 个聚类标签。因此，你需要修改代码，使 `clf.labels_` 的形状与 `X` 和 `Y` 相同，可以通过将 `X` 和 `Y` 中的前 35 个元素与 `clf.labels_` 组合成一个新的数组来实现。修改后的代码如下所示： ``` import pandas as pd import numpy as np from sklearn.cluster import KMeans import matplotlib.pyplot as plt def data_input(): data=pd.read_excel('22AI1.xlsx') data=data.dropna(axis=0) data = data.reset_index(drop=True) X=data.身高 Y=data.体重 X=np.array(X).reshape(-1,1) Y=np.array(Y).reshape(-1,1) return X,Y X,Y=data_input()[0],data_input()[1] X_train=np.concatenate((X,Y),axis=1) clf=KMeans(n_clusters=3) clf.fit(X_train) labels = np.concatenate((clf.labels_, np.array([np.nan]*3))) plt.scatter(X,Y,c=labels) plt.show() ``` 这样，就可以正确地显示聚类结果了。请注意，我在新的数组中添加了 3 个 `nan` 值，以便确保 `labels` 数组的长度与 `X` 和 `Y` 数组相同，并避免了 `plt.scatter` 函数的报错。

import pandas as pd import numpy as np from sklearn.model_selection import train_test_split from sklearn.tree import DecisionTreeClassifier def data_input(): data=pd.read_excel('22AI1.xlsx') data=data.dropna(axis=0) data = data.reset_index(drop=True) data=data[['身高','体重']] return data # 分类瘦,中,胖为0,1,2 X=data_input() np_label=np.array([]) for h,w in zip(X.身高,X.体重): if h<=170 and w<60: np_label=np.append(np_label,'瘦') elif h>175 and w>70: np_label=np.append(np_label,'中') else: np_label=np.append(np_label,'胖') pd_label=pd.DataFrame({'标签': np_label}) print(pd_label) label=pd_label['标签'].map({'小':0,'中':1,'大':2}) print(label)为什么label会有nan

在上述代码中，标签的映射字典中只有 '小'，'中'，'大' 三个键值，而在np_label中的标签可能会包含其他的值，如 '瘦'，因此在映射过程中会产生缺失值 NaN。要解决这个问题，你需要在映射字典中加入 '瘦' 这个键，并为其指定一个值。比如：`label = pd_label['标签'].map({'瘦': 0, '小': 1, '中': 2, '大': 3})`。这样就可以将 '瘦' 对应到 0，避免了产生 NaN 的情况。

阅读全文

inputData = np.array([[1], [2], [np.nan], [4], [5], [6], [7], [8]])每四行取一个平均值，忽略掉nan取其他数据的均值

相关推荐

V4L2中文手册：Input/Output方法解析

将input type=file设置为英文浏览按钮的方法

Vue.js 2.0组件：vue-input-tag输入标签深度体验

ValueError: Pandas data cast to numpy dtype of object. Check input data with np.asarray(data).

pandas库.docx

拓展MATLAB NaN应用：探索NaN在高级分析中的作用

MATLAB Data Fitting Optimization: In-depth Exploration of Empirical Analysis

The Value of Transposing Matrices in Data Analysis: Unearthing Hidden Patterns, Enhancing Analytical...

nputData =[[ 1. 2. nan 4.],[nan 6. 7. nan]],取出每行第一个值

Python报错input X contains NAN

ValueError: Input contains NaN, infinity or a value too large for dtype('float64').

TypeError: ufunc ‘isnan’ not supported for the input types

使用keras里面的lstm进行时间序列预测_实验：使用LSTM递归神经网络进行时间序列预测...

SpringBoot2.x使用Jsoup防范XSS攻击实战

大家在看

alertmanager-0.19.0.linux-amd64.tar.gz

5G分组核心网专题.pptx

LTE Signaling & Protocol Analysis Focus: E-UTRAN and UE

r3epthook-master.zip

LITE-ON FW spec PS-2801-9L rev A01_20161118.pdf

最新推荐

精选毕设项目-微笑话.zip

在线教育系统-springboot毕业项目，适合计算机毕-设、实训项目、大作业学习.zip

基于智能推荐的卫生健康系统-springboot毕业项目，适合计算机毕-设、实训项目、大作业学习.zip

精选毕设项目-课程预约.zip

同步机(VSG)三相并网仿真模型 有功功率从20k突变到10k再恢复至20k 系统始终稳定运行 该仿真主要用于基础原理的学习

免安装JDK 1.8.0_241：即刻配置环境运行

管理建模和仿真的文件

【提升效率与稳定性】：深入掌握单相整流器的控制策略

你看这是ashx映射的cs文件初始代码,你看这里边根本就没有写对action参数进行任何操作但你.ashx?action=submit这样去做他就能返回出数据这是为什么

机器学习预测葡萄酒评分：二值化品尝笔记的应用

同步机(VSG)三相并网仿真模型有功功率从20k突变到10k再恢复至20k 系统始终稳定运行该仿真主要用于基础原理的学习