对python打乱数据集中X,y标签对的方法详解 - CSDN文库

41 浏览量更新于2023-03-16 收藏 87KB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

资源详情

资源推荐

对对python打乱数据集中打乱数据集中X,y标签对的方法详解标签对的方法详解

今天就为大家分享一篇对python打乱数据集中X,y标签对的方法详解，具有很好的参考价值，希望对大家有所帮

助。一起跟随小编过来看看吧

今天踩过的两个小坑：今天踩过的两个小坑：

一.用random的shuffle打乱数据集中的数据-标签对

index=[i for i in range(len(X_batch))]

# print(type(index))

index=random.shuffle(index)

结果shuffle完以后index变成None了，看了下api，这样说明的：

这个函数如果返回值，就返回None，所以用index=balabala就把index的内容改变了。去掉index=random.shuffle(index)等号

前面的值，这样利用shuffle函数就可以直接将index的内容打乱，并且不返回任何值。

因此以上方式就可以打乱index的顺序，并以新顺序输出batch中的数据。

二.整体引用index这个list中的数据

因为因为index是一个是一个list，所以代码这样写：，所以代码这样写：

X_batch=X_batch[index]

Y_batch=Y_batch[index]

是有问题的，报错是:TypeError: list indices must be integers or slices, not list.

这是因为我的X_batch,Y_batch都是list，直接引用index是错误的。而可以直接引用的方法是如果X_batch，Y_batch是数

组，index是数组，就可以。

所以代码改成了：所以代码改成了：

X_batch,Y_batch=data_generator(data_path)

index=[i for i in range(len(X_batch))]

# print(type(index))

random.shuffle(index)

index=np.array(index)

X_batch=[np.array(X_batch)[index]]

Y_batch=[np.array(Y_batch)[index]]

参考代码：

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余1页未读，立即下载

weixin_38672962

粉丝: 4
资源: 934

会员权益专享

图片转文字

全年可省5，000元立即开通

最新资源

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈