没有合适的资源?快使用搜索试试~ 我知道了~
首页对python打乱数据集中X,y标签对的方法详解
资源详情
资源评论
资源推荐

对对python打乱数据集中打乱数据集中X,y标签对的方法详解标签对的方法详解
今天就为大家分享一篇对python打乱数据集中X,y标签对的方法详解,具有很好的参考价值,希望对大家有所帮
助。一起跟随小编过来看看吧
今天踩过的两个小坑:今天踩过的两个小坑:
一.用random的shuffle打乱数据集中的数据-标签对
index=[i for i in range(len(X_batch))]
# print(type(index))
index=random.shuffle(index)
结果shuffle完以后index变成None了,看了下api,这样说明的:
这个函数如果返回值,就返回None,所以用index=balabala就把index的内容改变了。去掉index=random.shuffle(index)等号
前面的值,这样利用shuffle函数就可以直接将index的内容打乱,并且不返回任何值。
因此以上方式就可以打乱index的顺序,并以新顺序输出batch中的数据。
二.整体引用index这个list中的数据
因为因为index是一个是一个list,所以代码这样写:,所以代码这样写:
X_batch=X_batch[index]
Y_batch=Y_batch[index]
是有问题的,报错是:TypeError: list indices must be integers or slices, not list.
这是因为我的X_batch,Y_batch都是list,直接引用index是错误的。而可以直接引用的方法是如果X_batch,Y_batch是数
组,index是数组,就可以。
所以代码改成了:所以代码改成了:
X_batch,Y_batch=data_generator(data_path)
index=[i for i in range(len(X_batch))]
# print(type(index))
random.shuffle(index)
index=np.array(index)
X_batch=[np.array(X_batch)[index]]
Y_batch=[np.array(Y_batch)[index]]
参考代码:














安全验证
文档复制为VIP权益,开通VIP直接复制

评论0