imgs = loader_train.__iter__().next()[0].view(batch_size, 784).numpy(),怎么修改

时间: 2024-04-15 11:27:38 浏览: 191
ZIP

imgs.zip_imgs.com_imgs图片_web 图片展示_展示_左右滑动模

要修改这行代码,你可以使用以下方式: ```python imgs = next(iter(loader_train))[0].view(batch_size, 784).numpy() ``` 这里使用`next(iter(loader_train))`来替代`loader_train.__iter__().next()`。这两种方法是等效的,都是获取`loader_train`中的下一个batch数据。然后使用`.view(batch_size, 784)`来改变数据的形状,并最后使用`.numpy()`将数据转换为NumPy数组。
阅读全文

相关推荐

# 定义数据集读取器 def load_data(mode='train'): # 数据文件 datafile = './data/data116648/mnist.json.gz' print('loading mnist dataset from {} ......'.format(datafile)) data = json.load(gzip.open(datafile)) train_set, val_set, eval_set = data # 数据集相关参数,图片高度IMG_ROWS, 图片宽度IMG_COLS IMG_ROWS = 28 IMG_COLS = 28 if mode == 'train': imgs = train_set[0] labels = train_set[1] elif mode == 'valid': imgs = val_set[0] labels = val_set[1] elif mode == 'eval': imgs = eval_set[0] labels = eval_set[1] imgs_length = len(imgs) assert len(imgs) == len(labels), \ "length of train_imgs({}) should be the same as train_labels({})".format( len(imgs), len(labels)) index_list = list(range(imgs_length)) # 读入数据时用到的batchsize BATCHSIZE = 100 # 定义数据生成器 def data_generator(): if mode == 'train': random.shuffle(index_list) imgs_list = [] labels_list = [] for i in index_list: img = np.reshape(imgs[i], [1, IMG_ROWS, IMG_COLS]).astype('float32') img_trans=-img #转变颜色 label = np.reshape(labels[i], [1]).astype('int64') label_trans=label imgs_list.append(img) imgs_list.append(img_trans) labels_list.append(label) labels_list.append(label_trans) if len(imgs_list) == BATCHSIZE: yield np.array(imgs_list), np.array(labels_list) imgs_list = [] labels_list = [] # 如果剩余数据的数目小于BATCHSIZE, # 则剩余数据一起构成一个大小为len(imgs_list)的mini-batch if len(imgs_list) > 0: yield np.array(imgs_list), np.array(labels_list) return data_generator

下面代码在tensorflow中出现了init() missing 1 required positional argument: 'cell'报错: class Model(): def init(self): self.img_seq_shape=(10,128,128,3) self.img_shape=(128,128,3) self.train_img=dataset # self.test_img=dataset_T patch = int(128 / 2 ** 4) self.disc_patch = (patch, patch, 1) self.optimizer=tf.keras.optimizers.Adam(learning_rate=0.001) self.build_generator=self.build_generator() self.build_discriminator=self.build_discriminator() self.build_discriminator.compile(loss='binary_crossentropy', optimizer=self.optimizer, metrics=['accuracy']) self.build_generator.compile(loss='binary_crossentropy', optimizer=self.optimizer) img_seq_A = Input(shape=(10,128,128,3)) #输入图片 img_B = Input(shape=self.img_shape) #目标图片 fake_B = self.build_generator(img_seq_A) #生成的伪目标图片 self.build_discriminator.trainable = False valid = self.build_discriminator([img_seq_A, fake_B]) self.combined = tf.keras.models.Model([img_seq_A, img_B], [valid, fake_B]) self.combined.compile(loss=['binary_crossentropy', 'mse'], loss_weights=[1, 100], optimizer=self.optimizer,metrics=['accuracy']) def build_generator(self): def res_net(inputs, filters): x = inputs net = conv2d(x, filters // 2, (1, 1), 1) net = conv2d(net, filters, (3, 3), 1) net = net + x # net=tf.keras.layers.LeakyReLU(0.2)(net) return net def conv2d(inputs, filters, kernel_size, strides): x = tf.keras.layers.Conv2D(filters, kernel_size, strides, 'same')(inputs) x = tf.keras.layers.BatchNormalization()(x) x = tf.keras.layers.LeakyReLU(alpha=0.2)(x) return x d0 = tf.keras.layers.Input(shape=(10, 128, 128, 3)) out= ConvRNN2D(filters=32, kernel_size=3,padding='same')(d0) out=tf.keras.layers.Conv2D(3,1,1,'same')(out) return keras.Model(inputs=d0, outputs=out) def build_discriminator(self): def d_layer(layer_input, filters, f_size=4, bn=True): d = tf.keras.layers.Conv2D(filters, kernel_size=f_size, strides=2, padding='same')(layer_input) if bn: d = tf.keras.layers.BatchNormalization(momentum=0.8)(d) d = tf.keras.layers.LeakyReLU(alpha=0.2)(d) return d img_A = tf.keras.layers.Input(shape=(10, 128, 128, 3)) img_B = tf.keras.layers.Input(shape=(128, 128, 3)) df = 32 lstm_out = ConvRNN2D(filters=df, kernel_size=4, padding="same")(img_A) lstm_out = tf.keras.layers.LeakyReLU(alpha=0.2)(lstm_out) combined_imgs = tf.keras.layers.Concatenate(axis=-1)([lstm_out, img_B]) d1 = d_layer(combined_imgs, df)#64 d2 = d_layer(d1, df * 2)#32 d3 = d_layer(d2, df * 4)#16 d4 = d_layer(d3, df * 8)#8 validity = tf.keras.layers.Conv2D(1, kernel_size=4, strides=1, padding='same')(d4) return tf.keras.Model([img_A, img_B], validity)

import torch, os, cv2 from model.model import parsingNet from utils.common import merge_config from utils.dist_utils import dist_print import torch import scipy.special, tqdm import numpy as np import torchvision.transforms as transforms from data.dataset import LaneTestDataset from data.constant import culane_row_anchor, tusimple_row_anchor if __name__ == "__main__": torch.backends.cudnn.benchmark = True args, cfg = merge_config() dist_print('start testing...') assert cfg.backbone in ['18','34','50','101','152','50next','101next','50wide','101wide'] if cfg.dataset == 'CULane': cls_num_per_lane = 18 elif cfg.dataset == 'Tusimple': cls_num_per_lane = 56 else: raise NotImplementedError net = parsingNet(pretrained = False, backbone=cfg.backbone,cls_dim = (cfg.griding_num+1,cls_num_per_lane,4), use_aux=False).cuda() # we dont need auxiliary segmentation in testing state_dict = torch.load(cfg.test_model, map_location='cpu')['model'] compatible_state_dict = {} for k, v in state_dict.items(): if 'module.' in k: compatible_state_dict[k[7:]] = v else: compatible_state_dict[k] = v net.load_state_dict(compatible_state_dict, strict=False) net.eval() img_transforms = transforms.Compose([ transforms.Resize((288, 800)), transforms.ToTensor(), transforms.Normalize((0.485, 0.456, 0.406), (0.229, 0.224, 0.225)), ]) if cfg.dataset == 'CULane': splits = ['test0_normal.txt', 'test1_crowd.txt', 'test2_hlight.txt', 'test3_shadow.txt', 'test4_noline.txt', 'test5_arrow.txt', 'test6_curve.txt', 'test7_cross.txt', 'test8_night.txt'] datasets = [LaneTestDataset(cfg.data_root,os.path.join(cfg.data_root, 'list/test_split/'+split),img_transform = img_transforms) for split in splits] img_w, img_h = 1640, 590 row_anchor = culane_row_anchor elif cfg.dataset == 'Tusimple': splits = ['test.txt'] datasets = [LaneTestDataset(cfg.data_root,os.path.join(cfg.data_root, split),img_transform = img_transforms) for split in splits] img_w, img_h = 1280, 720 row_anchor = tusimple_row_anchor else: raise NotImplementedError for split, dataset in zip(splits, datasets): loader = torch.utils.data.DataLoader(dataset, batch_size=1, shuffle = False, num_workers=1) fourcc = cv2.VideoWriter_fourcc(*'MJPG') print(split[:-3]+'avi') vout = cv2.VideoWriter(split[:-3]+'avi', fourcc , 30.0, (img_w, img_h)) for i, data in enumerate(tqdm.tqdm(loader)): imgs, names = data imgs = imgs.cuda() with torch.no_grad(): out = net(imgs) col_sample = np.linspace(0, 800 - 1, cfg.griding_num) col_sample_w = col_sample[1] - col_sample[0] out_j = out[0].data.cpu().numpy() out_j = out_j[:, ::-1, :] prob = scipy.special.softmax(out_j[:-1, :, :], axis=0) idx = np.arange(cfg.griding_num) + 1 idx = idx.reshape(-1, 1, 1) loc = np.sum(prob * idx, axis=0) out_j = np.argmax(out_j, axis=0) loc[out_j == cfg.griding_num] = 0 out_j = loc # import pdb; pdb.set_trace() vis = cv2.imread(os.path.join(cfg.data_root,names[0])) for i in range(out_j.shape[1]): if np.sum(out_j[:, i] != 0) > 2: for k in range(out_j.shape[0]): if out_j[k, i] > 0: ppp = (int(out_j[k, i] * col_sample_w * img_w / 800) - 1, int(img_h * (row_anchor[cls_num_per_lane-1-k]/288)) - 1 ) cv2.circle(vis,ppp,5,(0,255,0),-1) vout.write(vis) vout.release()

from pdb import set_trace as st import os import numpy as np import cv2 import argparse parser = argparse.ArgumentParser('create image pairs') parser.add_argument('--fold_A', dest='fold_A', help='input directory for image A', type=str, default='../dataset/50kshoes_edges') parser.add_argument('--fold_B', dest='fold_B', help='input directory for image B', type=str, default='../dataset/50kshoes_jpg') parser.add_argument('--fold_AB', dest='fold_AB', help='output directory', type=str, default='../dataset/test_AB') parser.add_argument('--num_imgs', dest='num_imgs', help='number of images',type=int, default=1000000) parser.add_argument('--use_AB', dest='use_AB', help='if true: (0001_A, 0001_B) to (0001_AB)',action='store_true') args = parser.parse_args() for arg in vars(args): print('[%s] = ' % arg, getattr(args, arg)) splits = os.listdir(args.fold_A) for sp in splits: img_fold_A = os.path.join(args.fold_A, sp) img_fold_B = os.path.join(args.fold_B, sp) img_list = os.listdir(img_fold_A) if args.use_AB: img_list = [img_path for img_path in img_list if '_A.' in img_path] num_imgs = min(args.num_imgs, len(img_list)) print('split = %s, use %d/%d images' % (sp, num_imgs, len(img_list))) img_fold_AB = os.path.join(args.fold_AB, sp) if not os.path.isdir(img_fold_AB): os.makedirs(img_fold_AB) print('split = %s, number of images = %d' % (sp, num_imgs)) for n in range(num_imgs): name_A = img_list[n] path_A = os.path.join(img_fold_A, name_A) if args.use_AB: name_B = name_A.replace('_A.', '_B.') else: name_B = name_A path_B = os.path.join(img_fold_B, name_B) if os.path.isfile(path_A) and os.path.isfile(path_B): name_AB = name_A if args.use_AB: name_AB = name_AB.replace('_A.', '.') # remove _A path_AB = os.path.join(img_fold_AB, name_AB) im_A = cv2.imread(path_A, cv2.IMREAD_COLOR) im_B = cv2.imread(path_B, cv2.IMREAD_COLOR) im_AB = np.concatenate([im_A, im_B], 1) cv2.imwrite(path_AB, im_AB),解释上述代码,并告诉我怎么设置文件夹格式

最新推荐

recommend-type

基于pytorch的UNet_demo实现及训练自己的数据集.docx

- `-b`表示批大小(batch size) - `-l`表示学习率 - `-s`表示缩放比例 - `-v`表示验证集比例 - **训练自己的数据集**: 调整数据集命名以保持一一对应,确保输入是3通道图像,输出是单通道掩模。如果遇到`...
recommend-type

python1111111111

python1111111111
recommend-type

群山环绕的蓝色风景PPT模板下载

资源摘要信息:"重峦叠嶂的群山背景图片PPT模板" 知识点: 1. PPT模板的定义和应用:PPT模板是预先设计好的演示文稿样式,用于快速制作演示文稿或幻灯片。它通常包括背景设计、字体样式、配色方案和布局等元素。在进行演讲、汇报、教学或商业展示时,使用PPT模板可以提高制作效率,统一视觉效果,使内容更加吸引人。 2. 背景图片的作用:在PPT模板中,背景图片是至关重要的设计元素之一。它不仅能够为演示文稿设定基调和氛围,还可以增强信息传达的视觉效果,使观众更容易接受和理解演讲内容。好的背景图片应简洁而不抢眼,能够衬托主题,让内容成为焦点。 3. 山景图片的象征意义:山景图片通常给人以稳重、稳固和坚韧不拔的象征意义。在演示文稿中使用山景背景图片,可以传递出坚持不懈、勇攀高峰的主题和信息。重峦叠嶂的群山图片则能够突出这种寓意,适用于激励性演讲或团队合作主题的展示。 4. 文件格式与使用场景:本PPT模板文件以.jpg格式提供,它是一种常用的图像文件格式,用于网络传输、网页显示或个人计算机保存。由于.jpg文件具有压缩特性,因此适合用于网络下载或电子设备间共享,但需要注意的是,过多压缩可能会导致图像质量降低。 5. 免费资源的获取与注意事项:第一PPT模板网提供了精美风景幻灯片背景图片的免费下载,这为很多需要节省成本的用户提供了便利。然而,免费资源在使用时需要遵守相关网站的使用条款,可能包含版权声明或在商业用途上的限制。用户下载使用前应仔细阅读许可协议,避免侵犯版权或违规使用。 6. .ppt文件的编辑与制作:虽然本资源提供的是背景图片,但用户在获得图片后可能需要将其应用到.ppt演示文稿中。这通常需要使用Microsoft PowerPoint或其他类似软件(如WPS Office、Google Slides等)来完成。编辑时要注意保持背景图片与演示文稿内容的协调性,以及适当的图片尺寸和位置。 7. 压缩包子文件与资源管理:资源文件名称列表中包含了图片1.jpg以及其他文件,如使用帮助.txt、谷普下载.url、说明.url。这些文件可能是关于如何使用模板、下载链接或使用说明。用户在下载和使用这些资源时,应仔细检查文件清单,了解每个文件的作用,并正确管理这些资源,以避免丢失重要信息。 8. 知识产权保护:在使用任何设计素材时,无论是否免费,都应尊重知识产权。避免使用未经授权的素材,尤其是在商业项目中。使用时应确保素材来源的合法性和适用性,以免造成法律风险和道德争议。 通过以上知识点的介绍,用户可以更好地理解重峦叠嶂的群山背景图片PPT模板的价值和使用方法,并在设计演示文稿时更加得心应手。
recommend-type

管理建模和仿真的文件

管理Boualem Benatallah引用此版本:布阿利姆·贝纳塔拉。管理建模和仿真。约瑟夫-傅立叶大学-格勒诺布尔第一大学,1996年。法语。NNT:电话:00345357HAL ID:电话:00345357https://theses.hal.science/tel-003453572008年12月9日提交HAL是一个多学科的开放存取档案馆,用于存放和传播科学研究论文,无论它们是否被公开。论文可以来自法国或国外的教学和研究机构,也可以来自公共或私人研究中心。L’archive ouverte pluridisciplinaire
recommend-type

【Python沉浸式音频体验】:虚拟现实中的音频处理技巧

![【Python沉浸式音频体验】:虚拟现实中的音频处理技巧](https://www.thetechinfinite.com/wp-content/uploads/2020/07/thetechinfinite-22-1024x576.jpg) # 1. 虚拟现实中的音频处理概述 虚拟现实技术已经不再是科幻小说中的概念,而是逐渐走入了我们的生活。在这个沉浸式的世界里,除了视觉效果外,音频处理也扮演了至关重要的角色。本章将为读者提供一个虚拟现实音频处理的概览,从基础理论到实际应用,从简单的音频增强到复杂的交互设计,我们将逐步深入探讨如何在虚拟环境中实现高质量的音频体验。 虚拟现实中的音频处
recommend-type

如何利用改进的LSTM模型进行智能车行为识别和轨迹预测,并通过加速度优化提升预测精度?

为了在智能车领域实现更为精确的行为识别和轨迹预测,改进的LSTM模型是一个有效的工具。结合《改进LSTM模型提升车辆轨迹预测精度:行为识别与优化策略》一文中的研究,以下步骤和细节将帮助你深入了解和应用这一技术: 参考资源链接:[改进LSTM模型提升车辆轨迹预测精度:行为识别与优化策略](https://wenku.csdn.net/doc/7k3q6biwdz?spm=1055.2569.3001.10343) 1. 数据预处理:首先,需要收集并预处理智能车的数据集,包括车辆的状态信息、行为信息以及与环境的交互信息。数据预处理包括标准化、去噪等步骤,为模型提供高质量的输入数据。 2. 改
recommend-type

dim-spa核心组件:JavaScript实现滚动条

资源摘要信息: "scroller: 滚动条" 在web开发中,滚动条是一个十分常见的界面元素,它是页面内容超出视窗时用于浏览更多内容的控制装置。开发者通常使用HTML、CSS和JavaScript等技术来控制滚动条的行为和样式。在本篇知识汇总中,我们将详细探讨JavaScript在创建和操作滚动条中的应用,同时结合相关技术细节,介绍如何在web页面中实现平滑滚动、动态内容加载和响应用户交互等功能。 ### JavaScript与滚动条 JavaScript是web开发中不可或缺的脚本语言,它允许开发者编写代码来动态地改变网页的外观和行为。在处理滚动条时,JavaScript可以提供精细的控制,例如监听滚动事件、获取滚动位置、改变滚动位置以及创建自定义滚动条等。 ### 监听滚动事件 为了响应滚动条的移动,开发者可以利用JavaScript中的`addEventListener`方法来监听滚动事件,如`scroll`事件。当用户滚动页面时,会触发该事件,并且可以执行与滚动相关的操作。 ```javascript document.addEventListener('scroll', function() { console.log('滚动位置:', window.scrollY); }); ``` ### 获取和设置滚动位置 通过JavaScript可以轻松获取或设置当前滚动位置。`window.scrollY`属性可以获取垂直滚动位置的像素值,而`window.scrollX`则用于获取水平滚动位置。开发者也可以使用`window.scrollTo(x, y)`或`element.scrollTo(options)`方法来编程式地改变滚动位置。 ```javascript // 获取当前垂直滚动位置 console.log(window.scrollY); // 设置滚动位置到页面顶部 window.scrollTo(0, 0); // 使用对象设置滚动位置 window.scrollTo({ top: 100, left: 100, behavior: 'smooth' }); ``` ### 动态内容加载与分页 在处理大量内容时,直接在页面上渲染所有数据可能会导致性能问题。此时,可以通过滚动条的位置来触发内容的懒加载(lazy loading)或分页加载(pagination)。这通常结合监听滚动事件和发送Ajax请求来实现。 ```javascript document.addEventListener('scroll', function() { if ((window.innerHeight + window.scrollY) >= document.body.offsetHeight) { // 到达页面底部时加载更多内容 loadMoreContent(); } }); function loadMoreContent() { // 发送Ajax请求获取新内容,并将其添加到页面中 } ``` ### 自定义滚动条样式 CSS提供了对滚动条样式的控制能力,但这种控制相对有限。通过使用JavaScript结合CSS,可以实现更加自定义的滚动条设计。虽然不推荐完全隐藏默认滚动条(因为它可能会影响用户体验),但在某些情况下,创建自定义滚动条确实可以提升视觉效果。 ```css /* 定义自定义滚动条的CSS样式 */ ::-webkit-scrollbar { width: 10px; } ::-webkit-scrollbar-track { background: #f1f1f1; } ::-webkit-scrollbar-thumb { background: #888; } ::-webkit-scrollbar-thumb:hover { background: #555; } ``` ### 与dim-spa结合 dim-spa(Dimensional Space)很可能是一个特定的框架或库,用于创建空间感知的web应用。在这个框架内,滚动条可能是一个用户界面组件,允许用户在一个多维空间中浏览内容。JavaScript可以在这个框架下提供更加动态和流畅的滚动体验。 ```javascript // 在dim-spa框架内控制滚动条 dimspa.scrollIntoView(element); ``` ### 结论 综合上述内容,JavaScript在滚动条的控制方面提供了非常强大的功能。无论是监听滚动事件、动态加载内容、还是创建自定义滚动条,JavaScript都能满足多样化的web开发需求。开发者应深入理解这些知识点,并在实际项目中灵活运用,以优化用户体验并提升界面交互的流畅度。
recommend-type

"互动学习:行动中的多样性与论文攻读经历"

多样性她- 事实上SCI NCES你的时间表ECOLEDO C Tora SC和NCESPOUR l’Ingén学习互动,互动学习以行动为中心的强化学习学会互动,互动学习,以行动为中心的强化学习计算机科学博士论文于2021年9月28日在Villeneuve d'Asq公开支持马修·瑟林评审团主席法布里斯·勒菲弗尔阿维尼翁大学教授论文指导奥利维尔·皮耶昆谷歌研究教授:智囊团论文联合主任菲利普·普雷教授,大学。里尔/CRISTAL/因里亚报告员奥利维耶·西格德索邦大学报告员卢多维奇·德诺耶教授,Facebook /索邦大学审查员越南圣迈IMT Atlantic高级讲师邀请弗洛里安·斯特鲁布博士,Deepmind对于那些及时看到自己错误的人...3谢谢你首先,我要感谢我的两位博士生导师Olivier和Philippe。奥利维尔,"站在巨人的肩膀上"这句话对你来说完全有意义了。从科学上讲,你知道在这篇论文的(许多)错误中,你是我可以依
recommend-type

Python虚拟现实网络编程:多人互动体验的设计与实现

![Python虚拟现实网络编程:多人互动体验的设计与实现](https://img-blog.csdnimg.cn/4eac4f0588334db2bfd8d056df8c263a.png) # 1. Python虚拟现实网络编程概述 在当今数字化时代,Python作为一门充满活力的编程语言,以其简洁明了的语法和强大的社区支持,在网络编程和虚拟现实(VR)应用开发领域中占据着重要的地位。Python的虚拟现实网络编程不仅结合了网络技术与VR的交互特性,还为开发者提供了一个高效、灵活的编程环境,使得实现多人互动体验变得更加可行。 ## 1.1 虚拟现实技术与网络编程的融合 虚拟现实技术通
recommend-type

在MATLAB中,如何快速查找sin函数的帮助文档,并演示如何设置不同的数据显示格式来输出sin函数的计算结果?

在MATLAB命令行中,你可以使用多种方法来查找特定函数的帮助文档,例如sin函数的帮助信息。最直接的方式是使用`help`命令,即在MATLAB命令窗口输入`help sin`,系统将返回sin函数的详细帮助信息,包括它的描述、语法和使用例证。如果你想要查找包含特定关键字的帮助文档,可以使用`lookfor`命令,例如`lookfor trigonometry`将会列出所有与三角函数相关的帮助文档。 参考资源链接:[MATLAB公式与常用命令指南](https://wenku.csdn.net/doc/8945be0k58?spm=1055.2569.3001.10343) 为了以不同的