imgs = loader_train.__iter__().next()[0].view(batch_size, 784).numpy(),怎么修改

时间: 2024-04-15 11:27:38 浏览: 146
要修改这行代码,你可以使用以下方式: ```python imgs = next(iter(loader_train))[0].view(batch_size, 784).numpy() ``` 这里使用`next(iter(loader_train))`来替代`loader_train.__iter__().next()`。这两种方法是等效的,都是获取`loader_train`中的下一个batch数据。然后使用`.view(batch_size, 784)`来改变数据的形状,并最后使用`.numpy()`将数据转换为NumPy数组。
相关问题

i_test = 0 print('-'*30) print('Creating test images...') print('-'*30) imgs_test = glob.glob(self.test_path+"/*."+"bmp") print(len(imgs_test)) imgdatas_test = np.ndarray((len(imgs_test),self.img_rows,self.img_cols,1), dtype=np.uint8) for imgname_test in imgs_test: midname_test = imgname_test[imgname_test.rindex("/")+1:] img_test = load_img(self.test_path + "/" + midname_test,grayscale = True) #img_test = scipy.io.loadmat(self.test_path + "/" + midname_test) #img_test = img_test['src'] #img_test=img_test.resize(hw) img_test = img_to_array(img_test) imgdatas_test[i_test] = img_test i_test += 1 print('loading test images done') imgs_test = imgdatas_test.astype('float32') imgs_test /= 255 return imgs_train, imgs_mask_train, imgs_test

这段代码是用于读取测试数据集中的图像数据,并将其转换为一个numpy数组。具体来说,它首先通过glob函数获取测试数据集中所有.bmp文件的路径,然后利用load_img函数将每个图像转换为numpy数组,并存储到imgdatas_test数组中。最后,它将imgdatas_test数组中的元素转换为float32类型,并将它们归一化到[0,1]的范围内。函数返回imgs_train, imgs_mask_train, imgs_test三个numpy数组。

讲解代码实现的功能 def initFaces(self): # 存储知道人名列表 known_names = [] # 存储知道的特征值 known_encodings = [] # 遍历存储人脸图片的文件夹 db_folder = "images/db_faces" face_imgs = os.listdir(db_folder) # 遍历图片,将人脸图片转化为向量 for face_img in face_imgs: face_img_path = os.path.join(db_folder, face_img) face_name = face_img.split(".")[0] load_image = face_recognition.load_image_file(face_img_path) # 加载图片 image_face_encoding = face_recognition.face_encodings(load_image)[0] # 获得128维特征值 known_names.append(face_name) # 添加到人名的列表 known_encodings.append(image_face_encoding) # 添加到向量的列表 return known_names, known_encodings

这段代码实现了一个初始化人脸向量的函数,其主要功能为: 1. 创建两个空列表 known_names 和 known_encodings,分别用于存储已知人脸的名称和特征向量; 2. 遍历存储人脸图片的文件夹 db_folder,获取其中的所有人脸图片文件名; 3. 对于每个人脸图片文件 face_img,将其路径拼接到 db_folder 上,然后使用 face_recognition 库中的 load_image_file() 函数加载图片,并使用 face_encodings() 函数获取该图片的128维特征向量; 4. 将该图片的人名 face_name 添加到 known_names 列表中,将特征向量 image_face_encoding 添加到 known_encodings 列表中; 5. 最终返回 known_names 和 known_encodings 两个列表。 这个函数实现的目的是将已知人脸的特征向量存储下来,用于后续的人脸识别任务。具体地说,当系统需要识别一个人脸时,它会计算该人脸的特征向量,然后与已知人脸的特征向量进行比对,以确定该人脸的身份。
阅读全文

相关推荐

# 定义数据集读取器 def load_data(mode='train'): # 数据文件 datafile = './data/data116648/mnist.json.gz' print('loading mnist dataset from {} ......'.format(datafile)) data = json.load(gzip.open(datafile)) train_set, val_set, eval_set = data # 数据集相关参数,图片高度IMG_ROWS, 图片宽度IMG_COLS IMG_ROWS = 28 IMG_COLS = 28 if mode == 'train': imgs = train_set[0] labels = train_set[1] elif mode == 'valid': imgs = val_set[0] labels = val_set[1] elif mode == 'eval': imgs = eval_set[0] labels = eval_set[1] imgs_length = len(imgs) assert len(imgs) == len(labels), \ "length of train_imgs({}) should be the same as train_labels({})".format( len(imgs), len(labels)) index_list = list(range(imgs_length)) # 读入数据时用到的batchsize BATCHSIZE = 100 # 定义数据生成器 def data_generator(): if mode == 'train': random.shuffle(index_list) imgs_list = [] labels_list = [] for i in index_list: img = np.reshape(imgs[i], [1, IMG_ROWS, IMG_COLS]).astype('float32') img_trans=-img #转变颜色 label = np.reshape(labels[i], [1]).astype('int64') label_trans=label imgs_list.append(img) imgs_list.append(img_trans) labels_list.append(label) labels_list.append(label_trans) if len(imgs_list) == BATCHSIZE: yield np.array(imgs_list), np.array(labels_list) imgs_list = [] labels_list = [] # 如果剩余数据的数目小于BATCHSIZE, # 则剩余数据一起构成一个大小为len(imgs_list)的mini-batch if len(imgs_list) > 0: yield np.array(imgs_list), np.array(labels_list) return data_generator

下面代码在tensorflow中出现了init() missing 1 required positional argument: 'cell'报错: class Model(): def init(self): self.img_seq_shape=(10,128,128,3) self.img_shape=(128,128,3) self.train_img=dataset # self.test_img=dataset_T patch = int(128 / 2 ** 4) self.disc_patch = (patch, patch, 1) self.optimizer=tf.keras.optimizers.Adam(learning_rate=0.001) self.build_generator=self.build_generator() self.build_discriminator=self.build_discriminator() self.build_discriminator.compile(loss='binary_crossentropy', optimizer=self.optimizer, metrics=['accuracy']) self.build_generator.compile(loss='binary_crossentropy', optimizer=self.optimizer) img_seq_A = Input(shape=(10,128,128,3)) #输入图片 img_B = Input(shape=self.img_shape) #目标图片 fake_B = self.build_generator(img_seq_A) #生成的伪目标图片 self.build_discriminator.trainable = False valid = self.build_discriminator([img_seq_A, fake_B]) self.combined = tf.keras.models.Model([img_seq_A, img_B], [valid, fake_B]) self.combined.compile(loss=['binary_crossentropy', 'mse'], loss_weights=[1, 100], optimizer=self.optimizer,metrics=['accuracy']) def build_generator(self): def res_net(inputs, filters): x = inputs net = conv2d(x, filters // 2, (1, 1), 1) net = conv2d(net, filters, (3, 3), 1) net = net + x # net=tf.keras.layers.LeakyReLU(0.2)(net) return net def conv2d(inputs, filters, kernel_size, strides): x = tf.keras.layers.Conv2D(filters, kernel_size, strides, 'same')(inputs) x = tf.keras.layers.BatchNormalization()(x) x = tf.keras.layers.LeakyReLU(alpha=0.2)(x) return x d0 = tf.keras.layers.Input(shape=(10, 128, 128, 3)) out= ConvRNN2D(filters=32, kernel_size=3,padding='same')(d0) out=tf.keras.layers.Conv2D(3,1,1,'same')(out) return keras.Model(inputs=d0, outputs=out) def build_discriminator(self): def d_layer(layer_input, filters, f_size=4, bn=True): d = tf.keras.layers.Conv2D(filters, kernel_size=f_size, strides=2, padding='same')(layer_input) if bn: d = tf.keras.layers.BatchNormalization(momentum=0.8)(d) d = tf.keras.layers.LeakyReLU(alpha=0.2)(d) return d img_A = tf.keras.layers.Input(shape=(10, 128, 128, 3)) img_B = tf.keras.layers.Input(shape=(128, 128, 3)) df = 32 lstm_out = ConvRNN2D(filters=df, kernel_size=4, padding="same")(img_A) lstm_out = tf.keras.layers.LeakyReLU(alpha=0.2)(lstm_out) combined_imgs = tf.keras.layers.Concatenate(axis=-1)([lstm_out, img_B]) d1 = d_layer(combined_imgs, df)#64 d2 = d_layer(d1, df * 2)#32 d3 = d_layer(d2, df * 4)#16 d4 = d_layer(d3, df * 8)#8 validity = tf.keras.layers.Conv2D(1, kernel_size=4, strides=1, padding='same')(d4) return tf.keras.Model([img_A, img_B], validity)

import torch, os, cv2 from model.model import parsingNet from utils.common import merge_config from utils.dist_utils import dist_print import torch import scipy.special, tqdm import numpy as np import torchvision.transforms as transforms from data.dataset import LaneTestDataset from data.constant import culane_row_anchor, tusimple_row_anchor if __name__ == "__main__": torch.backends.cudnn.benchmark = True args, cfg = merge_config() dist_print('start testing...') assert cfg.backbone in ['18','34','50','101','152','50next','101next','50wide','101wide'] if cfg.dataset == 'CULane': cls_num_per_lane = 18 elif cfg.dataset == 'Tusimple': cls_num_per_lane = 56 else: raise NotImplementedError net = parsingNet(pretrained = False, backbone=cfg.backbone,cls_dim = (cfg.griding_num+1,cls_num_per_lane,4), use_aux=False).cuda() # we dont need auxiliary segmentation in testing state_dict = torch.load(cfg.test_model, map_location='cpu')['model'] compatible_state_dict = {} for k, v in state_dict.items(): if 'module.' in k: compatible_state_dict[k[7:]] = v else: compatible_state_dict[k] = v net.load_state_dict(compatible_state_dict, strict=False) net.eval() img_transforms = transforms.Compose([ transforms.Resize((288, 800)), transforms.ToTensor(), transforms.Normalize((0.485, 0.456, 0.406), (0.229, 0.224, 0.225)), ]) if cfg.dataset == 'CULane': splits = ['test0_normal.txt', 'test1_crowd.txt', 'test2_hlight.txt', 'test3_shadow.txt', 'test4_noline.txt', 'test5_arrow.txt', 'test6_curve.txt', 'test7_cross.txt', 'test8_night.txt'] datasets = [LaneTestDataset(cfg.data_root,os.path.join(cfg.data_root, 'list/test_split/'+split),img_transform = img_transforms) for split in splits] img_w, img_h = 1640, 590 row_anchor = culane_row_anchor elif cfg.dataset == 'Tusimple': splits = ['test.txt'] datasets = [LaneTestDataset(cfg.data_root,os.path.join(cfg.data_root, split),img_transform = img_transforms) for split in splits] img_w, img_h = 1280, 720 row_anchor = tusimple_row_anchor else: raise NotImplementedError for split, dataset in zip(splits, datasets): loader = torch.utils.data.DataLoader(dataset, batch_size=1, shuffle = False, num_workers=1) fourcc = cv2.VideoWriter_fourcc(*'MJPG') print(split[:-3]+'avi') vout = cv2.VideoWriter(split[:-3]+'avi', fourcc , 30.0, (img_w, img_h)) for i, data in enumerate(tqdm.tqdm(loader)): imgs, names = data imgs = imgs.cuda() with torch.no_grad(): out = net(imgs) col_sample = np.linspace(0, 800 - 1, cfg.griding_num) col_sample_w = col_sample[1] - col_sample[0] out_j = out[0].data.cpu().numpy() out_j = out_j[:, ::-1, :] prob = scipy.special.softmax(out_j[:-1, :, :], axis=0) idx = np.arange(cfg.griding_num) + 1 idx = idx.reshape(-1, 1, 1) loc = np.sum(prob * idx, axis=0) out_j = np.argmax(out_j, axis=0) loc[out_j == cfg.griding_num] = 0 out_j = loc # import pdb; pdb.set_trace() vis = cv2.imread(os.path.join(cfg.data_root,names[0])) for i in range(out_j.shape[1]): if np.sum(out_j[:, i] != 0) > 2: for k in range(out_j.shape[0]): if out_j[k, i] > 0: ppp = (int(out_j[k, i] * col_sample_w * img_w / 800) - 1, int(img_h * (row_anchor[cls_num_per_lane-1-k]/288)) - 1 ) cv2.circle(vis,ppp,5,(0,255,0),-1) vout.write(vis) vout.release()

from pdb import set_trace as st import os import numpy as np import cv2 import argparse parser = argparse.ArgumentParser('create image pairs') parser.add_argument('--fold_A', dest='fold_A', help='input directory for image A', type=str, default='../dataset/50kshoes_edges') parser.add_argument('--fold_B', dest='fold_B', help='input directory for image B', type=str, default='../dataset/50kshoes_jpg') parser.add_argument('--fold_AB', dest='fold_AB', help='output directory', type=str, default='../dataset/test_AB') parser.add_argument('--num_imgs', dest='num_imgs', help='number of images',type=int, default=1000000) parser.add_argument('--use_AB', dest='use_AB', help='if true: (0001_A, 0001_B) to (0001_AB)',action='store_true') args = parser.parse_args() for arg in vars(args): print('[%s] = ' % arg, getattr(args, arg)) splits = os.listdir(args.fold_A) for sp in splits: img_fold_A = os.path.join(args.fold_A, sp) img_fold_B = os.path.join(args.fold_B, sp) img_list = os.listdir(img_fold_A) if args.use_AB: img_list = [img_path for img_path in img_list if '_A.' in img_path] num_imgs = min(args.num_imgs, len(img_list)) print('split = %s, use %d/%d images' % (sp, num_imgs, len(img_list))) img_fold_AB = os.path.join(args.fold_AB, sp) if not os.path.isdir(img_fold_AB): os.makedirs(img_fold_AB) print('split = %s, number of images = %d' % (sp, num_imgs)) for n in range(num_imgs): name_A = img_list[n] path_A = os.path.join(img_fold_A, name_A) if args.use_AB: name_B = name_A.replace('_A.', '_B.') else: name_B = name_A path_B = os.path.join(img_fold_B, name_B) if os.path.isfile(path_A) and os.path.isfile(path_B): name_AB = name_A if args.use_AB: name_AB = name_AB.replace('_A.', '.') # remove _A path_AB = os.path.join(img_fold_AB, name_AB) im_A = cv2.imread(path_A, cv2.IMREAD_COLOR) im_B = cv2.imread(path_B, cv2.IMREAD_COLOR) im_AB = np.concatenate([im_A, im_B], 1) cv2.imwrite(path_AB, im_AB),解释上述代码,并告诉我怎么设置文件夹格式

最新推荐

recommend-type

基于pytorch的UNet_demo实现及训练自己的数据集.docx

- `-b`表示批大小(batch size) - `-l`表示学习率 - `-s`表示缩放比例 - `-v`表示验证集比例 - **训练自己的数据集**: 调整数据集命名以保持一一对应,确保输入是3通道图像,输出是单通道掩模。如果遇到`...
recommend-type

重点服务业广州市科技和信息化网.pptx

重点服务业广州市科技和信息化网.pptx
recommend-type

R语言中workflows包的建模工作流程解析

资源摘要信息:"工作流程建模是将预处理、建模和后处理请求结合在一起的过程,从而优化数据科学的工作流程。工作流程可以将多个步骤整合为一个单一的对象,简化数据处理流程,提高工作效率和可维护性。在本资源中,我们将深入探讨工作流程的概念、优点、安装方法以及如何在R语言环境中使用工作流程进行数据分析和模型建立的例子。 首先,工作流程是数据处理的一个高级抽象,它将数据预处理(例如标准化、转换等),模型建立(例如使用特定的算法拟合数据),以及后处理(如调整预测概率)等多个步骤整合起来。使用工作流程,用户可以避免对每个步骤单独跟踪和管理,而是将这些步骤封装在一个工作流程对象中,从而简化了代码的复杂性,增强了代码的可读性和可重用性。 工作流程的优势主要体现在以下几个方面: 1. 管理简化:用户不需要单独跟踪和管理每个步骤的对象,只需要关注工作流程对象。 2. 效率提升:通过单次fit()调用,可以执行预处理、建模和模型拟合等多个步骤,提高了操作的效率。 3. 界面简化:对于具有自定义调整参数设置的复杂模型,工作流程提供了更简单的界面进行参数定义和调整。 4. 扩展性:未来的工作流程将支持添加后处理操作,如修改分类模型的概率阈值,提供更全面的数据处理能力。 为了在R语言中使用工作流程,可以通过CRAN安装工作流包,使用以下命令: ```R install.packages("workflows") ``` 如果需要安装开发版本,可以使用以下命令: ```R # install.packages("devtools") devtools::install_github("tidymodels/workflows") ``` 通过这些命令,用户可以将工作流程包引入到R的开发环境中,利用工作流程包提供的功能进行数据分析和建模。 在数据建模的例子中,假设我们正在分析汽车数据。我们可以创建一个工作流程,将数据预处理的步骤(如变量选择、标准化等)、模型拟合的步骤(如使用特定的机器学习算法)和后处理的步骤(如调整预测阈值)整合到一起。通过工作流程,我们可以轻松地进行整个建模过程,而不需要编写繁琐的代码来处理每个单独的步骤。 在R语言的tidymodels生态系统中,工作流程是构建高效、可维护和可重复的数据建模工作流程的重要工具。通过集成工作流程,R语言用户可以在一个统一的框架内完成复杂的建模任务,充分利用R语言在统计分析和机器学习领域的强大功能。 总结来说,工作流程的概念和实践可以大幅提高数据科学家的工作效率,使他们能够更加专注于模型的设计和结果的解释,而不是繁琐的代码管理。随着数据科学领域的发展,工作流程的工具和方法将会变得越来越重要,为数据处理和模型建立提供更加高效和规范的解决方案。"
recommend-type

管理建模和仿真的文件

管理Boualem Benatallah引用此版本:布阿利姆·贝纳塔拉。管理建模和仿真。约瑟夫-傅立叶大学-格勒诺布尔第一大学,1996年。法语。NNT:电话:00345357HAL ID:电话:00345357https://theses.hal.science/tel-003453572008年12月9日提交HAL是一个多学科的开放存取档案馆,用于存放和传播科学研究论文,无论它们是否被公开。论文可以来自法国或国外的教学和研究机构,也可以来自公共或私人研究中心。L’archive ouverte pluridisciplinaire
recommend-type

【工程技术中的数值分析秘籍】:数学问题的终极解决方案

![【工程技术中的数值分析秘籍】:数学问题的终极解决方案](https://media.geeksforgeeks.org/wp-content/uploads/20240429163511/Applications-of-Numerical-Analysis.webp) 参考资源链接:[东南大学_孙志忠_《数值分析》全部答案](https://wenku.csdn.net/doc/64853187619bb054bf3c6ce6?spm=1055.2635.3001.10343) # 1. 数值分析的数学基础 在探索科学和工程问题的计算机解决方案时,数值分析为理解和实施这些解决方案提供了
recommend-type

如何在数控车床仿真系统中正确进行机床回零操作?请结合手工编程和仿真软件操作进行详细说明。

机床回零是数控车床操作中的基础环节,特别是在仿真系统中,它确保了机床坐标系的正确设置,为后续的加工工序打下基础。在《数控车床仿真实验:操作与编程指南》中,你可以找到关于如何在仿真环境中进行机床回零操作的详尽指导。具体操作步骤如下: 参考资源链接:[数控车床仿真实验:操作与编程指南](https://wenku.csdn.net/doc/3f4vsqi6eq?spm=1055.2569.3001.10343) 首先,确保数控系统已经启动,并处于可以进行操作的状态。然后,打开机床初始化界面,解除机床锁定。在机床控制面板上选择回零操作,这通常涉及选择相应的操作模式或输入特定的G代码,例如G28或
recommend-type

Vue统计工具项目配置与开发指南

资源摘要信息:"该项目标题为'bachelor-thesis-stat-tool',是一个涉及统计工具开发的项目,使用Vue框架进行开发。从描述中我们可以得知,该项目具备完整的前端开发工作流程,包括项目设置、编译热重装、生产编译最小化以及代码质量检查等环节。具体的知识点包括: 1. Vue框架:Vue是一个流行的JavaScript框架,用于构建用户界面和单页应用程序。它采用数据驱动的视图层,并能够以组件的形式构建复杂界面。Vue的核心库只关注视图层,易于上手,并且可以通过Vue生态系统中的其他库和工具来扩展应用。 2. yarn包管理器:yarn是一个JavaScript包管理工具,类似于npm。它能够下载并安装项目依赖,运行项目的脚本命令。yarn的特色在于它通过一个锁文件(yarn.lock)来管理依赖版本,确保项目中所有人的依赖版本一致,提高项目的可预测性和稳定性。 3. 项目设置与开发流程: - yarn install:这是一个yarn命令,用于安装项目的所有依赖,这些依赖定义在package.json文件中。执行这个命令后,yarn会自动下载并安装项目所需的所有包,以确保项目环境配置正确。 - yarn serve:这个命令用于启动一个开发服务器,使得开发者可以在本地环境中编译并实时重载应用程序。在开发模式下,这个命令通常包括热重载(hot-reload)功能,意味着当源代码发生变化时,页面会自动刷新以反映最新的改动,这极大地提高了开发效率。 4. 生产编译与代码最小化: - yarn build:这个命令用于构建生产环境所需的代码。它通常包括一系列的优化措施,比如代码分割、压缩和打包,目的是减少应用程序的体积和加载时间,提高应用的运行效率。 5. 代码质量检查与格式化: - yarn lint:这个命令用于运行项目中的lint工具,它是用来检查源代码中可能存在的语法错误、编码风格问题、代码重复以及代码复杂度等问题。通过配置适当的lint规则,可以统一项目中的代码风格,提高代码的可读性和可维护性。 6. 自定义配置: - 描述中提到'请参阅',虽然没有具体信息,但通常意味着项目中会有自定义的配置文件或文档,供开发者参考,如ESLint配置文件(.eslintrc.json)、webpack配置文件等。这些文件中定义了项目的个性化设置,包括开发服务器设置、代码转译规则、插件配置等。 综上所述,这个项目集成了前端开发的常用工具和流程,展示了如何使用Vue框架结合yarn包管理器和多种开发工具来构建一个高效的项目。开发者需要熟悉这些工具和流程,才能有效地开发和维护项目。"
recommend-type

"互动学习:行动中的多样性与论文攻读经历"

多样性她- 事实上SCI NCES你的时间表ECOLEDO C Tora SC和NCESPOUR l’Ingén学习互动,互动学习以行动为中心的强化学习学会互动,互动学习,以行动为中心的强化学习计算机科学博士论文于2021年9月28日在Villeneuve d'Asq公开支持马修·瑟林评审团主席法布里斯·勒菲弗尔阿维尼翁大学教授论文指导奥利维尔·皮耶昆谷歌研究教授:智囊团论文联合主任菲利普·普雷教授,大学。里尔/CRISTAL/因里亚报告员奥利维耶·西格德索邦大学报告员卢多维奇·德诺耶教授,Facebook /索邦大学审查员越南圣迈IMT Atlantic高级讲师邀请弗洛里安·斯特鲁布博士,Deepmind对于那些及时看到自己错误的人...3谢谢你首先,我要感谢我的两位博士生导师Olivier和Philippe。奥利维尔,"站在巨人的肩膀上"这句话对你来说完全有意义了。从科学上讲,你知道在这篇论文的(许多)错误中,你是我可以依
recommend-type

74LS181逻辑电路设计:原理图到实际应用的速成课

参考资源链接:[4位运算功能验证:74LS181 ALU与逻辑运算实验详解](https://wenku.csdn.net/doc/2dn8i4v6g4?spm=1055.2635.3001.10343) # 1. 74LS181逻辑电路概述 ## 1.1 74LS181的定义与重要性 74LS181是一款广泛应用于数字逻辑设计的4位算术逻辑单元(ALU),它提供了一系列算术和逻辑运算功能,使得复杂的计算任务得以简化实现。该器件由16个引脚组成,是早期数字系统设计的核心组件之一。 ## 1.2 74LS181的应用背景 74LS181出现在计算机和数字电路设计的黄金时期,它支持多种二进制运
recommend-type

在集成电路测试中,如何根据JEDEC标准正确应用K因子校准方法来测量热阻?

对于从事半导体器件测试的工程师来说,掌握基于JEDEC标准的热阻测量方法是至关重要的。在这些方法中,K因子校准是确保热阻测量精度的关键步骤。为了帮助你深入理解并正确应用K因子校准方法,我们建议参考《JEDEC JESD51-1:集成电路热特性与电学测试》。这份文档详细介绍了如何进行K因子校准以及相关的测试流程。 参考资源链接:[JEDEC JESD51-1:集成电路热特性与电学测试](https://wenku.csdn.net/doc/3rddttq31q?spm=1055.2569.3001.10343) K因子校准方法涉及以下几个关键步骤: