PyTorch实现Pokemon识别：ResNet详细代码与数据集教程

62 浏览量更新于2024-08-30 收藏 96KB PDF 举报

"这篇文章主要介绍了如何使用PyTorch实现基于ResNet模型的Pokemon图像分类，提供了详细的代码示例和数据集获取链接。作者首先定义了一个`Pokemon`类，用于处理数据集中的图片和对应的标签，然后构建了ResNet模型的核心模块ResBlock，接着搭建了完整的ResNet网络结构。在设置超参数后，通过`DataLoader`加载数据，初始化模型，设定损失函数、优化器和评估方法，最后进行训练和检验。" 在PyTorch中，构建深度学习模型通常涉及以下几个关键步骤： 1. **定义数据处理类**：在本例中，`Pokemon`类继承自`torch.utils.data.Dataset`，它是一个抽象基类，用于表示一个数据集。`__init__`方法接收文件路径`root`，图片尺寸`resize`以及数据集模式`mode`（训练、测试或验证）。`name2label`字典用于将宝可梦种类映射到唯一的整数标签。作者遍历文件夹，为每个种类创建一个唯一的标签。 2. **构建ResBlock**：ResBlock是ResNet的核心组件，它包含两个卷积层和一个跳跃连接（skip connection），使得网络能够学习残差。在ResNet中，这种设计有助于解决梯度消失和爆炸问题，使得深度网络训练更为有效。 3. **搭建ResNet**：ResNet的构建通常包括多个阶段，每个阶段由若干个ResBlock组成。阶段之间的通道数可能不同，通过`downsample`操作保持输入和输出的尺寸一致。在PyTorch中，可以使用`nn.Sequential`来组合这些模块。 4. **设置超参数**：这包括学习率、批次大小、优化器类型（如SGD或Adam）、损失函数（如交叉熵损失）等。这些超参数的选择对模型的性能至关重要，通常需要通过实验调整找到最优组合。 5. **数据加载**：使用`DataLoader`将数据集分批加载，这可以提高内存效率并实现数据增强，如随机翻转、缩放等。`DataLoader`接收`Dataset`实例，以及批次大小、 shuffle选项等参数。 6. **初始化模型、损失函数和优化器**：根据定义的网络结构创建模型实例，设置损失函数（如`nn.CrossEntropyLoss`）用于计算预测与真实标签之间的差异，选择优化器（如`optim.SGD`）更新模型参数。 7. **训练与检验**：在训练过程中，模型会迭代遍历数据集，计算损失，更新权重，并在验证集上进行性能评估。训练过程可能还包括模型保存和调参等步骤，以优化模型性能。这个项目提供了一个完整的端到端示例，展示了如何使用PyTorch进行图像分类任务，特别是对于自定义数据集的处理和ResNet模型的实现，对于初学者来说是非常有价值的参考。

pytorch:pokemon+resnet详细代码详细代码+数据集数据集

文章目录文章目录一.定义一个Pokemon的类，用于获取图片以及对应的label二.构建resblock三.搭建resnet四.设置一些超参数五.载入

数据六.初始化模型，设置loss_function/optimizer/evaluation七.开始训练,并进行检验

import torch

from torch import nn

from torch.nn import functional as F

from torchvision import transforms

from torch.utils.data import DataLoader,Dataset

from torch import optim

import os

import csv

from PIL import Image

import warnings

warnings.simplefilter('ignore')

一一.定义一个定义一个Pokemon的类，用于获取图片以及对应的的类，用于获取图片以及对应的label

pokemon数据集请戳：

缦旋律的资源合集.

对于自定义数据集，并使用DataLoader划分batch不熟悉的，可以戳：

自定义数据集+DataLoader.

class Pokemon(Dataset):

def __init__(self,root,resize,mode): #root是文件路径，resize是对原始图片进行裁剪，mode是选择模式（train、test、validation）

super(Pokemon,self).__init__()

self.root = root

self.resize = resize

self.name2label = {} #给每个种类分配一个数字，以该数字作为这一类别的label

#name是宝可梦的种类，e.g：pikachu

for name in sorted(os.listdir(os.path.join(self.root))): #listdir返回的顺序不固定，加上一个sorted使每一次的顺序都一样

if not os.path.isdir(os.path.join(self.root,name)):#os.path.isdir()用于判断括号中的内容是否是一个未压缩的文件夹

continue

self.name2label[name] = len(self.name2label.keys())

print(self.name2label)

self.images,self.labels = self.load_csv('images&labels.csv')

#将全部数据分成train、validation、test

if mode == 'train': #前60%作为训练集

self.images = self.images[:int(0.6*len(self.images))] self.labels = self.labels[:int(0.6*len(self.labels))] elif mode == 'val':

#60%~80%作为validation

self.images = self.images[int(0.6*len(self.images)):int(0.8*len(self.images))] self.labels =

self.labels[int(0.6*len(self.labels)):int(0.8*len(self.labels))] else: #后20%作为test set

self.images = self.images[int(0.8*len(self.images)):] self.labels = self.labels[int(0.8*len(self.labels)):]

def load_csv(self,filename):

#载入原始图片的路径，并保存到指定的CSV文件中，然后从该CSV文件中再次读入所有图片的存储路径和label。

#如果CSV文件已经存在，则直接读入该CSV文件的内容

#为什么保存的是图片的路径而不是图片？因为直接保存图片可能会造成内存爆炸

if not os.path.exists(os.path.join(self.root,filename)): #如果filename这个文件不存在，那么执行以下代码，创建file

images = [] for name in self.name2label.keys():

#glob.glob()返回的是括号中的路径中的所有文件的路径

# += 是把glob.glob（）返回的结果依次append到image中，而不是以一个整体append

# 这里只用了png/jpg/jepg是因为本次实验的图片只有这三种格式，如果有其他格式请自行添加

images += glob.glob(os.path.join(self.root,name,'*.png'))

images += glob.glob(os.path.join(self.root,name,'*.jpg'))

images += glob.glob(os.path.join(self.root,name,'*.jpeg'))

print(len(images))

random.shuffle(images) #把所有图片路径顺序打乱

with open(os.path.join(self.root,filename),mode='w',newline='') as f: #将图片路径及其对应的数字标签写到指定文件中

writer = csv.writer(f)

for img in images: #img e.g：'./pokemon/pikachu\00000001.png'

name = img.split(os.sep)[-2] #即取出‘pikachu’

label = self.name2label[name] #根据name找到对应的数字标签

writer.writerow([img,label]) #把每张图片的路径和它对应的数字标签写到指定的CSV文件中

print('image paths and labels have been writen into csv file:',filename)

#把数据读入（如果filename存在就直接执行这一步，如果不存在就先创建file再读入数据）

images,labels = [],[] with open(os.path.join(self.root,filename)) as f:

reader = csv.reader(f)

下载后可阅读完整内容，剩余3页未读，立即下载

weixin_38724229

粉丝: 8
资源: 917

PyTorch实现Pokemon识别：ResNet详细代码与数据集教程

目标检测数据集（三）drone-dataset-3.zip

PyTorch-SE-ResNet:SE-ResNet PyTorch版本

目标检测数据集.txt

pytorch + torchvision + resnet + finetune + dataset

video-classification-3d-cnn-pytorch：使用3D ResNet的视频分类工具

课程设计 基于PyTorch+PyQt+Flask+resnet的动物图像分类系统的设计与实现+详细文档+全部资料（高分项目）

基于pytorch实现CNN+VGG+resnet人脸表情识别源码+项目说明.zip

【毕业设计】基于pytorch实现CNN+VGG+resnet人脸表情识别源码+项目说明.zip

pytorch：表情识别模型ResNet

Pytorch实现：使用ResNet18网络训练Cifar10数据集，测试集准确率达到95.4

最新资源

课程设计基于PyTorch+PyQt+Flask+resnet的动物图像分类系统的设计与实现+详细文档+全部资料（高分项目）