使用pytorch训练图像识别模型的代码

时间: 2024-05-16 12:12:31 浏览: 112

基于pytorch图像识别模型训练（源码+使用说明）

5星 · 资源好评率100%

以下是一个基本的使用 PyTorch 训练图像分类模型的代码示例：首先，导入必要的库和模块： ``` python import torch import torch.nn as nn import torch.optim as optim from torch.optim import lr_scheduler import numpy as np import torchvision from torchvision import datasets, models, transforms import matplotlib.pyplot as plt import time import os import copy ``` 接下来，定义数据增强和数据加载器： ``` python data_transforms = { 'train': transforms.Compose([ transforms.RandomResizedCrop(224), transforms.RandomHorizontalFlip(), transforms.ToTensor(), transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225]) ]), 'val': transforms.Compose([ transforms.Resize(256), transforms.CenterCrop(224), transforms.ToTensor(), transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225]) ]), } data_dir = '/path/to/dataset' image_datasets = {x: datasets.ImageFolder(os.path.join(data_dir, x), data_transforms[x]) for x in ['train', 'val']} dataloaders = {x: torch.utils.data.DataLoader(image_datasets[x], batch_size=4, shuffle=True, num_workers=4) for x in ['train', 'val']} dataset_sizes = {x: len(image_datasets[x]) for x in ['train', 'val']} class_names = image_datasets['train'].classes device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu") ``` 然后，定义模型： ``` python model_ft = models.resnet18(pretrained=True) num_ftrs = model_ft.fc.in_features model_ft.fc = nn.Linear(num_ftrs, 2) model_ft = model_ft.to(device) criterion = nn.CrossEntropyLoss() optimizer_ft = optim.SGD(model_ft.parameters(), lr=0.001, momentum=0.9) exp_lr_scheduler = lr_scheduler.StepLR(optimizer_ft, step_size=7, gamma=0.1) ``` 接下来，定义训练函数和验证函数： ``` python def train_model(model, criterion, optimizer, scheduler, num_epochs=25): since = time.time() best_model_wts = copy.deepcopy(model.state_dict()) best_acc = 0.0 for epoch in range(num_epochs): print('Epoch {}/{}'.format(epoch, num_epochs - 1)) print('-' * 10) for phase in ['train', 'val']: if phase == 'train': model.train() else: model.eval() running_loss = 0.0 running_corrects = 0 for inputs, labels in dataloaders[phase]: inputs = inputs.to(device) labels = labels.to(device) optimizer.zero_grad() with torch.set_grad_enabled(phase == 'train'): outputs = model(inputs) _, preds = torch.max(outputs, 1) loss = criterion(outputs, labels) if phase == 'train': loss.backward() optimizer.step() running_loss += loss.item() * inputs.size(0) running_corrects += torch.sum(preds == labels.data) if phase == 'train': scheduler.step() epoch_loss = running_loss / dataset_sizes[phase] epoch_acc = running_corrects.double() / dataset_sizes[phase] print('{} Loss: {:.4f} Acc: {:.4f}'.format( phase, epoch_loss, epoch_acc)) if phase == 'val' and epoch_acc > best_acc: best_acc = epoch_acc best_model_wts = copy.deepcopy(model.state_dict()) print() time_elapsed = time.time() - since print('Training complete in {:.0f}m {:.0f}s'.format( time_elapsed // 60, time_elapsed % 60)) print('Best val Acc: {:4f}'.format(best_acc)) model.load_state_dict(best_model_wts) return model def visualize_model(model, num_images=6): was_training = model.training model.eval() images_so_far = 0 fig = plt.figure() with torch.no_grad(): for i, (inputs, labels) in enumerate(dataloaders['val']): inputs = inputs.to(device) labels = labels.to(device) outputs = model(inputs) _, preds = torch.max(outputs, 1) for j in range(inputs.size()[0]): images_so_far += 1 ax = plt.subplot(num_images//2, 2, images_so_far) ax.axis('off') ax.set_title('predicted: {}'.format(class_names[preds[j]])) imshow(inputs.cpu().data[j]) if images_so_far == num_images: model.train(mode=was_training) return model.train(mode=was_training) ``` 最后，调用训练函数和可视化函数进行训练和可视化： ``` python model_ft = train_model(model_ft, criterion, optimizer_ft, exp_lr_scheduler, num_epochs=25) visualize_model(model_ft) plt.show() ```

阅读全文

使用pytorch训练图像识别模型的代码

相关推荐

基于PyTorch的昆虫图像识别Yolo模型

PyTorch下DenseNet模型训练与图像识别指南

基于pytorch图像识别模型训练（源码+使用说明）

基于PyTorch的图像识别

PyTorch基于卷积神经网络识别RMB项目源代码+模型文件+数据集,采用python中的PyTorch实现图像识别

基于Pytorch的验证码识别模型应用

action-recognition-models-pytorch:pytorch的动作识别模型

用于手写数字识别的Demo，使用pyTorch训练Minist数据集，导出ONNX模型文件.zip

pytorch 3D视频动作识别代码

AlexNet卷积神经网络图像分类Pytorch训练代码 使用Cifar100数据集

基于pytorch的数字识别神经网络代码

GPU加速的Pytorch迁移学习图像识别模型实战

使用PyTorch实现的OCR识别技术代码详解

PyTorch图像二维码识别完整实现教程

PyTorch 1.0.0深度学习模型：图像处理预训练模型集

Pytorch声纹识别EcapaTdnn模型参数文件详解

基于PyTorch的ResNet表情识别模型训练指南

pyTorch训练Minist手写数字识别Demo及ONNX模型导出

使用PyTorch实现奥特曼识别的CNN项目教程

最新推荐

用Pytorch训练CNN(数据集MNIST,使用GPU的方法)

Pytorch提取模型特征向量保存至csv的例子

Pytorch实现的手写数字mnist识别功能完整示例

RuoYi-Vue3(1).zip

MATLAB实现小波阈值去噪：Visushrink硬软算法对比

管理建模和仿真的文件

【交互特征的影响】：分类问题中的深入探讨，如何正确应用交互特征

c语言从链式队列 中获取头部元素并返回其状态的函数怎么写

易语言实现画板图像缩放功能教程

"互动学习：行动中的多样性与论文攻读经历"

AlexNet卷积神经网络图像分类Pytorch训练代码使用Cifar100数据集

c语言从链式队列中获取头部元素并返回其状态的函数怎么写