迁移学习：ResNet模型在椅子识别中的微调实践

66 浏览量更新于2024-08-30 收藏 146KB PDF 举报

"L23模型微调finetuning，涉及ResNet18模型，以及ImageNet数据集的使用，探讨了微调作为迁移学习的一种方法，用于处理中等规模数据集的问题。" 在深度学习领域，微调是迁移学习的一个重要策略，尤其在面对数据集规模介于小型和大规模之间的情况时。例如， Fashion-MNIST数据集虽小，易于训练，而ImageNet数据集则极其庞大，包含上千万张图像和数千类别，适合训练复杂的模型。但在实际应用中，我们常常遇到的是规模介于两者之间的数据集，如识别特定类型椅子的数据集。微调的基本思想是利用预训练的大型模型，如ResNet18这样的模型，该模型已经在类似ImageNet这样庞大的数据集上进行了充分的训练，学习到了丰富的视觉特征。在微调过程中，首先，我们会在源数据集（如ImageNet）上对模型进行预训练，使其掌握通用的图像表示能力。这些预训练的模型能够捕捉到图像中的边缘、纹理、形状等基本特征，这些特征对于多种任务都是通用的。接下来，针对新的目标数据集，我们创建一个新的模型，保留预训练模型（源模型）的大部分结构和参数，但移除或替换与新任务不匹配的部分，比如最后的分类层。这是因为源模型的输出层通常是为源数据集的类别设计的，对于新的任务（如识别椅子的类别）可能并不适用。于是，我们在目标模型中添加一个新的输出层，其大小与目标数据集的类别数量相匹配，并随机初始化这个新层的参数。在新模型构建完成后，我们使用目标数据集进行训练，只更新新增的输出层和可能需要调整的其他层（例如，有时我们会选择只微调最后几层，以防止对预训练特征的过度修改）。这种训练过程通常需要较少的迭代次数，因为模型已经从源数据集中学习到了基础的表示能力。微调的优势在于，它能够有效利用预训练模型的知识，减少在目标数据集上训练的时间和资源。在数据量有限的情况下，微调可以帮助我们获得更好的性能，避免模型过拟合，同时提高模型泛化能力。尽管微调并非总是必要的，但对于那些数据量不足或者难以获取大量标注数据的任务，它是一种非常实用的解决方案。

L23模型微调模型微调fine tuning

resnet185352

链接：https://pan.baidu.com/s/1EZs9XVUjUf1MzaKYbJlcSA

提取码：axd1

9.2 微调微调

在前面的一些章节中，我们介绍了如何在只有6万张图像的Fashion-MNIST训练数据集上训练模型。我们还描述了学术界当下

使用最广泛的大规模图像数据集ImageNet，它有超过1,000万的图像和1,000类的物体。然而，我们平常接触到数据集的规模

通常在这两者之间。

假设我们想从图像中识别出不同种类的椅子，然后将购买链接推荐给用户。一种可能的方法是先找出100种常见的椅子，为每

种椅子拍摄1,000张不同角度的图像，然后在收集到的图像数据集上训练一个分类模型。这个椅子数据集虽然可能比Fashion-

MNIST数据集要庞大，但样本数仍然不及ImageNet数据集中样本数的十分之一。这可能会导致适用于ImageNet数据集的复杂

模型在这个椅子数据集上过拟合。同时，因为数据量有限，最终训练得到的模型的精度也可能达不到实用的要求。

为了应对上述问题，一个显而易见的解决办法是收集更多的数据。然而，收集和标注数据会花费大量的时间和资金。例如，为

了收集ImageNet数据集，研究人员花费了数百万美元的研究经费。虽然目前的数据采集成本已降低了不少，但其成本仍然不

可忽略。

另外一种解决办法是应用迁移学习（transfer learning），将从源数据集学到的知识迁移到目标数据集上。例如，虽然

ImageNet数据集的图像大多跟椅子无关，但在该数据集上训练的模型可以抽取较通用的图像特征，从而能够帮助识别边缘、

纹理、形状和物体组成等。这些类似的特征对于识别椅子也可能同样有效。

本节我们介绍迁移学习中的一种常用技术：微调（fine tuning）。如图9.1所示，微调由以下4步构成。

在源数据集（如ImageNet数据集）上预训练一个神经网络模型，即源模型。

创建一个新的神经网络模型，即目标模型。它复制了源模型上除了输出层外的所有模型设计及其参数。我们假设这些模型参数

包含了源数据集上学习到的知识，且这些知识同样适用于目标数据集。我们还假设源模型的输出层跟源数据集的标签紧密相

关，因此在目标模型中不予采用。

为目标模型添加一个输出大小为目标数据集类别个数的输出层，并随机初始化该层的模型参数。

在目标数据集（如椅子数据集）上训练目标模型。我们将从头训练输出层，而其余层的参数都是基于源模型的参数微调得到

的。

当目标数据集远小于源数据集时，微调有助于提升模型的泛化能力。

9.2.1 热狗识别热狗识别

接下来我们来实践一个具体的例子：热狗识别。我们将基于一个小数据集对在ImageNet数据集上训练好的ResNet模型进行微

调。该小数据集含有数千张包含热狗和不包含热狗的图像。我们将使用微调得到的模型来识别一张图像中是否包含热狗。

首先，导入实验所需的包或模块。torchvision的models包提供了常用的预训练模型。如果希望获取更多的预训练模型，可以使

用使用pretrained-models.pytorch仓库。

%matplotlib inline

import torch

from torch import nn, optim

from torch.utils.data import Dataset, DataLoader

import torchvision

from torchvision.datasets import ImageFolder

from torchvision import transforms

from torchvision import models

import os

下载后可阅读完整内容，剩余3页未读，立即下载

weixin_38670531

粉丝: 5
资源: 951

迁移学习：ResNet模型在椅子识别中的微调实践

Python-ScikitLearn风格的NLP微调FineTuning模块

openai/chatgpt微调/fine-tuning/测试用/投喂资源

微调fine-tuning.pdf

Scikit-Learn风格的NLP微调(Fine Tuning)模块-python

微调fine-tuning 微调通过训练⽐prompt所能容纳的更多的示例.pdf

TensorFlow中的模型微调（Fine-tuning）

TensorFlow模型微调（Fine-tuning）策略与技巧

PyTorch中的模型微调（Fine-tuning）技巧分享

语言模型Fine-tuning技术详解

TensorFlow目标检测实践：模型Fine-tuning

最新资源