深度解析LeNet、AlexNet、VGG、NiN与GoogLeNet：卷积层与全连接层的较量

130 浏览量更新于2024-08-30 2 收藏 443KB PDF 举报

本文档主要介绍了五个经典的深度学习卷积神经网络模型：LeNet、AlexNet、VGG、NiN（网络中的网络）和GoogLeNet，以及它们在深度学习领域的应用和优势。文章首先讨论了全连接层与卷积层之间的对比，强调了全连接层的局限性，如对图像特征空间关系处理的不足和对大尺寸图像的处理困难，而卷积层则通过局部连接和共享权重来解决这些问题。 LeNet是最早的卷积神经网络之一，它由卷积层和全连接层组成，适用于手写数字识别任务。LeNet包含两个卷积层块，每个卷积层后面跟着一个最大池化层，以捕捉图像特征并减少对位置的依赖。全连接层用于分类，输出层有10个节点对应10个类别。文章提供了LeNet在PyTorch中的实现示例，展示了如何导入必要的库并构建模型结构。 AlexNet是深度学习的转折点，它引入了更深的网络结构和ReLU激活函数，显著提高了识别性能。AlexNet模型有多个卷积层、池化层和全连接层，使用Dropout防止过拟合。文中也给出了AlexNet在PyTorch中的实现，展示了如何构建多层网络结构。 VGGNet，尤其是VGG16和VGG19，以其深度和简单的卷积核设计而闻名。VGG模型的特点是大量使用3x3的小卷积核，减少了参数数量。文章没有提供VGG的详细实现，但提到了其结构特点。 NiN，即网络中的网络，它引入了全局平均池化层替代全连接层，有效地减少了参数数量并保持了输入的空间信息。NiN模型在PyTorch中的实现展示了网络架构的灵活性和创新。 GoogLeNet，也称为Inception模块，采用了Inception块的设计，利用不同大小的卷积核并行提取特征，大大提高了模型效率。GoogLeNet在精度和效率之间取得了很好的平衡。文章提到了完整Inception块的结构，并展示了其在PyTorch中的实现方法。本篇文章深入剖析了这些经典模型，不仅阐述了它们在深度学习领域的发展和应用，还提供了在PyTorch平台上的实现代码，供读者理解和实践。通过对比全连接层和卷积层的优势，有助于理解深度学习模型的设计思想和优化策略。

LeNet、、AlexNet、、VGG、、NiN、、GoogLeNet

文章目录文章目录LeNet、AlexNet、VGG、NiN、GoogLeNet全连接层与卷积层的优势对比LeNetLeNet模型LeNet的pytorch实现AlexNetAlexNet模型AlexNet的pytorch实现VGGVGG模型

VGG的实现NiN(网络中的网络）NiN模型NiN的pytorch实现GooLeNetInception块完整goolenet模型GooLeNet的pytorch小结

LeNet、、AlexNet、、VGG、、NiN、、GoogLeNet

全连接层与卷积层的优势对比全连接层与卷积层的优势对比

使用全连接层的局限性：

图像在同一列邻近的像素在这个向量中可能相距较远。它们构成的模式可能难以被模型识别。

对于大尺寸的输入图像，使用全连接层容易导致模型过大。

使用卷积层的优势：

卷积层保留输入形状。

卷积层通过滑动窗口将同一卷积核与不同位置的输入重复计算，从而避免参数尺寸过大

LeNet

LeNet模型模型

LeNet分为卷积层块和全连接层块两个部分。

LeNet网络结构

卷积层块里的基本单位是卷积层后接最大池化层：卷积层用来识别图像里的空间模式，如线条和物体局部，之后的最大池化层则用来降低卷积层对位置的敏感性。卷积层块由两个这

样的基本单位重复堆叠构成。在卷积层块中，每个卷积层都使用5×55\times 55×5的窗口，并在输出上使用sigmoid激活函数。第一个卷积层输出通道数为6，第二个卷积层输出通道数

则增加到16。这是因为第二个卷积层比第一个卷积层的输入的高和宽要小，所以增加输出通道使两个卷积层的参数尺寸类似。卷积层块的两个最大池化层的窗口形状均为2×22\times

22×2，且步幅为2。由于池化窗口与步幅形状相同，池化窗口在输入上每次滑动所覆盖的区域互不重叠。

卷积层块的输出形状为(批量大小, 通道, 高, 宽)。当卷积层块的输出传入全连接层块时，全连接层块会将小批量中每个样本变平（flatten）。也就是说，全连接层的输入形状将变成二

维，其中第一维是小批量中的样本，第二维是每个样本变平后的向量表示，且向量长度为通道、高和宽的乘积。全连接层块含3个全连接层。它们的输出个数分别是120、84和10，其

中10为输出的类别个数。

LeNet的的pytorch实现实现

#import

import sys

sys.path.append("../")

import d2lzh1981 as d2l

import torch

import torch.nn as nn

import torch.optim as optim

import time

class Flatten(torch.nn.Module): #展平操作

def forward(self, x):

return x.view(x.shape[0], -1)

class Reshape(torch.nn.Module): #将图像大小重定型

def forward(self, x):

return x.view(-1,1,28,28) #(B x C x H x W)

net = torch.nn.Sequential( #Lelet

Reshape(),

nn.Conv2d(in_channels=1, out_channels=6, kernel_size=5, padding=2), #b*1*28*28 =>b*6*28*28

nn.Sigmoid(),

nn.AvgPool2d(kernel_size=2, stride=2), #b*6*28*28 =>b*6*14*14

nn.Conv2d(in_channels=6, out_channels=16, kernel_size=5), #b*6*14*14 =>b*16*10*10

nn.Sigmoid(),

nn.AvgPool2d(kernel_size=2, stride=2), #b*16*10*10 => b*16*5*5

Flatten(), #b*16*5*5 => b*400

nn.Linear(in_features=16*5*5, out_features=120),

nn.Sigmoid(),

nn.Linear(120, 84),

nn.Sigmoid(),

nn.Linear(84, 10)

)

AlexNet

LeNet: 在大的真实数据集上的表现并不尽如意。

1.神经网络计算复杂。

2.还没有量深研究参数初始化和凸优化算法等诸多领域。

机器学习的特征提取:手工定义的特征提取函数

神经网络的特征提取：通过学习得到数据的多级表征，并逐级表越来越抽象的概念或模式。

神经网络发展的限制:数据、硬件

AlexNet模型模型

AlexNet使用了8层卷积神经网络，并以很大的优势赢得了ImageNet 2012图像识别挑战赛。它首次证明了学习到的特征可以超越手工设计的特征，从而一举打破计算机视觉研究的前

状。

下载后可阅读完整内容，剩余5页未读，立即下载

weixin_38612811

粉丝: 5
资源: 931

深度解析LeNet、AlexNet、VGG、NiN与GoogLeNet：卷积层与全连接层的较量

NIN网络模型模块

《动手学深度学习》卷积神经网络LeNet

深度卷积神经网络LeNet-5和ResNet的对比以及应用分析

AlexNet、VGG11、NiN、GoogLeNet等网络的Pytorch实现

深度学习之LENET网络、AlexNet网络、VGG网络、NiN网络中的网络、GoogLeNet网络

深度学习经典网络详解：LeNet-5到GoogLeNet

26网络中的网络NiN.zip

深度学习（五）————卷积神经网络基础、leNet、卷积神经网络进阶

《动手学深度学习》Task05：卷积神经网络基础+LeNet+卷积神经网络进阶

深度学习进阶：AlexNet与VGG，探索CNN发展与GPU挑战

最新资源