CNN发展历程：从LeNet到Inception-v2的关键组件与经典网络结构

版权申诉

5星 · 超过95%的资源 79 浏览量更新于2024-06-26 收藏 3.27MB PDF 举报

CNN基本网络结构的发展历程可以追溯到早期的LeNet5，它是第一个将卷积层、池化层和全连接层结合的经典架构。LeNet5由两层卷积层（5×5的卷积核，步长为1）和两次最大池化操作，之后是两个全连接层，主要用于图像识别任务。随后，AlexNet引入了更为深度的网络设计和创新技术。它包括五个卷积层、三个全连接层，ReLU激活函数的应用显著增强了网络的非线性表达能力。为了防止过拟合，AlexNet采用了Dropout和数据增强策略，以及利用LRN（局部响应归一化）来增强特征学习。同时，AlexNet通过双GPU并行训练加快了模型训练速度。 VGGNet进一步推动了深度学习在计算机视觉领域的应用，它采用堆叠3×3卷积核来模拟更大感受野，且加深网络层次，增加了卷积核数量。然而，VGGNet也认识到过深网络可能导致过拟合，因此在每一组卷积层后增加最大池化层以减小模型大小。 GoogLeNet（Inception-v1）针对深度与参数量的关系进行了优化。它提出了一种“inception”模块，通过不同尺寸的卷积核以及1×1卷积来控制参数量，提高了网络对多尺度特征的捕捉能力，同时保持了计算效率。这一设计在减少过拟合的同时，提升了模型的泛化性能。 Inception-v2在此基础上引入了批量标准化（Batch Normalization，BN）技术，BN有助于加速收敛、提高模型稳定性和泛化能力。BN通过标准化每个批次的输入，使得网络的学习更加稳定，从而在不增加参数的情况下提高了网络的性能。总结来说，CNN的发展从最初的局部感知逐步深化，从LeNet5到AlexNet再到VGGNet，再到GoogLeNet和Inception系列，网络结构越来越复杂，技术不断迭代，如卷积核大小的选择、池化操作、激活函数、正则化方法和标准化技术等，这些都在持续推动着计算机视觉领域的进步。每一阶段的进步都体现了对模型复杂度、计算效率和过拟合问题的精细调控。

4. GoogLeNet(inception v1)

从 VGG 中我们了解到，网络层数越深效果越好。但是随

着模型越深参数越来越多，这就导致网络比较容易过拟合，

需要提供更多的训练数据；另外，复杂的网络意味更多的计

算量，更大的模型存储，需要更多的资源，且速度不够快。

GoogLeNet 就是从减少参数的角度来设计网络结构的。

GoogLeNet 通过增加网络宽度的方式来增加网络复杂

度，让网络可以自己去应该如何选择卷积核。这种设计减少

了参数，同时提高了网络对多种尺度的适应性。使用了 1×

1 卷积可以使网络在不增加参数的情况下增加网络复杂度。

剩余18页未读，继续阅读

apple_51426592

粉丝: 9848
资源: 9652

CNN发展历程：从LeNet到Inception-v2的关键组件与经典网络结构

CNN基本网络结构发展简史超全总结.docx

CNN基本入门总结（归纳）

CNN基本入门总结（归纳）下

CNN、DNN、RNN学习总结.pdf

卷积神经网络CNN代码解析mb.pdf

卷积神经网络（CNN）.pdf

【深度学习】一文搞懂卷积神经网络（CNN）的原理（超详细）_卷积神经网络原理-CSDN博客.pdf

卷积神经网络概述.pdf

人工神经网络基础培训PPT.pdf

LeNet-5结构的卷积神经网络-CNN.zip

最新资源