常用的经典卷积神经网络

### 经典卷积神经网络架构 #### LeNet-5 架构 LeNet-5 是最早的卷积神经网络之一，由 Yann LeCun 提出。该网络主要用于手写字符识别任务。LeNet-5 的结构相对简单，主要包含两组卷积层和池化层，后面接两个全连接层。 ```python import torch.nn as nn class LeNet(nn.Module): def __init__(self): super(LeNet, self).__init__() self.conv1 = nn.Conv2d(in_channels=1, out_channels=6, kernel_size=5) self.pool1 = nn.MaxPool2d(kernel_size=2, stride=2) self.conv2 = nn.Conv2d(in_channels=6, out_channels=16, kernel_size=5) self.pool2 = nn.MaxPool2d(kernel_size=2, stride=2) self.fc1 = nn.Linear(16 * 4 * 4, 120) self.fc2 = nn.Linear(120, 84) self.fc3 = nn.Linear(84, 10) def forward(self, x): x = self.pool1(F.relu(self.conv1(x))) x = self.pool2(F.relu(self.conv2(x))) x = x.view(-1, 16 * 4 * 4) x = F.relu(self.fc1(x)) x = F.relu(self.fc2(x)) x = self.fc3(x) return x ``` #### AlexNet 架构 AlexNet 在 ImageNet 大规模视觉识别挑战赛 (ILSVRC) 中取得了优异的成绩。它引入了 ReLU 激活函数、Dropout 正则化技术以及数据增强方法来提高泛化能力[^1]。 ```python class AlexNet(nn.Module): def __init__(self, num_classes=1000): super(AlexNet, self).__init__() self.features = nn.Sequential( nn.Conv2d(3, 64, kernel_size=11, stride=4, padding=2), nn.ReLU(inplace=True), nn.MaxPool2d(kernel_size=3, stride=2), nn.Conv2d(64, 192, kernel_size=5, padding=2), nn.ReLU(inplace=True), nn.MaxPool2d(kernel_size=3, stride=2), nn.Conv2d(192, 384, kernel_size=3, padding=1), nn.ReLU(inplace=True), nn.Conv2d(384, 256, kernel_size=3, padding=1), nn.ReLU(inplace=True), nn.Conv2d(256, 256, kernel_size=3, padding=1), nn.ReLU(inplace=True), nn.MaxPool2d(kernel_size=3, stride=2), ) self.classifier = nn.Sequential( nn.Dropout(), nn.Linear(256 * 6 * 6, 4096), nn.ReLU(inplace=True), nn.Dropout(), nn.Linear(4096, 4096), nn.ReLU(inplace=True), nn.Linear(4096, num_classes), ) def forward(self, x): x = self.features(x) x = x.view(x.size(0), 256 * 6 * 6) x = self.classifier(x) return x ``` #### VGGNet 架构 VGGNet 使用非常深的堆叠方式构建卷积层，通过增加网络深度显著提升了模型性能。所有卷积核大小固定为 \(3 \times 3\) ，步幅设为 1 。最大池化窗口尺寸同样设置为 \(2 \times 2\)[^2]。 ```python cfgs = { 'A': [64, 'M', 128, 'M', 256, 256, 'M', 512, 512, 'M', 512, 512, 'M'], } def make_layers(cfg, batch_norm=False): layers = [] in_channels = 3 for v in cfg: if v == 'M': layers += [nn.MaxPool2d(kernel_size=2, stride=2)] else: conv2d = nn.Conv2d(in_channels, v, kernel_size=3, padding=1) if batch_norm: layers += [conv2d, nn.BatchNorm2d(v), nn.ReLU(inplace=True)] else: layers += [conv2d, nn.ReLU(inplace=True)] in_channels = v return nn.Sequential(*layers) class VGG(nn.Module): def __init__(self, features, num_classes=1000, init_weights=True): super(VGG, self).__init__() self.features = features self.avgpool = nn.AdaptiveAvgPool2d((7, 7)) self.classifier = nn.Sequential( nn.Linear(512 * 7 * 7, 4096), nn.ReLU(True), nn.Dropout(), nn.Linear(4096, 4096), nn.ReLU(True), nn.Dropout(), nn.Linear(4096, num_classes), ) if init_weights: self._initialize_weights() def forward(self, x): x = self.features(x) x = self.avgpool(x) x = torch.flatten(x, 1) x = self.classifier(x) return x vgg11 = VGG(make_layers(cfgs['A'])) ``` 这些经典 CNN 模型都具备良好的表征学习能力和平移不变分类特性，能够在不同位置检测相同的模式而不会影响最终结果[^3]。此外，随着网络层数加深，提取到的特征更加抽象且更具区分度[^4]。

阅读全文

常用的经典卷积神经网络

相关推荐

PyTorch实现经典卷积神经网络源码解析

卷积神经网络原理与应用：从神经网络到CNN

卷积神经网络详解：层级结构与实战应用

经典卷积神经网络应用实战项目

卷积神经网络,卷积神经网络原理,Python源码.zip

卷积神经网络经典代码代码

卷积神经网络

卷积神经网络9篇文章,卷积神经网络论文,Python源码.rar

卷积神经网络-使用Python实现的简单手写字识别卷积神经网络.zip

卷积神经网络CNN以及几种经典模型

经典卷积神经网络在机器视觉中的应用及不同数据集的特点

量子经典混合卷积神经网络在MNIST数据集的应用研究

常用卷积神经网络分类模型

cnn卷积神经网络包括VGG-Net卷积神经网络吗

基于卷积神经网络基于卷积神经网络猫狗识别猫狗识别代码

图像分类常用卷积神经网络，为什么

卷积神经网络实现手写数字识别卷积神经网络实现手写数字识别

常用的一维卷积神经网络

卷积神经网络经典模型结构图

深度学习训练营：经典卷积网络结构解析

大家在看

matlab-基于互相关的亚像素图像配准算法的matlab仿真-源码

OBD-PID.pdf

NPPExport_0.3.0_32位64位版本.zip

H.323协议详解

如何用IntelliJ开发Niagara4的模块

最新推荐

基于matlab的模拟滤波器和数字滤波器设计, 基于matlab的模拟滤波器和数字滤波器设计，其中数字滤波器包扩IIR和FIR的低通、高通、带通、带阻四大类型，模拟滤波器包括巴特沃斯( Butterw

GitHub Classroom 创建的C语言双链表实验项目解析

管理建模和仿真的文件

【三态RS锁存器CD4043的秘密】：从入门到精通的电路设计指南（附实际应用案例）

霍夫曼四元编码matlab

MATLAB在AWS上的自动化部署与运行指南

"互动学习：行动中的多样性与论文攻读经历"

铁路售票系统用例图：异常流处理的黄金法则

MySQL的jar包拷贝到sqoop/lib下的代码

Windows系统上运行Hadoop解决方案