TensorFlow实现AlexNet深度学习网络详解

39 浏览量更新于2024-08-30 收藏 55KB PDF 举报

"本文主要介绍了如何使用TensorFlow实现AlexNet模型，包括AlexNet的基本网络结构以及每一层的具体配置。AlexNet是深度学习领域的一个经典模型，最初在2012年的ImageNet图像识别大赛上取得了突破性的成绩。" 在深度学习领域，AlexNet是一个里程碑式的模型，它由Alex Krizhevsky、Ilya Sutskever和Geoffrey Hinton共同提出。这个模型在2012年的ImageNet Large Scale Visual Recognition Challenge (ILSVRC) 中，以其出色的性能引起了广泛的关注。AlexNet的结构对后来的深度学习模型设计产生了深远的影响。 AlexNet的网络结构通常包含以下几个部分： 1. 输入层（Input Layer）：输入是224x224像素的三通道RGB图像。在实际应用中，为了保持图像的比例，会通过padding将图像尺寸调整为227x227。 2. C1卷积层（Convolutional Layer 1）： - 卷积层：使用96个11x11大小的卷积核，步长(stride)为4，这使得输出特征图的尺寸为55x55。由于GPU的计算限制，特征图被分割成两半，每半48个特征图。 - 激活函数：使用ReLU（Rectified Linear Unit），它引入了非线性，有助于模型学习更复杂的特征。 - 最大池化(MaxPooling)：使用3x3的池化窗口，步长为2，将特征图尺寸减半至27x27。 - 局部响应归一化(LRN)：这是一种正则化技术，通过考虑邻近神经元的活动来抑制过强的激活，提高网络的泛化能力。 3. C2卷积层（Convolutional Layer 2）： - 卷积层：使用256个5x5大小的卷积核，步长为1，使用padding以保持输入和输出尺寸相同，输出特征图为27x27。同样，特征图被分成两半，每半128个特征图。 - 激活函数：依然使用ReLU。 - 最大池化：与C1层相同，将特征图尺寸减半至13x13。 - LRN：继续进行局部响应归一化。 4. C3卷积层（Convolutional Layer 3）： - 卷积层：包含384个3x3大小的卷积核，步长为1，无padding，因此输出特征图尺寸减小。 - 激活函数：ReLU。 - 此层没有最大池化和LRN。接着是更多的卷积层、全连接层（FC， Fully Connected Layers）和一个Softmax分类层，用于最终的图像分类。全连接层将高维特征图转换为固定长度的向量，最后的Softmax层将这些向量转化为概率分布，表示属于各个类别的概率。在TensorFlow中实现AlexNet，可以按照上述结构定义网络的每一层，包括卷积层（使用`tf.keras.layers.Conv2D`）、池化层（`tf.keras.layers.MaxPooling2D`）、ReLU激活（`tf.keras.layers.ReLU`）以及LRN（需要自定义实现，因为TensorFlow官方库未提供）。同时，使用GPU进行并行计算以加速训练过程。 AlexNet通过引入更深的网络结构、ReLU激活函数和有效的正则化策略，大大提升了深度学习模型在图像识别任务上的表现。其在TensorFlow中的实现，不仅加深了我们对深度学习模型的理解，也为实际项目提供了参考。

《《2020/02/18》》tensorflow学习系列学习系列3——AlexNet简单介绍及简单介绍及

TensorFlow实现实现

https://www.cnblogs.com/charlotte77/p/7987904.html

https://github.com/steelOneself/tensorflow_learn/blob/master/AlexNet/AlexNet.py

tensorflow实现AlexNet

ps: 仅供自己学习使用

AlextNet 网络结构网络结构

Input输入层输入层

输入为224*224*3的三通道RGB图像，为方便后续计算，实际操作中通过padding处理，把图像变成227*227*3

1. C1卷积层卷积层

该层由: 卷积操作 + Max Pooling + LRN组成。

1. 卷积层: 由96个feature map组成, 每个feature map由11*11卷积核在stride=4下生成，输出feature map为55*55*48*2，

其中55=(227-11)/4+1,48为分在每个GPU上的feature map数, 2为GPU个数;

2. 激活函数: 采用ReLU;

3. Max Pooling: 采用stride=2且核大小为3*3, 输出feature map为27*27*48*2, 其中27=(55-3)/2+1, 48为分在每个GPU上的feature map数, 2为GPU个数;

4. LRN: 邻居数设置为5做归一化。

最终输出数据为归一化后的: 27*27*48*2

2. C2卷积层卷积层

该层由: 卷积操作 + Max Pooling + LRN组成。

1. 卷积层: 由256个feature map组成, 每个feature map由5*5卷积核在stride=1下生成, 为使输入和卷积输出大小一致,

需要做参数为2的padding, 输出feature map 为27*27*128*2, 128为分在每个GPU上的feature map数, 2为GPU数。

2. 激活函数: 采用ReLU。

3. Max Pooling: 采用stride=2且核大小为3*3, 输出feature map为13×13×128×2，其中13=(27-3)/2+1，128为分在每个GPU上的feature map数，2为GPU个

数；

4. LRN: 邻居数设置为5做归一化。

3. C3卷积层卷积层

该层由: 卷积操作 + LRN组成(注意, 没有Max Pooling)

1. 输入为13*13*256, 因为这一层两个GPU会做通信

2. 卷积层: 之后由384个feature map组成, 每个feature map由3*3卷积核在stride=1下生成, 为使输入和卷积输出大小一致,

需要做参数为1的padding, 输出feature map为13*13*192*2, 192为分在每个GPU上的feature map数, 2为GPU个数;

3. 激活函数, 采用ReLU;

4. C4卷积层卷积层

该层由: 卷积操作 + LRN组成(注意, 没有Max Pooling)

1. 卷积层: 由384个feature组成，同C3

2. 激活函数, 采用ReLU;

5. C5卷积层卷积层

该层由：卷积操作 + Max Pooling组成

1. 卷积层：由256个feature map组成，每个feature map由3*3卷积核在stride=1下生成，为使输入和卷积输出大小一致,

需要做参数为1的padding, 输出feature map为13*13*128*2, 128为分在每个GPU上的feature map数, 2为GPU个数;

2. 激活函数, 采用ReLU;

3. Max Pooling: 采用stride=2且核大小为3*3，输出feature map为6*6*128*2。

最终输出数据为归一化后的: 6*6*128*2

F6全连接层全连接层

该层为全连接层 + Dropout

使用4096个节点；

激活函数：采用ReLU；

采用参数为0.5的Dropout操作

最终输出数据为4096个神经元节点。

F7全连接层全连接层

该层为全连接层 + Dropout

使用4096个节点；

激活函数：采用ReLU；

采用参数为0.5的Dropout操作

最终输出为4096个神经元节点。

输出层输出层

该层为全连接层 + Softmax

使用1000个输出的Softmax

最终输出为1000个分类。

下载后可阅读完整内容，剩余3页未读，立即下载

weixin_38610052

粉丝: 6
资源: 942

TensorFlow实现AlexNet深度学习网络详解

tensorflow实现AlexNet训练mnist数据

AlexNet卷积神经网络-猫狗大战（分类）.zip

alexnet-tensorflow:使用AlexNet的钢缺陷图像分类

基于tensorflow的深度学习论文复现(包括经典的AlexNet, VGGNet).zip

Test2_alexnet_alexnettensorflow_tensorflow_

tensorflow-基于Tensorflow实现的SqueezeNet算法.zip

word2vec.pdf+计算机视觉.pdf文档 基于python+tensorflow《深度学习在互联网上的应用》——寒小阳

Tensorflow资料

深度学习推理加速工具——tensorrtx

ImageNet，MNIST在线手写体识别，基于Tensorflow, Django实现.zip

最新资源

word2vec.pdf+计算机视觉.pdf文档基于python+tensorflow《深度学习在互联网上的应用》——寒小阳