VGG16、VGG16_bigConv、GoogLeNet_V3与ResNet18：深度解析与Keras实战

156 浏览量更新于2024-08-29 收藏 561KB PDF 举报

本文主要探讨了主流卷积神经网络结构的深入解析与Keras实现，重点关注了三种知名网络模型：VGG16、VGG16_bigConv、GoogLeNet_V3以及ResNet18。以下是对这些网络结构的详细介绍及其在Keras框架下的实现： 3.1 VGG16 VGG16是Visual Geometry Group提出的一种深度卷积神经网络，其特点是具有多个连续的3x3卷积层，通过堆叠大量小卷积核来提取图像特征。在Keras实现中，构建的模型首先包含一个带有权重衰减（weight_decay）的卷积层，采用'valid'填充方式，确保输出尺寸不变，然后添加批量归一化层以加速收敛。 3.2 VGG16_bigConv VGG16_bigConv可能是VGG16的一个变体，增加了更大的卷积核或更深的网络结构。具体细节没有明确说明，但通常会在保持VGG16基本结构的基础上进行扩展。 3.3 GoogLeNet_V3 GoogLeNet（Inception-V3）是Google开发的深度学习模型，其核心在于引入了Inception模块，包含了不同大小的卷积核以捕捉不同尺度的特征。Inception-V3在Keras中的实现可能涉及多分支卷积、池化和连接操作。 3.4 ResNet18 ResNet（Residual Network）通过残差块解决了深度网络训练过程中的梯度消失问题，ResNet18是其基础版，有18层深度。在Keras中，它会包含一系列残差单元，每个单元包含一个或多个残差块，有助于网络更深地学习特征。 3.5 模型对比这部分讨论了这些模型在训练过程中的收敛性能对比，可能会涉及到训练速度、准确率、过拟合程度等指标。通过比较，可以更好地理解每种网络结构对于特定任务的适应性和效率。附录A中提到的Keras使用技巧和常见问题： A.1 函数类 - categorical_crossentropy和sparse_categorical_crossentropy：前者适用于类别数量固定的多分类问题，而后者则用于类别数量可变的情况。两者的主要区别在于数据格式和计算方法。 - keras.fit、fit_generator和train_on_batch：fit用于训练单个样本或生成器产生的批次数据，fit_generator用于处理生成器生成的数据，train_on_batch则是对单个batch进行训练。 A.2 BUG类这部分记录了在使用Keras过程中遇到的一些问题，包括可能的错误原因、解决方案或工作原理上的误解。本文深入剖析了主流卷积神经网络的结构和Keras实现方法，对于理解这些网络的工作原理和优化实践具有重要意义。同时，通过比较不同模型的性能，读者可以更有效地选择适合自己的网络架构。

主流卷积神经网络结构探索和分析（三）主流卷积神经网络结构探索和分析（三）

主流卷积神经网络结构探索和分析（三）主流卷积神经网络结构探索和分析（三）3 VGG16，VGG16_bigConv， GoogLeNet_V3及ResNet18网络结构详解及Keras实现方法3.1 VGG163.2 VGG16_bigConv3.3

GoogLeNet_V33.4 ResNet183.5 模型对比3.5.1 模型训练过程中的收敛情况对比附录A. keras踩坑记录A.1. 函数类A.1.1 categorical_crossentropy 和

sparse_categorical_crossentropy 的区别在哪？A.1.2 keras fit、fit_generator和train_on_batch的区分A.2. BUG类

接上一片的内容，本篇博客主要讨论（一）中分析的网络具体结构及keras实现方法

3 VGG16，，VGG16_bigConv，， GoogLeNet_V3及及ResNet18网络结构详解及网络结构详解及Keras实现方法实现方法

3.1 VGG16

前面的博客已经对VGG16的思路进行了阐述，这里直接给出VGG16的网络结构图。

keras代码如下：

def build_vgg16_model(weight_decay, num_classes, x_shape,learning_rate, lr_decay):

# Build the network of vgg for 10 classes with massive dropout and weight decay as described in the paper.

print('start model')

model = Sequential()

# weight_decay = self.weight_decay

print('start 1st Conv2D')

#model.add(Conv2D(64, (3, 3), padding='same', input_shape=x_shape, kernel_regularizer=regularizers.l2(weight_decay)))

model.add(Conv2D(64, (3, 3), padding='same', input_shape=x_shape, kernel_regularizer=regularizers.l2(weight_decay)))