VGG19与图像分类：从深度学习的基本单元到实战应用

需积分: 0 67 浏览量更新于2024-07-01 收藏 3.15MB PDF 举报

本章节主要探讨的是深度学习中的一个重要组成部分——卷积神经网络(CNN)在图像处理中的应用，特别是北大版实验手册的第三章，着重介绍如何使用VGG19网络进行图像分类。VGG19是一个经典的深度卷积网络架构，它在图像识别领域取得了显著的成功。实验目的分为三个关键点： 1. 深入理解深度卷积神经网络的基础组件，包括卷积层和最大池化层，通过Python实现VGG19的前向传播，这有助于后续在风格迁移任务中计算风格损失。 2. 将已有的三层神经网络扩展到VGG19网络，强化对神经网络工程实现中模块演化过程的认识，为构建更复杂的应用提供基础。 3. 实践操作层面，要求编写约300行代码，预计耗时3小时，以加深对网络结构的实际操作和优化。卷积层是CNN的核心组件，其特点是具有可学习的滤波器（卷积核），能够检测输入数据中的局部特征并提取空间不变性。每层卷积层之后通常接一个ReLU激活函数，用于引入非线性，增强模型表达能力。N个卷积层之后通常会插入一个最大池化层，用于减小特征图尺寸、减少计算量和提高模型的稳健性，常采用最大值池化或平均池化策略。最大池化层通过取每个子区域内的最大值作为输出，有助于保留最重要的特征信息。之后的卷积特征会被映射到多个输出特征上，这些特征会通过全连接层进行进一步处理，直至最终输出层，如softmax层用于多分类问题。实验进程和工作量安排是实践学习的重要部分，旨在让学生逐步掌握深度学习的基本实践技巧。通过这个实验，学生不仅能够了解VGG19的结构，还能将其应用于实际场景，如图像分类，为后续的图像风格迁移等高级任务打下坚实基础。此外，整个实验设计是以第2章的基础实验框架为基础，递进式地引入和扩展新的技术，使得学习者能在实践中理解和掌握深度学习的基本理论和实践操作。通过阅读这部分内容，读者可以深入理解卷积神经网络的工作原理，并能够在实际项目中灵活运用。

智能计算系统实验教程

于将最大池化层（pool5）输出的四维特征图矩阵变形为二维矩阵作为全连接层的输入。最

大池化层和 flatten 层中没有参数，不包含参数初始化和参数加载操作。

卷积层：程序示例如图3.3所示，定义了以下成员函数。

• 层的初始化：需要定义卷积的超参数，包括卷积核的高（或宽）K、输入特征图的通

道数 C

、输出特征图通道数 C

out

、特征图边界扩充大小 p、卷积步长 s 等。

• 参数初始化：卷积层的参数包括权重（卷积核）和偏置。与全连接层类似，通常用高

斯随机数初始化权重的值，而将偏置的所有值初始化为 0。

• 前向传播计算：根据公式(3.1)和(3.3)可进行卷积层的前向传播计算。首先利用公式(3.1)对

输入特征图进行边界扩充。之后利用公式(3.3)将卷积核与边界扩充后的特征图计算矩阵内

积并与偏置相加获得当前位置的输出特征图结果，将卷积核进行滑动获得整个输出特征图

的结果。在工程实现中，最简单直接的实现方式是利用四重循环计算输出特征图所有位置

的值。由于 VGG19 网络中的所有卷积层都是 3 ×3 卷积核，即 K = 3，边界扩充大小 p = 1，

步长 s = 1，因此 VGG19 网络中的所有卷积层输出特征图的高和宽与输入特征图保持相同。

• 参数加载：从该函数的输入中读取本层的权重 W 和偏置 b。

1 c l a s s C o n v o l u t i o n a l L a y e r ( o b j e c t ) :

2 d e f _ _ i n i t _ _ ( s e l f , k e r n e l _ s i z e , c h a n n e l _ i n , c h a n n e l _ o u t , pa d d i ng , s t r i d e ) :

3 # 卷积层的初始化

4 s e l f . k e r n e l _ s i z e = k e r n e l _ s i z e

5 s e l f . c h a n n e l _ i n = c h a n n e l _ i n

6 s e l f . c h a n n e l _ o u t = c h a n n e l _ o u t

7 s e l f . p a d d i n g = pa d d i n g

8 s e l f . s t r i d e = s t r i d e

9 d e f i n i t _ p a r a m ( s e l f , s t d = 0 . 0 1 ) : # 参数初始化

10 s e l f . w e i g h t = np . random . nor m a l ( l o c = 0 . 0 , s c a l e = s t d , s i z e =( s e l f . c h a n n e l _ i n , s e l f .

k e r n e l _ s i z e , s e l f . k e r n e l _ s i z e , s e l f . c h a n n e l _ o u t ) )

11 s e l f . b i a s = np . z e r o s ( [ s e l f . c h a n n e l _ o u t ] )

12 d e f fo r w a r d ( s e l f , i n p u t ) : # 前向传播的计算

13 s e l f . i n p u t = i n p u t # [ N , C , H, W]

14 # 边界扩充

15 h e i g h t = __________ _ _ _ _ ________ _ _ _ _ __

16 w i d t h = _______ _ _ _ _ _______ _ _ _ _ ______

17 s e l f . i n p u t _ p a d = np . z e r o s ( [ s e l f . i n p u t . s h a p e [ 0 ] , s e l f . i n p u t . s h a p e [ 1 ] , h e i g h t ,

w i d t h ] )

18 s e l f . i n p u t _ p a d [ ________ _ _ _ ________ _ _ _ _ _____ ] = s e l f . i n p u t

19 h e i g h t _ o u t = __ _ _______ _ _ _ _ ________ _ _ _ _ __

20 w i d t h _ o u t = _ _ _ ________ _ _ _ ________ _ _ _ _ __

21 s e l f . o u t p u t = np . z e r o s ( [ s e l f . i n p u t . s h a p e [ 0 ] , s e l f . c h a n n e l _ o u t , h e i g h t _ o u t ,

w i d t h _ o u t ] )

22 f o r i d x n in r a n g e ( s e l f . i n p u t . s h a p e [ 0 ] ) :

23 f o r i d x c in r a n g e ( s e l f . c h a n n e l _ o u t ) :

24 f o r id x h i n ra n g e ( h e i g h t _ o u t ) :

25 f o r idxw i n r a n g e ( w i d t h _ o u t ) :

26 # TODO：计算卷积层的前向传播，特征图与卷积核的内积再加偏置

27 s e l f . o u t p u t [ i d x n , idx c , id x h , idxw ] = ____ _ _ _ _ ________ _ _ _ _ ______

28 r e t u r n s e l f . o u t p u t

29 d e f loa d _ p a ra m ( s e l f , we i g h t , b i a s ) : # 参数加载

30 s e l f . w e i g h t = we i g h t

31 s e l f . b i a s = b i a s

图 3.3 卷积层的实现示例

最大池化层：程序示例如图3.4所示，定义了以下成员函数。

教学使用，请勿传播

中科院计算所

剩余27页未读，继续阅读

战神哥

粉丝: 852
资源: 325

VGG19与图像分类：从深度学习的基本单元到实战应用

Lab 3 - 实验手册1

实验手册1

1.0实验手册.rar

第二章实验手册（北大版）1

"深度学习实验手册：三层神经网络设计与实现

实验1 Shell命令基础

TerraExplorer_Pro中文用户手册

C语言实验指导书（初学者实验指导）

数据库大作业指导手册-20201

数据库大作业指导手册-20211

最新资源