深度卷积神经网络：图像处理中尺寸与参数的关系详解

153 浏览量更新于2024-08-28 1 收藏 388KB PDF 举报

图像处理中的深度卷积神经网络是一种广泛应用在计算机视觉任务中的模型，特别是用于图像分类和特征提取。其核心是卷积层，通过一系列参数如核尺寸(kernel size)、padding、stride等来控制输出尺寸。在深度神经网络架构中，这些参数对于保持空间信息和网络的可解释性至关重要。输出尺寸（oho_hoh,owo_wow）是由输入尺寸（nhn_hnh,nwn_wnw）以及卷积操作中的几个关键因素决定的。具体计算公式如下： - o_h = (n_h + p_h - k_h + s_h) / s_h - o_w = (n_w + p_w - k_w + s_w) / s_w 其中，n_h 和 n_w 分别代表输入的高度和宽度，p_h 和 p_w 是padding的数量（两侧各加pad/2），k_h 和 k_w 是核的尺寸，s_h 和 s_w 是stride的值。padding的作用是增加输入的空间，使得在不改变输出尺寸的情况下，可以保留更多的上下文信息，而stride则控制了卷积核在输入上的移动步长。举个例子，LeNet是早期的卷积神经网络模型，应用于MNIST数据集，其结构包括两个卷积层、两次平均池化（MaxPooling）和全连接层。在LeNet的第一层卷积中，kernel大小为6x5x5，pad为2，stride为1，这导致输出尺寸从28x28变为28x28。第二层卷积和池化则进一步缩小了特征图的尺寸，最终展平成一个400维的向量，用于全连接层的输入。 AlexNet是更复杂的深度卷积神经网络，它针对ImageNet数据集设计，输入尺寸为3通道的224x224。AlexNet通常包含多个卷积层、池化层和全连接层，每个部分都有不同的参数设置，旨在提取丰富的特征并进行精确的分类。理解这些参数之间的关系对于构建和调整深度卷积神经网络至关重要，因为它们直接影响模型的性能和计算效率。通过调整这些参数，可以实现从低级特征的提取到高级语义的理解，使得深度卷积神经网络在图像识别、物体检测、人脸识别等领域取得了显著的进步。

图像处理中的深度卷积神经网络图像处理中的深度卷积神经网络

输出尺寸（oho_hoh,owo_wow）与输入尺寸（nhn_hnh,nwn_wnw）、核尺寸（khk_hkh,kwk_wkw）、padding（php_hph,pwp_wpw）和

stride（sws_wsw,shs_hsh）的关系

oh=(nh+ph−kh+sh)/show=(nw+pw−kw+sw)/sw

o_h=(n_h+p_h-k_h+s_h)/s_h \

o_w=(n_w+p_w-k_w+s_w)/s_w

oh=(nh+ph−kh+sh)/show=(nw+pw−kw+sw)/sw

这里的php_hph,pwp_wpw表示两侧padding的和，即在单侧paddingph/2p_h/2ph/2,pw/2p_w/2pw/2

LeNet

Data:MNIST

Input:(batch_size,1,28,28)

1st Conv: kernel=6*5*5 pad=2 stride=1 -----> (28+4-5+1)/1=28 output.shape=(batch_size,6,28,28)

Sigmoid

1st AvgPool: kernel=2*2 pad=0 stride=2 -----> (28+0-2+2)/2=14 output.shape=(batch_size,6,14,14)

2st Conv: kernel=16*5*5 pad=0 stride=1 -----> (14+0-5+1)/1=10 output.shape=(batch_size,16,10,10)

Sigmoid

2st AvgPool: kernel=2*2 pad=0 stride=2 -----> (10+0-2+2)/2=5 output.shape=(batch_size,16,5,5)

Flatten: feature_map展成向量长度16*5*5=400 (batch_size,400)

1st FC: 权重矩阵400*120 (batch_size,120)

2st FC: 权重矩阵120*84 (batch_size,84)

3st FC: 权重矩阵84*10 (batch_size,10)

AlexNet

下载后可阅读完整内容，剩余4页未读，立即下载

weixin_38672731

粉丝: 5
资源: 952

深度卷积神经网络：图像处理中尺寸与参数的关系详解

基于python使用深度卷积神经网络的图像去噪设计与实现

深度卷积神经网络在计算机视觉中的应用研究综述_卢宏涛.pdf

面向大规模图像分类的深度卷积神经网络优化.pdf

FPGA图像处理中的卷积神经网络在滤波中的应用

图像处理入门：卷积神经网络基础解析

图像处理，基于深度卷积神经网络的图像篡改检测

卷积神经网络与深度卷积神经网络

深度卷积神经网络属于卷积神经网络吗

java笔试题算法-CNN-TA:使用深度卷积神经网络的算法金融交易：时间序列到图像转换方法：使用基于图像处理特性的二维卷积神经网络的新型算法

基于深度卷积神经网络图像去噪算法

最新资源