没有合适的资源?快使用搜索试试~ 我知道了~
首页深度学习之--CNN卷积神经网络__整理版.docx
深度学习之--CNN卷积神经网络__整理版.docx
需积分: 20 224 浏览量
更新于2023-05-26
评论
收藏 12.72MB DOCX 举报
前段时间学习了BP网络和CNN网络,做了一些笔记,整理了相关公式推导,以及一些扩展,算是比较全面的深度学习入门资料啦~
资源详情
资源评论
资源推荐

一、卷积
1.1 卷积的概念
图 1
“卷”,指的是函数的翻转,从 g(t) 变成 g(-t) 的这个过程;
“积”,指的是滑动积分/加权求和。
先对 g 函数进行翻转,再平移到 n 处,在这个位置对两个函数的对应点相乘再相加。
1.2 卷积的物理含义
如图 2 所示,输入信号是 f(t),是随时间变化的;系统响应函数是 g(t) ,图中的响应函数是随
时间指数下降的,也就是说:在时间 t 内,每个时刻产生的输入信号在当前时刻的响应是最强的,
比如在 t=0 时刻有一个输入,那么这个最先产生的输入将随着时间的流逝不断衰减;那么到了 t=T
时刻,此时产生的输入 f(T)会具有最强的响应 g(0),而原来在 t=0 时刻的输入 f(0)的值已经衰减为
f(0)g(T)。

图 2
如 3 图所示,在 T=10 时刻,输出结果跟图中带标记的区域整体有关。其中,f(10)因为是在
t=10 这个时刻刚输入的,因此对应最强的响应,其输出结果为 f(10)g(0),而时刻 t=9 的输入 f(9),
只经过了 1 个时间单位的衰减,所以产生的输出应该是 f(9)g(1),如此类推,即图中虚线所描述的
关系。这些对应点相乘然后累加,就是 T=10 时刻的输出信号值,这个结果也是 f 和 g 两个函数在
T=10 时刻的卷积值。
图 3
为了更好的表示信号间的对应相乘,如图 4,首先需要把 g 函数翻转变成 g(-t):
图 4
最后进一步平移 T 个单位:

图 5
1.3 CNN 中的卷积操作
如图 6,假设输入图像像素为 n×n,卷积核(过滤器)大小为 f×f,步长为 s(默认为 1),那么卷
积后输出的大小为[(n−f)/s+1]×[(n−f)/s+1],由于没有进行全零填充(无 padding),输出的数据维度
会减少,对边缘信息获取不充分;所以我们可以采取 padding 操作来解决这个问题,假设 padding
的长度为 p,由于在二维情况下,上下左右都会“添加”长度为 p的数据,因此构造新的输入大小为
[(n+2p)/s]×[(n+2p)/s] , 卷积后的输出变为[(n+2p−f)/s+1]×[(n+2p−f)/s+1]。
图 6
如图 7,输入是一张灰度图,我们可以用不同的卷积核实现多个方向的特征图提取:

图 7
剩余19页未读,继续阅读

















安全验证
文档复制为VIP权益,开通VIP直接复制

评论0