深度学习基础：卷积、池化与1x1卷积解析

需积分: 0 128 浏览量更新于2024-08-05 收藏 1.4MB PDF 举报

“深度学习（预览版）1” 在深度学习领域，卷积神经网络（CNN）是处理图像、语音和文本数据的关键技术。本文将探讨其中的一些核心概念，包括卷积、池化、正则化、不同的卷积类型以及它们在提升模型性能中的作用。卷积公式描述了卷积层如何从输入数据生成输出特征图。卷积运算通过应用滤波器（或称为卷积核）在输入数据上滑动，每个位置的乘积累加形成一个输出像素。这种运算允许网络学习到输入数据的局部特征，并通过多层堆叠形成更复杂的表示。 1x1卷积，尽管其卷积核大小仅为1x1，但其作用不可忽视。它主要用作通道间的信息融合和维度压缩，减少网络的计算量和参数数量，同时保持模型的表达能力。循环神经网络（RNN）和长短时记忆网络（LSTM）是处理序列数据的模型。RNN因其循环结构能处理时间序列信息，但存在梯度消失问题；LSTM通过门控机制解决了这一问题，更有效地捕捉长期依赖。模型不收敛可能由多种原因导致，如学习率设置不当、初始化问题、过拟合或欠拟合、数据质量问题等。正则化是防止过拟合的一种策略，如L1和L2正则化，以及dropout技术，它随机关闭一部分神经元以减少模型复杂性。批量归一化（BN）和组归一化（GroupNormalization）都是用于加速训练并提高模型稳定性的技术。BN通过对每批数据进行归一化，改善内部协变量位移；而GroupNormalization则按通道分组进行归一化，适用于小批量或单样本训练。 VGG网络使用多个小的3x3卷积核代替大卷积核，可以达到同样的感受野，同时减少了参数数量，增加了网络深度。 ReLU激活函数相对于sigmoid和tanh有更快的训练速度和更好的梯度传播，但其缺点是在负区间内输出全为0，可能导致“死亡ReLU”问题。 Dropout是一种正则化方法，它在训练期间随机丢弃一部分神经元，迫使其他神经元学习更通用的特征，从而减少过拟合。空洞卷积（Dilated Convolution）通过跳过某些位置的卷积，扩大了卷积的感受野，无需增加更多的参数或计算量。转置卷积（也称为上采样卷积）常用于卷积神经网络的反向传播过程，用于增大输出尺寸，恢复原始输入的空间分辨率。分组卷积（GroupConvolution）将输入通道分成多个子组，每个子组有自己的卷积核，减少了计算量，但保持模型性能。深度可分离卷积（Depthwise Separable Convolution）将深度卷积和1x1卷积结合，首先对每个输入通道独立进行卷积，然后进行通道间的卷积，大大减少了计算成本，常用于移动设备上的轻量级网络。这些概念构成了深度学习的基础，理解和掌握它们对于构建高效且准确的深度学习模型至关重要。

LSTM的门：

输入门：

输出门：



遗忘门：

候选记忆：

cell的产生的新的记忆：

cell的输出：

导致模型不收敛的原因

没有对数据做归一化。

没有检查过你的结果。这里的结果包括预处理结果和最终的训练测试结果。

忘了做数据预处理。

忘了使用正则化。

Batch Size设的太大。

学习率设的不对。

最后一层的激活函数用的不对。

网络存在坏梯度。比如Relu对负值的梯度为0，反向传播时，0梯度就是不传播。

参数初始化错误。

网络太深。隐藏层神经元数量错误。

剩余10页未读，继续阅读

晕过前方

粉丝: 1130
资源: 328

深度学习基础：卷积、池化与1x1卷积解析

Python深度学习库TensorTrade发布首个预览版

《动手学深度学习》中文版v2课程详情介绍

深度学习500问：GitHub高星开源教程揭秘

深度学习调参-google automl 预览版

ARM Cortex-M4微控制器深度实战V1.0[预览版]

深度学习标注工具

OpenCV 5.0 预览版压缩包几功能模块介绍；OpenCV 5.0 预览版压缩包几功能模块介绍；OpenCV 5.0 预览版

labelme深度学习标注工具

WSL2安装深度学习环境

深度学习标注工具 3.0源码

最新资源