DFT池化：提升视觉分类的变换不变性方法

80 浏览量更新于2024-06-20 收藏 1.23MB PDF 举报

"基于DFT的变换不变池层视觉分类技术是JongbinRyu、Ming-Hsuan Yang和Jongwoo Lim等研究者提出的一种改进的卷积神经网络(CNN)方法，主要应用于图像识别和分类。该技术利用离散傅立叶变换(DFT)来增强CNN的平移不变性和形状保持能力，从而提高分类准确性。在传统的CNN架构中，池化层如最大池化或平均池化可能因图像错位导致信息损失。DFT幅度池化则通过保持关键结构信息，解决了这一问题。 1. DFT在CNN中的应用 - 离散傅立叶变换是一种用于分析信号频率成分的技术，当应用于图像处理时，可以揭示图像的空间频率信息。 - 在CNN中，DFT幅度池化层替代了传统的池化层，保留了基于傅立叶变换的移位定理的平移不变性，这意味着即使图像位置有所变化，分类性能依然保持稳定。 2. DFT+方法 - 除了直接使用DFT幅度池化，研究者还提出了一种名为DFT+的方法，它结合了中间卷积层的输出，进一步增强了网络的性能。 - DFT+方法通过集成多个层次的特征，增强了网络对复杂模式的识别能力，有助于提升分类准确率。 3. 实验与评估 - 提出的方法在多个数据集上进行了广泛的评估，包括ImageNet、CUB2010-2011、MIT Indoors、Caltech101、FMD和DTD，涵盖了各种视觉分类任务。 - 使用了AlexNet、VGG-VD16、Inception-v3和ResNet作为基础网络，实验证明DFT和DFT+方法在所有网络和数据集上都提升了分类性能。 4. 解决未对准问题 - 传统的CNN模型，如AlexNet和VGG-VD，全连接层会保留所有信息，但可能会受到目标对象在图像中位置、大小和方向的影响。 - GoogleNet、ResNet和Inception等现代模型通过平均池化层缓解了这个问题，但DFT幅度池化提供了一种更有效的方法来处理图像错位，同时保持重要特征。 5. 结构比较 - 图1展示了常规CNN结构与DFT幅度池化的对比。DFT将输入特征图的每个通道进行变换，然后使用幅度信息传递到全连接层。 - DFT幅度池化的第一元素相当于平均值，但保留了更多的频域信息，这对于正确分类至关重要。基于DFT的变换不变池层技术为CNN提供了更强的鲁棒性，特别是在处理图像变形和未对准情况时，这为视觉分类任务带来了显著的性能提升。这一创新方法有望在图像识别领域产生广泛的影响。

J. Ryu，M.- H. Yang和J. Lim

为了评估所提出的算法的性能，我们进行了广泛的实验与各种基

准数据库和基础网络。我们表明，DFT和DFT

方法一致，显着提高了

国家的最先进的基线算法在不同类型的分类任务。

我们在这项工作中做出了以下贡献

(i)

我们提出了一种新的DFT幅度池的基础上的傅里叶变换的二维移位

定理。它保留了传统方法不能同时满足的平移不变性和保形性因

此，DFT幅度对图像未对准以及噪声更鲁棒，并且它取代平均池

化，因为其输出包含更多信息。

(ii)

我们建议DFT

方法，这是一个合奏方案的中间卷积层。由于输

出特征尺寸可以通过裁剪DFT中的高频部分来调整，因此它有

助于处理更高分辨率的中间级输出，并且还有助于减少后续层

中的参数

(iii)

使用各种基准数据集（ ImageNet ， CUB ， MIT Indoors ， Caltech

101 ， FMD 和 DTD ）和许多基础 CNN （ AlexNet ， VGG-VD ，

Inception-v3和ResNet）进行的广泛实验表明，DFT和DFT

方法在所

有设置中显着提高了分类准确性。

相关工作

CNN最广泛使用的应用之一是ImageNet数据集上的对象识别任务[1，

2，3，4，5]。受成功的启发，CNN已被应用于其他识别任务，如场

景[7，8]和细粒度对象识别[9，10，11]，以及其他任务，如对象检测

[12，13，14]和图像分割[15，16，17]。我们讨论了这些CNN的重要操

作，并将这项工作放在适当的背景下。

2.1

变换不变量池

除了丰富的分层特征表示之外，CNN成功的原因之一是对某些对象变

形的鲁棒性为了对未对准和变形的进一步鲁棒性，可以选择首先找到

图像中的目标位置并仅聚焦于那些区域例如，在更快的R-CNN [13]模

型中，区域建议网络评估激活图中的滑动虽然它能够处理不确定的对

象位置和离群背景区域，这种方法需要高的计算负荷。此外，即使有

良好的对象提议，也难以通过诸如图像扭曲的预处理步骤来有效地处

理真实图像中的未对准相反，已经开发了许多方法来考虑网络内的空

间变化。

剩余15页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

DFT池化：提升视觉分类的变换不变性方法

二维离散傅立叶变换性质验证等.rar

图像压缩中的变换编码

基于DFT变换的图像水印理论

dft变换的matlab程序

dft变换电压有效值计算

利用MATLAB编程，打开一副图像，对其进行DFT变换，并置其不同区域内系数为0

周期信号经过抽样后做dft变换的结论

接着上面的代码，加入对每个子图像做DCT和DFT变换的代码

基于DFT数字化解调的通用模型在哪可以找到 以及对AM、SSB、VSB、DSB通用

最新资源

基于DFT数字化解调的通用模型在哪可以找到以及对AM、SSB、VSB、DSB通用