深度组件分析：ADNN在图像预测中的表达性多层模型

103 浏览量更新于2024-06-20 收藏 1.64MB PDF 举报

本文主要探讨了一种新颖的深度学习技术——基于交替方向神经网络（ADNNs）的深度组件分析（DeepCA）。作者们来自卡内基梅隆大学，由卡尔文·默多克、张明芳和西蒙·路西共同研究。深度组件分析旨在解决深度神经网络在理论理解不足但表现优异与浅层模型如分量分析（Component Analysis，CA）具有理论支持但容量有限之间的矛盾。在深度学习领域，尽管深度卷积神经网络（CNN）在计算机视觉任务中展现出卓越的性能，如图像分类、对象检测和语义分割，但它们往往依赖于复杂的模型和不完全理解的数学原理。为弥补这一不足，研究者提出利用深度CA，它构建了一个多层模型，通过在每一层中对潜在变量施加分层结构的约束，增强了模型的表达能力。为了实现高效的推理，文章提出了一种可微分优化算法，该算法利用ADNNs进行参数学习，这使得传统的反向传播技术得以应用。同时，论文将前馈神经网络视为深度CA推理的单次迭代近似，从而提供了理解深度学习的新视角，并为结合先验知识和约束预测提供了一种实用方法。作者还展示了深度组件分析在诸如带有稀疏输出约束的单图像深度预测等任务中的实际应用，相比于传统方法，能够提升性能。这种方法的成功得益于将经典领域的知识融入到深度学习框架中，减少了对大量标记数据的依赖，并可能提高模型的参数效率。文章的关键点包括深度CA的理论基础、ADNNs在优化过程中的作用、如何将前馈网络与深度CA联系起来，以及实验中所展示的性能提升。这为我们理解深度学习如何结合领域知识和结构化表示学习提供了有价值的研究成果。

C. Murdock，M.F. Chang和S.Lucey

图片提供基线 T

真相

图3：DeepCA应用于单图像深度预测的演示，使用与已知深度值的稀疏集连接的图像

作为输入。基线前馈网络不能保证产生与给定深度值一致的输出。相比之下，具有增加

的迭代次数（T >1）的ADNN学习满足稀疏输出约束，解决模糊度以获得更准确的预

测，而没有不切实际的不连续性。

工作作为一个例子，我们考虑的任务，单图像的深度预测，

一个困难的问题，

由于缺乏三维信息，如规模和角度。然而，在许多实际场景中，已知深度输出的稀

疏集合可用于解决这些模糊性以提高准确度。该先验知识可以来自像

LIDAR

的附加

传感器模态或来自在纹理图像区域周围提供稀疏深度的其他

重建算法已经针对该

问题提出了前馈网络，其通过将已知深度值级联作为附加输入通道

[30]

。然而

，虽

然这提供了有用的上下文，但不能保证

预测与给定的输出一致，从而导致不切实

际的不连续性。相比之下，

DeepCA

通过将预测视为未知潜在变量来实施约束

。这

种行为如何解决歧义的一些例子

如图所示。其中具有附加迭代的

ADNN

学习从给

定深度值传播信息以产生更准确的预测。

除了实际优势外，我们的模型还

为概念

化深度学习技术提供了一个新的视角。具体地，整流线性单元（

ReLU

）激活函数

[14]

，其在各种应用中的许多现有技术模型中普遍存在

，相当于

非负约束上的稀疏投影除了解释

前馈网络作为重建目标函数的单次迭代近似，这提出了从稀疏近似理论的角度更好

地理解深度神经网络的

。

剩余16页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

深度组件分析：ADNN在图像预测中的表达性多层模型

深度学习算法研究及其在图像分类上的应用

卷积神经网络详解：从基础到深度应用

深度学习技术详解：神经网络、卷积神经网络和循环神经网络

MATLAB深度学习实战：神经网络、卷积神经网络和循环神经网络

深度学习技术：揭秘神经网络的奥秘

解析神经风格迁移技术在卷积神经网络中的应用

图像语义分割实践系列文章：03 - 探究卷积神经网络（CNN）在图像语义分割中的作用

MATLAB卷积神经网络与GAN携手：生成逼真图像，惊艳你的双眼

深度学习网络与神经网络算法原理解析

深度学习中的卷积神经网络（CNN）详解

最新资源