正交权重提升神经网络协方差稳定性与性能

31 浏览量更新于2024-06-19 收藏 1.35MB PDF 举报

本文主要探讨了正交权重在改进神经网络协方差条件中的应用，针对在深度学习模型中插入奇异值分解（SVD）元层时出现的协方差矩阵病态问题进行深入研究。传统的神经网络中，为了保持矩阵的对称性和半正定性，常通过计算输入特征映射的协方差XXT来预处理数据。然而，这可能导致协方差条件恶化，影响模型的训练稳定性和泛化能力。现有的研究试图通过正交处理来改善这种情况，例如对权重进行正交约束。然而，这些方法虽然能提升条件数，但可能牺牲部分性能。为解决这一矛盾，本文提出了一种新的处理策略——最近正交梯度（NOG）和最佳学习率（OLR），旨在在维持正交性的同时，尽可能减少对模型性能的影响。 NOG和OLR的引入旨在找到一种平衡，它们在去相关批量归一化（BN）和全局协方差池（GCP）等应用场景中得到了验证。实验结果表明，这些方法能够同时改善协方差条件和模型的泛化能力，表明正交权重的使用不仅有助于优化训练过程，还能进一步提升整体性能。文章关键词包括可微奇异值分解、协方差条件和正交约束，强调了在深度学习实践中的实际意义。作者宋悦及其团队的研究表明，通过对SVD层施加正交权重约束，可以显著提高模型在计算机视觉任务中的表现，特别是在处理矩阵运算和特征变换时，能够更好地维护模型的稳定性和有效性。总结来说，本文的核心贡献在于提出了一种创新的解决方案，通过最近正交梯度和最佳学习率策略，有效解决了神经网络中由于SVD元层导致的协方差条件问题，这对于深度学习模型的性能优化和稳定性至关重要。通过实际的视觉识别实验，证明了这种方法在提升模型表现和改善训练条件上的有效性。

+v：mala2255获取更多论

文

∈

≥

改善条件反射

通过Carley变换或矩阵指数显式正交权重[33，51，45]。在这些技术

中，正交正则化和正交权重是最常用的，因为它们通常会带来一些实

际的推广改进。由于协方差与Pre-SVD层的权重矩阵密切相关，因此

实施正交性约束可以帮助改善SVD元层的协方差调节我们将选择一些

有代表性的方法，并在第二节中验证它们的影响。4.2.

请注意，现有文献的重点与我们的工作不同正交约束通常用于改

善神经网络层的Lipschitz常数，这有望改善图像生成中的视觉质量

[5，36]，以实现更好的对抗鲁棒性[52，45]，并提高泛化能力[43，

54]。我们的工作是关注提高协方差条件和泛化性能。此外，正交性

的文献主要研究如何加强正交权矩阵，而很少关注梯度和学习率。节

中5，我们将探索这种可能性，并提出我们的解决方案：最近的正交

梯度和最佳学习率，这是最佳的意义上，更新的权重是尽可能接近正

交矩阵。

背景：SVD元层

本节介绍SVD元层传播规则的背景知识。

3.1

向前传球

给定整形特征XR

d×N

，其中d表示特征维度（

即，

通道的数量）并且N表

示特征的数量（

即，

特征的空间维度的乘积），SVD元层首先将样本协

方差计算为：

XJX

，

（I

−

）（2）

其中J表示中心矩阵，I表示单位矩阵，并且1 是一个列向量，其值分

别为全1。协方差总是半正定的（PSD），没有任何负特征值。然后，使

用SVD执行特征分解

P= UΛ

，

Λ = diag（λ

，

. . .

，

）（3）

其中U是正交特征向量矩阵，diag（）表示将向量变换为对角矩阵，

并且Λ是对角矩阵，其中特征值以非递增顺序排序，

即，

，

然

后，根据应用，矩阵平方根或反平方根计算为：

1 1

∈

= UΛ

，

= diag（

，

. . .

，

）

（4）

−

= UΛ

−

，

−

= diag（

−

，

. . .

，

−

）

2 2 2

2 2

个

剩余21页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

正交权重提升神经网络协方差稳定性与性能

EOF和BP神经网络相结合的模式温度预报误差订正方法研究.pdf

"正交权重改进神经网络协方差条件

正交特征变换对图神经网络的性能提升

协方差矩阵+正交矩阵

协方差矩阵可以衡量样本特征权重吗

马氏距离协方差矩阵与权重的关系

改进的协方差矩阵ar模型功率谱分析

bp神经网络多输出回归

如何使用BP神经网络优化卡尔曼

基于pca和bp神经网络的人脸识别matlab源代码

最新资源