稀疏流形正则化提升非负矩阵分解抗噪性能

169 浏览量更新于2024-08-29 1 收藏 958KB PDF 举报

本文主要探讨的是"稀疏诱导流形正则化凸非负矩阵分解算法"这一主题，针对非负矩阵分解方法在处理有噪声的真实数据时存在的有效性挑战，研究人员提出了一种创新性的算法。非负矩阵分解是一种常用的数据降维和特征提取工具，特别适用于那些数据元素通常为非负的场景，如文本数据和生物信息学数据。然而，当实际数据存在噪声时，传统的非负矩阵分解可能会受到干扰，导致学习到的特征不准确或不稳定。在这个新算法中，作者引入了流形正则化，这是一种用于处理高维数据中局部结构信息的方法，它假设数据点在低维流形上分布。通过结合流形正则化，他们将注意力转向了低维子空间的基矩阵，提出了一个额外的稀疏约束，即使用L2,1范数来鼓励基矩阵中的某些元素保持稀疏。这种稀疏约束的作用是减少噪声特征的影响，使模型更加聚焦于关键特征，提高学习的鲁棒性。构建的乘法更新规则是算法的核心部分，它确保了在加入稀疏约束后，算法能够在迭代过程中稳定且高效地优化。通过对算法的收敛性进行理论分析，研究者证明了在该规则下，算法能够收敛到全局最优解或者一个近似最优解。为了验证算法的性能，文章进行了K均值聚类实验。实验结果显示，相比于传统的非负矩阵分解和其他8种同类算法，稀疏诱导的流形正则化方法在处理噪声数据时具有更好的表现，能够更有效地降低噪声特征的贡献，从而提高聚类结果的准确性。这表明，所提出的算法在实际应用中具有更高的稳定性和有效性。总结来说，这项研究不仅拓展了非负矩阵分解的理论框架，还提供了在处理噪声数据时的一个有效策略。其研究成果对于提升基于非负矩阵分解的机器学习任务，尤其是在数据预处理和特征选择阶段，具有重要的实践价值。

·86· 通信学报第 41 卷

另外，SGCNMF 对模型进行了稀疏化处理，提高了

其泛化能力和噪声稳健性。在一组图像数据集上的聚

类实验结果验证了 SGCNMF 的有效性。

2 相关工作

2.1 凸非负矩阵分解

NMF 将非负数据矩阵分解为 2 个非负矩阵的

乘积。给定一个矩阵

,[, , ]

xxx

=∈X " R ，找到

2 个非负矩阵

=[ ]

∈U R 和

=[ ]

∈V R

，使

s.t. ,≈XUV U V≥≥00

(1)

其中，U 为基矩阵，V 为编码矩阵。原数据矩阵与

分解后矩阵乘积的误差越小，则对原始数据的拟合

越好。为了最小化分解误差，

Lee 等

[30]

提出了乘法

更新规则算法。

混合符号矩阵是指含有正数、零和负数的矩

阵，经典

NMF 只解决含非负元素矩阵的分解问题。

Ding

等

[21]

提出了 CNMF 并证明其收敛性。与 NMF

将矩阵分解成 2 个非负矩阵的乘积不同，CNMF 是

一种矩阵的三分解方法

[31]

，其允许数据矩阵 X 中出

现负元素，分解为式

(2)所示形式。

±±++

=XXUV (2)

本文采用欧氏距离描述分解误差，CNMF 的代

价函数

定义为

±±++

=−XXUV (3)

与 NMF 的乘法更新规则

[30]

类似，CNMF 有乘

法更新规则

[21]

，如式(4)所示。

(

)

()

TTT

()()

()() )

() ()

ik ik

jk jk

+−

−+

+−

−+

←

XX V XX UVV

XX U VU XX U

XX U V XX U

(4)

2.2 图正则化非负矩阵分解 GNMF

局部不变性假设

[32]

认为，在高维空间里局部近邻

样本映射到低维空间时对应的样本仍为近邻的。为了

保持数据空间的几何结构，对于

2 个原本近邻的点 x

与 x

，用新的基表示的两点 v

和 v

也应该相近。基于

此，

GNMF 首先构建一个邻接图 G，并连接 X = [x

…

, x

]中近邻的点。然后，构建权重矩阵 W 用于量

化点之间的近邻程度。构建

W 有 3 种方式：0−1 加

权、热核加权和点积加权。本文以

0−1 加权为例。

⎧

⎪

⎨

⎪

⎩

，与无连接

，与有连接

(5)

为了保持 v

与 v

两点间的近邻关系，定义图正

则化项如式(6)所示。

TT T

() ( )

Tr( ) Tr( ) Tr( )

ij ij

RvvW=−=

−=

∑

VDV VWV VLV

(6)

其中， Tr(•) 表示矩阵的迹；D 表示一个对称矩阵，

其对角元素

为矩阵 W 的第 i 行的元素和（或者

对应第

i 列的元素和）；L 为描述空间结构特征的拉

普拉斯矩阵，且

L=D−W。将图正则化项作为惩罚

项，构建目标函数

，如式(7)所示。

(,) Tr( )

s.t. 0, 0

ij ij

=− +UV X UV V LV

≥≥

(7)

是非负的正则化参数，当 λ=0 时 GNMF 退化

成

NMF。使式(7)最小化，乘法更新规则为

(

()

)

ik i

←

XU V

VU VDU

(8)

Cai

等

[12]

证明了在乘法更新规则式(8)下，目标

函数

可以保证收敛性。

2.3 流形正则化凸非负矩阵分解

CNMF

可以看作 K-means松弛编码空间的正交约

束后的版本

[21]

，CNMF 在分解过程中丢失了数据的空

间结构信息。

Hu 等

[23]

将 GNMF 与 CNMF 相结合，

提出

GCNMF，在松弛了 NMF 的非负约束的同时，

通过最小化流形正则化项来保留数据空间的流形

结构特征。与

GNMF 类似，GCNMF 构建了邻接图

G、权重矩阵 W 和拉普拉斯矩阵 L，并在代价函数

中添加图正则化项 R(V)。GCNMF 的目标函数

为

*TT

(,) (,) () Tr( )OOR

=+=−+UV UV V X XUV V LV

s.t. 0, 0

ij ij

UV≥≥ (9)

2.4 稀疏约束非负矩阵分解

基于稀疏约束的方法可以发掘特征空间的潜

在关联。稀疏约束通常以对目标约束项添加

p,q

范

数的形式存在，是一种常见的提高矩阵分解性能的

剩余11页未读，继续阅读

weixin_38674050

粉丝: 5

稀疏流形正则化提升非负矩阵分解抗噪性能

稀疏诱导流形正则化在非负矩阵分解中的应用

流形正则化非光滑非负矩阵分解新方法

矩阵三分解与流形正则化的零镜头学习算法

稀疏诱导流形正则化凸非负矩阵分解算法.docx

L3/2正则化图非负矩阵分解算法

图正则化稀疏判别非负矩阵分解.pdf

通过超图正则化非负矩阵分解实现图像聚类

基于稳健图正则化的非负矩阵分解在特征基因选择中的应用

实时流形正则化上下文感知追踪算法优化

超图正则化非负矩阵分解在图像聚类中的应用

最新资源