2高度经济的可扩展图像聚类
假设我们具有一组多视图图像特征X
=
{
X1
,
...
,
Xm
}
,来自
m
个视图,其中
X
v
=
[
x
v
,
· · ·
,
x
v
] ∈
d
v
×
N
是累积特征矩阵
1
N
从第
五
视图看。
d
v
和
N
分别表示X
v
x
v
∈
d
v
×1
是来自第
v
个视图的第i个特
征向量。无监督MVIC的主要目标是将
X
划分为
c
个
组,其中
c
是聚类的
数量在这项工作中,为了解决大规模的
MVIC问题,我们的HSIC的目的是执行二进制聚类在更低
维的汉明
空间。特别地,我们执行多视图压缩
(
即,
将多视图特征投影到公
共汉明空间上)同时,强大的二进制聚类结构制定在学习的汉明
空间有效的聚类。
作为预处理步骤,我们首先将每个视图的特征归一化为零中心向
量。受[26,40]的启发,在这项工作中,每个特征向量都是
通过简单的非线性RBF核映射编码,
即,
,
ψ
(x
v
)=[
exp
(
−
x
v
−
我我
a
v
2
/γ
)
,
···
,
e
x
p
(
−
x
v
−
a
v
2
/γ
)
]
,
其中
γ
是
与
h相关的
预确定的k
,并且
1
i l
ψ
(
x
v
)
∈
l
×
1
维
不是一个
l
维
的
线性
空间
,它是一个
线性空间
从第五视图看。与[25,26,40]类似,
{
a
v
}
l
i i
=1
点从
X
v
(l= 1000用于在这项工作中的每个视图随后,我们将介绍
如何分别学习常见的二进制表示和鲁棒的二进制聚类结构,并最
终以联合学习目标结束
1)
二进制表示学习。 我们认为一个家庭
K
个
散列函数,其将每个
ψ
(x
,
v
)量化为
i i1iK
不同视图之间的语义间隙,HSIC生成共同的二进制表示。
通过组合多视图特征来呈现。具体地,HSIC同时
编程
。
在
Hamming s空间
上对一个共 同体进 行了 Σ
mmmul t ie vi e
s
检验,
即
. e.
,
bi
=
sgn
(
Pv
)
ψ
(
xv
),其中
bi
是来自差分视频的第i个特征的公共二进制码
(
i
. e.
,
x
v
,
v
=
1
,
…
,
m
)
,
sgn
(
·
)
是一个元素,其中,sgn(·)是一个元素,
其中,
sgn(·)
是一个元素。
t
i
on
,
Pv
=
[
pv
,
···
,
pv
]
∈
l
×
K
是
在
ri
x
上的
映射
,
用于该
ev-tv
视图
和
1
K
是
第i个散列函数的投影向量。因此,我们通过最小化以下量化损失
来构建学习函数:
由于不同的视图从不同的角度描述同一主题,因此
多个视图的相似性以及区分不同视图之间的个体特性的视图特定/个
体信息 为此,我们将每个投影分解为s,i上的可共享和个体投影的组
合
。
e.
,
Pv
=
[
Ps
,
Pv
]
。
S
p
eci
fi
l
y
,
P
S
∈
l
×
K
S
即
在多个视图上的共享预节点,
其中
Pv
∈
l
×
KI
是第
v
个视图的独立预节点,其中
K
=
KS
+
KI
。因此,HSIC
集体地学习共同的