深度哈希(SSDH)[34]和BGDH [31]最大限度地减少了标记数据的经验误差,
并通过图形构造方法利用未标记的数据与SSDH和BGDH使用图来建模未标记数
据并且消耗时间和空间不同,我们的方法利用生成模型来学习未标记数据。
DSH-GANs [21]利用类标签为合成图像训练AC-GANs [19],然后使用这些合成
图像来训练深度哈希模型。与DSH-GANs不同的是,我们的方法利用了更常见
的三元组标签,并专门设计了一个GANs模型,可以在有限的监督信息下很好地
学习更重要的
生成模型是机器学习中的一种重要模型,它通过学习数据的分布来理解数据。
Goodfellow提出了一个高效而简单的框架来估计生成模型,称为生成对抗网络
(GANs)[5],通过使生成模型和判别模型进行两人极大极小博弈。条件生成
对抗网络(cGANs)[17]通过使用类标签来限制生成器和鉴别器,将GANs扩展
到其条件版本。与已有的生成模型不同,我们的方法中的生成模型是专门针对
三元组信息和未标记数据而设计的。
3
半监督生成对抗哈希
G i v
由未标记
的
数据
Xu
=
{
Xu
}
组成 的 数 据集
X
|
i
=
1
,
. . .
,
m
}
的形式
的单独图像和
标记数据
X1
=
{
(x
q
,
x
p
,
x
n
)
i
|
i
=
1
,
. . .
,
n
}
的三元
组信息,其中查询图
像
Xq
更类似于正一
xp
而
不是
在
iv eone
xn
处更类似于
neg
,我们的主要目标是学习映
射函数
B
(
·
)
,其
将输入图像X
X
编码为k位二进制码
B
(X)
∈
{0
,
1}
k
,
同时保持数据集中
X
中图像的相对语义相似性。
如图1所示,我们的SSGAH方法由生成模型G、
判别模型D和深度散列模型H。生成模型是以半监督的方式学习三元组信息的分
布,并生成syn-wise
)
i
|
i
=
1
,
2
,
...
,
m
+
n
}
,其中,实像x大于
天然模型是区分真正的三胞胎从合成的。深度哈希模型是学习在整个数据集上
保持语义相似性的二进制代码所有三个模型都以对抗的方式一起训练。
3.1
模型体系结构
生成 和判别模 型我们 生成和判 别
模 型
的 目 标
是 学 习未 标 记 数 据
的 分 布
X
u
=
{
x
u
|
i
=
1
,
2
,
. . .
,
n
}
和 标 记 数 据
X1
=
{
( x
q
,
x
p
,
x
n
)
i
|
i
=
1
,
2
,
. . .
,
n},然后合成现实的
有意义的三元组。具体地,给定实样本
x
∈
{
Xu
,
Xl
},合成三元组