没有合适的资源?快使用搜索试试~ 我知道了~
首页零镜头图像检索:基于草图的新方法与挑战
"基于草图的零镜头图像检索框架" 基于草图的零镜头图像检索(Sketch-Based Image Retrieval, SBIR)是一个重要的研究领域,它涉及到从图像数据库中找出与给定的手绘草图相匹配的自然图像。印度理工学院马德拉斯的研究团队提出了一种新的框架,专门针对零镜头学习的场景,即模型在训练时未见过的新类别。传统的SBIR方法主要关注粗粒度的评估,它们可能只匹配到相同类别但形状特征不同的图像,导致模型无法很好地泛化到未见过的类别。 文章指出,当前SBIR模型的学习方式主要是在训练过程中建立类特定的映射,这限制了它们在零镜头设置下的表现。为了解决这个问题,研究者引入了一种生成方法,采用深度条件生成模型,以草图作为输入,生成具有匹配细节的图像,以填补草图中可能缺失的信息。这种方法旨在提高模型在处理未在训练集中出现的类别时的泛化能力。 实验是在大规模的Sketchy数据集上进行的,该数据集包含大量草图-照片对。结果显示,所提出的生成模型在零镜头SBIR框架下,相比于几种先进的方法,显著提高了性能。这表明,通过生成模型,可以更有效地学习草图和自然图像之间的关系,从而在跨类别的检索任务中实现更好的性能。 关键词还包括图像检索和零样本学习,强调了这项工作在图像检索领域的创新和对零样本学习这一挑战的贡献。论文中提到,随着社交媒体和电子商务网站的发展,基于内容的图像检索变得越来越重要,特别是当用户能通过草图来表达他们想要的图像时。因此,这个零镜头图像检索框架对于提升用户体验和搜索效率具有实际意义,有助于推动图像检索技术的进一步发展。
资源详情
资源推荐
4
Sasi Kiran Yelamarthi等
人
2
相关工作
由于我们提出了一个零杆框架的SBIR任务,我们简要回顾了基于草图
的图像检索以及零杆学习在本节的文献
SBIR中的传统流水线涉及将图像和草图投影到公共特征空间中。这些
特征或从中提取的二进制代码用于检索任务。手工制作的基于特征的模
型包括Hu和Collomose [14]提出的梯度场HOG描述符、Saavendra [37]提出
的边缘方向直方图(HELO)、Saavendra
et.al
[39]提出的学习关键形状
(LKS),这些模型在视觉词袋(BoVW)框架中用作SBIR的特征提取
器。Yu
et.al
[52]是第一个使用卷积神经网络(CNN)进行草图分类任务
的人。 Qi
et.al
[7]介绍了将siamese架构用于粗粒度SBIR。Sangkloy
et.al
[40]使用三元组排名损失来训练粗粒度SBIR的特征。Yuet.al [51]使用三
元组网络进行实例级SBIR评估鞋和椅子数据集的性能。它们使用伪细粒
度评估,其中它们仅查看检索图像中草图的正确图像的位置。Liuet.al
[26]提出了一种半异构的深度架构,用于从草图和图像中提取二进制代
码,这些代码可以以端到端的方式进行训练,用于粗粒度SBIR任务。
现在我们回顾一下零炮的文献。图像分类中的零次学习[22,23,28]
是指学习识别新类别的图像,尽管训练集中不存在来自这些类别的示
例。由于收集每个类的示例以训练监督模型的困难,零次学习最近受到
了研究界的极大兴趣[1,10,21,23,35,43,46,48,49]。我们建议
读者参阅[50],以了解关于这个问题的全面调查。最近,零拍摄学习已
经在许多其他计算机视觉任务中获得了越来越多的关注,例如IM。 年
龄标记[25,53],视觉问题回答[29,33,45]等。据我们所知,零杆框架
以前没有在SBIR任务中探索过。
3
SBIR的零激发设置
我们现在提供SBIR中零发射设置的正式定义让
S
=
{
(
x
sketch
,
x
img
,
y
i
)
|
yi
∈
Y}
是素描、图像和类的三元组
我我
其中Y是
S
中所有类标签的集合。 我们划分了类la-
将数据分别输入
Y
序列
和
Y
测试
数据相应地,让
S
tr
={(
x
sketch
,
x
img
)|
y
i
∈
Y
train
}和
Ste
={(
x
sketch
,
x
img
)|
y
i
∈
Y
test
}是
我我我
将S划分为训练集和测试集。这样,我们就对配对数据进行了分区
训练集和测试集,使得来自测试类的草图都不出现在训练集中。
由于模型无法访问类标签,因此模型需要学习草图和相应图像之
间的潜在对齐,以便在测试数据上表现良好。
剩余17页未读,继续阅读
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 新型矿用本安直流稳压电源设计:双重保护电路
- 煤矿掘进工作面安全因素研究:结构方程模型
- 利用同位素位移探测原子内部新型力
- 钻锚机钻臂动力学仿真分析与优化
- 钻孔成像技术在巷道松动圈检测与支护设计中的应用
- 极化与非极化ep碰撞中J/ψ的Sivers与cos2φ效应:理论分析与COMPASS验证
- 新疆矿区1200m深孔钻探关键技术与实践
- 建筑行业事故预防:综合动态事故致因理论的应用
- 北斗卫星监测系统在电网塔形实时监控中的应用
- 煤层气羽状水平井数值模拟:交替隐式算法的应用
- 开放字符串T对偶与双空间坐标变换
- 煤矿瓦斯抽采半径测定新方法——瓦斯储量法
- 大倾角大采高工作面设备稳定与安全控制关键技术
- 超标违规背景下的热波动影响分析
- 中国煤矿选煤设计进展与挑战:历史、现状与未来发展
- 反演技术与RBF神经网络在移动机器人控制中的应用
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功