自监督预训练方法提升细粒度图像检索性能
PDF格式 | 1.06MB |
更新于2025-01-16
| 14 浏览量 | 举报
"基于草图的细粒度图像检索的预训练自监督方法"
本文探讨了细粒度图像检索(Fine-Grained Sketch-Based Image Retrieval, FG-SBIR)领域的一个新策略,即利用自监督学习来替代传统的ImageNet预训练方法。作者提出了一种称为"拼图游戏"的自监督预训练技术,该技术涉及重新组合随机打乱的图像部分。此方法的关键在于混合模态表达和高效的置换矩阵推理。
在拼图任务设计中,第一个关键点是采用混合模态表达,即将草图和真实图像结合,以增强模型对不同模态的理解。第二个关键点是优化框架中的置换矩阵推理,通过Sinkhorn迭代来实现,这比传统的分类器公式更为有效,可以更好地模拟真实的拼图自我监督。
实验结果证明,这种自监督预训练策略在四个产品级别的FG-SBIR基准测试中显著优于基于ImageNet预训练的传统方法。不仅如此,该策略还提高了跨类别的泛化能力,无论是在预训练/微调还是微调/测试阶段都有所体现。
传统的FG-SBIR方法通常依赖于ImageNet预训练权重的微调,因为收集实例级草图-照片对的成本高昂。然而,ImageNet的数据规模对于当代深度CNN来说可能不足以直接从头开始训练。因此,作者提出的自监督学习方法旨在消除对ImageNet预训练的依赖,同时通过混合域拼图求解器提升FG-SBIR的准确性和泛化性能。
这项工作为FG-SBIR领域提供了新的视角,即如何利用自监督学习来改进模型的初始化,并提高在细粒度图像检索任务上的表现。通过创新的预训练策略,研究人员可能能够开发出更加高效且适应性强的模型,这对于推动FG-SBIR技术的发展具有重要意义。
相关推荐










cpongm
- 粉丝: 6
最新资源
- VB通过Modbus协议控制三菱PLC通讯实操指南
- simfinapi:R语言中简化SimFin数据获取与分析的包
- LabVIEW温度控制上位机程序开发指南
- 西门子工业网络通信实例解析与CP243-1应用
- 清华紫光全能王V9.1软件深度体验与功能解析
- VB实现Access数据库数据同步操作指南
- VB实现MSChart绘制实时监控曲线
- VC6.0通过实例深入访问Excel文件技巧
- 自动机可视化工具:编程语言与正则表达式的图形化解释
- 赛义德·莫比尼:揭秘其开创性技术成果
- 微信小程序开发教程:如何实现模仿ofo共享单车应用
- TrueTable在Windows10 64位及CAD2007中的完美适配
- 图解Win7搭建IIS7+PHP+MySQL+phpMyAdmin教程
- C#与LabVIEW联合采集NI设备的电压电流信号并创建Excel文件
- LP1800-3最小系统官方资料压缩包
- Linksys WUSB54GG无线网卡驱动程序下载指南