GMSSCP:图谱驱动的多空间语义关联传播提升视频检索效果

0 下载量 40 浏览量 更新于2024-08-28 收藏 1.79MB PDF 举报
本文主要探讨了"基于图的多空间语义相关传播在视频检索中的应用"这一主题,针对概念化视频检索(CBVR)中存在的一个关键挑战:如何为特定查询有效地选择和融合适当的概念。传统的CBVR方法依赖于概念检测结果,然而,这在实际应用中存在选择合适的概念以及处理噪声问题的难题。 作者提出了创新的GMSSCP(Graph-based Multi-Space Semantic Correlation Propagation)方法,其核心在于利用图结构来整合和传播多空间的语义关联。GMSSCP采用流形排序算法,这是一种能够同时考虑查询与多个概念层次间复杂关系的高级分析技术。这种方法的优势在于能够增强对查询线索的适应性,使概念的相关性传播和选择过程更为精确,从而提高检索结果的准确性,即使在存在噪声的环境下也能保持较高的鲁棒性。 此外,GMSSCP的独特之处在于它的灵活性,可以动态地将多模式查询线索作为额外节点融入统一传播图,使其不仅适用于自动检索,也适用于交互式场景。这种适应性使得系统能够根据用户的实时输入和反馈进行动态调整,提升用户体验。 实验部分在TRECVID数据集上进行了深入验证,结果显示GMSSCP相较于当前最先进的概念选择方法表现出显著的优势。在实际应用中,GMSSCP被成功应用于交互式检索系统VideoMap,实现了优秀的检索性能和用户满意度。 总结来说,本文的核心贡献是提出了一种新颖且高效的GMSSCP方法,它通过图结构和流形排序算法在多空间语义关联的基础上,优化了概念的选择和融合过程,为基于语义内容的视频检索提供了一个强大的工具。其在处理噪声、适应查询线索以及实现交互式检索方面的表现,使得该方法在视频检索领域具有广泛的应用前景。