多模态融合与竞争力视频场景分割算法
需积分: 20 161 浏览量
更新于2024-08-11
收藏 302KB PDF 举报
"基于多模态融合和竞争力的视频场景分割算法 (2014年) - 武汉理工大学学报(信息与管理工程版), 2014年12月"
本文主要介绍了一种创新的视频场景分割算法,旨在解决视频分割中“语义鸿沟”问题,即底层特征与高层语义之间的不匹配。作者杨亭、丰洪才、金凯和赵杰雪提出了一个结合多模态融合和镜头间竞争力的方法,该方法能够综合处理视频帧中的图像、文本和音频等不同模态的数据。
首先,该算法对视频帧的不同模态进行特征提取,利用欧式距离和余弦距离计算同种模态数据之间的相似性。接着,通过典型相关分析法来评估不同模态数据之间的相关度。这些计算出的相似性和相关度随后被融合,用于确定镜头之间的相似度和相关度。
在确定了镜头间的相似度和相关度后,算法采用了镜头间竞争力的概念,分别对相似镜头和相关镜头进行场景分割。通过对相似镜头和相关镜头的分割结果取交集,可以得到最终的场景边界,从而实现对整个视频的精确场景分割。
实验结果显示,这种方法在场景分割任务上表现出色,查全率达到了82.19%,查准率则为86.7%。这表明该算法在处理视频场景分割时,既能有效检测到大多数场景边界,又能保持较高的准确性。
相较于仅依赖单一模态特征的分割方法,该算法考虑了多种模态信息,提高了识别的鲁棒性。尽管一些先前的工作如[LIN等]和[文献[2]]已经尝试结合多种特征,但并未充分考虑异构数据间的关联共生性,而本文的算法在这方面有所改进。另外,尽管其他如[文献[3-5]]的研究在特定类型的视频(如新闻、体育、广告)上取得了成功,但通用性不足。而本文提出的算法旨在提供一种更普遍适用的解决方案,以提高场景分割的效率、准确性和通用性。
该论文的贡献在于提出了一种新的视频场景分割策略,通过多模态融合和竞争力分析,提升了场景分割的性能,对于视频分析和检索领域具有重要的理论和应用价值。
2021-09-20 上传
2021-09-25 上传
2021-04-30 上传
2021-05-20 上传
2024-05-08 上传
点击了解资源详情
点击了解资源详情
weixin_38713393
- 粉丝: 8
- 资源: 878
最新资源
- 新代数控API接口实现CNC数据采集技术解析
- Java版Window任务管理器的设计与实现
- 响应式网页模板及前端源码合集:HTML、CSS、JS与H5
- 可爱贪吃蛇动画特效的Canvas实现教程
- 微信小程序婚礼邀请函教程
- SOCR UCLA WebGis修改:整合世界银行数据
- BUPT计网课程设计:实现具有中继转发功能的DNS服务器
- C# Winform记事本工具开发教程与功能介绍
- 移动端自适应H5网页模板与前端源码包
- Logadm日志管理工具:创建与删除日志条目的详细指南
- 双日记微信小程序开源项目-百度地图集成
- ThreeJS天空盒素材集锦 35+ 优质效果
- 百度地图Java源码深度解析:GoogleDapper中文翻译与应用
- Linux系统调查工具:BashScripts脚本集合
- Kubernetes v1.20 完整二进制安装指南与脚本
- 百度地图开发java源码-KSYMediaPlayerKit_Android库更新与使用说明