基于小波变换与SVM的新闻视频字幕检测算法

需积分: 10 0 下载量 143 浏览量 更新于2024-09-08 收藏 476KB PDF 举报
本篇论文深入探讨了"基于小波变换的新闻视频字幕提取"这一主题,由李娟和赵衍运两位作者合作完成,他们分别来自北京邮电大学信息与通信工程学院。论文聚焦于新闻视频检索领域中的关键任务——字幕检测与提取,这在提高视频内容理解和检索效率上具有重要意义。 研究者们针对新闻字幕的纹理特性,提出了一个创新的方法。首先,利用Haar小波变换对视频帧进行分析,这种变换能够在不同频率范围内提供丰富的细节信息,通过融合高频子带的能量,生成能量图。接着,通过对能量图进行二值化处理,形成包含候选文本信息的边缘图,以便更好地突出字幕区域的边缘轮廓。 进一步,作者采用数学形态学操作对边缘图像进行处理,通过细化边缘并消除噪声,得到连通域图,这样有助于提高后续文字检测的准确性。随后,通过计算小波共生矩阵特征,这是一种基于小波变换的统计特性,能够捕捉到字幕与背景之间的显著差异。 关键的一步是将这些特征输入到支持向量机(SVM)分类器中,SVM作为一种强大的监督学习模型,可以有效区分文本区域与非文本区域,从而实现精准的文字定位。实验结果显示,该方法不仅定位速度快,而且具有较高的文本提取率,这对于实际应用中的新闻视频字幕检索系统来说无疑是一个重要的性能指标。 这篇论文在小波变换、形态学和机器学习技术的结合下,提供了一种高效且精确的新闻视频字幕提取方案,对于推动新闻视频内容分析和信息检索技术的发展具有一定的理论价值和实践意义。