PS-LevelSet模型在嘴唇形状定位中的应用

自然科学

论文

需积分: 10 194 浏览量更新于2024-08-11 收藏 884KB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

"基于PS-LevelSet的嘴唇几何形状定位模型 (2010年) - 华南理工大学学报（自然科学版）" 这篇论文探讨的是在唇读技术中的一个关键问题，即如何更精确地定位和分割嘴唇的几何形状。传统的水平集模型在处理嘴唇分割时常常遇到边界过收敛和过早收敛的挑战，导致分割结果不准确。针对这一问题，作者提出了一种改进的模型，称为PS-LevelSet模型，该模型融合了先验知识来增强水平集方法。 PS-LevelSet模型的核心在于利用一个改进的差值能量函数来引入嘴唇形状的先验信息。在曲线演化的进程中，模型会不断地比较当前演化曲线与预设的嘴唇形状模型之间的差距，并据此调整曲线的形状，使得演化结果更接近于实际的嘴唇轮廓。这种方法旨在提高模型的收敛精度，避免过早或过度收敛，从而提升嘴唇分割的准确性。实验结果显示，采用PS-LevelSet模型进行嘴唇几何形状定位的准确率相较于传统的水平集模型提升了8.38%，这表明了该方法的有效性。这一进步对于提升唇读系统的性能至关重要，因为准确的嘴唇定位是唇读系统正确理解和识别说话内容的基础。唇读是一种重要的辅助语音识别技术，尤其在嘈杂环境中，它可以弥补单纯依赖声音识别的不足。通过分析说话者的嘴唇运动，唇读技术可以识别出说话的内容，提供一种视觉上的理解通道。因此，提高嘴唇形状定位的精度直接影响到视频语音识别系统的整体性能和应用范围。这篇论文发表在华南理工大学学报的自然科学版上，由奉小慧、贺前华等人共同完成。他们分别从事音视频语音处理、口语语音识别、模式识别等领域的研究。该研究得到了国家自然科学基金的支持，展示了在模式识别和信号处理领域中的创新工作。关键词涉及唇读、形状定位、水平集模型以及曲线演化，这些都与本文的研究内容紧密相关。文章的DOI标识为10.3969/j.issn.1000-565X.2010.02.023，方便后续的引用和查询。这篇论文为唇读技术的进步提供了理论支持和实际解决方案，对于语音识别特别是视频语音识别领域具有重要价值。

资源详情

资源推荐

华南理工大学学报  自然科学版 

第  卷第  期

ＪｏｕｒｎａｌｏｆＳｏｕｔｈＣｈｉｎａＵｎｉｖｅｒｓｉｔｙｏｆＴｅｃｈｎｏｌｏｇｙ

ＶｏｌＮｏ

 年  月

ＮａｔｕｒａｌＳｃｉｅｎｃｅＥｄｉｔｉｏｎ

Ｆｅｂｒｕａｒｙ

文章编号 Ｘ



收稿日期 

基金项目 国家自然科学基金资助项目

作者简介 奉小慧女博士生主要从事音视频语音处理口语语音识别模式识别等研究Ｅｍａｉｌ ｘｈｆｅｎｇｍａｉｌ

ｓｃｕｔｅｄｕｃｎ

 通讯作者 贺前华男教授博士生导师主要从事语音识别及合成技术音视频信号处理模式识别等研究

Ｅｍａｉｌ ｅｅｈｅｓｃｕｔｅｄｕｃｎ

基于ＰＳＬｅｖｅｌＳｅｔ的嘴唇几何形状定位模型



奉小慧贺前华



王伟凝严乐贫

华南理工大学电子与信息学院 广东广州 

摘要 针对面向唇读的水平集模型在嘴唇分割中存在边界过收敛和过早收敛的问题

文中提出了一种改进的基于先验知识的水平集模型简称为ＰＳＬｅｖｅｌＳｅｔ来进行嘴唇几

何形状的定位ＰＳＬｅｖｅｌＳｅｔ模型利用改进的差值能量函数引入嘴唇形状的先验信息在

曲线演化过程中反复比较演化曲线和先验曲线的差距使曲线的演化形状逐渐逼近先验

模型形状从而更精确地收敛于目标物体实际轮廓实验表明用ＰＳＬｅｖｅｌＳｅｔ模型定位嘴

唇几何形状的准确率比用水平集模型提高了 

关键词 唇读 形状定位 水平集模型 曲线演化

中图分类号 ＴＰ ｄｏｉ ｊｉｓｓｎＸ

自动语音识别作为目前主流的人机信息交互技

术是未来实现真正意义上的人机交流的一个必需

组成部分传统的单独听觉语音识别在安静环境下

已能取得很高的正确识别率但在复杂的噪声环境

下识别性能急剧下降



视频语音作为语音识别的

辅助手段可以抵制这种复杂的环境使其完全不受

声学噪声的影响



视频语音识别是通过提取说话

人说话时嘴唇的特征来识别和理解说话的内容也

称之为唇读嘴唇的几何形状定位是唇读过程中提

取嘴唇几何特征的关键步骤之一其定位方法较多

文献 中利用嘴唇的色彩和边缘信息进行分割

但这种方法没有平滑约束其结果一般比较粗糙且

没有很好的形状文献 中的ＬＤＡ算法是用聚类

的方法来区分嘴唇像素点和肤色像素点但是这种

分割结果带有很多的噪声点的干扰因此以上两种

定位方法都不适合在唇读中使用模板匹配算法通

过改变给定的模板使得模板与嘴唇形状匹配但是

模板的选取需要大量的训练数据且收敛受到原始

图像灰度值的干扰



ＬｅｖｅｌＳｅｔ模型



是一种描

述曲线以曲率相关的速度演化的有力工具 近几年

来在图像分割轮廓形状定位及计算机视觉等领域中

得到了广泛的应用它采用欧拉类型的求解方法避

免了蛇形模型



易陷入局部极值的问题且计算

稳定但在目标轮廓不是很明显或梯度信息很弱

时就会出现过收敛的问题且会受到嘴唇阴影的

影响

通常人在正常说话情况下说话的嘴唇形状改变

不会太大因此文中提出了一种改进的基于先验知

识的水平集模型 简称为ＰＳＬｅｖｅｌＳｅｔ来进行嘴唇

形状的定位与以往通过统计概率



来引入先验

信息的模型不同ＰＳＬｅｖｅｌＳｅｔ模型通过引入改进的

曲线差异能量函数对偏离真实目标轮廓形状进行

惩罚和约束从而达到曲线演化的收敛并且在该模

型中改进的曲线差异能量函数允许先验形状具有

旋转平移和尺度变换的功能这样可以很好地描述

物体的边界和先验形状的映射关系对实际应用有

很大帮助

ＬｅｖｅｌＳｅｔ模型

ＬｅｖｅｌＳｅｔ模型



是在二维或三维图像中计算

下载后可阅读完整内容，剩余4页未读，立即下载

weixin_38725734

粉丝: 4
资源: 933

PS-LevelSet模型在嘴唇形状定位中的应用

VOF法与Level Set法的比较

elasticsearch-rest-high-level-client-6.8.3-API文档-中英对照版.zip

期权matlab代码-matlab-levelset:Matlab中的水平集方法实现

关于水平集方的通用程序-Levelset_main.m

大数据-算法-点模型的几何处理和形状编辑.pdf

matlab的欧拉方法代码-Level-Set-Based-Image-Segmentation:基于水平集的图像分割

Variational-Level-Set.rar_level set_变分水平集_水平集_水平集 初始化_符号距离函数

基于目标监督的先验形状level set模型分割心脏MR图像 (2006年)

水平集matlab代码-level-set:水平集

水平集matlab代码-level-set:水平集代码matlab尝试

Level_Set.zip_level set_level-set_set

matlab精度检验代码-Unstructured-Level-Set-Method:复杂非结构网格上前沿演化的鲁棒3D水平集方法

level-set-method.rar_Level set method_level set_level-s_水平集_水平集方

rw.rar_Level set Matlab_level set_level-set

基于Packet-Level与Flow-Level的网络流量分类特征优化方法

最新资源

Variational-Level-Set.rar_level set_变分水平集_水平集_水平集初始化_符号距离函数