动态人脸表情识别:多视觉与音频特征融合算法
需积分: 3 112 浏览量
更新于2024-09-02
收藏 4.09MB PDF 举报
"基于多视觉描述子及音频特征的动态序列人脸表情识别",这篇文章主要探讨了一种在非约束环境下的人脸动态表情识别方法,利用多视觉描述子和音频特征来提升识别效果。
动态序列人脸表情识别是当前研究的一个热点,它在安全驾驶、市场营销、临床医学等领域有着广泛的应用前景。作者李宏菲、李庆、周莉等人对此进行了深入研究,他们提出了一种融合多视觉描述子和音频特征的动态表情识别算法。这一算法的核心在于,通过多视觉描述子来捕捉面部表情的时空局部特征,从而有效地提取动态表情的特征。同时,结合视频和音频信息,通过融合策略来增强表情识别的准确性。
文章中提到,为了处理不同时长的动态表情序列,采用了协方差矩阵和时间轴分段的动态规整方法,确保了不同长度的样本都能得到恰当的描述。为了提高模型的泛化性能,作者引入了集成识别模型,该模型基于多个个体识别模型的加权投票。在权重学习方面,他们提出了两种方法:一种是基于随机重采样的投票权重学习,另一种则是基于个体分类模型相对优势的投票权重学习。这两种方法都旨在优化投票过程,进一步提升表情识别的性能。
实验部分,研究人员使用了AFEW5.0动态表情库进行验证,结果证明了所提算法的有效性。关键词包括动态表情识别、多视觉描述子、集成分类器和权重学习。该研究为理解和改进人脸识别技术,特别是在动态表情识别领域,提供了新的视角和实用的解决方案。
这篇论文发表在2019年8月的《电子学报》第47卷第8期,属于中图分类号下的相关研究,并具有A类文献标识码。文章的DOI为10.3969/j.issn.0372-2112.2019.08.006,可通过提供的URL访问电子版全文。
1250 浏览量
1084 浏览量
2656 浏览量
点击了解资源详情
点击了解资源详情
点击了解资源详情
点击了解资源详情
点击了解资源详情
anitachiu_2
- 粉丝: 31
- 资源: 801
最新资源
- Angular实现MarcHayek简历展示应用教程
- Crossbow Spot最新更新 - 获取Chrome扩展新闻
- 量子管道网络优化与Python实现
- Debian系统中APT缓存维护工具的使用方法与实践
- Python模块AccessControl的Windows64位安装文件介绍
- 掌握最新*** Fisher资讯,使用Google Chrome扩展
- Ember应用程序开发流程与环境配置指南
- EZPCOpenSDK_v5.1.2_build***版本更新详情
- Postcode-Finder:利用JavaScript和Google Geocode API实现
- AWS商业交易监控器:航线行为分析与营销策略制定
- AccessControl-4.0b6压缩包详细使用教程
- Python编程实践与技巧汇总
- 使用Sikuli和Python打造颜色求解器项目
- .Net基础视频教程:掌握GDI绘图技术
- 深入理解数据结构与JavaScript实践项目
- 双子座在线裁判系统:提高编程竞赛效率