听觉机理驱动的鲁棒说话人识别:基于统计学习的稀疏表示与优化
需积分: 0 78 浏览量
更新于2024-09-06
收藏 697KB PDF 举报
本篇论文研究关注于"基于听觉机理的鲁棒说话人识别",由游大涛和韩纪庆两位学者合作完成,他们的工作受到高等学校博士学科点专项科研基金的支持。论文的核心观点是探索听觉中枢的编码机制与稀疏表示之间的关联。他们指出,听觉中枢的编码方式在信号处理层面与稀疏表示有相似之处,这意味着可以通过统计学习得到的原子来近似听觉中枢的基本编码单元,这些编码单元对应着语音的时间-频率结构。
研究者强调,虽然已经发现这种模拟方法在理论上可行,但实际应用中对于学习得到的基的有效性并未得到充分验证。为了解决这个问题,他们结合了听觉生理学的研究成果和相干性度量方法,设计了一套有效性评估策略,提出了一个优化算法来确保基的可靠性。他们提出的鲁棒语音特征旨在模拟听觉中枢的编码过程,以提高说话人识别的抗干扰性能。
关键词包括"说话人识别"、"鲁棒性"、"听觉机理"、"稀疏表示"以及"字典优化",这些都是论文探讨的主要技术手段和目标。论文的中图分类号为TP3915,表明其属于信号处理与通信技术领域中的说话人识别研究方向。
这篇论文不仅探讨了听觉感知在说话人识别中的潜在作用,还通过理论分析和实验验证,试图提升识别系统的稳健性和准确性,为实际的语音识别系统设计提供了新的思路和技术支持。
2019-07-22 上传
2019-09-10 上传
2019-07-22 上传
2019-09-11 上传
2019-07-22 上传
2019-09-06 上传
2019-07-22 上传
weixin_39840650
- 粉丝: 411
- 资源: 1万+
最新资源
- 掌握压缩文件管理:2工作.zip文件使用指南
- 易语言动态版置入代码技术解析
- C语言编程实现电脑系统测试工具开发
- Wireshark 64位:全面网络协议分析器,支持Unix和Windows
- QtSingleApplication: 确保单一实例运行的高效库
- 深入了解Go语言的解析器组合器PARC
- Apycula包安装与使用指南
- AkerAutoSetup安装包使用指南
- Arduino Due实现VR耳机的设计与编程
- DependencySwizzler: Xamarin iOS 库实现故事板 UIViewControllers 依赖注入
- Apycula包发布说明与下载指南
- 创建可拖动交互式图表界面的ampersand-touch-charts
- CMake项目入门:创建简单的C++项目
- AksharaJaana-*.*.*.*安装包说明与下载
- Arduino天气时钟项目:源代码及DHT22库文件解析
- MediaPlayer_server:控制媒体播放器的高级服务器