耳蜗基底膜特性下的高效语音特征提取与智能轮椅应用提升

需积分: 6 2 下载量 155 浏览量 更新于2024-09-09 收藏 1.89MB PDF 举报
本文研究的论文深入探讨了基于人耳听觉特性的语音特征提取方法,具体聚焦于利用伽马通滤波器组来模拟耳蜗基底膜的滤波特性。耳蜗基底膜是内耳中负责转换声波为神经信号的关键结构,其独特的时间频率响应为声音处理提供了重要的参考。研究者首先对伽马通滤波器组进行研究和修正,这种滤波器具有良好的模拟耳蜗基底膜滤波性能,能够精确地捕捉到语音信号中的关键特征。 提出的GT-ERBCC (GammaTone-based Equivalent Rectangular Bandwidth Cepstral Coefficient) 语音特征提取方法,就是基于这种修正后的滤波器组。这种方法通过计算等价矩形带宽cepstrum系数,有效地提取出语音信号的频谱特性,这对于语音识别系统来说非常重要,因为它能简化识别过程,提高系统的准确性。在实际应用中,这个特征提取方法被成功地应用到了智能轮椅的人机交互系统中。 智能轮椅的人机交互通常依赖于精确的语音控制,因此,一个高效且准确的语音识别系统对于实现无障碍交流至关重要。研究结果显示,采用基于耳蜗基底膜特性的特征提取方法显著提升了语音识别系统的识别率,使得智能轮椅能够更好地理解和响应用户的语音指令。 论文的作者团队包括罗元教授、陈君硕士研究生、张毅教授以及童开国硕士研究生,他们分别在机器视觉、智能信号处理、机器人技术等领域有所专长。他们的合作展示了跨学科研究的力量,即如何将生物学原理与信息技术相结合,提升智能设备的性能。 这篇论文不仅贡献了一种新的语音特征提取技术,而且展示了其在实际应用中的潜力,特别是在改善智能设备,如智能轮椅的人机交互体验方面的价值。这对于推动人工智能和无障碍技术的发展具有重要意义。