计算声场景分析模型:基于听觉心理学的研究

版权申诉
0 下载量 182 浏览量 更新于2024-08-08 收藏 4.26MB PDF 举报
"这篇硕士学位论文主要探讨了基于听觉心理学的计算声场景分析模型,作者为李想,专业为信号与信息处理,导师为吴镇扬。论文详细研究了人的听觉系统如何在复杂环境中识别和追踪声音,并通过计算声场景分析(cAS∞)模拟这一过程。" 在论文的第一部分,作者介绍了人类听觉系统的生理结构和心理特性,包括对声音强度、音调、音色和空间定位的感知。同时,定义了声场景分析(ASA)的概念,这是一种模拟人类感知能力的研究方法。文章还讨论了听觉心理学的一些基本准则,以及此类研究的重要性。 第二章对计算声场景分析的现有研究进行了概述,涵盖了主要的研究内容和不同模型的特点。作者分析了各种模型的优缺点,并预测了未来可能的应用领域和技术发展趋势。 第三章深入探讨了一种基于Wavlet Energy Transform (WET)的计算声场景分析算法,详细阐述了与该算法相关的外围听觉模型和中级听觉模型。这些模型是模拟人类听觉系统对声音处理的关键组成部分。 第四章介绍了基于神经振荡器网络的计算声场景分析算法,分析了其生理基础和振荡特性,并展示了实验结果。神经振荡器网络被认为能有效地模拟大脑如何解析和区分声音。 鉴于神经振荡器网络算法的局限性,第五章提出了一种改进算法,该算法结合了周期图谱峰值检测和序列组合技术,以提高声音分离的效果。实验证明,改进后的算法相比原始神经振荡器网络算法有显著提升。 在论文的结论部分,作者总结了研究工作,并对未来的研究方向提出了个人见解。关键词包括声场景分析、计算声场景分析、WET、神经振荡器网络、峰值检测、序列组合和声音分离。 这篇论文对于理解人类听觉系统的工作原理以及开发更高效的音频处理算法具有重要意义,特别是在云计算环境下,这些模型和技术可以用于语音识别、噪声抑制、声音分离等应用场景,对提升云服务中的音频处理性能有着积极的影响。