⼼理声学基本知识⼼理声学基本知识
⼼理声学的基本要素是到达⼈⽿的声⾳的频率、强度和谱结构。以下将进⼀步讨论基于⼼理声
学的声源定位、距离感知及包围感等。
2.2.1 ⼈⽿对声源的定位
在⾃然听⾳中,⼈的听觉系统对声源的定位取决于多个因素——双⽿接收到的信号差异⽤来决
定声源的⽔平位置,由外⽿对⾼频信号的反射所引起的⽿郭效应决定声源的垂直位置,⽽⼈⽿
的某些⼼理声学特性对于声源的定位也起到很⼤的作⽤。
2.2.1.1 双⽿效应
在⾃然听⾳环境中,双⽿信号之间的差异对于声源的定位是⾮常重要的。该因素可以在直达声
场的听⾳环境中得到最好解释,如图2-6所⽰。
图2-6 声源S与镜像声源S′引⼊最⼤程度相似的双⽿因素
声源位于⽔平⾯上,⽔平⽅位⾓为θ,与⼈头中⼼的距离为r,到达左右⽿的距离分别为SL和
SR。由于SL>SR,声⾳⾸先到达右⽿,从⽽在到达双⽿的时间先
后上形成时间差。这种时间差被定义为双⽿时间差(interaural time difference,ITD)
,它与声源的⽔平⽅位⾓θ有关。当θ = 0°时, = 0;当θ = ±90°时, 达到最
⼤值,对⼀般⼈头来说,为0.6~0.7ms 的数量级。
在低中频(f <1.5kHz)情况下,双⽿时间差是定位的主要因素,这时对固定频率的声⾳,双⽿
时间差与双⽿相位差是相对应的。然⽽对于更⾼的频率,虽然双⽿时间差的概念依然正确,但
双⽿相位差的概念将变得模糊不清。以正弦声⾳为例来进⾏解释,设双⽿时间差的最⼤值为
Δtmax,则⾓频率为ω的正弦声⾳在左、右两⽿产⽣的相位差为ΔΦ = ωΔtmax。可以看出,当ω
较⼩时,声⾳频率较低,波长较长,由时间差所造成的相位差有确定的意义,双⽿可以根据它
来判定声源的⽅位;当ω较⼤时,即声⾳频率较⾼、波长较短时,由时间差所形成的相位差数值
将较⼤,甚⾄会超过180°,使⼈不能判断是超前还是滞后,因⽽失去了作为声源定位因素的意
义。所以双⽿相位差只对低频声的⽅位判断起主要作⽤,⽽双⽿时间差(严格说是群延时)则
可作为1.5~4.0kHz的⼀个定位因素。
另外⼀⽅⾯,⼈头对⼊射声波起到了阻碍作⽤,导致了两⽿信号间的声级差(interaural
intensity difference,IID)。声级差除与⼊射声波的⽔平⽅位⾓有关外,还与⼊射声波的频率有
关。在低频时,声⾳波长⼤于⼈头尺⼨,声⾳可以绕射过⼈头⽽使双⽿信号没有明显的声级
差。随着频率的增加,波长越来越短,头部对声波产⽣的阻碍越来越⼤,使得双⽿信号间的声
级差越来越明显——这就是我们常说的⼈头遮蔽效应。对于1.5~4.0kHz的频率范围来说,声级
差和时间差是声源定位的共同因素,⽽当f > 5.0kHz时,双⽿声级差是定位的主要因素,与时间
差形成互补。总的来说,双⽿时间差和声级差涵盖了整个声⾳频率范围。
但是如果只考虑双⽿时间差和声级差两个因素,还不⾜以完全解释定位问题,其中最典型的问
题就是前后镜像声源的定位。假设⼈头是⼀个球体,不存在外⽿,如图2-7所⽰,⽔平⽅位⾓为
θ的声源和⽔平⽅位⾓为180°.θ的镜像声源在⼈⽿处会产⽣相同的IID和ITD。对于实际的⼈头来
说,虽然IID和ITD不会完全相同,但是它们会在很⼤程度上相似。当只考虑双⽿时间差和声级差
时,就会产⽣前后镜像声源的混淆,其实这只是空间锥形区域声像混淆(cones of confusion)
的⼀种
特例。为了解决这个问题,就要依赖于其他的因素进⾏声源定位了。
图2-7 空间锥形区域声像混淆
2.2.1.2 ⽿郭效应
在听觉系统中⽤于对声源进⾏垂直定位的因素通常被认为是“单⽿信号”。⽿郭具有不规则的形
状,形成⼀个共振腔。当声波到达⽿郭时,⼀部分声波直接进⼊⽿道,另⼀部分则经过⽿郭反
射后才进⼊⽿道。由于声⾳到达的⽅向不同,反射声和直达声之间强度⽐不仅发⽣变化,⽽且
反射声与直达声之间在不同频率上产⽣不同的时间差和相位差,使反射声与直达声在⿎膜处形
成⼀种与声源⽅向位置有关的频谱特性,听觉神经据此判断声⾳的空间⽅向。⽿郭效应的本质
就是改变不同空间⽅向声⾳的频谱特性,也就是说⼈类听觉系统功能上相当于梳状滤波器,将