稳态和动态虚拟听觉重放对近场距离感知的影响.pdf
《稳态和动态虚拟听觉重放对近场距离感知的影响.pdf》由会员分享,可在线阅读,更多相关《稳态和动态虚拟听觉重放对近场距离感知的影响.pdf(9页珍藏版)》请在咨信网上搜索。
1、第 43 卷 第 3 期Vol.43,No.32024 年 5 月Journal of Applied AcousticsMay,2024 研究报告 稳态和动态虚拟听觉重放对近场距离感知的影响燕子翔谢菠荪朱 俊(华南理工大学物理与光电学院声学研究所广州510641)摘要:虚拟听觉重放是研究距离感知的一种重要工具,它可分为传统的稳态虚拟听觉重放和动态虚拟听觉重放。稳态虚拟听觉重放经常会产生头中定位而影响距离感知的判断,从而影响最终的实验结果。过去的实验大多采用稳态虚拟听觉重放,因此其结论也存在较大的争议性。该文对比研究稳态和动态的虚拟听觉重放对绝对距离感知效果的影响。实验采用非个性化头相关传输函
2、数进行双耳合成,将分布在水平面0.201.00 m的7个距离、0 180的7个方位角下的信号通过耳机进行虚拟重放。心理声学实验结果表明,在稳态虚拟听觉重放条件下,受试者不同程度地报告了存在头中定位。而动态虚拟听觉重放系统能够利用动态因素,从而产生头外化的听觉感知。统计分析表明动态虚拟听觉重放下的距离感知效果与稳态重放存在明显的差异。由于动态虚拟重放更接近真实声源的感知效果,应选用这种方法作为实验工具。同时,在实际的空间声应用中,也应该采用动态虚拟听觉重放产生不同的距离感知。关键词:虚拟听觉重放;距离感知;声学近场中图法分类号:O428;O429文献标识码:A文章编号:1000-310X(202
3、4)03-0469-09DOI:10.11684/j.issn.1000-310X.2024.03.001Influence of static and dynamic virtual auditory display on near-fielddistance perceptionYAN ZixiangXIE BosunZHU Jun(Acoustic Lab,School of Physics and Optoelectronics,South China University of Technology,Guangzhou 510641,China)Abstract:Virtual au
4、ditory display(VAD)is a tool in the researches of auditory distance perception.It can besubdivided into conventional static VAD and advanced dynamic VAD.Static VAD is inclined to create the per-ception of in-head-localization and influences the distance judgment,and thereby spoils the final experime
5、ntalresults.However,static VADs were used in many previous experiments,resulting in controversial conclusions.By using static and dynamic VADs,the present work explores the influence of static and dynamic VAD onthe auditory distance perception.Non-individualized head related transfer functions were
6、used for binauralsynthesis.The resultant binaural signals of seven target distances from 0.20 m to 1.00 m and seven horizontalazimuths from 0to 180were presented by headphone.Results of psychoacoustic experiments indicated thatfor static VAD,subjects reported the perception of in-head-localization.I
7、n contrast,dynamic VAD created dy-namic cue for externalized perception.Statistical analysis reveals the significant difference between the resultsof distance perception of static and dynamic VAD.A dynamic VAD should be used as a tool in the experimentsof distance perception because its results are
8、more consistent with those of actual sound source.Moreover,dynamic VADs should be also used in practical spatial sound to create different distance perceptions.Keywords:Virtual auditory display;Distance perception;Near-field2022-12-02收稿;2023-03-06定稿国家自然科学基金项目(12174118)作者简介:燕子翔(1998),男,安徽合肥人,硕士研究生,研究
9、方向:电声与听觉。通信作者 E-mail:4702024 年 5 月0 引言听觉距离感知是人类空间听觉能力之一。对听觉距离感知的研究不但对人类听觉机理的研究方面有重要的意义,且对空间声重放应用技术的发展有重要的作用。过去的研究表明,听觉距离感知是多个因素协同作用的结果,主要包括随距离变化的声音的主观响度、空气吸收引起的高频衰减、近场头相关传输函数(Head related transfer function,HRTF)效应,以及直达混响声能比等14。但总体来说,目前对听觉距离感知因素及其相互作用的研究远不如方向定位充分,结论也远不如方向定位明确。而近年发展空间声重放的技术更需要对听觉距离感知因
10、素的进一步研究。在目前对相关的神经生理学机理还不明了的情况下,听觉距离感知的研究主要是通过心理声学实验进行,其结果也为下一步进行神经生理学机理的研究提供基础。传统心理声学实验方法是控制实际的声源距离及声学环境,从而产生不同的听觉距离感知因素。但是传统的方法比较复杂,不容易对不同听觉距离感知因素进行独立的控制。空间声场重放或虚拟听觉(双耳)重放(Virtualauditory display,VAD)可以看成是声音虚拟现实技术,理论上可以从物理上精确重构声场或双耳声压,从而产生不同的听觉感知信息(包括听觉距离感知因素)。特别是采用耳机的VAD,它不但硬件结构相对简单,避免了听音室反射声对实验的影
11、响,并且理论上可以精确控制双耳声压,从而独立地控制各种听觉感知因素。因而VAD技术成了听觉感知心理声学研究的实验工具,近年大量涉及距离感知的实验都是基于VAD技术进行的34。但是,有不少实验得到与传统真实声源实验不一致甚至冲突的结果,有些研究也以此作为新的结论。为了解决这问题,需要对VAD作为实验工具的有效性进行检验,并寻找产生不一致结果的原因。事实上,人类都是通过双耳感知任意声场的信息的。VAD是通过信号处理的方法模拟不同声源和声学环境所产生的双耳声信号,从而在耳机重放中产生相应的听觉感知。VAD可细分为稳态重放和动态重放两种方式1。稳态重放假定倾听者头部的方向和位置固定,信号处理中不考虑头
12、部运动引起的双耳声压的动态变化。而动态重放采用头部跟踪器检测倾听者头部的瞬时方向和位置,不断地刷新倾听者自身特性的模拟参数(如HRTF),从而实时地模拟出双耳声信号及其随倾听者头部方向和位置的变化。稳态重放技术上相对简单,比较容易实现,所以过去许多研究是采用稳态VAD作为距离感知实验工具的。另一方面,在对实际声源和环境的听觉感知中,头部不自觉的微小转动引起的双耳声压变化带来了动态听觉信息,这对于听觉定位是至关重要的5。稳态VAD失去了这些动态信息,很容易产生头中定位感知。这可能是采用稳态VAD作为距离感知实验工具得到不一致结果的基本原因。在听觉距离感知的实验中,消除头中定位是控制听觉距离感知的
13、基础或前提。因而理应在重放中准确模拟出真实声源所产生的双耳声压及其动态变化,也就是需要用动态VAD作为实验工具。除此之外,在空间声的实际的应用中(如虚拟现实的应用),也有不少研究企图在稳态VAD中产生不同距离的虚拟源感知,但实际效果却是有限的1。为了说明上述问题,特别是验证VAD作为听觉距离感知实验工具的有效性,本文通过心理声学实验研究稳态和动态VAD在不同条件下对绝对距离感知效果。实验结果证明稳态VAD系统会产生误导的结果,而动态虚拟重放更接近真实声源的结果,所以应该采用动态VAD系统作为实验工具。而实际应用也应采用动态VAD产生不同的距离感知。1模拟不同距离自由场虚拟源的原理本文采用顺时针
14、的球坐标系统,声源空间位置由(r,)表示,如图1所示。其中0 6 r +表示距离;906 6+90表示仰角,为90、0和90分别表示正下方、水平面和正上方;180 6 180表示方位角,水平面为90、0、90和180分别表示正左、正前、正右和正后方向。如前所述,听觉距离感知是多个因素共同作用的结果,且和环境反射声有关。为简单起见,这里仅模拟自由场声源听觉距离感知的情况,这样可避免环境反射声参数的变化(如直达混响声能比、混响时间等)带来的不确定性,容易和过去对自由场真实声源的实验结果比较。同时,假定目标声源位于距头中心1.0 m以内的距离,空气吸收引起的高频声波衰减可以忽略(通常空气吸收引起的高
15、频衰减第43卷 第3期燕子翔等:稳态和动态虚拟听觉重放对近场距离感知的影响471要在声源距离大于十几米的情况下才开始产生可感知的效果)。Oz?xy?Sr?图1倾听者头部的坐标系统Fig.1 Coordinate system of listeners head在上述条件下,已知的声源距离感知因素包括随距离变化的声音的主观响度和近场HRTF效应。声音主观响度是由自由场中声源产生的声压幅度随距离衰减引起,是相对距离感知因素。近场HRTF效应是由于头部对入射声波的散射、阴影作用以及耳廓对声波的散射作用,产生与声源方向、距离有关的双耳声级差(Interaural level difference,IL
16、D)和双耳声压谱。对位于(r,)自由场点声源,其产生的双耳声压可由对应的近场HRTF计算得到:P=14rH(r,f)P0.(1)这里为L和R分别表示左耳和右耳,f 为频率,P0正比于声源的振幅。式(1)中,因子1/r描述自由场点声源声压幅度随距离的变化,H描述各种HRTF相关的效应。与声源距离有关的线性延时已略去,因为单声源的情况下该延时不会引起可感知的效应。在稳态VAD的情况下,给定目标虚拟源的位置(r,),将单路输入信号E0按式(2)进行HRTF滤波处理,得到一对双耳声信号:E=14rH(r,f)E0.(2)将双耳声信号用耳机重放,即可产生和自由场声源一致的双耳声压。对动态VAD,当倾听者
17、头部转动后(本文只考虑头部转动,不考虑头部平移),目标声源相对头部的方向发生改变。头部跟踪器通过检测头部的瞬时方向,得到目标声源相对头部的位置,并据此不断地刷新式(2)信号处理的HRTF数据,从而模拟出双耳声压随头部运动的动态变化。有关动态VAD的详细原理可参考附录A和文献1,6。2实验原理与方法为了验证稳态VAD会产生与真实声源不一致的距离感知结果,对稳态和动态VAD进行了距离感知的实验。也就是按照第1节给出的方法,分别在稳态和动态VAD中产生不同目标距离和方向的双耳声信号并用耳机重放,然后进行距离和方向感知实验。实验是在文献6中给出的虚拟听觉环境实时绘制系统平台上进行。该系统基于个人计算机
18、平台用C+和Python混合编程实现,采用电磁追踪器(Polhemus FASTRAK)实时检测倾听者头部的3个转动自由度运动参数,进而通过旋转矩阵实时计算声源相对倾听者头部中心的新的球坐标,从而找出该球坐标下的HRTF进行滤波处理,最后馈给耳机重放,产生目标虚拟源。实际测量表明,该系统的场景刷新率和系统平均滞后时间分别为60 Hz和25.4 ms。Sandvad7的研究结果表明,刷新率至少要大于10 Hz,否则会对虚拟声源的定位判断造成影响,而20 Hz的场景刷新率对定位判断几乎没有影响。有关系统滞后时间,Brungart等8认为对于大部分的虚拟听觉应用场景来说,小于60 ms的系统滞后时间
19、即可满足要求,而对于相对来说要求较高的研究场景来说,小于30 ms的系统滞后时间也足以满足要求。因而该系统的场景刷新率和系统滞后时间均能够满足研究需要。信号处理所采用的HRTF数据库是通过对配备DB60/61小耳廓的无躯干KEMAR人工头进行边界元法(Boundary element method,BEM)数值计算得到,HRTF的采样频率为44.1 kHz,长度为512点9。该HRTF数据库包含0.20 m、0.25 m、0.30 m、0.40 m、0.50 m、0.75 m以及1.00 m共7个距离,每个距离下方位角和仰角的范围分别为06 6 355和856 6+85,且分辨率均为5,因此单
20、个距离下共有2520个空间位置的双耳HRTF。为了获取更高精度的HRTF,采用双线性插值10对该数据库进行插值处理,进而得到7个距离下、方位角和仰角分辨率均为1的64440个空间位置的双耳HRTF。4722024 年 5 月采用非个性化近场HRTF进行处理,不止是为了方便。其一是因为近场HRTF的获取比较困难,目前国际上只有本实验室具有真人受试者的(个性化)近场测量HRTF数据库。国际上过去的VAD实验是采用非个性化测量或计算近场HRTF进行处理,甚至是从远场HRTR用非常粗略的近似得到的HRTF进行处理。如果本研究用个性化近场HRTF进行处理而得到与国外过去研究不一致的结果,反而不容易区分这
21、种不一致是源于动态VAD还是个性化近场HRTF处理。其二是本文主要研究距离感知。本实验室余光正等过去的实验已经证明,个性化HRTF主要影响稳态VAD方向定位(减少前后和上下混乱),对距离感知影响很少11。而对动态VAD,由于引入了动态定位因素,方向定位对个性化HRTF的依赖进一步减少。所以本研究特意采用非个性化近场HRTF进行处理。实验采用的是入耳式耳机(Etymotic ResearchER-2)进行重放,ER-2耳机具有平直的幅度响应,因此可略去耳机传输特性均衡这一过程。采用全频带粉红噪声作为重放信号,为了使受试者有足够的时间进行距离判断,信号长度为15 s。目标虚拟源位置分布在右半水平面
22、,共7个距离(0.20 m、0.25 m、0.30 m、0.40 m、0.50 m、0.75 m以及1.00 m),每个距离共7个方位角(0、30、60、90、120、150以及180)。这里选择的最小目标虚拟源距离是0.20 m,主要是因为平均头部半径大约是0.0875 m,更近的目标距离将非常靠近头表面,计算(或测量)HRTF数据的误差变得很大(因而本文的数据库包括的最小目标声源距离也是0.20 m)。同时在少于0.20 m的距离,距离感知实验的误差也很大。实验在一间本底噪声小于30 dBA的控制室内进行。实验过程中,受试者通过FASTRAK电磁跟踪器报告感知虚拟源位置。电磁跟踪器包括两个
23、接收器,其一固定在受试者头表面,用于实时检测受试者的头部运动参数;另一个固定在一根指示棒的末端,实验过程中受试者通过指示棒指向感知的虚拟源位置,由计算机进行位置的记录,所记录的数据包括方位角、仰角以及距离3个参数。共8名受试者(5男3女)参加实验,且双耳听力均正常。每种实验条件下的虚拟源位置重复重放两次,采用随机位置的方式进行重放,因而每种实验条件下共有8名受试者2次重复=16个判断(样本)。从统计学的角度,样本量越大,当然越好,但实验的工作量越大。因而实际的实验通常是在样本量和工作量方面做一定的折中。较少样本带来的影响将在3.3节讨论。实验前会对受试者进行一定程度的听音训练,确保在动态条件下
24、头部的微小转动以及在静态条件下头部的保持不动。从头部跟踪器检测的数据(以及作者团队过去在类似实验的数据表明),动态条件下头部绕垂直轴转动的角度在10 25之间,绕前后轴转动的角度在10 20之间。稳态条件下,头部绕垂直轴和前后轴转动的角度不大于3。最后对实验结果进行统计分析。3实验结果3.1头中定位结果稳态VAD条件下,可能会出现头中定位感知的现象。表1给出了不同目标虚拟源方向和距离的情况下头中定位所占的百分比。头中定位的信号的方向分布主要在正前方S=0和正后方S=180,在侧前方S=30也出现了少量的头中定位。在侧向S分别为60、90、120和150没有出现头中定位的情况。也就是说,稳态VA
25、D主要是对前方和后方附近的目标虚拟源产生头中定位。这和过去许多研究的结果是一致的12。稳态VAD系统下头中定位信号的距离分布并无明显规律性,但主要分布在0.5 m以内的区域。对动态VAD,所有目标声源方向和距离都没有出现头中定位。也就是说,动态因素消除了头中定位,这也是和过去研究的结果一致的1314。表1不同方位角下的头中定位百分比Table 1 Percentage of in-head-localizationunder different azimuths(单位:%)距离/m03060901201501800.2031.36.3000037.50.2525.00000018.80.303
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 稳态 动态 虚拟 听觉 重放 近场 距离 感知 影响
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。