三維音頻距離感知敏感度的測量與分析
2022-06-20 17:56:28
摘要:
虛擬現(xiàn)實與多媒體技術(shù)的快速發(fā)展使三維音頻的應(yīng)用增多。傳統(tǒng)的三維音頻感知測量主要集中在人耳對方位感知性能上,欠缺對距離感知性能的深入研究,現(xiàn)有的三維音頻感知特性的研究不足以支撐三維音頻在距離感知性能方面的提升。通過三維音頻距離感知敏感度的實驗,得到距離、角度等因素對距離感知敏感度變化的影響規(guī)律,以及不同距離時的距離感知閾值。
引言
傳統(tǒng)的三維音頻可以分為多聲道三維音頻和雙耳三維音頻。多聲道三維音頻主要通過揚(yáng)聲器的排列呈現(xiàn)三維音頻的效果,而雙耳三維音頻則是通過頭相關(guān)傳遞函數(shù)(HRTF,Head Related Transfer Functions )實現(xiàn)的,它利用原始音頻與其時域?qū)?yīng)的頭相關(guān)沖激響應(yīng)(HRIR,Head-Related Impulse Response)進(jìn)行卷積,從而得到包含聲源與聽音者間方位角、高度角和距離的雙耳三維音頻信號,其對硬件需求較小,方便攜帶。但是,由于人耳對距離感知是由強(qiáng)度、混響、頻譜及雙耳間差異等復(fù)雜因素共同決定的,所以僅通過HRIR無法合成距離信息準(zhǔn)確的雙耳三維音頻。因此,探究人耳對三維音頻的距離感知特性,尤其是實際聲場環(huán)境下的表現(xiàn),對于提升三維音頻空間聽覺效果的研究及其應(yīng)用具有參考價值。
近年來,一些學(xué)者提出了基于距離的三維音頻恢復(fù)和編碼的方法。2014年,Zahorik P等人結(jié)合混響與幅度調(diào)制技術(shù),提高了在混響環(huán)境中,單聲道音頻的距離感知效果[4]。2016年,Spagnol S等人提出了近場聲像濾波器模型,通過使用延遲回饋濾波器組實現(xiàn)距離恢復(fù)函數(shù)模型[5]。2017年,Koutny等人提出了利用球諧函數(shù)分解的聲源距離恢復(fù)算法,該算法主要用于多通道三維音頻系統(tǒng)中的雙耳三維音頻恢復(fù)。2019年,李念等人研究了聽覺距離線索感知特性和定位機(jī)理及其在3D音頻編碼中的應(yīng)用。
傳統(tǒng)的三維音頻感知特性的研究主要針對水平角和高度角,但隨著基于距離的音頻重建和編碼的提出,部分學(xué)者也展開了對三維音頻距離的感知特性的研究。2016年,法國布雷斯特大學(xué)的Mathieu Paquier等人開展了聽覺、視覺對距離感知影響的聯(lián)合研究。2017年,武漢大學(xué)楊乘等人對三維空間距離感知特性進(jìn)行了研究。
綜上所述,一方面實際應(yīng)用中對三維音頻空間距離感知性能的要求提高,另一方面?zhèn)鹘y(tǒng)的三維音頻感知特性的研究主要集中在水平面和垂直面,對三維空間內(nèi)距離感知特性的研究較少,相關(guān)實驗主要是通過在消音室中不同位置的聲音進(jìn)行采集后,受試者利用耳機(jī)進(jìn)行測聽,zui終得到三維音頻的感知特性,鮮有在實際的聲場環(huán)境下進(jìn)行測量。傳統(tǒng)的實驗環(huán)境雖然可以滿足對不同方位感知敏感度的測量,但是削弱了對距離的感知。針對上述存在的問題,筆者在三維音頻感知特性的實驗基礎(chǔ)上,充分考慮其他因素對距離感知特性的影響,設(shè)計了三維音頻距離感知特性的實驗,采用受試者現(xiàn)場測聽,通過改變距離、角度得到相關(guān)數(shù)據(jù),并進(jìn)行統(tǒng)計分析得到三維音頻距離感知敏感度的變化情況和不同距離的距離感知閾值。
1、距離感知敏感度的測量
由于環(huán)境和人體自身的生理結(jié)構(gòu)等因素的影響,人耳對音頻方位的變化存在一定的感知閾值,只有當(dāng)空間方位的變化達(dá)到一定閾值時,人才能感受到方位的變化,這種感知閾值被稱為恰感知差異(JND,Just Notice Difference)。距離感知敏感度(DPS,Distance Perception Sensitivity)是指人耳對音頻在距離變化的感知特性。
1.1 實驗環(huán)境配置
傳統(tǒng)的感知敏感度實驗主要圍繞角度的變化進(jìn)行測試,測試主要通過采集消音室中不同角度的聲音,通過耳機(jī)進(jìn)行角度辨別,zui終得到感知敏感度。但是,這種傳統(tǒng)測試方式得到的DPS會受到一些因素的影響,首先,受試者在使用耳機(jī)進(jìn)行測聽實驗時,往往會因為頭中定位(IHL,Inside-the-head Localization)的影響,感覺聲像主要集中在人頭內(nèi)部,不能很好地感知距離的變化;其次,根據(jù)研究,在混響情況下,人耳對聲源方向的定位能力不如在消音室中,相反,人耳對聲源距離的定位能力在混響情況下比消音室里更準(zhǔn)確。綜上所述,本實驗安排在長6.2 m、寬3.4 m、高2.8 m的聽音實驗室中進(jìn)行,該房間經(jīng)過吸聲處理,室內(nèi)環(huán)境噪聲不大于40 dB,混響時間約為0.4 s,該混響時間既可以滿足聽音室的混響時間要求,又更加接近日常室內(nèi)環(huán)境的混響時間。
對于研究不同距離DPS的實驗,把揚(yáng)聲器固定在一個標(biāo)有刻度且可以前后移動的支架上,支架高度為使揚(yáng)聲器與人耳處在同一高度,通過控制移動揚(yáng)聲器控制聲源到人耳的距離。對不同水平角度的DPS進(jìn)行測量的實驗,采用旋轉(zhuǎn)座椅來調(diào)整角度,如圖1所示。
圖1 距離感知敏感度測試示例
實驗使用的揚(yáng)聲器為JBL Control 12C-VA吸頂揚(yáng)聲器,該揚(yáng)聲器的凈尺寸為3 in(7.6 cm),頻響范圍在68 Hz~17 kHz。該揚(yáng)聲器方便固定和移動,同時由于其尺寸較小,可以更好地滿足本次測試的需求??紤]到揚(yáng)聲器移動過程中產(chǎn)生的噪聲影響測試結(jié)果,支架使用了靜音軌道,其在移動過程中產(chǎn)生的輕微噪聲可以忽略不計。
由于高斯白噪聲沒有嚴(yán)格的周期性,可以有效地減少相位混淆現(xiàn)象的發(fā)生,同時高斯白噪聲包含全頻帶的頻率成分,所以本次實驗使用高斯白噪聲作為主觀聽音測試的音頻信號,由Audition生成,時為長600 ms,采樣率48 kHz、精度16 bit單聲道,zui高頻率為20 kHz,zui低頻率為20 Hz。
參與本實驗的有8名測試人員,其中5名男性,3名女性,年齡在20~25歲之間,都有主觀三維音頻的相關(guān)聽音實踐經(jīng)驗。在測聽實驗之前,受試者需要進(jìn)行三維音頻距離感知的聽音訓(xùn)練,使其可以更好地判斷遠(yuǎn)近。在聽音訓(xùn)練結(jié)束后,受試者需要完成參考音為100 cm,測試音為125 cm的固定點(diǎn)的聽音測試,測試過程中參考音和測試音會隨機(jī)播放,共40次,測試人員需要在2 s內(nèi)判斷聲音遠(yuǎn)近變化,zui終只有當(dāng)正確率超過80%才可以參與正式的測聽實驗??紤]到受試者需要對136個測試點(diǎn)進(jìn)行測聽,每個測試點(diǎn)可能需要測聽30次以上,所以在測試前會告知受試者本次測聽的具體步驟,同時在每個測試點(diǎn)測聽結(jié)束后,會讓受試者休息5 min,以提高受試者的測聽效率和測試結(jié)果的準(zhǔn)確性。
1.2 實驗方法
實驗采用經(jīng)典心理聲學(xué)中1up/2down的心理測試方法[9],該方法包含了多輪測試,每一輪測試的測試信號都依賴于前一輪的測試結(jié)果。1up/2down的意思為:當(dāng)受試者連續(xù)兩次判斷正確時,系統(tǒng)在當(dāng)前測試值的基礎(chǔ)上,減小參考音與測試音之間的步長;如受試者判斷錯誤,則將增大參考音與測試音之間的步長,生成新的測試值。記每一次步長變化為一次反轉(zhuǎn)(n)。
根據(jù)前期的預(yù)實驗結(jié)果,實驗將變化步長(Sn)的初始值設(shè)為50 cm,步長變換次數(shù)記為n,實驗過程中步長(Sn)變化公式:
對于步長變化時存在的小數(shù)部分四舍五入,以保證實驗過程中步長變化的zui小值為1 cm。
根 據(jù) 初 始 步 長 和 步 長 變 換 公 式 , 模 擬 使用1up/2down心理測試方法測試,當(dāng)參考音為50 cm時步長的變化情況,如圖2所示??梢钥吹剑瑴y試音的初始值從100 cm降到接近參考音50 cm時,需要經(jīng)過13次反轉(zhuǎn)。從第5次反轉(zhuǎn)之后,測試值接近平穩(wěn)。所以,在本次實驗過程中將反轉(zhuǎn)次數(shù)設(shè)為13次,對zui后五次的步長變化后的測試距離求平均值,得到某一位置的DPS。
圖2 50 cm時測試音的變化情況示意圖
實驗測量了聲源距離到人耳50 cm、65 cm、80 cm、100 cm、120 cm、140 cm、160 cm、180 cm、200 cm、225 cm、250 cm、275 cm、300 cm、340 cm、380 cm、420 cm、465 cm,共17個距離的數(shù)據(jù);對應(yīng)每個距離的測量垂直角均為0°,水平角如圖3所示,為0°、15°、30°、45°、75°、90°、135°、180°的DPS,每個實驗人員共需要進(jìn)行136組聽音測試。
圖3 實驗測量范圍示意圖
1.3 實驗步驟
本實驗具體流程,如圖4所示。
圖4 實驗流程圖
步驟一:根據(jù)需要測聽的水平角和距離,確定固定測聽點(diǎn)作為參考音,選取水平角相同,距離相差一個初始步長的音頻信號作為測試音。
步驟二:隨機(jī)播放參考音與測試音。兩段測試信號的長度均為600 ms,兩段信號間的移動的時間間隔控制在1 s內(nèi)。
步驟三:受試者需在2 s內(nèi)做出選擇,判斷步驟二中播放的音頻信號的位置變化情況,即判斷第二個音頻信號離前一個音頻信號更近或更遠(yuǎn)。測試人員做出選擇后無法更改,直接執(zhí)行下一步驟。
步驟四:當(dāng)連續(xù)兩次判斷正確時,將減小距離步長;為了保證實驗的準(zhǔn)確性,實驗允許無法判斷的情況出現(xiàn),當(dāng)連續(xù)出現(xiàn)兩次無法判斷的情況時,則按判斷錯誤處理,增大距離步長;進(jìn)入步驟五。
步驟五:根據(jù)白噪聲的特性,長時間的測聽實驗可能會造成受試者產(chǎn)生疲勞,影響測試結(jié)果。所以,當(dāng)實驗測試測試次數(shù)大于40次,記該位置的DPS為0,并退出本次測試;實驗測試次數(shù)小于40次,同時反轉(zhuǎn)次數(shù)大于13次,則取zui后五次的測試值的平均值為該位置的DPS,否則返回步驟二繼續(xù)進(jìn)行測聽。
2 距離感知敏感度的分析
2.1 異常值處理
受試者在測聽過程中可能會出現(xiàn)對某一位置的聲音信號無法準(zhǔn)確定位的情況。也就是,當(dāng)受試者經(jīng)過40次測聽,同時翻轉(zhuǎn)次數(shù)小于13次的情況時,則將該點(diǎn)的DPS記為0。本次實驗中共有三組數(shù)據(jù)出現(xiàn)這種情況。插值法是離散函數(shù)逼近常用的一種方法,通過插值方法可以構(gòu)造連續(xù)曲面經(jīng)過的全部離散點(diǎn),同時根據(jù)有限個已知點(diǎn)的值推導(dǎo)未知點(diǎn)的值。本實驗利用多項式插值法對這些數(shù)據(jù)進(jìn)行替換。
多項式插值法[12]以表示某條 線段的前一個端點(diǎn),表示該線段的后一個端點(diǎn),則對于在范圍內(nèi)的橫坐標(biāo)為x的點(diǎn),其高度y為:
其中,yi和yi+1的兩個參數(shù)稱為基函數(shù),二者之和為1,分別代表yi和yi+1對插值點(diǎn)高度的權(quán)值。
2.2 DPS與距離、角度的關(guān)系
不同角度時 D P S 隨距離的變化如圖 5 所示,在50~160 cm時,距離感知敏感度的變化較為緩慢;在160~465 cm時,距離感知敏感度的變化較為明顯。在測量距離相同的情況下,不同角度的DPS的變化趨勢大致相同。
圖5 不同角度時DPS隨距離的變化情況
不同距離 D P S 隨角度的變化如圖 6 所示,在45°~75°時,不同距離的DPS都有一個明顯的下降,即在這一區(qū)間內(nèi),人耳對距離的變化更為敏感;測量角度為0°和180°時,在距離相同的情況下,DPS基本一致。
圖6 不同距離時DPS隨角度的變化情況
為了研究整個測量范圍內(nèi)DPS的變化情況,在已有的實驗數(shù)據(jù)基礎(chǔ)上,采用三次樣條插值的方法對測量范圍內(nèi)數(shù)據(jù)進(jìn)行擬合。三次樣條插值是通過構(gòu)造分段多項式進(jìn)行插值,從而可實現(xiàn)較小的插值誤差[13],其定義為:
設(shè)在區(qū)間[a,b]上給定一個分割
如果定義在[a,b]上的一個函數(shù)S(x)滿足下列條件:
(1)在每個小區(qū)上,S(x)是三次多項式;
(2)在整個區(qū)間[a,b]上,S(x)為二階連續(xù)可導(dǎo)函數(shù),也就是說在每個節(jié)點(diǎn)處
則稱S(x)為三次樣條插值函數(shù)。
通過對實驗范圍內(nèi)各點(diǎn)進(jìn)行插值擬合,zui終得到了距離感知敏感度的曲面圖,如圖7所示。隨著距離的增大DPS的整體變化呈現(xiàn)增大趨勢,即隨著距離的增大,人對聲源距離的感知減小。在60°~90°區(qū)間內(nèi),DPS出現(xiàn)下降,即人對聲源距離變化的感知在左右兩側(cè)更為明顯,這與2017年武漢大學(xué)楊乘等人對不同DPS測量數(shù)據(jù)擬合得到的DPS變化趨勢基本一致。
圖7 測量范圍內(nèi)距離感知敏感度曲面圖
傳統(tǒng)的實驗僅僅對DPS的變化趨勢進(jìn)行分析,為了進(jìn)一步研究距離和角度對DPS的影響,實驗對現(xiàn)有數(shù)據(jù)進(jìn)行多元線性回歸分析,其具體數(shù)學(xué)模型如下:
假設(shè)某一因變量y受k個自變量的影響,其中n組觀測值為。那么,多元線性回歸模型的結(jié)構(gòu)形式為:
式中,為待定參數(shù),為隨機(jī)變量。
通過對現(xiàn)有的實驗數(shù)據(jù)進(jìn)行分析,得到角度(x1)和距離(x2)對DPS的影響。如圖8所示,圖中P-val的值表示樣本間差異由抽樣誤差所致的概率,當(dāng)P-val<0.05為顯著,P-val<0.01為非常顯著,可以看到x1=0.00,x2=0.95,由此可以得到距離是DPS的主要影響因素。
圖8 距離和角度對DPS的影響
2.3 距離感知閾值
距離感知閾值( D P T , D i s t a n c e P e r c e p t i o n Threshold)是指當(dāng)距離的變化達(dá)到一定閾值時,人才能感受到距離的變化。通過對本實驗數(shù)據(jù)的分析得到100 cm、200 cm、300 cm的距離條件下的DPT,方便進(jìn)行下一步的研究。上文已經(jīng)對影響DPS的因素進(jìn)行了分析,得到角度不是影響DPS的主要因素,所以在研究DPT時,排除角度的因素。
通過對相同距離的DPS統(tǒng)計,得到了測量距離為100 cm、200 cm和300 cm的DPT的分布情況,如圖9、圖10、圖11所示。從統(tǒng)計結(jié)果中發(fā)現(xiàn),當(dāng)測量距離為100 cm和200 cm時,DPT較為集中,測量距離為300 cm時DPT分布的較為分散,和上文得到DPS隨距離變化的結(jié)論一致。
圖9 測量距離100 cm 距離感知閾值的分布情況
圖10 測量距離200 cm 距離感知閾值的分布情況
圖11 測量距離300 cm 距離感知閾值的分布情況
標(biāo)準(zhǔn)偏差用來描述各數(shù)據(jù)偏離平均數(shù)的距離(離均差)的平均數(shù)。標(biāo)準(zhǔn)差能反映一個數(shù)據(jù)集的離散程度,標(biāo)準(zhǔn)偏差越小,這些值偏離平均值就越少,反之亦然。其公式如下:
通過去除部分偏差較大的值后,對相關(guān)數(shù)據(jù)分析得到,測量距離為100 cm時,距離感知閾值的平均值為 7.62 cm,其中zui小值為1 cm,zui大值為14.4 cm,標(biāo)準(zhǔn)偏差為3.98 cm。測量距離為200 cm時,距離感知閾值的平均值為15.76cm,其中zui小值5.4 cm,zui大值28.2 cm,標(biāo)準(zhǔn)偏差為6.0 cm。
3 總結(jié)
本實驗設(shè)計了三維音頻感知敏感度的實驗,使用高斯白噪聲作為聲源,通過改變水平角和距離,測量了水平方向0~180°,距離50~465 cm內(nèi)136個測量點(diǎn)的DPS。根據(jù)實驗數(shù)據(jù),分析了距離、角度對距離感知敏感度的影響規(guī)律。相較于角度等其他因素,距離為影響DPS的主要因素;50~160 cm時,DPS的變化較小,160~465 cm時,DPS的變化較大;人對聲源距離變化的感知在人耳的左右兩側(cè)更為明顯;得到了不同距離時的距離感知閾值。在后續(xù)工作中,將擴(kuò)大實驗測量的范圍,加入高度角等因素,以及音量、混響等交叉因素的綜合影響,繼續(xù)完善三維音頻感知敏感度的研究。