CN118633301A - 用于回放沉浸式音频的音频处理方法 - Google Patents
用于回放沉浸式音频的音频处理方法 Download PDFInfo
- Publication number
- CN118633301A CN118633301A CN202280090803.3A CN202280090803A CN118633301A CN 118633301 A CN118633301 A CN 118633301A CN 202280090803 A CN202280090803 A CN 202280090803A CN 118633301 A CN118633301 A CN 118633301A
- Authority
- CN
- China
- Prior art keywords
- audio
- height
- channels
- filter
- channel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title description 2
- 238000000034 method Methods 0.000 claims abstract description 99
- 230000005236 sound signal Effects 0.000 claims abstract description 31
- 230000003595 spectral effect Effects 0.000 claims abstract description 12
- 230000006870 function Effects 0.000 claims description 102
- 238000012546 transfer Methods 0.000 claims description 88
- 230000008447 perception Effects 0.000 claims description 15
- 230000000694 effects Effects 0.000 claims description 6
- 230000001419 dependent effect Effects 0.000 claims description 2
- 230000002238 attenuated effect Effects 0.000 abstract description 2
- 238000012545 processing Methods 0.000 description 16
- 230000004044 response Effects 0.000 description 8
- 230000013707 sensory perception of sound Effects 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 7
- 238000005259 measurement Methods 0.000 description 5
- 101001121408 Homo sapiens L-amino-acid oxidase Proteins 0.000 description 4
- 102100026388 L-amino-acid oxidase Human genes 0.000 description 4
- 101100233916 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) KAR5 gene Proteins 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 238000013500 data storage Methods 0.000 description 4
- 101000827703 Homo sapiens Polyphosphoinositide phosphatase Proteins 0.000 description 3
- 102100023591 Polyphosphoinositide phosphatase Human genes 0.000 description 3
- UHZZMRAGKVHANO-UHFFFAOYSA-M chlormequat chloride Chemical compound [Cl-].C[N+](C)(C)CCCl UHZZMRAGKVHANO-UHFFFAOYSA-M 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000001902 propagating effect Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Landscapes
- Stereophonic System (AREA)
Abstract
一种从沉浸式音频格式的音频生成至少两个音频声道的方法(1000),用于利用具有至少两个音频扩音器(1,2)的非沉浸式扩音器系统在车辆内部回放至少两个音频声道,音频包括至少一个高度音频声道(1010)以及至少两个非高度音频声道(1050,1100)。方法包括:将虚拟高度滤波器(1300)应用(1500)于高度声道(1010),以便当由扩音器之一回放高度声道时,衰减高度声道的直接从扩音器(1;2)发出的频谱分量,并且放大高度声道的从车辆内部的车顶或靠近车顶的区域反射的频谱分量,以生成经滤波的虚拟高度音频信号(1175);以及将经滤波的虚拟高度音频信号与两个非高度音频声道中的至少一个混合(1700)。
Description
相关申请的交叉引用
本申请要求以下优先申请的优先权:于2021年12月20日提交的美国临时申请63/291,598(参考号:D21147AUSP1),于2022年6月20日提交的美国临时申请63/353,778(参考号:D21147AUSP2)以及于2022年6月20日提交的欧洲申请EP22179943.0(参考号:D21147AEP)。
技术领域
本公开涉及音频处理领域。特别地,本公开涉及一种从沉浸式音频格式的音频生成至少两个音频声道的方法,用于利用(非沉浸式)扩音器系统回放所述至少两个音频声道。本公开进一步涉及一种包括被配置为执行所述方法的处理器的装置、一种包括所述装置的车辆、一种程序以及一种计算机可读存储介质。
背景技术
车辆通常包含用于音频回放的扩音器系统。车辆中的扩音器系统可以用于从例如磁带、CD、在车辆的汽车娱乐系统中或者经由连接到车辆的设备来远程执行的音频流式传输服务或应用程序来回放音频。所述设备可以是例如无线地或通过电缆连接到车辆的便携式设备。例如,最近,如Spotify和Tidal等流式传输服务已被集成到汽车娱乐系统中,要么直接集成到车辆的硬件(通常称为“车机”)中,要么经由使用蓝牙或Apple CarPlay或Android Auto的智能手机来集成。车辆中的扩音器系统也可以用于播放地面和/或卫星广播。用于车辆的传统扩音器系统是立体声扩音器系统。立体声扩音器系统可以包括总共四个扩音器:一对前扩音器和一对后扩音器,分别用于前部乘客和后部乘客。然而,近年来,随着DVD播放器在车辆中的引入,环绕声扩音器系统已在车辆中引入,以支持DVD音频格式的回放。图1示出了车辆100的内部视图。车辆100包括环绕声扩音器系统,该系统包括扩音器10、11、30、31、41、42和43。仅示出了车辆100左侧的扩音器。对应的扩音器可以对称地布置在车辆100的右侧。特别地,图1的环绕声扩音器系统包括:成对的高音扩音器41、42和43、一对全频前扩音器30和后扩音器31、中央扩音器10以及低频效果扩音器或低音炮11。高音扩音器41被放置在靠近车辆仪表板处。高音扩音器42被放置在车辆100的前侧柱的低处。然而,高音扩音器41、42、43以及全频前扩音器30和后扩音器31可以被放置在适合于特定实施方式的任何位置。
沉浸式音频正在成为电影院和家庭聆听环境的主流。随着沉浸式音频成为电影院和家庭中的主流,很自然地认为沉浸式音频也将在车辆内回放。杜比全景声(Dolby Atmos)音乐已经可以通过各种流式传输服务获得。沉浸式音频与环绕声音频格式的区别通常在于包含了头顶或高度音频声道。因此,为了回放沉浸式音频,使用了头顶或高度扩音器。虽然高端车辆可能包含这种头顶或高度扩音器,但大多数传统车辆仍使用立体声扩音器系统或更先进的环绕声扩音器系统,如图1所示。事实上,高度扩音器大大增大了车辆中扩音器系统的复杂性。高度扩音器需要放置在车辆的车顶中,而车顶通常不适用于此目的。例如,车辆通常具有低车顶,这限制了放置高度扩音器的可用高度。此外,车辆在销售时通常有安装天窗的选项,以打开车辆车顶的窗户,这使得在车顶集成或放置高度扩音器成为一个困难的工业设计挑战。这种高度扩音器可能还需要额外的音频电缆。由于所有这些原因,由于空间和工业设计的限制,在车辆中集成高度扩音器可能是昂贵的。
发明内容
在非沉浸式扩音器系统(例如,立体声扩音器系统或环绕声扩音器系统)中回放沉浸式音频内容将是有利的。在本公开的上下文中,“非沉浸式扩音器系统”是包括至少两个扩音器但没有(即不包括)头顶扩音器(即没有高度扬声器)的扩音器/扬声器系统。
通过将沉浸式音频内容回放到非沉浸式扩音器系统中来创建声音高度的感知将是有利的,从而即使不使用头顶扩音器也能增强用户的音频体验。
本公开的一方面提供了一种从沉浸式音频格式的音频生成至少两个音频声道的方法,用于利用至少两个音频扩音器的非沉浸式扩音器系统在车辆内部(或任何聆听环境内部)回放所述至少两个音频声道,所述音频包括至少一个高度音频声道以及至少两个非高度音频声道。所述方法包括将虚拟高度滤波器应用于所述至少一个高度声道。所述虚拟高度滤波器被配置用于:当由所述至少两个扩音器之一回放所述至少一个音频高度声道时,至少部分地衰减所述至少一个高度声道的直接从回放所述高度声道的扩音器发出的频谱分量。所述虚拟高度滤波器还被配置用于至少部分地放大所述至少一个高度声道的从所述车辆内部的车顶或靠近所述车顶的区域反射的频谱分量,以生成至少一个经滤波的虚拟高度音频信号。所述方法进一步包括:将所述至少一个经滤波的虚拟高度音频信号与所述两个非高度音频声道中的至少一个混合以生成所述至少两个音频声道。
在本公开的上下文中,术语“声道”意指音频信号加可选的元数据,其中,位置被编码为声道标识符,例如,左前或右上环绕;“基于声道的音频”是被格式化以便通过具有相关联的标称位置的预定义扩音器区域组(例如,5.1、7.1等)来回放的音频;术语“对象”或“基于对象的音频”意指具有比如视在源位置(例如,3D坐标)、视在源宽度等参数化源描述的一个或多个音频声道。
当所述高度声道分在不进行滤波的情况下从所述至少两个扩音器之一回放时,声音可以沿着不同的路径辐射。一些声音可以沿着从扩音器到聆听位置(例如,到乘客耳朵或驾驶员耳朵)的直接路径辐射。一些其他声音可以沿着从扩音器到聆听位置的反射路径辐射。例如,一些声音可以从车辆内部的车顶或靠近车顶的区域反射,并且因此从车顶或靠近车顶的区域辐射到聆听位置。当回放高度声道时,沿直接路径辐射的声音是不期望的。通过将虚拟高度滤波器应用于至少一个高度声道,高度声道的从车顶或靠近车顶反射的频谱分量被放大,而高度声道的直接发散到扩音器的频谱分量被衰减。如上进行配置,所述方法补偿不期望的直接声音,并且将感知高度提示引入被馈送到至少两个扩音器之一的音频信号中,从而改善虚拟高度信号的定位和感知质量。例如,已经开发了定向听力模型以创建虚拟高度滤波器,所述虚拟高度滤波器当用于处理由至少两个扩音器再现的音频时改善了再现的感知质量。
在实施例中,沉浸式音频格式的音频可以进一步包括至少两个另外的非高度音频声道。经滤波的虚拟高度音频信号可以与非高度音频声道中的每一个混合,以生成四个音频声道。
在实施例中,沉浸式音频格式的音频可以包括至少两个高度音频声道。可以将虚拟高度滤波器应用于至少两个高度音频声道中的每一个,以生成至少两个经滤波的虚拟高度音频信号。可以将经滤波的虚拟高度音频信号中的每一个与至少两个非高度声道之一混合。
在实施例中,沉浸式音频格式的音频可以包括四个高度音频声道以及四个非高度音频声道。可以将虚拟高度滤波器应用于四个高度音频声道中的每一个,以生成四个经滤波的虚拟高度音频信号。可以将经滤波的虚拟高度音频信号中的每一个与四个非高度声道之一混合。
在实施例中,所述虚拟高度滤波器可以具有滤波器传递函数,并且其中,所述方法进一步包括根据标识所述滤波器传递函数的一个或多个参数来确定所述虚拟高度滤波器的滤波器传递函数。
在实施例中,所述方法可以进一步包括将所述一个或多个参数作为查找表或分析函数存储在处理器中。
在实施例中,所述虚拟高度滤波器可以具有滤波器传递函数,所述滤波器传递函数在第一频率处具有峰值并且在高于所述第一频率的第二频率处具有陷波。
在实施例中,所述至少两个音频扩音器可以相对于聆听位置横向地间隔开,并且所述方法可以进一步包括基于所述至少两个扩音器距所述聆听位置的相对距离以及基于所述车顶或靠近所述车顶的区域相对于所述聆听位置的仰角来确定所述虚拟高度滤波器的滤波器传递函数。
在实施例中,所述至少两个音频扩音器可以相对于聆听位置横向间隔开,并且所述方法可以进一步包括基于所述至少两个扩音器距所述聆听位置的一系列相对距离以及基于所述车顶或靠近所述车顶的区域相对于所述聆听位置的一系列仰角,获得多个虚拟高度滤波器的多个滤波器传递函数;以及从所述多个滤波器传递函数中选择一个滤波器传递函数。
在实施例中,所选择的滤波器传递函数可以是所述多个滤波器传递函数的平均值。
在实施例中,从所述多个滤波器传递函数中选择一个滤波器传递函数可以包括:基于所述至少两个扩音器距所述聆听位置的平均距离以及基于所述车顶或靠近所述车顶的区域相对于所述聆听位置的平均仰角来选择标识所选择的滤波器传递函数的一个或多个参数。
在实施例中,可以对每个所选择的滤波器传递函数迭代地应用上述方法的获得、选择、应用和混合的步骤,直到所述滤波器传递函数以最大声音仰角感知提供对所述至少两个声道的回放。
在实施例中,所述方法可以进一步包括将增益应用于所述虚拟高度滤波器。在实施例中,所述增益可以是用户可配置的。本公开的另一方面提供了一种装置,所述装置包括处理器和耦接到所述处理器的存储器,其中,所述处理器被配置为执行本公开中描述的任何方法。
本公开的另一方面提供了一种包括这样的装置的车辆。
本公开的其他方面提供了一种包括指令的程序,所述指令当由处理器执行时使所述处理器执行处理音频的方法,并且进一步提供了一种存储这样的程序的计算机可读存储介质。
附图说明
在附图中以示例而非限制的方式来图示本公开的实施例,其中相同附图标记指代相同的要素,并且在附图中:
图1示意性地示出了具有根据本公开的实施例布置的扩音器系统的车辆的内部视图,
图2是图示了根据本公开的实施例的从沉浸式音频格式的音频生成至少两个音频声道的方法的示例的流程图,
图2A示意性地示出了根据本公开的实施例的从沉浸式音频格式的音频生成至少两个音频声道的方法的示例,
图3示意性地示出了车辆,
图4示意性地示出了具有根据本公开的实施例布置的扩音器系统的车辆的俯视图,
图5示意性地示出了车辆内部的示例性声音路径,
图6示意性地示出了根据本公开的一些实施例的虚拟高度滤波器的一些示例,
图7示意性地示出了根据本公开的实施例的从沉浸式音频格式的音频生成四个音频声道的方法的示例,
图8示意性地示出了根据本公开的实施例的从沉浸式音频格式的音频生成两个音频声道的方法的示例,
图9示意性地示出了根据本公开的实施例的从沉浸式音频格式的音频生成四个音频声道的方法的示例,
图10示意性地示出了根据本公开的实施例的从沉浸式音频格式的音频生成六个音频声道的方法的示例,
图10A示意性地示出了根据本公开的实施例的从沉浸式音频格式的音频生成八个音频声道的方法的示例,
图11是用于执行根据本公开的实施例的方法的装置的示例的示意图。
具体实施方式
以下描述了许多特定细节以提供对本公开的充分理解。然而,可以在没有这些具体细节的情况下实施本公开。另外,可以以较不详尽的方式描述众所周知的部分。附图是示意性的并且包括与理解本公开相关的部分,而其他部分可以被省略或仅提出。
图2示出了图示了根据本公开的实施例的从沉浸式音频格式的音频生成至少两个音频声道的方法1000的示例的流程图。沉浸式音频格式的音频包括至少一个高度声道以及至少两个非高度声道。方法1000可以用于利用至少两个音频扩音器的非沉浸式扩音器系统在车辆内部回放所生成的至少两个音频声道。车辆可以是任何类型的客运或非客运车辆(例如,用于商业目的或运输货物)。本公开中提供的示例假设在车辆内部执行对所生成的至少两个音频声道的回放。然而,所生成的至少两个音频声道可以在适合于特定实施方式的任何其他类型的聆听环境(例如,封闭或部分封闭的聆听环境,例如,房间)内回放。
例如,参考图3,示意性地绘制了车辆3000(在该示例中为四座汽车)。为了简单起见,扩音器的布置未在图3中示出,但在图1的车辆100的更详细的内部视图中示出。客车3000具有四个座椅3110、3120、3130和3140。当考虑图1所示的扩音器系统时,扩音器30、31、41、42、43将具有布置在车辆3000右手侧的对应扩音器(图中未示出)。参考图3,位于车辆3000左手侧的扩音器与位于车辆3000右手侧的相应对应扩音器相对于中心轴线3150(沿着车辆3000的长度穿过车辆的中心)反射对称地布置。应当理解,座椅3110、3120、3130和3140中的每一个以及因此位于其上的潜在聆听者可以相对于包括扩音器30、31、41、42、43(图3中未示出)及其在车辆右手侧的相应对应扩音器(图3中也未示出)的任何一对扩音器对称地偏离中心。例如,坐在驾驶员座椅3110上的驾驶员将在扩音器30、41、42与对应的右手侧扩音器(图中未示出)之间对称地偏离中心。与车辆3000右手侧的对应扩音器相比,驾驶员将更靠近扩音器30、41和42。在图1和图3中,驾驶员座椅被示出在车辆3000的左侧(相对于驾驶的前进方向为左侧)。然而,应当理解,驾驶员座椅在车辆中的位置在不同地区可能有所不同。例如,在英国、澳大利亚或日本,驾驶员座椅相对于驾驶车辆的前进方向位于车辆的右侧。
非沉浸式扩音器系统可以是例如立体声扩音器系统或环绕声扩音器系统(如参考图1所示)。
在实施例中,沉浸式音频格式的音频可以是以沉浸式音频格式渲染的音频。
(例如,经渲染的)音频的沉浸式音频格式可以包括至少一个高度声道。在实施例中,沉浸式音频格式可以是支持仰角的基于对象的音频格式,例如杜比全景声格式。在另一个实施例中,沉浸式音频格式可以是支持仰角的基于声道的音频格式,例如,X.Y.Z音频格式,其中,X≥2是前音频声道或环绕声音频声道的数量,Y≥0如果存在,是低频效果或低音炮音频声道,并且Z≥1是至少一个高度音频声道。在实施例中,可以将基于对象的音频格式(例如,支持仰角)渲染或预渲染为对应的基于声道的音频格式,以生成与基于声道的音频格式的声道相对应的扩音器馈送。图1所示的扩音器系统是用于回放5.1音频的典型的5.1扩音器系统,具有5个前或环绕声扩音器、两个左音频扩音器(例如,左扩音器和左环绕声扩音器)、两个右音频扩音器(例如,右扩音器和右环绕声扩音器)、一个中央扩音器以及一个LFE扩音器。这两个左音频扩音器对应于扩音器30、31(用于中频或全频)、41、42和43(用于高频)。中央扩音器对应于扩音器10。LFE扩音器对应于扩音器11。
例如,参考图4,示意性地示出了另一示例性车辆4000的俯视图。车辆4000可以是以三个不同的排分布的六座或七座车辆。车辆4000可以是例如运动型多功能车辆(SUV)或小型公共汽车。车辆4000具有六个座椅4110、4120、4130、4140、4150和4160。对于车辆4000,可以实施典型的7.1扩音器系统。图4中所示的扩音器系统具有三个左扩音器4210、4230和4250(例如,左扩音器和两个左环绕声扩音器)以及三个右扩音器4220、4240和4260(例如,右扩音器和两个右环绕声扩音器)、一个中央扩音器4270以及一个LFE扩音器4280。
还将参考图2A解释图2中示意性图示的方法。
参考图2A,沉浸式音频格式的音频可以包括非高度声道1050和1100(例如,左声道和右声道)以及(在该示例中为单个)高度声道1010。图2A的示例的扩音器系统是扩音器1和2的立体声扩音器系统。在该示例中,扩音器1和2用于回放声道1050、1100和1010的沉浸式音频格式的音频。方法1000从沉浸式音频格式的音频生成两个声道1008和1016,如下文所解释的。由于从沉浸式音频格式的三个声道生成了两个声道1008和1016,所以可以说沉浸式音频格式的三个声道被下混为用于回放的两个声道。
参考图2和图2A,方法1000包括将虚拟高度滤波器1300应用1500于高度声道1010。虚拟高度滤波器1300被配置为当由扩音器1或2之一回放高度声道1010时,至少部分地衰减高度声道1010的直接从这样的扩音器1或2之一发出的频谱分量。虚拟高度滤波器1300进一步被配置为至少部分地放大高度声道1010的从车辆内部的车顶或靠近车顶的区域反射的频谱分量,以生成经滤波的虚拟高度音频信号1175。方法1000进一步包括将经滤波的虚拟高度音频信号1175与非高度音频声道1050和1100混合1700,以生成两个音频声道1008和1016,用于在扩音器1和2处回放它们。图2A示出了经滤波的虚拟高度音频信号1175与非高度声道1050和1100两者混合。然而,经滤波的虚拟高度音频信号1175可以仅与非高度声道1050和1100之一混合。将经滤波的虚拟高度音频信号1175与仅一个非高度声道1050或1100混合以生成两个声道用于回放,足以在不使用高度/头顶扩音器的情况下产生声音高度或仰角的感知。
为了进一步解释,参考图5,该图示意性地示出了由扩音器5000回放的声音可以在车辆内部从扩音器5000传播到聆听位置5100的示例性路径5300和5400。扩音器5000可以是参考例如图1和图4的扩音器系统示出的任何扩音器。特别地,扩音器5000可以是其中示出的左扩音器、右扩音器或环绕声扩音器中的任何一个。优选地,由于高度提示通常在高频信号而不是低频信号中更普遍,所以扩音器5000可以是与左扩音器、右扩音器或环绕声扩音器中的任何扩音器相关联的任何高频扩音器,例如图1所示的扬声器(例如,高音扬声器)41、42和43。聆听位置5100可以位于车辆的乘客或驾驶员的耳朵/头部。由扩音器5000回放的声音可以沿着反射路径5300(在图5中由虚线指示)和直接路径5400(在图5中由实线指示)辐射。反射路径5300是从扩音器5000到聆听位置5100的间接路径,并且由从位于聆听位置5100上方的表面5500反射的声音形成。在车辆内部,表面5500可以是车辆的车顶或靠近车辆的车顶的区域。靠近车顶的区域可以是前挡风玻璃或后挡风玻璃的上部内部部分或车辆的侧窗的上部内部部分。通常,表面5500可以是车辆内部的任何部分,其在声音回放期间位于高于聆听位置(例如在聆听位置上方)的仰角。为了增加声音仰角感知,期望声音沿着反射路径5300辐射。然而,来自扩音器5000的一些声音将沿着直接路径5400传播,从而减弱了对从表面5500处声音被反射离开的位置到聆听位置5100的声音的感知。与期望的反射声音相比,这种不期望的直接声音的量可以是扩音器5000的方向性图的函数。已经发现,位于车辆内部的整个高度的大约一半处(例如,大约位于车门中间高度处)的扩音器提供了增强的声音仰角感知。
为了补偿不期望的直接声音,已经示出了结合信号处理将感知高度提示引入被馈送到扩音器5000的音频信号中改善了虚拟高度信号的定位和感知质量。例如,已经开发了定向听力模型以创建虚拟高度滤波器,所述虚拟高度滤波器当用于处理由扩音器再现的音频时改善了再现的感知质量。在实施例中,虚拟高度滤波器是从物理扩音器位置和相对于聆听位置的虚拟扩音器位置(在聆听位置上方)两者得到的。对于物理扩音器位置,基于声音从扩音器位置直接传播到聆听位置处的聆听者耳朵的模型来确定第一定向滤波器。这种滤波器可以从定向听力模型得到,比如,HRTF(头部相关传递函数)测量数据库、或参数化双耳听力模型、耳廓模型、或利用有助于感知高度的提示的其他类似传递函数模型。虽然将耳廓模型考虑在内的模型通常是有用的,因为其有助于限定感知高度的方式,但是滤波器函数并非旨在隔离耳廓效应,而是旨在处理从一个方向到另一个方向的声级比,并且耳廓模型是可以使用的双耳听力模型的一个这样的模型的示例,但也可以使用其他模型。
接下来,确定该滤波器的逆,并将其用于移除沿着直接从物理扩音器位置到聆听位置的路径传播的音频的定向提示。接下来,对于虚拟扩音器位置,使用相同的定向听力模型基于声音从虚拟扩音器位置直接传播到同一聆听位置处的聆听者耳朵的模型来确定第二定向滤波器。如果声音是从聆听位置上方的虚拟扩音器位置发出,则直接应用该滤波器,从而施加耳朵将接收的定向提示。在实践中,可以以允许单个滤波器至少部分地移除(衰减)来自物理扩音器位置的定向提示并且至少部分地插入(放大)来自虚拟扩音器位置的定向提示的方式来组合第一定向滤波器和第二定向滤波器。这种单个滤波器提供频率响应曲线,所述频率响应曲线在本文中被称为“高度滤波器传递函数”、“虚拟高度滤波器响应曲线”、“期望频率传递函数”、“高度提示响应曲线”或类似词语,以描述从音频扩音器系统中的高度声音分量中过滤(例如,衰减)直接声音分量的滤波器或滤波器响应曲线。
关于滤波器模型,如果P1表示第一滤波器对来自物理扩音器位置的声音传输进行建模的以dB为单位的频率响应,并且P2表示第二滤波器对来自虚拟扩音器位置的声音传输进行建模的以dB为单位的频率响应,则以dB为单位的虚拟高度滤波器PT的总响应可以表示为:PT=α(P2-P1),其中,α是控制滤波器强度的比例因子或增益。当α=1时,滤波器被最大限度地应用,并且当α=0时,滤波器不进行任何动作(0dB响应)。在实践中,基于反射声音与直接声音的相对平衡,可以将α设置在0与1之间(例如α=0.5)。随着直接声音的水平相较于反射声音的增加,α也应当增大,以便更充分地向这种不期望的直接声音路径施加虚拟扩音器位置的定向提示。然而,α不应当大到损害沿反射路径传播的已经包含适当的定向提示的音频的感知音质。通常,滤波器P1和P2的精确值将是物理扩音器位置相对于聆听位置的方位角和反射扬声器位置的仰角的函数。该仰角进而是物理扩音器位置距聆听位置的距离以及车顶或靠近车顶的区域(图5中的表面5500)的高度与扬声器的高度之间的差的函数。
图6示出了根据本公开的一些实施例的虚拟高度滤波器的示例曲线6200、6300和6400。曲线6200、6300和6400在图中表示,其以纵坐标示出了虚拟高度滤波器的振幅(以分贝(dB)为单位),并以横坐标示出了频率(以赫兹(Hz)为单位)。
曲线6200、6300和6400表示三个不同虚拟高度滤波器的滤波器传递函数。图6示出了三个不同滤波器的滤波器传递函数6200、6300和6400在约8000赫兹的第一频率处具有峰值,并且在高于第一频率的约12000赫兹的第二频率处具有陷波。然而,峰值和陷波可以处于不同的频率。如上所解释的,可以通过将不同的比例因子/不同的增益应用于虚拟高度滤波器来获得这三个不同的传递函数。在实施例中,增益可以是用户可配置的,使得虚拟高度滤波器的‘长度’可以由用户根据特定实施方式来调谐。
在实施例中,如参考图2所示,本公开的方法可以进一步包括根据标识滤波器传递函数的一个或多个参数来确定1800虚拟高度滤波器的滤波器传递函数。例如,一个或多个参数可以指示表示虚拟高度滤波器的滤波器传递函数的峰值、峰值频率、陷波和陷波频率的至少一个值。例如,参数可以例如作为查找表或分析函数存储在存储器或包含存储器的处理器中。这些参数可以由处理单元从存储器中取得,所述处理单元可以根据这些参数重构虚拟高度滤波器。因此,可以使用重构的虚拟高度滤波器并将其应用于高度声道。通过使用一个或多个参数来标识滤波器传递函数,高度声道的处理被简化,因为虚拟高度滤波器由几个参数来描述,而不是本地生成的。
在实施例中,如参考图2所示,本公开的方法可以进一步包括基于至少两个扩音器和距聆听位置的相对距离以及基于车顶或靠近车顶的区域相对于聆听位置的仰角来确定1850虚拟高度滤波器的滤波器传递函数。
例如,在一个实施例中,一个或多个传感器可以位于聆听位置处或附近,以测量至少两个扩音器距聆听位置的这种相对距离以及车顶或靠近车顶的区域相对于聆听位置的仰角。例如,在实施例中,这种传感器可以大约在聆听者头部的相同高度处嵌入在车辆的每个座椅的头枕中。所述测量可以在所述方法的初始校准阶段执行,或者可替代地,与音频的回放基本实时地执行。
可替代地、附加地或可选地,虚拟高度滤波器的滤波器传递函数可以基于一个或多个聆听位置与至少两个扩音器中的每个扩音器之间的预定绝对距离以及车顶相对于聆听位置的预定仰角。例如,一个或多个聆听位置(例如,图3的座椅3110、3120、3130或3140处的任何位置)与一对立体声扩音器之间的距离以及车顶的仰角可以由环境特性(例如,车辆的内部设计)和扩音器安装确定/预定。本公开的方法可以使用该预定信息来获得虚拟高度滤波器的滤波器传递函数。例如,在实施例中,根据一个或多个参数确定1800虚拟高度滤波器的滤波器传递函数的步骤可以涉及访问预定参数。例如,所述参数可能已经针对某一类型的一个车辆获得/测量,并且随后存储在相同类型的车辆的车载计算系统的存储器中。这种离线校准的优点在于,车辆不需要配备用于在线测量和获得滤波器传递函数的传感器。
可替代地、附加地或可选地,在如参考图2所示的实施例中,方法1000可以进一步包括(通常在步骤1500之前)获得1900多个虚拟高度滤波器的多个滤波器传递函数。所述多个虚拟高度滤波器可以基于至少两个扩音器距聆听位置的一系列相对距离以及基于车顶或靠近车顶的区域相对于聆听位置的一系列仰角来获得。例如,可以例如在校准阶段期间针对多个不同的聆听位置和/或多个扩音器位置来测量扩音器-(多个)聆听位置的一系列距离。类似地,可以例如在校准阶段期间针对多个不同的聆听位置来测量车顶(或其虚拟扩音器位置)的一系列仰角。所述方法进一步包括从多个滤波器传递函数中选择2000一个滤波器传递函数。例如,在实施例中,所选择的滤波器传递函数可以基于至少两个扩音器距聆听位置的平均距离以及基于车顶或靠近车顶的区域(或虚拟扩音器位置)相对于聆听位置的平均仰角。在另一个实施例中,所选择的虚拟高度滤波器(的滤波器传递函数)是多个滤波器传递函数的平均值。例如,所选择的传递函数可以通过在多个滤波器传递函数之间进行插值来确定。在又另一个实施例中,包括步骤1900和2000在内的方法1000可以例如在校准阶段期间并且如图2中由将步骤1700连接到步骤1900的虚线所指示的,迭代地应用于每次迭代所选择的每个滤波器传递函数,直到所选择的滤波器传递函数在一个或多个聆听位置处提供最佳的声音仰角感知(例如,使声音仰角感知最大化)。换言之,可以迭代地应用包括步骤1900和2000在内的方法1000,直到(所选择的)滤波器传递函数以最大声音仰角感知提供对至少两个声道的回放。通常,为了在特定类型的车辆中进行简单且更有效的音频处理,可以选择对于大部分聆听位置/扩音器位置以及车顶或靠近车顶的区域的仰角(或虚拟扩音器位置的仰角)平均表现良好的单个滤波器传递函数。然而,滤波器传递函数可以例如借助于如上所解释的传感器来基本上实时地自适应地确定。自适应地确定滤波器传递函数可以提供更准确的确定,并且因此提供增强的声音仰角感知。
在实施例中,仍然参考图2,如在步骤1900中获得的多个传递函数中的每个滤波器传递函数可以根据例如作为LUT或分析函数存储在存储器中的一个或多个参数来确定,如上所解释的。所述方法可以针对特定车辆类型或当使用传感器时主动/自适应地选择滤波器传递函数的参数。
在实施例中,仍然参考图2,根据一个或多个参数(基于预定距离/仰角信息或基于实际测量值)确定1800虚拟高度滤波器的滤波器传递函数的步骤可以在检测到位于一个或多个聆听位置处的聆听者的移动时触发。例如,可以采用一个或多个传感器来检测聆听者的移动。当在车辆内部使用时,这种传感器可以例如位于车辆的相应座椅处。所述一个或多个传感器可以被配置为检测车辆中乘客或驾驶员的存在,从而使得处理方法能够使用正确的距离信息来获得滤波器传递函数。
在实施例中,所述一个或多个座椅传感器或一组不同的传感器可以用于检测新的聆听位置,例如,聆听者头部的新位置(或聆听者耳朵的位置)。例如,驾驶员或乘客可以水平地和/或垂直地调整他自己的座椅,以在车辆中获得更舒适的乘坐位置。在该实施例中,所述方法可以根据新检测到的聆听位置取得/获得虚拟高度滤波器(的滤波器传递函数)。以这种方式,可以根据新的聆听位置使用正确的信息,无论是基于一组正确的预定聆听者到扩音器的距离信息和一组预定车顶仰角信息,还是基于实际测量值。例如,如果/当标识虚拟高度滤波器(的滤波器传递函数)的预定一个或多个参数被存储为分析函数或查找表(LUT)时,不同的分析函数或不同的LUT可以对应于不同的(例如,检测到的)座椅或聆听位置。
如上所解释的,沉浸式音频格式可以具有不同类型并且适合于特定实施方式
例如,参考图7,音频的沉浸式音频格式包括单个高度声道1010以及四个非高度声道1050、1100、1125和1150。非高度声道1050和1100可以分别是左(L)声道和右(R)声道。非高度声道1125和1150可以分别是左环绕声(LS)声道和右环绕声(RS)声道。非高度声道1050和1100可以分别是前声道、中声道或左后声道和右后声道。类似地,非高度声道1125和1150可以分别是前声道、中声道或左后环绕声声道和右后环绕声声道。
虚拟高度滤波器1300被应用于高度声道1010,以生成经滤波的虚拟高度信号1175。经滤波的虚拟高度信号1175与非高度声道1050、1100、1125和1150中的每一个混合,以生成四个声道信号1008、1016、1032和1064。声道信号1008、1016、1032和1064被馈送到扩音器1、2、3和4,用于回放。使用单个虚拟高度滤波器(的滤波器传递函数)简化了将沉浸式音频格式的音频转换为扩音器1至4的声道馈送信号1008至1064。
在另一个示例中,参考图8,音频的沉浸式音频格式包括两个高度声道1010和1020以及两个非高度声道1050和1100。例如,高度声道1020和1010可以是左上(TL)声道和右上(TL)声道。非高度声道1050和1100可以分别是左(L)声道和右(R)声道。声道1020和1010可以分别是左上前声道、左上中/中央声道或左上后声道和右上后声道。类似地,声道1050和1100可以分别是左前声道、左中/中央声道或左后声道和右后声道。
虚拟高度滤波器1300被应用于高度声道1010,以生成经滤波的虚拟高度信号1175。虚拟高度滤波器1400被应用于高度声道1020,以生成经滤波的虚拟高度信号1200。虚拟高度滤波器1300可以与虚拟高度滤波器1400相同。针对所有高度声道使用单个高度滤波器,简化了音频处理并且需要更少的处理能力。然而,在一些实施例中,虚拟高度滤波器1300可以不同于虚拟高度滤波器1400。例如,虚拟高度滤波器1300可以针对右声道被优化。例如,虚拟高度滤波器1300的滤波器传递函数可以被选择用于最大化右声道中的声音仰角感知。类似地,虚拟高度滤波器1400可以针对左声道被优化。例如,虚拟高度滤波器1400的滤波器传递函数可以被选择用于最大化左声道中的声音仰角感知。通常,针对不同的声道适配虚拟高度滤波器在与相应声道(在该示例中,左声道和右声道)相关联的聆听位置处提供了更好的声音仰角感知。
经滤波的虚拟高度信号1175与非高度声道1100混合,以生成声道信号1017馈送给扩音器2。经滤波的虚拟高度信号1200与非高度声道1050混合,以生成声道信号1009馈送给扩音器1。因此,通过分别用扩音器1和2回放声道(信号)1009和1017,可以实现增强的声音仰角感知。
在另一个示例中,参考图9,音频的沉浸式音频格式包括四个非高度声道1050、1100、1125和1150以及四个高度声道1010、1020、1030和1040。非高度声道1050和1100可以分别是左(L)声道和右(R)声道。非高度声道1125和1150可以分别是左环绕声(LS)声道和右环绕声(RS)声道。非高度声道1050和1100可以分别是左前声道、左中/中央声道或左后声道和右后声道。类似地,非高度声道1125和1150可以分别是左前环绕声声道、左中/中央环绕声声道或左后环绕声声道和右后环绕声声道。高度声道1020和1010可以是左上前(TFL)声道和右上前(TFL)声道。高度声道1040和1030可以是右上后(TRR)声道和左上后(TRL)声道。虚拟高度滤波器1300被应用于高度声道1010,以生成经滤波的虚拟高度信号1175。虚拟高度滤波器1400被应用于高度声道1020,以生成经滤波的虚拟高度信号1200。虚拟高度滤波器2500被应用于高度声道1030,以生成经滤波的虚拟高度信号1225。虚拟高度滤波器2600被应用于高度声道1040,以生成经滤波的虚拟高度信号1250。虚拟高度滤波器1300、1400、2500、2600可以是相同或不同的,如参考图8的示例所解释的。
经滤波的虚拟高度信号1175与非高度声道1100混合,以生成声道信号1018馈送给扩音器2。经滤波的虚拟高度信号1200与非高度声道1050混合,以生成声道信号1011馈送给扩音器1。经滤波的虚拟高度信号1225与非高度声道1125混合,以生成声道信号1033馈送给扩音器3。经滤波的虚拟高度信号1250与非高度声道1150混合,以生成声道信号1063馈送给扩音器4。
因此,通过分别用扩音器1至4回放声道(声道信号)1011、1018、1033和1063,可以实现增强的声音仰角感知。
如图2A、图7至图9的示例所解释的,用于回放的声道通常少于沉浸式音频格式的声道数量。因此,可以说沉浸式音频格式的声道被下混为用于回放的声道。
可以设想适合于特定实施方式的任何其他合适的沉浸式音频格式和/或扬声器配置。
例如,除了参考图7至图9所示的示例的声道之外,沉浸式音频格式的音频还可以包括中央(C)声道和/或低频效果(LFE)声道(图7至图9中均未示出)。如上所解释的,由于高度提示通常在高频信号而不是低频信号中更普遍,所以当存在高度提示时,中央声道和/或LFE声道通常不与经滤波的高度声道混合。
在一些实施例(图中未示出)中,当存在中央声道时,中央声道可以与左前声道和右前声道混合在一起。在这种实施例中,可以在将左前声道和右前声道与中央声道混合之后执行(多个)经滤波的高度声道与(多个)非高度音频声道(即,左前声道和/或右前声道)的混合。
类似的考虑适用于如图4所示的扩音器配置,所述扩音器配置还包括左中(ML)扩音器4230和右中(MR)扩音器4240。便利的是,对于所使用的任何扩音器配置,系统中的所有扩音器在所生成的声道的回放期间保持活动。
图10示意性地示出了根据本公开的实施例的从沉浸式音频格式的音频生成六个音频声道(即,5.1音频格式的音频)的方法的示例。5.1音频格式的输出例如适合于图1所示的扩音器系统。例如,输入音频格式是5.1.4。在这种情况下,如上所解释的,可以采用前级混合500来例如混合左前声道、右前声道和中央声道。然而,根据具体实施方式,可以适当地启用或禁用前级混合500。当启用前级混合500时,在框600中,可以将输入音频5.1.4的经滤波的四个高度声道与四个非高度声道混合,如下。与中央声道混合的两个非高度左前声道和右前声道进而与经滤波的(例如,TFL和TFR)混合。两个非高度LS和RS直接与TRL和TRR混合。当禁用前级混合500时,在框600中,可以将经滤波的四个高度声道直接与输入的四个非高度声道混合(即,不将它们与中央声道混合)。在该示例中,中央声道信号不被混合,而是直接馈送到图1的中央扩音器10。类似地,在该示例中,LFE声道不被混合,而是直接馈送到图1的LFE扩音器11。通过与高度声道混合而生成的声道被馈送到对应的前扩音器和后扩音器,如参考图9的示例所解释的。
图10A示意性地示出了根据本公开的实施例的从沉浸式音频格式的音频生成八个音频声道(即,7.1音频格式的音频)的方法的示例。7.1音频格式的输出例如适合于图4所示的扩音器系统。
在该示例中,为了使图4的扩音器系统的所有扩音器保持活动,可以采用附加的中级混合700,以获得7.1音频格式的音频输出。
该过程将与参考图10所解释的相同,并且在此不再重复。在框600的输出处,音频输出将采用如参考图10所解释的5.1音频格式。附加的中级混合框700将音频从5.1转换为7.1音频格式,以馈送到图4所示的扩音器系统的所有扩音器。在实际的实施方式中,前级混合500和中间级混合700可以始终在车辆/处理器或装置中实施,并且根据特定扩音器系统配置和/或前级混合要求的需要被启用/禁用。
在一些实施例中,在与对应的经虚拟滤波的高度声道混合之前,对非高度声道(例如左前声道和右前声道和/或左后声道和右后声道)进行处理。例如,可以对左前声道和右前声道和/或左后声道和右后声道进行处理,以补偿车辆中的(多个)乘客/驾驶员的偏离中心聆听位置。偏离中心聆听位置的补偿可以利用EP1994795B1中描述的算法来执行,所述文献通过引用以其全文结合在此。在EP1994795B1中,示出了可以对相对于同一对(立体声)扩音器对称地偏离中心的两个聆听位置同时进行“虚拟居中”。这遵循减小单个聆听位置的耳间相位差(IDP)的相位差的相同原理。在两个聆听位置的情况下,同时减小针对这两个聆听位置中的每个聆听位置获得的IDP的相位差,使得每个聆听位置处的每个IDP在期望的频率范围内的值介于-90度和90度之间。通过补偿偏离中心聆听位置并且将经滤波的高度声道与对应的经补偿的前非高度声道和/或后非高度声道混合,可以防止高度声道的内容在前扩音器和/或后扩音器上平移。
示例计算设备
描述了一种从沉浸式音频格式的音频生成至少两个音频声道的方法,用于利用至少两个音频扩音器的非沉浸式扩音器系统回放所述至少两个音频声道。附加地,本公开还涉及一种用于执行这些方法的装置。此外,本公开涉及一种可以包括用于执行这些方法的装置的车辆。在图11中示意性地图示了这种装置1440的示例。装置1440可以包括处理器1410(例如,中央处理单元(CPU)、图形处理单元(GPU)、数字信号处理器(DSP)、一个或多个专用集成电路(ASIC)、一个或多个射频集成电路(RFIC)或这些的任何组合)和耦接到处理器1410的存储器1420。存储器1420可以例如存储表示标识(例如,针对不同聆听位置和/或车顶的仰角和/或不同车辆的)虚拟高度滤波器的滤波器传递函数的一个或多个参数的(或一组)分析函数或(或一组)查找表。处理器可以被配置为例如通过从存储器1420中取得该组分析函数和/或LTU来执行在整个公开中描述的方法的一些或所有步骤。为了执行生成至少两个音频声道的方法,装置1440可以接收沉浸式音频格式的(例如,经渲染的)音频的声道(例如,高度声道和一个或多个前音频声道或环绕声音频声道1425)作为输入。在这种情况下,装置1440可以输出两个或更多个声道信号1430,用于在非沉浸式扩音器系统中回放声道信号。
装置1440可以是服务器计算机、客户端计算机、个人计算机(PC)、平板PC、机顶盒(STB)、个人数字助理(PDA)、蜂窝电话、智能手机、web设备、网络路由器、交换机或网桥、或能够(顺序或以其他方式)执行指定要由所述装置采取的动作的指令的任何机器。进一步地,虽然在图11中仅图示了单个装置1440,但是本公开将涉及单独或联合执行指令以执行本文讨论的任何一种或多种方法的装置的任何集合。
本公开进一步涉及一种包括指令的程序(例如,计算机程序),所述指令当由处理器执行时使所述处理器执行本文描述的方法的一些或所有步骤。
更进一步地,本公开涉及存储前述程序的计算机可读(或机器可读)存储介质。这里,术语“计算机可读存储介质”包括但不限于例如固态存储器、光学介质和磁性介质形式的数据储存库。
本文所描述的实施例可以以硬件、软件、固件及其组合来实施。例如,实施例可以在包括电子电路和部件的系统(如计算机系统)上实施。计算机系统的示例包括台式计算机系统、便携式计算机系统(例如膝上型计算机)、手持式设备(例如智能电话或平板计算机)和联网设备。用于实施所述实施例的系统可以例如包括集成电路(IC)、可编程逻辑设备(PLD)(如现场可编程门阵列(FPGA))、数字信号处理器(DSP)、专用IC(ASIC)、中央处理单元(CPU)和图形处理单元(GPU)中的至少一者。
本文所描述的实施例的某些实施方式可以包括计算机程序产品,所述计算机程序产品包括指令,所述指令当由数据处理系统执行时会使所述数据处理系统执行本文所描述的任何实施例的方法。计算机程序产品可以包括存储有所述指令的非暂态介质,例如物理介质,如包括软盘和硬盘驱动器的磁性数据存储介质,包括CD ROM和DVD的光学数据存储介质,以及包括ROM、闪速存储器(如闪速RAM或USB闪速驱动器)的电子数据存储介质。在另一个示例中,计算机程序产品包括包含所述指令的数据流、或者包括包含存储在分布式计算系统中(例如,一个或多个数据中心中)的所述指令的文件。
本公开不限于上述实施例和示例。在不脱离由所附权利要求限定的本公开的范围的情况下,可以做出许多修改和变化。
可以从以下枚举的示例实施例(A-EEE和B-EEE)中理解本发明的各个方面:
A-EEE 1.一种从沉浸式比特流生成离散声道的方法,所述方法包括
识别所述沉浸式比特流的一个或多个高度声道以及一个或多个非高度声道,
使用虚拟高度滤波器和非标准混合技术来处理所述一个或多个高度声道,以及
将经处理的一个或多个高度声道与所述一个或多个非高度声道混合。
B-EEE 1.一种从沉浸式音频格式的音频生成至少两个音频声道的方法(1000),用于利用至少两个音频扩音器(1,2)的非沉浸式扩音器系统在车辆内部回放所述至少两个音频声道,所述音频包括至少一个高度音频声道(1010)以及至少两个非高度音频声道(1050,1100),所述方法包括:
-将虚拟高度滤波器(1300)应用(1500)于所述至少一个高度声道(1010),以便当由所述至少两个扩音器之一回放所述至少一个音频高度声道时,至少部分地衰减所述至少一个高度声道(1010)的直接从所述扩音器(1,2)发出的频谱分量,并且至少部分地放大所述至少一个高度声道的从所述车辆内部的车顶或靠近所述车顶的区域反射的频谱分量,以生成至少一个经滤波的虚拟高度音频信号(1175),
-将所述至少一个经滤波的虚拟高度音频信号(1175)与所述两个非高度音频声道中的至少一个混合(1700),以生成所述至少两个音频声道(1008,1016)。
B-EEE 2.如B-EEE 1所述的方法(1000),其中,所述沉浸式音频格式的音频进一步包括至少两个另外的非高度音频声道(1125,1150),并且其中,所述经滤波的虚拟高度音频信号(1175)与所述非高度音频声道(1050,1100,1125,1150)中的每一个混合,以生成四个音频声道(1008,1016,1032,1064)。
B-EEE 3.如前述B-EEE中任一项所述的方法,其中,所述沉浸式音频格式的音频包括至少两个高度音频声道(1010,1020),并且其中,所述虚拟高度滤波器(1300,1400)被应用于所述至少两个高度音频声道(1010,1020)中的每一个高度音频声道,以生成至少两个经滤波的虚拟高度音频信号(1175,1200),并且其中,所述经滤波的虚拟高度音频信号(1175,1200)中的每一个与所述至少两个非高度声道(1100,1050)之一混合。
B-EEE 4.如前述B-EEE中任一项所述的方法,其中,所述沉浸式音频格式的音频包括四个高度音频声道(1010,1020,1030,1040)和四个非高度音频声道(1050,1100,1125,1150),并且其中,所述虚拟高度滤波器(1300,1400,2500,2600)被应用于所述四个高度音频声道(1010,1020,1030,1040)中的每一个,以生成四个经滤波的虚拟高度音频信号(1175,1200,1225,1250),并且其中,所述经滤波的虚拟高度音频信号(1175,1200,1225,1250)中的每一个与所述四个非高度声道(1100,1050,1125,1150)之一混合。
B-EEE 5.如前述B-EEE中任一项所述的方法,其中,所述非沉浸式扩音器系统是立体声或环绕声扩音器系统。
B-EEE 6.如前述B-EEE中任一项所述的方法,其中,所述虚拟高度滤波器具有滤波器传递函数,并且其中,所述方法进一步包括根据标识所述滤波器传递函数的一个或多个参数来确定所述虚拟高度滤波器的滤波器传递函数。
B-EEE 7.如前述B-EEE中任一项所述的方法,其中,所述虚拟高度滤波器具有滤波器传递函数,所述滤波器传递函数在第一频率处具有峰值并且在高于所述第一频率的第二频率处具有陷波。
B-EEE 8.如B-EEE 6和7所述的方法,其中,所述一个或多个参数指示以下各项的至少一个值:所述滤波器传递函数的峰值、第一频率、陷波和第二频率。
B-EEE 9.如前述B-EEE中任一项所述的方法,其中,所述至少两个音频扩音器(1,2)相对于聆听位置横向间隔开。
B-EEE 10.如B-EEE 9所述的方法,进一步包括基于所述至少两个扩音器距所述聆听位置的相对距离以及基于所述车顶或靠近所述车顶的区域相对于所述聆听位置的仰角来确定(1800)所述虚拟高度滤波器的滤波器传递函数。
B-EEE 11.如B-EEE 9所述的方法,进一步包括
基于所述至少两个扩音器距所述聆听位置的一系列相对距离以及基于所述车顶或靠近所述车顶的区域相对于所述聆听位置的一系列仰角,获得(1900)多个虚拟高度滤波器的多个滤波器传递函数;以及
从所述多个滤波器传递函数中选择(2000)一个滤波器传递函数。
B-EEE 12.如权利要求11所述的方法,其中,所选择的滤波器传递函数是所述多个滤波器传递函数的平均值。
B-EEE 13.如从属于权利要求6至8中任一项的权利要求11所述的方法,其中,从所述多个滤波器传递函数中选择一个滤波器传递函数包括:基于所述至少两个扩音器距所述聆听位置的平均距离以及基于所述车顶或靠近所述车顶的区域相对于所述聆听位置的平均仰角来选择标识所选择的滤波器传递函数的一个或多个参数。
B-EEE 14.如B-EEE 11至13中任一项所述的方法,其中,对每个所选择的滤波器传递函数迭代地应用所述获得(1900)、选择(2000)、应用(1500)和混合(1700)的步骤,直到所述滤波器传递函数以最大声音仰角感知提供对所述至少两个声道的回放。
B-EEE 15.如B-EEE 6至14中任一项所述的方法,进一步包括将所述一个或多个参数作为查找表或分析函数存储在处理器中。
B-EEE 16.如前述B-EEE中任一项所述的方法,进一步包括将增益应用于所述虚拟高度滤波器。
B-EEE 17.如B-EEE 16所述的方法,其中,所述增益是用户可配置的。
B-EEE 18.如前述B-EEE中任一项所述的方法,其中,所述沉浸式音频格式的音频是以所述沉浸式音频格式渲染的音频,和/或其中,所述沉浸式音频格式是杜比全景声或任何X.Y.Z音频格式,其中,X≥2是前音频声道或环绕声音频声道的数量,Y≥0如果存在,是低频效果或低音炮音频声道,并且Z≥1是所述至少一个高度音频声道。
B-EEE 19.一种装置,被配置为执行如B-EEE 1至18中任一项所述的方法。
B-EEE 20.一种车辆,包括具有至少两个音频扩音器(1,2)的扩音器系统,所述车辆进一步包括如B-EEE 19所述的装置。
B-EEE 21.一种程序,包括指令,所述指令当由处理器执行时使所述处理器执行根据B-EEE 1至18中任一项所述的方法。
B-EEE 22.一种计算机可读存储介质,存储有根据B-EEE 21所述的程序。
Claims (21)
1.一种从沉浸式音频格式的音频生成至少两个音频声道的方法,用于利用至少两个音频扩音器的非沉浸式扩音器系统在车辆内部回放所述至少两个音频声道,所述音频包括至少一个高度音频声道以及至少两个非高度音频声道,所述方法包括:
-将虚拟高度滤波器应用于至少一个高度声道,以便当由至少两个扩音器中的一个扩音器回放至少一个音频高度声道时,至少部分地衰减所述至少一个高度声道的直接从所述扩音器发出的频谱分量,并且至少部分地放大所述至少一个高度声道的从所述车辆内部的车顶或靠近所述车顶的区域反射的频谱分量,以生成至少一个经滤波的虚拟高度音频信号,
-将所述至少一个经滤波的虚拟高度音频信号与所述两个非高度音频声道中的至少一个非高度音频声道混合,以生成所述至少两个音频声道。
2.如权利要求1所述的方法,其中,所述沉浸式音频格式的音频进一步包括至少两个另外的非高度音频声道,并且其中,所述经滤波的虚拟高度音频信号与所述非高度音频声道中的每一个非高度音频声道混合,以生成四个音频声道。
3.如前述权利要求中任一项所述的方法,其中,所述沉浸式音频格式的音频包括至少两个高度音频声道,并且其中,将所述虚拟高度滤波器应用于所述至少两个高度音频声道中的每一个高度音频声道,以生成至少两个经滤波的虚拟高度音频信号,并且其中,所述经滤波的虚拟高度音频信号中的每一个经滤波的虚拟高度音频信号与所述至少两个非高度声道中的一个非高度声道混合。
4.如前述权利要求中任一项所述的方法,其中,所述沉浸式音频格式的音频包括四个高度音频声道和四个非高度音频声道,并且其中,将所述虚拟高度滤波器应用于所述四个高度音频声道中的每一个高度音频声道,以生成四个经滤波的虚拟高度音频信号,并且其中,所述经滤波的虚拟高度音频信号中的每一个经滤波的虚拟高度音频信号与所述四个非高度声道中的一个非高度声道混合。
5.如前述权利要求中任一项所述的方法,其中,所述非沉浸式扩音器系统是立体声或环绕声扩音器系统。
6.如前述权利要求中任一项所述的方法,其中,所述虚拟高度滤波器具有滤波器传递函数,并且其中,所述方法进一步包括根据标识所述滤波器传递函数的一个或多个参数来确定所述虚拟高度滤波器的滤波器传递函数。
7.如前述权利要求中任一项所述的方法,其中,所述虚拟高度滤波器具有滤波器传递函数,所述滤波器传递函数在第一频率处具有峰值并且在高于所述第一频率的第二频率处具有陷波。
8.如权利要求6和7所述的方法,其中,所述一个或多个参数指示以下各项的至少一个值:所述滤波器传递函数的峰值、第一频率、陷波和第二频率。
9.如前述权利要求中任一项所述的方法,其中,所述至少两个音频扩音器相对于聆听位置横向间隔开。
10.如权利要求9中任一项所述的方法,进一步包括基于所述至少两个扩音器距所述聆听位置的相对距离以及基于所述车顶或靠近所述车顶的区域相对于所述聆听位置的仰角来确定所述虚拟高度滤波器的滤波器传递函数。
11.如权利要求9所述的方法,进一步包括
基于所述至少两个扩音器距所述聆听位置的一系列相对距离以及基于所述车顶或靠近所述车顶的区域相对于所述聆听位置的一系列仰角,获得多个虚拟高度滤波器的多个滤波器传递函数;以及
从所述多个滤波器传递函数中选择一个滤波器传递函数。
12.如权利要求11所述的方法,其中,所选择的滤波器传递函数是所述多个滤波器传递函数的平均值。
13.如从属于权利要求6至8中任一项的权利要求11所述的方法,其中,从所述多个滤波器传递函数中选择一个滤波器传递函数包括:基于所述至少两个扩音器距所述聆听位置的平均距离以及基于所述车顶或靠近所述车顶的区域相对于所述聆听位置的平均仰角来选择标识所选择的滤波器传递函数的一个或多个参数。
14.如权利要求11至13中任一项所述的方法,其中,对每个所选择的滤波器传递函数迭代地应用所述获得、选择、应用和混合的步骤,直到所述滤波器传递函数以最大声音仰角感知提供对所述至少两个声道的回放。
15.如权利要求6至14中任一项所述的方法,进一步包括将所述一个或多个参数作为查找表或分析函数存储在处理器中。
16.如前述权利要求中任一项所述的方法,进一步包括将增益或用户可配置增益应用于所述虚拟高度滤波器。
17.如前述权利要求中任一项所述的方法,其中,所述沉浸式音频格式的音频是以所述沉浸式音频格式渲染的音频,和/或其中,所述沉浸式音频格式是杜比全景声或任何X.Y.Z音频格式,其中,X≥2是前或环绕声音频声道的数量,Y≥0如果存在,是低频效果或低音炮音频声道,并且Z≥1是所述至少一个高度音频声道。
18.一种装置,被配置为执行如前述权利要求中任一项所述的方法。
19.一种车辆,包括具有至少两个音频扩音器的扩音器系统,所述车辆进一步包括如权利要求18所述的装置。
20.一种程序,包括指令,所述指令当由处理器执行时使所述处理器执行根据权利要求1至17中任一项所述的方法。
21.一种计算机可读存储介质,存储有根据权利要求20所述的程序。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US63/291,598 | 2021-12-20 | ||
US202263353778P | 2022-06-20 | 2022-06-20 | |
EP22179943.0 | 2022-06-20 | ||
US63/353,778 | 2022-06-20 | ||
PCT/US2022/081951 WO2023122547A1 (en) | 2021-12-20 | 2022-12-19 | A method of processing audio for playback of immersive audio |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118633301A true CN118633301A (zh) | 2024-09-10 |
Family
ID=91999819
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202280083833.1A Pending CN118402257A (zh) | 2021-12-20 | 2022-12-19 | 用于回放沉浸式音频的音频处理方法 |
CN202280090803.3A Pending CN118633301A (zh) | 2021-12-20 | 2022-12-19 | 用于回放沉浸式音频的音频处理方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202280083833.1A Pending CN118402257A (zh) | 2021-12-20 | 2022-12-19 | 用于回放沉浸式音频的音频处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (2) | CN118402257A (zh) |
-
2022
- 2022-12-19 CN CN202280083833.1A patent/CN118402257A/zh active Pending
- 2022-12-19 CN CN202280090803.3A patent/CN118633301A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
CN118402257A (zh) | 2024-07-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100569008C (zh) | 车载音频环绕模式的系统和方法 | |
US8194898B2 (en) | Sound reproducing system and sound reproducing method | |
CN102696244B (zh) | 具有音频通道补偿的多通道音频系统 | |
US10623857B2 (en) | Individual delay compensation for personal sound zones | |
JP4946148B2 (ja) | 音声信号処理装置、音声信号処理方法及び音声信号処理プログラム | |
US20190130927A1 (en) | An active monitoring headphone and a binaural method for the same | |
US10757522B2 (en) | Active monitoring headphone and a method for calibrating the same | |
US10582325B2 (en) | Active monitoring headphone and a method for regularizing the inversion of the same | |
US9930469B2 (en) | System and method for enhancing virtual audio height perception | |
JP6434165B2 (ja) | 前面ラウドスピーカによって個別の三次元音響を達成する、車内再生のためのステレオ信号を処理する装置および方法 | |
JP4887290B2 (ja) | 音像定位制御装置 | |
EP2466918B1 (en) | Audio system, audio signal processing device and method, and program | |
JP2025519476A (ja) | 即時型オーディオ・フェーディング | |
CN118633301A (zh) | 用于回放沉浸式音频的音频处理方法 | |
US20250048051A1 (en) | A method of processing audio for playback of immersive audio | |
US12041433B2 (en) | Audio crosstalk cancellation and stereo widening | |
US20240147184A1 (en) | Apparatus and method for supplying sound in a space | |
US20240373184A1 (en) | A method of processing audio for playback of immersive audio | |
CN117652161A (zh) | 用于回放沉浸式音频的音频处理方法 | |
EP3094110B1 (en) | Audio signal processing apparatus and signal processing method for a sound system, particularly in a vehicle | |
HK1235195A1 (zh) | 用於增強虛擬音頻高度感知的系統和方法 | |
HK1235954A1 (zh) | 用於增強虛擬音頻高度感知的系統和方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |