[go: up one dir, main page]

CN101406074B - 解码器及相应方法、双耳解码器、包括该解码器的接收机或音频播放器及相应方法 - Google Patents

解码器及相应方法、双耳解码器、包括该解码器的接收机或音频播放器及相应方法 Download PDF

Info

Publication number
CN101406074B
CN101406074B CN2006800539650A CN200680053965A CN101406074B CN 101406074 B CN101406074 B CN 101406074B CN 2006800539650 A CN2006800539650 A CN 2006800539650A CN 200680053965 A CN200680053965 A CN 200680053965A CN 101406074 B CN101406074 B CN 101406074B
Authority
CN
China
Prior art keywords
mrow
msub
channel
signal
related transfer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2006800539650A
Other languages
English (en)
Other versions
CN101406074A (zh
Inventor
拉斯·维尔默斯
克里斯托弗·薛林
耶罗恩·布里巴特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Dolby International AB
Original Assignee
Dolby International AB
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby International AB, Koninklijke Philips Electronics NV filed Critical Dolby International AB
Publication of CN101406074A publication Critical patent/CN101406074A/zh
Application granted granted Critical
Publication of CN101406074B publication Critical patent/CN101406074B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • H04S3/004For headphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)
  • Peptides Or Proteins (AREA)
  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)

Abstract

在使用具有与在多通道信号的2个通道之间的电平关系有关的信息的电平参数(306)根据多通道信号的HRTF(308)得到修改后的HRTF(310)(头相关传递函数)的情况下,能够根据多通道信号的参数缩混(312)有效地得到耳机缩混信号(314),使得具有较低电平的通道的HRTF(308)比具有较高电平的HRTF(308)更强烈地影响修改后的HRTF(310)。在考虑与HRTF(308)相关联的通道的相对强度的解码过程中得到修改后的HRFT(310)。从而对HRTF(308)进行修改,使得能够将多通道信号的参数表示的缩混信号(314)直接用于合成耳机缩混信号(314)而不需要参数缩混的中间完全参数多通道重建。

Description

解码器及相应方法、双耳解码器、包括该解码器的接收机或音频播放器及相应方法
技术领域
本发明涉及根据参数多通道表示对编码的多通道音频信号进行解码,具体地,涉及提供空间收听体验的2-通道缩混(例如耳机兼容的缩混或用于2个扬声器装置的空间缩混)的产生。 
背景技术
近来关于音频编码的发展使得能够根据立体声(或单声道)信号以及相应的控制数据来重新创建音频信号的多通道表示。因为传输附加控制数据以根据传输的单声道或立体声通道来控制环绕通道的重新创建(也称作上混),所以这些方法与诸如杜比定向逻辑之类的基于较旧矩阵的解决方案有很大不同。 
因此,这样的参数多通道音频解码器(例如MPEG环绕)根据M个传输通道和附加控制数据来重建N个通道,其中N>M。附加控制数据表示比传输全部N个通道显著更低的数据速率,使得编码非常有效,同时保证了与M个通道设备和N个通道设备兼容。 
这些参数环绕编码方法通常包括:根据IID(通道间强度差)或CLD(通道电平差)和ICC(通道间相干性)将环绕信号参数化。这些参数描述了在上混过程中通道对之间的功率比和相关性。还在现有技术中使用的另外的参数包括:用于在上混过程期间预测中间体(intermediate)或输出通道的预测参数。 
在多通道音频内容的再现方面的其它发展提供了使用立体声耳机得到空间收听效果的手段。为了仅使用耳机的2个扬声器来实现空间收听体验,使用HRTF(头相关传递函数)将多通道信号缩混为立体声信号,所述HRTF意在考虑人类头部的极其复杂的传输特性以提供空间收听体验。 
另一相关途径将使用传统的2通道回放环境以及采用适合的滤波器对多通道音频信号的通道进行滤波,以实现接近采用原始数目的扬声器回放的收听体验。对信号的处理类似于在耳机回放情况下创建具有期望属性的适合“空间立体声缩混”。与耳机情况相反,2个扬声器的信号同时到达收听者的2个耳朵,引起不期望的“串音效应”。因为对于最佳再现质量需要考虑这种“串音效应”,所以一般将用于信号处理的滤波器称作串音消除滤波器。通常,本技术的目的是:通过使用复串音消除滤波器消除内部串音来扩展在立体声扬声器基座外部的声源的范围。 
由于复滤波,所以HRTF滤波器非常长,也就是这些HRTF滤波器每个均可以包括几百个滤波器抽头。出于同样的原因,几乎不可能实现对滤波器的这样的参数化:当代替实际滤波器使用时,该参数化工作得足够好以至于不降低感觉质量。 
因此,一方面,多通道信号的比特节约参数表示确实存在,以允许对编码后的多通道信号进行有效传送。另一方面,得知了在仅使用立体声耳机或立体声扬声器时针对多通道信号创建空间收听体验的良好方式。然而,这需要多通道信号的所有通道作为头相关传递函数的应用的输入以创建耳机缩混信号。因此,在应用头相关传递函数或串音消除滤波器之前需要传输全部集合的多通道信号或需要完全重建参数表示,因而传输带宽或计算复杂度高得不可接受。 
发明内容
本发明的目的是提供以下构思:允许使用多通道信号的参数表示来更有效地重建提供空间收听体验的2通道信号。 
根据本发明的第一方面,采用用于使用多通道信号的缩混的表示、以及使用具有与在多通道信号的2个通道之间的电平关系有关的信息的电平参数、以及使用与多通道信号的2个通道相关的头相关传递函数得到耳机缩混信号的解码器实现了这个目的,该解码器包括:滤波器计算器,用于通过使用电平参数对2个通道的头相关传递函数加权得到修改后的头相关传递函数,使得具有较高电平的通道的头相关传递函数比具有较低电平的通道的头相关传递函数更强地影响修改后的头  相关传递函数;以及合成器,所述合成器用于使用修改后的头相关传递函数以及缩混信号的表示得到耳机缩混信号。 
根据本发明的第二方面,利用一种双耳解码器实现了该目的,所述双耳解码器包括:用于使用多通道信号的缩混的表示、以及使用具有与在多通道信号的2个通道之间的电平关系有关的信息的电平参数、以及使用与多通道信号的2个通道相关的头相关传递函数得到耳机缩混信号的解码器,该解码器包括:滤波器计算器,用于通过使用电平参数对2个通道的头相关传递函数加权得到修改后的头相关传递函数,使得具有较高电平的通道的头相关传递函数比具有较低电平的通道的头相关传递函数更强地影响修改后的头相关传递函数;以及合成器,用于使用修改后的头相关传递函数以及缩混信号的表示得到耳机缩混信号;分析滤波器组,用于通过对多通道信号的缩混进行子带滤波得到多通道信号的缩混的表示;以及合成滤波器组,用于通过合成耳机缩混信号得到时域耳机信号。 
根据本发明的第三方面,利用使用多通道信号的缩混的表示、以及使用具有与在多通道信号的2个通道之间的电平关系有关的信息的电平参数、以及使用与多通道信号的2个通道有关的头相关传递函数得到耳机缩混信号的方法实现了该目的,所述方法包括:使用电平参数通过对2个通道的头相关传递函数加权得到修改后的头相关传递函数,使得具有较高电平的通道的头相关传递函数比具有较低电平的通道的头相关传递函数更强地影响修改后的头相关传递函数;以及使用修改后的头相关传递函数以及缩混信号的表示得到耳机缩混信号。 
根据本发明的第四方面,利用包括解码器的接收机或音频播放器实现了该目的,所述解码器用于使用多通道信号的缩混的表示、以及使用具有与在多通道信号的2个通道之间的电平关系有关的信息的电平参数、以及使用与多通道信号的2个通道有关的头相关传递函数得到耳机缩混信号,所述解码器包括:滤波器计算器,所述滤波器计算器用于通过使用电平参数对2个通道的头相关传递函数加权得到修改后的头相关传递函数,使得具有较高电平的通道的头相关传递函数比具有较低电平的通道的头相关传递函数更强地影响修改后的头相关传递  函数;以及合成器,所述合成器用于使用修改后的头相关传递函数以及缩混信号的表示得到耳机缩混信号。 
根据本发明的第五方面,利用接收或音频播放的方法实现了该目的,所述接收或音频播放的方法具有:使用多通道信号的缩混的表示、以及使用具有与在多通道信号的2个通道之间的电平关系有关的信息的电平参数、以及使用与多通道信号的2个通道有关的头相关传递函数得到耳机缩混信号的方法,该方法包括:使用电平参数通过对2个通道的头相关传递函数加权得到修改后的头相关传递函数,使得具有较高电平的通道的头相关传递函数比具有较低电平的通道的头相关传递函数更强地影响修改后的头相关传递函数;以及使用修改后的头相关传递函数以及缩混信号的表示得到耳机缩混信号。 
根据本发明的第六方面,利用用于使用多通道信号的缩混的表示、以及使用具有与在多通道信号的2个通道之间的电平关系有关的信息的电平参数、以及使用与多通道信号的2个通道有关的串音消除滤波器得到空间立体声缩混信号的解码器实现该目的,该解码器包括:滤波器计算器,用于通过使用电平参数对2个通道的串音消除滤波器加权得到修改后的串音消除滤波器,使得具有较高电平的通道的串音消除滤波器比具有较低电平的通道的串音消除滤波器更强地影响修改后的串音消除滤波器;以及合成器,所述合成器用于使用修改后的串音消除滤波器以及缩混信号的表示得到空间立体声缩混信号。 
本发明基于以下研究结果:在滤波器计算器用于根据多通道信号的原始HRTF得到修改后的HRTF(头相关传递函数)的情况下,并且在滤波器转换器使用具有与在多通道信号的2个通道之间的电平关系有关的信息的电平参数使得具有较高电平的通道的HRTF比具有较低电平的通道的HRTF更强地影响修改后的HRTF的情况下,能够根据多通道信号的参数缩混得到耳机缩混信号。在考虑了与HRTF相关联的通道的相对强度的解码过程期间得到修改后的HRTF。修改原始的HRTF,使得能够将多通道信号的参数表示的缩混信号直接用于合成耳机缩混信号而不需要对参数缩混信号进行全部参数多通道重建。 
在本发明的一个实施例中,本发明的解码器用于实现对原始多通  道信号的传输参数缩混进行参数多通道重建以及本发明的双耳重建。根据本发明,不需要在双耳缩混之前对多通道信号进行完全重建,这具有极大降低计算复杂度的显著优点。例如,这允许仅具有有限的能量贮存器的移动设备显著扩展了回放长度。另外的优点是,甚至在仅使用2扬声器耳机时,相同的设备也能够用作针对全部多通道信号(例如5.1、7.1、7.2信号)以及针对具有空间收听体验的信号的双耳缩混的提供器。例如,这在家庭娱乐配置中可以是极其有利的。 
在本发明的另外的实施例中,滤波器计算器用于得到修改后的HRTF,操作用于不仅通过对HRTF应用单独的加权因子而且通过引入针对将要组合的每个HRTF的附加相位因子来将2个通道的HRTF组合。相位因子的引入所具有的优点是,在对2个滤波器的叠加或组合之前实现了对这2个滤波器的延迟补偿。这导致了对与在前后扬声器之间的中间位置相对应的主要延迟时间进行建模的组合后的响应。 
第二个优点是,在滤波器的组合期间必须应用以保证能量保存的增益因子在频率特性方面比不引入相位因子的情况下更稳定。这尤其与本发明的构思相关,如根据本发明的实施例,在滤波器组域内对多通道信号的缩混的表示进行处理,以得到耳机缩混信号。同样地,将对缩混信号的表示的不同频带分开地进行处理,从而单独应用的增益函数的平滑特性是至关重要的。 
在本发明的另外的实施例中,将头相关传递函数转换成针对子带域的子带滤波器,使得在子带域中使用的修改后的HRTF的总数比原始HRTF的总数小。这具有的明显优点是,与使用标准HRTF滤波器进行缩混相比,得到耳机缩混信号的计算复杂度甚至降低了。 
实现本发明的构思允许使用极其长的HRTF,并且从而允许根据具有极佳感觉质量的多通道信号的参数缩混的表示重建耳机缩混信号。 
此外,在串音消除滤波器上使用本发明的构思允许根据具有极佳感觉质量的多通道信号的参数缩混的表示产生将要由标准的2扬声器装置使用的空间立体声缩混。 
本发明解码构思的一个另外的重要优点是,实现本发明的构思的  单个的本发明双耳解码器可以用于得到双耳缩混以及对考虑了附加传输的空间参数的传输的缩混进行多通道重建。 
在本发明的一个实施例中,本发明的双耳解码器包括:分析滤波器组,用于得到子带域中的多通道信号的缩混的表示;以及实现对修改后的HRTF进行计算的本发明的解码器。本发明的双耳解码器还包括合成滤波器组,用于最终得到对耳机缩混信号的时域表示,其中准备好由任何传统的音频回放装置对所述耳机缩混信号进行回放。 
在下文中,将参考附图更详细地解释现有技术的参数多通道解码方案以及双耳解码方案,以更清楚地概述本发明的构思的更好的优点。 
以下详述的本发明的大多数实施例描述了使用HRTF的本发明的构思。如先前注意到的,HRTF处理与使用串音消除滤波器相类似。因此,将理解所有实施例既可以指HRTF处理也可以指串音消除滤波器。换言之,可以利用以下的串音消除滤波器替换所有的HRTF滤波器,以将本发明的构思应用于串音消除滤波器的使用。 
附图说明
可以通过参照附图依次对本发明的优选实施例进行描述,其中: 
图1示出了使用HRTF的传统双耳合成; 
图1b是出了对串音消除滤波器的传统使用; 
图2示出了多通道空间编码器的示例; 
图3示出了现有技术的空间/双耳解码器的示例; 
图4示出了参数多通道编码器的示例; 
图5示出了参数多通道解码器的示例; 
图6示出了本发明的解码器的示例; 
图7示出了对将滤波器变换到子带域的构思加以演示的方框图; 
图8示出了本发明的解码器的示例; 
图9示出了本发明的解码器的另一示例;以及 
图10示出了本发明的接收机或音频播放器的示例。 
具体实施方式
以下描述的实施例仅仅是对用于通过变形(morphed)的HRTF滤波对多通道信号进行双耳解码的本发明的原理的例证。理解的是,对这里所描述的布置所进行的修改和变化对于本领域技术人员而言是显而易见的。因此,意图在于仅受限于独立权利要求的范围而不受通过这里的实施例的描述和解释所表现的具体细节的限制。 
为了更好地概述本发明的特征和优点,现在将给出对现有技术的更详细的描述。 
图1概述了传统的双耳合成算法。利用一组HRTF12a至12j对一组输入通道(左前(LF)、右前(RF)、左环绕(LS)、右环绕(RS)、以及中心(C))10a、10b、10c、10d以及10e进行滤波。将每个输入信号分成2个信号(左“L”和右“R”分量),其中,随后利用与期望的声音位置相对应的HRTF对这些信号分量中的每个进行依次滤波。最后,利用求和器14a对所有的左耳信号求和以产生左双耳输出信号L,利用求和器14b对所有的右耳信号求和以产生右双耳输出信号R。可以注意到的是,可以主要在时域执行HRTF卷积,然而由于可以提高计算效率通常优选在频域执行滤波。这意味着,还在频域执行图1所示的求和,此外需要随后变换到时域。 
图1b示出了用于仅使用标准立体声回放环境的2个扬声器实现空间收听效果的串音消除处理。 
目的是利用仅具有2个扬声器16a和16b的立体声回放系统再现多通道信号,使得收听者18感受到空间收听体验。相对于耳机再现的主要区别是2个扬声器16a和16b的信号直接到达收听者18的2个耳朵。因此需要另外考虑由虚线指示的信号(串音)。 
为了容易解释,在图1b中仅示出了具有源20a至20c的3通道输入信号。显而易见的是,在原则上能够将场景扩展为任意数目的通道。 
为了得到将要回放的立体声信号,利用串音消除滤波器21a至21f中的2个对每个输入源进行处理,一个滤波器针对回放信号的每个通道。最后,将针对左回放通道16a和右回放通道16b的所有滤波的信号求和以进行回放。显然,通常串音消除滤波器对于每个源20a和20b将是不同的(取决于期望感知位置),此外所述串音消除滤波器甚至会取  决于收听者。 
由于本发明的构思的高灵活性,所以得益于在对串音消除滤波器的设计和应用中的高灵活性,使得能够独立地针对每个应用或播放设备将滤波器最优化。另一个优点是,因为仅需要2个合成滤波器组,所以该方法在计算上极其有效。 
在图2中示出了空间音频编码器的原理图。在这样的基本编码场景中,空间音频解码器40包括空间编码器42、缩混编码器44以及多路复用器46。 
利用空间编码器42对多通道输入信号50进行分析,提取空间参数,所述空间参数描述需要传输至解码器侧的多通道输入信号的空间属性。例如,根据不同的编码场景,由空间编码器42产生的缩混信号可以是单声道或立体声信号。缩混编码器44然后可以使用任何传统的单声道或立体声音频编码方案对单声道或立体声缩混信号进行编码。多路复用器46通过将空间参数和编码的缩混信号组合(combine)成输出比特流来创建输出比特流。 
图3示出了与图2的编码器相对应的多通道解码器与例如图1中概述的双耳合成方法的可能直接组合。如能够看到的,对特征进行组合的现有技术途径是简单并且直接的。该结构包括多路分解器60、缩混解码器62、空间解码器64以及双耳合成器66。对输入比特流68进行多路分解,得到空间参数70和缩混信号比特流。通过使用传统的单声道或立体声解码器的缩混解码器62,对后面的缩混信号比特流进行解码。将解码的缩混信号与空间参数70一起输入至空间解码器64,所述空间解码器64产生具有由空间参数70所指示的空间属性的多通道输出信号72。完全重建多通道信号72之后,简单地添加双耳合成器66以实现图1的双耳合成构思的方式是直接的。因此,将多通道输出信号72用作双耳合成器66的输入,所述双耳合成器66对多通道输出信号进行处理以得到产生的双耳输出信号74。图3所示的方式具有至少3个缺点: 
-需要计算全部多通道信号表示作为中间步骤,然后进行双耳合成中的HRTF卷积和缩混。在给出每个音频通道能够具有不同的空间位置的事实的情况下,尽管应该以每通道为基础执行HRTF卷积,然而根  据复杂度观点这是不期望的情况。因此计算复杂度高并且浪费能量。 
-空间解码器在滤波器组(QMF)域进行操作。另一方面,将HRTF卷积典型地应用于FFT域中。因此,多通道QMF合成滤波器组的级连、多通道DFT变换、以及立体声逆DFT变换是必要的,导致了系统具有高计算要求。 
-由空间解码器产生的、用于创建多通道重建的编码伪信号(coding artefact)将是听得见的,并且在(立体声)双耳输出中将有可能增强。 
在图4和5中给出了对多通道编码和解码的更详细描述。 
图4所示的空间编码器100包括第一OTT(1至2编码器)102a、第二OTT102b以及TTT盒(3至2编码器)104。由空间编码器100对包括LF、LS、C、RF、RS(左前、左环绕、中心、右前以及右环绕)通道在内的多通道输入信号106进行处理。每个OTT盒接收2个输入音频通道,得到单个单声道音频输出通道以及关联的空间参数,该参数具有与相对于彼此或相对于输出通道的原始通道的空间属性有关的信息(例如CLD、ICC、参数)。在编码器100中,由OTT编码器102对LF和LS通道进行处理,由OTT编码器102b对RF和RS通道进行处理。产生两个信号L和R,一个仅具有与左侧有关的信息,另一个仅具有与右侧有关的信息。由TTT编码器104对信号L、R和C作进一步的处理,产生立体声缩混以及附加参数。 
典型地,由TTT编码器产生的参数包括:对于每个参数带的一对预测系数,或描述三个输入信号的能量比的一对电平差。“OTT”编码器的参数包括在对于每个频带的输入信号间的电平差以及相干性或互相关值。 
可以注意到的是,尽管空间编码器100的示意图表明了在编码期间对缩混信号的独立通道的顺序处理,然而还能够在一个单个矩阵运算内实现编码器100的完全缩混处理。 
图5示出了相应的空间解码器,接收由图4的编码器提供的缩混信号以及相应的空间参数作为输入。 
空间解码器120包括:2至3解码器122以及1至2解码器124a至124c。  将缩混信号L0和R0输入至重新创建中心通道C、右通道R以及左通道L的2至3解码器122。由产生6个输出通道的OTT解码器124a至124c对这三个通道作进一步的处理。可以注意到的是,低频增强通道LFE的产生不是强制性的并且可以被省略,使得在图5所示的环绕解码器120内可以节省一个单个OTT解码器。 
根据本发明的一个实施例,将发明构思应用于图6所示的解码器。本发明的解码器200包括:2至3解码器104以及6个HRTF滤波器106a至106f。由TTT解码器104对立体声输入信号(L0,R0)进行处理,得到3个信号L、C以及R。可以注意到的是,因为TTT编码器可以与图5所示的编码器相同并且因而适于在子带信号上操作,所以假设将在子带域内得到立体声输入信号。由HRTF滤波器106a至106f对信号L、R以及C进行HRTF参数处理。 
对得到的6个通道求和以产生立体声双耳输出对(Lb,Rb)。 
能够按照以下矩阵运算来描述TTT解码器106: 
L R C = m 11 m 12 m 21 m 22 m 31 m 32 L 0 R 0
其中矩阵条目mxy取决于空间参数。空间参数与矩阵条目之间的关系与5.1-多通道MPEG环绕解码器中的那些关系相同。将这3个产生的信号L、R以及C中的每个分成2个,并且采用与这些声音源的期望(感知)位置相对应的HRTF参数对这3个得到的信号L、R以及C进行处理。对于中心通道(C),能够直接应用声音源位置的空间参数,得到针对中心的2个输出信号LB(C)和RB(C): 
L B ( C ) R B ( C ) = H L ( C ) H R ( C ) C .
对于左(L)通道,使用权重wlf和wrf将来自左前和左环绕通道的HRTF参数组合成单个的HRTF参数集。 
所产生的“复合”HRTF参数在统计学意义上模拟前通道和环绕通道的效果。以下方程用于产生针对左通道的双耳输出对(LB,RB):
L B ( L ) R B ( L ) = H L ( L ) H R ( L ) L ,
以类似的方式,根据以下方程得到针对右通道的双耳输出: 
L B ( R ) R B ( R ) = H L ( R ) H R ( R ) R ,
在给出对LB(C)、RB(C)、LB(L)、RB(L)、LB(R)以及RB(R)的以上定义之后,能够从给出立体声输入信号的单个2×2矩阵得到完整的LB和RB: 
L B R B = h 11 h 12 h 21 h 22 L 0 R 0
其中: 
h11=m11HL(L)+m21HL(R)+m31HL(C), 
h12=m12HL(L)+m22HL(R)+m32HL(C), 
h21=m11HR(L)+m21HR(R)+m31HR(C), 
h22=m12HR(L)+m22HR(R)+m32HR(C)。 
在上文中,对于Y=L0,RO和X=L,R,C,假设HY(X)元素是复标量。然而,本发明启示如何对2×2矩阵双耳解码器的方式进行扩展以操作任意长度的HRTF滤波器。为了实现这个,本发明包括以下步骤: 
·将HRTF滤波器响应变换至滤波器组域; 
·从HRTF滤波器对提取总延迟差或相位差; 
·将HRTF滤波器对的响应变形为CLD参数的函数; 
·增益调整。 
这是通过利用6个滤波器代替对于Y=L0,R0并且X=L,R,C的6个复增益HY(X)来实现的。从在QMF域给出了HRTF滤波器响应的、针对Y=L0,R0并且X=Lf,Ls,Rf,Rs,C的10个滤波器Hγ(X)中得到这6个滤波器。根据在后续段落之一所描述的方法能够实现这些QMF表示。 
换言之,本发明提出了根据以下方程通过使用复线性组合对前通道和环绕通道滤波器进行修改(变形)来得到修改后的HRTF的构思: 
H Y ( X ) = g w f exp ( - j φ XY w s 2 ) H Y ( Xf ) + g w s exp ( j φ XY w f 2 ) H Y ( Xs ) .
如根据以上公式所看到的,修改后的HRTF的得到是对原始HRTF的加权叠加,还应用了相位因子。权重ws、wf取决于意在由图5的OTT解码器124a和124b使用的CLD参数。 
权重wlf和wls取决于针对Lf和Ls的“OTT”盒的CLD参数: 
w lf 2 = 10 CLD l / 10 1 + 10 CLD l / 10 , w ls 2 = 1 1 + 10 CLD l / 10
权重wrf和wrs取决于针对Rf和Rs的“OTT”盒的CLD参数: 
w rf 2 = 10 CLD r / 10 1 + 10 CLD r / 10 , w rs 2 = 1 1 + 10 CLD r / 10
根据前后HRTF滤波器间的主要延迟时间差τXY以及QMF组的子带索引n能够得到相位参数φXY: 
φ XY = π ( n + 1 2 ) 64 τ XY .
在对滤波器的变形中该相位参数的任务是双重的。首先,该相位参数在叠加之前实现对两个滤波器的延迟补偿,其中叠加导致了对与前后扬声器间的源位置相对应的主要延迟时间进行建模(model)的组合后的响应。其次,与φXY=0的简单的叠加的情况相比,该相位参数使得必要的增益补偿因子g更加稳定并且随频率缓慢变化。 
利用不相干加法幂(addition power)规则确定增益因子g, 
P Y ( X ) 2 = w f 2 P Y ( Xf ) 2 + w s 2 P Y ( Xs ) 2 ,
其中, 
P Y ( X ) 2 = g 2 ( w f 2 P Y ( Xf ) 2 + w s 2 P Y ( Xs ) 2 + 2 w f w s P Y ( Xf ) P Y ( Xs ) ρ XY )
ρXY是在滤波器exp(-jφXY)Hγ(Xf)和Hγ(Xs)之间的标准化复互相关的实值。 
对于以上方程,P代表描述了针对由索引指定的滤波器的脉冲响应的每频带的平均电平的参数。当然,一旦知道了滤波器响应函数,就容易地得到这个平均强度。 
在φXY=0的简单叠加的情况下,ρXY的值作为频率的函数以不稳定的并且振荡的方式变化,这导致了需要大规模的增益调整。在具体实  现中,有必要限制增益g的值,并且不能避免对信号的剩余频谱色化(spectral colorization)。 
相反,使用如本发明提出的具有基于延迟的相位补偿的变形导致了作为频率的函数的ρXY的平滑特性。这个值通常甚至接近于自然HRTF得到的滤波器对的值,因为它们主要在延迟和相位上有所不同,并且相位参数的目的是在QMF滤波器组域中考虑延迟差。 
在滤波器Hγ(Xf)和Hγ(Xs)之间的标准化复互相关的相位角给出了对本发明提出的相位参数φXY的可选的有利选择,并且利用标准展开(unwrapping)技术将相位值展开作为QMF组的子带索引n的函数。该选择的结果是,ρXY从不为负并且因而对于所有子带来说,补偿增益g满足1/
Figure G2006800539650D0013114921QIETU
≤g≤1。此外,在主要延迟时间差τXY不可用的情况下,对相位参数的这个选择使前通道和环绕通道滤波器能够变形。 
对于如以上描述的本发明的实施例,提出了将HRTF正确地变换成在QMF域内对HRTF滤波器的有效表示。 
图7给出了将时域滤波器正确地变换成对重建的信号具有相同的净效应的子带域内的滤波器的原理图。图7示出了复分析组300、与该分析组300相对应的合成组302、滤波器转换器304以及子带滤波器306。 
提供输入信号310,对于输入信号310,已知滤波器312具有期望的属性。实现滤波器转换器304的目的是:在由分析滤波器组300进行分析、随后的子带滤波306以及合成302之后,输出信号314具有如同在时域中由滤波器312对所述输出信号314进行滤波时所具有的特性一样的特性。利用滤波器转换器304完成了提供与多个使用的子带相对应的多个子带滤波器的任务。 
以下描述概述了在复QMF子带域中实现给定FIR滤波器h(v)的方法。图7示出了工作的原理。 
这里,子带滤波仅仅是针对每个子带n=0,1,...,L-1对一个复值FIR滤波器的应用,以根据以下公式将原始索引cn变换成滤波后的索引对应dn: 
d n ( k ) = Σ l g n ( l ) c n ( k - l )
观察到这与针对严格采样的滤波器组而开发的公知方法不同,这是因为这些方法需要具有更长响应的多带滤波。关键部分是将任何时域FIR滤波器转换成复子带域滤波器的滤波器转换器。因为对复QMF子带域进行过采样,所以对于给定的时域滤波器不存在规范的子带滤波器集合。不同的子带滤波器可以具有对时域信号的相同净效应。这里将要描述的是通过将滤波器转换器限定为类似于QMF的复分析组而得到的一种尤其吸引人的近似解决方案。 
假设滤波器转换器的原型的长度是64KQ,将实64KH抽头FIR滤波器变换成一组64复KH+KQ-1抽头子带滤波器。对于KQ=3,将1024个抽头的FIR滤波器转换成采用50dB的近似质量的18个抽头的子带滤波。 
根据以下公式计算子带滤波器抽头: 
g n ( k ) = Σ v = - ∞ ∞ h ( v + kL ) q ( v ) exp ( - i π L ( n + 1 2 ) v ) ,
其中q(v)是从QMF原型滤波器得到的FIR原型滤波器。如能够看到的,这仅仅是对给定滤波器h(v)的复滤波器组分析。 
在下文中,将针对本发明的另外的实施例来概述本发明的构思,其中针对具有5个通道的多通道信号的多通道参数表示是可用的。请注意,在本发明的这个特定实施例中,将原始10个HRTF滤波器VY,X(例如,由图1的滤波器12a至12j的QMF表示所给出的)变形为针对Y=L,R并且X=L,R,C的6个滤波器。 
针对Y=L,R并且X=FL,BL,FR,BR,C的10个滤波器vγ,χ描述了混合QMF域中给定的HRFT滤波器响应。 
采用根据以下方程的复线性组合来执行对前通道和环绕通道滤波器的结合: 
hL,C=vL,C
hR.C=vR.C
h L , L = g L , L σ FL exp ( - j φ FL , BL L σ BL 2 ) v L , FL + g L , L σ BL exp ( j φ FL , BL L σ FL 2 ) v L , BL
h L , R = g L , R σ FR exp ( - j φ FR , BR L σ BR 2 ) v L , FR + g L , R σ BR exp ( j φ FR , BR L σ FR 2 ) v L , BR
h R , L = g R , L σ FL exp ( - j φ FL , BL R σ BL 2 ) v R , FL + g R , L σ BL exp ( j φ FL , BL R σ FL 2 ) v R , BL
h R , R = g R , R σ FR exp ( - j φ FR , BR R σ BR 2 ) v R , FR + g R , R σ BR exp ( j φ FR , BR R σ FR 2 ) v R , BR
利用以下方程确定增益因子gL,L、gL,R、gR,L、gR,R: 
g Y , X = ( σ FX 2 CFB Y , X 2 + σ BX 2 σ FX 2 CFB Y , X 2 + σ BX 2 + 2 σ FX σ BX CFB Y , X ICCFB Y , X φ ) 1 / 2
按照以下方式定义参数CFBY,X
Figure G2006800539650D00153
和相位参数φ: 
利用以下方程针对Y=L,R和X=L,R定义HRTF滤波器的每混合带的平均前/后电平商(level quotient): 
( CFB Y , X ) k = ( Σ l = 0 L q - 1 | ( v Y , FX ) k ( l ) | 2 Σ l = 0 L q - 1 | ( v Y , BX ) k ( l ) | 2 ) 1 / 2 .
此外,然后针对Y=L,R并且X=L,R定义相位参数 
Figure G2006800539650D00155
( CIC Y , X ) k = | ( CIC Y , X ) k | exp ( j ( φ FX , BX Y ) k ) ,
其中利用以下方程定义复互相关(CICY.X)k: 
( CIC Y , X ) k = Σ l = 0 L p - 1 ( v Y , FX ) k ( l ) ( v Y , BX ) k * ( l ) ( Σ l = 0 L q - 1 | ( v Y , FX ) k ( l ) | 2 ) 1 / . 2 ( Σ l = 0 L q - 1 | ( v Y , BX ) k ( l ) | 2 ) 1 / 2 .
按照子带索引k对相位参数应用相位展开,使得对于k=0,1,...从子带k到子带k+1的相位增量小于或等于π。对于增量,在存在两种选择±π的情况下,选择对于在区间[-π,π]中相位测量的增量的符号。 
最后,利用以下方程针对Y=L,R和X=L,R定义标准化相位补偿的互相关: 
( ICCFB Y , X φ ) k = | ( CIC Y , X ) k | .
请注意,例如,在混合子带域内(也就是在将子带分解为不同频带的域中)执行多通道处理的情况下,可以按照以下方式将HRTF响应映射到混合带滤波器:
如在没有混合滤波器组的情况下,根据以上概述的方法,将从源X=FL,BL,FR,BR,C至目标Y=L,R的10个给定的HRTF脉冲响应全部转换为QMF子带滤波器。结果是具有分量
Figure G2006800539650D00161
(l)的10个子带滤波器
Figure G2006800539650D00162
其中QMF子带m=0,1,...,63,QMF时隙l=0,1,...,Lq-1。使得由m=Q(k)代表从混合带k映射到QMF组m的指数。 
然后利用以下方程定义混合带域中的HRTF滤波器vY,X: 
( v Y , X ) k ( l ) = ( v ^ Y , X ) Q ( k ) ( l ) .
对于先前的段落中所描述的特定实施例,在给定将要变换至QMF子带域的长度为Nh的FIR滤波器h(v)的情况下,可以按照以下方式来实现将HRTF滤波器转换到QMF域的滤波器转换: 
子带滤波包括:对于每个QMF子带m=0,1,...,63的一个复值FIR滤波器的单独应用。关键部分是将给定的时域FIR滤波器h(v)转换成复子带域的滤波器hm(l)的滤波器转换器。滤波器转换器是类似于QMF分析组的复分析组。滤波器转换器的原型滤波器q(v)的长度是192。利用以下方程定义采用0对时域FIR滤波器的扩展: 
Figure G2006800539650D00164
然后利用以下方程针对m=0,1,..,63和l=0,1,...,Kh+1给出长度Lq=Kh+2的子带滤波器,其中
Figure G2006800539650D0016121034QIETU
: 
h m ( l ) = Σ v = 0 191 h ~ ( v + 64 ( l - 2 ) ) q ( v ) exp ( - j π 64 ( m + 1 2 ) ( v - 95 ) ) .
尽管相对于具有2个通道的缩混信号(也就是传输的立体声信号)细化了本发明的构思,然而对本发明构思的应用决不限于具有立体声缩混信号的方案。 
综上所述,本发明涉及对于参数多通道信号的双耳呈现使用长HRTF或串音消除滤波器的问题。本发明提出了将参数HRTF方式扩展到HRTF滤波器的任意长度的新的方式。 
本发明包括以下特征:
-将立体声缩混信号与2×2矩阵相乘,其中每个矩阵元素是FIR滤波器或任意长度(如由HRTF滤波器给出的); 
-通过根据传输的多通道参数将原始HRTF滤波器变形得到2×2矩阵中的滤波器; 
-计算对HRTF滤波器的变形,以得到正确的谱包络和总能量。 
图8示出了用于得到耳机缩混信号的本发明解码器300的示例。解码器包括滤波器计算器302以及合成器304。滤波器计算器接收电平参数306作为第一输入并且接收HRTF(头相关传递函数)308作为第二输入以得到修改后的HRTF310,其中,与在时域中应用的头相关传递函数308相比,在将所述修改后的HRTF310应用于子带域中的信号时,所述修改后的HRTF310对信号具有相同净效应。修改后的HRTF310用作第一合成器304的第一输入,所述合成器接收子带域内的缩混信号的表示312作为第二输入。利用参数多通道编码器得到缩混信号的表示312,并且所述缩混信号的表示312旨在用作由多通道解码器对全部多通道信号进行重建的基础。因此,合成器404能够使用修改后的HRTF310和缩混信号的表示312得到耳机缩混信号314。 
可以注意到的是,能够以任何可能的参数表示提供HRTF,例如,作为与滤波器相关联的传输函数,作为对滤波器的脉冲响应,或作为针对FIR滤波器的一系列抽头系数。 
先前的示例假设提供了缩混信号的表示作为滤波器组表示(也就是作为通过滤波器组得到的采样)。然而,典型地提供并且传输时域缩混信号,以便还允许在简单的回放环境中直接回放提交的信号。因此,在图9中,在本发明的另外的实施例中,双耳兼容解码器400包括分析滤波器组402以及合成滤波器组404以及本发明的解码器,例如所述本发明的解码器可以是图8的解码器300。解码器功能块以及这些功能块的描述可用于图9以及图8中,并且在以下图中将省略对解码器300的描述。 
分析滤波器组402接收由多通道参数编码器创建的多通道信号的缩混406。仍然在滤波器组域内,分析滤波器组402得到所接收的缩混信号的表示406,然后将所述所接收的缩混信号的表示406输入至  解码器300中,所述解码器300得到耳机缩混信号408。也就是,在由分析滤波器组402引入的频带内利用多个采样或系数表示缩混。因此,为了在时域中提供最终的耳机缩混信号410,将耳机缩混信号408输入至合成滤波器组404中,所述合成滤波器组404得到准备好由立体声再现装置回放的耳机缩混信号410。 
图10示出了本发明的接收机或音频播放器500,所述接收机或音频播放器500包括本发明的音频解码器501、比特流输入502、以及音频输出504。 
能够在本发明的接收机/音频播放器500的输入502处输入比特流。然后利用解码器501对比特流进行解码,在本发明的接收机/解码器500的输出504处输出或播放解码后的信号。 
尽管在先前的图中描述了示例以实现根据传输的立体声缩混的本发明的构思,然而还可以将本发明的构思用于根据单个立体声缩混通道或根据多于2个缩混通道的配置。 
在本发明的描述中,给出了将头相关传递函数传递至子带域中的一个特定实现。然而,还可以使用得到子带滤波器的其它技术而不限制本发明的构思。 
还能够通过除了先前提出的计算以外的其它计算得到在修改后的HRTF的得到中引入的相位因子。因此,以不同的方式得到这些因子不限制本发明的范围。 
尽管具体地针对HRTF和串音消除滤波器示出了本发明的构思,然而本发明的构思能够用于针对多通道信号的一个或更多个独立通道所定义的其它滤波器以允许计算有效地产生高质量的立体声回放信号。此外,滤波器不限于用于对收听环境建模的滤波器。甚至能够使用向信号添加“人造(artificial)”分量的滤波器,例如混响(reverberation)或其它失真滤波器。 
根据本发明的某些实现要求,能够在硬件或软件中实现本发明的方法。能够使用与可编程计算机合作的数字存储媒体(具体地上面存储有电可读控制信号的磁盘、DVD或CD)来执行所述实现,以便执行本发明的方法。因此,本发明通常是具有存储在机器可读载体上的  程序代码的计算机程序产品,当计算机程序产品在计算机上运行时对于执行本发明的方法而言所述程序代码是可操作的。换言之,因此本发明的方法是具有用于执行本发明的方法中的至少一个的程序代码的计算机程序(当所述计算机程序在计算机上运行时)。 
尽管参考前述内容的特定实施例示出并且描述了所述前述内容,然而本领域技术人员将理解,在不脱离前述内容的精神和范围的情况下,可以进行在形式和细节上的各种其它改变。将理解的是,在不脱离这里所公开的以及所附权利要求所包含的广泛构思的情况下,可以进行各种修改以适于不同的实施例。

Claims (17)

1.一种解码器,用于使用多通道信号的缩混信号的表示(312)、以及使用具有与在多通道信号的2个通道之间的电平关系有关的信息的电平参数(306)、以及使用与多通道信号的2个通道相关的头相关传递函数(308)得到耳机缩混信号(314),其中,2个通道的第一通道是多通道信号的左或右侧的前通道,2个通道的第二通道是同侧的后通道,所述解码器包括:
滤波器计算器(302),用于通过使用以下复线性组合,
H Y ( X ) = gw f exp ( - j φ XY w s 2 ) H Y ( Xf ) + g w s exp ( j φ XY w f 2 ) H Y ( Xs ) ,
其中,ΦXY是平均相位,ws和wf是使用电平参数(306)得到的加权因子,以及g是使用电平参数(306)得到的公共增益因子,使用电平参数(306)对前通道头相关传递函数(308)HY(Xf)以及后通道头相关传递函数(308)HY(Xs)加权得到修改后的头相关传递函数HY(X)(310),使得具有较高电平的通道的头相关传递函数(308)比具有较低电平的通道的头相关传递函数(308)更强地影响修改后的头相关传递函数HY(X)(310);以及
合成器(304),用于使用修改后的头相关传递函数(310)以及缩混信号的表示(312)得到耳机缩混信号(314)。
2.根据权利要求1的解码器,其中,滤波器计算器(302)操作用于得到适于应用到缩混信号的滤波器组表示的修改后的头相关传递函数(310)。
3.根据权利要求1的解码器,适于使用在滤波器组域中的得到的缩混信号的表示。
4.根据权利要求1的解码器,其中,滤波器计算器(302)操作用于使用相同电平参数(306)得到针对2个通道的头相关传递函数(308)的加权因子。
5.根据权利要求4的解码器,其中,滤波器计算器(302)操作用于根据以下公式,使用电平参数CLD1得到针对第一通道f的第一加权因子w1f以及针对第二通道s的第二加权因子w1s
w lf 2 = 10 CLD 1 / 10 1 + 10 CLD 1 / 10 , w ls 2 = 1 1 + 10 CID 1 / 10 .
6.根据权利要求1的解码器,其中,滤波器计算器(302)操作用于使用在2个通道的头相关传递函数(308)的脉冲响应之间的延迟时间得到平均相位。
7.根据权利要求6的解码器,其中,滤波器计算器(302)在具有n个频带的滤波器组域中操作,并且使用在2个通道的头相关传递函数(308)的脉冲响应之间的延迟时间得到针对每个频带的单独的平均相位。
8.根据权利要求6的解码器,其中,滤波器计算器(302)在具有多于2个频带的滤波器组域中操作,并且根据以下公式,使用所述延迟时间τXY得到针对每个频带的单独的平均相位ΦXY
φ XY = π ( n + 1 2 ) 64 τ XY , 其中n是整数。
9.根据权利要求1的解码器,其中,滤波器计算器(302)操作用于使用在第一和第二通道的头相关传递函数(308)的脉冲响应之间的归一化复互相关的相位角得到平均相位。
10.根据权利要求1的解码器,适于使用缩混信号的表示(312),所述缩混信号的表示(312)具有从具有左前、左环绕、右前、右环绕以及中心通道的多通道信号得到的左和右通道。
11.根据权利要求1的解码器,其中,合成器操作用于得到耳机缩混信号(314)的通道,对多通道信号的缩混信号的表示(312)应用修改后的头相关传递函数(310)的线性组合。
12.根据权利要求11的解码器,其中,合成器操作用于根据电平参数(306)使用针对线性组合的系数。
13.一种双耳解码器,包括:
根据权利要求1的解码器;
分析滤波器组,所述分析滤波器组用于通过对多通道信号的缩混进行子带滤波得到多通道信号(312)的缩混信号的表示(312);以及
合成滤波器组,所述合成滤波器组用于通过合成耳机缩混信号(314)得到时域耳机信号。
14.一种解码器,用于使用多通道信号的缩混信号的表示(312)、以及使用具有与在多通道信号的2个通道之间的电平关系有关的信息的电平参数(306)、以及使用与多通道信号的2个通道相关的串音消除滤波器得到空间立体声缩混信号,其中,2个通道的第一通道是多通道信号的左或右侧的前通道,2个通道的第二通道是同侧的后通道,所述解码器包括:
滤波器计算器(302),用于通过使用以下复线性组合,
H Y ( X ) = gw f exp ( - j φ XY w s 2 ) H Y ( Xf ) + g w s exp ( j φ XY w f 2 ) H Y ( Xs ) ,
其中,ΦXY是平均相位,ws和wf是使用电平参数(306)得到的加权因子,以及g是使用电平参数(306)得到的公共增益因子,使用电平参数(306)对前通道串音消除滤波器HY(Xf)以及后通道串音消除滤波器HY(Xs)加权得到修改后的串音消除滤波器,使得具有较高电平的通道的串音消除滤波器比具有较低电平的通道的串音消除滤波器更强地影响修改后的串音消除滤波器;以及
合成器(304),用于使用修改后的串音消除滤波器以及缩混信号的表示(312)得到空间立体声缩混信号。
15.一种使用多通道信号的缩混信号的表示(312)、以及使用具有与在多通道信号的2个通道之间的电平关系有关的信息的电平参数(306)、以及使用与多通道信号的2个通道相关的头相关传递函数(308)得到耳机缩混信号(314)的方法,其中,2个通道的第一通道是多通道信号的左或右侧的前通道,2个通道的第二通道是同侧的后通道,所述方法包括:
通过使用以下复线性组合,
H Y ( X ) = gw f exp ( - j φ XY w s 2 ) H Y ( Xf ) + g w s exp ( j φ XY w f 2 ) H Y ( Xs ) ,
其中,ΦXY是平均相位,ws和wf是使用电平参数(306)得到的加权因子,以及g是使用电平参数(306)得到的公共增益因子,使用电平参数(306),对前通道头相关传递函数(308)HY(Xf)以及后通道头相关传递函数(308)HY(Xs)加权得到修改后的头相关传递函数HY(X)(310),使得具有较高电平的通道的头相关传递函数比具有较低电平的通道的头相关传递函数更强地影响修改后的头相关传递函数HY(X);以及
使用修改后的头相关传递函数(310)以及缩混信号的表示得到耳机缩混信号(314)。
16.一种包括解码器的接收机或音频播放器,所述解码器用于使用多通道信号的缩混信号的表示(312)、以及使用具有与在多通道信号的2个通道之间的电平关系有关的信息的电平参数(306)、以及使用与多通道信号的2个通道有关的头相关传递函数(308)得到耳机缩混信号(314),其中,2个通道的第一通道是多通道信号的左或右侧的前通道,2个通道的第二通道是同侧的后通道,所述解码器包括:
滤波器计算器,用于通过使用以下复线性组合,
H Y ( X ) = gw f exp ( - j φ XY w s 2 ) H Y ( Xf ) + g w s exp ( j φ XY w f 2 ) H Y ( Xs ) ,
其中,ΦXY是平均相位,ws和wf是使用电平参数(306)得到的加权因子,以及g是使用电平参数(306)得到的公共增益因子,使用电平参数(306)对前通道头相关传递函数(308)HY(Xf)以及后通道头相关传递函数(308)HY(Xs)加权得到修改后的头相关传递函数HY(X)(310),使得具有较高电平的通道的头相关传递函数比具有较低电平的通道的头相关传递函数更强地影响修改后的头相关传递函数HY(X)(310);以及
合成器,用于使用修改后的头相关传递函数(310)以及缩混信号的表示得到耳机缩混信号(314)。
17.一种用于接收或音频播放的方法,所述用于接收或音频播放的方法具有:使用多通道信号的缩混信号的表示(312)、以及使用具有与在多通道信号的2个通道之间的电平关系有关的信息的电平参数(306)、以及使用与多通道信号的2个通道有关的头相关传递函数(308)得到耳机缩混信号(314)的方法,其中,2个通道的第一通道是多通道信号的左或右侧的前通道,2个通道的第二通道是同侧的后通道,所述方法包括:
通过使用以下复线性组合,
H Y ( X ) = gw f exp ( - j φ XY w s 2 ) H Y ( Xf ) + g w s exp ( j φ XY w f 2 ) H Y ( Xs ) ,
其中,ΦXY是平均相位,ws和wf是使用电平参数(306)得到的加权因子,以及g是使用电平参数(306)得到的公共增益因子,使用电平参数(306),对前通道头相关传递函数(308)HY(Xf)以及后通道头相关传递函数(308)HY(Xs)加权得到修改后的头相关传递函数HY(X)(310),使得具有较高电平的通道的头相关传递函数比具有较低电平的通道的头相关传递函数更强地影响修改后的头相关传递函数HY(X)(310);以及
使用修改后的头相关传递函数(310)以及缩混信号的表示得到耳机缩混信号(314)。
CN2006800539650A 2006-03-24 2006-09-01 解码器及相应方法、双耳解码器、包括该解码器的接收机或音频播放器及相应方法 Active CN101406074B (zh)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
SE06006746 2006-03-24
SE0600674 2006-03-24
SE0600674-6 2006-03-24
US74455506P 2006-04-10 2006-04-10
US60/744,555 2006-04-10
PCT/EP2006/008566 WO2007110103A1 (en) 2006-03-24 2006-09-01 Generation of spatial downmixes from parametric representations of multi channel signals

Publications (2)

Publication Number Publication Date
CN101406074A CN101406074A (zh) 2009-04-08
CN101406074B true CN101406074B (zh) 2012-07-18

Family

ID=40538857

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006800539650A Active CN101406074B (zh) 2006-03-24 2006-09-01 解码器及相应方法、双耳解码器、包括该解码器的接收机或音频播放器及相应方法

Country Status (11)

Country Link
US (1) US8175280B2 (zh)
EP (1) EP1999999B1 (zh)
JP (1) JP4606507B2 (zh)
KR (1) KR101010464B1 (zh)
CN (1) CN101406074B (zh)
AT (1) ATE532350T1 (zh)
BR (1) BRPI0621485B1 (zh)
ES (1) ES2376889T3 (zh)
PL (1) PL1999999T3 (zh)
RU (1) RU2407226C2 (zh)
WO (1) WO2007110103A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109115245A (zh) * 2014-03-28 2019-01-01 意法半导体股份有限公司 多通道换能器设备和其操作方法

Families Citing this family (77)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7644282B2 (en) 1998-05-28 2010-01-05 Verance Corporation Pre-processed information embedding system
US6737957B1 (en) 2000-02-16 2004-05-18 Verance Corporation Remote control signaling using audio watermarks
JP2006504986A (ja) 2002-10-15 2006-02-09 ベランス・コーポレイション メディア・モニタリング、管理および情報システム
US7369677B2 (en) * 2005-04-26 2008-05-06 Verance Corporation System reactions to the detection of embedded watermarks in a digital host content
US20060239501A1 (en) 2005-04-26 2006-10-26 Verance Corporation Security enhancements of digital watermarks for multi-media content
JP4988717B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
US8577686B2 (en) 2005-05-26 2013-11-05 Lg Electronics Inc. Method and apparatus for decoding an audio signal
US8020004B2 (en) 2005-07-01 2011-09-13 Verance Corporation Forensic marking using a common customization function
US8781967B2 (en) 2005-07-07 2014-07-15 Verance Corporation Watermarking in an encrypted domain
US7793546B2 (en) * 2005-07-11 2010-09-14 Panasonic Corporation Ultrasonic flaw detection method and ultrasonic flaw detection device
KR101333031B1 (ko) * 2005-09-13 2013-11-26 코닌클리케 필립스 일렉트로닉스 엔.브이. HRTFs을 나타내는 파라미터들의 생성 및 처리 방법 및디바이스
TWI344638B (en) * 2006-01-19 2011-07-01 Lg Electronics Inc Method and apparatus for processing a media signal
WO2007091848A1 (en) * 2006-02-07 2007-08-16 Lg Electronics Inc. Apparatus and method for encoding/decoding signal
US8027479B2 (en) * 2006-06-02 2011-09-27 Coding Technologies Ab Binaural multi-channel decoder in the context of non-energy conserving upmix rules
AU2007312598B2 (en) * 2006-10-16 2011-01-20 Dolby International Ab Enhanced coding and parameter representation of multichannel downmixed object coding
GB2453117B (en) * 2007-09-25 2012-05-23 Motorola Mobility Inc Apparatus and method for encoding a multi channel audio signal
KR101406531B1 (ko) * 2007-10-24 2014-06-13 삼성전자주식회사 스테레오 오디오 신호로부터 바이노럴 비트를 발생시키는 장치 및 방법
JP2009128559A (ja) * 2007-11-22 2009-06-11 Casio Comput Co Ltd 残響効果付加装置
US9445213B2 (en) 2008-06-10 2016-09-13 Qualcomm Incorporated Systems and methods for providing surround sound using speakers and headphones
US8259938B2 (en) 2008-06-24 2012-09-04 Verance Corporation Efficient and secure forensic marking in compressed
JP5746621B2 (ja) * 2008-07-31 2015-07-08 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ バイノーラル信号のための信号生成
UA101542C2 (ru) 2008-12-15 2013-04-10 Долби Лабораторис Лайсензин Корпорейшн Виртуализатор окружающего звука с динамическим сжатием диапазона и способ
JP5524237B2 (ja) 2008-12-19 2014-06-18 ドルビー インターナショナル アーベー 空間キューパラメータを用いてマルチチャンネルオーディオ信号に反響を適用する方法と装置
JP5679340B2 (ja) 2008-12-22 2015-03-04 コーニンクレッカ フィリップス エヌ ヴェ 送信効果処理による出力信号の生成
TWI404050B (zh) * 2009-06-08 2013-08-01 Mstar Semiconductor Inc 多聲道音頻信號解碼方法與裝置
JP2011066868A (ja) * 2009-08-18 2011-03-31 Victor Co Of Japan Ltd オーディオ信号符号化方法、符号化装置、復号化方法及び復号化装置
CN102157149B (zh) 2010-02-12 2012-08-08 华为技术有限公司 立体声信号下混方法、编解码装置和编解码系统
TWI443646B (zh) 2010-02-18 2014-07-01 Dolby Lab Licensing Corp 音訊解碼器及使用有效降混之解碼方法
KR20110116079A (ko) 2010-04-17 2011-10-25 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 장치 및 방법
US8838978B2 (en) 2010-09-16 2014-09-16 Verance Corporation Content access management using extracted watermark information
US9530421B2 (en) 2011-03-16 2016-12-27 Dts, Inc. Encoding and reproduction of three dimensional audio soundtracks
US8682026B2 (en) 2011-11-03 2014-03-25 Verance Corporation Efficient extraction of embedded watermarks in the presence of host content distortions
US8923548B2 (en) 2011-11-03 2014-12-30 Verance Corporation Extraction of embedded watermarks from a host content using a plurality of tentative watermarks
US8533481B2 (en) 2011-11-03 2013-09-10 Verance Corporation Extraction of embedded watermarks from a host content based on extrapolation techniques
US8615104B2 (en) 2011-11-03 2013-12-24 Verance Corporation Watermark extraction based on tentative watermarks
US8745403B2 (en) 2011-11-23 2014-06-03 Verance Corporation Enhanced content management based on watermark extraction records
US9323902B2 (en) 2011-12-13 2016-04-26 Verance Corporation Conditional access using embedded watermarks
US9547753B2 (en) 2011-12-13 2017-01-17 Verance Corporation Coordinated watermarking
FR2986932B1 (fr) * 2012-02-13 2014-03-07 Franck Rosset Procede de synthese transaurale pour la spatialisation sonore
US9602927B2 (en) * 2012-02-13 2017-03-21 Conexant Systems, Inc. Speaker and room virtualization using headphones
US10321252B2 (en) 2012-02-13 2019-06-11 Axd Technologies, Llc Transaural synthesis method for sound spatialization
US9571606B2 (en) 2012-08-31 2017-02-14 Verance Corporation Social media viewing system
US8869222B2 (en) 2012-09-13 2014-10-21 Verance Corporation Second screen content
US9106964B2 (en) 2012-09-13 2015-08-11 Verance Corporation Enhanced content distribution using advertisements
US8726304B2 (en) 2012-09-13 2014-05-13 Verance Corporation Time varying evaluation of multimedia content
JP6179122B2 (ja) * 2013-02-20 2017-08-16 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム
US9191516B2 (en) * 2013-02-20 2015-11-17 Qualcomm Incorporated Teleconferencing using steganographically-embedded audio data
US9093064B2 (en) * 2013-03-11 2015-07-28 The Nielsen Company (Us), Llc Down-mixing compensation for audio watermarking
US9262793B2 (en) 2013-03-14 2016-02-16 Verance Corporation Transactional video marking system
JP6019266B2 (ja) * 2013-04-05 2016-11-02 ドルビー・インターナショナル・アーベー ステレオ・オーディオ・エンコーダおよびデコーダ
WO2014171791A1 (ko) 2013-04-19 2014-10-23 한국전자통신연구원 다채널 오디오 신호 처리 장치 및 방법
EP2973551B1 (en) 2013-05-24 2017-05-03 Dolby International AB Reconstruction of audio scenes from a downmix
IN2015MN03262A (zh) 2013-05-24 2015-12-04 Dolby Int Ab
EP2830336A3 (en) * 2013-07-22 2015-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Renderer controlled spatial upmix
US9251549B2 (en) 2013-07-23 2016-02-02 Verance Corporation Watermark extractor enhancements based on payload ranking
US9319819B2 (en) * 2013-07-25 2016-04-19 Etri Binaural rendering method and apparatus for decoding multi channel audio
US9208334B2 (en) 2013-10-25 2015-12-08 Verance Corporation Content management using multiple abstraction layers
CN104681034A (zh) 2013-11-27 2015-06-03 杜比实验室特许公司 音频信号处理
JP6508539B2 (ja) * 2014-03-12 2019-05-08 ソニー株式会社 音場収音装置および方法、音場再生装置および方法、並びにプログラム
JP2017514345A (ja) 2014-03-13 2017-06-01 ベランス・コーポレイション 埋め込みコードを用いた対話型コンテンツ取得
US9779739B2 (en) 2014-03-20 2017-10-03 Dts, Inc. Residual encoding in an object-based audio system
US10037202B2 (en) 2014-06-03 2018-07-31 Microsoft Technology Licensing, Llc Techniques to isolating a portion of an online computing service
US9510125B2 (en) * 2014-06-20 2016-11-29 Microsoft Technology Licensing, Llc Parametric wave field coding for real-time sound propagation for dynamic sources
US10978079B2 (en) 2015-08-25 2021-04-13 Dolby Laboratories Licensing Corporation Audio encoding and decoding using presentation transform parameters
CA3034685A1 (en) * 2016-01-18 2017-07-27 Boomcloud 360, Inc. Subband spatial and crosstalk cancellation for audio reproduction
US10225657B2 (en) 2016-01-18 2019-03-05 Boomcloud 360, Inc. Subband spatial and crosstalk cancellation for audio reproduction
CN108632714B (zh) * 2017-03-23 2020-09-01 展讯通信(上海)有限公司 扬声器的声音处理方法、装置及移动终端
FR3065137B1 (fr) * 2017-04-07 2020-02-28 Axd Technologies, Llc Procede de spatialisation sonore
CN108156575B (zh) * 2017-12-26 2019-09-27 广州酷狗计算机科技有限公司 音频信号的处理方法、装置及终端
US10764704B2 (en) * 2018-03-22 2020-09-01 Boomcloud 360, Inc. Multi-channel subband spatial processing for loudspeakers
US10602298B2 (en) 2018-05-15 2020-03-24 Microsoft Technology Licensing, Llc Directional propagation
US10798515B2 (en) 2019-01-30 2020-10-06 Facebook Technologies, Llc Compensating for effects of headset on head related transfer functions
TWI843389B (zh) 2019-06-14 2024-05-21 弗勞恩霍夫爾協會 音訊編碼器、降混訊號產生方法及非暫時性儲存單元
US10932081B1 (en) 2019-08-22 2021-02-23 Microsoft Technology Licensing, Llc Bidirectional propagation of sound
US12183351B2 (en) 2019-09-23 2024-12-31 Dolby Laboratories Licensing Corporation Audio encoding/decoding with transform parameters
US10841728B1 (en) 2019-10-10 2020-11-17 Boomcloud 360, Inc. Multi-channel crosstalk processing
US12100403B2 (en) * 2020-03-09 2024-09-24 Nippon Telegraph And Telephone Corporation Sound signal downmixing method, sound signal coding method, sound signal downmixing apparatus, sound signal coding apparatus, program and recording medium

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1685763A (zh) * 2002-09-23 2005-10-19 皇家飞利浦电子股份有限公司 声音信号的生成
WO2006008683A1 (en) * 2004-07-14 2006-01-26 Koninklijke Philips Electronics N.V. Method, device, encoder apparatus, decoder apparatus and audio system

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100346963B1 (ko) 1993-05-05 2002-11-13 코닌클리케 필립스 일렉트로닉스 엔.브이. 적어도하나의부호기를포함하는전송시스템
US5771295A (en) * 1995-12-26 1998-06-23 Rocktron Corporation 5-2-5 matrix system
US6198827B1 (en) * 1995-12-26 2001-03-06 Rocktron Corporation 5-2-5 Matrix system
ATE184140T1 (de) 1996-03-07 1999-09-15 Fraunhofer Ges Forschung Codierverfahren zur einbringung eines nicht hörbaren datensignals in ein audiosignal, decodierverfahren, codierer und decodierer
DE19640814C2 (de) 1996-03-07 1998-07-23 Fraunhofer Ges Forschung Codierverfahren zur Einbringung eines nicht hörbaren Datensignals in ein Audiosignal und Verfahren zum Decodieren eines nicht hörbar in einem Audiosignal enthaltenen Datensignals
US6711266B1 (en) 1997-02-07 2004-03-23 Bose Corporation Surround sound channel encoding and decoding
TW429700B (en) 1997-02-26 2001-04-11 Sony Corp Information encoding method and apparatus, information decoding method and apparatus and information recording medium
DE19947877C2 (de) 1999-10-05 2001-09-13 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Einbringen von Informationen in einen Datenstrom sowie Verfahren und Vorrichtung zum Codieren eines Audiosignals
US6725372B1 (en) * 1999-12-02 2004-04-20 Verizon Laboratories Inc. Digital watermarking
JP3507743B2 (ja) 1999-12-22 2004-03-15 インターナショナル・ビジネス・マシーンズ・コーポレーション 圧縮オーディオデータへの電子透かし方法およびそのシステム
US7136418B2 (en) 2001-05-03 2006-11-14 University Of Washington Scalable and perceptually ranked signal coding and decoding
US20030035553A1 (en) * 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
DE10129239C1 (de) 2001-06-18 2002-10-31 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Einbetten eines Wasserzeichens in ein Audiosignal
US7243060B2 (en) 2002-04-02 2007-07-10 University Of Washington Single channel sound separation
AU2003216669A1 (en) 2002-05-10 2003-11-11 Koninklijke Philips Electronics N.V. Watermark embedding and retrieval
JP2005352396A (ja) * 2004-06-14 2005-12-22 Matsushita Electric Ind Co Ltd 音響信号符号化装置および音響信号復号装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1685763A (zh) * 2002-09-23 2005-10-19 皇家飞利浦电子股份有限公司 声音信号的生成
WO2006008683A1 (en) * 2004-07-14 2006-01-26 Koninklijke Philips Electronics N.V. Method, device, encoder apparatus, decoder apparatus and audio system

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109115245A (zh) * 2014-03-28 2019-01-01 意法半导体股份有限公司 多通道换能器设备和其操作方法
CN109115245B (zh) * 2014-03-28 2021-10-01 意法半导体股份有限公司 多通道换能器设备和其操作方法

Also Published As

Publication number Publication date
RU2008142141A (ru) 2010-04-27
KR20080107433A (ko) 2008-12-10
ATE532350T1 (de) 2011-11-15
KR101010464B1 (ko) 2011-01-21
ES2376889T3 (es) 2012-03-20
EP1999999B1 (en) 2011-11-02
PL1999999T3 (pl) 2012-07-31
EP1999999A1 (en) 2008-12-10
RU2407226C2 (ru) 2010-12-20
BRPI0621485A2 (pt) 2011-12-13
US8175280B2 (en) 2012-05-08
US20070223708A1 (en) 2007-09-27
JP2009531886A (ja) 2009-09-03
WO2007110103A1 (en) 2007-10-04
CN101406074A (zh) 2009-04-08
BRPI0621485B1 (pt) 2020-01-14
JP4606507B2 (ja) 2011-01-05

Similar Documents

Publication Publication Date Title
CN101406074B (zh) 解码器及相应方法、双耳解码器、包括该解码器的接收机或音频播放器及相应方法
US8577686B2 (en) Method and apparatus for decoding an audio signal
AU2005324210C1 (en) Compact side information for parametric coding of spatial audio
EP1989920B1 (en) Audio encoding and decoding
TWI415111B (zh) 空間解碼器單元、空間解碼器裝置、音訊系統、消費型電子裝置、產生一對雙耳輸出聲道之方法及電腦可讀媒體
CN101455095B (zh) 在变换域中用于有效的双耳声音空间化的方法和装置
KR100928311B1 (ko) 오디오 피스 또는 오디오 데이터스트림의 인코딩된스테레오 신호를 생성하는 장치 및 방법
US9595267B2 (en) Method and apparatus for decoding an audio signal
CN101185118B (zh) 解码音频信号的方法和装置
MX2008011994A (es) Generacion de mezclas descendentes espaciales a partir de representaciones parametricas de señales de multicanal.

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C53 Correction of patent of invention or patent application
CB02 Change of applicant information

Address after: Amsterdam

Applicant after: Dolby International AB

Co-applicant after: Koninklijke Philips Electronics N.V.

Address before: Stockholm

Applicant before: Dolby Sweden AB

Co-applicant before: Koninklijke Philips Electronics N.V.

COR Change of bibliographic data

Free format text: CORRECT: APPLICANT; FROM: DOLBY SWEDEN AB TO: DOLBY INTERNATIONAL CO., LTD.

C14 Grant of patent or utility model
GR01 Patent grant