CN100594744C - 声音信号的生成 - Google Patents
声音信号的生成 Download PDFInfo
- Publication number
- CN100594744C CN100594744C CN03822586A CN03822586A CN100594744C CN 100594744 C CN100594744 C CN 100594744C CN 03822586 A CN03822586 A CN 03822586A CN 03822586 A CN03822586 A CN 03822586A CN 100594744 C CN100594744 C CN 100594744C
- Authority
- CN
- China
- Prior art keywords
- sound signals
- signal
- related transfer
- transfer functions
- hrtf
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 121
- 230000006870 function Effects 0.000 claims abstract description 69
- 238000012546 transfer Methods 0.000 claims abstract description 65
- 238000000034 method Methods 0.000 claims abstract description 29
- 101100111947 Arabidopsis thaliana CYP72C1 gene Proteins 0.000 abstract 1
- 101150015099 CHIA1 gene Proteins 0.000 abstract 1
- 101100439244 Glycine max CHI2-A gene Proteins 0.000 abstract 1
- 101100166889 Zea mays CHI gene Proteins 0.000 abstract 1
- 101150014959 chi1 gene Proteins 0.000 abstract 1
- 101150071577 chi2 gene Proteins 0.000 abstract 1
- 210000003128 head Anatomy 0.000 description 44
- 230000005540 biological transmission Effects 0.000 description 14
- 238000004891 communication Methods 0.000 description 5
- 210000005069 ears Anatomy 0.000 description 5
- 210000003454 tympanic membrane Anatomy 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 238000000513 principal component analysis Methods 0.000 description 3
- 239000000872 buffer Substances 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004040 coloring Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 210000000883 ear external Anatomy 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000013067 intermediate product Substances 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
- H04S1/002—Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
- H04S1/005—For headphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
- H04S1/007—Two-channel systems in which the audio signals are in digital form
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S5/00—Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/01—Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/01—Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Stereophonic System (AREA)
- Television Signal Processing For Recording (AREA)
Abstract
本发明涉及一种用于从来自具有相关的第二组头部相关传递函数的第二组声音信号(M)中的至少一个输入信号生成至少一个输出信号(HPL,HPR)的方法和媒体系统。该媒体系统可以是TV、CD播放器、DVD播放器、收音机、显示器、放大器、耳机或VCR。所述方法包括下述步骤:为第二组声音信号中的每个信号确定加权关系式(14),该加权关系式包括至少一个来自第三组中间声音信号(CHI1,CHI2)的信号和至少一个加权值(权重);根据第二组声音信号、第二组头部相关传递函数和加权关系式确定第一组头部相关传递函数(HRTF);和借助至少一个来自所述第一组头部相关传递函数的HRTF来转换至少一个来自第三组中间声音信号的信号,以便生成至少一个属于所述第一组声音信号的输出信号。由此,最后,为随后的输入信号向输出信号的转换确定了较少的HRTF。由此,需要很少的卷积运算。
Description
本发明涉及媒体系统中的一种根据来自具有相关的第二组头部相关传递函数的第二组声音信号中的至少一个输入信号来生成至少一个输出信号的方法。
本发明还涉及一种用于实现所述方法的计算机系统。
本发明进一步还涉及一种用于实现所述方法的计算机程序产品。
本发明进一步还涉及一种用于根据来自具有相关的第二组头部相关传递函数的第二组声音信号中的至少一个输入信号来生成来自第一组声音信号中的至少一个输出信号的媒体系统。
WO 01/49073公开了一种模拟外部声源的声音再现系统。该系统使用多个所谓的头部相关传递函数(Head Related TransferFunction)(HRTF),来为一套耳机生成声音。
在本技术领域的文献中一般都可以知道,要合成为输出(即,所得到的声音信号)的声源的输入通道,会需要相对较大数量的HRTF。这一般来说会导致使用所述HRTF来进行系统实现,这是相当昂贵的,需要不必要的卷积,并且设计起来比较复杂。这一点将会借助附图1和2进一步进行讨论,在这些附图中将会借助计算给出使用相应公式和HRTF数量的现有应用系统和本发明。
上述的问题是通过所述方法得到解决的,该方法包括步骤:
为第二组声音信号中的每个信号确定加权关系式,该加权关系式包括至少一个来自第三组中间声音信号的信号和至少一个加权值;
根据第二组声音信号、第二组头部相关传递函数和加权关系式确定第一组头部相关传递函数;和
借助至少一个来自所述第一组头部相关传递函数的HRTF来转换至少一个来自第三组中间声音信号的信号,以便生成至少一个属于所述第一组声音信号的输出信号。
在第一个步骤中,为第二组声音信号中的每个信号,即,为多个输入声音信号中的每个信号,确定一个加权关系式,该关系式由中间声音信号和至少一个加权值构成。从而所述输入声音信号得以转换为用于后续内部应用的中间声音信号。
在第二个步骤中,所述第一组而为新的一组HRTF于是得以根据第二组声音信号(一般为输入声音信号)和所述第二组头部相关传递函数(与所述输入声音信号相关并且起初为变换或转换所述第二组输入声音信号做出过贡献)而确定出来。
优点是,在所述确定过程(将在按照本发明的实施例中进行讨论)中,新的一组HRTF包括比原本对转换输入声音信号做出过贡献的所述第二组头部相关传递函数要少的HRTF。
随后,在第三个步骤中,所述新而较少的HRTF(即,第一组头部相关传递函数)用于生成一个或多个输出信号(属于所述第一组声音信号),这是由于为了获得所述输出信号,来自第三组中间声音信号的一个或多个信号是借助所述新且较少量的HRTF转换的。
所述问题进一步是借助在其上执行所述方法的所述媒体系统而得到解决的。该媒体系统可以为TV、CD播放器、DVD播放器、收音机、具有声音的显示器、放大器、耳机或VCR。
按照优选实施方式,所述媒体系统包括:
用于为第二组声音信号中的每个信号确定加权关系式的装置,加权关系式包括至少一个来自第三组中间声音信号的信号和至少一个加权值;
用于根据第二组声音信号、第二组头部相关传递函数和加权关系式确定第一组头部相关传递函数的装置;和
用于借助至少一个来自所述第一组头部相关传递函数的HRTF来转换至少一个来自第三组中间声音信号的信号、以便生成至少一个属于所述第一组声音信号的输出信号的装置。
由于与前面针对本方法介绍的相同原因,媒体系统给出了同样的优点。
下面将结合优选实施例并且参照附图对现有技术和本发明进行更加全面的解释说明,其中:
附图1表示按照现有技术和按照本发明的由三个输入声音信号生成两个输出声音信号的例子;
附图2表示由一个输入声音信号生成两个输出声音信号;
附图3表示由来自具有相关的第二组头部相关传递函数的第二组输入声音信号的至少一个输入声音信号生成至少一个输出声音信号的方法。
在全部附图中,相同的附图标记和类似的名称表示相同或相应的结构、功能等。
在本发明中,可以使用一组头部相关传递函数(HRTF)来生成一个或多个声音信号。可以将HRFT定义为描述声音如何从特定声源向耳部传播以及属于一组的HRTF的数量的函数,这可以从描述声音从源传播到双耳的一个HRTF到由传送声音的源的数量决定的多个HRTF。可替换地,从少量的(n个)输入信号,可以得出m个中间信号,其需要2乘m个HRTF(m>n),头部相关传递函数(HRTF)可用于将所述输入信号(作为源)扩展为多通道声音(作为中间产物),这些多通道声音然后可以下混合(down mix)成较少的结果输出声音信号,例如,用于耳机的左和右信号。
另外可以在下面的期刊中找到HRTF的介绍:《应用声学(AppliedAcoustics)》,关于听觉环境和遥现的特刊(Special issue onauditory environment and telepresence),第36卷,第3-4期,第171-218页(1992年),H.Moller所著的《双耳听觉技术的基本原理(Fundamentals of binaural technology)》。
下面,将对HRTF加以更加详细的定义。在测定任意声源在耳膜上产生的声压的过程中(考虑到诸如耳朵之间的距离和外耳的形状之类的参数),全部所需的是从声源到耳膜的脉冲响应,这可以例如通过在耳朵中放置麦克风来测量。这称为头部相关脉冲响应,并且其傅立叶变换称为头部相关传递函数(HRTF)。HRTF采集了所有身体暗示以用于对声源定位。一旦得知了针对左耳和右耳的HRTF,就能够从单耳声源合成出精确的双耳信号。头部相关传递函数是公知的,并且在众多文献中进行过介绍,比如Blauert的《空间听觉:人类声音定位的精神物理学(Spatial hearing:The Psychophysics of Human SoundLocalization)》(MIT出版社,剑桥,MA,1983)。当声音经过一组HRTF滤波时,对于该组HRTF所属于的人来说,声音得到了优化,而因此对于除了该组HRTF所属于的人之外的任何人而言,声音感受决不会是最优化的。该组HRTF是具有专用于特定人的参数或系数的滤波函数。对于特定的人来说,取决于上面提到的任意声源、声源和人之间的距离,并且取决于测量函数参数的房间的特性,得到不同的HRTF组。当,例如,声源是耳机时,HRTF取决于通过其进行声音再现的耳机。使用这一函数对声音进行滤波的结果是,在耳机中得到了环绕声的最佳空间再现。声源也可以是一般的扬声器,在这种情况下,需要进行串扰消除,这例如可以根据HRTF来进行。
立体声信号包括左右信号分量,它们可以来源于立体感信号源,例如来源于一组麦克风,例如经由其它的电子器材,比如混音器材而得到。此外,该信号还可以作为来自另一个立体感播放器的输出、作为无线电信号用无线电广播、或通过任何其它适当的手段而接收到。
附图1表示现有技术中和按照本发明的由三个输入声音信号生成两个输出声音信号的例子。在一般的应用中,所述两个声音信号可以包括分配给耳机中的两个扬声器的立体声信号。
首先,按照现有技术,经由耳机再现多通道声音是公知的。这一通过耳机进行的多通道声音再现利用了一种称为双耳听觉的公知技术和头部相关传递函数(HRTF)。术语“双耳听觉(binaural)”指的是这样一种情况:对聆听者的耳朵有两路输入(左和右)。任何一组在耳膜的位置上记录的左和右通道信号都称为双耳听觉信号。
意图是,在使用耳机的时候与在扬声器进行播放的时候一样,在耳膜处得到相同的声音。为了实现这一意图,必须要搜集更多的有关声源向耳膜传播的知识。这种传输以头部相关传递函数(HRTF)的形式得到了最好的描述,该函数包含任意线性滤波,比如染色(coloration)和耳间时间(inter-aural time)及声谱差。耳间时间差的出现是因为声波是以不同的距离传输到左耳和右耳的。这些传递函数取决于入射的角度和到声源的距离。
回过头来看附图,附图标记1、2和3表示对应的三个通道(即,三个输入声音信号)CH1、CH2和CH3,这三个通道合成用于耳机的左(HPL)和右(HPR)结果(输出)声音信号。所述通道各自借助三个相关的头部相关传递函数(附图标记4到9)得以传输。换句话说,CH1是借助头部相关传递函数HRTF1进行发送的,相应地CH2是借助头部相关传递函数HRTF2得以发送的,等等。这是针对两个通道进行的,以便通过对通道与相关HRTF的乘积进行求和(附图标记10和11)来实现立体声信号的生成。所述立体声(输出)信号由左(HPL)(附图标记12)和右(HPR)(附图标记13)表示为两个结果声音信号。
对左结果信号的求和于是为:
HPL=CH1·HRTF1,L+CH2·HRTF2,L+CH3·HRTF3,L (1)
相应地,对右结果声音信号的求和于是为:
HPR=CH1·HRTF1,R+CH2·HRTF2,R+CH3·HRTF3,R (2)
这样,在现有技术的情况下,这一传输需要二乘以三个,即,六个头部相关传递函数。
一般来说,在本申请的所有部分中,如果上面提到的变量是频域变量,则符号“·”表示相乘;而在时域中,“·”表示变量的卷积运算。
一般地并且相应地,在对现有技术的例子,n=3个声源的(输入)通道(CH1到CH2)进行扩展以组合出m个声音输出(即m个结果声音信号)时,将会需要n乘以m个头部相关传递函数。
其次,按照本发明的优选实施例,可以以不同的方式来实现与现有技术的例子相同的传输。为了延续这个例子,将会对同样三个通道(CH1、CH2和CH3)进行讨论。就是,这些通道可以是左和右(中间)通道的线性组合或使用加权系数α和β的加权形式。所述α和β可以使它们的加权值取决于各自的通道(即,L和R),这样,一般来说:
CHi=αi·L+βi·R. (3)
在对超过两个通道(L,R)应用本发明时,例如对第三个、第四个通道等,即C、D等应用本发明时,本领域的技术人员可以随后将公式(3)推广为:
CHi=αi·L+βi·R+ci·C+di·D等,用于针对相应的扬声器或最终声音的相应的较大数量的结果(输出)声音信号(HPL、HPR、HPC、HPD等)。
在由Roy Irwan和Ronald M.Aarts(菲利普研究中心(PhilipsResearch Laboratories))于2001年6月21-24日在德国SchlossElmau召开的第19届国际会议上提交的《音响工程协会会议论文(Sound Engineering Society Conference Paper)》中,公开了一种将立体声变换为多通道声音的方法。在这篇论文中(在第3页上),分别为左和右通道使用了在时刻k的相应的WL(k)和WR(k)(加权)记法定义了所述α和β′。
为了简明,在这个例子中仅使用两个通道的(结果(输出)声音信号)。
延续附图1中的现有技术的例子,不过是按照下述方式在本发明的优选的第一实施例中实施的:
CH1=α1·L+β1·R (4)
CH2=α2·L+β2·R (5)
CH3=α3·L+β3·R (6)
我们发现,公式(1)和(2)仍然适用于(通道与相关HRTF乘积的)求和,这样当把(4)、(5)和(6)代入到(1)和(2)中时,得出:
HPL=(α1·L+β1·R)·HRTF1,L+(α2·L+β2·R)·HRTF2,L+(α3·L+β3·R)·HRTF3,L (7)
HPR=(α1·L+β1·R)·HRTF1,R+(α2·L+β2·R)·HRTF2,R+(α3·L+β3·R)·HRTF3,R (8)
或者采取不同的方式表达为:
HPL=L·(α1·HRTF1,L+α2·HRTF2,L+α3·HRTF3,L)+R·(β1·HRTF1,L+β2·HRTF2,L+β3·HRTF3,L); (9)
从而
HPR=L·(α1·HRTF1,R+α2·HRTF2,R+α3·HRTF3,R)+R·(β1·HRTF1,R+β2·HRTF2,R+β3·HRTF3,R); (10)
不过,请注意,目前为止关于本发明所讨论的HRTF仅仅用作公式中的中间变量,没有并且也没有必要与关于按照实际的头部相关传递函数实现的所述现有技术的讨论相反。
或者对于i=3,即,以归纳的形式:
这样,仅需要两个滤波器用于左耳机驱动器HPL以便分别对左和右信号进行滤波,这是因为公式(11)中的因子∑(αi·HRTFi,L)和∑(βi·HRTFi,L)可以各自看作一个滤波器。
相应地,就公式12而言,∑(αi·HRTF1,R)和∑(βi·HRTFi,R)是用于右耳机驱动器HPR的两个滤波器。
这样,就仅需要两个滤波器来对用于右耳机驱动器的左和右信号进行滤波。
这样,在继续进行按照本发明的有三个输入声道的实现方式时,传输现在仅需要二乘二,即,四个头部相关传递函数了。与附图1的现有技术的例子相比,按照现有技术需要六个头部相关传递函数,而要实现相同的传输,本发明需要更少的头部相关传递函数。
相应地,为了实现相同的传输,需要更少的卷积运算。
换句话说,当由现有技术开始并且按照现有技术对该例子进行进一步推广时,以声音信号的简单级联方式,例如,在m=2(即,立体声、双输出通道或信号,例如用于两个耳机驱动器)的情况下,n=5个输入通道或声音信号(CH1到CH5)将会需要总数为2乘5个,即10个HRTF(按照现有技术),而按照本发明的第一实施例,仅需要四个头部相关传递函数来实现相同的传输。
附图2表示由一个输入声音信号产生两个输出声音信号。所述两个声音信号在一般的应用中仍然可以包括分配给耳机中的两个扬声器的立体声信号,不过在这个作为本发明的第二实施例的例子中,仅对只有一个输入声音信号的声源M的情况进行讨论。
首先,将通过HRTF所使用的计算过程来讨论现有技术:
现有技术适用于仅有一个输入通道(如附图中所示)的情况,即,一个输入声源M并且然后分配为两个结果(输出)声音信号HPL、HPR。与附图1相比并且按照附图1,原则上所使用的通道减少了一个(即,CH3);相应地,按照现有技术,对左结果(输出)声音信号的求和为:
HPL=CH1·HRTF_L,l+CH2·HRTF_R,l (13)
并且,相应地,对右结果(输出)声音信号的求和于是就是:
HPR=CH1·HRTF_L,r+CH2·HRTF_R,r (14)
这里,第一个大写字母符号L和R分别为各个扬声器通道,而第二个小写字母l对应于左耳,r对应于右耳。
这样,在现有技术的情况下,这一传输需要二乘二个,即,四个头部相关传递函数。
其次,将对按照本发明的第二实施例,即附图2进行讨论:
想象使用两个输出声道HPL和HPR将一个在录音棚中(移动)的歌唱者“M”的歌声记录到CD上。
通过采用主成分分析,可以还原出必需的阿尔法,即αi(如下面的公式15中所示)。由此可使用两个通道来确定出歌唱者在扬声器中间的连线上的位置。可以是这样的情况,阿尔法是时变的。
在Prentice-Hall出版公司(新泽西)1999年出版的《神经网络(Neural Networks)》(第二版)中由S.Haykin所著的《主成分分析(Principal Component Analysis)》中可以找到对主成分分析的一般性讨论,该一般性讨论在前面提到的文章《将立体声变换为多通道的方法(A method to convert stereo to multi-channel)》中得到了采用。
单一的声(输入)源M可以处于两个扬声器之间的任何位置上。例如,在录音棚中对歌唱者M在两个通道(或者甚至更多的通道)之间的进行声像单位控制(pan-pot)电位计移动立体声录音,从而左中间通道(CHI1)可以表示为αi1·M而右中间通道(CHI2)可以表示为αi2·M,这样:
CHI1=αi1·M and CHI2=αi2·M (15)
不过,请注意,就本发明而言,对这一特定的实施例,所述通道(CHI1和CHI2)仅用作公式中的中间通道(变量),并且与针对现有技术进行的讨论(即,CH1、CH2)不同,并不是实际的通道。
换句话说,就本发明而言,将左和右(中间通道)映射到了一个通道M上。
所以,从现有技术变换到按照附图2的本发明的另一种实施例,公式13和14可以表示为:
HPL=αi1·M·HRTF_L,l+αi2·M·HRTF_R,l (16)
HPR=αi1·M·HRTF_L,r+αi2·M·HRTF_R,r (17)
或
HPL=M·(αi1·HRTF_L,l+αi2·HRTF_R,l) (18)
HPR=M·(αi1·HRTF_L,r+αi2·HRTF_R,r) (19)
或
HPL=M·H_1 (20)
HPR=M·H_2 (21)
其中,
H_1=(αi1·HRTF_L,l+αi2·HRTF_R,l) (22)
并且
H_2=(αi1·HRTF_L,r+αi2·HRTF_R,r) (23)
这表面,本发明仅仅需要两个卷积运算或HRTF,这是由于公式20和21中的因子(H_1,H_2)分别被各自看作一个HRTF滤波器。
这样,传输现在将仅需要两个头部相关传递函数。与需要四个头部相关传递函数的现有技术相比,对于从一个(输入)声源M实现相同的传输,本发明需要更少的头部相关传递函数(和相应的卷积运算)。
不过,所述仅将两个输出通道映射到一个通道上的第二实施例是非常简单的,该第二实施例可以推广到将多于两个通道映射到一个通道上(通过相应的α),下面就此进行讨论:
专利申请WO 0207481:用于得出立体声环绕和/或音频中央信号的多通道立体声变换器(Multi-channel stereo converter forderiving a stereo surround and/or audio centre signal),皇家飞利普电子有限公司(Koninklijke Philips Electronics N.V.),发明人:Irwan,Roy;AARTS,Ronaldus,M.,申请号:EP 0107757,于2001年7月5日提交,A2于2002年1月24日公开,其中使用主成分分析将两个通道(L,R)映射到了一个C或者中央通道上,并且在C.Faller和F.Baumgartner所著的《应用于立体声和多通道音频压缩的双耳听觉提示编码(Binaural cue coding applied to stereo andmulti-channel audio compression)》(Convention paper 5574(L-6)of the 112th AES Convention Munich,Germany,Audio Eng.Soc.(第112届AES会议的会议论文5574(L-6),德国慕尼黑,音频工程师协会),2002年5月)中也介绍了上述技术。
在按照上述两种实施例实施本发明时,本领域的技术人员可以从带有声音输入和输出的通用(HRTF)功能块的角度结合或看待这些实施例。换句话说,所述实施例可用于级联耦合声音信号。换句话说,HPL和HPR不是从一个功能块输出的声音信号,而是可以通过级联将它们输入给另一个功能块。
一般来说,遍及本申请的所述公式可以在媒体系统中实现,比如TV、CD播放器、DVD播放器、收音机、显示器、放大器或VCR。这一点可借助附图2的附图标记20表明。不过,按照可替换的或是附加的方式,可以是这样一种情况,即所述公式可以集成到适用于嵌入到具有足够处理能力的耳机里的电路(或软件)中。
在附图中,用带有箭头的线画出了通道之间的传输,(输入声音信号)CH及M到其它中间声道以及到结果(输出)声音信号或通道。这些线表明,传输可以借助适于实现声音数据传输的电路(例如,通过有线或无线数据链路)来进行。这种传输的例子可以是各种不同的发射机,例如,包括网络接口的发射机、网卡、无线电发射机、用于其它适当电磁信号的发射机(比如用于发射红外光的LED)、例如通过IrDa端口、基于无线电的通信、例如通过蓝牙收发机等等。其它的适当发射机的例子包括线缆调制解调器、电话调制解调器、综合业务数字网(ISDN)适配器、数字订户线路(DSL)适配器、卫星收发机、以太网适配器等等。相应地,通信通道可以是任何适当的有线或无线数据链路,例如基于分组的通信网络(比如因特网或其它的TCP/IP网络)的链路、近程通信链路(比如红外链路)、蓝牙连接或其它的基于无线电的链路。
通信通道的其它例子包括计算机网络和无线电信网络,比如蜂窝数字分组数据(CDPD)网络、全球移动通信系统(GSM)网络、码分多址(CDMA)网络、时分多址(TDMA)网络、通用分组无线业务(GPRS)网络、第三代网络(比如UMTS网络)等等。
附图3表示从来自具有相关的第二组头部相关传递函数的第二组输入声音信号中的至少一个输入信号来生成至少一个输出声音信号的方法。所述生成可以在媒体系统中进行,比如TV、CD播放器、DVD播放器、收音机、显示器、放大器、耳机和VCR中进行。
按照本方法的典型应用形式(或者内建在诸如所述媒体系统这样的设备中),所述输出声音信号可以属于第一组输出声音信号,例如,诸如送到耳机或其它扬声器的HPL或HPR这样的一个或多个输出。反之,所述第二组声音信号可以是诸如CH1、CH2...CHn和M这样的输入。不过,在具有HRTF功能块的声音信号级联链中,可以根据声音信号进入(作为输入)或离开(作为输出)级联耦合的声音信号块,将所述(输入)声音信号看作用作如输入或输出的通用声音信号。换句话说,从一个功能块输出的声音信号可以输入(声音信号)到另一个功能块,反之亦然。
根据已经做过讨论的实施例,所述第二组头部相关传递函数(与所述输入声音信号相关)可以包括当初对变换或转换所述第二组输入声音信号做出过贡献的头部相关传递函数(比如HRTF_L,l、HRTF_R,l、HRTF_L,r、HRTF_R,r、HRTF1,L、HRTF2,L、HRTF3,L...HRTF1,R、HRTF2,R...等)。
在步骤90中,按照本发明的优选实施例的方法开始。将记载与处理的声音信号相对应的HRTF、输入和中间声道、输出声道、权重等的变量、标志、缓冲区等设置为缺省值。当该方法第二次开始时,仅仅将遭到破坏的变量、标志、缓冲区等重新设置为缺省值。
继续进行该方法的介绍,在步骤100中,可以为第二组(输入)声音信号中的每个信号确定一个加权关系式。所述加权关系式可以包括至少一个来自第三组中间声音信号的信号,比如L和R;CH1和CH2,它们分别(按照已经讨论过的两种实施例)具有对应的加权值。
如在本发明的实施例中所讨论的,按照第一实施例,一个例子可以是,CHi(即,i个输入声音信号中的每一个)=αi·L+βi·R,其中αi和βi是加权值,而L和R各自为来自所述第三组中间声音信号的信号。
按照第一实施例,借助比现有技术少的HRTF,对比(所产生的)输出声音信号多的输入声音信号进行了处理。
按照在本发明的实施例中进一步进行的讨论,按照第二实施例,另一个例子可以是CHI1=αi1·M和CHI2=αi2·M,其中αi1和αi2各自为加权值,而其中CHI1和CHI2是相应的该第二实施例的中间声音信号。
按照第二实施例,与第一实施例相对,借助比现有技术更少的HRTF,对总地来说比所生成的输出声音信号(在例二中)少的输入声音信号(在例一中)进行了处理。
在步骤200中,可以确定第一(新生成的)组头部相关传递函数。所述第一组(头部相关传递函数)可以基于第二组声音信号(即,输入声音信号)、第二组头部相关传递函数(如现有技术中所讨论和使用的)和新确定的加权关系式。换句话说,所述第一新组头部相关传递函数是为了在下面的步骤中借助它随后对中间声音信号进行变换的目的而生成的。该确定过程考虑了第二组声音信号(即,输入信号,比如诸如CH1、CH2...CHn和M这样的声音信号(一般作为输入))和所述第二组头部相关传递函数(当初为变换和转换所述第二组输入声音信号做出过贡献的头部相关传递函数)。此外,所述确定过程对应于用于解释本发明的两种实施例的公式,对具有对应的中间信号(L、R等)的所述加权关系式(CHi=αi·L+βi·R等)进行考虑。
在步骤300中,可以借助来自所述第一组(新生成的头部相关传递函数)的至少一个HRTF对来自所述第三组中间声音信号(L、R、CHI1、CHI2)的至少一个信号进行转换,以便生成属于所述第一组输出声音信号(HPL、HPR)的至少一个信号(作为输出信号)。就这点而言,新生成的HRTF,即,所述第一组头部相关传递函数(∑(αi·HRTFi,R)、∑(βi·HRTFi,R)、H_1、H_2等)可以用于,对一个或多个中间声音信号进行实际转换和变换(卷积),这些中间信号比如为L,R(第一实施例)或CHI1和CHI2(第二实施例)。结果,于是产生了输出声音信号HPL、HPR其中至少之一。
因此,本发明的优点是,总地来说,与现有技术相比,将会通过较少HRTF和卷积运算来实现所述生成过程。
通常,只要媒体系统加电,该方法就会整个重新开始。另外,该方法可以在步骤400终止;不过,当媒体系统再次加电等时,该方法可以从步骤100开始进行。
计算机可读介质可以是磁带、光盘、数字通用盘(DVD)、激光唱盘(可记录CD或可写CD)、迷你盘、硬盘、软盘、智能卡、PCMCIA卡等。
在权利要求书中,置于括号中的任何附图标记皆不应理解为是对权利要求的限定。词“包括”并不排除存在权利要求中未列出的元件或步骤的情况。置于元件之前的词“一个”或“一”并不排除存在多个此种元件的情况。
本发明可以借助包括数个性质不同的元件的硬件来实现,并且可以借助适当编程的计算机来实现。在列举出数个装置的产品权利要求中,这些装置中的若干个可以通过同一个硬件项来实现。在相互不同的从属权利要求中记载特定手段的这一纯粹现象并不表示这些手段的结合形式不能用于实现优点。
Claims (5)
1.一种在媒体系统中从来自具有相关的第二组头部相关传递函数的第二组声音信号中的至少一个输入信号生成来自第一组声音信号的至少一个输出信号的方法,所述方法包括下述步骤:
为第二组声音信号中的每个信号确定加权关系式,所述加权关系式包括至少一个来自第三组中间声音信号的信号和至少一个加权值;
根据第二组声音信号、第二组头部相关传递函数和加权关系式,确定第一组头部相关传递函数;和
借助来自所述第一组头部相关传递函数的至少一个头部相关传递函数来转换至少一个来自第三组中间声音信号的信号,以便生成至少一个属于所述第一组声音信号的输出信号。
2.按照权利要求1所述的方法,其特征在于,第二组声音信号中的每个信号CHi由CHi=αi·L+βi·R确定,其中αi和βi各自为加权值,并且其中L和R各自为来自所述第三组中间声音信号的信号。
3.按照权利要求1所述的方法,其特征在于,CHI1=αi1·M和CHI2=αi2·M,其中αi1和αi2各自为加权值,M为单一的声输入源,并且其中CHI1和CHI2各自为来自所述第三组中间声音信号的信号。
4.一种计算机系统,用于从来自具有相关的第二组头部相关传递函数的第二组声音信号中的至少一个输入信号生成来自第一组声音信号的至少一个输出信号,所述计算机系统包括:
用于为第二组声音信号中的每个信号确定加权关系式的装置,所述加权关系式包括至少一个来自第三组中间声音信号的信号和至少一个加权值;
用于根据第二组声音信号、第二组头部相关传递函数和加权关系式确定第一组头部相关传递函数的装置;和
用于借助来自所述第一组头部相关传递函数的至少一个头部相关传递函数来转换至少一个来自第三组中间声音信号的信号、以便生成至少一个属于所述第一组声音信号的输出信号的装置。
5.一种媒体系统,用于从来自具有相关的第二组头部相关传递函数的第二组声音信号中的至少一个输入信号生成来自第一组声音信号的至少一个输出信号,所述媒体系统包括:
用于为第二组声音信号中的每个信号确定加权关系式的装置,所述加权关系式包括至少一个来自第三组中间声音信号的信号和至少一个加权值;
用于根据第二组声音信号、第二组头部相关传递函数和加权关系式确定第一组头部相关传递函数的装置;和
用于借助来自所述第一组头部相关传递函数的至少一个头部相关传递函数来转换至少一个来自第三组中间声音信号的信号、以便生成至少一个属于所述第一组声音信号的输出信号的装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP02078943 | 2002-09-23 | ||
EP02078943.4 | 2002-09-23 | ||
PCT/IB2003/004002 WO2004028204A2 (en) | 2002-09-23 | 2003-09-16 | Generation of a sound signal |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1685763A CN1685763A (zh) | 2005-10-19 |
CN100594744C true CN100594744C (zh) | 2010-03-17 |
Family
ID=32011013
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN03822586A Expired - Lifetime CN100594744C (zh) | 2002-09-23 | 2003-09-16 | 声音信号的生成 |
Country Status (9)
Country | Link |
---|---|
US (2) | US7489792B2 (zh) |
EP (1) | EP1547436B1 (zh) |
JP (1) | JP4399362B2 (zh) |
KR (1) | KR101016975B1 (zh) |
CN (1) | CN100594744C (zh) |
AU (1) | AU2003260841A1 (zh) |
DE (1) | DE60328402D1 (zh) |
ES (1) | ES2328922T3 (zh) |
WO (1) | WO2004028204A2 (zh) |
Families Citing this family (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4399362B2 (ja) * | 2002-09-23 | 2010-01-13 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 音声信号の生成 |
JP4694763B2 (ja) * | 2002-12-20 | 2011-06-08 | パイオニア株式会社 | ヘッドホン装置 |
JP2008502200A (ja) * | 2004-06-04 | 2008-01-24 | サムスン エレクトロニクス カンパニー リミテッド | ワイドステレオ再生方法及びその装置 |
KR100725818B1 (ko) | 2004-07-14 | 2007-06-11 | 삼성전자주식회사 | 최적 가상음원을 제공하는 음향재생장치 및 음향재생방법 |
US8627213B1 (en) * | 2004-08-10 | 2014-01-07 | Hewlett-Packard Development Company, L.P. | Chat room system to provide binaural sound at a user location |
US7634092B2 (en) * | 2004-10-14 | 2009-12-15 | Dolby Laboratories Licensing Corporation | Head related transfer functions for panned stereo audio content |
EP1825713B1 (en) | 2004-11-22 | 2012-10-17 | Bang & Olufsen A/S | A method and apparatus for multichannel upmixing and downmixing |
EP1691348A1 (en) * | 2005-02-14 | 2006-08-16 | Ecole Polytechnique Federale De Lausanne | Parametric joint-coding of audio sources |
JP4988717B2 (ja) | 2005-05-26 | 2012-08-01 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号のデコーディング方法及び装置 |
CN101185118B (zh) * | 2005-05-26 | 2013-01-16 | Lg电子株式会社 | 解码音频信号的方法和装置 |
US8577686B2 (en) * | 2005-05-26 | 2013-11-05 | Lg Electronics Inc. | Method and apparatus for decoding an audio signal |
RU2419249C2 (ru) | 2005-09-13 | 2011-05-20 | Кониклейке Филипс Электроникс Н.В. | Аудиокодирование |
KR100708196B1 (ko) | 2005-11-30 | 2007-04-17 | 삼성전자주식회사 | 모노 스피커를 이용한 확장된 사운드 재생 장치 및 방법 |
TWI344638B (en) | 2006-01-19 | 2011-07-01 | Lg Electronics Inc | Method and apparatus for processing a media signal |
KR100829870B1 (ko) * | 2006-02-03 | 2008-05-19 | 한국전자통신연구원 | 멀티채널 오디오 압축 코덱의 음질 평가 장치 및 그 방법 |
WO2007091848A1 (en) | 2006-02-07 | 2007-08-16 | Lg Electronics Inc. | Apparatus and method for encoding/decoding signal |
EP1989920B1 (en) * | 2006-02-21 | 2010-01-20 | Koninklijke Philips Electronics N.V. | Audio encoding and decoding |
CN101406074B (zh) * | 2006-03-24 | 2012-07-18 | 杜比国际公司 | 解码器及相应方法、双耳解码器、包括该解码器的接收机或音频播放器及相应方法 |
US8027479B2 (en) | 2006-06-02 | 2011-09-27 | Coding Technologies Ab | Binaural multi-channel decoder in the context of non-energy conserving upmix rules |
FR2903562A1 (fr) * | 2006-07-07 | 2008-01-11 | France Telecom | Spatialisation binaurale de donnees sonores encodees en compression. |
US7876904B2 (en) * | 2006-07-08 | 2011-01-25 | Nokia Corporation | Dynamic decoding of binaural audio signals |
KR20080079502A (ko) * | 2007-02-27 | 2008-09-01 | 삼성전자주식회사 | 입체음향 출력장치 및 그의 초기반사음 생성방법 |
US10425747B2 (en) | 2013-05-23 | 2019-09-24 | Gn Hearing A/S | Hearing aid with spatial signal enhancement |
EP2806661B1 (en) * | 2013-05-23 | 2017-09-06 | GN Resound A/S | A hearing aid with spatial signal enhancement |
US9226090B1 (en) * | 2014-06-23 | 2015-12-29 | Glen A. Norris | Sound localization for an electronic call |
US10129681B2 (en) * | 2015-03-10 | 2018-11-13 | Ossic Corp. | Calibrating listening devices |
US9967693B1 (en) * | 2016-05-17 | 2018-05-08 | Randy Seamans | Advanced binaural sound imaging |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0107757A1 (de) | 1982-09-28 | 1984-05-09 | Robert Bosch Gmbh | Vorrichtung zur Ausleuchtung passiver Anzeigen |
DE4237710A1 (en) * | 1991-11-07 | 1993-05-13 | Koenig Florian | Improving head related sound characteristics for TV audio signal playback - using controlled audio signal processing for conversion into stereo audio signals |
US5572591A (en) * | 1993-03-09 | 1996-11-05 | Matsushita Electric Industrial Co., Ltd. | Sound field controller |
US5742689A (en) * | 1996-01-04 | 1998-04-21 | Virtual Listening Systems, Inc. | Method and device for processing a multichannel signal for use with a headphone |
WO1997025834A2 (en) * | 1996-01-04 | 1997-07-17 | Virtual Listening Systems, Inc. | Method and device for processing a multi-channel signal for use with a headphone |
US6067361A (en) * | 1997-07-16 | 2000-05-23 | Sony Corporation | Method and apparatus for two channels of sound having directional cues |
US6990205B1 (en) * | 1998-05-20 | 2006-01-24 | Agere Systems, Inc. | Apparatus and method for producing virtual acoustic sound |
EP1208725B1 (en) | 1999-12-24 | 2009-06-03 | Koninklijke Philips Electronics N.V. | Multichannel audio signal processing device |
EP1201101A2 (en) | 1999-12-24 | 2002-05-02 | Koninklijke Philips Electronics N.V. | Headphones with integrated microphones |
WO2002007481A2 (en) | 2000-07-19 | 2002-01-24 | Koninklijke Philips Electronics N.V. | Multi-channel stereo converter for deriving a stereo surround and/or audio centre signal |
JP4399362B2 (ja) * | 2002-09-23 | 2010-01-13 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 音声信号の生成 |
-
2003
- 2003-09-16 JP JP2004537424A patent/JP4399362B2/ja not_active Expired - Lifetime
- 2003-09-16 KR KR1020057004893A patent/KR101016975B1/ko not_active Expired - Lifetime
- 2003-09-16 US US10/528,489 patent/US7489792B2/en not_active Ceased
- 2003-09-16 US US12/725,693 patent/USRE43273E1/en not_active Expired - Lifetime
- 2003-09-16 CN CN03822586A patent/CN100594744C/zh not_active Expired - Lifetime
- 2003-09-16 AU AU2003260841A patent/AU2003260841A1/en not_active Abandoned
- 2003-09-16 EP EP03797465A patent/EP1547436B1/en not_active Expired - Lifetime
- 2003-09-16 DE DE60328402T patent/DE60328402D1/de not_active Expired - Lifetime
- 2003-09-16 ES ES03797465T patent/ES2328922T3/es not_active Expired - Lifetime
- 2003-09-16 WO PCT/IB2003/004002 patent/WO2004028204A2/en active Application Filing
Also Published As
Publication number | Publication date |
---|---|
WO2004028204A2 (en) | 2004-04-01 |
ES2328922T3 (es) | 2009-11-19 |
US20060045274A1 (en) | 2006-03-02 |
USRE43273E1 (en) | 2012-03-27 |
KR101016975B1 (ko) | 2011-02-28 |
EP1547436B1 (en) | 2009-07-15 |
AU2003260841A8 (en) | 2004-04-08 |
AU2003260841A1 (en) | 2004-04-08 |
KR20050043985A (ko) | 2005-05-11 |
JP4399362B2 (ja) | 2010-01-13 |
US7489792B2 (en) | 2009-02-10 |
EP1547436A2 (en) | 2005-06-29 |
CN1685763A (zh) | 2005-10-19 |
JP2006500817A (ja) | 2006-01-05 |
WO2004028204A3 (en) | 2004-07-15 |
DE60328402D1 (de) | 2009-08-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100594744C (zh) | 声音信号的生成 | |
US7382885B1 (en) | Multi-channel audio reproduction apparatus and method for loudspeaker sound reproduction using position adjustable virtual sound images | |
EP1194007B1 (en) | Method and signal processing device for converting stereo signals for headphone listening | |
EP1971978B1 (en) | Controlling the decoding of binaural audio signals | |
CN100586227C (zh) | 立体声扩展网络中的输出均衡 | |
AU2008362920B2 (en) | Method of rendering binaural stereo in a hearing aid system and a hearing aid system | |
US20070160219A1 (en) | Decoding of binaural audio signals | |
CN101112120A (zh) | 处理多声道音频输入信号以从其中产生至少两个声道输出信号的装置和方法、以及包括执行该方法的可执行代码的计算机可读介质 | |
WO2007080225A1 (en) | Decoding of binaural audio signals | |
CN1839663B (zh) | 音频立体声处理方法、设备和系统 | |
US6700980B1 (en) | Method and device for synthesizing a virtual sound source | |
US6563869B1 (en) | Digital signal processing circuit and audio reproducing device using it | |
JP2008502200A (ja) | ワイドステレオ再生方法及びその装置 | |
EP4264962A1 (en) | Stereo headphone psychoacoustic sound localization system and method for reconstructing stereo psychoacoustic sound signals using same | |
KR20080078907A (ko) | 양 귀 오디오 신호들의 복호화 제어 | |
CN101656525A (zh) | 一种获得滤波器的方法和滤波器 | |
WO2007080224A1 (en) | Decoding of binaural audio signals | |
Horiuchi et al. | Adaptive estimation of transfer functions for sound localization using stereo earphone-microphone combination |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CX01 | Expiry of patent term | ||
CX01 | Expiry of patent term |
Granted publication date: 20100317 |