CN1159691A - 用于声频信号线性预测分析的方法 - Google Patents
用于声频信号线性预测分析的方法 Download PDFInfo
- Publication number
- CN1159691A CN1159691A CN96121556A CN96121556A CN1159691A CN 1159691 A CN1159691 A CN 1159691A CN 96121556 A CN96121556 A CN 96121556A CN 96121556 A CN96121556 A CN 96121556A CN 1159691 A CN1159691 A CN 1159691A
- Authority
- CN
- China
- Prior art keywords
- signal
- filter
- transfer function
- level
- short
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 230000005236 sound signal Effects 0.000 title claims description 68
- 238000012546 transfer Methods 0.000 claims abstract description 81
- 238000004458 analytical method Methods 0.000 claims abstract description 65
- 230000015572 biosynthetic process Effects 0.000 claims description 80
- 238000003786 synthesis reaction Methods 0.000 claims description 77
- 238000001914 filtration Methods 0.000 claims description 40
- 238000001228 spectrum Methods 0.000 claims description 39
- 230000005284 excitation Effects 0.000 claims description 38
- 238000012545 processing Methods 0.000 claims description 34
- 238000005086 pumping Methods 0.000 claims description 25
- PMOWTIHVNWZYFI-WAYWQWQTSA-N cis-2-coumaric acid Chemical compound OC(=O)\C=C/C1=CC=CC=C1O PMOWTIHVNWZYFI-WAYWQWQTSA-N 0.000 claims description 15
- 230000014509 gene expression Effects 0.000 claims description 15
- 230000003595 spectral effect Effects 0.000 abstract description 8
- 101150060088 ampp gene Proteins 0.000 abstract 1
- 230000006870 function Effects 0.000 description 53
- 230000004044 response Effects 0.000 description 10
- 239000000203 mixture Substances 0.000 description 9
- 230000006978 adaptation Effects 0.000 description 7
- 230000007774 longterm Effects 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 6
- 230000006872 improvement Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000011002 quantification Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 239000002131 composite material Substances 0.000 description 2
- 230000000873 masking effect Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 102100029469 WD repeat and HMG-box DNA-binding protein 1 Human genes 0.000 description 1
- 101710097421 WD repeat and HMG-box DNA-binding protein 1 Proteins 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000000875 corresponding effect Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000005428 wave function Effects 0.000 description 1
- 230000003313 weakening effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
用线性预测分析方法去确定代表声频信号频谱包络的频谱参数。该法包括q个相继的预测级(5p),q是大于1的整数。在每个预测级P(1≤p≤q),都确定代表所述级输入信号的Mp个线性预测系数a1 P,…aMP P的参数。要分析的声频信号构成第一级的输入信号。第p+1级的输入信号(SP(n)由第p级输入信号(Sp-1(n))经过一个有下述转移函数的滤波器滤波后组成:
Description
本发明涉及一种用于对声频信号进行线性预测分析的方法。该方法在预测声频信号编码器方面,尤其在以CELP(编码受激线性预测)编码器为其最普及型的分析-综合编码器方面,获得一种特殊的,但不是唯一的应用。
分析-综合预测编码技术目前很广泛地用于对电话频带(300-3400Hz)的语音以低达8kbit/s的速率进行编码,而同时保持电话质量。对于(20KHz量级的)声频频带,有一些采用变换编码技术的应用,它们涉及播出和存储一些语音和音乐信号。然而,这些技术具有相当大的编码延迟(大于100ms),尤其当它们参与那些交互作用很重要的组合通信时会发生更大的困难。预测技术只产生较小的延迟,它主要取决于线性预测分析帧的长度(一般为10至20ms);由于这个缘故,甚至在对频带宽度大于电话频带的语音和/或音乐信号进行编码时,它们也可获得应用。
用于位速率压缩的预测编码器,可将信号的频谱包络模型化。这种建模起因于M阶(一般说来窄频带的M≈10)的线性预测分析,其要点在于确定输入信号的M个线性预测系数ai。这些系数表征一个译码器中使用的综合滤波器,其转移函数是1/A(z)形式的,其中
同语音编码相比,线性预测分析具有较宽的综合应用领域。在某些应用中,对于线性预测分析打算获得的那些变量来说,预测阶M可构成这些变量之一,这一变量是受所分析的信号的频谱中存在的峰数影响的(参阅US-A-5,142,581)。
用线性预测分析计算的滤波器可以有各种各样的结构,从而对用于表示诸系数的参数(系数ai本身,LAR、LSF、LSP参数,反射或PARCOR系数等)有不同的选择。在数字信号处理器(DSP)出现之前,一些递归结构通常用于计算滤波器,此类结构的例子有,采用F.Itakura和S.Saito在下述文章中描述的那种PARCOR系数的结构:“用于语音分析与综合的数字滤波技术”,第7届国际声学会议论文集,布达佩斯1971,261-264页(参见FR-A-2,284,946,或US-A-3,975,587)。
在分析-综合编码器中,诸系数ai也用于构造一个由编码器使用的感知加权滤波器,以确定一个为了获得代表语音信号的综合信号而加给短期综合滤波器的激励信号。这种感知加权可强化那些编码错误最可觉察的频谱段,也就是说相互共振峰段。感知加权滤波器的转移函数W(z)通常有下式的形式:
式中γ1和γ2是两个频谱扩展系数,使0≤γ2≤γ1≤1.E.Ordentlich和Y.Shoham在其下述文章中对噪声掩蔽问题提供一种改进意见:“在32Kbps下的宽频带语音的低-延迟代码-受激线性预测编码”,Proc.ICASSP,Toronto,May1991,pages9-12。对于感知加权来说,这一改进在于把滤波器W(z)同另一个对频谱摆动(tilt)建模的滤波器结合起来。在具有高频谱动态范围(宽频带或声频带)的编码信号的情况下,这一改进是特别明显的,作者们就此在上述文章中已指出,在再现信号的主观质量上有重大的改进。
在大多数流行的CELP译码器中,诸线性预测系数ai也用于确定一个后置滤波器,这种滤波器用于在不变更信号频谱摆动的情况下,削弱语音信号的峰段与谐波段之间频率段。这种后置滤波器的一个常规形式的转移函数是:
其中Gp是一个补偿滤波器衰减的增益系数,β1和β2是满足0≤β1≤β2≤1的系数,μ是一个正的常数,且γ1表示一个取决于诸系数ai的第一反射系数。
因此,用系数ai对信号的频谱包络建模,就构成编码与译码过程中的主要因素;这包络应当代表要在译码器中再现的信号的频谱内容,并且控制译码器中噪声掩蔽量化和后置过滤。
对于具有高动态频谱范围的信号,通常使用的线性预测分析不能可靠地对频谱的包络建模。同在高频下相比,在低频下的语音信号通常具有高得多的能量;因此,虽然线性预测分析可在低频时准确地建模,但舍弃了在较高频率时频谱建模。这一缺点在宽频带编码情况下是特别成问题的。
本发明之一个目的在于使用一种线性预测分析方法,改进一个系统中声频信号的频谱模型化。另一目的在于对不同的输入信号(语音、音乐、正弦、DTMF等信号)、不同的频带宽度(电话频带、宽频带、高保真度频带等)、不同的记录(方向性传声器、声学天线等)和滤波条件,使这样一个系统的性能更一致。
因此,本发明提出一种声频信号的线性预测分析方法,以便确定那些依赖于声频信号短期频谱的频谱参数,该方法包括q个相继的预测级,q是一个大于1的整数,在每个预测级p(1≤p≤q),都确定一些参数,它们表示所述级的输入信号的Mp个线性预测系数a1 p,…,aMP p,Mp是预定的,所分析的声频信号构成第一级的输入信号,且p+1级的输入信号由经过具有以下转移函数的滤波器滤波后的级p的输入信号组成:
尤其是,线性预测系数的数目Mp可以随着从一个级到下一个级而增加。这样,第一级就能够相当可靠地计算频谱或信号的总摆动,而随后的级可改进信号峰段的表示。在具有高动态范围的信号的情况下,这可避免特许最大能量段太大,导致冒险去无价值地对其他可能在感知上重要的频率段建模。
本发明的第二方面涉及在一种正向-适配的分析-综合的声频编码器中应用这种线性预测分析方法。本发明就此提出一种用来编码声频信号的方法,它包括下列诸步骤:
-在相继帧中数字化的声频信号的线性预测分析,旨在确定那些规定一个短期综合滤波器的参数;
-确定那些规定施加于短期综合滤波器的激励信号的激励参数,旨在产生一个代表声频信号的综合信号;和
-对规定短期综合滤波器的参数和激励的参数,产生量化值,
其中线性预测分析是一种具有上述规定的q个相继级的处理,并且其中短期预测滤波器具有一个借助下式的1/A(z)形式的转移函数:
这样,也能够按照公式(2)使用所得的转移函数A(z),以便在编码器是一个借助闭环确定激励信号的分析-综合编码器时,规定感知加权滤波器的转移函数。另一个好的可能性是:可采用能够从一个级到下一个级改变的频谱扩展系数γ1和γ2,这就是说给感知加权滤波器一个下述形式的转移函数:
式中γ1 P,γ2 P表示成对的频谱扩展系数,对1≤p≤q,使0≤γ2 P≤γ1 P≤1。
本发明还能够用于相关的译码器。根据本发明这样应用的译码方法包括下列诸步骤:
-接收那些规定一个短期综合滤波器的参数和激励的参数的量化值,规定短期综合滤波器的参数包括线性预测系数组的数目q>1,每组系数都包括预定数目的系数;
-根据激励参数的量化值产生一个激励信号;和
-借助下式用一个具有I/A(z)形式的转移函数的综合滤波器滤波激励信号,可产生个综合声频信号:
式中系数a1 P,…,aMP P在1≤p≤q时相当于第p组线性预测系数。
这一转移函数A(z)还可用于规定一个,其转移函数如上面公式(3)中所示,包括一个A(z/β1)/A(z/β2)形式的项的后置滤波器,其中β1和β2表示满足0≤β1≤β2≤1的系数。
一个有利的变换形式在于用下式取代后置滤波器的转移函数的这个项:
式中β1 P,β2 P表示成对的系数,在1≤p≤q时使0≤β1 P≤β2 P≤1。
本发明还用于反向适配的声频编码器。本发明就此提出一种方法,用于对一个在相继帧中数字化的第一声频信号进行编码,它包括下列诸步骤:
-线性预测分析一个第二声频信号,以便确定一些规定一个短期综合滤波器的参数;
-确定一些规定一个要加给短期综合滤波器的激励信号的激励参数,以便产生一个代表第一声频信号的综合信号,这一综合信号构成至少用于一个随后帧的所述第二声频信号;和
-产生激励参数的量化值,
其中线性预测分析是一种借助如上所定义的q个相继级的处理,且其中短期预测滤波器具有一个借助下式的1/A(z)形式的转移函数:
为了在一个相关的译码器中实施,本发明提出一种用于译码一个比特流的方法,以便在相继的帧中构造一个用所述比特流编码的声频信号,该法包括下列诸步骤:
-接收激励参数的量化值;
-根据激励参数的量化值产生一个激励信号;
-通过用一个短期综合滤波器对激励信号滤波,产生一个综合声频信号;和
-进行综合信号的线性预测分析,以便得到用于至少一个随后帧的短期综合滤波器的系数,
其中线性预测分析是一种借助如上所定义的q个相继的级的处理,并且其中短期预测滤波器具有一个借助下式的1/A(z)形式的转移函数:
本发明还有可能产生一些混合声频的编码器/译码器,即一些采用正向和反向适配模式的,第一线性预测级的或若干相当于正向分析的级的,和最后级的或若干相当于反向分析的级的编码器/译码器。本发明就此提出一种方法,用于对在相继的帧中数字化的一个第一声频信号进行编码,该法包括下列诸步骤:
-线性预测分析第一声频信号,以便确定一些规定一个短期综合滤波器的第一部件的参数;
-确定一些规定一个要加给短期综合滤波器的激励信号的参数,以便产生一个代表第一声频信号的综合信号;
-对一些规定短期综合滤波器的第一部件的参数和一些激励参数,产生一些量化值;
-用一个具有相当于短期综合滤波器的第一部件的转移函数的倒数的转移函数的滤波器,过滤综合信号;和
-线性预测分析经滤波的综合信号,以便得到用于至少一个随后帧的短期综合滤波器的第二部件的系数,
其中第一声频信号的线性预测分析是一种具有qF个相继级的处理,qF是一个最小等于1的整数,所述的具有qF个级的处理包括在每个预测级P(1≤p≤qF)都确定一些代表所述级输入信号的MFp个线性预测系数a1 F,P,…,aMFp F,P的参数,MFP是预定的,第一声频信号构成第一级的输入信号,和某一级P+1的输入信号由一个具有下列转移函数的滤波器滤波的P级的输入信号组成:
短期综合滤波器的第一部件具有借助下式的1/AF(z)形式的转移函数:
并且其中经滤波的综合信号的线性预测分析是一种具有qB个相继级的处理,qB是一个最小等于1的整数,所述的具有qB个级的处理在其每个预测级P(1≤p≤qB)都确定一些代表所述级输入信号的MBp个线性预测系数a1 B,P,…, aMBp B,P的参数,MBp是预定的,经滤波的综合信号构成第一级的输入信号,并且p+1级的输入信号由具有下列转移函数的滤波器滤波的P级输入信号组成: 短期综合滤波器的第二部件具有借助下式的1/AB(z)形式的转移函数:
并且短期综合滤波器具有A(z)=AF(z)·AB(z)的1/A(z)形式的转移函数。
为了在一个相关的混合型译码器中实施,本发明提出一种用于译码一个比特流的方法,以便在相继帧中构造一个由所述比特流编码的声频信号,该法包括下列诸步骤:
-接收一些规定一个短期综合滤波器的第一部件的参数和一些激励参数的量化值,规定短期综合滤波器的第一部件的参数在1≤p≤qF时代表qF组线性预测系数a1 F,P,…,aMFP F,P,qF最小于等于1,每组P都包括预定数目MFp个系数,短期综合滤波器第一部件具有下式1/FA(z)形式的转移函数:
-根据激励参数的量化值产生一个激励信号;
-通过借助A(z)=AF(z)·AB(z)用一个有转移函数1/A(z)的短期综合滤波器过滤该激励信号,产生一个综合声频信号,1/AB(z)代表短期综合滤波器的第二部件的转移函数;
-用一个有转移函数AF(z)的滤波器过滤该综合信号;和
-进行一种滤波后综合信号的线性预测分析,以便得到用于至少一个随后帧的短期综合滤波器的第二部件的系数,
其中滤波综合信号的线性预测分析是一种具有如上所定义的qB个级的处理,并且其中短期综合滤波器具有一个借助下式的1/A(z)=1/[AF(z)·AB(z)]形式的转移函数:
虽然本发明特别重视分析-综合编码/译码领域的应用,但应指出,根据本发明提出的多级线性预测分析方法还具有许多在声频信号处理方面的其他应用,例如用于变换预测编码器,语音识别系统,语音增强系统等。
参照附图,根据下述优选的非限制性实施例,会显出本发明的其他特殊特点和优点,在附图中:
-图1是一个根据本发明的线性预测分析方法的流程图;
-图2是一个频谱图,对本发明方法的结果和常规线性预测分析方法的结果进行比较;
-图3和4都是方块图,示出能够实施本发明的一个CELP译码器和编码器;
-图5和6都是方块图,示出能够实施本发明的CELP译码器和编码器的变型;
-图7和8都是方块图,示出能够实施本发明的其他CELP译码器和编码器的变型。
用S0(n)表示一个要按图1所示方法分析的声频信号。假定采用数字样本形式,整数n表示相继的采样次数。线性预测分析方法包括q个相继的级51,…5p,…,5q。在每个预测级5p(1≤p≤q),都进行输入信号SP-1(n)的Mp阶的线性预测。第一级51的输入信号由要分析的声频信号S0(n)组成;而某一级5P+1(1≤p≤q)的输入信号则由在一个用6P表示的级得到的信号SP(n)组成,其方法为使用一个具有下述转移函数的滤波器,对第p级5p的输入信号SP-1(n)施加过滤:
式中系数ai P(1≤i≤Mp)是在级5p得到的线性预测系数。
能够用于各个级51,…,5q的线性预测分析方法都是本专业技术人员熟知的。
例如,可以参考下列著作:L.R.Rabiner和R.W.Shafer所著的“语音信号的数字处理”,Prentice-Hall Int.,1978;和J.D.Markel和A.H.Gray所著的“语音的线性预测”,Springer Verlag Berlin Heidelberg,1976。尤其是,可以使用Levinson-Durbin算法,它包括下列诸步骤(对每个级5p):
-在Q个样本的分析窗上求出该级的输入信号SP-1(n)的Mp个自相关值R(i)(0≤i≤Mp):
其中S*(n)=ap-1(n)·f(n),f(n)表示长度Q的一个开窗函数,例如一个方波函数或一个汉明函数;
-递归地求出系数ai P:
E(O)=R(O)
对从1到Mp,有
ai p,i=-ri p
E(i)=[1-(rip)2].E(i-1)
对从1到i-1的j,有
aj p,ixaj p,i-1-ri p·ai-j p,i-1
认为系数ai p(i=1,…,Mp)等于在最后迭代中得到的ai p,Mp。数量E(Mp)是P级的残留预测误差的能量。对于-1与1之间的系数γi P被看成是反射系数。它们可以用log一面积比率LARi P=LAR(ri P),来表示,函数LAR是用LAR(r)=log10[(1-r)/(1+r)]确定的。
在一些应用中,所得的预测系数需要量化。可以直接对系数ai P,对相关的反射系数ri P或对log-面积比率LARi P进行量化。另一可能性是要量化频谱线参数(线谱对LSP或线谱频率LSF)。Mp个谱线频率ωi P(1≤i≤Mp)被归一化成0与π之间,它们都是这样的,以致于复数1,exp(jω2 P),exp(jω4 P),...,,…exp(jωMp P)都是多项式PP(z)=AP(z)-z-(Mp+1)AP(z-1)的根,并且复数exp(jω1 P), exp(jω3 P),...,exp(jωP Mp-1)和-1都是多项式QP(Z)=AP(z)+z-(Mp+1)AP(z-1)的根。该量化可能涉及归一化的频率ωi P或它们的余弦。
可以根据上述的常规Levinson-Durbin算法在每个预测级5p进行分析。可以有利地采用其他一些给出相同结果的新近开发的算法,尤其是分离Levinson算法(见“一种用于语音编码的计算LSP参数的新的高效算法”,by S.Saoudi,J.M.Boucher and A.Le Guyader,SignalProcessing,Vol.28,1992,pages201-212),或Chebyshev多项式的应用(见“使用Chebyshev多项式计算线谱频率”,by p.Kabal and R.P.Ramachandran,IEEE Trans.on Acoustics,Speech,and SignalProcessing,Vol.ASSP-34,No.6,pages1419-1426,December1986)。
当为了确定一个用于声频信号S0(n)的短期预测滤波器而进行图1所述的多级分析时,就使这种滤波器的转移函数采取下式的形式:
应指出,这一转移函数满足公式(1)给出的一般通用形式,这时M=M1+…+Mq。然而,用多级预测处理而得到的函数A(z)的系数ai,通常不同于用常规一级预测处理而提供的系数。
优先地进行的线性预测的阶数Mp是随着从一级到下一级而增加的:M1<M2<…<Mq。这样,在第一级51(例如M1=2)较粗地模拟所分析信号的频谱包络的形状,然后,一级一级地改进这一模型,而不丧失第一级提供的全部信息。这可避免对一些在感知上重要的参数,例如频谱的总摆动,注意不够;尤其在宽频带信号和/或有高频谱动态范围的信号的情况下,更是如此。
在一个典型的实施例中,相继预测级的数目q等于2。如果以M阶的综合滤波器为目标,就有可能取M1=2和M2=M-2,由下列诸式给出滤波器(方程(1))的诸系数:
·a1=a1 1+a1 2 (9)
·a2=a2 1+a1 1a1 2+a2 2 (10)
·ak=a2 1ak-2 2+a1 1ak-1 2+ak 2 for 2<k≤M-2 (11)
·aM-1=a2 1aM-3 2+a1 1aM-2 2 (12)
·aM=a2 1aM-2 2 (13)
为了表达,和适宜时量化短期频谱,有可能对每级(1≤p≤q)都采用一组上述的频谱参数(ai P,ri P,LARi P,ωi P或cosωi P,其中1≤i≤Mp);或者,频谱参数相同(ai,γi,LARi,ωi或cosωi,其中1≤i≤M),但根据方程(9)至(13)计算复合滤波器。在这些表达参数与其他表达参数之间的选择取决于每个特定应用的约束条件。
图2中的曲线说明一个语音信号的一段30ms的对话段的一些频谱包络的比较,这些包络用一种具有M=15的常规一级线性预测处理来模拟(曲线II),还根据本发明在q=2级和M1=2与M2=13时用线性预测处理来模拟(曲线III)。信号的抽样频率Fe是16KHz。用曲线I表示信号的频谱(它的傅里叶变换的模数)。这一频谱表示一些声频信号,平均说来,它们在低频下的能量大于在高频下的能量。频谱动态范围有时大于图2中的范围(60dB)。曲线(II)和(III)相当于所模拟的频谱包络|1/A(e2jπf/Fe)|。可以看出,根据本发明的分析方法可显著地改良频谱的模拟,尤其在高频(f>4KHz)下,更是如此。用多级的分析处理可更好地照顾在高频下的频谱总摆动及其共振峰。
下面描述本发明对一种CELP型语音编码器的应用。
图3说明在一个CELP编码器和译码器中使用的语音综合处理。激励发生器10根据指标K发出一个属于预定的代码簿的激励代码Ck,放大器12按照激励增益β来放大这个激励代码,所得的信号经受一个长期综合滤波器14的处理。滤波器14的输出信号u又经受一个短期综合滤波器16的处理,它的输出S构成在此被视为综合语音信号的信号。这种综合信号被加到一个后置滤波器17上,用于改进所再现语音的主观质量。后置滤波技术是语音编码领域所熟知的事情(参见J.H.Chen和A.Gersho:“用于编码语音质量提高的自适应后置滤波器”,IEEE Trans.on Speech and Audio Processing.vol.3-1,pages 59-71,January1995)。在所介绍的实例中,后置滤波器17的系数是从在短期综合滤波器16中特征化的LPC参数获得的。人们知道,象在目前某些CELP译码器中的情况一样,后置滤波器17也能包括一个长期后置滤波部件。
上述的信号,对于一个宽频带编码器(50-7000Hz)来说,是在抽样速率Fe例如等于16KHz下用例如16位字表示的数字信号。一般说来,综合滤波器14,16都单纯是递归的滤波器。长期综合滤波器14一般具有一种借助B(z)=1-Gz-T的1/B(z)形式的转移函数。延迟T和增益G构成长期预测(LTP)参数,这些参数是由编码器自适应地确定的。规定短期综合滤波器16的LPC参数,是在编码器中用一种语音信号的线性预测分析方法来确定的。在通常的CELP编码器和译码器中,滤波器16的转移函数通常是借助(1)式的A(z)的1/A(z)形式的。本发明提议,采用一种类似形式的转移函数,其中A(z)是根据如上所述的(7)式分解的。举例来说,不同级的参数可以是q=2,M1=2,M2=13(M=M1+M2=15)。
术语“激励信号”在此用于表示加给短期综合滤波器14的信号u(n)。这种激励信号包括一个LTP成分G.u(n-T),和一个残余成分或新息序列βck(n)。在分析-综合编码器中,使残余成分和任选的LPT成分特征化的参数是在闭环中使用一个感知加权滤波器求出的。
图4示出一个CELP编码器图。其语音信号s(n)是一个数字信号,举例来说,是由一个模拟/数字转换器20对传声器22的放大与滤波输出信号进行处理而提供的。信号s(n)是在Λ个样本的相继帧中数字化的,它们本身被划分成L个样本的子帧或激励帧(例如Λ=160,L=32)。
LPC、LTP和EXC(指标K和激励增益β)参数是以编码器电平分别用三个分析模块24、26、28来得出的。然后这些参数按已知方式被量化,以进行高效的数字传输,再送到一个多路复用器30处理,在此形成编码器的输出信号。这些参数还送到一个模块32,以计算编码器的某些滤波器的初始状态。这个模块32主要包括一个译码链,例如图3所示的链。象译码器一样,模块32也根据量化的LPC、LTP和EXC参数进行操作。如果象通常情况一样,在译码器对LPC参数内插,则可用模块32进行同样的内插。模块32有可能以编码器电平获悉,译码器的综合滤波器14,16的先前状态,这是在所述的子帧之前作为综合与激励参数的函数而确定的。
在编码处理的第一步骤,短期分析模块24通过分析语音信号s(n)的短期相关性,确定那些规定短期综合滤波器的LPC参数。举例来说,这一确定是以每Λ个样本帧一次的方式进行的,以便适应语音信号频谱内容的演变。根据本发明,问题在于采用图1所示的分析方法,这s0(n)=s(n)。
下面的编码级在于确定长期预测LTP参数。举例来说,它们是以每L个样本子帧一次的方式确定的。减法器34从语音信号s(n)减去短期综合滤波器16的响应,得一空输入信号。这一响应是由一个具有转移函数1/A(z)的滤波器36确定的,这函数的系数是由已用模块24确定的LPC参数来给出的,并且它的初始状态是由模块32提供的,以便相当于综合信号的M=M1+…+Mq个最后的样本。减法器34的输出信号被送到一个感知加权滤波器38,其作用在于强化误差最明显的频谱段,即交互共振峰段。
感知加权滤波器38的转移函数W(z)是W(z)=AN(z)/AP(z)形式的,其中AN(z)和AP(z)都是M阶的FIR型(有限脉冲响应)转移函数。函数AN(z)和AP(z)的各个系数bi和ci(1≤i≤M)都是,用一个把它们传送到滤波器38的感知加权求值模块39,对每一帧进行计算的。第一个可能性是在0≤γ2≤γ1≤1情况下认为AN(z)=A(Z/γ1)和AP(z)=A(Z/γ2),这可简化成具有(7)式A(z)形式以常规(2)式形式。在具有q=2、M1=2和M2=13的宽频带信号的情况下,发现选择γ1=0.92和γ2=0.6,可给出好的结果。
然而,为了使额外的计算很少,本发明有可能通过采用(6)式的形式和W(z),使量化噪声的整形具有更大的灵活性,即:
在有q=2、M1=2和M2=13的宽频带信号的情况下,发现选择γ1 1=0.9,γ2 1=0.65,γ1 2=0.95和γ2 2=0.75时,可给出好的结果。项A1(Z/γ1 1)/A1(Z/γ2 1)有可能调节滤波器38的总摆动,而项A2(Z/γ1 2)/A2(Z/γ2 2)。则有可能调节在共振峰电平的掩蔽。
模块26以常规方式进行的闭环LTP分析之目的在于,为每个子帧选择延迟T,它可使规一化的关系式取极大值:
式中X′(n)表示滤波器38在所述的子帧期间的输出信号,且YT(n)表示卷积u(n-T)*h′(n),在上面的表达式中,h′(0),h′(1),…,h′(L-1)表示转移函数W(z)/A(z)的加权综合滤波器脉冲响应。这一脉冲响应h′是在量化和内插后适宜时,由脉冲响应计算模块40得出的,它取决于模块39送出的系数bi和ci和为子帧确定的LPC参数。样本u(n-T)是长期综合滤波器14以前的状态,这是由模块32送出的。对短于一个子帧长度的延迟T,遗漏的样本u(n-T)是通过根据以前的样本内插,或从语音信号得到的。在一个规定的窗口范围内选择完全或部分延迟的T。为了减小闭环的查找范围,从而减小要计算的卷积yT(n)数,可以首先确定一个开环延迟T′,例如每帧一次,然后从围绕T′的减小的间隔范围内为每个子帧而选择闭环延迟。按照它的最简单形式,开环查找之目的在于确定延迟T′,如果转移函数A(z)的反滤波器滤波适宜,则可使语音信号的自相关作用最大。在确定了延迟T以后,用下式得出长期预测增益G:
为了查找涉及某一子帧的CELP激励,由模块26为最佳延迟T计算的信与GyT(n),是先用减法器42从信号x′(n)中减去的。然后把所得的信号X(n)送到一个反向滤波器44,它再送出一个由下式给出的信号D(n):
式中h(0),h(1),…,h(L-1)表示由综合滤波器和感知加权滤波器组成的滤波器的脉冲响应,这种响应是通过模块40计算的。换句话说,复合滤波器具有W(z)/[A(z).B(z)]类型的转移函数。按矩阵符号,这给出:
D=(D(0),D(1),...,D(L-1))=x.H此X=(X(0),X(1),…,X(L-1))和
向量D构成一个用于激励寻找模块28的目标向量。这一模块28确定一个代码簿中的代码字,该字可使规一化关系式pK 2/αK 2最大,其中:
Pk=D.ck T
αk 2=ck.HT.H.ck T=ck.U.ck T
在确定了最佳指标K以后,认为激励增益β等于PK/αK 2。
参见图3,CELP译码器包括一个多路信号分解器8,用于接收由编码器输出的位流。EXC激励参数和LTP与LPC综合参数的量化值被送到发生器10、放大器12和滤波器14、16,以便产生一个综合信号,先送到后置滤波器17,然后由转换器18转换成模拟信号,再经放大,送到扬声器19,以便再现原始语音。
在图3中译码器的情况下,LPC参数例如由涉及各线性预测级的反射系数ri P(也被看作是部分相关或PARCOR系数)的量化指数组成。模块15从量化指数恢复ri P的量化值,并且把它们转换,以便提供q组线性预测系数。举例来说,使用与Levinson-Durbin算法相同的递归法,进行这种转换。
系数组ai P被送到一个由相继的q个滤波器/级组成的短期综合滤波器16,它们具有由方程(4)给出的转移函数1/A1(z),…,1/Aq(z)。滤波器16也可能是单级的,它具有由方程(1)给出的转移函数1/A(z),其中系数ai已根据方程(9)至(13)算出。
系数组ai P还被送到后置滤波器17,在所述的实例中,后置滤波器17具有下述形式的转移函数: 式中APN(z)和APP(z)都是M阶的FIR型转移函数,Gp是一个恒定的增益系数,μ是一个正常数,和r1表示第一反射系数。反射系数r1可以是一个涉及复合综合滤波器的系数ai的系数,这就不需要作计算。也可以把r1看作是第一预测级的第一反射系数(r1=r1 1)再在适宜时调节常数μ。对于项APN(z)/APP(z),第一可能性是令APN(z)=A(Z/β1)和APP(z)=A(Z/β2),其中0≤β1≤β2≤1,这就简化成常规的(3)式形式和(7)式的A(z)形式。
象在编码器的感知加权滤波器情况一样,本发明有可能从一级到下一级采用不同的系数β1和β2(方程8),即:
在有q=2,M1=2和M2=13的宽频带信号的情况下,发现选择β1 1=0.7,β2 1=0.9,β1 2=0.95和β2 2=0.97,可给出好的结果。
上面已描述本发明用于一种正向适配预测编码器的情况,即其中进行线性预测分析的声频信号是编码器输入信号。本发明还可用于反向适配预测编码器/译码器,其中综合信号在编码器/译码器进行线性预测分析(参见J.H.Chen等人:“一种用于CCITT 16kbit/s语音编码标准的低延迟CELP编码器”,IEEE J.SAC,Vol.10,No.5,pages830-848,June1992)。图5和6分别示出实施本发明的一个反向适配CELP译码器和一个反向适配CELP编码器。与图3和4相同的标号用于表示相同的部件。
反向适配译码器只接收诸参数的量化值,这些参数规定要加给短期综合滤波器16的激励信号u(n)。在所述的实例中,这些参数是指标K,和相关的增益β,以及LTP参数。综合信号(n)是由与图3中模块相同的一个多级线性预测分析模块124来处理的。模块124把LPC参数送到滤波器16,用于激励信号的一个或多个随后帧;并且送到一个其系数是按如上所述得到的后置滤波器17。
图6所示的相应编码器对局部发生的综合信号,而不是对声频信号S(n),进行多级线性预测分析。这样,它包括一个主要用图5中译码器的10、12、14、16和124表示的单元组成的局部译码器132。此外,局部译码器还把通过分析该综合信号得出的LPC参数,送到滤波器36的初始状态S和自适应字典的样本u;感知加权计算模块39和用于计算脉冲响应h和h′的模块40使用这些LPC参数。关于其余情况,除了不再需要LPC分析模块24之外,编码器的操作相同于参照图4描述的编码器的操作。只有EXC和LTP参数被送到译码器。
图7和8是有混合适配性的一个CELP译码器和一个CELP编码器的方块图。第一级或诸级的线性预测系数是由编码器进行的声频信号正向分析产生的,而最后的一个级或诸级的线性预测系数则是由译码器(和由一个编码器提供的局部译码器)进行的综合信号反向分析产生的。用与图3至6中相同的标号表示相同的单元。
图7所示的混合译码器接收EXC、LTP参数的量化值,这些参数规定要加到短期综合滤波器16的激励信号u(n);并且由编码器进行的正向分析来确定LPC/F参数的量化值。这些LPC/F参数代表在1≤p≤qF时的qF组线性预测系数a1 F,P,…,aMFP F,P,并且规定滤波器16的转移函数1/A(z)的第一成分1/AF(z):
为了得到这些LPC/F参数,图8所示的混合编码器包括一个模块224/F,该模块qF>1时以参照图1所述的方式,或在qF=1时以单级的形式,分析要编码的声频信号s(n)。
具有转移函数1/A(z)=1/[AF(z)·AB(z)]的短期综合滤波器的其他成分由下式给出:
为了确定系数ai B,P,混合译码器包括一个反滤波器200,该滤波器具有对短期综合滤波器16产生的综合信号(n)进行滤波的转移函数AF(z),以便产生一个滤波的综合信号0(n)一个模块224/B在qB>1时以参照图1所述的方式,或在qB=1时以一单级的方式,进行这种信号0(n)的线性预测分析。把这样得到的LPC/B系数送到综合滤波器16,以便规定它用于随后帧的第二成分。象LPC/F系数一样,它们也被送到后置滤波器17,其成分APN(z)和APP(z)或者是APN(z)=A(Z/β1)和APP(z)=A(Z/β2)形式的,或者是下述形式的:
其中成对的系数β1 F,P、β2 F,P和β1 B,P,β2 B,P都是可用0≤β1 F,P≤β2 F,P≤1和0≤β1 B,P≤β2 B,P≤1来分别进行最佳化的。
在混合编码器中提供的局部译码器232,主要由图7中译码器的用标号10、12、14、16、200和224/B表示的元件所组成。此外,局部译码器232还把LPC/B参数送到滤波器36的初始状态和自适应字典的样本u;感知加权计算模块39和用于计算脉冲响应h和h′的模块40,都使用这些LPC/B参数和由分析模块224/F输出的LPC/F参数。
由模块39计算的感知加权滤波器38的转移函数,或者是W(z)=A(Z/γ1)/A(Z/γ2)形式的,或者是下式形式的:
其中成对的系数γ1 F,P、γ2 F,P和γ1 B,P、γ2 B,P都是用0 ≤γ2 F,P≤γ2 F,P≤1
和0≤γ2 B,P≤γ1 B,P≤1来分别进行最佳化的。
关于其余情况,混合编码器的操作相同于参照图4描述的编码器的操作。只有EXC、LTP和LPC/F参数才送往译码器。
Claims (22)
1.一种声频信号(S0(n))的线性预测分析方法,用于确定那些随该声频信号的短期频谱而定的频谱参数,该方法包括q个相继的预测级(5p),q是一个大于1的整数,该方法的特征在于,在每个预测级p(1≤p≤q)都确定一些参数,这些参数表示所述级输入信号的Mp个线性预测系数a1 P,…,aMP P,Mp对每级P都是预定的,要分析的声频信号构成第一级的输入信号(S0(n)),并且第P+1级的输入信号(SP(n))由第P级的输入信号(SP-1(n))经过一个具有下列转移函数的滤波器滤波以后而组成:
2.根据权利要求1所述的分析方法,其特征在于线性预测系数的个数Mp是逐级递增的。
3.一种对某一声频信号进行编码的方法,该方法包括下述步骤:
-对在相继的帧中数字化的声频信号(s(n))进行线性预测的分析,以便确定那些规定一个短期综合滤波器(16)的参数(LPC);
-对那些规定一个要加给短期综合滤波器(16)的激励信号(u(n))的激励参数(k,β,LTP),进行确定,以便产生一个表示该声频信号的综合信号((n));和
-对规定短期综合滤波器的诸参数和激励参数,产生诸量化值,
其特征在于线性预测分析是一种有着q个相继级(5p)的处理,q是一个大于1的整数,所述的处理包括,在每个预测级p(1≤p≤q)都确定一些参数,这些参数表示所述级输入信号的Mp个线性预测系数a1 P,…,aMp P,Mp对每级p都是预定的,要编码的声频信号(s(n))构成第一级的输入信号(S0(n)),并且第P+1级的输入信号(sP(n))由第P级的输入信号(SP-1(n))经过一个具有下列转移函数的滤波器滤波以后而组成: 短期综合滤波器(16)具有借助下式的1/A(z)形式的转移函数:
4.根据权利要求3所述的编码方法,其特征在于线性预测系数的个数Mp是逐级递增的。
5.根据权利要求3或4所述的编码方法,其特征在于至少某些激励参数是通过使一个误差信号的能量为最小而确定的,这个误差信号是对声频信号(S(n))与综合信号((n))之间的差信号,用至少一个感知加权滤波器(38)进行滤波而产生的,该滤波器的转移函数是W(z)=A(Z/γ1)/A(Z/γ2)形式的,式中γ1和γ2如此表示频谱的扩展系数,以致于0≤γ2≤γ1≤1。
6.根据权利要求3或4所述的编码方法,其特征在于至少某些激励参数是通过使一个误差信号的能量为最小而确定的,这个误差信号是对声频信号(S(n))与综合信号((n))之间的差信号,用至少一个感知加权滤波器(38)进行滤波而产生的,该滤波器的转移函数是下式形式的:
式中γ1 P,γ2 P如此表示成对的频谱扩展系数,以致于对1≤p≤q有0≤γ2 P≤γ1 P≤1。
7.一种对一个比特流进行译码的方法,用于构造一个由所述比特流编码的声频信号,其特征在于:
-接收一些规定一个短期综合滤波器(16)的参数(LPC)和一些激励参数(k,β,LTP)的量化值,这些参数规定一个综合滤波器,该综合滤波器又规定q组线性预测系数(ai p),q大于1,每组p包括的系数的个数Mp是预定的;
-根据诸激励参数的量化值产生一个激励信号(u(n));和
-通过借助具有1/A(z)形式的转移函数的综合滤波器(16),对激励信号进行滤波,产生一个综合声频信号((n)):
式中系数a1 P,…,aMp P相当于1≤p≤q时的第p组线性预测系数。
8.根据权利要求7所述的译码方法,其特征在于所述的综合声频信号((n))是加到一个后置滤波器(17)的,该滤波器的转移函数(HPF(z))包括一个A(Z/β1)/A(Z/β2)形式的项,式中β1和β2如此表示系数,以致于0≤β1≤β2≤1。
9.根据权利要求7所述的译码方法,其特征在于所述的综合声频信号(((n))是加到一个后置滤波器(17)上的,该滤波器的转移函数(HPF(z))包括一个下述形式的项:
其中β1 P,β2 P如此表示成对的系数,以致于对1≤p≤q有0≤β1 P≤β2 P≤1,并且对于第P组线性预测系数来说,AP(z)代表下述函数:
10.一种对相继帧中数字化的第一声频信号进行编码的方法,该方法包括下述步骤:
-对第二声频信号((n))进行线性预测分析,以便确定那些规定一个短期综合滤波器(16)的参数(LPC);
-对那些规定一个要加到短期综合滤波器(16)上的激励信号(u(n))的激励参数(k,β,LTP),进行确定,以便产生一个代表第一声频信号的综合信号((n)),这个综合信号构成用于至少一个随后帧的所述第二声频信号;和
-产生激励参数的量化值;
其特征在于线性预测分析是一种具有q个相继级(5P)的处理,q是一个大于1的整数,所述的处理包括,在每个预测级p(1≤p≤q)确定一些参数,这些参数代表所述级的输入信号的Mp个线性预测系数a1 P,…,aMp P,Mp对每级P都是预定的,第二声频信号((n))构成第一级的输入信号(S0(n)),并且第P+1级的输入信号(SP(n))由第P级的输入信号(SP-1(n))经过一个具有下述转移函数的滤波器滤波以后组成: 短期综合滤波器(16)具有借助下式的1/A(z)形式的转移函数:
11.根据权利要求10所述的编码方法,其特征在于线性预测系数的个数Mp逐级递增。
12.根据权利要求10或11所述的编码方法,其特征在于至少一些激励参数是通过使一个误差信号的能量为最小而确定的,这个误差信号是对第一声频信号(S(n))与综合信号((n))之间的差信号,用至少一个感知加权滤波器(38)滤波而产生的,该滤波器的转移函数是W(z)=A(Z/γ1)/A(Z/γ2)形式的,其中γ1和γ2如此表示频谱扩展系数,以致于0≤γ2≤γ1≤1。
13.根据权利要求10或11所述的编码方法,其特征在于至少一些激励参数是通过使一个误差信号的能量为最小而确定的,这个误差信号是对第一声频信号(S(n))与综合信号((n))之间的差信号,用至少一个感知加权滤波器(38)滤波而产生的,该滤波器的转移函数是下式形式的:
式中γ1 P,γ2 P如此表示成对的频谱扩展系数,以致于对1≤p≤q,有0≤γ2 P≤γ1 P≤1。
14.一种对一个比特流进行译码的方法,用于在相继的帧中构造一个由所述比特流编码的声频信号,其特征在于:
-接收激励参数(k,β,LTP)的量化值;
-根据激励参数的量化值产生一个激励信号(u(n));
-通过用一个短期综合滤波器(16)对该激励信号进行滤波,产生一个综合声频信号(((n));和
-进行综合信号((n))的线性预测分析,以便得到用于至少一个随后帧的短期综合滤波器(16)的系数;
其特征还在于其线性预测分析是一种具有q个相继级(5P)的处理,q是一个大于1的整数,所述的处理包括,在每个预测级p(1≤p≤q)确定一些参数,这些参数代表所述级输入信号的Mp个线性预测系数a1 P,…, aMp P,Mp对每级p都是预定的,综合信号((n))构成第一级的输入信号(S0(n)),第P+1级的输入信号(SP(n))由第P级的输入信号(SP-1(n))经过一个具有下列转移函数的滤波器滤波而组成:
短期综合滤波器(16)具有一个借助下式的1/A(z)形式的转移函数:
15.根据权利要求14所述的译码方法,其特征在于所述的综合声频信号((n))是加到一个后置滤波器(17)上的,该滤波器的转移函数(HPF(z))包括一个A(Z/β1)/A(Z/β2)形式的项,其中β1和β2如此表示诸系数,以致于0≤β1≤β2≤1。
16.根据权利要求14所述的译码方法,其特征在于所述的综合声频信号((n))是加到一个后置滤波器(17)上的,该滤波器的转移函数(HPF(z))包括一个下述形式的项:
其中β1 P,β2 P如此表示成对的系数,以致于对1≤p≤q,有0≤β1 P≤β2 P≤1。
17.一种对在相继帧中数字化的第一声频信号进行编码的方法,其特征在于它包括下述步骤:
-对第一声频信号(S(n))进行线性预测分析,以便确定一个短期综合滤波器(16)的第一部件的参数(LPC/F);
-对规定一个要加到短期综合滤波器(16)上的激励信号(u(n))的一些激励参数(k,β,LTP),进行确定,以便产生一个代表第一声频信号的综合信号((n));
-产生一些规定短期综合滤波器的第一部件的参数和一些激励参数的量化值;
-用一个具有一个转移函数的滤波器来过滤综合信号((n)),这个转移函数相当于短期综合滤波器的第一部件的转移函数的倒数;和
-对滤波后的综合信号((0(n))进行线性预测分析,以便得到用于至少一个随后帧的短期综合滤波器的第二部件的系数;
其特征还在于,第一声频信号(S(n))的线性预测分析是一种具有qF个相继级(5p)的处理,qF是一个至少等于1的整数,所述的具有qF个级的处理包括,在每个预测级P(1≤p≤q)确定一些参数,这些参数代表所述级的输入信号的MFP个线性预测系数a1 F,P,…,aMFp F,P,MFp对每级P都是预定的,第一声频信号(S(n))构成有qF级的处理的第一级的输入信号(S0(n)),并且有qF个级的处理的第P+1级的输入信号(SP(n))是,由有qF个级的处理的第P级的输入信号(Sp-1(n))经过一个有下述转移函数的滤波器滤波以后组成的:
短期综合滤波器(16)的第一部件具有一个借助下式的1/AF(z)形式的转移函数
其特征还在于滤波后综合信号的线性预测分析是一种具有qB个相继级(5p)的处理,qB是一个至少等于1的整数,所述的有qB个级的处理包括,在每个预测级p(1≤p≤qB)确定一些个参数,这些参数代表所述级的输入信号的MBP个线性预测系数a1 B,P,…,aMBp B,P,MBp对每级P都是预定的,滤波后的综合信号(0(n))构成有着qB个级的处理的第一级的输入信号(S0(n)),并且有着qB个级的处理的第P+1级的输入信号(SP(n))是,由有着qB个级的处理的第P级的输入信号(SP-1(n))经过一个有着下述转移函数的滤波器滤波以后所组成的:
短期综合滤波器(16)的第二部件具有一个借助下式的1/AB(z)表式的转移函数: 并且短期综合滤波器(16)具有一个借助A(z)=AF(z)、AB(z)的1/A(z)形式的转移函数。
18.根据权利要求17所述的编码方法,其特征在于至少一些激励参数是通过使一个误差信号的能量为最小而确定的,这个误差信号是对第一声频信号(S(n))与综合信号((n))之间的差信号,用至少一个感知加权滤波器(38)进行滤波而产生的,该滤波器的转移函数是W(z)=A(Z/γ1)/A(Z/γ2)形式的,其中γ1和γ2如此表示频谱扩展系数,以致于0≤γ2≤γ1≤1。
19.根据权利要求17所述的编码方法,其特征在于至少一些激励参数是通过使一个误差信号的能量为最小而确定的,这个误差信号是对第一声频信号(S(n))与综合信号((n))之间的差信号,用至少一个感知加权滤波器(38)进行滤波而产生的,该滤波器的转移函数是下式形式的:
式中γ1 F,P,γ2 F,P如此表示成对的频谱扩展系数,以致于对1≤p≤q,有0≤γ2 F,P≤γ1 F,P≤1,并且γ1 B,P,γ2 B,P如此表示成对的频谱扩展系数,以致于对1≤p≤qB,有0≤γ2 B,P≤γ1 B,P≤1。
20.一种对一个比特流进行译码的方法,用于在一些相继的帧中构造一个由所述比特流编码的声频信号,其特征在于:
-接收一些规定一个短期综合滤波器(16)的第一部件的参数(LPC/F)和一些激励参数(k,β,LTP)的量化值,那些规定短期综合滤波器的第一部件的参数代表,在1≤p≤qF时,qF组线性预测系数a1 F,P,…,aMFp F,P,qF至少等于1,每组P都包括预定数目MFp个系数,短期综合滤波器(16)的第一部件具有一个借助下式的1/AF(z)形式的转移函数:
-根据该激励参数的量化值产生一个激励信号(u(n));
-通过用一个具有转移函数1/A(z)和A(z)=AF(z)·AB(z)的短期综合滤波器(16)对该激励信号进行滤波,产生一个综合声频信号((n)),1/AB(z)代表短期综合滤波器(16)的第二部件的转移函数;
-用一个具有转移函数AF(z)的滤波器对该综合信号((n))进行滤波;和
-进行滤波后的综合信号(S0(n))的线性预测分析,以便得到用于至少一个随后帧的短期综合滤波器(16)的第二部件的系数;
其特征还在于滤波后综合信号的线性预测分析是一种具有qB个相继级(5P)的处理,qB是一个至少等于1的整数,所述的处理包括,在每个预测级p(1≤p≤q)都确定一些参数,这些参数代表所述级输入信号的MBp个线性预测系数a1 B,P,…,aMBp B,P,MBp对每级P都是预定的滤波后的综合信号(0(n))构成第一级的输入信号(S0(n)),并且第P+1级的输入信号(SP(n))是由第P级的输入信号(SP-1(n))经过一个具有下述转移函数的滤波器滤波后而组成的:
短期综合滤波器(16)的第二部件具有借助下式的1/AB(z)形式的转移函数:
21.根据权利要求20所述的译码方法,其特征在于所述的综合声频信号((n))是加到一个后置滤波器(17)上的,该滤波器的转移函数(HPF(z))包括一个A(Z/β1)/A(Z/β2)形式的项,项中β1和β2如此表示诸系数,以致于0≤β1≤β2≤1。
22.根据权利要求20所述的译码方法,其特征在于所述的综合声频信号((n))是加到一个后置滤波器(17)上的,该滤波器的转移函数(HPF(z))包括一个下述形式的项:
项中β1 F,P,β2 F,P如此表示成对的系数,以致于对1≤p≤qF,有0≤β1 F,P≤β2 F,P≤1,并且β1 B,P,β2 B,P如此表示成对的系数,以致于对1≤p≤qB,有0≤β1 B,P≤β2 B,P≤1。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR9514925 | 1995-12-15 | ||
FR9514925A FR2742568B1 (fr) | 1995-12-15 | 1995-12-15 | Procede d'analyse par prediction lineaire d'un signal audiofrequence, et procedes de codage et de decodage d'un signal audiofrequence en comportant application |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1159691A true CN1159691A (zh) | 1997-09-17 |
Family
ID=9485565
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN96121556A Pending CN1159691A (zh) | 1995-12-15 | 1996-12-13 | 用于声频信号线性预测分析的方法 |
Country Status (7)
Country | Link |
---|---|
US (1) | US5787390A (zh) |
EP (1) | EP0782128B1 (zh) |
JP (1) | JP3678519B2 (zh) |
KR (1) | KR100421226B1 (zh) |
CN (1) | CN1159691A (zh) |
DE (1) | DE69608947T2 (zh) |
FR (1) | FR2742568B1 (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101114415B (zh) * | 2006-07-25 | 2011-01-12 | 元太科技工业股份有限公司 | 双稳态显示器的驱动装置及其方法 |
CN102638846A (zh) * | 2012-03-28 | 2012-08-15 | 浙江大学 | 一种基于最优量化策略的wsn通信负载降低方法 |
CN106463136A (zh) * | 2014-06-26 | 2017-02-22 | 高通股份有限公司 | 基于高频带信号特征的时间增益调整 |
CN110299146A (zh) * | 2014-01-24 | 2019-10-01 | 日本电信电话株式会社 | 线性预测分析装置、方法、程序以及记录介质 |
CN110415714A (zh) * | 2014-01-24 | 2019-11-05 | 日本电信电话株式会社 | 线性预测分析装置、方法、程序以及记录介质 |
Families Citing this family (42)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5621852A (en) * | 1993-12-14 | 1997-04-15 | Interdigital Technology Corporation | Efficient codebook structure for code excited linear prediction coding |
FR2729246A1 (fr) * | 1995-01-06 | 1996-07-12 | Matra Communication | Procede de codage de parole a analyse par synthese |
FR2729247A1 (fr) * | 1995-01-06 | 1996-07-12 | Matra Communication | Procede de codage de parole a analyse par synthese |
JPH10124088A (ja) * | 1996-10-24 | 1998-05-15 | Sony Corp | 音声帯域幅拡張装置及び方法 |
JP3064947B2 (ja) * | 1997-03-26 | 2000-07-12 | 日本電気株式会社 | 音声・楽音符号化及び復号化装置 |
FI973873A (fi) * | 1997-10-02 | 1999-04-03 | Nokia Mobile Phones Ltd | Puhekoodaus |
FR2774827B1 (fr) | 1998-02-06 | 2000-04-14 | France Telecom | Procede de decodage d'un flux binaire representatif d'un signal audio |
US6223157B1 (en) * | 1998-05-07 | 2001-04-24 | Dsc Telecom, L.P. | Method for direct recognition of encoded speech data |
US6148283A (en) * | 1998-09-23 | 2000-11-14 | Qualcomm Inc. | Method and apparatus using multi-path multi-stage vector quantizer |
US6778953B1 (en) * | 2000-06-02 | 2004-08-17 | Agere Systems Inc. | Method and apparatus for representing masked thresholds in a perceptual audio coder |
KR100865860B1 (ko) * | 2000-11-09 | 2008-10-29 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 보다 높은 지각의 품질을 위한 전화 음성의 광대역 확장 |
KR100852610B1 (ko) | 2000-12-06 | 2008-08-18 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 필터 장치들 및 방법들 |
WO2002067246A1 (en) * | 2001-02-16 | 2002-08-29 | Centre For Signal Processing, Nanyang Technological University | Method for determining optimum linear prediction coefficients |
US6590972B1 (en) * | 2001-03-15 | 2003-07-08 | 3Com Corporation | DTMF detection based on LPC coefficients |
US7062429B2 (en) * | 2001-09-07 | 2006-06-13 | Agere Systems Inc. | Distortion-based method and apparatus for buffer control in a communication system |
US6934677B2 (en) | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
US7240001B2 (en) * | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
US20030216921A1 (en) * | 2002-05-16 | 2003-11-20 | Jianghua Bao | Method and system for limited domain text to speech (TTS) processing |
EP1383109A1 (fr) * | 2002-07-17 | 2004-01-21 | STMicroelectronics N.V. | Procédé et dispositif d'encodage de la parole à bande élargie |
US7299190B2 (en) * | 2002-09-04 | 2007-11-20 | Microsoft Corporation | Quantization and inverse quantization for audio |
US7502743B2 (en) | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
JP4676140B2 (ja) | 2002-09-04 | 2011-04-27 | マイクロソフト コーポレーション | オーディオの量子化および逆量子化 |
US7254533B1 (en) * | 2002-10-17 | 2007-08-07 | Dilithium Networks Pty Ltd. | Method and apparatus for a thin CELP voice codec |
US20040260540A1 (en) * | 2003-06-20 | 2004-12-23 | Tong Zhang | System and method for spectrogram analysis of an audio signal |
US7539612B2 (en) * | 2005-07-15 | 2009-05-26 | Microsoft Corporation | Coding and decoding scale factor information |
US8027242B2 (en) | 2005-10-21 | 2011-09-27 | Qualcomm Incorporated | Signal coding and decoding based on spectral dynamics |
US8417185B2 (en) * | 2005-12-16 | 2013-04-09 | Vocollect, Inc. | Wireless headset and method for robust voice data communication |
US7885419B2 (en) | 2006-02-06 | 2011-02-08 | Vocollect, Inc. | Headset terminal with speech functionality |
US7773767B2 (en) | 2006-02-06 | 2010-08-10 | Vocollect, Inc. | Headset terminal with rear stability strap |
US8392176B2 (en) | 2006-04-10 | 2013-03-05 | Qualcomm Incorporated | Processing of excitation in audio coding and decoding |
WO2008032828A1 (fr) * | 2006-09-15 | 2008-03-20 | Panasonic Corporation | Dispositif de codage audio et procédé de codage audio |
CN101536311B (zh) | 2007-01-25 | 2012-09-26 | 夏普株式会社 | 脉冲输出电路、使用该脉冲输出电路的显示装置的驱动电路、显示装置及脉冲输出方法 |
US8428957B2 (en) | 2007-08-24 | 2013-04-23 | Qualcomm Incorporated | Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands |
TWI346465B (en) * | 2007-09-04 | 2011-08-01 | Univ Nat Central | Configurable common filterbank processor applicable for various audio video standards and processing method thereof |
USD605629S1 (en) | 2008-09-29 | 2009-12-08 | Vocollect, Inc. | Headset |
FR2938688A1 (fr) | 2008-11-18 | 2010-05-21 | France Telecom | Codage avec mise en forme du bruit dans un codeur hierarchique |
WO2010102446A1 (zh) * | 2009-03-11 | 2010-09-16 | 华为技术有限公司 | 一种线性预测分析方法、装置及系统 |
US8160287B2 (en) | 2009-05-22 | 2012-04-17 | Vocollect, Inc. | Headset with adjustable headband |
US8438659B2 (en) | 2009-11-05 | 2013-05-07 | Vocollect, Inc. | Portable computing device and headset interface |
WO2011118977A2 (ko) * | 2010-03-23 | 2011-09-29 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
KR101257776B1 (ko) * | 2011-10-06 | 2013-04-24 | 단국대학교 산학협력단 | 상태-체크 코드를 이용한 부호화 방법 및 부호화 장치 |
EP3323243B1 (en) * | 2015-07-16 | 2022-01-19 | Dolby Laboratories Licensing Corporation | Signal reshaping and decoding for hdr signals |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3975587A (en) * | 1974-09-13 | 1976-08-17 | International Telephone And Telegraph Corporation | Digital vocoder |
US4398262A (en) * | 1981-12-22 | 1983-08-09 | Motorola, Inc. | Time multiplexed n-ordered digital filter |
CA1245363A (en) * | 1985-03-20 | 1988-11-22 | Tetsu Taguchi | Pattern matching vocoder |
US4868867A (en) * | 1987-04-06 | 1989-09-19 | Voicecraft Inc. | Vector excitation speech or audio coder for transmission or storage |
JP2625998B2 (ja) * | 1988-12-09 | 1997-07-02 | 沖電気工業株式会社 | 特徴抽出方式 |
GB2235354A (en) * | 1989-08-16 | 1991-02-27 | Philips Electronic Associated | Speech coding/encoding using celp |
US5307441A (en) * | 1989-11-29 | 1994-04-26 | Comsat Corporation | Wear-toll quality 4.8 kbps speech codec |
FI98104C (fi) * | 1991-05-20 | 1997-04-10 | Nokia Mobile Phones Ltd | Menetelmä herätevektorin generoimiseksi ja digitaalinen puhekooderi |
IT1257065B (it) * | 1992-07-31 | 1996-01-05 | Sip | Codificatore a basso ritardo per segnali audio, utilizzante tecniche di analisi per sintesi. |
US5706395A (en) * | 1995-04-19 | 1998-01-06 | Texas Instruments Incorporated | Adaptive weiner filtering using a dynamic suppression factor |
US5692101A (en) * | 1995-11-20 | 1997-11-25 | Motorola, Inc. | Speech coding method and apparatus using mean squared error modifier for selected speech coder parameters using VSELP techniques |
-
1995
- 1995-12-15 FR FR9514925A patent/FR2742568B1/fr not_active Expired - Lifetime
-
1996
- 1996-12-11 US US08/763,457 patent/US5787390A/en not_active Expired - Lifetime
- 1996-12-12 EP EP96402715A patent/EP0782128B1/fr not_active Expired - Lifetime
- 1996-12-12 DE DE69608947T patent/DE69608947T2/de not_active Expired - Lifetime
- 1996-12-13 CN CN96121556A patent/CN1159691A/zh active Pending
- 1996-12-14 KR KR1019960065696A patent/KR100421226B1/ko active IP Right Grant
- 1996-12-16 JP JP33614096A patent/JP3678519B2/ja not_active Expired - Lifetime
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101114415B (zh) * | 2006-07-25 | 2011-01-12 | 元太科技工业股份有限公司 | 双稳态显示器的驱动装置及其方法 |
CN102638846A (zh) * | 2012-03-28 | 2012-08-15 | 浙江大学 | 一种基于最优量化策略的wsn通信负载降低方法 |
CN102638846B (zh) * | 2012-03-28 | 2015-08-19 | 浙江大学 | 一种基于最优量化策略的wsn通信负载降低方法 |
CN110299146A (zh) * | 2014-01-24 | 2019-10-01 | 日本电信电话株式会社 | 线性预测分析装置、方法、程序以及记录介质 |
CN110415714A (zh) * | 2014-01-24 | 2019-11-05 | 日本电信电话株式会社 | 线性预测分析装置、方法、程序以及记录介质 |
CN110415714B (zh) * | 2014-01-24 | 2022-11-25 | 日本电信电话株式会社 | 线性预测分析装置、线性预测分析方法以及记录介质 |
CN110299146B (zh) * | 2014-01-24 | 2023-03-24 | 日本电信电话株式会社 | 线性预测分析装置、方法以及记录介质 |
CN106463136A (zh) * | 2014-06-26 | 2017-02-22 | 高通股份有限公司 | 基于高频带信号特征的时间增益调整 |
CN106463136B (zh) * | 2014-06-26 | 2018-05-08 | 高通股份有限公司 | 基于高频带信号特征的时间增益调整 |
Also Published As
Publication number | Publication date |
---|---|
KR970050107A (ko) | 1997-07-29 |
US5787390A (en) | 1998-07-28 |
FR2742568A1 (fr) | 1997-06-20 |
EP0782128B1 (fr) | 2000-06-21 |
EP0782128A1 (fr) | 1997-07-02 |
DE69608947T2 (de) | 2001-02-01 |
KR100421226B1 (ko) | 2004-07-19 |
FR2742568B1 (fr) | 1998-02-13 |
JPH09212199A (ja) | 1997-08-15 |
JP3678519B2 (ja) | 2005-08-03 |
DE69608947D1 (de) | 2000-07-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1159691A (zh) | 用于声频信号线性预测分析的方法 | |
CN1112671C (zh) | 综合分析语音编码器中噪声隐蔽电平适应性修改方法 | |
CN101180676B (zh) | 用于谱包络表示的向量量化的方法和设备 | |
CN1150516C (zh) | 语音编码方法和语音编码器 | |
CN1158648C (zh) | 语音可变速率编码方法与设备 | |
CN1969319A (zh) | 信号编码 | |
AU746342B2 (en) | Method and apparatus for pitch estimation using perception based analysis by synthesis | |
CN1795495A (zh) | 音频编码设备、音频解码设备、音频编码方法和音频解码方法 | |
CN1265217A (zh) | 在语音通信系统中语音增强的方法和装置 | |
EP2120234B1 (en) | Speech coding apparatus and method | |
CN1922658A (zh) | 音频信号的分类 | |
CN104040624B (zh) | 改善低速率码激励线性预测解码器的非语音内容 | |
CN1922659A (zh) | 编码模式选择 | |
CN101061535A (zh) | 用于人工扩展语音信号的带宽的方法和装置 | |
CN105009209A (zh) | 用于降低时域解码器中的量化噪声的装置和方法 | |
CN1161750C (zh) | 语音编码译码方法和装置、电话装置、音调变换方法和介质 | |
CN1509469A (zh) | 语音编解码器中用于线频谱频率矢量量化的方法和系统 | |
CN1486486A (zh) | 用于编码和解码声学参数的方法、设备和程序及用于编码和解码语音的方法、设备和程序 | |
CN1152164A (zh) | 码激励线性预测编码装置 | |
EP2128858B1 (en) | Encoding device and encoding method | |
US6377920B2 (en) | Method of determining the voicing probability of speech signals | |
EP2087485B1 (en) | Multicodebook source -dependent coding and decoding | |
US6377914B1 (en) | Efficient quantization of speech spectral amplitudes based on optimal interpolation technique | |
JPH07199997A (ja) | 音声信号の処理システムにおける音声信号の処理方法およびその処理における処理時間の短縮方法 | |
CN1625681A (zh) | 产生lsf矢量 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C01 | Deemed withdrawal of patent application (patent law 1993) | ||
WD01 | Invention patent application deemed withdrawn after publication |