CN1097396C - 声音编码装置和方法 - Google Patents
声音编码装置和方法 Download PDFInfo
- Publication number
- CN1097396C CN1097396C CN95119970A CN95119970A CN1097396C CN 1097396 C CN1097396 C CN 1097396C CN 95119970 A CN95119970 A CN 95119970A CN 95119970 A CN95119970 A CN 95119970A CN 1097396 C CN1097396 C CN 1097396C
- Authority
- CN
- China
- Prior art keywords
- vector
- noise
- unit
- codebook
- adaptive
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 239000013598 vector Substances 0.000 title claims abstract description 605
- 238000013139 quantization Methods 0.000 title claims abstract description 78
- 230000003044 adaptive effect Effects 0.000 claims description 120
- 238000010606 normalization Methods 0.000 claims description 103
- 230000015572 biosynthetic process Effects 0.000 claims description 51
- 238000000034 method Methods 0.000 claims description 47
- 239000002131 composite material Substances 0.000 claims description 45
- 238000004364 calculation method Methods 0.000 claims description 36
- 230000005540 biological transmission Effects 0.000 claims description 30
- 238000003786 synthesis reaction Methods 0.000 claims description 27
- 230000005236 sound signal Effects 0.000 claims description 15
- 238000004458 analytical method Methods 0.000 claims description 11
- 230000002194 synthesizing effect Effects 0.000 claims description 6
- 238000011156 evaluation Methods 0.000 claims 4
- 238000010586 diagram Methods 0.000 description 23
- 230000008929 regeneration Effects 0.000 description 20
- 238000011069 regeneration method Methods 0.000 description 20
- 230000008859 change Effects 0.000 description 18
- 238000012545 processing Methods 0.000 description 17
- 230000006866 deterioration Effects 0.000 description 16
- 230000000694 effects Effects 0.000 description 14
- 238000003860 storage Methods 0.000 description 13
- 230000008676 import Effects 0.000 description 11
- 230000015654 memory Effects 0.000 description 11
- 238000001914 filtration Methods 0.000 description 10
- 238000012546 transfer Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 8
- 239000000203 mixture Substances 0.000 description 7
- 230000009467 reduction Effects 0.000 description 7
- 230000007704 transition Effects 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 6
- 238000011002 quantification Methods 0.000 description 6
- 230000008901 benefit Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 5
- 239000000284 extract Substances 0.000 description 5
- 238000002360 preparation method Methods 0.000 description 4
- 230000001172 regenerating effect Effects 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 238000005520 cutting process Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 230000033228 biological regulation Effects 0.000 description 2
- 230000004087 circulation Effects 0.000 description 2
- 230000003292 diminished effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000035807 sensation Effects 0.000 description 2
- 210000001260 vocal cord Anatomy 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 244000309464 bull Species 0.000 description 1
- 239000003245 coal Substances 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000012517 data analytics Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 230000010287 polarization Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000009418 renovation Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/94—Vector quantisation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
- H04N19/89—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
在利用由标引指定的编码矢量应表示目标矢量的量化装置中,由误差估计单元进行在不考虑标引编码错误的情况下的编码矢量误差估计和考虑编码错误的情况下的估计,根据不考虑编码错误的错误估计结果,由第1选择单元从多个标引候补中选择出少数的标引候补后,再根据考虑编码错误的误差估计由第二选择单元从由第一选择单元已选择出的少数的标引候补中选择只为了用于表示目标矢量的标引。
Description
本发明涉及用在声音和图象等编码上的矢量量化装置。
矢量量化是把通过对声音信号等采样而获得的许多采样集中的块当作多维矢量空间的一个点并以成批的方式对它们进行编码的方式,是用由标引指定的矢量表示目标矢量的,它被广泛地使用在压缩编码无线传送声音的声音编码等装置中。
在近年来以CELP方式为代表的声音编码方式中,通过采用自适应编码簿和噪声编码簿两个编码簿的矢量量化把构成声源的驱动信号的音调成分的形状和噪声成分的形状表现出来,使这两个形状组合而形成的驱动信号通过特性(滤波器系数)随着时间变化的合成滤波器生成合成声音。为了提高合成声音的质量,在驱动信号的编码单元中进行编码,以便使合成声音的主观误差达到最小。也就是说,利用随从声音中提取的时间变化的误差比例,采用选择。用于分别指定应该从自适应编码簿和噪声编码簿中提取的编码向量的标引方法。因此,以前的CELP方式即使在4k比特/秒的低比特率下,也能提供比较高质量的合成声音。
可是,大家都知道,把以前的CELP方式等用在利用无线移动通信的声音编码装置中时,由于在传送线路上的编码错误对传送的标引的影响而使合成声音的质量大幅度下降。即使附加例如纠错码,在传送线路上状态不良的情况下,仍不能防止这样的编码错误。因此,重要的是提供一种实用的编码装置,该编码装置能把由传送线路的编码错误引起的质量下降达到最小的计划编排在声音的编码过程中。
作为声音编码装置的公知的编码错误对策的方法有在设计编码装置的阶段采取预先设定编码矢量和标引相对应的对策的方法,以便使在作为编码输出的传送参量候补期间内预先保持冗余度的因编码错误而引起的恶化尽可能小,这些方法在例如《电子信息通讯学会论文志》V01 J77-A No.3 pp,485-493,1994″守谷等′CELP编码的激振编码簿的学习法″中已有详细描述。当采用由这种方法设计的编码装置时,在由编码装置选择出的标引信息的编码在传送线路上接收到误码时,是有能起平均地控制由译码装置再生的编码矢量的质量恶化的效果。
可是,在上述的声音编码装置中,在实际动作时,在编码装置进行的标引选拔阶段,由于没有考虑由传送线路的编码错误对质量恶化的影响,所以既使作为编码完全无错误,对编码矢量的误差进行估计也只能从该估计值中选择出噪声编码簿的标引编码。即,在选择出的标引编码中产生误差时,无法估计哪种程度的误差。因此在标引编码中发生错误时,由于该编码错误会在译码侧读出的编码向量中产生大的误差,从而会在再生信号中引起突然发生的质量大幅度下降的问题。
在这种矢量量化方式中,特别是作为利用比特率为8kbit/秒的声音编码的矢量量化方式的VSELP(Vector Sun ExeitedLinear prediction)方式也是公知的。关于VSELp方式在Ira.A.Gerson的″VECTOR SUM EXCITED LINEAR pREDICTION(VSELp)SPEECHCODING AT 8kBpS″proc IEEE Int.Conf on Acoustics,Speech and Signal Processing pp 461-464,April 1990有描述。
VSELp方式的特征之一在于:矢量量化的输出编码即标引的比特数p时,利用预先存储的p个基本矢量并通过这些p个基本矢量的和或差的组合表示2p个编码矢量。
具体地说,将p个基本矢量Vm(n)乘以系数Qim,再将乘积相加便得编码矢量Ui(tn)。其中Vm(n)是表示第m号基本矢量,Ui(n)表示标引为i编码矢量,系数Qim根据i和m的值选取+1或-1中的任何一个值。因此,为了能够利用回归方程寻找最佳的标引i,如果i的比特数p为7-9的大小,则可以把矢量量化所必需的计算量控制在可能进行实时处理的程度。
可是,这种已有的矢量量化方式对必要的标引寻找的计算量的削减效果还不十分明显,在标引的比特数p大于10时,进行实时处理仍很困难。
如上所述,在已有的方法中的矢量量化的装置中,在标引的比特数大的情况下由于寻找最佳的标引所必要的计算量增大而存在使实时处理困难的问题。
在根据CELP方式代表的线性预测分析法的声音编码方式中,驱动信号,增益和滤波器系数是主要的参量。
在就CELP方式进行简单说明时,首先利用声音编码装置通过分析按帧单位分割的输入声音确定加权合成滤波器的滤波系数。为了使从输入声音通过听觉加权处理单元获得的加权输入声音同从加权合成滤波器输出的译码声音的误差达到最小,计算出来自自适应编码簿和噪声编码簿的两个编码矢量,和与这两种编码矢量相乘的增益,把乘以该增益后的两种编码矢量合成作为加权合滤波器的驱动信号。于是,这些驱动信号、增益和合成滤波器的滤波系数的信息作为编码的参数供给声音译码装置。在声音译码装置中根据发送的参数生成译码声音。
因此在这样的声音编码译码装置中,如何减少从编码装置输出的编码参数的信息量是一个重要的课题,为此,正在考虑各种方案。
例如,驱动合成滤波器的驱动信号是使从人的声带发出的信息模式化后的信号,该电功率具有随时间平稳变化的特性。作为削减传送增益编码簿的标引信息时的量化所必要的比特数的一种方法,可以采用利用这个特性的方案。具体地说,先存储过去的帧驱动信号的电功率,对当前帧通过把该电功率同编码矢量的功率相比较预测增益值。然后,把该预测值同实际的增益值的差量化后传送出,在译码侧通过其相反的操作获得实际的增益值。
可是,在该方法中由于利用过去的帧信息,而使在输入声音的上升部和下降部或元音变化部等的过渡区上的增益的预测的偏差变大,所以不一定能够获得期望的量化效果。
如上所述,在CELP方式的声音编码/译码装置中,当传送同编码矢量相乘的增益信息时,在进行应削减使增益编码簿的标引信息量化的比特数的增益量化时,利用前帧的信息的已有技术存在输入信号的过渡部的量化性能未必良好的问题。
为了解决上述问题,本发明第一个目的是提供即使在传送线路中存在编码误差时也可以把再生信号的突然发生的质量恶化控制到最小限度的矢量量化装置。
本发明的第二个目的是提供即使在标引的比特数非常大的情况下也能高速地进行寻找最佳标引的矢量量化装置。
本发明的第三目的是提供可以减少传送增益编码矢量时的量化所必要的比特数且使输入信号的过渡部的量化性能优良的矢量量化装置。
为了达到第一目的,本发明是利用由标引指定的编码簿表示目标向量的矢量量化装置,其特征在于,该装置包括:考虑标引编码错误后对编码矢量误差进行估计的单元,根据该误差估计单元的估计结果从作为为了表示目标矢量而采用的标引的多个候选标引中选择出至少一个标引的单元。
另外,本发明的特征在于包括:估计编码矢量误差的第一估计单元,考虑标引编码错误后估计编码矢量误差的第二估计单元,根据第一估计单元的估计结果从成为为了表示目标矢量而采用的标引的多个候选标引中选择出少数候选标引的第一选择单元,根据第二估计单元的估计结果从被第一选择单元选择出的候选标引中选择出至少一个标引的第二选择单元。
本发明的特征还在于包括:输入有关传送标引信息的传送线路编码错误信息的单元,根据由该输入单元输入的信息调节考虑第二估计单元的编码误差大小的单元。
另外,虽然本发明的误差估计单元可以通过计算求出编码矢量的误差来进行估计的,但是,作为误差估计方法,除了采用实际计算矢量间距离误差方法之外,还可以用通过误差计算的数学公式变形使相当于合成矢量同目标矢量的内积的值和相当于合成矢量的功率的值或将其作为标准值组合起来的简略的误差估计法和不用合成滤波器计算出由于编码错误引起的编码矢量直接的形状误差等的方法。
通常采用矢量量化的声音编码装置,即采用合成合成声音的滤波器和驱动该滤波器的驱动信号表现本发明并利用由标引指定的噪声编码簿表示驱动信号噪声成分,在根据上述方法的声音编码装置所选用的情况下,在从多个标引候选者中选择出为了表示驱动信号的噪声成分而用的标引的过程中,可以应用本发明的选择标引方法。这时应就编码矢量进行加权误差估计。
为了达到本发明的第二目的,在根据相对于目标矢量的代表向量的误差寻找对应于所期望的代表矢量的标引并输出寻找出的标引的矢量量化装置中本发明的的基本特征在于包括:产生把n维个仔矢量的分量与把同此相乘的极性作为分量的n维极性矢量的分量Sn的积作为分量的代表矢量的单元,产生对应于极性矢量的各分量的极性的极性信息的指数单元和根据极性信息指数产生极性矢量的单元。
也就是说,代表矢量产生单元产生把N维仔矢量的分量Vn同对应N维极性矢量的分量Sn的积Vn×Sn(n=0~N-1,|Sn|=1)作为分量的代表矢量。其中,极性信息标引单元最好是把通过指定由定的极性信息产生单元产生的极性矢量的分量Sn的极性的极性信息指定的极性矢量的分量Sn的极性设为Sk[k=1(p、n),(k,p为满足0≤k≤p-1,1≤p≤N的整数)],通过使Sk与该极性信息的第k个比特的值bk相对应,便产生p比特的极性信息标引。
另外,在这种情况下函数L(p,n)最好是用p除n所得的余数,或者是不超过np/N的最大的整数。
另外就满足仔矢量的k=L(p、N)条件的第n个矢量分量计算出目标矢量同代表矢量的部分内积,最好是把该部分内积的极性作为Sk。
扩展本发明的矢量量化装置配备:有多个存储N维仔矢量和仔向量存储器,寻找用于选择存储在这些存储器中的多个仔矢量之一的仔矢量标引的仔矢量标引寻找单元。在这种情况下,代表矢量产生单元产生把由被仔矢量标引寻找单元寻找出的仔矢量标引所选择出的N维仔矢量的分量同把乘以该仔矢量的各分量的极性作为分量的N维极性矢量分量的积作分量的代表矢量。
上述仔矢量标引寻找单元的特征在于具有一个使仔矢量的标引候选数缩减为J个的单元,该单元当把存储在仔矢量存储器中的仔矢量的个数取为I、把仔矢量选取为Vi(i是仔矢量标引,i=0~I-1)时,对于每个所述的仔矢量Vi满足所述的仔矢量的k=L(p、n)(其中k、p是满足0≤k≤p-1,1≤p≤N的整数)的第n个矢量的分量则从上述目标矢量和上述代表矢量的部分内积fk进行计算 。
为了达到第三个目,本发明的矢量量化装置是把帧单位的第一和第二输入矢量作为输入并使同第二输入矢量相乘的增益量化的装置,其特征在于,通过利用当前帧的第一输入矢量计算出逆归一化系数,利用该逆归一化系数使归一化增益进行逆归一化并计算出同第二矢量相乘的增益。
另外,在计算逆归一化系数时,也可以采用对当前帧的第一输入矢量进行定标的输入矢量。
本发明的矢量量化装置是输入帧单位的第一和第二输入矢量。并使同第二矢量相乘的增益量化的矢量装置,其特征在于,利用当前帧的第一输入矢量计算出归一化系数,再利用该归一化系数使同第一矢量相乘的增益归一化。
在这种情况下,计算归一化系数时,也同样可以采用对现帧的第一输入矢量进行定标的输入矢量。
本发明的声音编码装置能完成下述操作:使从自适应编码簿和噪声编码簿获得的自适应编码矢量和噪声编码矢量在分别乘以从增益编码簿获得的归一化增益和固定增益后进行合成,并作为驱动信号供给根据帧单位的输入声音信号的分析结果确定滤波器系数的合成滤波器,根据自适应编码簿的噪声编码簿和增益编码簿分别寻找使由该合成滤波器输出的声音信号和听觉加权处理的声音信号的误差达到最小的自适应编码矢量、噪声编码矢量和增益,把上述自适应的编码矢量、噪声编码矢量,由上述增益编码簿获得的增益和上述合成滤波器的滤波系数作为分别表的编码参数进行输出,其特征在于该声音编码装置配备有:利用由上述自适应编码簿获得的当前帧的自适应编码矢量计算出逆归一化系数的归一化系数计算单元,利用由该单元计算出的逆归一化系数对由上述增益编码簿获得的归一化增益进行逆归一化而获得归一化前的增益的逆归一化单元和输出表示上述归一化增益的编码参数的单元。
本发明的声音译码装置可以完成下述操作:把分别表示自适应编码矢量、噪声编码、归一化增益和合成滤波器的滤波系数编码参数作为输入,使由自适应编码簿和噪声编码簿获得的自适应编码矢量和噪声编码矢量在分别乘以由增益编码簿获得的归一化增益和固定的增益后合成,并作驱动信号供给根据帧单位的输入声音信号的分析结果确定滤波系数的合成滤波器,并对声音信号进行译码,其特征在于配备有:利用由上述自适应编码簿获得的当前帧的自适应编码矢量计算逆归一化系数的逆归一化系数计算单元,利用由该单元计算出的逆归一化系数从上述归一化增益获得同噪声编码矢量相乘的归一化前的增益的单元。
图1是本发明的矢量量化装置的第一实施例编码侧的方框图。
图2是表示第一实施例的编码选择处理的程序图。
图3是第一实施例的译码装置侧的方框图。
图4是本发明的矢量量化装置的第二实施例的编码侧的方框图。
图5是本发明的矢量量化装置的第三实施例的原理的方框图。
图6是本发明的第三实施例的声音编码装置的方框图。
图7是图6的预选择单元的一个例子的详细方框图。
图8是预选单元的其它例子的方框图。
图9是表示在图中所示的预选单元的处理过程的程序图。
图10是图6的基本选择单元一个例子的详细方框图。
图11是表示求出图10所示的基本选择单元的极性信息的处理步骤的程序图。
图12是表示图10中所示的基本选择单元的处理步骤的例子的程序图。
图13是表示第三实施例的噪音编码矢量再生单元的处理步骤的例子的程序图。
图14是本发明的第三实施例的声音译码装置的方框图。
图15是本发明的第四实施例的编码装置的方框图。
图16是本发明的第五实施例的增益量化装置的方框图。
图17是本发明的第六实施例的声音编码装置的方框图。
图18是表示用于说明第六实施例操作的自适应编码矢量、噪声编码矢量和驱动信号的波形图。
图19是本发明第七实施例的声音译码装置的方框图。
图20是本发明第八实施例的增益量化装置的方框图。
图21是本发明第九实施例的增益量化装置的方框图。
图22是本发明第十实施例的声音编码装置的方框图。
图23是本发明第十一实施例的声音译码装置的方框图。
图24是本发明的第十二实施例的增益量化装置的方框图。
下面参照附图说明本发明的矢量量化装置的实施例。
第一实施例
图1是适用本发明的矢量量化装置的第一实施例的声音编码装置的方框图。简单地说,本实施例是对由输入声音合成滤波器系数信息,音调周期信息、噪声编码簿的标引信息和增益编码簿的信息四种信息进行抽样后编码的结构,并且对音调周期信息、噪声编码簿的标引信息和增益编码簿的标引信息进行编码,以便使合成声音的误差(与目标矢量的误差)达到最小,并将这些编码与合成滤波器系数信息一起传送。图1示出了适用利用以CELP方式代表的声音编码法的声音编码装置的例子。
如下面所述,本实施例在噪声编码簿的标引寻找中采用本发明独特的方式。在具体说明图1的构成之前,先参照图2就本发明的噪声编码簿的标引寻找步骤作一说明。
在步骤S0中,根据输入声音设定目标矢量。
在步骤S2中,对无编码错误的合成声音的误差进行估计,选择噪声编码矢量的标引候补。也就是说选择表示能成为目标矢量的适当数量的编码矢量(候补)的指数,例如候补的选择可以按误差的顺序比较编码矢量,根据误差变为最小编码矢量选择出确定的数。
在步骤S2中,对于按上述选择出的指数候补数进行考虑编码误差引起的质量恶化后的误差估计,在步骤S3中,最后确定用于产生目标矢量的一个标引。
下面说明图1的构成。本实施例的声音编码装置配备有:存储过去的一定时间的驱动信号并对应指定的音调周期产生编码矢量自适应编码簿2000、存储各种确定的驱动信号(噪声编码矢量)和根据噪声编码簿标引产生噪声编码矢量的噪声编码簿2180。由这两个编码簿2000和2180获得的编码矢量分别通过增益电路2160和2250给出增益g1、g2后,经加法器2260进行加法运算后作为驱动信号供给合成滤波器2270。这两个增益由增益编码簿2280给出。合成滤波器2270把驱动信号作为输入而输出合成声音。输入声音输入给合成滤波系数信息分析单元2290,合成滤波系数数据分析单元2290分析输入声音对表示声音谱的外形的合成滤波系数信息进行抽取编码,在把该编码作为合成滤波器系数信息供给目标矢量产生单元2300的同时,将合成滤波器的系数供给合成滤波器2270。作为合成滤波信息的分析方法,可以采用例如LpC(线性预测编码)分析法。目标矢量生产单元2300根据输入声音和合成滤波器的信息产生目标矢量,并将该目标矢量输出给误差估计单元。误差估计单元2310利用目标矢量和合成滤波器的系数信息估计对于由合成滤波器2270所获得的合成声音的目标矢量的误差。误差估计单元2310的输出供给编码预选择单元2320和编码选择单元2325。编码预备选择单元2320根据被误差估计单元2310求出的误差估计值选择噪声编码簿2180的候选编码矢量(候选标引)并将选择结果供给编码选择单元2325。编码选择单元2325从被编码预备选择单元2320缩减的少数的候补标引中考虑编码错误并选择出最佳的噪声编码簿的标引。由于必须考虑编码错误,一个用于在传送经路或记录媒体上为编码选择单元2325的输出标引提供模拟编码误差的编码错误处理单元2326连接在编码选择单元2325和噪声编码簿2180之间。
下面详细说明图1中的各构成部件。
自适应编码簿2000被用于选择音调周期。即,自适应编码簿2000存储过去的驱动信息,从预先设定的音调周期候补中选择作为编码参数用的音调周期。具体地讲,把用合成滤波器2270对把音调周期候补供给自适应编码簿2000的编码矢量进行合成获得的合成候补矢量与被目标矢量产生单元2300产生的目标矢量的误差成为最小作为估计的基准,由编码预备选择单元2320选择最佳的音调周期。
作为误差计算方法还有实际计算候补合成矢量与目标矢量的距离误差的方法。通过借助误差计算公式的变换使相当于合成矢量同目标矢量的内积的值和相当于合成矢量功率的值组合起来,使得无论哪个周期候补都能避开对形成固定值的那样的值进行重复计算,通过利用比较少的计算量判定误差大小的方法可以选择出最佳的音调周期。
在自适应编码簿2000的寻找中可以采用与把增益电路2160的增益设定为例如按通常的CELP方式的最适合的增益的等价的编码簿寻找法。而此时把从噪声编码簿2180抽取的编码矢量对驱动信号的影响作为零,进行音调周期寻找。当把噪声编码簿的指数的候补数目限定的非常少时,在考虑到来自噪声编码簿2180的编码矢量对驱动信号的影响后寻找音调周期时,还可以期待进一步寻找出能产生误差少的合成声声音调周期和噪声编码的效果。
下面参照图2所示的程序图说明噪声编码簿标引的寻找步骤。在这里所说明的噪声编码标引的寻找中适用本发明的矢量量化。这时,误差估计单元2310在不考虑噪声编码簿的标引编码误差的情况下进行估计编码矢量误差的第一价评和考虑噪声编码簿的标引编码误差进行估计编码矢量误差的第二估计。
也就是说,首先由误差估计单元2310计算噪声编码簿2180的标引信息编码没有错误时的误差估计结果,由编码预选择单元2320根据该估计结果使预先设定的多个噪声编码簿的候补标引缩减为少量数的噪声编码簿的候补标引,再由误差估计单元2310计算考虑噪声编码簿的标引信息编码错误引起的质量恶化的误差估计结果,就根据该误差估计结果由编码预选择单元2320选择出的少量噪声编码簿的候补标引,由编码选择单元2325进行噪声编码簿的标引候补数进行缩减并进行用在表示驱动信号的噪声编码码簿的标引的寻找。
具体地讲,采用经由编码预选择单元2320寻找路线2340把噪声编码簿的标引候补供给噪声编码簿2180,把由合成滤波器2270合成对应于该噪声编码簿标引的候补的编码矢量后获得的合成矢量候补与根据由目标矢量产生单元2300的输入声音产生的目标矢量的误差变小作为指标,选择出少量的噪声编码簿候补标引。作为此时的误差计算方法,还有实际计算矢量间的距离的方法,通过把借助误差计算公式的变换使相应于合成矢量目标矢量的内积的值和相应于合成矢量功率的值或者象按此看待的值组合,使得无论对哪个噪声编码簿的候补标引都能避免对象作为固定值的那样值重复进行计算,因此,可以通过比较少的计算选择出误差小的噪声编码簿的指数。
在编码选择单元2325中,把被编码预选择单元2320选择出的少数的噪声编码簿的候补标引缩减为更少数的候补标引。在本实施例中,在编码选择单元2325中把噪声编码的标引缩减到仅为I个,最终就能获得传送的噪声编码簿的指数信息。
这时,虽然利用误差估计单元2310的误差估计值的计算可以采用与在无编码错误条件下用的计算同样的误差估计,但是,为了进一步简化计算,通过不使用合成滤波器2270而采由编码错误引起的编码矢量的直接形状误差等的方法,也是选择指数的有效方法。
编码错误处理单元2326对每个接收被编码选择单元2325选择的少数的噪声编码簿的候补标引都能模拟传送路线的编码错误或者记录媒体的编码错误并把标引供给噪声编码簿2180,以便也能对在把该编码错误引起的变化提供给标引时的编码矢量的误差进行估计。
作为考虑传送线路的编码错误或记录媒体的编码错误并对编码矢量的误差进行估计的方法,有例如利用下面所示的误差期望值E的方法。
式中E(i)是表示传送对应于标引i的编码时的误差期望值,p(j|j)是表示标引i由于在传送路线或记录媒体上的编码错误而变为标引j的概率,d(j)是表示对应于标引j的编码矢量的编码无错误时的误差估计值,或者表示简化的误差估计值。例如把在对应于标引i的传送线路或记录媒体上的编码用n比特表示时,这些编码中的1比特发生错误的概率是ε=p(j|i)(但i≠j),全部n比特无错误的概率为1-nε=p(i|j)。
在编码选择单元2325被选择出的少数的噪声编码簿的候补指数中,把给出最佳大小E的标引i作为编码簿的候补标引选择出。在为了把误差量表示为d而定义误差估计值时,由于E变成为误差量的期望值,所以最好是选择使E成为最小值时的标引。
为了简化E的计算,概率p(j|i)的值在门限值以下的情况下,将p预先量化为0,在式(1)中p为0的项不要计算,为了在利用固定小数点DSp(数字信号处理器)时使计算简化起见,将p值量化为(1/2)的n(n为自然数)次方的值的方法也有效的,这儿,可以预先设定式(1)中的p(j|i)的值。
虽然在上面介绍的电子信息通信学会论文杂志V01.J77-ANo3.pp.485-493,1994″字谷等的CELP编码的激振编码簿的学习法″中也记载了式(1)的误差期望值E的定义,但是该文中只是在编码簿的设计阶段中考虑了期望值E,在通常的编码中在指数寻找中利用的是没有考虑传送线路或记录媒体的编码错误的误差估计值。
与此相反,本发明在通常的编码中,把考虑传送路线或记录媒体的编码错误的估计法用在指数的寻找中,这点是与上文大不相同。如此,在编码错误条件下把实际译码的再生信号质量为何种程度作为估计标引的重要指标,所此可以选择标引,从而可以使由编码错误引起的突然发生的质量恶化达到最小。
用图1所示的声音编码装置的构成计算错误期望值E(i)的一个方法可以按下述操作进行;编码错误处理单元2326对于从编码选择单元2325提供的标引i,把概率p(j|i)不可忽略并为大的指数j作为候补标引提供给噪声编码簿2180,取出在按每个对应于j的编码矢量计算出的错误估计值上加权各自概率后的总和。
作为其它的计算E(i)的方法,在编码预选择单元2320中先把每个标引的误差估计值d暂时存储在存储器中,从存储器中读出对于由该编码预选择单元2320选择出的少数的候补标引所很必要的d(j),在作为由编码选择单元2325计算误差估计值的期望值的构成时,图1中的编码错误处理单元2326变为没有必要。
如果采取以上说明的标引寻找方法,则由编码装置侧最后选择出的标引可以提供没有错误时在规定以上的高质量音质,由于在即使有错误时音质恶化也很少,所以甚至在传送路线或者记录媒体上编码发生错误时实际上也很少发生在译码器侧突然发生质量恶化的问题。
下面根据由上述的声音编码装置产生的编码信息说明产生编码声音的声音译码装置的一个实施例。图3是本发明的声音编码装置的一个实施例的方框图。在该图中示出了输入由图1中所示的声音编码装置编码参数时的合成滤波器系数信息,音调周期信息、噪声编码簿的标引信息和增益编码簿的标引信息,根据这些信息产生合成声音的构成。
首先说明驱动信号的再生方法。在自适应编码簿1000中根据从声音编码装置传送出的音调周期信息获得从过去的驱动信号中选择的自适应编码矢量。对于该自适应编码矢量,根据由声音编码装置传送出的增益编码簿的标引信息,把从增益编码簿1290中获得的自适应编码矢量用的增益g1用增益电路1160作乘法后产生第一矢量。
根据由编码装置传送出的噪声编码簿的指数从噪音编码簿1180中取出噪声编码矢量,使该噪声编码矢量经增益电路1250乘以从增益编码簿1290中获得的噪声编码矢量用的增益g2而产生第二矢量。
接着,把由加法器1260进行相加运算的第一矢量和第二矢量的和并再生作为驱动信号。最后把该驱动信号输入到根据从声音编码装置传送出的合成滤波器系数信息而构成的合成滤波器1270进行声音合成,从输出端1280获得该合成声音。
如上所述,若利用第一实施例,根据考虑标引编码错误后的编码矢量的误差估计结果,从可能成为用于表示目标矢量的标引的多个候补标引中选择出期望的标引,因此即使在选择的标引编码中存在编码错误时也能大幅度地降低在再生信号中突然发生的质量严复恶化的可能性。
另外,由于是根据编码矢量的误差估计结果从多个标引中选择的少数的候补标引,所以选择出的少数候补标引实对于在全部候补标引中无编码错误时的再生信号可以确保误差少并在规定的质量以上。再对这些少数的候补标引进行考虑标引信息的编码错误的影响后的误差估计。通过根据该误差估计结果进一步缩减少候补标引的候补数,所以选择编码错误时质量恶化小的候补标引。最后选择出为了表示目标矢量而用的标引。
通常,考虑编码错误影响的误差估计是使计算复杂化,但是本发明中,由于是在通过不考虑编码错误的误差估计使标引的候补数目减少后才进行考虑误差的误差估计,几乎没有增加计算量,并且可以选择出对传送路线或记录媒体的编码错误能稳定控制质量恶化的指数。
另外,在本实施例通过只改变编码侧的编码寻找方法提供一种对付编码错误有效的编码装置,因此,具有既使用在标准化的编码方式下也不需要更换记录编码簿等的表的优点。
接着,说明本发明的其它实施例,在以下实施例中与第一实施例相应的部分用相同的参考数字并略去其详细说明。
第二实施例
图4示出适用于在无线通信系统所使用的声音编码装置的第二实施例,该实施例把本发明的矢量量化装置提供给具有得到有关传送路线编码错误或记录媒体的编码错误信息那样结构的编码装置或者把有关传送线路的编码错误或记录媒体的编码错误的信息提供给编码装置侧。
在第一实施中,编码错误采用的是预先确定的值,也就是说对每个传送线路或每个记录媒体都采用固定值,但在本实施例是这样构成的,即误码率检测器2327从端子2328获得关于传送路线或记录媒体的编码错误的信息,检测有无编码错误或编码错误的大小,使在误差期望值E的计算中用的标引的编码错误的概率p(j/j)的值随着编码错误状态变化并把设定的指令提供给编码选择单元2325。
这样,便获得根据传送线路或记录媒体的误码率的比较正确的误差期望值,具有可以选择出根据状态的最适合的标引的效果。例如,在传送中或在记录再生中获得无编码错误的这个信息情况下,使编码错误的考虑程度降低,或者不考虑编码错误就根据误差最小化原理进行标引寻找,在获得编码错误多的那个信息情况下,则转换成使考虑编码错误的程度增大的标引寻找,这样就容易实现。
在噪音编码簿2180的标引寻找中,可以采用与把增益电路2250的增益设定在例如公知的CELP方式所用的那样的最佳增益上的等价的编码簿寻找法。
增益编码簿的标引信息的编码在本实施例中是采用可以由增益编码簿的标引信息指定的特定增益的增益编码簿2280和寻找路线2350进行的。当寻找增益编码簿的标引信息时,应使合成声音与人声音的误差变小那样地进行寻找。
在本实施例也与第一实施例中的说明的相同,事先由编码预选择单元2320将每个标引的误差估计值d(j)暂时存储在存储器中,从存储器中读出对于由该编码预选择单元2320选择出的少数候选标引所很必要的d(j),在当形成在编码选择单元2325计算误差估计值的期望值的构成时,编码误差处理单元2326变成不必要。另外,对应于本实施例的声音编码装置的声音译码装置也可以采用图3所示的构成。
若按照以上说明的第二实施例,除了第一实施例的效果外,在具有获得关于传送线路或记录媒体的编码错误的信息的那样结构的编码装置和无线通信系统中,根据有关该传送线路或记录媒体的编码错误的信息,在考虑编码错误后的误差估计中改变考虑由编码错误引起影响的程度,以便适合通信线路的编码错误状态,以及进行能够获得误差少的再生信号的标引选择,从而更可以在对付传送线路或记录媒体的编码错误方面进行有效的矢量量化。
在第一和第二实施例的指数选择过程中,首先通过无编码错误时的误差估计缩减了标引的候补数目,接着又对已缩减的候补数目通过考虑因编码错误引起的质量恶化的误差估计进一步缩减标引候补数目,但如果编码簿的尺寸小而全部的标引候补数从开始就少时,显然,用从开始就考虑由编码错误引起的质量恶化的误差估计选择标引的方法(即省略图2的步骤S1而突然实行步骤S3的方法),在实现对于编码错误具有很强的抵抗效果的编码装置方面也是有效的。在步骤S2在无编码错误的条件缩减候补数目后,在有编码误差的条件计算出最佳的标引只是为了削减计算量和计算时间。
另外在第一和第二实施例的标引选择过程中也可以如下述那样选择,首先通过无编码误差时的误差估计缩减标引的候补数目,接着对已缩减的候补数目通过考虑由编码错误引起的质量恶化的误差估计把候补标引缩减成一个标引,就在后一缩减阶段缩减了多个候补,对于所得到的多个候补,根据考虑在例如声音信号的其它区的误差估计结果或考虑增益的误差估计结果等和其它的误差评价结果最后选择出一个标引。
此外,在第一和第二实施例对于在噪声编码簿的指数寻找中适用本发明的矢量量化的例子进行说明,但是不限于此,基本上只要是可以适用矢量量化的参数编码的部分就能使用本发明。
第三实施例
下面说明可以大幅度削减标引寻找所需要的计算量并实时处理能容易实现的实施例。
图5是表示本发明的矢量量化装置的噪音编码矢量产生单元的原理构成图。在该例中,编码簿100是噪音编码簿,作为噪声编码向量存储着多个(I)N维的仔矢量V。I个N维仔矢量用Vi(i=0~I-1)表示。在端子101中输入仔矢量选择用的标引Ic,根据这些标引Ic通过仔矢量选择开关102选择I个仔矢量Vi中的一个。
极性矢量产生单元103从极性信息标引Ip产生N维极性矢量S,由N个乘法器104组成的极性乘法单元105将被开关102选择出的仔矢量V的N个分量Vn(n=0~N-1)分别同由极性矢量产生单元103产生的极性矢量S的N个元素Sn相乘,由此产生把Vn×Sn的积作为元素的代表矢量V。
如把这样的矢量再生单元用在矢量量化装置上,即使代表矢量标引的比特数大的情况下,也可以在少计算量下高速地进行最佳代表矢量标引的寻找,完成适合实时处理的计算。下面用具体例子说明这个效果。
例如考察采用由20比特的信息表示220(=1048576)个代表矢量的编码簿,使8kHz采样的声音数据进行矢量量化。
这时,以前的VSELp方式可以用20个仔矢量的和或差的组合表示220个代表矢量,但是为了寻找出其中的适合的代表矢量,必需220次误差计算循环。为寻找这样多的循环次数的代表矢量必需大约数4MIpS左右的巨大计算量。
与此相反,在本发明的一个状态把一个仔矢量的分量分割成20区间,通过将各个区间的每个矢量分量乘以+1或-1的极性可以不采用矢量的和或差等而只用极性信息组成表观220个代表矢量。每个区间的极性是1比特,所以只用20比特的信息就能再生一个代表矢量。适合的代表矢量极性由于可以只由1次简单的矢量的内积计算(80次积和)和20次的极性判定确定,所以使计算量降到1/10MIpS以下。
在本发明的另一状态,通过在四个仔矢量的选择使用2比特在极性信息上使用18比特的结构,可以表示220代表矢量。在该方法中,矢量的内积计算必需要4次,在适合的仔矢量的寻找中必需要4次误差计算循环,但是计算量为IMIpS左右。
此外,从以上的例子可以明显看出,本发明还使仔矢量的个数比以前方法大幅度减少,由于可以实现20比特的编码簿,所以具有可以节约仔矢量存储所需要的存储器数量的效果。
在本发明中,即使极性信息因传送媒体和存储媒体的编码错误而变质,仍具有可以再生恶化的少量代表矢量的效果。这就是为什么原样的1比特的极性信息形成只对代表矢量的一部分分量的极性产生影响结构。结果是极性信息1比特的错误没有影响到全部代表矢量的形状恶化,而限制在一部分的形状恶化。因此,本发明的向量量化装置对于极性信息具有抵抗编码错误的优点。
下面就本发明的矢量量化装置适用在声音编码装置上的实施例进行说明。图6是表示把有关本发明一实施例的矢量量化适用在声音编码的驱动信号的噪声成分编码上时的编码装置的构成例子的方框图。
输入信号(声音信号)从端子201输入给合成滤波器编码单元202和加权滤波单元203,合成滤波器编码单元202从输入声音信号的分析(LpC分析等)抽取表示声音频谱包络信息的合成滤波器的信息,在对该信息编码后将该编码输出给多路转换器208的同时,根据输入声音信号的分析计算出加权滤波系数信息,将其输出给加权滤波单元203,而把加权处理合成滤波系数信息H输出给音调成分编码单元204,噪音成分编码单元205和局部译码单元207。
加权滤波单元203输入加权滤波器系数信息和输入声音信号和来自局部译码单元207的局部译码信号,输出以块单位可能处理的N维参考声音矢量X。
音调成分编码单元204输入参考声音矢量X,加权合成滤波器系数信息H和来自局部译码单元207的过去的驱动信号,利用公知的方法对进行某个自适应编码簿的寻找,从过去的驱动信号波形抽取在现时点(当前帧)的音调成分的再生所用的音调矢量Yo,在将该标引输出给多路转换单元208的同时输出合成过的音调矢量Xo。
下面将成为本实施例特征的噪声成分编码单元205进行说明。噪声成分编码单元205由噪声编码簿100,参考矢量修正单元211,预选择单元211,基本选择单元213和噪声编码矢量再生单元215构成。
参考矢量修正单元211对从参考声音矢量X中除去音调矢量Xo的影响后的残差矢量用加权合成滤波器系数信息H进行时间逆加权处理,输出已修正的参考矢量R。预选择单元212利用参考矢量R和噪声编码簿100使编码簿的多个候补指数缩减为少数(设为J个)的候补标引。基本选择单元213把来自预选择簿212的J个候补标引进一步精减,最后把一个候补标引选择作为标引Ic进行处理。
噪声编码矢量再生单元215的构成如图5所示,它把通过用与来自基本选择单元213的仔矢量标引Ic对应的来自噪声编码簿100的仔矢量V和与来自基本选择单元213的极性信息标引Ip对应的极性矢量S的每个分量相乘获得的代表矢量U作为形状最佳化噪音编码簿Y1而求出。噪声编码矢量再生单元215利用噪声编码矢量Y1和来自合成滤波器编码单元202的加权合成滤波器系数信息H,也输出合成的噪声编码矢量X1。
下面详细说明噪声编码单元205的各部分。
图7与噪声编码簿100一起示出了预选择单元212的详细构成。在此,为了使说明简单起见,假设矢量的维数N=6,极性信息标引Ip的比特数p=2。另外,以把上述的函数L作为L(p,n)=n mod p(用p去除n时的余数)作为例子进行说明。
在图7中,部分内积计算单元301计算出从噪声编码簿100抽取的标引i的仔矢量Vi和修正的参考矢量R的部分内积fk(k=0~p-1)。部分内积fk对于矢量分量的位置n=0~N-1只就满足k=n mod p的分量求出内积值。因而,以p=2,N=6为例,可以计算为:
f0=r0v0+r2v2+r4v4 (2)
f1=r1v1+r3v3+r5v5 (3)利用绝对值加法器302计算出这些部分内积fk的绝对值和 由比较器303按cor(i)的大小顺序排列,选择出J个对应于从最大值到J个噪声编码簿的指数,并将这些标引作为预选择输出。
部分内积的绝对值和cor(i)等于对矢量Vi把极性矢量S调整最佳时的Vi同R的内积值。由此,可以对形状修正后的矢量Vi的标引预选择按cor(i)的最大值进行寻找。
作为预选择单元212的另一构成的例子,存储在噪音编码簿100的仔矢量Vi的模未正规化时,可以按例如图8所示的方式,修正图7所示的构成。在图8中,噪音编码簿100除了仔矢量外,还存储着每个矢量的归一化加权系数Wi。预备选择单元400在归一化绝对值加法器402中根据部分内积fk和归一化加权系数Wi对使归一化绝对值
和从最大开始直至J个值的标引进行J个寻找,并把它作为预选择输出。另外作为归一化的加权Wi的值,可以采用矢量Vi模的倒数。
图9示出了用归一化加权的预选择处理步骤。
在步骤S11中设定I,J,N,p矢量R和编码簿。
在步骤S12中,设仔矢量的标引i=0。
在步骤S13中,对标引i计算矢量R和矢量Vi的部分内积fk,在步骤14中,对所有的k(0~p~1)求fk的绝对值和,并将该和值同加权的Wi相乘计算出归一化的绝对值的和cor(i)。在步骤15中,设i为i+1,在步骤16中判断i是否在I以下,如果在I以下,则重复从步骤13开始的处理。由此,进行到步骤13、14的处理直到i=0~I-1。
在步骤17中,使归一化绝对值的和cor(i)按大小的顺序排列,从最大值选择出J个于J个归一化绝对值和相对应的标引i,把这标引作为i-Opt(j)(j=0~J-1)存储起来。
在步骤18中,把J个选择出的标引作为予选择数据输出。
下面说明基本选择单元213。图10是表示基本选择单元213的构成例子的方框图。该基本选择单元213由部分内积计算单元501、绝对值加法器502、比较器503、极性乘法器504和正交化功率计算单元505构成,使对应于由预选择单元212选择出的J个候补标引i-Opt(j)(j=0~J-1)的仔矢量V从噪声编码簿100的依次抽取顺序而构成,在图中的例子中设p=2,N=6。部分内积计算单元501除了求出对应于从噪声编码簿100中取出的标引的仔矢量V和参考矢量R的部分内积fk(k=0~p-1)外,还求出极性信息比特bk和极性Sk。极性Sk可以按下式计算。
Sk=Sign(dk) (6)
其中,Sign(X)是表示X的极性的值。
极性信息的第k个比特bk可以通过例如设bk=(1-Sk)/2使和极性Sk相对应。
在图11中示出了根据参考矢量R和仔矢量V计算极性Sk和极性信息比特bk的步骤。
在步骤21中,设定N、p、矢量R和仔矢量V。
在步骤22中,利用该矢量R和矢量V计算部分内积fk(k=0~p-1)。
在步骤23中,根据部分内积fk求出极性Sk和极性信息比特bk从而确定极性信息。
在步骤S24中,输出极性Sk和极性信息比特bk。
极性乘法器524利用就V计算矢量后的极性Sk并通过un=Vn×Sk(n=0~N-1,k=n mod p)产生形状最佳化的矢量V。例如当p=2,N=6,而L(p,n)=n moa p时设UO=VOSO U1=V1S1,U2=V2SO,U3=V3S1,U4=V4SO,U5=V5S1。
正交功率计算单元505利用合成矢量U后的音调矢量XO和加权的全成滤波器系数信息,计算正交后U的合成矢量的功率POW,并将其输出给比较器503。
绝对值加法器502,用上述方法计算内积值cor,并将其输出给比较器503。比较器503通过对每个利用内积cor和功率POW的标引进行处理,进行最佳的标引Ic的选择,并在输出与其对应的极性信息标引Ip同时输出Ic。
在图12中示出基本选择单元213的处理步骤。
在步骤31中进行初始化。
在步骤32中根据J-0,m=1-opt(0),Ic=m Vm计算cor2(0),POW(0)。
在步骤S33中判定是否J=I-1,在是的情况下,在步骤S42中计算对应Ic的Ip,在步骤S43中输出Ic和Ip。
在否的情况下,在步骤S34中,设j=j+1,m=1-opt(j),在步骤S35中计算矢量R同矢量Vm的部分内积fk(k=0~p-1)。在步骤S36中,把对应后补指数i-opt(j)的cor(j)的平方值作为cor2(j)计算出。在步骤S37中计算UN=Vn×Sk[k=L(p、n),n=0~N-1]。在步骤38中,设对矢量有U有贡献的功率分量为POW(j)。在步骤S39中,利用cor2和POW使候补标引i-opt(j)同i-opt(j-1)进行下述的比较。
e=cor2(j)×POW(j-1)-cor2(j-1)×POW(j) …(7)
在步骤40中,判断e是否为正值。在是的情况下,在步骤41中,取Ic=m,返回到步骤S33,在否的情况下,立刻返回步骤S33。
这样一来,由基本选择单元213获得的噪声编码簿码的标引(仔矢量标引)Ic和极性信息标引Ip都输入给噪声矢量再生单元215,通过利用来自对应于噪声编码簿的标引Ic的噪声编码簿100的仔矢量V和对应于极性标引Ip的极性矢量S的每个分量的相乘,计算出使形状最佳化的噪声编码矢量(代表矢量)U。
图13示出了噪声编码簿再生单元215的处理步骤。
在步骤S51中,设定表示对应于标引I的仔矢量V和极性信息的标引Ip的各比特bk。
在步骤S52中,根据bk计算出极性Sk。
在步骤S53中通过极性Sk(k=0~p-1)与每仔矢量V的分量的相乘计算出代表矢量U。
在步骤S54中,设该仔矢量U为噪声编码矢量Y1,在噪声编码量再生单元215中再利用加权合成滤波器系数信息H和Y1,计算出合成后的噪声编码矢量X1,并将其输出。
现在再回到对图6进行说明,增益成分编码簿206对分别用在音调成分和噪声成分上的增益进行编码。具体的作法是,输入分别被音调成分编码单元204和噪声成分编码单元105合成的音调矢量Xo和合成的噪声编码矢量X1,通过内装的增益编码簿(图中未示出)的寻找,寻找出使参考矢量X和矢量(g0X0+g1X1)的误差成为最小的增益组(g0,g1)和与此相对应的标引G并将它们输出。
局部译码单元207利用增益g0、g1、音调矢量Y0和噪声编码向量Y1产生对应于当前块(帧)的驱动信号,利用该信号和加权合成滤波系数信息H产生局部译码信号。
多路转换单元208输入由各编码单元204、205、206计算出的编码的参数信息,将这些信息进行多路转换,从输出端209输出给传送媒体或存储媒体。
下面利用图14对从该声音编码装置的传送信息进行译码并输出再生声音的声音译码装置进行说明。
将输入给输入端子601的编码参数信息(合成滤波器系数信息、音调信息、噪声标引信息Ic、极性信息Ip和增益标引信息)在分离单元602中分离成由以下说明的各译码单元用的信息。音调成分译码单元604事先装有象与图6所示的声音编码装置相同地利用过去驱动信号的自适应编码簿(未图示),使用在该编码簿上的标引从分离单元602输入并再生音调矢量Y0。
噪声成分编码单元604由噪声编码簿605和噪声编码矢量再生单元606构成,它利用对应于译码后的噪声编码的标引Ic的矢量V和极性情极标引Ip,通过与图6所示的声音编码装置的噪声编码矢量再生单元215同样的处理,再生使形状最佳化的噪声编码矢量U,并把该矢量U作为矢量Y1输出。增益成分译码单元607象与声音编码装置相同那样地内藏增益编码簿(图中未示出),由译码后的标引G再生标引g0和g1。利用乘法器608、609和加法器610再生驱动g0y0+g1y1。合成声音滤波器611利用译码后的合成滤波器系数信息和驱动信号计算译码声音信号,并将其输出。作为声音译码装置的最终阶段的处理利用后滤波器612。后滤波器612根据可以传送的编码参数信息确定滤波器的特性,把调整译码声音信号的音质作为再生声音信号从端子613输出。
若如以上说明那样遵照第三实施例,产生对应于N维极性矢量S的各分量Sn的极性的极性信息标引,根据该极性信息标引产生N维极性矢量S,通过将该N维极性矢量的分量Sn同N维仔矢量V的分量Vn相乘产生把Vn×Sn(n=0~N-1,|Sn|=1)作为分量代表矢量U,可以非常简单地生成形状相对于一个仔矢量V而随着极性信息标引变化的编码矢量U。
这时,使极性矢量S的分量Sn的极性与Sk[k=L(p,n)(n≤k≤p-1,1≤p≤N)相同,通过Sk同极性信息的第k个比特的值bk对应而作为p比特的极性信息标引,可以把由1个仔矢量V可能产生的编码矢量U的形状限制在最大两个的范围。
此外,通过改变函数L(p,n)的p值,可以容易地控制代表矢量U所取出的形状变化数。
另外,通过设函数L(p,n)为
L(p,n)=n mod p …(8)
或L(p,n)=floor(n×p/N) …(9)
式中,floor(X)表示不超过X的最大整数,可以使利用相同极性产生的编码矢量U的分量Un的个数均等。
象通常那样利用上述的函数L可以使表示极性信息的各比特bk的信息有效地反映出编码矢量U的形状变化。
通过就满足k=L(p,n)的第n个矢量分量计算目标矢量R和矢量V的部分内积fk,设Sk=Sign(fk)(Sign(X)是X的正负极性值)可以确定产生使目标矢量R的形状误差变为最小的编码矢量U的极性矢量S。样一来,可以不依赖极性信息标引数的比特数p的大小,用矢量的维数N的数量级小的计算量确定Sk和bk(k=0~p-1)。因此,即使把极性信息标引的比特数设定在10以上,最适合p比特的极性信息(b0,b1,…bp-1)(相当于通量的矢量量化的标引)的寻找所要求的计算量也没有增加,因此本实施例的矢量量化装置特别适合于对实时处理的计算量限制严格的编码装置。
此外,在本实施例还是可以在仔矢量V存在多个的即用量矢Vi(i=0~I-1)表示仔矢量的构成进行扩展的有效方法。也就是说,用为了从Vi中选择出最适合的一个仔矢量V的仔矢量标引Ic和与其相对应的最适合的极性信息Ip的二个信息可以表示编码矢量U。这时,在选择仔矢量标引的过程中用以下手段时,可以大幅度地削减标引探索所要的计算量。也就是说,为了把仔矢量标引的候补数I缩减为小的候补数J,就满足仔矢量Vi的k=L(p,n)(k,p为满足0≤k≤p-1,1≤p≤N的整数)条件的第n个仔矢量的分量从目标矢量和编码矢量的部分内积fk进行计算。可以把仔矢量标引候补数缩减为J(0<J≤I)个。这就是使cor(i)成为从仔矢量Vi中求出的最适合的代表矢量Vi和目标矢量R的内积值的原因。
象上述那样用在本实施例中的矢量量化装置即使把矢量量化使用的标引的比特数p设定成10以上的很大值时,寻找标引所需要的处理量也很少,从而适合于实时处理。
本实施例还使仔矢量Vi的个数J比以前的方法大幅度地减少,由于可以把比较多的编码矢量作为编码簿实现,因此可以节约存储仔矢量所需要存储量。
另外,在本实施例中,即使极性信息因传送媒体和存储煤体的编码错误而畸变,仍具有可以再生劣化小的编码矢量的效果。这就是把原来的1比特极性信息变成为只对编码矢量的一部分分量的极性有影响的构成的理由,极性信息1比特的错误最终不会使编码向量的所有形状畸变,只限于一部分形状畸变。为此,采用本实施例的矢量量化装置对于极性信息具有所谓很强的抵抗编码错误的优点。
第四实施例。
图15是有关第四实施例的声音编码装置的方框图。该实施例用噪声成分编码单元205选择噪声编码簿100的标引和极性信息标引的多个组,利用增益成分编码单元206使这些组的后补最后形成缩减为一组Ic和pc的构成的方面与实施例3不同。
在图15中,噪声成分编码单元205由参考矢量修正单元211、噪声编码簿100、预选择单元212和噪声编码矢量再生部215构成。预选择择单元212利用修正过的参考矢量R和噪声编码簿100将编码簿内的多个指数候补缩减为少数(J个)标引候补。然后与这些J个标引候补的同时将对应于那些的极性信息标引的候补输出给噪声编码矢量再生单元215。噪声编码矢量再生单元215具有与第一实施例的噪声编码矢量再生单元215同样的功能,它将编码簿的矢量标引和对应该标引的极性信息标引的J组候补,以及和对应于该组的噪声编码矢量和合成后的噪声编码矢量的J组输出给增益成分编码单元206。增益成分编码单元206分别对输入的J组候补,利用合成音调矢量XO按与第一实施例的增益成分编码单元206相同的方法进行增益编码。然后从J组中选择出对应参考矢量X的误差成为最小的候补,把这时的噪声编码矢量作为Y1,编码簿的标引作为Ic,极性信息标引作为Ip,把增益g0和g1输出给局部译码单元207,同时把Ic,Ip和增益编码簿的标引G输出给多路输换器208。
由于其它方面与第三实施例的构成相同,所以省略其说明。
第五实施例
在上述的声音编码/译码装置中使从编码装置传送的编码信息量如何减少是一个重要的课题,特别是合成滤波器的驱动信号是被称为从人的声带发出的信号模式化的信号,由于其电功率具有随时间平稳变化的特征,所以利用这一特征削减传送增益编码簿的标引信息时量化所必要的比特数的方法有各种方案,下面就在传送与该编码矢量相乘的增益信息时进行应该削减使增益标引簿的标引信息量化的比特数的增益量化的实施例进行说明。
在图16中示出了根据本实施例的增益量化装置的构成。在端子p1和p2输入的编码矢量Cx,Cy通过增益电路11,12分别同增益Gx,Gy相乘后经加法器13合成为输出矢量G2,从端子p5输出。从端子p4供给增益Gz,从逆归一化单元15供给增益Gy。
输入矢量Cx,Cy输入给归一化系数计算单元14,由此,计算出归一化系数NY。接着,增益电路12的增益GY利用归一化系数NY,逆归一化地计算出供给逆归一化单元15的正规化增益LY。增益电路11的增益GX和增益电路12的归一化增益LY根据需要进行量化后传送给传送媒体或存储在存储媒体中。
在此,正规化系数Ny可以用下式表示
而px,py分别表示输入矢量Cx,Cy的电功率。
在功率px的值被设计成预先一定的值或基本上是一定的值的情况下,归一化系数Ny还可以按下式计算:
利用该归一化系数Ny可以按下式计算增益Gy
Gy=Ly÷Ny。 (12)
本实施例的增益量化装置如用后述声音编码装置的实施例所说明的那样,输入矢量Cx的电功率基本上等于输出矢量Cz的电功率,输入矢量Cy在象从噪声编码簿获得的编码矢量那样在不进行电功率调节的矢量的情况下,运行效率特别高,这时虽然增益电路11的增益Cx取接近1.0的值,但是提供给增益电路12的增益Gy随着输出向量Cz的大小而变化。
在此,即使若在利用本实施例而使输出矢量Cz值变化的情况,象从式(12)那样变得很明显,形成不改变归一化增益Ly值的构成。因此,与把增益Gy的信息按其原样传送存储的情况下相比,使传送存储正规化增益Ly的信息所必需量化的比特数削减。
下面用简单的例子说明该构成。例如输出矢量Cz的电功率成为4倍。如上所述,由于输入矢量Cx的电功率px与输出矢量Cz的电功率具有基本上相同的性质,所以输入矢量Cy的电功率py也成为四倍。另外,如上所述,输入矢量Cy由于没有调整电功率,最终使供给增益电路12的增益Gy的值变为振幅的2倍。可是归一化的增益Ly从上式变成
Ly=Gy×Ny 即使不改变归一化增益Ly,也可以改变增益电路12的增益Gy。
当不进行这样的逆正规化的情况,由于增益增益Gy随着输出向量Cz的变动而变动,在矢量Gy的信息传送存储时必需要较多的比特。与此相反,在本实施例中,由于正规化增益Ly不随输出矢量Cz的变化而变化,所以能以较少的比特数传送储存。本实施例通常用在声音编码/译码装置的编码例上。
第六实施例
下面参照图17说明采用图16的增益量化装置的声音编码装置的实施例。该声音编码装置与上述的实施例相同,是根据CELP方式构成的,由与图16所示的增益量化装置相同结构的增益量化单元10,增益编码簿30,自适应编码簿31,噪声编码簿32,归一化增益编码簿33,线形预测分析单元35,加权合成滤波器36,听感加权单元37,误差计算单元38和估计单元39构成。估计单元39具有图1的编码选择单元2320、2325,图6的编码单元202、204、205、206和多路转换单元208的功能。
该声音编码装置的运行如下:
应编码的声音信号输入给输入端34。该输入声音信号经线形预测分析单元35分析后计算出加权合成滤波器36的滤波系数。另外,输入声音信号还输入给听感加权单元37,获得加权输入声音信号。通过从该加权输入声音信号除掉前帧的影响后,获得目标信号。
自适应编码簿31通常是随根据用于驱动加权合成滤波器36的过去驱动信号构成的时间一起变化的编码簿,具有根据音调周期产生编码矢量(向下称为自适应编码矢量)的性质。噪声编码簿32通常是存储噪声的编码矢量(以下称为噪声编码矢量)的固定编码簿。从自适应的编码簿31所获得的自适应编码矢量和从噪声编码簿32所获得的噪声矢量分别作为输入矢量Cx,Cy输入给图16所示的增益量化单元10的端子p1和p2。
在增益量化单元10中,输入给端子p1的自适应编码矢量Cx在增益电路11中与来自从端子p4的增益编码簿30的增益编码矢量表示的规定的增益Gx相乘,输入给端子p2的噪声编码矢量在增益电路12中同从逆归一化电路15输出的增益Gy相乘。然后把由加法器13对增益电路11、12输出进行相加后的输出矢量作为用于驱动加权合成滤波器36的驱动信号从输出端p5输出。另外,该驱动信号还输入(存储)给应备有下一帧处理的自适应编码簿31中。、
估计单元39对被加权合成滤波器36所获得的合成信号同目标信号的误差进行估计,从自适应编码簿31,噪声编码簿32和增益指数编码簿33中寻找出该误差变为最小的自适应编码矢量,噪声编码矢量和增益的组合。然后由估计单元39估计由误差计算单元38计算出的误差,把表示使该误差成为最小时的加权合成滤波器36的滤波器系数的标引F,表示从自适应编码簿31来的自适应编码矢量的标引I,表示来自噪声编码簿32的噪声编码矢量的标引J,表示对来自归一化编码簿33的增益电路12的增益Gy归一化的归一化增益Ly的标引k和表示来自增益编码簿30的增益电路11的增益Gx的标引L作为编码参数输出给图中未示出的传送媒体或存储媒体。
本实施例的特征在于:噪声编码矢量的增益Gy是根据从归一化增益编码簿33获得的归一化增益编码Ly和从归一化系数计算单元14获得的归一化系数Ny而获得的。也就是说,本实施例的增益编码单元10着眼于,输入给加权合成滤波器36的驱动信号电功率的大部分是自适应编码簿31的自适应编码矢量的电功率,并也利用了这些功率。这个倾向在支配音质的有声范围是特别显著的,本实施例在是有声范围显示出特殊的优越性。
作为已有的技术,众所周知的就有根据要编码的当前帧的前一帧采用的驱动信号的电功率进行归一化的方法。在考虑使自适应编码簿31根据前一帧的驱动信号产生时,乍一看,本实施例的构成好象在与这个已有技术相类似,显然这是被误解了,因此,就与已有技术的不同进行说明。
在图18中,示出了来自输入声音的前沿部的自适应编码簿31的自适应编码矢量Cx,来自噪声编码簿32的编码矢量Cy和从加法器13输出的驱动信号(驱动矢量)Cz的两帧部分的波形的例子。
现在考虑处理在图18右侧所示的后半帧的情况,音调相同,即如果加权合成滤波器36的特性相同,由于决定声音大小的是输入给加权合成滤波器36的驱动信号Cz的功率,因此在后半帧中用在增益归一化上的原来驱动信号Cz被认为是图18的区间C2的驱动信号Cz是适合的。然后,由于这个区间C2的驱动信号Cz既是确定增益后获得的信号,又不可能在增益的归一化上使用。因此,在上述的技术中,驱动信号的电功率根据所谓平滑变化的性质,利用前一帧的驱动信号即区间C1的驱动信号Cz的电功率进行增益归一化。不过,从图18中还可以看出,在声音的上升部等由于区间C1和区间C2的驱动信号的Cz电功率的差别很大,所以把区间C1的驱动信号用在增益的归一化还存在效率的问题。
与此相反,在本实施例中,利用当前帧的区间C2的自适应编码矢量Cx的功率计算归一化系数,利用该归一化系数进行增益归一化。该区间C2的自适应编码矢量是根据前一帧驱动信号使音调的波形重复而产生的波形,没有变成与前帧的驱动信号相同的波形。而变成更接近当前帧的驱动信号的波形。因此,区间a2的自适应编码矢量的电功率由于取与区间C2的驱动信号电功率相近的值,利用该相近值计算出归一化系数进行增益归一化,所以可以高效率地进行归一化。
如上所述,根据第六实施例,利用当前帧获得的第一输入矢量Px计算出归一化系数,以该系数为基础从正规化增益计算出第二输入矢量py的增益。
这儿,由于归一化增益不随乘以增益后的输出矢量的变动而变动,所以能以较小的比特数一边传送该数据,一边存储。另外,在当前帧的输入矢量接近输出矢量的情况下,由于利用当前帧的输入矢量计算归一化系数,所以提高了在输入信号的过渡部分上的逆归一化效率和增益量化性能。
因此,在有关本实施例的声音编码装置中在把自适应编码矢量和噪声编码矢量组合而成的驱动矢量作为合成滤波器驱动信号而产生的装置中,在使与噪声编码矢量相乘的增益量化时,利用比较准确地反映当前帧的声音性质的编码矢量即自适应编码矢量计算出归一化系数,利用该系数计算出噪声编码矢量的归一化增益。
第七实施例
下面参照图19说明利用图16的增益量化装置的声音译码装置的实施例。这个声音编码装置是使来自图17所示的声音编码装置经传送媒体或存储媒体输入的编码参数的原来声音信号进行译码的装置,作为编码参数的指数F,I,J,k,L分别输入给合成滤波器4,自适应编码簿41,噪声编码簿42,归一化增益编码簿43和增益编码簿40。
从自适应编码簿41和噪声编码簿42中,根据标引I和J获得与从图17的声音编码装置的自适应编码簿31和噪声编码簿32输出的向量相同的自适应编码矢量和噪声编码矢量,并作为输入矢量Cx和Cy分别输入给由与图16说明的增益量化装置同一结构组成的增益量化单元20的端子p1和端子p2。
在增益量化单元20中,输入给端子p1的自适应编码矢量在增益电路21中与从增益编码簿40获得得的Cx相乘,输入给端子p2的噪声向量在逆归一化单元25中使归一化增益Ly同利用归一化系数Ny经过逆归一化计算获得的增益Gy相乘。然后,使经过加法器23对增益电路21,22的输出进行相加获得的输出矢量成为用于驱动合成滤波器44的驱动信号。根据标引F把合成滤波器44的滤波系数设定与图17中所示的声音编码装置中的合成滤波器36相同的特性,结果,把来自合成滤波器44的原声音信号作为译码输出而获得。
在上述的有关本实施例的声音编码装置中,从第五实施例的声音编码装置经由传送媒体和存储媒体输入的编码参量时使基本声音译码的装置中,利用正确反映当前帧的声音性质的编码矢量即自适应编码矢量计算出归一化系数,通过逆归一化利用归一化系数从编码参数中的归一化增益中求出用于同噪声编码矢量相乘的增益。
第八实施例
在图20中示出了利用有关第五实施例的变形的本实施例的增益量化装置的构成。输入给端子p1和p2的编码矢量Cx,Cy经过增益电路11,12分别乘以增益Gx,Gy后经由加法器13合成变为输出矢量Cz从端子p5输出。
输入矢量Cx,Cy输入给归一化系数计算单元14A,在此计算出归一化系数Ny′。于是,对增益电路12的增益Gy由归一化单元15A正规化后求出的归一化增益Ly根据需要进行量化后传送给传送媒体或存储在存储媒体中。
在此,归一化系数Ny可以用下式表示,
在电功率px的值设定为一预定值或基本上为一定值时,归一化系数Ny′也可以按下式计算出
利用该归一化系数Ny′可以按下式计算出归一化增益Ly
Ly=Gy·Ny (16)
在利用本实施例的增益量化装置,利用由当前帧获得的第一输入矢量计算出归一化系数,根据该归一化系数计算出对第二输入向量的增益值归一化的归一化增益。由于这样计算出的归一化增益不随乘以增益后的输出矢量的变化而变化,所以可以以少的比特数边传送数据边存储该数据。另外,在当前帧的输入矢量接近输出向量时,可以利用当前帧的输入矢量计算归一化系数,因此,在输入信号的过渡部使归一化效率提高,也使增益量化的性能提高。
第九实施例
图21示出了根据有关第五实施例的变形的本实施例的增益量化装置的构成。输入给端子p1和p2的编码矢量Cx,Cy经过增益电路11,12分别同增益Gx,Gy相乘后由加法器134合成作为输出矢量Cz,并从端子5输出。增益电路11的输出矢量Cx′(即输入矢量Cx经增益电路11乘以增益所获得的矢量,即定标成输入矢量)和编码矢量Cy供给逆归一化电路14,计算出逆归一化系数Ny″。增益电路12的增益Cy在逆归一化电路15中利用归一化系数Ny″通过逆归一化而求出归一化增益Ly。
在本实施例的量化装置中,利用对由当前帧而获得的第一输入矢量进行定标所得到的矢量计算出归一化系数,根据该系数通过对归一化矢量进行逆正规化而计算出第二输入矢量的增益值。在此,由于该归一化增益不随乘以增益后的输出矢量的变动而变动,所以可以以小比特数对该信息边传送边存储。另外,在当前帧的输入向量接近输出矢量时,通过利用当前帧的输入矢量计算归一化系数,提高了输入信号的过渡部的归一化效率和增益量化的性能。
在本实施例的增益电路11的增益不一定取接近1.0的值的情况下,本实施例具有比第五实施例增益量化精度高的优点。其理由如下:在第五实施例中将增益电路11的看作1.0而计算出归一化系Ny,与此相反,在本实施例中是考虑增益电路11的增益后算出归一化系数Ny的。
第十实施例
图22示出了利用图21的增益量化装置的声音编码装置的实施例。
第十一实施例
图23是利用图21的增益量化装置的声音译码装置的实施例。
第十二实施例
图24示出了利用有关第五实施例变形的本实施例的量化装置的构成。输入给端子p1和p2的编码矢量Cx,Cy通过增益电路11和12分别乘以增益Gx,Gy后,经过加法器13合成作为输出矢量Cz从端子p5输出。
增益电路11的输出Cx′和输入矢量Cy输入给归一化系数计算单元14A。在此计算出归一化数Ny″。接着,由归一化单元15A对增益电路12的增益Gy进行归一化而求出的归一化增益Ly,根据需要经量化后传送给传送媒体或存储在存储媒体中。
如上所述,按照本发明即使在传送线路上存在编码错误时,能提供一种将再生信号的突然发生的质量下降能抑制到最小程度的矢量量化装置。另外本发明的矢量量化装置即使在标引的比特数大的情况下也可以使寻找标引所需要的处理量减少并能高速地进行标引寻找。此外,由于即使作为编码簿存储的仔矢量的个数变少也可以等效地把多个编码矢量作为编码簿来实现,所以可以产生削减为存储仔向所有的存储器的数量的效果。另外,按照本发明,利用当前帧的第一输入矢量计算归一化系数,并通过对和第二输入的矢量相乘的增益进行归一化,与对利用过去的帧信号的增益进行归一化的手段相比较,特别可以获得在输入信号过渡部的量化性能提高的效果。
本发明的保护范围不限于上述的实施例,它可以有各种变形。例如,虽然各实施例是单独进行说明的,但是也可以将几个实施例适当组合起来。
Claims (18)
1.一种声音编码装置,包括:
噪声编码簿,用于存储多个由噪声编码簿标引指示的噪声编码矢量;
自适应编码簿,用于根据音调信息产生自适应编码矢量,上述自适应编码矢量模拟输入声音;
合成单元,用于根据从上述噪声编码簿中读出的噪声编码矢量,和从上述自适应编码簿中读出的自适应编码矢量,产生合成声音;和
编码单元,用于找寻噪声编码簿标引和音调信息,以使得输入声音和合成声音之间的差异为最小,从而使用噪声编码簿标引和音调信息将输入声音编码,上述编码单元包括:
误差估计单元,用于在考虑到噪声编码簿标引的编码错误的情况下,评定上述差异;和
选择单元,用于根据上述错误估计单元的评定结果,从多个可以用以表示输入声音的标引候补中,选择至少一个标引。
2.根据权利要求1中所述的声音编码装置,其特征在于,上述错误估计单元包括:
输入关于在传送噪声编码簿标引的传送线路的编码错误信息的输入单元;和
根据上述输入单元所输入的编码错误信息,评定上述差异的错误的单元。
3.一种声音编码装置,包括:
噪声编码簿,用于存储多个由噪声编码簿标引指示的噪声编码矢量;
自适应编码簿,用于根据音调信息产生自适应编码矢量,上述自适应编码矢量模拟输入声音;
合成单元,用于根据从上述噪声编码簿中读出的噪声编码矢量,和从上述自适应编码簿中读出的自适应编码矢量,产生合成声音;和
编码单元,用于找寻噪声编码簿标引和音调信息,以使得输入声音和合成声音之间的差异为最小,并从而使噪声编码簿标引和音调信息将输入声音编码,上述编码单元包括:
第一估计单元,用于在不考虑噪声编码簿标引的编码错误的情况下,评定上述差异;
第二估计单元,用于在考虑到噪声编码簿标引的编码错误的情况下,评定上述差异;
第一选择单元,用于根据上述第一估计单元的评定结果,从大数量的每个都可以用以表示输入声音的标引候补中,选择出小数量的标引候补;和
第二选择单元,用于根据上述第二估计单元的评定结果,从上述第一选择单元所选择的小数量的标引候补中,选择出至少一个标引。
4.根据权利要求3中所述的声音编码装置,其特征在于,上述第二估计单元包括:
输入关于在传送噪声编码簿标引的传送线路的编码错误信息的输入单元;和
根据上述输入单元所输入的编码错误信息,评定上述差异的错误的单元。
5.一种声音编码装置,包括:
噪声编码簿,用于存储多个噪声编码矢量;
设定单元,用于把从上述噪声编码簿中读出的噪声编码矢量的各分量的极性设定为+1和-1之一,从而产生在数量上比噪声编码矢量多的变形噪声编码矢量;
自适应编码簿,用于存储模拟输入声音音源的自适应编码矢量;
合成单元,用于将变形噪声编码矢量和从上述自适应编码簿中读出的自适应编码矢量合成,上述合成单元根据合成信号把自适应编码矢量更新;
由合成信号驱动,用于产生合成声音的单元;和
编码单元,用于寻找从上述噪声编码簿读出的噪声编码矢量的标引,和从上述自适应编码簿读出的自适应编码矢量的标引,以使得输入声音和合成声音之间的误差为最小,从而将上述两标引编码。
6.根据权利要求5中所述的声音编码装置,其特征在于,上述设定单元包括:
使极性矢量的分量Sn的极性Sk与极性信息的第k比特的值bk对应,以产生p比特的极性信息指数的单元,其中k=L(p,n),k,p为整数且满足0≤k≤p-1和1≤p≤N,N为正整数;
根据上述极性信息指数产生N维极性矢量的单元;和
产生具有把N维
仔矢量的分量Vn和N维极性矢量的对应分量Sn之间的积Vn×Sn作为分量的变形编码矢量的单元,其中n=0~N-1,|Sn|=1。
7.根据权利要求6中所述的矢量量化装置,其特征在于,上述函数L(p.n)是把n除以p所得到的余数,或是不超过np/N的最大整数。
8.根据权利要求6中所述的矢量量化装置,其特征在于,其中目标矢量和编码矢量之间的部分内积,是对于满足仔矢量的条件k=L(p,n)的第n个矢量分量计算的,并且将部分内积的极性设定为极性Sk。
9.根据权利要求5中所述的声音编码装置,其特征在于,上述设定单元包括:
在储多个N维仔矢量的单元;
搜寻用以选择多个N维仔矢量中的任何一个的仔矢量标引的搜寻单元;
根据极性信息决定极性矢量的分量Sn的极性Sk以产生极性矢量的单元;和
产生具有把上述搜寻单元选择的仔矢量的分量和N维极性矢量的对应分量的积作为分量的变形编码矢量的单元。
10.根据权利要求5中所述的声音编码装置,其特征在于,上述设定单元包括:
在储多个N维仔矢量的单元;
搜寻用以选择多个N维仔矢量中的任何一个的仔矢量标引的搜寻单元;
产生极性信息以指定极性矢量的分量Sn的极性的单元;
根据极性信息决定极性矢量的分量Sn的极性Sk以产生极性矢量;和
产生具有把上述搜寻单元选择的仔矢量的分量和N维极性矢量的对应分量的积作为分量的变形编码矢量的单元;
其中上述仔矢量标引搜寻单元包括一个单元,用于当将仔矢量Vi作为仔矢量时,对每个仔矢量Vi,根据目标矢量和编码矢量对于满足仔矢量Vi的条件k=L(p,n)的第n个矢量分量的部分内积fk,使用以下关系计算: 以减小仔矢量的标引候补数至J,其中k,p为整数,满足0≤k≤p-1和1≤p≤N,N为整数
i为仔矢量标引,并满足I=0~I-1。
11.一种声音编码装置,包括:
噪声编码簿,用于存储多个噪声编矢量;
自适应编码簿,用于存储模拟输入声音音源的自适应编码矢量;
合成单元,用于将从上述噪声编码簿读出的噪声编码矢量和从上述自适应编码簿中读出的自适应编码矢量合成,上述合成单元根据合成信号把存储在上述自适应编码簿的自适应编码矢量更新;
由合成信号驱动,用于产生合成声音的单元;和
编码单元,用于寻找从上述噪声编码簿读出的噪声编码矢量的标引,和从上述自适应编码簿读出的自适应编码矢量的标引,以使得在考虑编码错误的情况下,输入声音和合成声音之间的误差为最小,从而将上述两标引编码。
12.根据权利要求11中所述的装置,其特征在于,上述编码单元包括:
在不考虑编码错误的情况下,预选预定数目的从上述噪声编码矢量读出的噪声编码矢量的标引,以使得输入声音和合成声音之间的错误变得相对地小的单元;和
在考虑到编码错误的情况下,选择从上述噪声编码簿读出的噪声编码矢量的标引,以使得输入声音和合成声音之间的错误为最小的基本选择单元。
13.根据权利要求12中所述的装置,其特征在于,上述编码单元包括:
输入与编码的传送线路上的编码错误有关的信息的输入单元;和
根据由上述输入单元输入的与传送线路上的编码错误的有关信息,而调节上述基本选择单元考虑编码错误的程度的单元。
14.一种声音编码装置,包括:
存储多个噪声编码矢量的噪声编码簿;
存储模拟输入声音音源的自适应编码矢量的自适应编码簿;
将从上述噪声编码簿读出的噪声编码矢量与增益相乘的单元;
存储多个归一化增益矢量的归一化增益编码簿;
根据从上述自适应编码簿读出的自适应编码矢量,计算从上述噪声编码簿读出的噪声编码矢量的逆归一化系数的单元;
根据逆归一化系数对归一化增益矢量进行逆归一,以求出与噪声编码矢量相乘的增益的单元;
将从上述自适应编码簿读出的自适应编码矢量与乘以增益的噪声编码矢量合成的合成单元,上述合成单元根据合成信号更新自适应编码矢量;
由上述合成信号驱动、用以产生合成声音的单元;和
考虑到编码错误,寻找从上述噪声编码薄读出的噪声编码矢量标引,从上述自适应编码簿读出的自适应编码矢量的标引,和从上述归一化增益编码簿读出的归一化增益矢量的标引,以使得输入声音和合成声音之间的错误为最小,并从而将这些标引编码的编码单元。
15.一种声音编码装置,包括:
存储自适应编码矢量的自适应编码簿;
存储噪声编码矢量的噪声编码簿;
存储增益矢量的增益编码簿;
将从自适应编码簿输出的自适应编码矢量和从噪声编码簿输出的噪声编码矢量分别乘以从增益编码簿输出的对应增益矢量的单元;
将分别乘以对应增益矢量的自适应编码簿和噪声编码簿合成,以输出一个合成矢量作为驱动信号的单元;
具有根据以帧为单位的输入声音信号的分析结果决定的滤波系数的合成滤波器,上述合成滤波器接收驱动信号并输出合成声音;
搜寻自适应编码簿,噪声编码簿,和增益编码簿,以输出使得合成声音和输入声音信号的听感加权信号的错误为最小的自适应编码矢量,噪声编码矢量和增益编码矢量的单元;
输出自适应编码矢量,噪声编码矢量,自上述增益编码簿输出的增益矢量,和上述合成滤波器的滤波系数,作为分别代表自适应编码矢量,噪声编码矢量,增益矢量和滤波系数的编码系数的单元;
利用从上述自适应编码簿获得的当前帧的自适应编码矢量计算逆归一化系数的计算单元;
利用由上述计算单元算出的逆归一化系数对归一化增益进行逆归一化,以获得与上述第二矢量相乘的增益的逆归一化单元;和
输出上述归一化增益作为编码参量的单元。
16.一种声音编码方法,包括以下步骤:
存储多个由噪声编码簿标引指示的噪声编码矢量在噪声编码簿中;
使用自适应编码簿,根据音调信息产生自适应编码矢量,上述自适应编码矢量模拟输入声音;
根据从上述噪声编码簿中读出的噪声编码矢量,和从上述自适应编码簿中读出的自适应编码矢量,产生合成声音;和
找寻噪声编码簿标引和音调信息,以使得输入声音和合成声音之间的差异为最小,并从而使用噪声编码簿标引和音调信息将输入声音编码,上述搜寻步骤包括:
在考虑到噪声编码簿标引的编码错误的情况下,评定上述差异;和
根据上述错误估计单元的评定结果,从多个可以用以表示输入声音的标引候补中,选择至少一个标引。
17.一种声音编码方法,包括以下步骤:
存储多个噪声编矢量在噪声编码簿中;
把从上述噪声编码簿中读出的噪声编码矢量的各分量的极性设定为+1和-1之一,从而产生在数量上比噪声编码矢量多的变形噪声编码矢量;
存储模拟输入声音音源的自适应编码矢量在自适应编码簿中;
将变形噪声编码矢量和从上述自适应编码簿中读出的自适应编码矢量合成,上述合成步骤根据合成信号把自适应编码矢量更新;
响应上述合成信号产生合成声音;和
寻找从上述噪声编码簿读出的噪声编码矢量的标引,和从上述自适应编码簿读出的自适应编码矢量的标引,以使得输入声音和合成声音之间的误差为最小,从而将上述两标引编码。
18.一种声音编码方法,包括以下步骤:
存储自适应编码矢量在自适应编码簿中;
存储噪声编码矢量在噪声编码簿中;
存储增益矢量在增益编码簿中;
将从自适应编码簿输出的自适应编码矢量和从噪声编码簿输出的噪声编码矢量分别乘以从增益编码簿输出的对应增益矢量;
将分别乘以对应增益矢量的自适应编码簿和噪声编码簿合成,以输出一个合成矢量作为驱动信号;
用合成滤波器决定滤波系数,上述滤波系数是根据以帧为单位的输入声音信号的分析结果决定的,上述合成滤波器接收驱动信号并输出合成声音;
搜寻自适应编码簿,噪声编码簿,和增益编码簿,以输出使得合成声音和输入声音信号的听感加权信号的错误为最小的自适应编码矢量,噪声编码矢量和增益编码矢量;
输出自适应编码矢量,噪声编码矢量,自上述增益编码簿输出的增益矢量,和上述合成滤波器的滤波系数,作为分别代表自适应编码矢量,噪声编码矢量,增益矢量和滤波系数的编码系数;
利用从上述自适应编码簿获得的当前帧的自适应编码矢量计算逆归一化系数;
利用由上述计算单元算出的逆归一化系数对归一化增益进行逆归一化,以获得与上述第二矢量相乘的增益;和
输出上述归一化增益作为编码参量。
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP238142/94 | 1994-09-30 | ||
JP23814294A JPH08101700A (ja) | 1994-09-30 | 1994-09-30 | ベクトル量子化装置 |
JP05763295A JP3277090B2 (ja) | 1995-03-16 | 1995-03-16 | ゲイン量子化方法及び装置、音声符号化方法及び装置並びに音声復号化方法及び装置 |
JP057632/95 | 1995-03-16 | ||
JP063659/95 | 1995-03-23 | ||
JP06365995A JP3319551B2 (ja) | 1995-03-23 | 1995-03-23 | ベクトル量子化装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1128462A CN1128462A (zh) | 1996-08-07 |
CN1097396C true CN1097396C (zh) | 2002-12-25 |
Family
ID=27296321
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN95119970A Expired - Fee Related CN1097396C (zh) | 1994-09-30 | 1995-09-30 | 声音编码装置和方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US5774838A (zh) |
EP (1) | EP0704836B1 (zh) |
KR (1) | KR100194775B1 (zh) |
CN (1) | CN1097396C (zh) |
CA (1) | CA2159571C (zh) |
DE (1) | DE69526017T2 (zh) |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3357795B2 (ja) * | 1996-08-16 | 2002-12-16 | 株式会社東芝 | 音声符号化方法および装置 |
US5920853A (en) * | 1996-08-23 | 1999-07-06 | Rockwell International Corporation | Signal compression using index mapping technique for the sharing of quantization tables |
JP3707153B2 (ja) * | 1996-09-24 | 2005-10-19 | ソニー株式会社 | ベクトル量子化方法、音声符号化方法及び装置 |
JP3206497B2 (ja) * | 1997-06-16 | 2001-09-10 | 日本電気株式会社 | インデックスによる信号生成型適応符号帳 |
TW408298B (en) * | 1997-08-28 | 2000-10-11 | Texas Instruments Inc | Improved method for switched-predictive quantization |
EP1640970B9 (en) * | 1997-10-22 | 2009-10-14 | Matsushita Electric Industrial Co., Ltd. | Orthogonalization search for the CELP based speech coding |
JP3261691B2 (ja) * | 1997-11-28 | 2002-03-04 | 沖電気工業株式会社 | 符号帳予備選択装置 |
US6292512B1 (en) * | 1998-07-06 | 2001-09-18 | U.S. Philips Corporation | Scalable video coding system |
US6104992A (en) * | 1998-08-24 | 2000-08-15 | Conexant Systems, Inc. | Adaptive gain reduction to produce fixed codebook target signal |
US7072832B1 (en) * | 1998-08-24 | 2006-07-04 | Mindspeed Technologies, Inc. | System for speech encoding having an adaptive encoding arrangement |
JP2001075600A (ja) * | 1999-09-07 | 2001-03-23 | Mitsubishi Electric Corp | 音声符号化装置および音声復号化装置 |
JP3523827B2 (ja) * | 2000-05-18 | 2004-04-26 | 沖電気工業株式会社 | 音声データ録音再生装置 |
KR100415070B1 (ko) * | 2001-04-03 | 2004-01-16 | 주식회사 제로팩 | 진공 및 접착용 포장기 |
JP3887598B2 (ja) * | 2002-11-14 | 2007-02-28 | 松下電器産業株式会社 | 確率的符号帳の音源の符号化方法及び復号化方法 |
GB2418764B (en) * | 2004-09-30 | 2008-04-09 | Fluency Voice Technology Ltd | Improving pattern recognition accuracy with distortions |
DE102005000828A1 (de) | 2005-01-05 | 2006-07-13 | Siemens Ag | Verfahren zum Codieren eines analogen Signals |
US8005671B2 (en) * | 2006-12-04 | 2011-08-23 | Qualcomm Incorporated | Systems and methods for dynamic normalization to reduce loss in precision for low-level signals |
EP3364411B1 (en) | 2009-12-14 | 2022-06-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vector quantization device, speech coding device, vector quantization method, and speech coding method |
CN103636129B (zh) * | 2011-07-01 | 2017-02-15 | 诺基亚技术有限公司 | 多尺度码本搜索 |
US9418671B2 (en) * | 2013-08-15 | 2016-08-16 | Huawei Technologies Co., Ltd. | Adaptive high-pass post-filter |
US9659350B2 (en) * | 2014-01-31 | 2017-05-23 | Morpho, Inc. | Image processing device and image processing method for image correction, and non-transitory computer readable recording medium thereof |
US9503747B2 (en) | 2015-01-28 | 2016-11-22 | Intel Corporation | Threshold filtering of compressed domain data using steering vector |
JP2018526669A (ja) | 2015-07-06 | 2018-09-13 | ノキア テクノロジーズ オサケユイチア | オーディオ信号デコーダのためのビット・エラー検出器 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1045324A (zh) * | 1989-02-03 | 1990-09-12 | 菲利浦光灯制造公司 | 数字辅助电视编码和译码方法及设备 |
CN1081052A (zh) * | 1992-04-10 | 1994-01-19 | 通讯卫星公司 | 高清晰度电视信号的编码技术 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5263119A (en) * | 1989-06-29 | 1993-11-16 | Fujitsu Limited | Gain-shape vector quantization method and apparatus |
JPH0365822A (ja) * | 1989-08-04 | 1991-03-20 | Fujitsu Ltd | ベクトル量子化符号器及びベクトル量子化復号器 |
US5091945A (en) * | 1989-09-28 | 1992-02-25 | At&T Bell Laboratories | Source dependent channel coding with error protection |
CA2027705C (en) * | 1989-10-17 | 1994-02-15 | Masami Akamine | Speech coding system utilizing a recursive computation technique for improvement in processing speed |
DE4013863A1 (de) * | 1990-04-30 | 1991-10-31 | Staff Gmbh & Co Kg | Adapter fuer stromschienen |
JP3045197B2 (ja) * | 1991-07-29 | 2000-05-29 | 日本電信電話株式会社 | ベクトル量子化器の符号帳設計方法 |
US5233660A (en) * | 1991-09-10 | 1993-08-03 | At&T Bell Laboratories | Method and apparatus for low-delay celp speech coding and decoding |
US5495555A (en) * | 1992-06-01 | 1996-02-27 | Hughes Aircraft Company | High quality low bit rate celp-based speech codec |
-
1995
- 1995-09-29 CA CA002159571A patent/CA2159571C/en not_active Expired - Fee Related
- 1995-09-29 EP EP95306952A patent/EP0704836B1/en not_active Expired - Lifetime
- 1995-09-29 DE DE69526017T patent/DE69526017T2/de not_active Expired - Fee Related
- 1995-09-29 US US08/536,362 patent/US5774838A/en not_active Expired - Fee Related
- 1995-09-30 KR KR1019950033430A patent/KR100194775B1/ko not_active IP Right Cessation
- 1995-09-30 CN CN95119970A patent/CN1097396C/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1045324A (zh) * | 1989-02-03 | 1990-09-12 | 菲利浦光灯制造公司 | 数字辅助电视编码和译码方法及设备 |
CN1081052A (zh) * | 1992-04-10 | 1994-01-19 | 通讯卫星公司 | 高清晰度电视信号的编码技术 |
Also Published As
Publication number | Publication date |
---|---|
CA2159571A1 (en) | 1996-03-31 |
KR960013082A (ko) | 1996-04-20 |
EP0704836A3 (en) | 1998-03-11 |
EP0704836B1 (en) | 2002-03-27 |
KR100194775B1 (ko) | 1999-06-15 |
CN1128462A (zh) | 1996-08-07 |
CA2159571C (en) | 2000-03-14 |
EP0704836A2 (en) | 1996-04-03 |
US5774838A (en) | 1998-06-30 |
DE69526017T2 (de) | 2002-11-21 |
DE69526017D1 (de) | 2002-05-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1097396C (zh) | 声音编码装置和方法 | |
CN1200403C (zh) | 线性预测编码参数的矢量量化装置 | |
CN1158648C (zh) | 语音可变速率编码方法与设备 | |
CN1252681C (zh) | 一种码激励线性预测语音编码器的增益量化 | |
CN1172292C (zh) | 在编码宽带信号中用于适应性带宽音调搜寻的方法与设备 | |
CN1202514C (zh) | 编码和解码语音及其参数的方法、编码器、解码器 | |
CN100350807C (zh) | 在不连续传输期间产生安慰噪声的改进方法 | |
CN1240049C (zh) | 语音编码系统 | |
CN1187735C (zh) | 多模式话音编码装置和解码装置 | |
CN1115781C (zh) | 编码器 | |
CN1091535C (zh) | 将语音信号压缩成可变速率数据的方法、设备和电路 | |
CN1288622C (zh) | 编码设备和解码设备 | |
CN1201288C (zh) | 解码方法和设备 | |
CN1156872A (zh) | 语音编码的方法和装置 | |
CN1161751C (zh) | 语音分析方法和语音编码方法及其装置 | |
CN1969317A (zh) | 基于多个参数化的多声道重构 | |
CN1391689A (zh) | 宽带语音和音频信号解码器中的增益平滑 | |
CN1185625C (zh) | 语音编码方法及语音编码装置 | |
CN1441949A (zh) | 语音编码中的前向纠错 | |
CN1154013A (zh) | 信号编码方法和装置 | |
CN1155725A (zh) | 语音编码方法和装置 | |
CN1435817A (zh) | 语音编码转换方法和装置 | |
CN1222926C (zh) | 语音编码方法及其装置 | |
CN101076853A (zh) | 宽带编码装置、宽带线谱对预测装置、频带可扩展编码装置以及宽带编码方法 | |
CN1293535C (zh) | 声音编码设备和方法以及声音解码设备和方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C06 | Publication | ||
PB01 | Publication | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20021225 Termination date: 20091030 |