CN1140362A - 编码器 - Google Patents
编码器 Download PDFInfo
- Publication number
- CN1140362A CN1140362A CN95119106A CN95119106A CN1140362A CN 1140362 A CN1140362 A CN 1140362A CN 95119106 A CN95119106 A CN 95119106A CN 95119106 A CN95119106 A CN 95119106A CN 1140362 A CN1140362 A CN 1140362A
- Authority
- CN
- China
- Prior art keywords
- signal
- pitch
- aforementioned
- input signal
- encoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims abstract description 149
- 239000013598 vector Substances 0.000 claims abstract description 130
- 239000002131 composite material Substances 0.000 claims abstract description 56
- 238000004364 calculation method Methods 0.000 claims abstract description 51
- 239000000203 mixture Substances 0.000 claims abstract description 6
- 230000005540 biological transmission Effects 0.000 claims description 112
- 238000004458 analytical method Methods 0.000 claims description 73
- 230000003044 adaptive effect Effects 0.000 claims description 57
- 238000012545 processing Methods 0.000 claims description 52
- 238000012937 correction Methods 0.000 claims description 26
- 230000006978 adaptation Effects 0.000 claims description 13
- 238000005728 strengthening Methods 0.000 claims description 10
- 230000008901 benefit Effects 0.000 claims description 6
- 230000002708 enhancing effect Effects 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 71
- 230000003014 reinforcing effect Effects 0.000 description 16
- 230000006870 function Effects 0.000 description 15
- 230000005236 sound signal Effects 0.000 description 15
- 238000001514 detection method Methods 0.000 description 12
- 238000013139 quantization Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 8
- 230000000737 periodic effect Effects 0.000 description 7
- 238000007906 compression Methods 0.000 description 6
- 230000006835 compression Effects 0.000 description 6
- 238000012217 deletion Methods 0.000 description 6
- 230000037430 deletion Effects 0.000 description 6
- 239000000047 product Substances 0.000 description 5
- 238000005070 sampling Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000013500 data storage Methods 0.000 description 4
- 238000010187 selection method Methods 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 3
- 150000001875 compounds Chemical class 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 230000007423 decrease Effects 0.000 description 2
- 239000006185 dispersion Substances 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000002787 reinforcement Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000005755 formation reaction Methods 0.000 description 1
- 230000015654 memory Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/09—Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0011—Long term prediction filters, i.e. pitch estimation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
一种编码器,其构成包括:把驱动信号作为向量寄存的自适应代码簿;参照寄存在前述自适应代码簿中的向量获得复合信号的复合滤波器;求取利用前述复合滤波器得到的复合信号和目标信号的相似性的相似性计算部;根据由前述相似性计算部求得的相似性,从预先准备的编码比特率不同的多个编码方式中决定一种编码方式的编码方式部组成的编码方式选择部。
Description
本发明涉及高效地使声音信号(Speech signals)等编码的编码器,尤其是有关适合于可变速度编码(Variable rate coding)的编码器。
声音信号的高效、低比特率编码在汽车电话等移动通信和企业内部通信中,是用于有效利用电波和降低通信成本的重要技术。
近年来,在美国根据码分多址(CDMA)方式的可变速率通信系统已实用化,因此对于有效利用可变速率特性的多信道化和高质量的服务要求提高了。并且还从存储应用的观点出发根据声音的性质进行有效地址分配,所以可变速率声音编码可使存储媒体的有效利用成为可能。在这种的背景下,对可变速率声音编码的研究、开发活跃地进行着。
在固定速率情况中,用8kbps以下比特率、品质优异的声音合成形成可能的声音编码方式,CELP(Code Excited LinearPrediction)方式虽然是公知的,但即使在可变速率领域中,CELP方式也成为主流。在该情况下,在予先确定的多种类例如4种编码比特率中,每个固定帧长度选择1个比特率,在其比特率中利用最适合的CELP方式进行编码。当编码比特率低于1kbps时,也往往在驱动信号中应用随机噪声系列(random noise scheme)的声码器方式(Vocoder system),通常每比特率编码的方式不同。在可变速度编码中,一边达到目标品质一边通过如何能使平均比特率变小以决定可变速率编码方式的优劣,所以各帧的每个编码方式选择法变得重要了。对于此要求作为已有技术提出以下二种方案。
作为第1方法有如根据A·Dejaco等人提出的QCELP方式(文献1:“QCELP:The North American CDMA DigitalCellular Variable Rate Speech Coding Starrdard”,Proc.of the IEEE Workshop on Speech Coding forTelecomm unications,PP5-6,Oct.1993)。在该方式中,所采取的方法是把帧乘方(フレ-ムパワ-)作为特征量抽出,据此选择编码器,并且在根据E.Paksog等人的VRPS方式(文献2:“Variable Rate Speech Coding with PhoneticSegmentation”,Proc.1CASSP 93,PPII-155-158,April1993)中,采取在含有低频声音能量和零交扰(零クロス)比等的7个特征量加权和值基础上选择编码器的方法。
然而象这样的编码方式选择法虽然具有用比较少的计算量就可实现的优点,但译码声音未必能达到用如SNR等规定的目标品质,往往使品质低下。而在输入信号上附加背景噪声后的条件下,不能较好地实施特征量的抽出,存在选择结果欠妥的情况最后导致合成音品质低下。
作为第2方法,还有S.V.Vasegi提出的FS-CELP(FinitState-CELP)方式(文献3:“Finite State CELP forvariable rate speech coding”,1EE Proc.-1,Vol,138,No.6 PP603-610,Dec.1991)。
然而在该编码器选择法中,虽然具有选择的编码器通常能够达到目标品质的优点,但必须对预先准备的全部编码器进行计算,计算量增大,这是问题所在。
由L.Cella rio等人展示了上述第1方法和第2方法的混合法(文献4:“Variable Rate Speech Coding for UMIS”,Proc.of the IEEE Workshop on Speech Coding forTelecommunication,PP1-Z,Oct.1993)。该混合法中,用最初分析输入声音所得到的特征量来限定编码器,接着由所限定的编码器分别进行编码,最后选择使成本函数为最小的编码器。用该方法虽然获得第1方法和第2方法的中间解决办法,但必须使多个编码器工作,依然残存计算量极大的问题。
如上所述,在已有的编码器选择法中分析输入信号提取特征量,并根据其特征量选择编码器的方法中,译码声音未必能达到目标品质,往往出现品质低下的情况,并且在输入信号上附加背景噪声等的情况下,不能实施良好的特征量提取。难以选择适当的编码器,引起合成音的品质低下,这就是问题所在。并且用准备好的全部编码器实施编码而选择成本函数最小的编码器的又一个方法中,以及将这些方法组合的混合法中,存在有计算量增大的问题。
在已有的CELP编码中,当编码比特率下降,则分配给驱动信号的降低了的比特数变少,难以表示间距周期(ピツチ周期)变动和间距波形(ピツチ波形)变化。并且由于在编码过程中间距信息(ピツチ)情报)受到很大损失,所以在译码一侧,即使对由后置滤波器产生的间距信息作恢复处理,但其恢复程度也有限。
还有当象这样存储、传送由附加传输线路码传输过来的编码数据时,问题在于在存储、传送中由于还存储、传输了有关完全不需要的传输线路码的冗余比特,所以存在有存储装置和传输线路的利用率下降的问题。
进而,借助数据的压缩编码方式和再生装置的方式,在传送、存储中依然还存储不需要的压缩编码数据,因此存在有存储媒体和传输线路的利用效率下降的问题。
而且,问题还在于由于上述不需要的传输线路码和压缩码等的编码数据每次要再生译码,所以存在有再生装置的电路规模和消耗电力增加的问题。
本发明目的在于提供一种平均速率小,选择的编码方式能以较少的计算量达到目标品质的编码器。
根据本发明,所提供的编码器构成包括:寄存多个参照向量的自适应代码簿;通过在前述自适应代码薄上寄存的参照向量产生复合信号的复合滤波器;求出前述复合信号和前述输入信号相似性的相似性计算装置;基于由前述相似性计算装置求得的相似性,从预先准备的不同编码比特率的多个编码方式中决定一个编码方式的编码方式确定装置;根据确定了的编码方式使前述输入信号编码的编码装置。
按照本发明,从自适应代码簿中取出参照向量,通过复合滤波器产生复合信号,计算该复合信号和目标信号的相似性,根据该相似性确定编码方式。通常自适应代码簿是CELP方式的编码装置构成要素之一,由于其特征是能良好有效地显现以间距周期反复的目标信号的冗余度,所以对目标信号周期性大的信号,用寄存在自适应代码簿上的驱动信号向量能精确良好表示目标信号。因此,对在目标信号为周期性大的信号的情况下,即使分配复合滤波器驱动信号的比特数较少也能容易地达到目标品质,最终可使编码比特率降低。相反,当目标信号为周期性小的信号时,由于仅仅用自适应代码簿不能精确良好地表示,所以如果编码比特率不变高,则不可能达到目标品质。
从而,本发明求出从自应用代码簿得到的参照向量和目标向量的复合音电平的相似性,当该相似性大时选择低比特率编码方式;当相似性小时选择高比特率的编码方式,借此使平均比特率降低,并且可选择能达到目标品质的适合的编码方式。
即在分析目标信号提取特征量,根据其变化量和大小选择编码方式的方法中,经常存在有达不到目标品质的帧的问题,但是在本发明,使用作为编码器的一个构成要素的自适应代码簿,由于基于用复合音电平的相似性选择编码方式,所以几乎所有帧均可达到目标品质。
另一方面,对预先准备的多个编码器所有部分进行编码。在选择成本函数为最小的编码器的方法中,由于存在计算量增大的问题,在本发明中即使是在确定输入到复合滤波器的参照向量的计算量变得较大的情况下,只要进行自适应代码簿搜索即可使编码方式选择的计算量非常小。当通过目标信号间距分析确定参照向量选择编码方式时,只要利用自适应代码簿的就可以使必要的计算量变的更少。而当通过前帧间距信息确定参照向量选择编码方式时,计算量几乎不增加。
根据本发明如上所述,通过少的计算量就可使平均速率变小,而且可选择达到目标品质的编码方式。
另外,本发明目的在于提供一种编码器,由于获得在译码一侧能满足的复合声音品质,在编码一侧可得到充分的节距信息。
根据本发明提供的编码器构成包括:对输入信号作间距分析(ピツチ分析),提取间距周期及间距增益(ピツチグイン)的间距分析装置;利用由前述间距分析装置提取的间距周期及间距增益,加强前述输入信号的装置;对由前述加强装置所加强的输入信号进行编码的编码装置。
此外,本发明的目的在于提供一种编码数据的存储、传送装置,在使存储媒体和传输线路利用率提高同时,抑制再生装置电路规模的扩大,并且可降低电力消耗。
本发明所提供的一种编码数据的存储、传输装置构成包括:接收附加传输线路码的编码数据的接收装置;从接收的编码数据中将存储、输送中不需要的传输线路码的代码译码除去,同时,附加包括在存储、输送时所需的纠错码的代码、生成压缩编码数据的数据加工装置;存储、输送前述压缩编码数据的存储、输送装置。
附图简述:
图1是本发明第1实施例,是使用自适应代码簿的编码装置方框图;
图2是说明同一实施例处理顺序的程序方框图;
图3是本发明第2实施例,是使用间距分析的编码装置方框图;
图4是同一实施例的处理顺序说明程序方框图;
图5是本发明第3实施例,搜索自适应代码簿的全部参照向量的编码装置方框图;
图6是说明同一实施例处理顺序的程序方框图;
图7是本发明的第4实施例,是使用预测信号的编码装置方框图;
图8是同一实施例的处理顺序说明程序方框图;
图9是本发明的第5实施例,是备有多个编码器的声音编码装置示意方框图;
图10是本发明的第6实施例,是可选择代码方式的声音编码装置构成的方框图;
图11是本发明第7实施例,是备有间距加强部的编码装置方框图;
图12是图11的间距加强部的方框图;
图13是图11编码部的方框图;
图14是间距加强部的处理程序方框图;
图15是本发明的第8实施例,是在图11实施例中附加消除噪声的编码装置方框图;
图16是输入信号的短时间频谱图;
图17是输入信号频谱包络及频谱细微构造关系图;
图18表示间距加强输入信号时的短时间频谱图;
图19表示间距加强输入信号时的频谱包络及频谱细微构造关系的图;
图20是描述有关本发明编码装置的声音译码部的方框图;
图21是本发明的第9实施例,是在编码中切换间距加强信号和输入信号的编码装置的方框图;
图22是本发明的第10实施例,在编码中切换节距加强信号和输入信号的编码装置方框图;
图23是本发明第9实施例判断部的处理程序方框图;
图24是本发明第9实施例判断部的处理程序方框图;
图25是本发明第9实施例判断部的处理程序方框图;
图26是本发明第10实施例判断部的处理程序方框图;
图27是本发明的第7实施例的变形例的方框图;
图28是编码部构成的方框图;
图29是本发明第7实施例的变形例编码装置方框图;
图30是本发明第9实施例的变形例编码装置方框图;
图31是本发明第9实施例的变形例编码装置方框图;
图32是本发明第9实施例的变形例编码装置方框图;
图33是本发明第10实施例的变形例编码装置方框图;
图34是本发明第10实施例的变形例编码装置方框图;
图35是本发明第10实施例的变形例编码装置方框图;
图36是本发明第10实施例的变形例判断部处理程序方框图;
图37是本发明的编码装置中使用的间距加强部方框图;
图38是说明图37的间距加强部工作的程序方框图;
图39是本发明其他变形例的间距加强部方框图;
图40是说明图39间距加强部工作的程序方框;
图41是本发明其他变形例的间距加强部的方框图;
图42是图41的间距加强部工作说明程序方框图;
图43是本发明其他变形例的间距加强部的方框图;
图44是本发明其他变形例的间距加强部的方框图;
图45是本发明编码装置的编码部的方框图;
图46是本发明的第11实施例,是备有间距加强部的编码装置方框图;
图47是本发明的第12实施例,是在间距加强部上连接消除噪声的编码装置的方框图;
图48是本发明的第13实施例,是切换节距加强信号和输入信号的编码装置方框图;
图49是本发明的第14实施例,是切换间距加强信号和输入信号的编码装置方框图;
图50是本发明的第15实施例,是切换间距加强信号和输入信号的编码装置方框图;
图51是本发明的第16实施例,是切换间距加强信号和输入信号的编码装置方框图;
图52涉及本发明的第17实施例,是编码数据的存储、传输装置构成的方框图;
图53是说明数据加工部工作的程序方框图;
图54是具体说明数据加工部工作的图;
图55涉及本发明第18实施例,表示编码数据的存储、传输装置构成的方框图;
图56与发射装置构成一起展示的有关本发明第19实施例的编码数据的存储、传输装置构成的方框图;
图57A及57B分别展示有关本发明第20实施例的编码数据的存储、传输装置及再生装置的方框图;
图58A及图58B分别展示有关本发明第21实施例的编码数据的存储、传输装置及再生装置的方框图。
下面将参照附图说明本发明的实施例。
图1表示有关本发明第1实施例的编码方式选择部(Codingscheme selector)11的构成方框图。该编码方式选择部11根据从输入端子12输入的目标信号γ(n)确定应选择的编码方式,从输出端子13输出编码方式选择信息(Coding scheme selectionin for mation)1,其构成包括:自适应代码簿(adaptivecodebook)14、复合滤波器(synthesis filter)15、相似性计算部(Similarity calculator)16及编码方式决定部(Codingscheme determiming circuit)17。
接着说明有关本实施例的编码方式选择顺序。在本实施例中为简化说明,选择对象的编码方式为2个。编码方式选择信息I的值取“1”或“2”,当I=“1”时,选择比特率低的编码方式;当I=“2”时,选择比特率高的编码方式。
首先,通过输入端子12输入目标信号γ(n)。其次通过自适应代码簿14将参照向量p(n)送出,该向量p(n)通过复合滤波器25产生复合信号q(n),作为一个例子,复合滤波器15在Z变换区域可用下面(1)式表示:
在此,{αi} 10i=1表示LPC(线性预测分析linearlprediction analysis)系数,大于0,则取1.0以下常数。从而若用时间区域表示复合信号q(n)和参照向量p(n)的关系,则有下式(2):
接着在相似性计算部16计算目标信号r(n)和复合信号q(n)的相似性。即在相似性计算部16如下所示,把复合信号q(n)乘最佳增益(Optimum gain)g时的信号和目标信号(target signal)r(n)的SNR值作为相似性U输出。首先如下面(3)式所示,定义复合信号q(n)乘最佳增益g的信号和目标信号r(n)的平方误差值(sqnare error valne)E。E=∑(r(n)-g·q(n))2 (3)
由于使E最小时的g成为最佳增益,所以用g使E偏微分求解g,结果最佳增益g如(4)式所示:
用于该最佳增益g时的目标信号的SNR值S如下式(5)所示:
=-10 log10(1-(∑r(n)q(n))2/(∑r2(n)·∑q2(n))
(5)
其次,在编码方式决定部17用SNR值S判断应该用哪种编码方式。利用阈值(threshold)A,象S≥A时I=1,S<A时I=2那样实施判定法,输出编码方式选择信息I。
归纳以上处理流程,形成图2。首先,开始在步骤S11从自适应代码簿14取出参照向量p(n),接着在步骤S12把参照向量p(n)加到复合滤波器15,形成复合向量q(n);在步骤13求得复合向量q(n)的最佳增益g,再求出目标信息r(n)和g·q(n)的SNR值S;最后在步骤14通过比较SNR值S和阈值A确定选择比特率低的编码公式或比特率高的编码方式的编码方式选择信息I,通过输出端子13输出编码方式选择信息I。
图3是表示有关本发明第2实施例的编码方式选择部21构成的方框图。在与图1具有同一功能的部分标以相同符号进行说明,该编码方式选择部21利用间距分析部22分析目标信号r(n),求出间距T。与第1实施例不同的是用该间距T通过自适应代码薄确定参照的向量p(n)。因而这里说明有关新设置的间距分析部(pitchanalizer)28。
在间距分析部22只是时间T抽样使用过去信号r(n-T)来预测目标信号r(n),把其预测误差信号(prediction error signal)的功率E为最小时的时间T作为间距周期输出。即预测剩余信号功率(prediction residual signal power)E表示为: 这里,g为间距增益,N为间距分析长度(pitch analysislength)。为获得稳定的间距周期(pitch period),间距分析长度如N=256为宜。用间距增益g使式(1)偏微分,当其值为0时,预测误差信号功率E为最小值,若求其解,则为: 使(8)式为最小的T表示间距周期。因(8)式右边第1项为常数,所以实际上成为搜索右边第2项为最大的间距周期T。即间距分析部一边改变T一边计算(8)式右边第2项,若求得右边第2项为最大的T时则输出其间距周期T。这样求得的间距周期T,通过自适应代码簿14取出参照向量P。
归纳以上处理流程产生附图4。首先,开始在步骤S21用间距分析部22分析目标信号r(n)求出间距周期T;接着在步骤S22用间距周期T从自适应代码簿14取出参照的向量p(n),即通过自适应代码簿14搜索对应于所求得的间距周期T的参照向量p(n)。其后为步骤S23、S24、S25的处理,这些处理步骤分别与图2中的步骤S12、S13、S14相同,所以说明从略。
此外,在本实施例中虽然说明用目标信号r(n)求取间距周期T,但用听觉加权滤波器(hearing weighting filter)使目标信号r(n)加权情况下,使用输入声音信号u(n)可进行良好的间距分析。当使用使输入声音信号u(n)通过LPC预测滤波器获得预测剩余信号V(n)时,由于除去了声音信号的包络信息(envelopeinformation),所以可进行更好的间距分析。因此在本实施例中也可以用输入声音信号u(n)或预测剩余信号V(n)代替目标信号r(n)。并且在本实施例中,虽然只说明了有关在间距分析部22中使用1次间距预测滤波器的情况,但也可使用次数更高的预测滤波器。
图5表示有关本发明第3实施例的编码方式选择部31构成的方框图。若与图1具有同一功能的部分标以相同符号进行说明,则该编码方式选择部31把向适应代码簿14内的所有向量作为后补参照向量,在复合滤波器15对有关各个参照向量求取复合向量,与第1实施例不同的是使用搜索部32来搜索与目标向量r(n)最相似的复合向量。因而在此说明有关新设置的搜索部32。
搜索部32按照参照向量搜索寄存在自适应代码簿14中的全部向量,在相似性计算部16计算SNR值S,用SNR值S为最大时的S在编码确定部17确定编码方式,输出编码方式选择信息I。
然而,通常为了搜索未必要达到SNR值,比如可搜索使在(3)式规定的平方误差值E为最小的参照向量,这时,实际上在发现使平方误差值E成为最小的参照向量后计算SNR值,在编码确定部17输入该值。
归纳以上处理流程形成图6。这里,L表示寄存在自适应代码簿14内的向量个数。将(4)式表示的最佳增益g代入(3)式再展开,则产生: 为了使平方误差值E取最小值,作为影响程度求(1)式右边第1项: 变成了寻查该影响程度为最大的参照向量。
开始在步骤S30设变量i=1,iopt=1 Dmax=0;接着经步骤S31和步骤S32求取复合向量qi(n),另外的步骤S31、S32与图2的步骤S11、S12相同,说明从略;然后根据(10)式在步骤S33通过目标向量r(n)和复合向量qi(n)求取影响程度D;再在步骤S34比较影响程度D和最大影响程度Dmax的大小。这里若影响程度D比最大影响程度Dmax大,则在步骤S35将Dmax变成与D一样,这时的i值被寄存在iopt中,然后进入步骤S36;若影响程度D比Dmax小则直接进入步骤S36,在步骤S36使i值只增加1;再在步骤S37对i值和自适应代码簿14中所含的向量个数L进行比较,这里若i小于L则返回步骤S31,重复上述处理流程;若i比L大,则退出循环进入步骤S38,在步骤S38求取目标向量r(n)和g、q iopt(n)的SNR值;在步骤39根据该SNR值S输出编码方式选择信息I。关于步骤S38和S39的处理详情,因与图2的步骤S13和S14一样,说明从略。
根据本实施例,由于可通过寄存在自适应代码簿14中的全部向量求取成为最大SNR值的参照向量,所以与第2实施例不同,特别是对于存在大的背景噪声的输入声音,不受通过间距分析所得的间距正确性和精度的影响,能正确评价表示实际的自适应代码簿14的效率,这是有利的。
另外,在上述实施例中虽然通过自适应代码簿14的全部向量求取参照向量,但作为后补也可搜索由某种程度限定了的数的参照向量。
图7是有关本发明第4实施例的编码方式选择部41构成方框图。若在具有与图1相同功能的部分标以同样的符号进行说明,则该编码方式选择部41在目前帧中也使用通过前帧编码求得的间距信息,确定通过自适应代码簿14以该前帧的间距信息为基础的参照向量P(n)这一点与第1实施例不同。即在本实施例中新设置有缓冲器(バツフア)42,在该缓冲器42中寄存有由前帧求得的间距信息。该间距信息表示利用前帧编码时的自适应代码簿14的搜索结果,也就是说表示在由前帧作编码时自应用代码簿14的搜索所决定的间距。
根据在缓冲器42中寄存的间距信息,从自适应代码簿14取出参照向量p(n)。根据该参照向量P(n)经过相似性计算部16及编码方式确定部门输出编码方式选择信息I。相似性计算部16和编码方式确定部17的处理与第1实施例一样,所以其说明从略。
归纳以上处理流程,形成图8。首先在步骤S41中使用寄存在缓冲器42中的间距周期T,通过自适应代码簿14选择参照向量P(n)虽将其取出;后面的步骤S42、S43、S45的处理分别与图2的步骤S12、S13、S14的处理一样。
这样,本实施例由于利用前帧的间距信息确定参照向量,所以采用第2实施例的间距分析和第3实施例的自适应代码簿14,特别是无须进行确定参照向量的计算,所以用更少的计算量就可得到编码方式选择信息I,这是有利的地方。
其次作为第5实施例,说明在声音编码装置中适用上述编码方式选择部的实施例。图9是有关本实施例的声音编码装置构成方框图。编码方式选择部52采取在第1-第4实施例中所说明的编码方式选择部11、21、31、41的某个结构。编码器53-55是编码方式或换言之编码比特率分别不同的编码器,通过编码方式选择部52选择其中某一个。
下面说明其工作。首先通过输入端子51输出目标信号。该目标信号根据情况通过听觉加权滤波器,并且也可以是减少前帧影响的信号,但在该图中为简单起见,删除了有关其处理的部分。将该目标信号输入到编码方式选择部52,输出编码方式选择信息I,根据该编码方式选择信息I选择编码器53-55中一个,再将目标信号输入在其选择了的编码器中,编码结束后,把作为编码结果求得的编码参数和编码方式选择信号I输入至多路调制器56中,变换成比特流之后从输出端子56输出。
在本实施例中,作为更具体的声音编码装置实施例,说明有关分别在高比特率编码器中利用CELP方式编码器,在低比特率编码器中利用自适应代码簿的随机驱动型LPC声码器(以后称LPC声码器)的情况。
图10是有关本实施例的声音编码装置的方框图。在CELP方式中,作为输出信号输送给译码器的编码参数有:(1)自适应代码簿67的相应向量指数,(2)噪声向量码簿68的噪声向量指数,(3)间距增益码簿69的间距增益指数,(4)噪声增益码簿70的噪声增益指数,(5)LPC量化部74量子化结果所得的LPC指数。
在LPC声码器作为输出信号输送给译码器的参数中有:(1)增益码簿78的增益指数,(2)在LPC量化部82被量子化结果获得的LPC指数,(3)自适应码簿67的适合的向量指数,(4)间距增益码簿69的间距增益指数。
这里,LPC声码器因使用随机数作为驱动信号,所以没有必要把驱动信号信息传输给译码器,可使编码比特率非常之小。而且通常多数情况是在LPC声码器中以低比特率准备好LPC量化部82和增益码簿88,因此使全部比特率控制得更低。
以下说明本实施例的声音编码装置的工作。有关从输入端子61输入的声音信号在LPC分析部62进行LPC分析,求得线性预测系数(以后称LPC系数)。把由自适应代码簿67得到的适合的向量输入到由该LPC系数规定特性的复合滤波器63,求取复合信号。在相似性计算部64计算该复合信号和输入声音信号的相似性,以其结果为基础在编码方式确定部65确定编码方式。
相应于从编码方式确定部65输出的编码方式选择信息,在选择器66选择作为高比特率的编码器的CELP,或作为低比特率编码器的LPC声码器的某一个。
在此,说明有关用选择器66选择CELP方式编码器的情况。CELP方式编码器通过图10虚线上侧表示。
用乘法器71、72分别使自适应代码簿67得到的适合向量和由噪声码簿68得到的噪声向量乘以由间距增益码簿69得到的向距增益及由噪声增益码薄70得到的噪声增益。用加法器73使这些间距增益及噪声增益分别相乘后的适合向量及噪声向量相加,产生复合滤波器75的驱动信号。
另一方面,以由LPC分析部62求得的LPC系数和在LPC量化部74量子化得到的LPC系数为基础规定复合滤波器75的特性,在该复合滤波器75中输入由加法器73输出的驱动信号、借此产生复合信号。利用减法器77从作为通过输入声音信号使前帧影响减小的信号的目标信号中减去该复合信号,求得误差信号。
在听觉加权滤波器78中作加权之后用误差计算部79求其功率、通过该误差信号功率或为最小的适应向量、噪声向量、间距增益和噪声增益配合的自适应代码簿67、噪声码簿68、间距增益码簿69及噪声增益码簿61搜索该误差信号。该结果分别表示所求得的功率为最小时的适应向量、噪声向量、间距增益及噪声增益的适应向量指数、噪声向量指数、间距增益指及噪声增益指数且将示LPC系数的LPC指数作为编码参数输出至未图示的输送媒体或存储媒体并输送至未图示的声音译码装置(speech decodingappratus)。
接着说明有关用选择器66选择LPC声码器的情况。图10中虚线下侧表示LPC声码器。
在LPC声码器中首先经搜索决定自适应代码簿67的指数及间距增益、码簿69的间距增益。
接着在随机数产生部81产生成为平均值C、分散值I的随机数向量,用乘法器89将该随机数向量与增益相乘,再用加法器90将其与通过乘法器71的与间距增益相乘后的适应向量相加,借此产生复合滤波器83的驱动信号。然后在LPC量化部82使LPC系数量子化,以量化后的LPC系数为基础规定复合滤波器83的特性。通过把从乘法器89输出的驱动信号输入到该复合滤波器83生成复合信号,用减法器84从目标信号减去该复合信号,以求得误差信号。
该误差信号在听觉加权滤波器85中加权之后,在误差计算部86求得其功率。利用搜索部87通过增益码簿88求该误差信号功率为最小时的增益。这种场合也可不经搜索而分析地求得增益。表示该误差信号功率为最小的增益的增益指数和表示LPC系数的LPC指数作为编码参数输出至未图示的输送媒体或存储媒体并输送至未图增的声音译码装置中。
并且如第5实施例中的说明,在编码方式确定部65得到的编码方式选择信息I由未图示的多路调制器变换成编码参数和比特流,输出至输送媒体或存储媒体。
在本实施例中,由于在编码器(编码方式)的选择中利用作为根据CELP方式的编码器构成要素的自适应代码簿67及复合滤波器63,所以根据使用如前面第1-4实施例中说明的构成的编码方式选择部,可选择适当的编码方式。
即作为该情况的目标信号的输入声音信号为周期性的大信号时,用寄存在自适应代码簿67中的驱动信号的向量可精确地表示目标信号,所以目标信号在周期性大信号情况下,即便使在复合滤波器的驱动信号中分配的比特数减少也能容易地达到目标品质,从而可使用编码比特率低的LPC声码器。相反,在目标信号周期性小的信号时,由于自适应代码簿67不能精确地表示目标信号,所以在这种情况下只有通过使用编码比特率高的CELP方式编码器才能达到目标品质。
在本实施例中,如第1-4实施例所述,在相似性计算部64求得通过复合滤波器63从自适应代码簿67得到的参照向量的复合信号及作为目标信号的输入声音信号。若该相似性大时选择低比特率编码器;若相似性小时选择高比特率编码器,借此一边使平均比特率降低、一边可容易地实现目标品质。
另一方面,虽然未图示声音译码装置的结构,但对应图10的声音编码装置设置CELP方式及LPC声码器方式的译码器,通过来自声音编码装置的编码方式选择信息、选择这些译码器中某一种,利用其译码器根据来自声音编码装置的编码参数使原来的声音信号译码。
如上所述,根据本发明所提供的编码器,利用能够使自适应代码簿精确地表示目标信号等,由于选择多个已准备的编码方式中的1个作为基础,所以一边抑制选择必要的计算量,一边降低平衡速率,而且能选择实现目标品质的编码方式。
后面根据其他实施例说明声音编码器。
图11表示有关本发明第7实施例的声音编码器的示意性电路方框图。
根据该实施例,从输入端子1输入的输入信号a(n)在间距加强部(pitch emphasis section)100中被作间距加强之后,在编码部200中进行编码,通过输出端子300发射出去,就是说本实施例在编码处理的前处理中设置对输入信号的间距分析和基于分析进行间距加强的间距加强部100。
间距加强部100由如图12展示的间距分析运算部(Pitchanalysis computation unit)101及间距加强运算部(Pitonemphasis computation unit)102组成。间距加强部100的处理内容用图14说明。依次将输入信号a(n)输入至间距分析运算部101。在间距分析运算部101用某分析间隔作间距分析,输出间距周期T和间距增益g,若考虑声音的稳定性和计算量,则将分析间隔取5ms-10ms为妥。
在间距分析运算部101,只是时间T取样使用过去信号a(n-T)预测现在输入信号a(n),把其预测误差信号的功率为最小时的T作为间距周期输出。即预测误差信号功率(prediction errorsignal power)E表示为:
(T=20~147)这里g表示间距增益,N表示间距分析长度(pitch anadysislength)。为得到稳定的间距周期及间距增益,以N=40-256为佳。用g对(11)式偏微分,当其值为0时预测误差信号功率E取最小值,若对其求解,则有: 使(12)式为最小的T表示间距周期。由于(12)式右边第1项表示常数,所以实际上搜索第2项成为最大的T。这时间距增益g表示为: 并且当输入信号a(n)假定为广义固定(generalized stationary)情况下,可把(n)式右边第2项及(13)或右边的分母表示为:若除了间距周期T的搜索回路之外求该值,则可削减计算量。这样,可在间距分析运算部101求出间距周期T及间距增益g(步骤S10)。
在该实施例中,虽然说明了用1阶间距预测滤波器(lirst-order pitch prediction filter)求间距周期及间距增益的方法,但使用高阶预测滤波器也无妨。并且使用其他间距分析手段如零交叉系数法(zero-crossing method)、自相关法(auto-correlation method)及对数倒频谱法(cepstrum method)等也可实现。
以下说明间距加强运算部102。在间距加强运算部102中,在间距分析运算部101求得的间距周期T及间距增益g对输入信号a(n)作间距加强。这里,就使用极型间距滤波器(all pole pitchfiltor)作为说明,极型间距滤波器的传递函数可表达成: 其中A(z)为输入信号a(n)的Z变换值(transform ation value);B(z)为输出信号b(n)的Z变换值;G为增益;g为间距增益,ε为大于0但小于1的常数;ε=0.8为推荐值。并且为了避免成为振荡滤波器,必须监视使g和ε的积通常要小于1。例如g和ε的积超过0.8时,就必须进行非常处理,使g和ε的积被强制抑制在0.8。
若用时间区域表示(15)式,则:
b(n)=G·a(n)+g·ε·b(n-T) (16)根据(16)式,可获得使输入信号a(n)间距加强的信号b(n)(步骤S20)。
这里虽然用1阶间距加强滤波器进行说明,但不仅限于1阶,也可以用与间距分析运算部101的分析次数相同阶数的间距加强滤波器。并且,这里虽然就有关使用极型间距滤波器的情况作了说明,但使用比如零型(all-zero)间距滤波器、极零型(pole zero)间距滤波器等当然也都是可以的。
(16)式表示的间距加强运算虽然根据间距增益g使特性变化,但也可以应用通过预先决定的常数(如0.7)规定的间距加强运算替代使用间距增益g与常数之积作间距加强的方法。这种情况下,由于无需作间距增益g的计算,所以也可以只求(13)式分子项为最大的间距周期T,其效果是减少了计算量。
(16)式的增益G要使得作间距加强运算后的信号b(n)的功率等于输入信号a(n)的功率。在图37所示的构成中,先使G=1,用增益调整运算进行增益调整,使得输入信号a(n)的功率与作间距加强运算后的信号b(n)的功率一致。增益调整运算使输入信号a(n)的功率σa与间距加强后的信号b(n)相乘,以进行增益调整。其具体的处理内容参照图38进行说明。但是,在图37和图38中,与图12及14相同名称部分有同样功能,所以说明从略。
根据下式示出仅使帧长L度缓冲的输入信号a(n)的功率σa(S1012),帧长度L以40-160为佳
与(17)式一样求取对应输入信号a(n)的各取样的加强运算后的信号b(n)功率σb(S1013)。虽然间距加强运算是根据(16)式,但这里要注意使增益G=1的情况(S1013)。
通过σa和σb根据(19)式求出系数ξ(S1014)
若设使每个取样将ξ乘间距加强运算后的信号b(n)的信号为g(n),则g(n)表示为:
g(n)=ξ·b(n) (n=0~L-1) (20)输出g(n)(S1015)。
增益调整运算部103的增益调整方法当然也不仅限于上述方法,基本的作法是通过将决定了的系数乘间距加强运算后的信号b(n),使得由σa和σb输入信号功率和输出信号功率一致来实现的。
图39表示间距加强部100的其他构成,参照图40说明在该间距加强部100中的处理内容。在图39及40中,与图12及14同样名称部分具有同样的功能,所以说明从略。
开始用输入信号a(n)进行LPC分析,求LPC系数(αi∶i=1~P)(S1101)。P表示分析字数,这时使P=10。在LPC分析法中有自相关法、共分散法、FLAT算法等,使用那一种方法均可。接着由LPC系数形成预测滤波器。在该预测滤波器中通过输入信号产生预测误差信号d(n)(S1102)。预测剩余信号d(n)用LPC系数如(21)式所表示。这里,L为帧长度,以40-160为佳。
其中n=0~L-1
下面根据(11)式求使E为最小的间距周期T和间距增益g。但是把(11)式的a(n)置换成d(n)进行运算(S1103);进而再把(16)式的a(n)置换成d(n)进行运算(S1104);最后由LPC系数形成复合滤波器,在该复合滤波器中通过间距加强信号b(n)产生间距加强了的输入信号e(n)(S1105)。
其中n=0~L-1
利用编码部200对这样求得的间距加强了的输入信号e(n)进行编码。
图41中展示了间距加强部100的另外构成。该实施例的结构特征是具有增益调整运算。但是由于在图41及42中,与图39及40同样名称部分具有同样功能,所以说明从略。
在步骤S1103中,在求间距周期和间距增益时,在上述实施例中虽然采取分析预测剩余信号d(n)的方法,但也可以由分析输入信号a(n)来求间距周期和间距增益。然而,由于预测剩余信号排除短时相关,能作更正确的间距分析是已知的,所以令人满意的方法是分析预测剩余信号d(n)的方法。
这样,在图12的结构中输出间距加强信号b(n);在图37的结构中输出输入信号e(n);并且在图41的结构中输出增益调整后间距加强了的输入信号f(n)。编码部200将该输出信号给予进行编码处理。把在编码部200得到编码结果后的标引信息从输出端子300输出。
编码部200可采取根据象图13方框图所记载的CELP方式的构成。在同一图中用间距加强部100使输入信号a(n)作间距加强了的信号通过输入端子201以帧单位输入。帧由L个信号取样组成,当取样频率为8KHz时,一般取L=160。对于在驱动信号向量进行间距加强了的信号系列在LPC分析部215作LPC分析,再把求出的LPC系数在量化部216进行量子化处理,抽出量子化了的LPC系数αi(i=1,2,···,P)和标引(号码),把该LPC系数αi送到LPC复合滤波器213。另外,P为予测次数,一般取P=10。以(23)式给出LPC复合滤波器213的传递函数:
接着说明有关一边使声音信号复合一边搜索最佳驱动信号向量(optimum excitaion signal vector)的过程。首先从输入端子201输入1帧声音信号,用减法器202减去以前帧的复合滤波器213内部状态给与现在帧的影响。把从减法器202获得的信号系列分成4个副帧,成为各副帧的目标信号向量。
LPC复合滤波器213的输入信号的驱动信号向量是将从适应编码簿207选择的适应向量用乘法器209乘以从增益编码簿217得到的一定增益所取得的值与将从白色噪声编码簿208选择的噪声向量用乘法器210乘以从增益编码簿218得到的一定增益所取得的值由加法器212相加而得到的。
这里,适应编码簿207部分里根据利用使文献1中记载的间距预测分析作闭环工作或复合的分析(Analysis by synthesis)进行的。进一步内容在[W.B.Kleijin D.J.Kzasinski and17.Ketchum.“Improved Speech Quality and EfficientVector Quantization in CELP”,Proc.1CASSP,1988,PP.155-158](文献2)中阐明。根据该文献2,在延迟电路211中涉及间距范围a-b(a、b是驱动向量的取样号,通常a=20,b=147),每个取样都使LPC复合滤波器213的驱动信号延迟,以此形成相对a-b取样的间距周期的适应向量。作为代码字将此寄存在适应编码簿207中。
作最佳适应向量搜索时,通过适应编码簿207读出每个对应于各间距周期的适应向量的代码字,在乘法器209中与从增益编码簿217得到的一定增益相乘。利用LPC复合滤波器213作滤波处理,生成复合信号向量。生成的复合信号向量在减法器203中与目标向量相减。该减法器203的输出经过带听觉加权的滤波器204输入到误差计算电路205,求出平均平方误差。平均平方误差的信息再被输入到最小失真搜索电路206,检测其最小值。
以上过程随着适应编码簿207中的全部适应向量的后补进行,在最小失真搜索电路206中求出给予平均平方误差最小值的后补指数。并且在乘法器209中相乘的增益的指数也被确定成平均平方误差为最小。从以上过程所求得的适应向量乘以增益,再经在LPC复合滤波器213的滤波运算产生复合声音信号向量,将从目标向量减去该向量的结果所得信号作为残音向量搜索时的目标信号,然后用同样的方法作最佳噪声向量的搜索。即,通过噪声编码簿208逐个读出噪声向量的代码字,与从在乘法器210中的增益编码簿218得到的增益相乘,经在LPC复合滤波器213的滤波器运算,产生复合声音信号,与目标向量的平均平方误差计算随着全部噪声向量进行,求出给予平均平方误差最小值的噪声向量的指数及增益的指数。象这样通过指数选择部214分别发射适应编码簿207、208所确定的指数、通过LPC量化部216得到的LPC系数αi(i=1,2,···,P)的指数以及输入至上述乘法器209、210的增益的指数。此外,为了对从减法器203输出的误差信号的指数作调整,以降低人耳感觉的失真而使用带听觉加权的滤波器204。
如上所述,为了使输入信号间距加强,要使得更加适合于表示所谓适应编码簿的间距信息的驱动信号模型。因此可以说明既提高了适应编码簿的编码效率又提高了复合声音的主观品质。
另外,作为编码手段不仅限于CELP方式,当然也可用其他编码手段。
图20是根据CELP方式产生的声音译码部的方框图。使用通过编码部输送的适应向量的指数,取出来自适应编码簿401的适应向量。以从编码器输送的指数为基础,通过增益编码簿410使增益译码。在乘法器402中使前述适应向量和前述增益作乘法运算。同样,从噪声编码簿407取出噪声指数用乘法器409与通过增益编码簿401译码3的增益相乘。
其次,在加法器403中使这些向量作加法运算生成驱动向量,使前述驱动向量通过由从编码器输送的LPC系数所设定的LPC复合滤波器404而产生复合信号。为了使复合信号的主观品质提高,使复合信号通过后置滤波器405得到复合声音,从输出端子406输出。最后,在以下处理中所具备的每1个取样延迟被寄存在适应编码簿401中。
并且,在第7实施例中,虽然使用了间距加强了的信息b(n)在编码部200内进行LPC分析,但也可以用输入信号a(n)进行LPC分析。这时,如图27所示在编码部900中输入包括作间距加强了的信号b(n)和输入信号a(n)。
如图28所示,用输入信号a(n)进行LPC分析,这一点与图13不同。用图16、17及18、19说明该例的优点。图16表示输入信号向量,图17表示输入信号的向量包络及向量细微结构,图18表示使输入信号作间距加强时的向量,图19表示使输入信号作间距加强时的向量包络及向量细微结构。
一般声音的短时向量可看作表示音韵信息的向量包络和表示间距信息的向量细微结构之积。LPC系数表示了向量包络,如第7实施例若对于作间距加强了的信号b(n)作LPC分析,则象图19所示使向量细微结构得到加强,声音短时向量(图18)往往在向量细微结构上会受到很大影响。因此,如图19所示难以从作间距加强了的信号中提出正确的LPC系数,这种情况是主观品质变差的原因。
对此,在本实施例中由于用作间距加强前的输入信号a(n)进行LPC分析,所以图16的输入信号短时向量受到图7的向量细微结构方面影响,可提出如图15所示表示大致正确的向量包络的LPC系数。
间距加强部具有图19或图41结构情况下,使用在间距加强部将要作间距加强前的信号a(m)进行LPC分析,求出LPC系数。因此,经编码部900提供作间距加强的输入信号同时在间距加强部求得的LPC系数。若要在编码部重新不进行LPC分析,则如前所述可在编码部用正确的LPC系数,并且无须在编码部作LPC分析。
在图43中展示了在具有图39构成的间距加强部中输出间距加强信号以及LPC系数的间距加强部110。同样,在图44中展示了在具有图41构成的间距加强部中输出间距加强信号以及LPC系数的间距加强部110。并且在图45中展示了由应用间距加强部110时的编码部构成的编码部910。在不进行LPC分析这一点,图45与图28不同。图46展示了间距加强部110和编码部910连接时的构成。从间距加强部110输出的信号在使用图43结构的情况下,则输出作间距加强了的输入信号f(n),并输出在LPC分析获得的LPC系数。
接着,图15是有关本发明第8实施例的声音编码器。在图15中,具有与第7实施例同样名称的部分使其具有与图11的部分同样功能。
本实施例与第7实施例不同点在于用把输入信号a(n)加到噪声消除器400的结果所得到的信号e(n)作间距分析及间距加强。在本实施例中,在噪声消除器中通过输入信号a(n)使背景噪衰减,可以更正确地求得在间距分析部获得的间距周期及间距增益。而且,表示如前所述的大体正确的向量主要形式。为了提取LPC系数,如图29所示使用通过噪声消除器400得到的信号e(n)可进行LPC分析。
接着用图21说明有关本发明第3实施例的声音编码器。在图21中标以与图11同样标号的部分定义为与图11相应部分有同样功能。在此说明从略。
本实施例与第7实施例的不同点在于对输入信号间距加强的信号编码,在判断部500中通过输入信号a(n)作是否使输入信号编码的判断。基于在判断部500中判断的结果,判断部500对切换部510作指示。当象上述实施例对所有输入信号的间距作加强时,即便提供的间距信息不大的输入信号,甚至在不存在间距增益g为0的情况下,在某些间距周期T中也被加强了。其结果,因在输入信号中施加了多余的加强,往往使主观品质变劣。而且在提供混入背景噪声的输入信号情况下,往往因背景噪声影响通过与声音间距周期T不同的间距周期T′加强信号,因此主观品质下降了。该问题在混入的背景噪声周期性高的情况下尤为严重。考虑到这个问题,在下面的实施例中不是使所有的输入信号的间距都得到加强,而是设置一种构成,建立起某种判断条件,只当满足该条件时作间距加强,因此能克服上述问题。作为判断基准,无音部和无声部的输入信号中,如果不是包含如此程度的间距信息情况下不实施间距加强,而有声部大多包括间距信息情况下要作间距加强。此外作为其他判断标准的方法还有、在背景噪声的功率大时不作间距加强,在背景噪声的功率小时实施间距加强。还有在周期性背景噪声混在输入信号时不作间距加强,非周期性背景噪声混在输入信号时作间距加强。下面用图23至25说明图21的判断部500的3种工作。
首先用图23说明编码部500的第7实施例。作为该例的判断基准,其方法是在背景噪声功率大时不作间距加强,而在背景噪声小时作间距加强。
输入输入信号(信息组)a(n)(步骤S600),分析输入信号的背景噪声功率(步骤S601)。再在步骤S602中根据背景噪声功率的阈值S,判断是否使加强输入信号的间距的间距加强信号b(n)编码(步骤S603),是否使输入信号a(n)编码。即当背景噪声功率大于阈值S时(比如理想值20db),指示切换部510使输入信号a(n)编码。当背景噪声功率小于阈值时,指示切换部510使输入信号间距加强了的间距加强信号编码。根据阈值判断是否使间距加强信号编码,是否使输入信号a(n)编码的理由是,由于若背景噪声功率的阈值S过大,则间距加强达到背景部分信号,在译码一侧使加强达到噪声部分的难听的编码信号译码。
接着用图24说明编码部500的第8实施例。该例的判断基准方法为,当周期性背景噪声混在输入信号中时不作间距加强,当非周期性背景噪声混入输入信号时实施间距加强。
输入输入信号(信息组)a(n)(步骤S701),分析输入信号的背景噪声功率(步骤S702)。再在步骤S703中根据背景噪声功率的阈值S判断是否使输入信号a(n)编码(步骤S707)和是否进入下一个步骤S704。即,背景噪声功率大于阈值S(比如理想值为20db)时,指示切换部510使输入信号a(n)编码,而当背景噪声功率小于阈值S时,在步骤S704分析背景部分的间距增益,切换通过该间距增益与阈值G′相比是小还是大来进行编码的对象(步骤S705)。也就是说,间距增益比阈值G′大时指示切换部510使输入信号a(n)编码(步骤S707),当间距增益比阈值G′小时,指示切换部510使输入信号间距加强了时间距加强信号编码(步骤S706)。利用背景部分的间距增益判断是否使间距加强信号编码还是使输入信号a(n)编码的理由是,若进行间距加强达到背景部分有一定周期性时,则在译码一侧使若干难听的编码译码。
下面用图25说明编码部500的第9实施例。作为该实施例的判断基准,其方法中无音部和无声部的输入信号中不含那种程度的间距信息时不作间距加强,如有声部含有多个包括间距信息情况下要作间距加强。
输入输入信号(信息组)a(n)(步骤S801)。分析输入信号背景噪声功率(步骤S802)。再在步骤S803中,根据背景噪声功率的阈值S判断是进入步骤S805还是进入步骤S804,即背景噪声功率大于阈值S(比如理想值为20db)时,作背景部分以外的间距增益分析。而当背景噪声功率小于阈值S时,在步骤S804中分析背景部分的间距增益。当背景部分以外的间距增益小于阈值G″时,指示切换部510使输入信号a(n)编码(步骤S811),而当间距增益大于阈值G″时,指示切换部510使输入信号的间距加强了的间距加强信号编码(步骤S812)。另一方面,背景部分分析结果,当间距增益大于阈值G″时,指示切换部510使输入信号a(n)编码(步骤S808)。当间距增益小于阈值G″时,指示切换部510使输入信号间距加强了的间距加强信号编码(步骤S810)。通过背景部分及背景部分以外的间距增益判断是使间距加强信号编码还是使输入信号a(n)编码的理由是,若加强间距达到背景部分有一定周期性时,则在译码一侧把若干难听的编码信号作为译码。
并且对于事先判明背景噪声几乎不存在的声音,在无音部和无声部的输入信号中达到不包含间距信息的情况下不进行间距加强,有声部包含多个包括间距信息的情况下要进行间距加强的方法,用图36进行说明。在该方法中其优点在于无需依赖于背景噪声的判断条件,利用更为简便的处理即可判断是否进行间距加强。
使输入信号(信息组)a(n)输入(步骤S901),分析输入信号的功率(步骤S902)。再在步骤S903中根据信号功率的阈值S判断是进入步骤S904还是进入步骤S906。即当背景噪声功率大于阈值S(比如理想值为20db)时在步骤S904中作输入信号的间距分析。当背景噪声功率小于阈值S时在步骤S906指示切换部510使输入信号a(n)编码。在步骤S904中求得的间距增益若大于阈值G′,则进入步骤S907,若小于阈值G′则进入步骤906。即,若间距增益大于阈值G′,则指示切换部510使间距加强信号编码,若间距增益小于阈值,则指示切换部510,使输入信号a(n)在步骤S906编码。
根据图21的结构,为了求出表示正确向量包络的LPC系数,使用输入信号a(n),图30表示了进行LPC分析时的结构。
还有,图31示出了在图21中附加有噪声消除器时的构成;图32表示在图30中附加有噪声消除器时的构成。
利用图22说明有关本发明第10实施例的声音编码器。再存在图22中,标以与图11同样号码的部分定义为与图11有同样的功能。在此说明从略。
本实施例与第9实施例的不同之处在于,在判断部520中利用来自间距加强部100的信号判断是对加强输入信号间距的部分编码还是对输入信号编码。根据判断部520中判断的结果,判断部520对切换部510作指示。
利用图26说明在图22的判断部520的工作。输入在间距加强部100的间距分析运算部101得到的间距增益g(步骤S813)。在步骤S814,间距增益g利用功率的阈值g′判断是使加强输入信号间距的间距加强信号编码(步骤S815)还是使输入信号a(n)编码(步骤S816)。
为了求出通过图22表示都是正确的向量包络的LPC系数,使用输入信号a(n),在图33表示作LPC分析时的构成。再有,图34表示在图22附加有噪声消除器时的构成,图35表示在图33中附加有噪声消除器时的构成。
下面以间距加强部110和编码部910的组合作为基础,在图47-51中表示了附加有噪声消除器部500或520时的构成图。
图47是在图46中附加噪声消除器400时的结构图。图48是以图46作为基础所表示的构成,其中用判断部500判断在编码部910中是对自间距加强部110输出的输入信号进行编码还是对输入信号编码。切换部530根据判断部500的判断结果,输出从间距加强部110输出的间距加强信号或输入信号的某一个。并且从切换部530输出从间距加强部110输出的LPC系数,提供给编码部910。
图49表示在图48中附加了噪声消除器400的构成。图50虽然与图48大体有相同的构成,但不同点在于,使用间距加强部110的输出的间距加强信号作为判断部520的分析信号。图51表示在图50中附加有噪声消除器400的构成。
如上所述,根据本发明的声音编码装置,为了在进行输入信号编码前事先进行间距加强,从而在编码过程中,即便间距信息有某种程度受损,在译码器一侧也能得到充分的间距信息,因而主观品质提高了。
然后,参照图52说明有关根据第17实施例的编码数据的存储、传输装置(storage/transferring apparatus)。
图52所示的存储、传输装置其构成包括:接收传送过来的编码数据的接收部1110;处理接收的编码数据的数据处理部1120;使处理的编码数据的压缩码扩展(解压缩),使编码数据译码产生再生数据的压缩码译码部1130;输出再生数据的输出部1140;除去在存储、传输中不必要的数据,控制附加必要数据的编码数据的写入、存储、读出的控制部1151;根据控制部1151的控制,进行存储、传输用的编码数据的写入的写入部1152;存储写入的编码数据的存储部1153;在编码数据读出需要时,根据控制部1151的控制,读出存储的编码数据的读出部1154。
有关在上述构成的编码数据的存储、传输装置中使用的数据、在存储和再生时分别说明。
在存储时,接收数据1011被送入接收部1110,在该接收部1110中被转换成包含传输线路码的传输线路编码数据1012。传输线路编码数据1012被送入数据处理部1120,借助构成数据处理部1120的传输线路码译码部1122和数据删除部1121进行传输线路码的译码和数据的删除,作为压缩编码数据1013输出。即,如图53的程序方框图中所示在起动后传输线路编码数据中所含的传输线路码被译码(步骤1501)。接着从同样的数据中删除不必要的数据(步骤1502)。其后,在删除处理后的数据中附加纠错码,在数据处理部1120结束工作。该数据处理的具体说明如图54所示,经传输线路编码部1122使传输线路码译码。形成如图54中所示的除去纠错码译码数据。在该译码数据中包括不必要的数据,这不必要的数据在数据删除部1121中被除去,通过数据删除部1121输出具有需要数据成份的译码数据。该译码数据被输入到纠错码附加部1123,纠错码被附加到同一译码数据中。借此,通过纠错码附加部1123处理的传输线路编码数据的编码数据作为压缩编码数据1013被输出。
来自数据处理部1120的压缩编码数据1013根据控制部1151的指示通过写入部1152存入存储媒体1153中。再生时,至少删除传输线路码,存储在该存储媒体1153中的压缩编码数据通过读出部1154读出。通过在压缩码译码部1130中译码,将再生数据1015通过输出部1140提供给使用者。
如上所述,从接收部1110输出传输线路编码数据1012,该传输线路编码数据1012在接收侧使声音、图象等的数据被压缩码之后,附加检错码、纠错码、交错(インタ-リ-ブ)等的传输线路码。在数据处理部1120中所含的传输线路码译码部1122中,不作交错、纠错译码、检错译码等,将其结果作为压缩编码数据1013输出。这时,根据传输线路编码的方式区别于压缩编码数据在于有输出表示检错结果的检错比特的情况。在输出检错比特时,在压缩码译码部1130中阅读检错比特,在检测错时作补偿处理,具有不使再生数据1015品质下降的构成。
该检错比特的存储方法主要设计了以下2种方法。第1种方法是压缩编码数据1013与检错比特一起存储。第2种方法是,根据检错比特存储作了补偿处理后的压缩编码数据1013。在第2种方法中,如图42B所示的另外准备再生装置1202的情况下,对于压缩码译码部1280不具有进行补偿处理的功能,可得到与作了补偿处理的情况同等的再生数据1026。然而,利用补偿方法也有需要作由再生数据1226的补偿处理而产生的补偿的情况。这种情况下除了压缩编码数据1223,再生数据1226也需要补偿处理,所以只是操作压缩编码数据1223,从原理上其补偿是不可能的。所以不能利用第2种方法。
在数据处理部1220中所包括的数据删除部1221,往往能通过在传输线路码译码部1222中被译码的数据删除不必要的部分。其理由是,比如实施了分级编码等的压缩编码数据,根据使用的再生装置的析象度等,存在不需要使全部压缩编码数据1213存储、传输的情况。若举出其他例子说明理由,如在录电话会话内容等的声音数据时,无音区间和背景噪声区间即使消除,也不影响录制会话内容的本来目的。并且,在纠错码附加部(223,对于根据需要在传输线睡码译码部1222被译码的数据,重新附加小规模纠错码。其理由在于,即使在存储、输送中也有微小错误发生的情况,即使不是在传输线路码使用的大规模检错、纠错程度,通过附加简单的纠错码对于数据量和再生时的计算量几乎无影响,而可使数据得到保护。
传输线路码译码部1222和数据删除部1221、纠错码附加部1223的关系方面要考虑各种情况。若还存在如2所述在传输线路码译码后作数据删除的情况,则也要考虑在数据删除后作传输线路码译码的情况。并且若纠错码附加部还存在把传输线路码译码之后的数据作为对象的情况,则进一步也存在把作了数据删除的数据作为对象的情况,而且还存在不作数据删除和纠错码附加的情况。三者关系是压缩编码方式、传输线路编码方式、存储、传输装置和再生装置的方法等相互依存决定的。
象这样得到的压缩编码数据1213(往往还包括检错比特)根据控制部1251的指示通过写入部1252写入存储媒体1253,存储媒体可利用半导体存储器、磁盘、IC卡等。并且压缩编码数据1213通过同时也供给压缩码译码部1230使所存储的数据译码,通过输出部1240可向使用者提供。
举例说明有关使用以上构成的存储、传输装置的效果。在作为数字式便携电话声音编码标准方式一种的PDC通信系统情况下,如前所述,压缩编码数据为3.45kbps,传输线路编码数据为5.6kbps。在接收一侧,使用1兆字节的半导体存储器构成的存储媒体存储会话内容的情况下,在存储传输线路编码数据的已有技术的方法中仅仅能录约24分钟,而在本实施例11中,在数据处理部仅包括传输线路译码装置情况下,即便包括检错比特也能录音约38分钟,比上述现有技术录音多了14分。而且在接收一侧的计算量传输线路码译码部是压缩码译码部的2-3倍,所以在本实施例中与再生时的已有的存储、传输装置比较、仅用1/3-1/4的计算量就能再生,由于该部分抑制了耗电,可长时间维持电池的工作。
图55是表示有关本发明第18实施例的编码数据的存储、传输装置的构成方框图。这第18实施例是限定图52所示的第17实施例数据处理过程。传输线路码数据1012由传输线路码译码部1222译码之后,通过纠错码附加部1223附加纠错码。
在硬盘和半导体存储器等的存储媒体上存储、输送数据的存储、传输系统中,若与传输系统比较,虽然其比特错误发生概率少,但避不开比特错误发生的弊端。即便该发生概率小,但在存储、传输系统中发生比特错误对于正确读出存储的数据来说是不能忽视的。根据该第18实施例的构成,根据在传输线路中发生大的错码而去掉保护数据的传输线路码之后,根据在存储、传输系统中发生的轻微错误附加保护数据的小规模纠错码,据此,只使必要的最小限度比特增加,通过存储、传输系统的错误能保护数据。
而且在附加纠错码时,通过对于存储、传输系统的特征使用最适合的码,能更少地抑制比特的增加。
图56是与发射装置相关联地表示有关本发明第19实施例的编码数据的存储、传输装置的结构方框图。编码数据的存储、传输装置的构成、工作与图52所示的第17实施例的构成一样,展示了发送自存储传输装置接收部1110输入的输入数据的发射装置的具体构成。在图中发射装置包括:在应该传输的数据中附加传输线路码的传输线路码附加部1410;寄存前述应该传输的数据的寄存部1420;向传输线路发送附加了传输码的压缩编码数据的发射部1430。
根据图56所示的第19实施例形成的编码数据的发射装置及存储、传输装置具有根据传输线路的大错误产生设置的传输线路码附加部1410以保护数据,同时通过传输线路与附加部1410对应设置数据处理部1220。在发射一侧传输线路码附加部1410为保护传输线路的数据而在发射前附加传输线路码。在接收一侧,数据处理部1220是留下存储、传输用纠错码,局部地使传输线路码译码附去,从而减少存储、传输时的数据量。根据这一步,在接收一侧不重新附加纠错码得到存储、传输用数据,这就是优点所在。并且比如由不同存储媒体构成的存储系统中,应注意在预先传输侧的附加部1410中附加的传输线路码的种类,借此可进一步提高存储、传输系统的存储效率。
图57A及57B是表示根据本发明第20实施例构成的编码数据存储、传输装置和相关再生装置的方框图。与第11实施例的不同点在于除了存储装置1201外还设置再生装置1202。在存储装置1201中,根据控制部1261的指示通过写入部1262把从数据处理部1220输出的压缩编码数据1023寄存在存储媒体1263上。在再生装置1202中寄存在存储媒体1271的数据从读出部12723读出,作为压缩缩码数据1025输出,在压缩码译码部1280中译码,和为再生数据1026通过输出部1290向使用者提供。把传输线路编码数据1022寄存在存储媒体1263中的已有方法中,在再生装置1202中必需具有传输线路码译码部1222和压缩译码部1280。另一方面,友本发明第14实施例的构成中,由于在再生装置1202中无需传输线路码译码部1222,所以可使再生装置1202电路规模小型化或节电。
图58A及58B表示有关本发明第21实施例的编码数据存储、传输装置以及在其上连接的再生装置的相关结构方框图。与第14实施例的不同处在于:在传输装置1301中备有传输部1342替换写入部1262和存储媒体1263,和在再生装置1302中备有接收部1350替换读出部1272和存储媒体1271。从数据处理部1320输出的压缩编码数据1033通过输送部1342输出至传输线路。再生装置1302接收在接收部1350传输过来的数据1035,在压缩码译码部1360译码后通过输出部1370向使用者提供。在第15的实施例中,更加有效的构成是,根据传输时的错误为了保护数据,而在传输线路码译码部1322中被译码的数据中,利用纠错码附加部1323重新附加简单的纠错码。并且由少数传输装置1301通过网络等把数据传输给多数再生装置1302时,在本发明第5实施例中,即使在再生装置1302中不设置传输线路码译码部1322也能求得电路规模的小型化和耗电的减少。其结果,降低了再生装置1302的成本,能便宜地使用多数再生装置。
如上所述,根据本发明实施例在发射系统中附加传输线路码,把传输过来的编码数据存储、传输到接收系统中的存储装置时,对于接收的所有编码数据,在存储、传输中将不必要的传输线路码等译码,进行数据删除,同时,附加防止在存储、传输时的数据破坏的小规模纠错码等之后,通过对于存储、传输系统使编码数据存储或传输,有可能使上述工作有效,同时也提高了存储媒体和传输线路的利用效率,再生装置电路规模的小型化和再生装置的电力消耗降低方面也产生明显效果。
Claims (16)
1.一种编码器,其特征在于构成包括:输入输入信号的输入端子;寄存多个参照向量的自适应代码簿;通过寄存在前述自适应代码簿上的参照向量产生复合信号的复合滤波器;求解前述复合信号和前述输入信号相似性的相似性计算装置;根据由前述相似性计算装置求得的相似性,从予先准备的不同编码比特率的多个编码方式中确定一个编码方式的编码方式确定装置;根据确定了的编码方式使前述输入信号编码的编码装置。
2.根据权利要求1的编码器,其特征是,具有分析前述输入信号的间距求取间距信息,根据该间距信息指定前述自适应代码簿的间距分析装置,前述自适应代码簿根据前述间距信息在前述复合滤波器中读出指定的参照向量。
3.根据权利要求1的编码器,其特征是,具有搜索装置,从由前述相似性计算装置求得的相似性为最大的参照向量被寄存在前述向适应代码簿的全部参照向量中进行搜索,前述编码方式确定装置相应于由前述搜索装置搜索的参照向量,根据由前述相似性计算装置求得的相似性从前述多个编码方式中决定一个编码方式。
4.根据权利要求1的编码器,其特征是,具有分析前述输入信号的间距求取间距信息的间距分析装置,存储由过去的输入信号得到的间距信息的存储装置,前述自适应代码簿在前述复合滤波器上读出由前述间距信息指定的参照向量,前述复合滤波器通过从前述自适应代码簿读出的参照向量产生现在输入信号的复合信号,前述相似性计算装置求由前述复合滤波器产生的复合信号和现在输入的相似性。
5.根据权利要求1的编码器,其特征是,前述编码装置具有不同编码方式的多个编码器,和根据由前述编码方式确定装置决定的编码方式选择前述多个编码器的一个的选择装置。
6.一种编码器,其特征在于构成包括:对输入信号作间距分析,抽出间距周期及间距增益的间距分析装置;使用通过前述间距分析装置取的间距周期及间距增益,加强前述输入信号的加强装置;使由前述加强装置加强了的输入信号编码的编码装置。
7.根据权利要求6的编码器,其特征是,前述间距分析装置具有使用一时间的过去输入信号预测现在输入信号的装置;求相应预测信号和输入信号的预测误差信号功率为最小时的间距周期和间距益的装置。
8.根据权利要求6的编码器,其特征是,前述间距加强装置根据下式使输入信号a(n)作间距加强,输出间距加强信号b(n);
b(n)=G·a(n)+g·ε·b(n-T)
其中:G为增益,g为间距增益,ε<1.
T为间距周期。
9.一种编码器,其特征在于其构成包括:进行输入信号LPC分析的LPC分析装置;根据由前述LPC分析装置抽出的LPC系数通过前述输入信号求取预测剩余信号(Prediction zesidnal signal)的预测滤波器;加强前述预测剩余信号间距的间距加强装置;根据前述LPC系数通过由前述间距加强装置作间距加强的预测剩余信倍求取间距加强的输入信号的复合滤波器;使间距加强的前述输入信号编码的编码装置。
10.根据权利要求9的编码器,其特征是,前述间距加强装置包括:求取前述预测剩余信号功率为最小时的间距周期和间距增益的间距分析装置;和使用由前述间距分析装置抽出的间距周期及间距增益,使前述预测剩余信号作间距加强的间距加强电路。
11.根据权利要求10的编码器,其特征是,前述间距加强电路根据下式预测剩余信号a(n)作间距加强、输出间距加强信号b(n);
b(n)=G·a(n)+g·z·b(n-T)
其中:G为增益,g为间距增僧,ε<1,T为间距周期。
12.一种编码方法,其特征在于步骤如下:对输入信号作间距分析,抽出间距周期及间距增益;根据前述步骤,用抽出的间距周期及间距增益对前述输入信号作加强;使根据前述加强步骤加强了的输入信号编码。
13.一种编码方法,其特征在于步骤如下:通过输入信号求LPC系数;使用基于前述LPC系数作成的预测滤波器求预测剩余信号;使前述预测剩余信号作间距加强;利用根据前述LPC系数作成的复合滤波器,通过作间距加强了的前述预测剩余信号求作了间距加强了的输入信号;使作了间距加强的前述输入信号编码。
14.一种编码数据的存储、传输装置,其特征在于构成包括如下:接收附加传输线路码的编码数据的接收装置;从接收的编码数据中使包含存储、传输中不必要的传输线路码的码译码除去,必要时,使包含附加在存储、传输时必要的纠错码,产生压缩编码数据的数据处理装置;存储、传输前述压缩编码数据的存储、传输器。
15.根据权利要求14的编码数据的存储、传输装置,其特征是,前述数据处理装置包括从含有由前述接收装置接收的传输线路码的编码数据中,使前述传输线路码译码删除的数据删除装置。
16.根据权利要求15的编码数据的存储、传输装置,其特征是,前述数据处理装置包括纠错码附加装置,在去掉了前述传输线路的编码数据中,为了根据在存储、传输时产生的轻微错误保护编码数据,附加小规模纠错码。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP063660/95 | 1995-03-23 | ||
JP063660/1995 | 1995-03-23 | ||
JP7063660A JPH08263099A (ja) | 1995-03-23 | 1995-03-23 | 符号化装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1140362A true CN1140362A (zh) | 1997-01-15 |
CN1115781C CN1115781C (zh) | 2003-07-23 |
Family
ID=13235729
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN95119106A Expired - Lifetime CN1115781C (zh) | 1995-03-23 | 1995-09-29 | 编码器 |
Country Status (7)
Country | Link |
---|---|
US (1) | US5878387A (zh) |
EP (2) | EP0734014B1 (zh) |
JP (1) | JPH08263099A (zh) |
KR (1) | KR100209454B1 (zh) |
CN (1) | CN1115781C (zh) |
CA (1) | CA2159557C (zh) |
DE (2) | DE69531464T2 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102483922A (zh) * | 2009-06-29 | 2012-05-30 | 三星电子株式会社 | 使用加权线性预测变换对音频信号进行编码和解码的设备和方法 |
Families Citing this family (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6075768A (en) * | 1995-11-09 | 2000-06-13 | At&T Corporation | Fair bandwidth sharing for video traffic sources using distributed feedback control |
EP0922278B1 (en) * | 1997-04-07 | 2006-04-05 | Koninklijke Philips Electronics N.V. | Variable bitrate speech transmission system |
US6058359A (en) * | 1998-03-04 | 2000-05-02 | Telefonaktiebolaget L M Ericsson | Speech coding including soft adaptability feature |
US6418147B1 (en) * | 1998-01-21 | 2002-07-09 | Globalstar Lp | Multiple vocoder mobile satellite telephone system |
US6499008B2 (en) * | 1998-05-26 | 2002-12-24 | Koninklijke Philips Electronics N.V. | Transceiver for selecting a source coder based on signal distortion estimate |
WO2000011649A1 (en) * | 1998-08-24 | 2000-03-02 | Conexant Systems, Inc. | Speech encoder using a classifier for smoothing noise coding |
US7072832B1 (en) * | 1998-08-24 | 2006-07-04 | Mindspeed Technologies, Inc. | System for speech encoding having an adaptive encoding arrangement |
US7117146B2 (en) * | 1998-08-24 | 2006-10-03 | Mindspeed Technologies, Inc. | System for improved use of pitch enhancement with subcodebooks |
US6411927B1 (en) * | 1998-09-04 | 2002-06-25 | Matsushita Electric Corporation Of America | Robust preprocessing signal equalization system and method for normalizing to a target environment |
EP1159738B1 (en) * | 1999-02-08 | 2006-04-05 | QUALCOMM Incorporated | Speech synthesizer based on variable rate speech coding |
JP2000244384A (ja) * | 1999-02-18 | 2000-09-08 | Mitsubishi Electric Corp | 移動通信端末装置及び移動通信端末装置における音声符号化レート決定方法 |
US6438518B1 (en) * | 1999-10-28 | 2002-08-20 | Qualcomm Incorporated | Method and apparatus for using coding scheme selection patterns in a predictive speech coder to reduce sensitivity to frame error conditions |
US6965610B2 (en) * | 1999-12-23 | 2005-11-15 | Broadcom Corporation | System and method for providing compatibility between different transceivers in a multi-pair communication system |
US6382331B1 (en) * | 2000-04-17 | 2002-05-07 | Noble Drilling Services, Inc. | Method of and system for optimizing rate of penetration based upon control variable correlation |
US6757654B1 (en) * | 2000-05-11 | 2004-06-29 | Telefonaktiebolaget Lm Ericsson | Forward error correction in speech coding |
KR100844810B1 (ko) | 2000-12-22 | 2008-07-09 | 소니 가부시끼 가이샤 | 부호화 장치 및 복호 장치 |
KR100394146B1 (ko) * | 2000-12-28 | 2003-08-09 | 디지털시스 주식회사 | 인터넷 프로토콜상에서의 이중 다해상도 적응 압축음성신호 전송 방법 |
WO2003056546A1 (en) * | 2001-12-25 | 2003-07-10 | Ntt Docomo, Inc. | Signal coding apparatus, signal coding method, and program |
US7460722B2 (en) * | 2002-01-11 | 2008-12-02 | Canon Kabushiki Kaisha | Encoding of digital data with determination of sample path |
KR100656788B1 (ko) * | 2004-11-26 | 2006-12-12 | 한국전자통신연구원 | 비트율 신축성을 갖는 코드벡터 생성 방법 및 그를 이용한 광대역 보코더 |
US20060217970A1 (en) * | 2005-03-28 | 2006-09-28 | Tellabs Operations, Inc. | Method and apparatus for noise reduction |
US20060217972A1 (en) * | 2005-03-28 | 2006-09-28 | Tellabs Operations, Inc. | Method and apparatus for modifying an encoded signal |
US20060217983A1 (en) * | 2005-03-28 | 2006-09-28 | Tellabs Operations, Inc. | Method and apparatus for injecting comfort noise in a communications system |
US20060217988A1 (en) * | 2005-03-28 | 2006-09-28 | Tellabs Operations, Inc. | Method and apparatus for adaptive level control |
US20060215683A1 (en) * | 2005-03-28 | 2006-09-28 | Tellabs Operations, Inc. | Method and apparatus for voice quality enhancement |
US20070005347A1 (en) * | 2005-06-30 | 2007-01-04 | Kotzin Michael D | Method and apparatus for data frame construction |
US7818264B2 (en) * | 2006-06-19 | 2010-10-19 | Visa U.S.A. Inc. | Track data encryption |
EP2116997A4 (en) * | 2007-03-02 | 2011-11-23 | Panasonic Corp | AUDIO-DECODING DEVICE AND AUDIO-DECODING METHOD |
CN101599272B (zh) * | 2008-12-30 | 2011-06-08 | 华为技术有限公司 | 基音搜索方法及装置 |
JP6303435B2 (ja) * | 2013-11-22 | 2018-04-04 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用プログラム、オーディオ復号装置 |
JP6960766B2 (ja) * | 2017-05-15 | 2021-11-05 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 雑音抑圧装置、雑音抑圧方法及びプログラム |
EP3576088A1 (en) * | 2018-05-30 | 2019-12-04 | Fraunhofer Gesellschaft zur Förderung der Angewand | Audio similarity evaluator, audio encoder, methods and computer program |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3370423D1 (en) * | 1983-06-07 | 1987-04-23 | Ibm | Process for activity detection in a voice transmission system |
JPH0783315B2 (ja) * | 1988-09-26 | 1995-09-06 | 富士通株式会社 | 可変レート音声信号符号化方式 |
JP2940005B2 (ja) * | 1989-07-20 | 1999-08-25 | 日本電気株式会社 | 音声符号化装置 |
CA2051304C (en) * | 1990-09-18 | 1996-03-05 | Tomohiko Taniguchi | Speech coding and decoding system |
US5396576A (en) * | 1991-05-22 | 1995-03-07 | Nippon Telegraph And Telephone Corporation | Speech coding and decoding methods using adaptive and random code books |
US5265190A (en) * | 1991-05-31 | 1993-11-23 | Motorola, Inc. | CELP vocoder with efficient adaptive codebook search |
US5179594A (en) * | 1991-06-12 | 1993-01-12 | Motorola, Inc. | Efficient calculation of autocorrelation coefficients for CELP vocoder adaptive codebook |
JPH06138896A (ja) * | 1991-05-31 | 1994-05-20 | Motorola Inc | 音声フレームを符号化するための装置および方法 |
US5173941A (en) * | 1991-05-31 | 1992-12-22 | Motorola, Inc. | Reduced codebook search arrangement for CELP vocoders |
US5187745A (en) * | 1991-06-27 | 1993-02-16 | Motorola, Inc. | Efficient codebook search for CELP vocoders |
JP3432822B2 (ja) * | 1991-06-11 | 2003-08-04 | クゥアルコム・インコーポレイテッド | 可変速度ボコーダ |
US5371853A (en) * | 1991-10-28 | 1994-12-06 | University Of Maryland At College Park | Method and system for CELP speech coding and codebook for use therewith |
JP3089769B2 (ja) * | 1991-12-03 | 2000-09-18 | 日本電気株式会社 | 音声符号化装置 |
US5457783A (en) * | 1992-08-07 | 1995-10-10 | Pacific Communication Sciences, Inc. | Adaptive speech coder having code excited linear prediction |
US5440336A (en) * | 1993-07-23 | 1995-08-08 | Electronic Data Systems Corporation | System and method for storing and forwarding audio and/or visual information on demand |
-
1995
- 1995-03-23 JP JP7063660A patent/JPH08263099A/ja active Pending
- 1995-09-29 DE DE69531464T patent/DE69531464T2/de not_active Expired - Lifetime
- 1995-09-29 KR KR1019950033928A patent/KR100209454B1/ko not_active IP Right Cessation
- 1995-09-29 US US08/537,276 patent/US5878387A/en not_active Expired - Lifetime
- 1995-09-29 CN CN95119106A patent/CN1115781C/zh not_active Expired - Lifetime
- 1995-09-29 EP EP95306943A patent/EP0734014B1/en not_active Expired - Lifetime
- 1995-09-29 EP EP00109508A patent/EP1028411B1/en not_active Expired - Lifetime
- 1995-09-29 DE DE69519421T patent/DE69519421T2/de not_active Expired - Lifetime
- 1995-09-29 CA CA002159557A patent/CA2159557C/en not_active Expired - Lifetime
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102483922A (zh) * | 2009-06-29 | 2012-05-30 | 三星电子株式会社 | 使用加权线性预测变换对音频信号进行编码和解码的设备和方法 |
Also Published As
Publication number | Publication date |
---|---|
DE69519421D1 (de) | 2000-12-21 |
EP0734014B1 (en) | 2000-11-15 |
EP1028411A2 (en) | 2000-08-16 |
EP1028411A3 (en) | 2000-11-29 |
DE69519421T2 (de) | 2001-06-13 |
KR960036343A (ko) | 1996-10-28 |
JPH08263099A (ja) | 1996-10-11 |
EP1028411B1 (en) | 2003-08-06 |
CN1115781C (zh) | 2003-07-23 |
CA2159557C (en) | 2000-05-23 |
DE69531464T2 (de) | 2004-07-01 |
CA2159557A1 (en) | 1996-09-24 |
US5878387A (en) | 1999-03-02 |
EP0734014A1 (en) | 1996-09-25 |
KR100209454B1 (ko) | 1999-07-15 |
DE69531464D1 (de) | 2003-09-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1140362A (zh) | 编码器 | |
CN1264138C (zh) | 复制语音信号、解码语音、合成语音的方法和装置 | |
CN1165892C (zh) | 对宽带信号进行解码时的周期性增强的方法和设备 | |
CN1096148C (zh) | 信号编码方法和装置 | |
CN100338648C (zh) | 在基于线性预测的语音编码解码器中有效帧删除隐藏的方法和器件 | |
CN1252681C (zh) | 一种码激励线性预测语音编码器的增益量化 | |
CN1240049C (zh) | 语音编码系统 | |
RU2387025C2 (ru) | Способ и устройство для векторного квантования спектрального представления огибающей | |
CN1201288C (zh) | 解码方法和设备 | |
CN1185620C (zh) | 声音合成装置和方法以及电话装置 | |
CN1202514C (zh) | 编码和解码语音及其参数的方法、编码器、解码器 | |
CN1097396C (zh) | 声音编码装置和方法 | |
CN1135527C (zh) | 语音编码方法和装置,输入信号判别方法,语音解码方法和装置以及程序提供介质 | |
CN1618093A (zh) | 有效编码语音信号的信号修改方法 | |
CN1248195C (zh) | 语音编码转换方法和装置 | |
CN1957398A (zh) | 在基于代数码激励线性预测/变换编码激励的音频压缩期间低频加重的方法和设备 | |
CN1722231A (zh) | 处理丢失帧的语音通信系统及方法 | |
CN1205097A (zh) | 声音编码装置、声音译码装置、记录实现声音编码/译码的程序的记录媒体和移动通信装置 | |
CN1136374A (zh) | 发送接收装置 | |
CN1261713A (zh) | 接收装置和方法,通信装置和方法 | |
JP3357795B2 (ja) | 音声符号化方法および装置 | |
JP4304360B2 (ja) | 音声符号化復号方式間の符号変換方法および装置とその記憶媒体 | |
CN1293535C (zh) | 声音编码设备和方法以及声音解码设备和方法 | |
CN1977311A (zh) | 语音编码装置、语音解码装置及其方法 | |
JP4238535B2 (ja) | 音声符号化復号方式間の符号変換方法及び装置とその記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C06 | Publication | ||
PB01 | Publication | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CX01 | Expiry of patent term |
Granted publication date: 20030723 |
|
EXPY | Termination of patent right or utility model |