[go: up one dir, main page]

CN101031960A - 可扩展性编码装置和可扩展性解码装置及其方法 - Google Patents

可扩展性编码装置和可扩展性解码装置及其方法 Download PDF

Info

Publication number
CN101031960A
CN101031960A CNA2005800332307A CN200580033230A CN101031960A CN 101031960 A CN101031960 A CN 101031960A CN A2005800332307 A CNA2005800332307 A CN A2005800332307A CN 200580033230 A CN200580033230 A CN 200580033230A CN 101031960 A CN101031960 A CN 101031960A
Authority
CN
China
Prior art keywords
encoding
signal
channel
channel signal
scalable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2005800332307A
Other languages
English (en)
Inventor
后藤道代
吉田幸司
江原宏幸
押切正浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Publication of CN101031960A publication Critical patent/CN101031960A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Abstract

本发明公开一种可扩展性编码装置,能够对立体声语音信号实现通过CELP编码处理的可扩展性编码,从而提高编码效率。在该装置中,加法器(101)以及乘法器(102)求取第一声道信号CH1以及第二声道信号CH2的平均作为单声道信号M。单声道信号用CELP编码器(103)对单声道信号M进行CELP编码处理,将得到的编码参数输出到外部,并将利用该编码参数合成出的合成单声道信号M’输出到第一声道信号用编码器(104)。第一声道信号用编码器(104)利用合成单声道信号M’和第二声道信号CH2,对第一声道信号CH1进行CELP编码以使第一声道信号CH1的编码失真和第二声道信号CH2的编码失真的和成为最小。

Description

可扩展性编码装置和可扩展性解码装置及其方法
技术领域
本发明涉及对立体声语音信号通过CELP方式编码(以下有时只简称为CELP编码)从而实现可扩展性编码的可扩展性编码装置和可扩展性解码装置及其方法。
背景技术
正像通过便携式电话进行通话那样,现在移动通信系统中的语音通信以单声道方式进行的通信(单声道通信)为主流。但是,今后像第四代移动通信系统那样,随着传输速率更高的比特速率高速化的实现,因为能够确保用于传输多个声道的频宽,所以期待着在语音通信中普及通过立体声方式的通信(立体声通信)。
比如,将音乐存储于装载了HDD(硬盘)的便携式音频播放器,并在该播放器安装用于立体声的耳塞式耳机或头戴式耳机等来欣赏立体声音乐的用户越来越多,考虑到这样的现状可以预测到,今后将便携式电话与音乐播放器结合在一起,在使用用于立体声的耳塞机或耳机等的配件的同时,进行通过立体声方式的语音通信的生活方式将广为普及。另外,在逐渐普及起来的电视会议等的环境中,为了使富有临场感的对话成为可能,预计也将要进行立体声通信。
但是可以预计,即使立体声通信得到普及,仍然要进行单声道通信。这是因为单声道通信利用低比特速率,所以可以期待降低通信成本,而且只适合单声道通信的便携式电话能够缩小电路规模而价格低廉,不需要高品质语音通信的用户可能购买只适合单声道通信的便携式电话。因此,在一个通信系统中,同时存在适合立体声通信的便携式电话和适合单声道通信的便携式电话,通信系统需要同时适合立体声通信以及单声道通信。
另外,移动通信系统通过无线信号进行通信数据的交换,因此可能根据传播路径环境,有时丢失一部分通信数据。因此,对于以上的情况,如果有一种便携式电话具有能够从剩余的接收数据恢复原来的通信数据的功能的话,将非常具有使用价值。
存在由立体声信号和单声道信号构成的可扩展性编码技术,其具有如下功能:能够同时适合立体声通信以及单声道通信,并且即使通信数据的一部分发生了丢失,也能够从剩余的接收数据恢复原来的通信数据。作为具有该功能的可扩展性编码装置的例子,比如有非专利文献1所公开的装置。
[非专利文献]ISO/IEC 14496-3:1999(B.14 Scalable AAC with core coder)
发明内容
发明要解决的问题
但是,非专利文献1所公开的可扩展性编码装置以音频信号为对象而未考虑到语音信号,因此对语音信号原封不动地应用可扩展性编码,会发生编码效率下降的问题。也就是,对于语音信号,最佳的是应用能够高效地进行编码处理的CELP编码,但是在非专利文献1中并没有公开适用CELP方式的具体配置,特别是将CELP编码处理适用于扩展层,对于预料之外的语音信号原封不动地应用最佳化的CELP编码处理,很难得到所期望的编码效率。
因此,本发明旨在提供一种可扩展性编码装置和可扩展性解码装置及其方法,能够对立体声语音信号实现通过CELP编码处理的可扩展性编码,从而能够提高编码效率。
解决该问题的方案
本发明的可扩展性编码装置,采取以下的结构,包括:生成单元,由包括第一声道信号和第二声道信号的立体声语音信号生成单声道语音信号;单声道编码单元,对所述单声道语音信号进行CELP方式的编码处理;计算单元,计算通过对所述第二声道信号进行CELP方式的编码处理而生成的编码失真;以及第一声道编码单元,对所述第一声道信号进行CELP方式的编码处理,并求取所述第一声道信号的编码参数,该编码参数使经该编码处理而生成的所述第一声道信号的编码失真以及通过所述计算单元计算出的所述第二声道信号的编码失真的和成为最小。
发明有益效果
根据本发明,对立体声语音信号能够实现通过CELP编码处理的可扩展性编码,从而能够提高编码效率。
附图说明
图1是表示实施例1的可扩展性编码装置的主要结构的方框图;
图2是表示单声道信号与第一声道信号以及第二声道信号之间的关系的图;
图3是表示实施例1的单声道信号用CELP编码器内部的主要结构的方框图;
图4是表示实施例1的第一声道信号用编码器内部的主要结构的方框图;
图5是表示实施例1的可扩展性解码装置的主要结构的方框图;
图6是表示实施例2的可扩展性编码装置的主要结构的方框图;
图7是表示实施例2的第一声道信号用编码器内部的主要结构的方框图;以及
图8是表示实施例2的可扩展性解码装置的主要结构的方框图。
具体实施方式
以下,参照附图详细说明本发明的实施例。另外,在此,说明对由2个声道构成的立体声语音信号进行编码处理的情形的例子,而且,下面表示的第一声道以及第二声道分别为L声道以及R声道,或者R声道以及L声道。
(实施例1)
图1是表示本发明实施例1的可扩展性编码装置100的主要结构的方框图。该可扩展性编码装置100包括:加法器101、乘法器102、单声道信号用CELP编码器103以及第一声道信号用编码器104。
可扩展性编码装置100的各个部分进行以下的操作。
加法器101对输入到可扩展性编码装置100的第一声道信号CH1以及第二声道信号CH1进行加法处理,生成相加信号。乘法器102将该相加信号乘以1/2,使其的标量减半,并生成单声道信号M。也就是,加法器101以及乘法器102求取第一声道信号CH1以及第二声道信号CH2的平均信号,使其作为单声道信号M。
单声道信号用CELP编码器103对该单声道信号M进行CELP编码处理,并将对每个子帧得到的CELP编码参数输出到可扩展性编码装置100的外部。另外,单声道信号用CELP编码器103将利用该每个子帧的CELP编码参数而(对每个子帧)合成出的合成单声道信号M’输出到第一声道信号用编码器104。这里,CELP编码参数为LPC(LSP)参数、自适应音源代码本索引、自适应音源增益、固定音源代码本索引以及固定音源增益。
第一声道信号用编码器104对输入到可扩展性编码装置100的第一声道信号CH1,利用同样输入到可扩展性编码装置10入的第二声道信号CH2、和从单声道信号用CELP编码器103输出的合成单声道信号M’,进行后述的编码处理,并将得到的第一声道信号的CELP编码参数输出到可扩展性编码装置100的外部。
该可扩展性编码装置100的一个特征在于:由加法器101、乘法器102以及单声道信号用CELP编码器103构成第一层,由第一声道信号用编码器104构成第二层,从第一层输出单声道信号的编码参数,从第二层输出在解码端通过与对第一层的解码信号(单声道信号)一起进行解码处理而能够得到立体声信号的编码参数。也就是,本实施例的可扩展性编码装置实现由单声道信号和立体声信号构成的可扩展性编码。
根据该结构,获取了由所述第一层以及第二层构成的编码参数的解码装置,即使因为传播路径环境的恶化,不能获取第二层的编码参数而只能获取第一层的编码参数时,也能够解码出单声道信号,虽然该单声道信号的质量较差。另外,解码装置能够获取第一层以及第二层编码参数时,能够利用这些编码参数解码出高品质的立体声信号。
在下面,说明解码装置能够利用从可扩展性编码装置100输出的第一层以及第二层的编码参数,解码立体声信号的原理。图2是表示单声道信号与第一声道信号以及第二声道信号之间的关系的图。
编码处理前的单声道信号M能够如图2A所示那样,通过在第一声道信号CH1以及第二声道信号CH2的相加信号上乘上1/2,也就是通过下面的等式(1)求取。
M=(CH1+CH2)/2    等式(1)
因此,只要得到单声道信号M和第一声道信号CH1的话,从理论上讲第二声道信号CH2能够求取。
但是,实际上因为对单声道信号M和第一声道信号CH1进行编码处理,会产生源于编码处理的编码失真,导致所述的等式(1)不成立。更为详细的说明为,假设将第一声道信号CH1与单声道信号M之间的差分称为第一声道信号差分ΔCH1,第二声道信号CH2与单声道信号M之间的差分称为第二声道信号差分ΔCH2,通过进行编码处理,如图2B所示,因为在ΔCH1与ΔCH2之间产生差而不再满足等式(1)的关系,即使通过解码处理,得到单声道信号M与第一声道信号CH1,也不能从它们正确地求取第二信道信号CH2。因此,为了防止解码信号的音质的恶化,需要发明一种编码方法,该编码方法考虑上述两种编码失真的差。
于是,本实施例的可扩展性编码装置100为了提高CH1以及CH2的解码精度,在对CH1进行编码时,使CH1的编码失真成为最小,也使CH2的编码失真成为最小,来决定CH1的编码参数。由此,能够防止解码信号的音质恶化。
另一方面,CH2的解码为,在解码装置中,由单声道信号的解码信号以及CH1的解码信号而生成。因为由所述等式(1)推导出下面的等式(2),所以能够根据该等式(2)生成CH2。
CH2=2×M-CH1       等式(2)
图3是表示单声道信号用CELP编码器103内部的主要结构的方框图。
该单声道信号用CELP编码器103包括:LPC分析单元111、LPC量化单元112、LPC合成滤波器113、加法器114、听觉加权单元115、失真最小化单元116、自适应音源代码本117、乘法器118、固定音源代码本119、乘法器120、增益代码本121以及加法器122。
LPC分析单元111对从乘法器102输出的单声道信号M进行线性预测分析,将分析结果的LPC参数输出到LPC量化单元112以及听觉加权单元115。
LPC量化单元112将从LPC分析单元111输出的LPC参数变换为适于进行量化的LSP参数后进行量化,并将得到的量化LSP参数(CL)输出到单声道信号用CELP编码器103的外部。该量化LSP参数为通过单声道信号用CELP编码器103得到的CELP编码参数的其中一个。另外,LPC量化单元112将该量化LSP参数再次变换为量化LPC参数后,将其输出到LPC合成滤波器113。
LPC合成滤波器113利用从LPC量化单元112输出的量化LPC参数,将由后述的自适应音源代码本117以及固定音源代码本119生成的音源矢量作为驱动音源,进行通过LPC合成滤波器的合成。得到的合成信号M’输出到加法器114以及第一声道信号用编码器104。
加法器114反转从LPC合成滤波器113输出的合成信号的极性,通过与单声道信号M进行相加而计算误差信号,并将该误差信号输出到听觉加权单元115。该误差信号相当于编码失真。
听觉加权单元115使用基于从LPC分析单元111输出的LPC参数而构成的听觉加权滤波器,对从加法器114输出的编码失真进行听觉加权处理,并将该信号输出到失真最小化单元116。
失真最小化单元116对自适应音源代码本117、固定音源代码本119以及增益代码本121指示各种参数,以使从听觉加权单元115输出编码失真成为最小。具体而言,失真最小化单元116对自适应音源代码本117、固定音源代码本119以及增益代码本121指示使用的索引(CA、CD、CG)。
自适应音源代码本117将过去生成的、传往LPC合成滤波器113的驱动音源的音源矢量存储于内部缓冲器,基于对应于由失真最小化单元116指示的索引的自适应代码本延迟,从该被存储的音源矢量中取出相当于一个子帧的矢量,并作为自适应音源矢量输出到乘法器118。
固定音源代码本119将对应于从失真最小化单元116指示的索引的音源矢量作为固定音源矢量输出到乘法器120。
增益代码本121生成对应于由失真最小化单元116指示的索引的增益,具体而言为生成对应于来自自适应音源代码本117的自适应音源矢量以及来自固定音源代码本119的固定音源矢量的各个增益,并将所述增益分别输出到乘法器118、乘法器120。
乘法器118将从增益代码本121生成的自适应音源增益乘以从自适应音源代码本117输出的自适应音源矢量,并输出到加法器122。
乘法器120将从增益代码本121生成的固定音源增益乘以从固定音源代码本119输出的固定音源矢量,并将结果输出到加法器122。
加法器122将从乘法器118输出的自适应音源矢量和从乘法器120输出的固定音源矢量相加,并将相加后的音源矢量作为驱动音源输出到LPC合成滤波器113。另外,加法器122将得到的驱动音源的音源矢量反馈给自适应音源代码本117。
LPC合成滤波器113如上所述,对从加法器122输出的音源矢量,也就是通过自适应音源代码本117以及固定音源代码本119生成的音源矢量作为驱动音源,进行通过LPC合成滤波器的合成。
像这样,利用由自适应音源代码本117以及固定音源代码本119生成的音源矢量,求取编码失真的一系列处理为闭环(反馈环),失真最小化单元116对自适应音源代码本117、固定音源代码本119以及增益代码本121进行指示以使该编码失真成为最小。继而,失真最小化单元116将使编码失真成为最小的各种CELP编码参数(CA、CD、CG)输出到可扩展性编码装置100的外部。
图4是表示第一声道信号用编码器104内部的主要结构的方框图。
另外,该第一声道信号用编码器104中,LPC分析单元131、LPC量化单元132、LPC合成滤波器133、加法器134、失真最小化单元136、自适应音源代码本137、乘法器138、固定音源代码本139、乘法器140、增益代码本141以及加法器142,分别与上述的单声道信号用CELP编码器103中的LPC分析单元111、LPC量化单元112、LPC合成滤波器113、加法器114、失真最小化单元116、自适应音源代码本117、乘法器118、固定音源代码本119、乘法器120、增益代码本121以及加法器122为相同的结构,因此省略说明。
完全为新追加的结构为第二声道信号误差分量计算单元143。另外,听觉加权单元135以及失真最小化单元136的基本操作与在单声道信号用CELP编码器103中的听觉加权单元115以及失真最小化单元116相同,但是听觉加权单元135以及失真最小化单元136接收第二声道信号误差分量计算单元143的输出,还进行以下所述的、与单声道信号用CELP编码器103不同的操作。
本实施例的可扩展性编码装置100在第二层,也就是第一声道信号用编码器104中,在对CH1进行编码时,决定CH1的编码参数使CH1的编码失真以及CH2的编码失真的和成为最小。由此,通过CH1以及CH2的编码失真同时进行最佳化,能够实现高品质的语音。
第二声道信号误差分量计算单元143计算在对第二声道信号进行CELP编码时的误差分量,也就是计算上述CH2的编码失真。具体而言,第二声道信号误差分量计算单元143中的第二声道合成信号生成单元144使合成单声道信号M’加倍,并从该值减去合成第一声道信号CH1’,由此计算合成第二声道信号CH2’,而不进行第二声道信号的CELP编码处理。接下来,加法器145求取第二声道信号CH2与合成第二声道信号CH2’之间的差分。
听觉加权单元135与单声道信号用CELP编码器103中的听觉加权单元115同样地对第一声道信号CH1与合成第一声道信号CH1’之间的差分,也就是第一声道的编码失真,进行听觉加权处理。进一步,听觉加权单元135也对第二声道信号CH2与合成第二声道信号CH2’之间的差分,也就是第二声道的编码失真进行听觉加权处理。
失真最小化单元136通过以下表示的算法确定最优的自适应音源矢量、固定音源矢量以及它们的增益,以使上述经听觉加权处理的编码失真,也就是对于第一声道信号的编码失真以及对于第二声道信号的的编码失真的和成为最小。
以下,说明在失真最小化单元136中所使用的编码失真最小化的算法。另外,CH1、CH2为输入信号,CH1’为CH1的合成信号,CH2’为CH2的合成信号,M’为合成单声道信号。
对于第一声道信号以及第二声道信号的编码失真的和d由以下的等式(3)表示。
d=||CH1-CH1’||2+||CH2-CH2’||2           ...等式(3)
但是,根据单声道信号和第一声道信号以及第二声道信号的关系,CH2’如以下的等式(4)所示,可以通过经编码处理的单声道的合成信号M’和第一声道的合成信号CH1’表示。
CH2’=2×M’-CH1’                        ...等式(4)
因此,等式(3)可以改写成以下的等式(5)。
d=||CH1-CH1’||2+||CH2-(2×M’-CH1’)||2  ...等式(5)
也就是,本实施例的可扩展性编码装置通过搜索求取得到使由等式(5)表示的编码失真d成为最小的CH1’的第一声道信号的CELP编码参数。
具体而言,首先对进行对于第一声道的LPC参数的分析/量化。接下来,进行使上述等式(5)所表示的编码失真成为最小的自适应音源代码本搜索、固定音源代码本搜索以及音源增益搜索,并确定自适应音源代码本索引、固定音源代码本索引以及音源增益索引。
也就是,虽然是使CH1的编码失真以及CH2的编码失真的和成为最小,在编码过程中,只考虑CH1的编码失真即可。由此,也同时考虑到CH2的编码失真。
像这样,通过最佳地进行第一声道的参数的编码(自适应音源代码本索引以及固定音源代码本索引),能够不单对第一声道的信号,而且对第二声道的信号也进行使编码失真成为最小的编码处理。
接下来,说明在失真最小化单元136所使用的、使编码失真成为最小的算法的另一种变形。这里,将描述这样一种情形,按当希望由听觉加权单元135对第一声道信号的编码失真以及第二声道信号的编码失真进行听觉加权处理时的精度,对第一声道信号的编码失真以及第二声道信号的编码失真进行加权,由此对所述声道信号中的两者中的任一个进行高精度编码处理。另外,设α、β为对于经听觉加权处理后的CH1以及CH2的各自的编码失真的加权系数。
对于第一声道信号以及第二声道信号的编码失真的和d’由以下的等式(6)表示。
d’=α×||CH1-CH1’||2+β×||CH2-CH2’||2           ...等式(6)
但是,根据单声道信号和第一声道信号以及第二声道信号的关系,CH2’如以下的等式(7)所示,可以通过经编码处理的单声道的合成信号M’和第一声道的合成信号CH1’表示。
CH2’=2×M’-CH1’                                  ...等式(7)
因此,等式(6)成为以下的等式(8)。
d’=α×||CH1-CH1’||2+β×||CH2-(2×M’-CH1’)||2  ...等式(8)
本实施例的可扩展性编码装置通过搜索求取能得到使由等式(8)表示的编码失真d’成为最小的CH1’的第一声道信号的CELP编码参数。
具体而言,首先进行对于第一声道的LPC参数的分析/量化。接下来,进行使等式(8)所表示的编码失真成为最小的自适应音源代码本搜索、固定音源代码本搜索以及音源增益搜索,确定自适应音源代码本索引、固定音源代码本索引以及音源增益索引。
也就是,虽然是使CH1的编码失真以及CH2的编码失真的和成为最小,在编码过程中,只考虑CH1的编码失真即可。由此,相当于同时考虑对于CH2的编码失真。
这里,所谓的同时考虑并不一定意味着以同样的比例来考虑编码失真,比如第一声道信号和第二声道信号为完全独立的信号(比如,语音信号和其它的音乐信号,或是说话者A的语音和说话者B的语音的情形等),希望进一步高精度地编码第一声道信号时,通过将对于第一声道信号的失真信号的加权系数α设为大于β的值,能够使第一声道信号的失真小于第二声道信号的失真。
像这样,通过最佳地进行第一声道的参数的编码(自适应音源代码本索引以及固定音源代码本索引),能够不单对第一声道的信号,对第二声道的信号也进行使编码失真成为最小的编码处理。
另外,作为α以及β的值的确定方法,能够利用以下方法,即根据输入信号的种类(语音信号或者音乐信号等)预先准备成表格,或者计算一定区间(帧、子帧等)的信号的能量的比而确定。
图5是表示对由上述可扩展性编码装置100生成出的编码参数进行解码的、也就是对应于可扩展性编码装置100的可扩展性解码装置150的主要结构的方框图。
单声道信号用CELP解码器151由单声道信号的CELP编码参数合成单声道信号M’。第一声道信号用解码器152由第一声道信号的CELP编码参数合成第一声道信号CH1’。
另一方面,第二声道信号用解码器153由单声道信号M’和第一声道信号CH1’,根据以下的等式(9)求取第二声道信号CH2’。
CH2’=2×M’-CH1’  ...等式(9)
像这样,根据本实施例,在对CH1进行编码时,确定CH1的编码参数,以使CH1的编码失真以及CH2的编码失真的和成为最小,因此能够提高CH1以及CH2的解码精度,从而能够防止解码信号的音质恶化。
另外,虽然本实施例确定CH1的编码参数以使CH1的编码失真以及CH2的编码失真的和成为最小,也可以确定CH1的编码参数以使CH1的编码失真以及CH2的编码失真都成为最小。
(实施例2)
图6是表示本发明实施例2的可扩展性编码装置200的主要结构的方框图。另外,该可扩展性编码装置200具有与实施例1所示的可扩展性编码装置100相同的基本结构,对于相同的构成元件标附相同的附图标记,并省略其说明。
在本实施例中,在第二层中对CH1进行编码时,对第一声道信号CH1CH1和单声道信号的差分参数进行编码。更为详细的说明为,第一声道信号用编码器104a对输入到可扩展性编码装置200的第一信道信号CH1进行基于CELP编码的编码处理,也就是通过线性预测分析以及自适应音源代码本搜索而进行编码处理,并求取在该过程得到的编码参数与从单声道信号用CELP编码器103输出的单声道信号的CELP编码参数的差分参数。另外,如果对于该编码处理也简单称为CELP编码处理的话,则以上的处理相当于对单声道信号M与第一声道信号CH1在CELP编码参数的电平(阶段)求取差分。而且,第一声道信号用编码器104a对上述的差分参数进行编码。由此,因为对差分参数进行量化,所以能够进行更有效率的编码处理。
单声道信号用CELP编码器103与实施例1相同,对由第一声道信号以及第二声道信号生成出的单声道信号进行CELP编码,提取单声道信号的CELP编码参数并输出。该单声道信号的CELP编码参数也被输入到第一声道信号用编码器104a。另外,单声道信号用CELP编码器103将合成出的单声道信号M’也输出到第一声道信号用编码器104a。
第一声道信号用编码器104a的输入为,第一声道信号CH1、第2声道信号CH2、合成出的单声道信号M’以及单声道信号的CELP编码参数。第一声道信号用编码器104a编码对于单声道信号的第一声道信号的差分,并输出第一声道信号的CELP编码参数。这里,因为单声道信号经CELP编码处理,编码参数被提取出来,所以第一声道信号的CELP编码参数为对于单声道信号的CELP编码参数的差分参数。
图7是表示第一声道信号用编码器104a内部的主要结构的方框图。
LPC量化单元132求取通过LPC分析单元131得到的第一声道信号CH1的LPC参数与通过单声道信号用CELP编码器103已经求取出的单声道信号M的LPC参数之间的差分LPC参数,并将该差分量化使其成为最终的第一声道的LPC参数。
音源搜索如下进行。自适应音源代码本137a将第一声道CH1的自适应代码本延迟作为单声道信号的自适应代码本延迟与对于单声道信号的自适应代码本延迟的差分延迟参数来表示。固定音源代码本139a使用单声道信号用CELP编码器103的固定音源代码本119所使用的用于单声道信号M的固定音源代码本索引作为CH1的固定音源代码本索引。也就是,固定音源代码本139a使用与通过单声道信号的编码处理得到的相同的索引,作为固定音源矢量。
音源增益以通过单声道信号M的编码处理得到的自适应音源增益和与其相乘的增益乘数的积,或者以单声道信号M的编码处理得到的固定音源增益和与其相乘的增益乘数(与相乘于自适应音源增益的乘数相同)的积来表示,并对该增益乘数进行编码。
图8是表示对应于上述可扩展性编码装置200的可扩展性解码装置250的主要结构的方框图。
第一声道信号用解码器152a由单声道信号的CELP编码参数以及第一声道信号的CELP编码参数的双方,合成第一声道信号CH1’。
像这样,根据本实施例,在第二层对CH1进行编码时,因为对根据单声道信号计算出的差分参数进行编码,所以能够进行更有效的编码处理。
以上说明了本发明的实施例1和2。
本发明的可扩展性编码装置以及可扩展性解码装置,不被所示各实施例所限定,可以对本发明加以各种变更来实施。
本发明的可扩展性编码装置以及可扩展性解码装置,还能够配置于移动通信系统的通信终端装置以及基站装置,并且能够提供由此具有同样作用效果的通信终端装置以及基站装置。
另外,在上述各个实施例中,虽然将单声道信号M设为CH1与CH2的平均信号,但是并不一定只限于此。
另外,自适应音源代码本也有时称为自适应代码本。另外,固定音源代码本也有可能被称为固定代码本、噪声代码本、概率代码本(stochasticcodebook)、或者随机代码本(random codebook)。
另外,在此举了通过硬件来构成本发明的例子来说明,本发明还可以通过软件来实现。
另外,用于说明上述的各个实施例的各个功能模块,典型地由集成电路LSI(大规模集成电路)来实现。它们既可以分别实行单芯片化,也可以一部分或者是全部地包含在单个芯片中。
另外,在此虽然称做LSI,但根据集成度的不同也可以称为IC、系统LSI、超LSI、极大LSI等。
另外,集成电路的技术不只限于LSI,也可以使用专用电路或通用处理器来实现。也可以利用LSI制造后可编程的FPGA(Field Programmable GateArray,现场可编程门阵列),或可以利用对LSI内部的电路块的连接或设定为进行重新配置的可重配置处理器(Reconfigurable Processor)。
再有,如果随着半导体技术的进步或者其他技术的派生,出现了替换LSI集成电路的技术,当然也可以利用该技术来实现功能块的集成化。也有应用生物技术等的可能性。
本说明书是根据2004年9月30日提交的日本专利申请特愿第2004-288327号。该内容通过引用全部包括在此。
工业实用性
本发明的可扩展性编码装置和可扩展性解码装置及其方法能够适用于用在移动通信系统中对立体声语音信号通过CELP编码而进行可扩展性编码处理的通信终端装置、基站装置等。

Claims (18)

1.一种可扩展性编码装置,包括:生成单元,由包括第一声道信号和第二声道信号的立体声语音信号生成单声道语音信号;
单声道编码单元,对所述单声道语音信号进行CELP方式的编码处理;
计算单元,计算通过对所述第二声道信号进行CELP方式的编码处理而生成的编码失真;以及
第一声道编码单元,对所述第一声道信号进行CELP方式的编码处理,并求取所述第一声道信号的编码参数,以便使经该编码处理而生成的所述第一声道信号的编码失真、以及通过所述计算单元计算出的所述第二声道信号的编码失真的和最小。
2.如权利要求1所述的可扩展性编码装置,其中:
所述单声道编码单元利用通过对所述单声道语音信号进行CELP方式的编码处理而得到的编码参数,生成合成单声道信号;
所述第一声道编码单元利用通过对所述第一声道信号进行CELP方式的编码处理而得到的编码参数,生成合成第一声道信号;以及
所述计算单元通过利用所述合成单声道信号和所述合成第一声道信号,生成合成第二声道信号,并求取所述第二声道信号和所述合成第二声道信号之间的差分,从而计算通过对所述第二声道信号进行CELP方式的编码处理而生成的编码失真。
3.如权利要求1所述的可扩展性编码装置,其中,不进行对所述第二声道信号的编码处理。
4.如权利要求1所述的可扩展性编码装置,其中,所述和为分别对所述第一声道信号的编码失真以及所述第二声道信号的编码失真进行加权处理而得到的加权失真的和。
5.如权利要求1所述的可扩展性编码装置,其中,所述单声道编码单元将通过对于所述单声道语音信号的线性预测分析而得到的编码参数,输出到所述第一声道编码单元;以及
所述第一声道编码单元对编码参数之间的差分进行编码处理,所述编码参数为通过对于所述第一声道信号的线性预测分析而得到的编码参数和从所述单声道编码单元输出的编码参数。
6.如权利要求1所述的可扩展性编码装置,其中:
所述单声道编码单元将通过对于所述单声道语音信号的自适应音源代码本搜索而得到的编码参数输出到所述第一声道编码单元;以及
所述第一声道编码单元对参数之间的差分进行编码处理,所述参数为通过对于所述第一声道信号的自适应代码本搜索而得到的参数和从所述单声道编码单元输出的编码参数。
7.如权利要求1所述的可扩展性编码装置,其中,所述单声道编码单元将通过对于所述单声道语音信号的固定音源代码本搜索而得到的固定音源代码本索引,输出到所述第一声道编码单元;以及
所述第一声道编码单元利用从所述单声道编码单元输出的固定音源代码本索引,作为所述第一声道信号的固定音源代码本索引。
8.如权利要求1所述的可扩展性编码装置,其中,所述生成单元求取所述第一声道信号以及所述第二声道信号的平均作为所述单声道语音信号。
9.一种可扩展性解码装置,对应于权利要求1所述的可扩展性编码装置,该可扩展性解码装置包括:
单声道解码单元,利用从所述单声道编码单元输出的编码参数,对单声道语音信号进行解码;
第一声道解码单元,利用从所述第一声道编码单元输出的编码参数,对立体声语音信号的第一声道信号进行解码;以及
第二声道解码单元,利用所述单声道语音信号和所述立体声语音信号的第一声道信号,对所述立体声语音信号的第二声道信号进行解码。
10.一种可扩展性解码装置,对应于权利要求5所述的可扩展性编码装置,该可扩展性解码装置包括:
单声道解码单元,利用从所述单声道编码单元输出的编码参数对单声道语音信号进行解码;
第一声道解码单元,利用从所述单声道编码单元输出的编码参数和从所述第一声道编码单元输出的编码参数,对立体声语音信号的第一声道信号进行解码;以及
第二声道解码单元,利用所述单声道语音信号和所述立体声语音信号的第一声道信号,对所述立体声语音信号的第二声道信号进行解码。
11.一种可扩展性解码装置,对应于权利要求6所述的可扩展性编码装置,该可扩展性解码装置包括:
单声道解码单元,利用从所述单声道编码单元输出的编码参数对单声道语音信号进行解码;
第一声道解码单元,利用从所述单声道编码单元输出的编码参数和从所述第一声道编码单元输出的编码参数,对立体声语音信号的第一声道信号进行解码;以及
第二声道解码单元,利用所述单声道语音信号和所述立体声语音信号的第一声道信号,对所述立体声语音信号的第二声道信号进行解码。
12.一种可扩展性解码装置,对应于权利要求7所述的可扩展性编码装置,该可扩展性解码装置包括:
单声道解码单元,利用从所述单声道编码单元输出的编码参数对单声道语音信号进行解码;
第一声道解码单元,利用从所述单声道编码单元输出的编码参数和从所述第一声道编码单元输出的编码参数,对立体声语音信号的第一声道信号进行解码;以及
第二声道解码单元,利用所述单声道语音信号和所述立体声语音信号的第一声道信号,对所述立体声语音信号的第二声道信号进行解码。
13.一种包括权利要求1所述的可扩展性编码装置的通信终端装置。
14.一种包括权利要求9所述的可扩展性解码装置的通信终端装置。
15.一种包括权利要求1所述的可扩展性编码装置的基站装置。
16.一种包括权利要求9所述的可扩展性解码装置的基站装置。
17.一种可扩展性编码方法,包括:
生成步骤,由包括第一声道信号和第二声道信号的立体声语音信号生成单声道语音信号;
单声道编码步骤,对所述单声道语音信号进行CELP方式的编码;
计算步骤,计算对所述第二声道信号经CELP方式的编码处理而生成的编码失真;以及
第一声道编码步骤,对所述第一声道信号实施CELP方式的编码,并求取所述第一声道信号的编码参数,以便使经该编码处理而生成的所述第一声道信号的编码失真、以及通过所述计算步骤计算出的所述第二声道信号的编码失真的和最小。
18.一种可扩展性解码方法,对应于权利要求17所述的可扩展性编码方法,包括:
单声道解码步骤,利用从所述单声道编码步骤生成的编码参数对单声道语音信号进行解码;
第一声道解码步骤,利用从所述第一声道编码步骤生成的编码参数,对立体声语音信号的第一声道信号进行解码;以及
第二声道解码步骤,利用所述单声道语音信号和所述立体声语音信号的第一声道信号,对所述立体声语音信号的第二声道信号进行解码。
CNA2005800332307A 2004-09-30 2005-09-28 可扩展性编码装置和可扩展性解码装置及其方法 Pending CN101031960A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP288327/2004 2004-09-30
JP2004288327 2004-09-30

Publications (1)

Publication Number Publication Date
CN101031960A true CN101031960A (zh) 2007-09-05

Family

ID=36118956

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2005800332307A Pending CN101031960A (zh) 2004-09-30 2005-09-28 可扩展性编码装置和可扩展性解码装置及其方法

Country Status (10)

Country Link
US (1) US7904292B2 (zh)
EP (1) EP1801783B1 (zh)
JP (1) JP4963965B2 (zh)
KR (1) KR20070061847A (zh)
CN (1) CN101031960A (zh)
AT (1) ATE440361T1 (zh)
BR (1) BRPI0516739A (zh)
DE (1) DE602005016130D1 (zh)
RU (1) RU2007111717A (zh)
WO (1) WO2006035810A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113302685A (zh) * 2019-01-17 2021-08-24 日本电信电话株式会社 编码解码方法、解码方法、它们的装置及程序
CN115917643A (zh) * 2020-06-24 2023-04-04 日本电信电话株式会社 声音信号解码方法、声音信号解码装置、程序以及记录介质

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BRPI0515453A (pt) * 2004-09-17 2008-07-22 Matsushita Electric Ind Co Ltd aparelho de codificação escalável, aparelho de decodificação escalável, método de codificação escalável método de decodificação escalável, aparelho de terminal de comunicação, e aparelho de estação de base
KR20070061843A (ko) * 2004-09-28 2007-06-14 마츠시타 덴끼 산교 가부시키가이샤 스케일러블 부호화 장치 및 스케일러블 부호화 방법
JP5046652B2 (ja) * 2004-12-27 2012-10-10 パナソニック株式会社 音声符号化装置および音声符号化方法
EP1818910A4 (en) * 2004-12-28 2009-11-25 Panasonic Corp SCALABLE CODING DEVICE AND SCALABLE CODING METHOD
JP4850827B2 (ja) * 2005-04-28 2012-01-11 パナソニック株式会社 音声符号化装置および音声符号化方法
WO2006118179A1 (ja) * 2005-04-28 2006-11-09 Matsushita Electric Industrial Co., Ltd. 音声符号化装置および音声符号化方法
US20100017199A1 (en) * 2006-12-27 2010-01-21 Panasonic Corporation Encoding device, decoding device, and method thereof
US8599981B2 (en) * 2007-03-02 2013-12-03 Panasonic Corporation Post-filter, decoding device, and post-filter processing method
WO2008108083A1 (ja) * 2007-03-02 2008-09-12 Panasonic Corporation 音声符号化装置および音声符号化方法
CN102576539B (zh) 2009-10-20 2016-08-03 松下电器(美国)知识产权公司 编码装置、通信终端装置、基站装置以及编码方法
US9779739B2 (en) * 2014-03-20 2017-10-03 Dts, Inc. Residual encoding in an object-based audio system

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1268546C (en) * 1985-08-30 1990-05-01 STEREO VOICE SIGNAL TRANSMISSION SYSTEM
JP2746039B2 (ja) * 1993-01-22 1998-04-28 日本電気株式会社 音声符号化方式
JPH06259097A (ja) * 1993-03-09 1994-09-16 Olympus Optical Co Ltd コード駆動音源音声符号化装置
JPH09261065A (ja) * 1996-03-25 1997-10-03 Mitsubishi Electric Corp 量子化装置及び逆量子化装置及び量子化逆量子化システム
JP3622365B2 (ja) 1996-09-26 2005-02-23 ヤマハ株式会社 音声符号化伝送方式
JP3531780B2 (ja) * 1996-11-15 2004-05-31 日本電信電話株式会社 音声符号化方法および復号化方法
US6345246B1 (en) * 1997-02-05 2002-02-05 Nippon Telegraph And Telephone Corporation Apparatus and method for efficiently coding plural channels of an acoustic signal at low bit rates
JP3134817B2 (ja) * 1997-07-11 2001-02-13 日本電気株式会社 音声符号化復号装置
DE19742655C2 (de) * 1997-09-26 1999-08-05 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Codieren eines zeitdiskreten Stereosignals
SE519552C2 (sv) * 1998-09-30 2003-03-11 Ericsson Telefon Ab L M Flerkanalig signalkodning och -avkodning
US6973184B1 (en) * 2000-07-11 2005-12-06 Cisco Technology, Inc. System and method for stereo conferencing over low-bandwidth links
SE519985C2 (sv) * 2000-09-15 2003-05-06 Ericsson Telefon Ab L M Kodning och avkodning av signaler från flera kanaler
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
JP2003099095A (ja) * 2001-09-20 2003-04-04 Canon Inc オーディオ符号化装置、方法、記録媒体及びプログラム
JP2003323199A (ja) 2002-04-26 2003-11-14 Matsushita Electric Ind Co Ltd 符号化装置、復号化装置及び符号化方法、復号化方法
CN100346392C (zh) 2002-04-26 2007-10-31 松下电器产业株式会社 编码设备、解码设备、编码方法和解码方法
KR100528325B1 (ko) * 2002-12-18 2005-11-15 삼성전자주식회사 비트율 조절이 가능한 스테레오 오디오 부호화 및복호화방법 및 그 장치
US7809579B2 (en) * 2003-12-19 2010-10-05 Telefonaktiebolaget Lm Ericsson (Publ) Fidelity-optimized variable frame length encoding

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113302685A (zh) * 2019-01-17 2021-08-24 日本电信电话株式会社 编码解码方法、解码方法、它们的装置及程序
CN113302685B (zh) * 2019-01-17 2024-08-16 日本电信电话株式会社 编码解码方法及装置、解码方法及装置、计算机程序产品
CN115917643A (zh) * 2020-06-24 2023-04-04 日本电信电话株式会社 声音信号解码方法、声音信号解码装置、程序以及记录介质

Also Published As

Publication number Publication date
JPWO2006035810A1 (ja) 2008-05-15
BRPI0516739A (pt) 2008-09-23
DE602005016130D1 (de) 2009-10-01
KR20070061847A (ko) 2007-06-14
RU2007111717A (ru) 2008-10-10
EP1801783A1 (en) 2007-06-27
ATE440361T1 (de) 2009-09-15
EP1801783B1 (en) 2009-08-19
JP4963965B2 (ja) 2012-06-27
WO2006035810A1 (ja) 2006-04-06
US7904292B2 (en) 2011-03-08
EP1801783A4 (en) 2007-12-05
US20080255833A1 (en) 2008-10-16

Similar Documents

Publication Publication Date Title
JP5413839B2 (ja) 符号化装置および復号装置
JP4850827B2 (ja) 音声符号化装置および音声符号化方法
CN1783728A (zh) 通过使用空间信息来处理多声道音频信号的设备和方法
JP4887279B2 (ja) スケーラブル符号化装置およびスケーラブル符号化方法
CN1993733A (zh) 用于空间音频参数的有效编码的能量相关量化
CN1816847A (zh) 保真度优化的可变帧长编码
CN101044551A (zh) 用于双声道提示编码方案和类似方案的单通道整形
JP4887288B2 (ja) 音声符号化装置および音声符号化方法
CN101031960A (zh) 可扩展性编码装置和可扩展性解码装置及其方法
CN1947172A (zh) 方法、装置、编码器设备、解码器设备以及音频系统
JP4948401B2 (ja) スケーラブル符号化装置およびスケーラブル符号化方法
JP4555299B2 (ja) スケーラブル符号化装置およびスケーラブル符号化方法
JPWO2008132850A1 (ja) ステレオ音声符号化装置、ステレオ音声復号装置、およびこれらの方法
US7848932B2 (en) Stereo encoding apparatus, stereo decoding apparatus, and their methods
CN1977311A (zh) 语音编码装置、语音解码装置及其方法
CN101040323A (zh) 音响信号编码装置和音响信号解码装置
CN101044554A (zh) 可扩展性编码装置、可扩展性解码装置以及可扩展性编码方法
US20100121633A1 (en) Stereo audio encoding device and stereo audio encoding method
JP4842147B2 (ja) スケーラブル符号化装置およびスケーラブル符号化方法
JPWO2008090970A1 (ja) ステレオ符号化装置、ステレオ復号装置、およびこれらの方法
CN101069232A (zh) 立体声编码装置、立体声解码装置及其方法
CN1969318A (zh) 音频编码装置、解码装置、方法、以及程序
JP2006072269A (ja) 音声符号化装置、通信端末装置、基地局装置および音声符号化方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20070905