[go: up one dir, main page]

CN101067931A - 一种高效可配置的频域参数立体声及多声道编解码方法与系统 - Google Patents

一种高效可配置的频域参数立体声及多声道编解码方法与系统 Download PDF

Info

Publication number
CN101067931A
CN101067931A CNA2007100990463A CN200710099046A CN101067931A CN 101067931 A CN101067931 A CN 101067931A CN A2007100990463 A CNA2007100990463 A CN A2007100990463A CN 200710099046 A CN200710099046 A CN 200710099046A CN 101067931 A CN101067931 A CN 101067931A
Authority
CN
China
Prior art keywords
module
frequency
sound channel
signal
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2007100990463A
Other languages
English (en)
Other versions
CN101067931B (zh
Inventor
王磊
李迅
刘颖
徐森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Semiconductor technology (Shanghai) Co., Ltd.
Original Assignee
Xincheng (beijing) Sci & Tech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xincheng (beijing) Sci & Tech Co Ltd filed Critical Xincheng (beijing) Sci & Tech Co Ltd
Priority to CN2007100990463A priority Critical patent/CN101067931B/zh
Publication of CN101067931A publication Critical patent/CN101067931A/zh
Application granted granted Critical
Publication of CN101067931B publication Critical patent/CN101067931B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明提供一种高效可配置的频域参数立体声及多声道编解码方法与系统。将左右声道信号转换成和差声道的残差信号及估计的差声道残差信号;分别对估计的差声道残差信号、原始的差声道残差信号和原始的和声道残差信号进行时频变换,并分别提取出高频成分和原始差声道残差信号低频成分;对原始的差声道残差信号中的低频成分进行量化编码;利用高频成分求出估计的左右声道残差的高频成分;求出原始的左右声道残差的高频成分;对高频成分进行增益控制,求出左右声道残差的增益系数并进行量化编码;最后将编码后的数据和边信息进行复用,得到频域参数立体声比特流。

Description

一种高效可配置的频域参数立体声及多声道编解码方法与系统
技术领域
本发明属于立体声及多声道编解码技术领域,具体地说是一种高效可配置的频域参数立体声及多声道编解码方法与系统。
背景技术
经过多年的技术发展,数字音频编码技术已经非常成熟。目前,很多音频编码技术已经成为工业标准被大量应用。如Dolby实验室的AC-3、MPEG组织的MP3和AAC以及3GPP组织的AMR-WB+和EAAC+等,这些技术是数字编码技术在不同阶段发展的结果。随着移动领域、互联网以及无线通讯领域的日益普及,对于更有效的编码技术仍有很大的需求。
减少编码比特率的编码策略主要原理是去除信号冗余以及感知不相关的成分。比如利用预测或变换方法可以有效的去除信号冗余;去除感知不相关是从感知意义上去除不影响感知质量的成分。而对于多声道信号可以利用声道间的冗余以进一步提高编码效率。
编码多声道信号的技术有多种。比如一种叫做“和差立体声编码(mid-side coding)”的技术,这种技术不是直接编码左右声道信号而是先将左右声道信号变换成和差声道信号再进行编码,这样如果左右声道相关性很强,则编码和差声道所用的比特数就可以少于单独编码左右声道所用的比特数。但是由于编码和声道和差声道都是采用所谓的“波形编码”技术,所用的比特数仍然较高,所以这项技术一般都用于较高编码比特率如mp3、AAC等编码器中。
另外有一种叫做强度立体声编码(intensity stereo coding)技术,该技术的原理是:对于高频段(大于2kHz)的信号,听觉的方向感与有关信号强度的变化(信号包络)有关,而与信号的波形无关,即恒包络信号对听觉方向感无影响,因此可利用这一特点以及多声道间的相关信息,将若干声道合成一个共同声道进行编码,这就形成了强度立体声技术。这种技术可以大大减少编码比特数,但是一些研究表明在高频段,相位信息对编码质量还是有一定影响的,所以这项技术的应用就受到了限制。
在AMR-WB+编码器中,采用了所谓的“参数立体声编码(parameterstereo coding)技术。该技术首先对差声道信号进行重采样处理以得到差声道信号的低频部分和高频部分。然后对低频部分和高频部分分别处理。其中对低频部分进行变换编码,而对高频部分则利用和声道的高频去估计差声道的高频,然后进行增益控制。可以说AMR-WB+的参数立体声结合了“波形编码”和“参数编码”两种技术,在编码比特数和编码质量之间进行了较好的平衡。但是由于AMR-WB+的参数立体声对低频部分和高频部分分别进行编码,所以其机构就受到了限制,比如当编码比特率变高时不能有效的改进高频部分的编码质量;而且由于在时域进行重采样,所以在低频部分和高频部分出现不同的延迟,从而使编码结构变得很复杂。
发明内容
为了克服现有技术中的不足,本发明的目的在于提供一种高效可配置的频域参数立体声及多声道编解码方法与系统,提供一致的编解码框架以解决由于在时域重采样而使编解码结构过于复杂的问题。
本发明的再一个目的在于提供一种高效可配置的频域参数立体声及多声道编解码方法与系统,其特点是对于采用精确编码的低频带宽可以根据编码比特率进行灵活控制,比如当可用的编码比特率较高时,可以扩大低频的范围,反之则降低低频的范围。同时保持编解码器框架的一致性。
本发明的第三个目的在于提供一种高效可配置的频域参数立体声及多声道编解码方法与系统,其特点是高频部分进行增益控制是在频域中进行的,所以提高了频率分辨率,使高频部分的质量得到了改善。
本发明的第四个目的在于提供一种高效可配置的频域参数立体声及多声道编解码方法与系统,其特点是根据信号特征,信号的时间分辨率和频率分辨率同时可调,从而采取最适合当前信号的信号处理方法,使信号质量得到了增强。
为完成上述发明目的,本发明提供一种高效可配置的频域参数立体声及多声道编码方法,该方法包括以下步骤:
1)将左右声道信号转换成和差声道信号;
2)将和声道信号用单声道音频编码器进行编码;
3)将和差声道信号进行预测分析,得到和差声道的残差信号及预测分析滤波器系数;本步骤在某些具体实施例中可省略,此时应视本步骤等效于直通,为便于统一阐述,仍称直通状态下的输出为和差声道的残差信号;
4)用和声道残差信号对差声道残差信号根据信号类型进行估计,得到估计的差声道残差信号,信号估计的时间单元根据信号类型确定,当稳态信号时采用长帧,当瞬态信号时则将长帧分成多个短的子帧进行;
5)分别对估计的差声道残差信号、原始的差声道残差信号和原始的和声道残差信号进行时频变换,并分别提取出高频成分和差声道残差信号低频成分;该时频变换的长度也可以根据信号类型变化;
6)对原始的差声道残差信号中的低频成分进行量化编码;
7)利用估计的差声道残差高频成分、原始的差声道残差高频成分和原始的和声道残差高频成分进行增益控制,求出增益系数并进行量化;该增益系数可以为和差声道形式的增益系数,也可以为其他声道形式的增益系数;
8)将编码后的数据和边信息进行复用,得到频域参数立体声比特流。
为完成上述发明目的,本发明还提供一种高效可配置的频域参数立体声及多声道解码方法,该方法包括以下步骤:
1)对和声道编码信息进行解码得到解码后的和声道;
2)对频域参数立体声比特流进行解复用,得到差声道残差低频编码数据、增益系数编码数据、信号估计器系数以及解码所用的所有边信息;
3)对解码后的和声道进行预测滤波,得到和声道的残差信号;对应于编码端的预测分析步骤,本步骤在某些实施例中可省略,此时应视本步骤等效于直通,为便于统一阐述,仍称直通状态下的输出为和声道的残差信号;
4)利用和声道的残差信号及解复用得到的信号估计权值进行估计得到估计的差声道残差信号;
5)对估计的差声道残差信号进行时频变换得到估计的差声道残差频谱系数,并提取出高频成分;
6)对和声道残差信号进行时频变换得到和声道残差频谱系数,并提取出和声道残差信号的低频成分和高频成分;
7)利用解码后的增益系数、估计的差声道残差高频成分与和声道残差的高频成分进行增益控制,得到需要的频域残差信号高频成分。根据编码端增益系数表达形式的不同,该频域残差信号高频成分可以为和差声道的频域残差高频成分,也可以为其他声道形式的频域残差高频成分;
8)对差声道残差低频编码数据进行逆量化解码得到差声道残差的低频成分,并变换成与前一步骤相对应的声道形式的频域残差信号的低频成分;
9)将频域残差信号的低频成分和频域残差信号的高频成分组合在一起后进行频时变换,得到时域残差信号;
10)对时域残差信号进行合成滤波得到时域合成信号;对应于编码端的预测分析步骤,本步骤在某些实施例中可省略,此时应视本步骤等效于直通,为便于统一阐述,仍称直通状态下的输出为时域合成信号;
11)最后通过左右声道形成模块将时域合成信号变换成所需的左右声道信号。
为完成上述发明目的,本发明提供如下高效可配置的频域参数立体声及多声道编码系统。
本发明的高效可配置的频域参数立体声及多声道编码系统,包括和差声道形成模块、预测分析模块、音频编码器模块、信号估计模块、第一、第二和第三时频变换模块、信号类型分析模块、第一、第二和第三高频提取模块、低频提取模块、量化编码模块、增益控制模块、增益量化模块以及第一和第二码流复用模块,其特征在于:
所述和差声道形成模块,用于将输入的左、右声道信号转换成和、差声道信号,输出到预测分析模块;
所述预测分析模块,用于将和差声道形成模块的输出信号进行预测滤波得到和差声道的残差信号;所述线性预测分析模块还产生线谱频率矢量量化索引,并作为边信息输出到第二码流复用模块;该模块在某些具体实施例中可省略,此时应视该模块等效于直通,为便于统一阐述,仍称直通状态下的输出为和差声道的残差信号;
所述音频编码器模块,将和声道信号进行编码形成和声道编码码流输出到第一码流复用模块;本发明并不局限于某一特定音频编码器,它可以是现有音频编码器中的任何一种,如mp3、AAC、AMR-WB+、WMA、EAAC+等;
所述第一码流复用模块,将和声道编码码流复用成为音频编码比特流;
所述信号类型分析模块,用于对输入的差声道残差信号进行类型分析,确定该帧信号类型是快变类型还是缓变类型,得到的信号类型信息一路输出到信号估计模块,一路输出到第一、第二和第三时频变换模块,另一路输出到第二码流复用模块;
所述信号估计模块,根据信号类型用输入的和声道残差信号去估计输入的差声道残差信号得到估计的差声道残差信号并输出到第二时频变换模块,并产生信号估计权值的矢量量化索引作为边信息输出到第二码流复用模块;信号估计的时间单元根据信号类型确定,当稳态信号时采用长帧,当瞬态信号时则将长帧分成多个短的子帧进行;
所述第一时频变换模块,根据输入的信号类型信息对信号估计模块输出的和声道残差信号使用长帧或较短的子帧进行时频变换得到频域信号;
所述第二时频变换模块,根据输入的信号类型信息对信号估计模块输出的估计的差声道残差信号使用长帧或较短的子帧进行时频变换得到频域信号;
所述第三时频变换模块,根据输入的信号类型信息对信号估计模块输出的差声道残差信号使用长帧或较短的子帧进行时频变换得到频域信号;
所述第一高频提取模块,从第一时频变换模块输出的频域信号中提取出该频域信号的高频成分;
所述第二高频提取模块,从第二时频变换模块输出的频域信号中提取出该频域信号的高频成分;
所述第三高频提取模块,从第三时频变换模块输出的频域信号中提取出该频域信号的高频成分;
所述低频提取模块,从第三时频变换模块输出的差声道残差频域信号中提取出该频域信号的低频成分,该低频提取带宽的划分允许在同一编解码框架下根据压缩条件动态地调整,进行无缝切换;
所述量化编码模块,对低频提取模块输出的低频成分进行量化编码,并输出给第二码流复用模块;
所述增益控制模块,根据第一、第二、第三高频提取模块输出的高频成分进行增益控制得到增益系数,并输出到增益量化模块;该增益系数可以为和差声道的增益系数,也可以转换为其他声道形式的增益系数;
所述增益量化模块,将输入的增益系数进行量化编码并将量化编码信息输出到第二码流复用模块;
所述第二码流复用模块,将量化编码模块和增益量化模块输出的量化编码信息、信号类型分析模块输出的信号类型信息和预测分析模块及信号估计模块输出的边信息进行复用,形成频域参数立体声比特流。
为完成上述发明目的,本发明还提供如下的高效可配置的频域参数立体声及多声道解码系统。
本发明的高效可配置的频域参数立体声及多声道解码系统,包括第一和第二码流解复用模块、音频解码器模块、预测滤波模块、信号估计模块、第一和第二时频变换模块、低频提取模块、第一和第二高频提取模块、增益逆量化解码模块、增益控制模块、低频逆量化解码模块、低高频组合模块、频时变换模块、预测综合模块、左右声道形成模块,其特征在于:
所述第一码流解复用模块,对输入的音频编码比特流进行解复用,输出到音频解码器;
所述音频解码器产生解码后的和声道信号,输出到预测滤波模块;
所述第二码流解复用模块,对频域参数立体声比特流进行解复用,产生的线谱频率矢量量化索引输出到预测滤波模块和预测综合模块,产生的信号估计权值的矢量量化索引输出到信号估计模块,产生的信号类型信息输出到第一和第二时频变换模块、信号估计模块以及频时变换模块,产生的量化编码的增益系数输出到增益逆量化解码模块,产生的量化编码后的频域低频成分输出到低频逆量化解码模块;
所述预测滤波模块,对音频解码器输出的和声道信号进行滤波得到和声道残差信号;该模块在某些具体实施例中可不实现,此时应视该模块等效于直通,为便于统一阐述,仍称直通状态下的输出为和声道残差信号;
所述信号估计模块,利用作为边信息的信号估计权值的矢量量化索引构成信号估计器,并根据信号类型对预测滤波模块输出的和声道残差信号进行估计得到估计的差声道残差信号,输出到第二时频变换模块;另一路和声道残差信号输出到第一时频变换模块;
所述第一时频变换模块,根据信号类型信息对输入的和声道残差信号进行时频变换得到和声道残差频域信号,并输出到第一高频提取模块和低频提取模块;
所述第二时频变换模块,根据信号类型信息对输入的估计的差声道残差信号进行时频变换得到估计的差声道残差频域信号,并输出到第二高频提取模块;
所述低频提取模块,提取和声道残差频域信号的低频成分,并输出到低高频组合模块;
所述第一高频提取模块,提取和声道残差频域信号的高频成分,并输出到增益控制模块;
所述第二高频提取模块,提取估计的差声道残差频域信号的高频成分,并输出到增益控制模块;
所述低频逆量化解码模块,对输入的量化编码后的差声道残差频域低频成分进行逆量化解码,得到差声道残差频域低频成分,并输出到低高频组合模块;
所述增益逆量化解码模块,利用输入的量化编码的增益系数得到逆量化后的增益系数并输出到增益控制模块;
所述增益控制模块,利用逆量化的增益系数对估计的差声道残差频域高频成分、和声道残差频域高频成分进行增益控制得到增益控制后的频域残差信号高频成分,并输出到低高频组合模块。根据编码端增益系数表达形式的不同,该频域残差信号高频成分可以为和差声道的频域残差高频成分,也可以为其他声道形式的频域残差高频成分;
所述低高频组合模块,将输入的差声道残差频域低频成分、和声道残差频域低频成分和增益控制模块输出的频域残差信号高频成分组合成完整的频域残差信号,输出到频时变换模块。相应的,该频域残差信号可以为和差声道的频域残差信号,也可以为其他声道形式的频域残差信号;
所述频时变换模块,将低高频组合模块输出的频域残差信号进行频时变换,得到时域残差信号,输出到预测综合模块;
所述预测综合模块,利用输入的线谱频率矢量量化索引构成合成滤波器并对输入的时域残差信号进行合成滤波得到时域合成信号,输出到左右声道形成模块;该模块在某些具体实施例中可不实现,此时应视该模块等效于直通,为便于统一阐述,仍称直通状态下的输出为时域合成信号;
所述左右声道形成模块,对应于编码端的和差声道形成模块,将预测综合模块输出的时域合成信号经过变换形成左右声道的时域信号。
本发明具有明显的优于现有技术的有益效果。与现有技术在时域进行信号处理相比,本发明的信号处理是在频域进行。首先,提供一致的编解码框架以解决由于在时域重采样而使编解码结构过于复杂的问题;其次,对于采用精确编码的低频带宽可以根据编码比特率进行灵活控制,比如当可用的编码比特率较高时,可以扩大低频的范围,反之则降低低频的范围,同时保持编解码器框架的一致性;再次,高频部分的增益控制是在频域中进行,所以提高了频率分辨率,使高频部分的质量得到了改善;最后,根据信号特性允许同时对时域分辨率和频域分辨率进行调整,采取最适合当前信号特性的信号处理方式,提高了信号压缩效率。
附图说明
图1为本发明的编码系统原理框图;
图2为本发明的解码系统原理框图;
图3为本发明的第一实施例的频域参数立体声及多声道编码系统框图;
图4为本发明的第一实施例的频域参数立体声及多声道解码系统框图;
图5为本发明的线性预测分析模块构成图;
图6为本发明的编码端信号估计模块构成图;
图7为本发明的维纳估计器结构图;
图8为本发明的长短窗切换示意图;
图9为本发明的解码端线性预测滤波模块构成图;
图10为本发明的解码端信号估计模块构成图;
图11为本发明的解码端线性预测综合模块构成图;
图12为本发明的第一实施例的频域参数立体声及多声道编码方法流程图;
图13为本发明的第一实施例的频域参数立体声及多声道解码方法流程图;
图14为本发明的第二实施例的频域参数立体声及多声道编码系统框图;
图15为本发明的第二实施例的频域参数立体声及多声道解码系统框图;
图16为本发明的第三实施例的频域参数立体声及多声道编码系统框图;
图17为本发明的第三实施例的频域参数立体声及多声道解码系统框图;
图18为本发明的第四实施例的频域参数立体声及多声道编码系统框图;
图19为本发明的第四实施例的频域参数立体声及多声道解码系统框图;
符号说明
xL(n)为原始输入的左声道信号;
Figure A20071009904600201
为解码后的左声道合成信号;
xR(n)为原始输入的右声道信号;
Figure A20071009904600202
为解码后的右声道合成信号;
xM(n)为和差声道变换后的和声道信号;
Figure A20071009904600203
为解码后的和声道信号;
xS(n)为和差声道变换后的差声道信号;
eM(n)为信号预测后的和声道残差信号;
êM(n)为解码后的和声道残差信号;
eS(n)为信号预测后的差声道残差信号;
Figure A20071009904600204
为估计的差声道残差信号;
eR(n)为信号预测后的右声道残差信号;
êR(n)为解码的右声道残差时域信号;
êL(n)为解码的左声道残差时域信号;
EM(k)为时频变换后的和声道残差的频域信号;
为时频变换后的解码后的和声道残差的频域信号;
EMH(k)为和声道残差频域信号的高频部分;
Figure A20071009904600206
为解码后的和声道残差频域信号的高频部分;
Figure A20071009904600207
为解码后的和声道残差频域信号的低频部分;
ES(k)为时频变换后的差声道残差的频域信号;
Figure A20071009904600208
为时频变换后的估计的差声道残差的频域信号;
Figure A20071009904600209
为解码的差声道残差频域信号的低频部分;
WSH(k)为差声道残差频域信号的高频部分;
Figure A200710099046002010
为估计的差声道残差频域信号的高频部分;
Figure A200710099046002011
为解码的左声道残差频域信号;
ELH(k)为左声道残差频域信号的高频部分;
Figure A200710099046002012
为估计的左声道残差频域信号的高频部分;
Figure A200710099046002013
为增益控制后的左声道残差频域信号的高频部分;
Figure A200710099046002014
为解码的左声道残差频域信号的低频部分;
Figure A20071009904600211
为解码的右声道残差频域信号;
ERH(k)为右声道残差频域信号的高频部分;
为估计的右声道残差频域信号的高频部分;
为增益控制后的右声道残差频域信号的高频部分;
Figure A20071009904600214
为解码的右声道残差频域信号的低频部分;
g表示和差声道或者其他声道形式的增益系数矢量,
gL为左声道残差频域信号的高频部分的增益控制系数;
gR为右声道残差频域信号的高频部分的增益控制系数;
yM(n)表示信号估计模块输出的和声道信号或和声道残差信号;
表示和声道解码信号或和声道残差解码信号;
Figure A20071009904600216
表示信号估计模块输出的估计的差声道信号或差声道残差信号;
ys(n)表示信号估计模块输出的差声道信号或差声道残差信号;
YM(k)为yM(n)的频域信号表示;
Figure A20071009904600217
为yM(n)的频域解码信号表示;
YMH(k)为YM(k)信号的频域高频成分;
Figure A20071009904600218
为解码的YM(k)信号的频域高频成分
为解码的YM(k)信号的频域低频成分;
Ys(k)为ys(n)的频域信号表示;
Figure A200710099046002110
Figure A200710099046002111
频域信号表示;
Figure A200710099046002112
Figure A200710099046002113
信号的频域高频成分;
YSH(k)为Ys(k)信号的频域高频成分;
YSL(k)为Ys(k)信号的频域低频成分;
Figure A200710099046002114
为解码的Ys(k)信号的频域低频成分;
Figure A200710099046002115
表示解码端经过增益控制后的和差声道或其他声道形式的高频成分;
AM(z)为和声道的预测滤波器系数组;
A(z)为预测综合滤波器的系数。
具体实施方式
下面结合说明书附图来详细说明本发明的具体实施方式。
图1为本发明编码系统的原理框图,图2为本发明解码系统的原理框图。其中用虚线表示的模块在某些具体实施例中可等效于直通模块,即该模块的输入直接作为输出信号输出到下一个模块中。
图1是根据本发明的高效可配置的频域参数立体声及多声道编码系统原理框图,如图1所示,本发明的编码系统包括和差声道形成模块200、预测分析模块201、音频编码器模块203、信号估计模块204、第一、第二和第三时频变换模块205、206、207、信号类型分析模块208、第一、第二和第三高频提取模块213、209、210、低频提取模块211、量化编码模块212、增益控制模块215、增益量化模块216以及第一和第二码流复用模块214、217。其中,和差声道形成模块200,用于将输入的左、右声道信号转换成和、差声道信号,输出到预测分析模块。预测分析模块201,将和差声道形成模块的输出信号进行预测滤波得到和差声道的残差信号。线性预测分析模块还产生线谱频率矢量量化索引,并作为边信息输出到第二码流复用模块。该模块在某些具体实施例中可省略,此时应视该模块等效于直通,为便于统一阐述,仍称直通状态下的输出为和差声道的残差信号。音频编码器模块203,将和声道信号进行编码形成和声道编码码流输出到第一码流复用模块。本发明并不局限于某一特定音频编码器,它可以是现有音频编码器中的任何一种,如mp3、AAC、AMR-WB+、WMA、EAAC+等。第一码流复用模块214,将和声道编码码流复用成为音频编码比特流。信号类型分析模块208,用于对输入的差声道残差信号进行类型分析,确定该帧信号类型是快变类型还是缓变类型,得到的信号类型信息一路输出到信号估计模块,一路输出到第一、第二和第三时频变换模块,另一路输出到第二码流复用模块。信号估计模块204,根据信号类型用输入的和声道残差信号去估计输入的差声道残差信号得到估计的差声道残差信号并输出到第二时频变换模块,并产生信号估计权值的矢量量化索引作为边信息输出到第二码流复用模块。信号估计的时间单元根据信号类型确定,当稳态信号时采用长帧,当瞬态信号时则将长帧分成多个短的子帧进行。第一时频变换模块205,根据输入的信号类型信息对信号估计模块输出的和声道残差信号使用长帧或较短的子帧进行时频变换得到频域信号。第二时频变换模块206,根据输入的信号类型信息对信号估计模块输出的估计的差声道残差信号使用长帧或较短的子帧进行时频变换得到频域信号。第三时频变换模块207,根据输入的信号类型信息对信号估计模块输出的差声道残差信号使用长帧或较短的子帧进行时频变换得到频域信号。第一高频提取模块213,从第一时频变换模块输出的频域信号中提取出该频域信号的高频成分。第二高频提取模块209,从第二时频变换模块输出的频域信号中提取出该频域信号的高频成分。第三高频提取模块210,从第三时频变换模块输出的频域信号中提取出该频域信号的高频成分。低频提取模块211,从第三时频变换模块输出的差声道残差频域信号中提取出该频域信号的低频成分,该低频提取带宽的划分允许在同一编解码框架下根据压缩条件动态地调整,进行无缝切换。量化编码模块212,对低频提取模块输出的低频成分进行量化编码,并输出给第二码流复用模块。增益控制模块215,根据第一、第二、第三高频提取模块输出的高频成分进行增益控制得到增益系数,并输出到增益量化模块,该增益系数可以为和差声道的增益系数,也可以转换为其他声道形式的增益系数。增益量化模块216,将输入的增益系数进行量化编码并将量化编码信息输出到第二码流复用模块。第二码流复用模块217,将量化编码模块和增益量化模块输出的量化编码信息、信号类型分析模块输出的信号类型信息和预测分析模块及信号估计模块输出的边信息进行复用,形成频域参数立体声比特流。
图2是根据本发明的高效可配置的频域参数立体声及多声道解码系统原理框图。如图2所示,本发明的解码系统包括:第一和第二码流解复用模块301、300、音频解码器模块302、预测滤波模块303、信号估计模块304、第一和第二时频变换模块307、306、低频提取模块305、第一和第二高频提取模块309、308、增益逆量化解码模块311、增益控制模块310、低频逆量化解码模块312、低高频组合模块313、频时变换模块314、预测综合模块315、左右声道形成模块316。第一码流解复用模块301,对输入的音频编码比特流进行解复用,输出到音频解码器。音频解码器302产生解码后的和声道信号,输出到预测滤波模块。第二码流解复用模块300,对频域参数立体声比特流进行解复用,产生的线谱频率矢量量化索引输出到预测滤波模块和预测综合模块,产生的信号估计权值的矢量量化索引输出到信号估计模块,产生的信号类型信息输出到第一和第二时频变换模块、信号估计模块以及频时变换模块,产生的量化编码的增益系数输出到增益逆量化解码模块,产生的量化编码后的频域低频成分输出到低频逆量化解码模块。预测滤波模块303,对音频解码器输出的和声道信号进行滤波得到和声道残差信号;该模块在某些具体实施例中可不实现,此时应视该模块等效于直通,为便于统一阐述,仍称直通状态下的输出为和声道残差信号。信号估计模块304,利用作为边信息的信号估计权值的矢量量化索引构成信号估计器,并根据信号类型对预测滤波模块输出的和声道残差信号进行估计得到估计的差声道残差信号,输出到第二时频变换模块;另一路和声道残差信号输出到第一时频变换模块。第一时频变换模块307,根据信号类型信息对输入的和声道残差信号进行时频变换得到和声道残差频域信号,并输出到第一高频提取模块和低频提取模块。第二时频变换模块306,根据信号类型信息对输入的估计的差声道残差信号进行时频变换得到估计的差声道残差频域信号,并输出到第二高频提取模块。低频提取模块305,提取和声道残差频域信号的低频成分,并输出到低高频组合模块。第一高频提取模块309,提取和声道残差频域信号的高频成分,并输出到增益控制模块。第二高频提取模块308,提取估计的差声道残差频域信号的高频成分,并输出到增益控制模块。低频逆量化解码模块312,对输入的量化编码后的差声道残差频域低频成分进行逆量化解码,得到差声道残差频域低频成分,并输出到低高频组合模块。增益逆量化解码模块311,利用输入的量化编码的增益系数得到逆量化后的增益系数并输出到增益控制模块。增益控制模块310,利用逆量化的增益系数对估计的差声道残差频域高频成分、和声道残差频域高频成分进行增益控制得到增益控制后的频域残差信号高频成分,并输出到低高频组合模块。根据编码端增益系数表达形式的不同,该频域残差信号高频成分可以为和差声道的频域残差高频成分,也可以为其他声道形式的频域残差高频成分。低高频组合模块313,将输入的差声道残差频域低频成分、和声道残差频域低频成分和增益控制模块输出的频域残差信号高频成分组合成完整的频域残差信号,输出到频时变换模块。相应的,该频域残差信号可以为和差声道的频域残差信号,也可以为其他声道形式的频域残差信号。频时变换模块314,将低高频组合模块输出的频域残差信号进行频时变换,得到时域残差信号,输出到预测综合模块。预测综合模块315,利用输入的线谱频率矢量量化索引构成合成滤波器并对输入的时域残差信号进行合成滤波得到时域合成信号,输出到左右声道形成模块;该模块在某些具体实施例中可不实现,此时应视该模块等效于直通,为便于统一阐述,仍称直通状态下的输出为时域合成信号。左右声道形成模块316,对应于编码端的和差声道形成模块,将预测综合模块输出的时域合成信号经过变换形成左右声道的时域信号。
图3是本发明的第一实施例的编码系统框图。该编码系统是在残差域中实现,因此需要预测分析模块201,并且预测分析模块又由和声道预测分析模块2012、右声道预测滤波模块2011和一个减法器2013组成。同时增益控制模块215又由增益控制器2150、两个加法器2151和2153、两个减法器2152和2154组成。因此本发明第一实施例的编码系统包括和差声道形成模块200、和声道线性预测分析模块2012、右声道线性预测滤波模块2011,音频编码器模块203,信号估计模块204,信号类型分析模块208,信号估计模块204、205、206,高频提取模块209、210、213,差声道低频提取模块211,量化编码模块212,增益控制模块215,增益量化模块216,码流复用模块217、214。
和差声道形成模块200,将输入的左声道信号xL(n)和右声道信号xR(n)转换成和声道信号xM(n),其转换公式如式(1)所示。
     xM(n)=0.5·(xL(n)+xR(n))                        (1)
和声道线性预测分析模块2012,将和差声道形成模块200输出的和声道信号进行预测分析并滤波得到和声道残差信号eM(n),该模块可以有效的消除音频信号特别是语音信号在时间上的冗余度,从而提高了编码效率。
右声道线性预测滤波模块2011,将和差声道形成模块200输出的右声道信号利用模块2012输出的由和声道预测系数构成的滤波器进行滤波得到右声道残差信号。并通过减法器2013,将和声道残差信号减去右声道残差信号得到差声道残差信号eS(n)。
音频编码器模块203,对信号xM(n)进行编码,形成特定的编码码流。本发明并不局限于某一特定音频编码器,它可以是现有音频编码器中的任何一种,如mp3、AAC、AMR-WB+、WMA、EAAC+等
信号类型分析模块208,对信号eS(n)进行信号类型分析,确定该帧信号类型是缓变信号还是快变信号。如果为快变类型信号,为了控制前回声(pre-echo),信号估计模块和时频变换模块均采用子帧为单位进行信号估计和时频变换;否则为了提高编码增益,信号估计模块和时频变换模块均采用一帧为单位进行信号估计和时频变换。信号类型分析的结果一路输出到时频变换模块207、206和205中对时频变换进行控制,一路输出到信号估计模块204进行控制,另一路输出到码流复用模块217中。
信号估计模块204,用信号eM(n)根据信号类型去估计信号eS(n)得到估计的差声道残差信号
Figure A20071009904600261
信号估计有多种方法,如最小二乘估计,维纳估计和卡尔曼估计等。信号估计的时间单元根据信号类型确定,当稳态信号时采用长帧,当瞬态信号时则将长帧分成多个短的子帧进行,这样可以针对当前信号类型采取最合适的信号估计长度,提高压缩效率。
时频变换模块205,将信号eM(n)根据信号类型变换到频域(采用变换时)或子带域(采用滤波器组时),得到差声道残差频域或子带域信号EM(k)。变换有多种方法如离散傅立叶变换(DFT)、离散余弦变换(DCT)、修正离散余弦变换(MDCT)、小波变换等。信号变换的长度根据信号类型确定,当稳态信号时采用长帧,当瞬态信号时则将长帧分成多个短的子帧进行,这样有利于提高信号压缩效率。
类似地,时频变换模块206,将信号
Figure A20071009904600262
变换到频域得到信号
Figure A20071009904600263
类似地,时频变换模块207,将信号eS(n)变换到频域得到信号ES(k)。高频提取模块209,从时频变换模块206输出的估计的差声道残差的频域信号 中提取出高频成分
Figure A20071009904600265
高频提取模块210,从时频变换模块207输出的差声道残差的频域信号ES(k)中提取出高频成分ESH(k)。
高频提取模块213,从时频变换模块205输出的和声道残差的频域信号EM(k)提取出高频成分EMH(k)。
差声道低频提取模块211,从时频变换模块207输出的差声道残差的频域信号ES(k)中提取出低频成分。
量化编码模块212,将差声道低频提取模块211输出的的低频成分进行量化编码。量化编码可以为标量量化加熵编码的方案,也可以为矢量量化方案。在低码率编码中,矢量量化是一个合理的选择方案。
增益控制模块215,根据输入的ELH(k)对估计的
Figure A20071009904600271
在增益控制器2150中进行增益控制,得到增益系数gL;根据输入的ERH(k)对估计的
Figure A20071009904600272
在增益控制器2150中进行增益控制,得到增益系数gR。得到的gL、gR输出到增益量化模块216中。其中ELH(k)是利用加法器2153将ESH(k)和EMH(k)相加后得到,ERH(k)是利用减法器2154将ESH(k)和EMH(k)相减后得到。
Figure A20071009904600273
是利用加法器2151将
Figure A20071009904600274
和EMH(k)相加后得到,
Figure A20071009904600275
是利用减法器2152将 和EMH(k)相减后得到。
增益量化模块216,将输入的gL、gR进行量化编码并将量化编码信息输出到码流复用模块217中。
码流复用模块217,接收上述模块输出的编码数据以及边信息进行复用,形成频域参数立体声比特流。
码流复用模块214,将音频编码器模块203输出的编码码流形成音频编码比特流。
图5为本发明的线性预测分析模块示意图。参考图5,线性预测分析模块201由线性预测分析器501、转换器502、矢量量化器503、逆转换器504以及线性预测滤波器505构成。首先由线性预测分析器501对输入的信号xM(n)进行线性预测分析,求出预测系数AM(z),然后由转换器502将AM(z)转换成线谱频率LSF,再将LSF参数送入矢量量化器503中进行矢量量化并得到矢量量化的索引,根据矢量量化的索引得到量化后的线谱频率
Figure A20071009904600277
将得到的
Figure A20071009904600278
经过逆转换器504求出量化后的预测系数
Figure A20071009904600279
并用量化后的预测系数构成线性预测滤波器,最后对信号xM(n)用该线性预测滤波器进行滤波,得到信号eM(n)。其中线谱频率的矢量量化的索引作为边信息输出到码流复用模块217中。
图6为本发明的编码端信号估计模块构成图,参考图6,信号估计模块204由估计分析器601、矢量量化器602和信号估计器603构成。估计分析器601以一定准则(比如均方误差最小准则)用信号eM(n)去估计信号eS(n),得到一组满足条件的权值wi,其中i=0,...,M并且M≥0,M为估计分析器的阶数。得到的这组权值wi输入到矢量量化器602中对权值进行矢量量化并得到矢量量化的索引,根据矢量量化的索引得到量化后的权值并输入到信号估计器603中,信号eM(n)输入到信号估计器603得到
Figure A20071009904600281
其中得到的信号估计权值矢量量化索引还作为边信息输出到码流复用模块217中。
图7为图6中信号估计器603采用的维纳估计器示意图。参考图7,根据输入的信号eM(n)和它的1至M阶延迟,其中M为维纳估计器的阶数,去估计信号eS(n)。
图6中估计分析器601用于确定权值{wk,k=0,…,M},该权值使信号估计器603的估计误差均方值最小。最优权值可由解M阶估计器的wiener-Hopf方程(2)得到,
Σ k = 0 M w k R MM ( k - i ) = r MS ( - i ) 其中i=0,…,M                             (2)
其中
RMM(k-i)=E[eM(n-i)·eM(n-k)]                            (3)
rMS(-i)=E[eM(n-i)·eS(n)]                               (4)
图7所示信号估计器对信号eS(n)进行估计,得到估计的差声道残差信号
Figure A20071009904600283
如式(5)所示。
e ~ S ( n ) = Σ k = 0 M w ^ k · e M ( n - k ) - - - ( 5 )
图8为本发明的时频变换窗切换示意图。参考图8,首先从当前帧的起始位置选取M+N个样本的时域信号x(n),其中M为当前帧数据长度,N为下一帧重叠的长度,M和N的长度由当前帧的信号类型确定。当信号类型为缓变信号时,M和N选择较长的阶数以提高编码增益,在本实施例中采用M=1024,N=128;当信号类型为快变信号时,M和N选择较短的阶数以控制前回声,在本实施例中采用M=256,N=32。再对M+N个样本的时域信号进行加窗操作,得到加窗后的信号xw(n)=w(n)x(n)。其中w(n)为窗函数,在实现中可以使用任何一种满足信号完全重构条件的窗函数,例如可采用余弦窗:
w ( n ) = cos ( n&pi; 2 N 0 + &pi; 4 N 0 - &pi; 2 ) , 0 &le; n < N 0 1 , N 0 &le; n < M cos ( ( n - M ) &pi; 2 N + &pi; 4 N ) , M &le; n < M + N
其中N0为当前帧重叠的长度,由上一帧的信号类型确定。然后对经过加窗后的信号进行DFT变换,从而获得M+N个频域系数,
X ( k ) = &Sigma; n = 0 M + N - 1 x w ( n ) e - j ( 2 &pi; / ( M + N ) ) kn , k &Element; [ 0 , M + N - 1 ]
通过上述方法对eS(n)、
Figure A20071009904600293
和eM(n)分别进行时频变换得到ES(k)、
Figure A20071009904600294
和EM(k)。这些时频变换的变换方法,窗函数以及阶数都保持一致。
图12为本发明第一实施例的编码方法流程图,下文将参考图12对本发明的频域参数立体声编码器编码方法进行详细描述。
首先,在步骤101,使用公式(1)的方法将左右声道信号转换成和声道信号。
在步骤102,将和声道信号进行编码。本发明并不局限于某一特定音频编码方法,它可以是现有音频编码方法中的任何一种,如mp3、AAC、AMR-WB+、WMA、EAAC+等。
其次,在步骤103,将和声道信号分别进行线性预测滤波,得到和声道的残差信号。在此步骤中对一帧N点的和声道信号xM(n)进行p阶线性预测分析处理包含以下步骤:
I)计算当前帧时域信号xM(n)的自相关系数,
r M ( k ) = &Sigma; n = k N x M ( n ) y M ( n - k ) , k &Element; [ 0 , p ] ;
II)利用Levinson-Durbin算法得到预测系数ak,k∈[0,p],并由预测系数构成线性预测滤波器 A ( z ) = 1 - &Sigma; k = 1 p a k z - k ;
III)通过对两个多项式 f 1 ( z ) = A ( z ) + z - p A ( z - 1 ) f 2 ( z ) = A ( z ) - z - p A ( z - 1 ) 求根,将ak转换成线谱对LSPk,并由线谱对LSPk得到线谱频率LSFk
IV)对线谱频率进行矢量量化,得到量化后的线谱频率
Figure A20071009904600304
并转换为量化后的线谱对
Figure A20071009904600305
线谱频率的矢量量化索引作为边信息输出到码流复用模块中,用于在解码器端生成合成滤波器。
V)由量化后的线谱对
Figure A20071009904600306
通过计算f1(z)和f2(z)求出量化后的滤波器系数
Figure A20071009904600307
并构成量化后的和声道滤波器 A ^ ( z ) = 1 - &Sigma; k = 1 p a ^ k z - k .
VI)将xM(n)通过量化后的滤波器计算出预测后的和声道残差信号
e M ( n ) = x M ( n ) - &Sigma; k = 1 p a ^ k x M ( n - k ) .
VII)将右声道信号xR(n)也通过量化后的和声道滤波器
Figure A200710099046003010
得到预测后的右声道残差信号 e R ( n ) = x R ( n ) - &Sigma; k = 1 p a ^ k x R ( n - k )
VIII)用和声道残差信号减去右声道残差信号得到差声道残差信号eS(n)=eM(n)-eR(n)
在步骤104,用和声道残差信号eM(n)对差声道残差声道信号eS(n)进行估计,得到估计的差声道残差信号
Figure A200710099046003012
如果该帧信号为快变类型信号,信号估计模块将长帧信号分成多个短的子帧,然后对每个子帧进行信号估计;如果该帧信号为缓变类型信号,信号估计模块则对长帧信号进行信号估计。利用和声道残差信号对差声道残差信号进行估计的方法有多种,如最小二乘估计,维纳估计和卡尔曼估计等。本发明以维纳估计作为一个优选实施例。
在步骤105,分别对估计的差声道残差信号
Figure A20071009904600311
原始的差声道残差信号eS(n)和原始的和声道残差信号eM(n)进行时频变换,并分别提取出高频成分和差声道低频成分。时频变换的方法有多种,如离散傅立叶变换(DFT)、离散余弦变换(DCT)、修正离散余弦变换(MDCT)、小波变换等。本发明以离散傅立叶变换(DFT)作为一个优选实施例。其中低高频的频率划分允许在一确定频率(比如1kHz)附近根据编码比特率的大小、当前信号的复杂度动态调整,例如当编码比特率较高时,可以适当增大低频编码频带,反之则适当缩小。时频变换的阶数根据信号类型确定,如果当前信号为快变类型信号,则采用较短阶数的时频变换;如果当前信号为缓变类型信号,则采用较长阶数的时频变换。
在步骤106,对原始的差声道残差信号中的低频成分进行量化编码。编码方案可以为标量量化加熵编码的方案,也可以为矢量量化方案。在低码率编码中,矢量量化是一个合理的选择方案。量化编码的结果输出到码流复用模块中。
在步骤107,利用估计的
Figure A20071009904600312
和EMH(k)求出估计的
Figure A20071009904600313
如公式(6)所示;利用原始的EMH(k)和ESH(k)求出原始的ELH(k)和ERH(k),如公式(7)所示。
E ~ LH ( k ) = E MH ( k ) + E ~ SH ( k ) E ~ RH ( k ) = E MH ( k ) - E ~ SH ( k ) - - - ( 6 )
E LH ( k ) = E MH ( k ) + E SH ( k ) E RH ( k ) = E MH ( k ) - E SH ( k ) - - - ( 7 )
在步骤108,利用原始的ELH(k)和ERH(k)对估计的
Figure A20071009904600317
Figure A20071009904600318
进行增益控制,求出左右声道残差的增益系数gL和gR并进行量化。对估计的左右声道残差信号进行增益控制可以以临界带宽(criticalbandwidth)为单位进行,只需对估计的左右声道残差高频成分中的子带进行增益控制,这样,每个子带b的左右残差声道增益gL[b]和gR[b]可以按公式(8)和(9)计算得到:
g L [ b ] = 101 o g 10 &Sigma; k = k b k b + 1 - 1 E LH ( k ) E * LH ( k ) &Sigma; k = k b k b + 1 - 1 E ~ LH ( k ) E ~ * LH ( k ) - - - ( 8 )
g R [ b ] = 101 o g 10 &Sigma; k = k b k b + 1 - 1 E RH ( k ) E * RH ( k ) &Sigma; k = k b k b + 1 - 1 E ~ RH ( k ) E ~ * RH ( k ) - - - ( 9 )
其中*代表着复数共轭,kb为临界子带b的起始谱线。
当然增益控制也可以以MPEG所采用的比例因子带(scalefactorband)为单位进行;为了简单,也可以使每个子带包含的谱线数都相同。
然后将计算得到的左、右残差声道的增益系数进行量化,量化可以采用标量量化也可以采用矢量量化,最后将量化信息输出到码流复用模块中。
在步骤109,将编码后的数据和边信息进行复用,得到频域参数立体声比特流。
图4为本发明第一实施例的解码系统框图。该解码系统与图3编码系统相对应,因此也在残差域中实现,需要线性预测滤波模块303,并且,增益控制模块310是由增益控制器3100、加法器3101和减法器3102组成;低高频组合模块313由加法器3130和减法器3131组成;频时变换314由左声道频时变换3140和右声道频时变换3141组成;线性预测综合模块315由左声道线性预测综合模块3150和右声道线性预测综合模块3151组成。因此本发明第一实施例的解码系统包括码流解复用模块300、301,音频解码器302,线性预测滤波模块303,信号估计模块304,时频变换模块306、307,高频提取模块308、309,增益逆量化解码模块311,增益控制模块310,差声道低频逆量化解码模块312,低频提取模块305,低高频组合模块313,频时变换模块314,线性预测综合模块315。
码流解复用模块300,对频域参数立体声比特流进行解复用,得到相应的编码数据和边信息并对应输出到各模块中,以提供相应的数据和解码信息。其中输出到线性预测滤波模块303的边信息是和声道线谱频率矢量量化索引;输出到信号估计模块304的是信号估计权值的矢量量化索引和信号类型参数;输出到线性预测综合模块315的是和声道线谱频率矢量量化索引;输出到时频变换模块306和307以及频时变换模块314的是信号类型参数;输出到增益逆量化解码模块311的是量化编码后的增益系数;输出到差声道低频逆量化解码模块312的是量化编码后的差声道残差信号的低频数据。
码流解复用模块301,对输入的音频编码比特流进行解复用并将解复用的比特流输入到音频解码器模块302中。
音频解码器302,利用输入的比特流解码出和声道信号,该音频解码器与编码系统中的音频编码器相对应,可以是现有音频解码器中的任何一种,如mp3、AAC、AMR-WB+、WMA、EAAC+等,得到解码后的和声道信号输出到线性预测滤波模块303中。
线性预测滤波模块303,利用解复用的和声道线谱频率对解码后的和声道信号
Figure A20071009904600331
进行滤波,得到和声道残差信号êM(n)。
信号估计模块304,对êM(n)进行估计得到
Figure A20071009904600334
该304模块与图6所示编码端的信号估计模块204相对应,并且以采用图7所示的维纳估计器作为一个优选实施例。
时频变换模块306,与编码端的时频变换模块206一样,将信号变换得到
Figure A20071009904600336
时频变换模块307,与编码端的时频变换模块205一样,将信号êM(n)变换得到
Figure A20071009904600338
高频提取模块309和高频提取模块308分别提取出
Figure A20071009904600339
的高频成分
Figure A200710099046003311
Figure A200710099046003312
并输入到增益控制模块310中。
增益逆量化解码模块311,是编码端增益量化模块216的逆过程。通过该模块可以得到一组解量化的左、右残差声道增益系数,并输出到增益控制模块310中。
增益控制模块310由增益控制器3100、加法器3101和减法器3102组成。加法器3101将输入的
Figure A200710099046003313
相加后得到估计的左声道残差高频成分
Figure A200710099046003315
减法器3102将输入的
Figure A200710099046003316
Figure A200710099046003317
相减后得到估计的右声道残差高频成分
Figure A200710099046003318
增益控制器3100根据输入的左右残差声道增益系数对
Figure A200710099046003319
Figure A200710099046003320
进行增益控制得到左右残差声道的高频成分
Figure A200710099046003321
Figure A200710099046003322
并输出到低高频组合模块313中。
差声道低频逆量化解码模块312,是编码端量化编码模块212的逆过程。通过该模块可以得到差声道残差低频成分
Figure A200710099046003323
并输出到低高频组合模块313中。
低频提取模块305提取出
Figure A200710099046003324
中的低频
Figure A200710099046003325
并输出到低高频组合模块313中。
低高频组合模块313由加法器3130和减法器3131组成。首先加法器3130将输入的
Figure A20071009904600341
Figure A20071009904600342
相加后得到左声道残差低频成分
Figure A20071009904600343
然后减法器3131将输入的
Figure A20071009904600345
相减后得到右声道残差低频成分
Figure A20071009904600346
最后将
Figure A20071009904600347
和输入的 组合成左声道残差全频带谱系数
Figure A20071009904600349
Figure A200710099046003410
和输入的
Figure A200710099046003411
组合成右声道残差全频带谱系数
Figure A200710099046003412
并将
Figure A200710099046003413
Figure A200710099046003414
输出到频时变换模块314中。
频时变换模块314由左声道频时变换模块3140和右声道频时变换模块3141组成,是编码端时频变换模块的逆过程。模块3140对左声道残差的频域系数进行频时变换得到左声道残差信号;模块3141对右声道残差的频域系数进行频时变换得到右声道残差信号。
线性预测综合模块315由左声道线性预测综合模块3150和右声道线性预测综合模块3151组成。模块3150和3151利用从边信息得到的和声道的线谱频率矢量量化索引构成预测综合器,将左右声道残差信号通过后得到左右声道信号。
图9为图4所示解码系统中的线性预测滤波模块303的构成图。参考图9,线性预测滤波模块303由解矢量量化器1001、逆转换器1002和线性预测滤波器1003构成。解矢量量化器1001利用输入的和声道线谱频率矢量量化索引通过查找码表得到和声道量化的线谱频率
Figure A200710099046003415
经过逆转换器1002求出量化后的预测系数 线性预测滤波器1003利用
Figure A200710099046003417
构成滤波器对 进行滤波,得到êM(n)。
图10为图4所示解码系统中信号估计模块304的构成图。参考图10,信号估计模块304由解矢量量化器1101和信号估计器1102构成。解矢量量化器1101利用作为边信息输入的信号估计权值矢量量化索引通过查找码表得到量化后的权值
Figure A200710099046003420
信号估计器1102用量化后的权值
Figure A200710099046003421
得到信号估计器,用该信号估计器对êM(n)进行估计即可得到
Figure A200710099046003423
图11为图4所示解码系统的左声道线性预测综合模块3150的构成图。参考图11,左声道线性预测综合模块3150由解矢量量化器1201、逆转换器1202和线性预测合成器1203构成。解矢量量化器1201利用输入的和声道线谱频率矢量量化索引通过查找码表得到和声道量化的线谱频率
Figure A20071009904600351
得到的
Figure A20071009904600352
经过逆转换器1202求出量化后的预测系数 线性预测合成器1203利用
Figure A20071009904600354
构成合成器。最后对êL(n)进行合成得到
Figure A20071009904600355
同样,利用一样的合成器对êR(n)进行合成得到
Figure A20071009904600356
图13为本发明第一实施例的解码方法流程图,下文将参考图13对本发明第一实施例的频域参数立体声编码器解码方法进行详细描述。
首先,在步骤201,对和声道进行解码得到解码后的和声道。解码的方法和编码端相对应。
在步骤202,对频域参数立体声比特流进行解复用,得到差声道残差低频编码数据、增益系数编码数据以及解码所用的所有边信息。
其次,在步骤203,对解码后的和声道进行线性预测滤波,得到和声道的残差信号。所述线性预测滤波包含以下步骤:
I)从码流中读出和声道线谱频率的矢量量化索引,利用矢量量化索引通过查找对应码书得到量化后的线谱频率,并转换为线谱对;
II)由量化后的线谱对通过计算f1(z)和f2(z)求出量化后的预测系数并构成量化后的线性预测滤波器 A ^ M ( z ) = 1 - &Sigma; k = 1 p a ^ k z - k , 其中,p为预测阶数,并且和编码端相同;
III)将解码后的和声道通过线性预测滤波器得到和声道的残差信号:
e ^ M ( n ) = x ^ M ( n ) - &Sigma; k = 1 p a ^ k x ^ M ( n - k ) .
在步骤204,对和声道的残差信号进行估计得到估计的差声道残差信号。对和声道的残差信号进行估计要和编码端相对应。首先,从码流中读出信号估计权值矢量量化索引,利用矢量量化索引通过查找对应码书得到量化后的权值 { w ^ k , k = 0 , &CenterDot; &CenterDot; &CenterDot; , M } , 其中M为估计器的阶数,与编码端相同,其次,用量化后的权值构成信号估计器,并将和声道的残差信号通过该估计器,得到估计的差声道残差信号: e ~ S ( n ) = &Sigma; k = 0 M w ^ k &CenterDot; e M ( n - k ) .
在步骤205,对估计的差声道残差信号进行时频变换得到估计的差声道残差线谱频率,并提取出高频成分。时频变换和编码端的时频变换保持一致,如果也对估计的差声道残差信号进行M+N阶DFT变换,则可以得到M+N个频域线谱频率
Figure A20071009904600361
k∈[0,M+N-1]。将估计差声道频域线谱频率
Figure A20071009904600362
提取出高频成分
Figure A20071009904600363
在步骤206,对和声道残差信号进行时频变换得到和声道残差线谱频率,并提取出低频成分和高频成分。时频变换和编码端的时频变换保持一致,如果也对和声道残差信号进行M+N阶DFT变换,则可以得到M+N个频域线谱频率
Figure A20071009904600364
k∈[0,M+N-1]。将和声道线谱频率
Figure A20071009904600365
提取出低频成分
Figure A20071009904600366
和高频成分
Figure A20071009904600367
在步骤207,利用提出的估计的差声道残差高频成分与和声道残差的高频成分形成估计的左右残差声道高频成分。估计的左右残差声道高频成分
Figure A20071009904600368
利用公式(10)求得。
E ~ LH ( k ) = E ~ MH ( k ) + E ~ SH ( k ) E ~ RH ( k ) = E ~ MH ( k ) - E ~ SH ( k ) - - - ( 10 )
在步骤208,利用解码后的左右残差声道增益系数对估计的左右残差声道高频成分进行增益控制,得到左右声道残差的高频成分,并形成差声道残差高频成分。增益控制和编码端对应。如果增益控制也以临界带宽(critical bandwidth)为单位进行,则左右残差声道的高频成分
Figure A200710099046003611
可以按公式(11)计算得到:
E ^ LH ( k ) = 10 0.1 &CenterDot; g ^ L [ b ] &CenterDot; E ~ LH ( k ) E ^ RH ( k ) = 10 0.1 &CenterDot; g ^ R [ b ] &CenterDot; E ~ RH ( k ) - - - ( 11 )
其中k属于临界子带b中的所有谱线,
Figure A200710099046003615
为子带b的解量化后的左右声道增益系数, 为估计的左右残差声道高频成分。
在步骤209,对差声道残差低频编码数据进行逆量化解码得到差声道残差的低频成分。对差声道残差低频编码数据进行逆量化解码要和本发明的编码端相对应,得到差声道残差低频成分
Figure A200710099046003618
通过步骤1406得到的和声道残差低频成分
Figure A200710099046003619
利用公式(12)即可计算出左右声道残差低频成分
Figure A200710099046003620
Figure A200710099046003621
E ^ LL ( k ) = E ^ ML ( k ) + E ^ SL ( k ) E ^ RL ( k ) = E ^ ML ( k ) - E ^ SL ( k ) - - - ( 12 )
在步骤210,对左右声道残差的低频成分和高频成分组合在一起进行频时变换映射与编码端的时频变换相对应。可以采用逆离散傅立叶变换(IDFT)、逆离散余弦变换(IDCT)、逆修正离散余弦变换(IMDCT)、逆小波变换等。分别对左右声道残差频域线谱频率进行频时变换映射后得到左右声道残差信号êL(n)和êR(n)。
在步骤211,对左右声道残差信号进行合成滤波得到解码后的左右声道信号。
对左声道残差信号êL(n)进行合成滤波包含以下步骤:
首先,从码流中读出和声道线谱频率的矢量量化索引,利用矢量量化索引通过查找对应码书得到量化后的线谱频率,并转换为线谱对;
其次,由量化后的线谱对通过计算f1(z)和f2(z)求出量化后的预测系数
Figure A20071009904600372
并构成量化后的线性预测合成滤波器 1 A ^ M ( z ) = 1 1 - &Sigma; i = 1 p a ^ i z - i 其中,p为预测阶数,同编码端相同;
最后,将左声道残差信号êL(n)通过线性预测合成滤波器得到解码后的左声道信号: x ^ L ( n ) = e ^ L ( n ) + &Sigma; i = 1 p a ^ i x ^ L ( n - i ) .
同样将右声道残差信号êR(n)通过线性预测合成滤波器得到解码后的右声道信号: x ^ R ( n ) = e ^ R ( n ) + &Sigma; i = 1 p a ^ i x ^ R ( n - i ) .
图14为本发明第二实施例的编码系统框图。参考图14,该编码系统和图3所示编码系统的区别在于预测分析模块201的实现不同,而其它模块完全相同。所以只介绍预测分析模块201的实现方法,而与图3相同的模块此处不再赘述。
和声道线性预测分析模块2012,将和差声道形成模块200输出的和声道信号进行预测分析并滤波得到和声道残差信号eM(n),该模块可以有效的消除音频信号特别是语音信号在时间上的冗余度,从而提高了编码效率。具体实现如图5所示,前面已经叙及,此处不再赘述。利用图5所述的方法对信号xM(n)进行滤波,得到信号eM(n)。其中和声道线谱频率的矢量量化的索引作为边信息输出到码流复用模块217中。
差声道线性预测分析模块2010,将和差声道形成模块200输出的差声道信号进行预测分析并滤波得到差声道残差信号eS(n),而不再是如实施例1般,共用和声道的线性分析滤波模块。具体实现如图5所示,前面已经叙及,此处不再赘述。利用图5所述的方法对信号xS(n)进行滤波,得到信号eS(n)。其中差声道线谱频率的矢量量化的索引作为边信息输出到码流复用模块217中。
本发明第二实施例编码系统中对应各个模块的功能以及工作原理和图3第一实施例中相应模块相同,此处不再赘述。
本发明第二实施例编码系统所采用的编码方法的具体步骤如下:
步骤1、将左右声道信号转换成和差声道信号;
步骤2、将和声道信号进行编码;
步骤3、将和差声道信号分别进行线性预测滤波,得到和差声道的残差信号;
步骤4、用和声道残差信号根据信号类型对差声道残差声道信号进行估计,得到估计的差声道残差信号;
步骤5、分别对估计的差声道残差信号、原始的差声道残差信号和原始的和声道残差信号进行时频变换,并分别提取出高频成分和差声道低频成分;
步骤6、对原始的差声道残差信号中的低频成份进行量化编码;
步骤7、利用估计的差声道残差高频成份和原始的和声道残差高频成份求出估计的左右声道残差的高频成份;利用原始的和差声道残差高频成份求出原始的左右声道残差的高频成份。
步骤8、利用原始的左右声道残差高频成份对估计的左右声道残差高频成份进行增益控制,求出左右声道残差的增益系数并进行量化。
步骤9、将编码后的数据和边信息进行复用,得到频域参数立体声比特流。
此第二实施例编码系统所采用方法中各个相应步骤的具体内容与图3所示第一实施例编码系统编码方法的对应步骤相同,此处不再赘述。
图15为本发明第二实施例的解码系统的框图。参考图15,该解码系统和图4所示第一实施例解码系统的区别在于低高频组合模块313、频时变换模块314、线性预测综合模块315和左右声道形成模块316。其他模块与图4完全相同。所以下面只介绍与图4不同的模块,而相同的模块此处不再赘述。
低高频组合模块313接收增益控制模块310输出的左右残差声道的高频成分
Figure A20071009904600391
Figure A20071009904600392
以及差声道低频逆量化解码模块312输出的差声道残差的低频成分
Figure A20071009904600393
模块313由减法器3130组成。减法器3130将
Figure A20071009904600394
Figure A20071009904600395
相减并除以2以后得到差声道残差的高频成分
Figure A20071009904600396
组合在一起得到差声道残差的全频带谱系数
Figure A20071009904600397
并输出到频时变换模块314中。
频时变换模块314是编码端时频变换模块的逆过程。将差声道残差的频域系数
Figure A20071009904600398
通过频时变换得到差声道的残差信号êS(n)并输出到线性预测综合模块315中。具体变换方法前面已经叙及,此处不再赘述。
线性预测综合模块315从边信息得到的差声道的线谱频率矢量量化索引构成预测综合器,将差声道残差信号êS(n)通过后得到差声道信号
Figure A20071009904600399
并输出到左右声道形成模块316中。具体实现方法前面已经叙及,此处不再赘述。
左右声道形成模块316接收音频解码器302输出的解码后的和声道信号 和线性预测综合模块315输出的
Figure A200710099046003911
模块316通过将
Figure A200710099046003912
Figure A200710099046003913
相加得到解码后的左声道信号 相减得到解码后的右声道信号
Figure A200710099046003915
本发明第二实施例解码系统中的对应各个模块的功能以及工作原理和图4第一实施例中相应模块相同,此处不再赘述。
本发明第二实施例解码系统所采用的解码方法步骤如下:
步骤1、对和声道进行解码得到解码后的和声道;
步骤2、对频域参数立体声比特流进行解复用,得到差声道残差低频编码数据、增益系数编码数据以及解码所用的所有边信息;
步骤3、对解码后的和声道进行线性预测滤波,得到和声道的残差信号;
步骤4、对和声道的残差信号进行估计得到估计的差声道残差信号;
步骤5、对估计的差声道残差信号进行时频变换得到估计的差声道残差频谱系数,并提取出高频成份;
步骤6、对和声道残差信号进行时频变换得到和声道残差频谱系数,并提取出高频成份;
步骤7、利用提出的估计的差声道残差高频成份与和声道残差的高频成份形成估计的左右残差声道高频成份;
步骤8、利用解码后的左右残差声道增益系数对估计的左右残差声道高频成份进行增益控制,得到左右声道残差的高频成份,并形成差声道残差高频成份;
步骤9、对差声道残差低频编码数据进行逆量化解码得到差声道残差的低频成份;
步骤10、将差声道残差的低频成份和差声道残差的高频成份组合在一起后进行频时变换,得到差声道残差信号;
步骤11、对差声道残差信号进行合成滤波得到解码后的差声道信号;
步骤12、将解码后的和差声道信号转换成解码后的左右声道信号。
此第二实施例所采用方法中各个相应步骤的具体内容与图4所示第一实施例解码系统解码方法的对应步骤相同,此处不再赘述。
图16为本发明第三实施例的编码系统框图。参考图16,该编码系统和图14所示第二实施例编码系统的区别在于信号估计模块204由信号估计器2041和线性预测综合模块2042组成。另一个区别是输入到时频变换模块206的是和声道信号xM(n)而不是和声道残差信号eM(n)。
信号估计器2041的实现与第二实施例编码系统中信号估计模块204的实现相同。
线性预测综合模块2042接收信号估计器2041输出的估计的差声道残差信号
Figure A20071009904600411
和差声道线性预测分析模块2011输出的量化后的差声道预测系数。线性预测综合模块2042首先利用输入的量化后的差声道预测系数构成差声道合成滤波器;然后将估计的差声道残差信号
Figure A20071009904600412
输入其中得到估计的差声道信号
Figure A20071009904600413
最后将
Figure A20071009904600414
输出到时频变换模块206中。
通过加入模块2042后,此后时频变换、高低频的提取以及增益控制都在原始信号域中进行。
本发明第三实施例编码系统中的对应各个模块的功能以及工作原理和图3第一实施例中相应模块相同,此处不再赘述。
本发明第三实施例编码系统所采用的编码方法的具体步骤如下:
步骤1、将左右声道信号转换成和差声道信号;
步骤2、将和声道信号进行编码;
步骤3、将和差声道信号分别进行线性预测滤波,得到和差声道的残差信号;
步骤4、用和声道残差信号根据信号类型对差声道残差声道信号进行估计,得到估计的差声道残差信号;
步骤5、对估计的差声道残差信号进行合成得到估计的差声道信号;
步骤6、分别对估计的差声道信号、原始的差声道信号和原始的和声道信号进行时频变换,并分别提取出高频成分和差声道低频成分;
步骤7、对原始的差声道信号中的低频成份进行量化编码;
步骤8、利用估计的差声道高频成份和原始的和声道高频成份求出估计的左右声道的高频成份;利用原始的和差声道高频成份求出原始的左右声道的高频成份。
步骤9、利用原始的左右声道高频成份对估计的左右声道高频成份进行增益控制,求出左右声道的增益系数并进行量化。
步骤10、将编码后的数据和边信息进行复用,得到频域参数立体声比特流。
此第三实施例编码系统所采用方法中各个相应步骤的具体内容与图3第一实施例所示编码系统编码方法的对应步骤相同,此处不再赘述。
图17为本发明第三实施例的解码系统框图。参考图17,该解码系统和图15所示第二实施例解码系统的区别在于去掉频时变换模块314和左右声道形成模块316之间的线性预测综合模块315;并且信号估计模块304由信号估计器3041和线性预测综合模块3042组成。另一个区别是输入到时频变换模块307的是解码后的和声道信号
Figure A20071009904600421
而不是和声道残差信号êm(n)。
信号估计器3041的实现与第二实施例解码系统中信号估计模块304的实现相同。
线性预测综合模块3042接收信号估计器3041输出的估计的差声道残差信号
Figure A20071009904600422
和码流解复用模块300输出的边信息。线性预测综合模块3042首先利用输入的边信息构成差声道合成滤波器;然后将估计的差声道残差信号
Figure A20071009904600423
输入其中得到估计的差声道信号
Figure A20071009904600424
最后将 输出到时频变换模块306中。
本发明第三实施例解码系统中对应各个模块的功能以及工作原理和图4第一实施例中相应模块相同,此处不再赘述。
本发明第三实施例解码系统所采用的解码方法步骤如下:
步骤1、对和声道进行解码得到解码后的和声道;
步骤2、对频域参数立体声比特流进行解复用,得到差声道低频编码数据、增益系数编码数据以及解码所用的所有边信息;
步骤3、对解码后的和声道进行线性预测滤波,得到和声道的残差信号;
步骤4、对和声道的残差信号进行估计得到估计的差声道残差信号;
步骤5、对估计的差声道残差信号进行合成滤波得到估计的差声道信号;
步骤6、对估计的差声道信号进行时频变换得到估计的差声道频谱系数,并提取出高频成份;
步骤7、对和声道信号进行时频变换得到和声道频谱系数,并提取出高频成份;
步骤8、利用提出的估计的差声道高频成份与和声道的高频成份形成估计的左右声道高频成份;
步骤9、利用解码后的左右声道增益系数对估计的左右声道高频成份进行增益控制,得到左右声道的高频成份,并形成差声道高频成份;
步骤10、对差声道低频编码数据进行逆量化解码得到差声道的低频成份;
步骤11、将差声道的低频成份和差声道的高频成份组合在一起后进行频时变换,得到解码后的差声道信号;
步骤12、将解码后的和差声道信号转换成解码后的左右声道信号。
此第三实施例解码系统所采用方法中各个相应步骤的具体内容与图4所示第一实施例解码系统解码方法的对应步骤相同,此处不再赘述。
图18为本发明第四实施例的编码系统框图。参考图18,该编码系统和图14所示第三实施例编码系统的区别在于增益控制模块215只对差声道残差信号进行增益控制,因此时频变换模块仅需要206和207两个即可,从而大大降低了编码的复杂度。增益控制模块215的实现方式和第一实施例中增益控制模块2150相同,此处不再赘述。
本发明第四实施例编码系统中的对应各个模块的功能以及工作原理和图3第一实施例中相应模块相同,此处不再赘述。
本发明第四实施例编码系统所采用的编码方法的具体步骤如下:
步骤1、将左右声道信号转换成和差声道信号;
步骤2、将和声道信号进行编码;
步骤3、将和差声道信号分别进行线性预测滤波,得到和差声道的残差信号;
步骤4、用和声道残差信号根据信号类型对差声道残差声道信号进行估计,得到估计的差声道残差信号;
步骤5、分别对估计的差声道残差信号、原始的差声道残差信号进行时频变换,并分别提取出高频成分和差声道低频成分;
步骤6、对原始的差声道残差信号中的低频成份进行量化编码;
步骤7、利用估计的差声道残差高频成份和原始的差声道残差高频成份进行增益控制,求出差声道残差的增益系数并进行量化。
步骤8、将编码后的数据和边信息进行复用,得到频域参数立体声比特流。
此第四实施例编码系统所采用方法中各个相应步骤的具体内容与图3所示第一实施例编码系统编码方法的对应步骤相同,此处不再赘述。
图19为本发明第四实施例的解码系统框图。参考图19,该解码系统和图15所示第三实施例解码系统的区别在于增益控制模块310只对差声道残差进行增益控制,因此时频变换模块仅需要306一个即可,从而大大降低了解码的复杂度。增益控制模块310的实现方式和第一实施例中解码端的增益控制模块3100相同,此处不再赘述。
本发明第四实施例解码系统的对应各个模块的功能以及工作原理和图4第一实施例中相应模块相同,此处不再赘述。
本发明第四实施例解码系统所采用的解码方法的具体步骤如下:
步骤1、对和声道进行解码得到解码后的和声道;
步骤2、对频域参数立体声比特流进行解复用,得到差声道残差低频编码数据、增益系数编码数据以及解码所用的所有边信息;
步骤3、对解码后的和声道进行线性预测滤波,得到和声道的残差信号;
步骤4、对和声道的残差信号进行估计得到估计的差声道残差信号;
步骤5、对估计的差声道残差信号进行时频变换得到估计的差声道残差频谱系数,并提取出高频成份;
步骤6、利用解码后的差声道残差增益系数对估计的差声道残差的高频成份进行增益控制,得到差声道残差的高频成份;
步骤7、对差声道残差低频编码数据进行逆量化解码得到差声道残差的低频成份;
步骤8、将差声道残差的低频成份和差声道残差的高频成份组合在一起后进行频时变换,得到差声道残差信号;
步骤9、对差声道残差信号进行合成滤波得到解码后的差声道信号;
步骤10、将解码后的和差声道信号转换成解码后的左右声道信号。
此第四实施例解码系统所采用方法中各个相应步骤的具体内容与图4所示第一实施例解码系统解码方法的对应步骤相同,此处不再赘述。
本领域技术人员应当注意,以上实施例仅用以说明本发明而并非限制本发明;因此,尽管本说明书参照上述的各个实施例对本发明已进行了详细的说明,但是,本领域的普通技术人员应当理解,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。

Claims (24)

1.一种高效可配置的频域参数立体声及多声道编码方法,该方法包括以下步骤:
1)将左右声道信号转换成和差声道信号;
2)将和声道信号用单声道音频编码器进行编码;
3)将和差声道信号进行预测分析,得到和差声道的残差信号及预测分析滤波器系数;
4)用和声道残差信号对差声道残差信号根据信号类型进行估计,得到估计的差声道残差信号,信号估计的时间单元根据信号类型确定,当稳态信号时采用长帧,当瞬态信号时则将长帧分成多个短的子帧进行;
5)分别对估计的差声道残差信号、原始的差声道残差信号和原始的和声道残差信号根据信号类型进行时频变换,并分别提取出高频成分和差声道残差信号低频成分;该时频变换的长度也可以根据信号类型变化;
6)对原始的差声道残差信号中的低频成分进行量化编码;
7)利用估计的差声道残差高频成分、原始的差声道残差高频成分和原始的和声道残差高频成分进行增益控制,求出增益系数并进行量化;该增益系数可以为和差声道形式的增益系数,也可以为其他声道形式的增益系数;
8)将编码后的数据和边信息进行复用,得到频域参数立体声比特流。
2.根据权利要求1所述的方法,其中,所述步骤4中的估计为时域分辩率可变的信号估计,其中所述时域分辨率的调整根据信号类型来进行。
3.根据权利要求2所述的方法,其中,如果所述信号类型为快变类型信号,则信号估计模块将长帧信号分成多个短的子帧,然后对每个子帧进行信号估计;如果该所述信号类型为缓变类型信号,信号估计模块则对长帧信号进行信号估计。
4.根据权利要求1所述的编码方法,其中,所述步骤5中时频变换的方法为频域分辨率可调的变换,其中所述频域分辨率的调整根据信号类型决定。
5.根据权利要求所4述的编码方法,其中,如果所述信号类型为快变类型信号,则时频变换模块将长帧信号分成多个短的子帧,然后对每个子帧进行时频变换;如果所述信号类型为缓变类型信号,时频变换模块则对长帧信号进行变换。
6.根据权利要求1所述的编码方法,其中,所述步骤6中对差声道残差信号低频成分的低频提取带宽的划分可在同一编解码框架下根据压缩条件动态地调整。
7.根据权利要求1所述的编码方法,其中,所述步骤7中对估计的左右声道残差信号在频域进行的增益控制可以以临界带宽(criticalbandwidth)或均匀划分带宽为单位进行。
8.一种高效可配置的频域参数立体声及多声道解码方法,该方法包括以下步骤:
1)对和声道编码信息进行解码得到解码后的和声道;
2)对频域参数立体声比特流进行解复用,得到差声道残差低频编码数据、增益系数编码数据、信号估计器系数以及解码所用的所有边信息;
3)对解码后的和声道进行预测滤波,得到和声道的残差信号;
4)利用和声道的残差信号及解复用得到的信号估计权值进行估计得到估计的差声道残差信号;
5)对估计的差声道残差信号进行时频变换得到估计的差声道残差频谱系数,并提取出高频成分;
6)对和声道残差信号进行时频变换得到和声道残差频谱系数,并提取出和声道残差信号的低频成分和高频成分;
7)利用解码后的增益系数、估计的差声道残差高频成分与和声道残差的高频成分进行增益控制,得到需要的频域残差信号高频成分。根据编码端增益系数表达形式的不同,该频域残差信号高频成分可以为和差声道的频域残差高频成分,也可以为其他声道形式的频域残差高频成分;
8)对差声道残差低频编码数据进行逆量化解码得到差声道残差的低频成分,并变换成与前一步骤相对应的声道形式的频域残差信号的低频成分;
9)将频域残差信号的低频成分和频域残差信号的高频成分组合在一起后进行频时变换,得到时域残差信号;
10)对时域残差信号进行合成滤波得到时域合成信号;
11)最后通过左右声道形成模块将时域合成信号变换成所需的左右声道信号。
9.根据权利要求8所述的解码方法,其中,所述步骤2中对频域参数立体声比特流进行解复用,得到解码所用的所有编码数据和边信息;
10.根据权利要求8所述的解码方法,其中,所述步骤4中的时域分辨率可变的信号估计是根据编码端传送过来的信号类型信息和信号估计信息来重建的。
11.根据权利要求8所述的解码方法,其中,所述步骤9中频时变换和所述步骤5、6中时频变换的频域分辨率是根据编码端传送过来的信号类型信息来决定的。
12.一种高效可配置的频域参数立体声及多声道编码系统,包括和差声道形成模块、预测分析模块、音频编码器模块、信号估计模块、第一、第二和第三时频变换模块、信号类型分析模块、第一、第二和第三高频提取模块、低频提取模块、量化编码模块、增益控制模块、增益量化模块以及第一和第二码流复用模块,其特征在于:
所述和差声道形成模块,用于将输入的左、右声道信号转换成和、差声道信号,输出到预测分析模块;
所述预测分析模块,用于将和差声道形成模块的输出信号进行预测滤波得到和差声道的残差信号;所述线性预测分析模块还产生线谱频率矢量量化索引,并作为边信息输出到第二码流复用模块;
所述音频编码器模块,将和声道信号进行编码形成和声道编码码流输出到第一码流复用模块;
所述第一码流复用模块,将和声道编码码流复用成为音频编码比特流;
所述信号类型分析模块,用于对输入的差声道残差信号进行类型分析,确定该帧信号类型是快变类型还是缓变类型,得到的信号类型信息一路输出到信号估计模块,一路输出到第一、第二和第三时频变换模块,另一路输出到第二码流复用模块;
所述信号估计模块,根据信号类型用输入的和声道残差信号去估计输入的差声道残差信号得到估计的差声道残差信号并输出到第二时频变换模块,并产生信号估计权值的矢量量化索引作为边信息输出到第二码流复用模块;信号估计的时间单元根据信号类型确定,当稳态信号时采用长帧,当瞬态信号时则将长帧分成多个短的子帧进行;
所述第一时频变换模块,根据输入的信号类型信息对信号估计模块输出的和声道残差信号使用长帧或较短的子帧进行时频变换得到频域信号;
所述第二时频变换模块,根据输入的信号类型信息对信号估计模块输出的估计的差声道残差信号使用长帧或较短的子帧进行时频变换得到频域信号;
所述第三时频变换模块,根据输入的信号类型信息对信号估计模块输出的差声道残差信号使用长帧或较短的子帧进行时频变换得到频域信号;
所述第一高频提取模块,从第一时频变换模块输出的频域信号中提取出该频域信号的高频成分;
所述第二高频提取模块,从第二时频变换模块输出的频域信号中提取出该频域信号的高频成分;
所述第三高频提取模块,从第三时频变换模块输出的频域信号中提取出该频域信号的高频成分;
所述低频提取模块,从第三时频变换模块输出的差声道残差频域信号中提取出该频域信号的低频成分,该低频提取带宽的划分允许在同一编解码框架下根据压缩条件动态地调整,进行无缝切换;
所述量化编码模块,对低频提取模块输出的低频成分进行量化编码,并输出给第二码流复用模块;
所述增益控制模块,根据所述第一、第二、第三高频提取模块输出的高频成分进行增益控制得到增益系数,并输出到增益量化模块;该增益系数可以为和差声道的增益系数,也可以转换为其他声道形式的增益系数;
所述增益量化模块,将输入的增益系数进行量化编码并将量化编码信息输出到第二码流复用模块;
所述第二码流复用模块,将量化编码模块和增益量化模块输出的量化编码信息、信号类型分析模块输出的信号类型信息和预测分析模块及信号估计模块输出的边信息进行复用,形成频域参数立体声比特流。
13.如权利要求12所述的编码系统,其特征在于,所述预测分析模块包括:
第一和第二线性预测分析模块,分别用于将和差声道形成模块输出的和、差声道信号进行预测滤波得到和、差声道残差信号;所述第一和第二线性预测分析模块还分别产生和声道线谱频率矢量量化索引与差声道线谱频率矢量量化索引,并作为边信息输出到第二码流复用模块。
14.如权利要求12所述的编码系统,其特征在于,所述预测分析模块包括:
第一和第二线性预测分析模块、减法器;第一和第二线性预测分析模块分别用于将和差声道形成模块输出的和声道信号、右声道信号进行预测滤波得到和声道、右声道残差信号;所述第一和第二线性预测分析模块共用和声道线谱频率,并将和声道线谱频率矢量量化索引作为边信息输出到第二码流复用模块;减法器用于将和声道、右声道残差信号相减得到差声道残差信号。
15.如权利要求12所述的编码系统,其特征在于,所述信号估计模块包括:
信号估计器,信号估计器根据信号类型用输入的和声道残差信号去估计输入的差声道残差信号得到估计的差声道残差信号并输出到第二时频变换模块,并产生信号估计权值的矢量量化索引作为边信息输出到第二码流复用模块。
16.如权利要求15所述的信号估计模块,其特征在于,所述信号估计模块还包括:
线性预测综合模块,接收从所述信号估计器输出的估计的差声道残差信号,并将其恢复成估计的差声道信号,输出到所述时频变换模块中。
17.根据权利要求12所述的编码系统,其特征在于,所述增益控制模块包括:
增益控制器,根据第三时频变换模块输出的原始的差声道残差信号的频域高频成分对第二时频变换模块输出的估计的差声道残差信号的频域高频成分进行增益控制,并输出差声道增益控制系数到增益量化模块。
18.根据权利要求12所述的编码系统,其特征在于,所述增益控制模块包括:
增益控制器、第一和第二加法器、第一和第二减法器。输入的第一和第二高频提取模块输出的频域高频成分通过第一加法器和第一减法器形成估计的左、右声道残差信号的频域高频成分,并将其输出到增益控制器;输入的第一和第三高频提取模块输出的频域高频成分通过第二加法器和第二减法器形成原始的左、右声道残差信号的频域高频成分,并将其输出到增益控制器;增益控制器根据原始的左声道残差信号的频域高频成分对估计的左声道残差信号的频域高频成分进行增益控制,输出左声道的增益控制系数到增益量化模块;根据原始的右声道残差信号的频域高频成分对估计的右声道残差信号的频域高频成分进行增益控制,输出右声道的增益控制系数到增益量化模块。
19.根据权利要求12所述的编码系统,其特征在于,所述增益控制模块的增益控制是在频域对信号的高频成分进行的。
20.一种高效可配置的频域参数立体声及多声道解码系统,包括第一和第二码流解复用模块、音频解码器模块、预测滤波模块、信号估计模块、第一和第二时频变换模块、低频提取模块、第一和第二高频提取模块、增益逆量化解码模块、增益控制模块、低频逆量化解码模块、低高频组合模块、频时变换模块、预测综合模块、左右声道形成模块,其特征在于:
所述第一码流解复用模块,对输入的音频编码比特流进行解复用,输出到音频解码器;
所述音频解码器产生解码后的和声道信号,输出到预测滤波模块;
所述第二码流解复用模块,对频域参数立体声比特流进行解复用,产生的线谱频率矢量量化索引输出到预测滤波模块和预测综合模块,产生的信号估计权值的矢量量化索引输出到信号估计模块,产生的信号类型信息输出到第一和第二时频变换模块、信号估计模块以及频时变换模块,产生的量化编码的增益系数输出到增益逆量化解码模块,产生的量化编码后的频域低频成分输出到低频逆量化解码模块;
所述预测滤波模块,对音频解码器输出的和声道信号进行滤波得到和声道残差信号;
所述信号估计模块,利用作为边信息的信号估计权值的矢量量化索引构成信号估计器,并根据信号类型对预测滤波模块输出的和声道残差信号进行估计得到估计的差声道残差信号,输出到第二时频变换模块;另一路和声道残差信号输出到第一时频变换模块;
所述第一时频变换模块,根据信号类型信息对输入的和声道残差信号进行时频变换得到和声道残差频域信号,并输出到第一高频提取模块和低频提取模块;
所述第二时频变换模块,根据信号类型信息对输入的估计的差声道残差信号进行时频变换得到估计的差声道残差频域信号,并输出到第二高频提取模块;
所述低频提取模块,提取和声道残差频域信号的低频成分,并输出到低高频组合模块;
所述第一高频提取模块,提取和声道残差频域信号的高频成分,并输出到增益控制模块;
所述第二高频提取模块,提取估计的差声道残差频域信号的高频成分,并输出到增益控制模块;
所述低频逆量化解码模块,对输入的量化编码后的差声道残差频域低频成分进行逆量化解码,得到差声道残差频域低频成分,并输出到低高频组合模块;
所述增益逆量化解码模块,利用输入的量化编码的增益系数得到逆量化后的增益系数并输出到增益控制模块;
所述增益控制模块,利用逆量化的增益系数对估计的差声道残差频域高频成分、和声道残差频域高频成分进行增益控制得到增益控制后的频域残差信号高频成分,并输出到低高频组合模块。根据编码端增益系数表达形式的不同,该频域残差信号高频成分可以为和差声道的频域残差高频成分,也可以为其他声道形式的频域残差高频成分;
所述低高频组合模块,将输入的差声道残差频域低频成分、和声道残差频域低频成分和增益控制模块输出的频域残差信号高频成分组合成完整的频域残差信号,输出到频时变换模块。相应的,该频域残差信号可以为和差声道的频域残差信号,也可以为其他声道形式的频域残差信号;
所述频时变换模块,将低高频组合模块输出的频域残差信号进行频时变换,得到时域残差信号,输出到预测综合模块;
所述预测综合模块,利用输入的线谱频率矢量量化索引构成合成滤波器并对输入的时域残差信号进行合成滤波得到时域合成信号,输出到左右声道形成模块;
所述左右声道形成模块,对应于编码端的和差声道形成模块,将预测综合模块输出的时域合成信号经过变换形成左右声道的时域信号。
21.根据权利要求20所述的解码系统,其特征在于,所述信号估计模块包括:
信号估计器,利用作为边信息的信号估计权值的矢量量化索引进行重构,并根据信号类型对预测滤波模块输出的和声道残差信号进行估计得到估计的差声道残差信号,输出到第二时频变换模块;另一路和声道残差信号输出到第一时频变换模块。
22.根据权利要求21所述的解码系统,其特征在于,所述信号估计模块还包括:
线性预测综合模块,接收从所述信号估计器输出的估计的差声道残差信号,并利用作为边信息的线谱频率矢量量化索引构成差声道合成滤波器,将估计的差声道残差信号恢复成估计的差声道信号,最后将其输出到第二时频变换模块。
23.根据权利要求20所述的解码系统,其特征在于,所述的增益控制模块包括:
增益控制器,利用逆量化的差声道增益系数对估计的差声道残差频域高频成分进行增益控制得到增益控制后的差声道残差频域高频成分,并输出到低高频组合模块。
24.根据权利要求20所述的解码系统,其特征在于,所述的增益控制模块包括:
增益控制器、加法器和减法器。输入的估计的差声道残差频域高频成分、和声道残差频域高频成分通过加法器和减法器分别输出估计的左、右声道残差频域高频成分到增益控制器;增益控制器利用逆量化的差声道增益系数对估计的左、右声道残差频域高频成分进行增益控制得到增益控制后的左、右声道残差频域高频成分,并输出到低高频组合模块。
CN2007100990463A 2007-05-10 2007-05-10 一种高效可配置的频域参数立体声及多声道编解码方法与系统 Expired - Fee Related CN101067931B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2007100990463A CN101067931B (zh) 2007-05-10 2007-05-10 一种高效可配置的频域参数立体声及多声道编解码方法与系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2007100990463A CN101067931B (zh) 2007-05-10 2007-05-10 一种高效可配置的频域参数立体声及多声道编解码方法与系统

Publications (2)

Publication Number Publication Date
CN101067931A true CN101067931A (zh) 2007-11-07
CN101067931B CN101067931B (zh) 2011-04-20

Family

ID=38880463

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007100990463A Expired - Fee Related CN101067931B (zh) 2007-05-10 2007-05-10 一种高效可配置的频域参数立体声及多声道编解码方法与系统

Country Status (1)

Country Link
CN (1) CN101067931B (zh)

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102243876A (zh) * 2010-05-12 2011-11-16 华为技术有限公司 预测残差信号的量化编码方法及装置
CN101604524B (zh) * 2008-06-11 2012-01-11 北京天籁传音数字技术有限公司 立体声编码方法及其装置、立体声解码方法及其装置
CN101630509B (zh) * 2008-07-14 2012-04-18 华为技术有限公司 一种编解码方法、装置及系统
CN101925953B (zh) * 2008-01-25 2012-06-20 松下电器产业株式会社 编码装置、解码装置以及其方法
CN102171755B (zh) * 2008-09-30 2012-09-19 杜比国际公司 音频元数据的编码变换
CN102687198A (zh) * 2009-12-07 2012-09-19 杜比实验室特许公司 使用自适应混合变换的多声道音频编码比特流的解码
CN102947880A (zh) * 2010-04-09 2013-02-27 杜比国际公司 基于mdct的复合预测立体声编码
CN103052983A (zh) * 2010-04-13 2013-04-17 弗兰霍菲尔运输应用研究公司 音频或视频编码器、音频或视频解码器及利用可变预测方向处理多信道音频或视频信号的相关方法
CN102007532B (zh) * 2008-04-16 2013-06-19 Lg电子株式会社 用于处理音频信号的方法和装置
CN101996633B (zh) * 2009-08-18 2013-12-11 富士通株式会社 用于在音频信号中嵌入水印的方法和装置
CN107077853A (zh) * 2014-10-10 2017-08-18 杜比国际公司 用于对声场的高阶高保真立体声hoa信号表示进行低位速率压缩的方法和装置
CN107134280A (zh) * 2013-09-12 2017-09-05 杜比国际公司 多声道音频内容的编码
CN104769671B (zh) * 2013-07-22 2017-09-26 弗劳恩霍夫应用研究促进协会 用于使用时域噪声/修补整形对编码音频信号进行编码和解码的设备及方法
CN107408389A (zh) * 2015-03-09 2017-11-28 弗劳恩霍夫应用研究促进协会 用于编码多声道信号的音频编码器及用于解码经编码的音频信号的音频解码器
CN107945811A (zh) * 2017-10-23 2018-04-20 北京大学 一种面向频带扩展的生成式对抗网络训练方法及音频编码、解码方法
CN108269586A (zh) * 2013-04-05 2018-07-10 杜比实验室特许公司 使用高级频谱延拓降低量化噪声的压扩装置和方法
CN110021289A (zh) * 2019-03-28 2019-07-16 腾讯科技(深圳)有限公司 一种声音信号处理方法、装置及存储介质
CN110100279A (zh) * 2016-11-08 2019-08-06 弗劳恩霍夫应用研究促进协会 使用边增益和残差增益对多声道信号进行编码或解码的装置和方法
CN110534120A (zh) * 2019-08-31 2019-12-03 刘秀萍 一种移动网络环境下的环绕声误码修复方法
WO2019227991A1 (zh) * 2018-05-31 2019-12-05 华为技术有限公司 立体声信号的编码方法和装置
WO2020001570A1 (zh) * 2018-06-29 2020-01-02 华为技术有限公司 立体声信号的编码方法、解码方法、编码装置和解码装置
CN110739000A (zh) * 2019-10-14 2020-01-31 武汉大学 一种适应于个性化交互系统的音频对象编码方法
CN112863477A (zh) * 2020-12-31 2021-05-28 出门问问(苏州)信息科技有限公司 一种语音合成方法、装置及存储介质
US12112765B2 (en) 2015-03-09 2024-10-08 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE60331535D1 (de) * 2002-04-10 2010-04-15 Koninkl Philips Electronics Nv Kodierung und Dekodierung für mehrkanalige Signale
CN1233163C (zh) * 2002-08-21 2005-12-21 中山正音数字技术有限公司 多声道数字音频信号的压缩编码和解码设备及其方法
DE102004009954B4 (de) * 2004-03-01 2005-12-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Verarbeiten eines Multikanalsignals
CN100538821C (zh) * 2006-03-23 2009-09-09 北京东方利优科技发展有限公司 快变音频信号的编解码方法

Cited By (109)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101925953B (zh) * 2008-01-25 2012-06-20 松下电器产业株式会社 编码装置、解码装置以及其方法
CN102007532B (zh) * 2008-04-16 2013-06-19 Lg电子株式会社 用于处理音频信号的方法和装置
CN101604524B (zh) * 2008-06-11 2012-01-11 北京天籁传音数字技术有限公司 立体声编码方法及其装置、立体声解码方法及其装置
CN101630509B (zh) * 2008-07-14 2012-04-18 华为技术有限公司 一种编解码方法、装置及系统
CN102171755B (zh) * 2008-09-30 2012-09-19 杜比国际公司 音频元数据的编码变换
CN102682780A (zh) * 2008-09-30 2012-09-19 杜比国际公司 音频元数据的编码变换
US8798776B2 (en) 2008-09-30 2014-08-05 Dolby International Ab Transcoding of audio metadata
CN102682780B (zh) * 2008-09-30 2014-07-16 杜比国际公司 音频元数据的编码变换
CN101996633B (zh) * 2009-08-18 2013-12-11 富士通株式会社 用于在音频信号中嵌入水印的方法和装置
CN102687198A (zh) * 2009-12-07 2012-09-19 杜比实验室特许公司 使用自适应混合变换的多声道音频编码比特流的解码
CN104217724A (zh) * 2009-12-07 2014-12-17 杜比实验室特许公司 使用自适应混合变换的多声道音频编码比特流的解码
US8891776B2 (en) 2009-12-07 2014-11-18 Dolby Laboratories Licensing Corporation Decoding of multichannel audio encoded bit streams using adaptive hybrid transformation
CN104217724B (zh) * 2009-12-07 2017-04-05 杜比实验室特许公司 使用自适应混合变换的多声道音频编码比特流的解码
US9620132B2 (en) 2009-12-07 2017-04-11 Dolby Laboratories Licensing Corporation Decoding of multichannel audio encoded bit streams using adaptive hybrid transformation
CN102687198B (zh) * 2009-12-07 2014-09-24 杜比实验室特许公司 使用自适应混合变换的多声道音频编码比特流的解码
US10283126B2 (en) 2010-04-09 2019-05-07 Dolby International Ab MDCT-based complex prediction stereo coding
US10276174B2 (en) 2010-04-09 2019-04-30 Dolby International Ab MDCT-based complex prediction stereo coding
US11264038B2 (en) 2010-04-09 2022-03-01 Dolby International Ab MDCT-based complex prediction stereo coding
US9111530B2 (en) 2010-04-09 2015-08-18 Dolby International Ab MDCT-based complex prediction stereo coding
US9159326B2 (en) 2010-04-09 2015-10-13 Dolby International Ab MDCT-based complex prediction stereo coding
US11217259B2 (en) 2010-04-09 2022-01-04 Dolby International Ab Audio upmixer operable in prediction or non-prediction mode
US9378745B2 (en) 2010-04-09 2016-06-28 Dolby International Ab MDCT-based complex prediction stereo coding
CN102947880B (zh) * 2010-04-09 2014-10-08 杜比国际公司 解码器系统和解码方法
US10734002B2 (en) 2010-04-09 2020-08-04 Dolby International Ab Audio upmixer operable in prediction or non-prediction mode
CN102947880A (zh) * 2010-04-09 2013-02-27 杜比国际公司 基于mdct的复合预测立体声编码
US10586545B2 (en) 2010-04-09 2020-03-10 Dolby International Ab MDCT-based complex prediction stereo coding
US10553226B2 (en) 2010-04-09 2020-02-04 Dolby International Ab Audio encoder operable in prediction or non-prediction mode
US9761233B2 (en) 2010-04-09 2017-09-12 Dolby International Ab MDCT-based complex prediction stereo coding
US10475459B2 (en) 2010-04-09 2019-11-12 Dolby International Ab Audio upmixer operable in prediction or non-prediction mode
US10475460B2 (en) 2010-04-09 2019-11-12 Dolby International Ab Audio downmixer operable in prediction or non-prediction mode
US9892736B2 (en) 2010-04-09 2018-02-13 Dolby International Ab MDCT-based complex prediction stereo coding
US10360920B2 (en) 2010-04-09 2019-07-23 Dolby International Ab Audio upmixer operable in prediction or non-prediction mode
US11810582B2 (en) 2010-04-09 2023-11-07 Dolby International Ab MDCT-based complex prediction stereo coding
US10347260B2 (en) 2010-04-09 2019-07-09 Dolby International Ab MDCT-based complex prediction stereo coding
US10283127B2 (en) 2010-04-09 2019-05-07 Dolby International Ab MDCT-based complex prediction stereo coding
USRE49511E1 (en) 2010-04-13 2023-04-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio or video encoder, audio or video decoder and related methods for processing multi-channel audio or video signals using a variable prediction direction
USRE49469E1 (en) 2010-04-13 2023-03-21 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio or video encoder, audio or video decoder and related methods for processing multichannel audio or video signals using a variable prediction direction
CN103052983A (zh) * 2010-04-13 2013-04-17 弗兰霍菲尔运输应用研究公司 音频或视频编码器、音频或视频解码器及利用可变预测方向处理多信道音频或视频信号的相关方法
CN103052983B (zh) * 2010-04-13 2015-11-25 弗兰霍菲尔运输应用研究公司 音频或视频编码器、音频或视频解码器及编码和解码方法
USRE49717E1 (en) 2010-04-13 2023-10-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio or video encoder, audio or video decoder and related methods for processing multi-channel audio or video signals using a variable prediction direction
US9398294B2 (en) 2010-04-13 2016-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio or video encoder, audio or video decoder and related methods for processing multi-channel audio or video signals using a variable prediction direction
USRE49492E1 (en) 2010-04-13 2023-04-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio or video encoder, audio or video decoder and related methods for processing multi-channel audio or video signals using a variable prediction direction
USRE49453E1 (en) 2010-04-13 2023-03-07 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio or video encoder, audio or video decoder and related methods for processing multi-channel audio or video signals using a variable prediction direction
USRE49464E1 (en) 2010-04-13 2023-03-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio or video encoder, audio or video decoder and related methods for processing multi-channel audio or video signals using a variable prediction direction
USRE49549E1 (en) 2010-04-13 2023-06-06 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio or video encoder, audio or video decoder and related methods for processing multi-channel audio or video signals using a variable prediction direction
CN102243876A (zh) * 2010-05-12 2011-11-16 华为技术有限公司 预测残差信号的量化编码方法及装置
CN102243876B (zh) * 2010-05-12 2013-08-07 华为技术有限公司 预测残差信号的量化编码方法及装置
CN108269586A (zh) * 2013-04-05 2018-07-10 杜比实验室特许公司 使用高级频谱延拓降低量化噪声的压扩装置和方法
US11423923B2 (en) 2013-04-05 2022-08-23 Dolby Laboratories Licensing Corporation Companding system and method to reduce quantization noise using advanced spectral extension
CN108269585A (zh) * 2013-04-05 2018-07-10 杜比实验室特许公司 使用高级频谱延拓降低量化噪声的压扩装置和方法
US12175994B2 (en) 2013-04-05 2024-12-24 Dolby International Ab Companding system and method to reduce quantization noise using advanced spectral extension
US12142284B2 (en) 2013-07-22 2024-11-12 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework
US10847167B2 (en) 2013-07-22 2020-11-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework
US10515652B2 (en) 2013-07-22 2019-12-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
US11735192B2 (en) 2013-07-22 2023-08-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework
US11769513B2 (en) 2013-07-22 2023-09-26 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for decoding or encoding an audio signal using energy information values for a reconstruction band
US10147430B2 (en) 2013-07-22 2018-12-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection
US10573334B2 (en) 2013-07-22 2020-02-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding or decoding an audio signal with intelligent gap filling in the spectral domain
CN104769671B (zh) * 2013-07-22 2017-09-26 弗劳恩霍夫应用研究促进协会 用于使用时域噪声/修补整形对编码音频信号进行编码和解码的设备及方法
US10593345B2 (en) 2013-07-22 2020-03-17 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus for decoding an encoded audio signal with frequency tile adaption
US11996106B2 (en) 2013-07-22 2024-05-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
US11922956B2 (en) 2013-07-22 2024-03-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding or decoding an audio signal with intelligent gap filling in the spectral domain
US10002621B2 (en) 2013-07-22 2018-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
US10347274B2 (en) 2013-07-22 2019-07-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
US11769512B2 (en) 2013-07-22 2023-09-26 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection
US10332539B2 (en) 2013-07-22 2019-06-25 Fraunhofer-Gesellscheaft zur Foerderung der angewanften Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
US10984805B2 (en) 2013-07-22 2021-04-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection
US10332531B2 (en) 2013-07-22 2019-06-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for decoding or encoding an audio signal using energy information values for a reconstruction band
US10311892B2 (en) 2013-07-22 2019-06-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding or decoding audio signal with intelligent gap filling in the spectral domain
US11250862B2 (en) 2013-07-22 2022-02-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for decoding or encoding an audio signal using energy information values for a reconstruction band
US11049506B2 (en) 2013-07-22 2021-06-29 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
US11289104B2 (en) 2013-07-22 2022-03-29 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding or decoding an audio signal with intelligent gap filling in the spectral domain
US10134404B2 (en) 2013-07-22 2018-11-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework
US11222643B2 (en) 2013-07-22 2022-01-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus for decoding an encoded audio signal with frequency tile adaption
US10276183B2 (en) 2013-07-22 2019-04-30 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for decoding or encoding an audio signal using energy information values for a reconstruction band
US11257505B2 (en) 2013-07-22 2022-02-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework
US11410665B2 (en) 2013-09-12 2022-08-09 Dolby International Ab Methods and apparatus for decoding encoded audio signal(s)
CN107134280A (zh) * 2013-09-12 2017-09-05 杜比国际公司 多声道音频内容的编码
US11776552B2 (en) 2013-09-12 2023-10-03 Dolby International Ab Methods and apparatus for decoding encoded audio signal(s)
CN107134280B (zh) * 2013-09-12 2020-10-23 杜比国际公司 多声道音频内容的编码
CN107077853B (zh) * 2014-10-10 2020-09-08 杜比国际公司 用于对声场的高阶高保真立体声hoa信号表示进行低位速率压缩的方法和装置
CN107077853A (zh) * 2014-10-10 2017-08-18 杜比国际公司 用于对声场的高阶高保真立体声hoa信号表示进行低位速率压缩的方法和装置
CN112951248A (zh) * 2015-03-09 2021-06-11 弗劳恩霍夫应用研究促进协会 用于编码的音频编码器及用于解码的音频解码器
US12112765B2 (en) 2015-03-09 2024-10-08 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
CN107408389A (zh) * 2015-03-09 2017-11-28 弗劳恩霍夫应用研究促进协会 用于编码多声道信号的音频编码器及用于解码经编码的音频信号的音频解码器
CN107408389B (zh) * 2015-03-09 2021-03-02 弗劳恩霍夫应用研究促进协会 用于编码的音频编码器及用于解码的音频解码器
US11741973B2 (en) 2015-03-09 2023-08-29 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
US10777208B2 (en) 2015-03-09 2020-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
US11107483B2 (en) 2015-03-09 2021-08-31 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
CN112951248B (zh) * 2015-03-09 2024-05-07 弗劳恩霍夫应用研究促进协会 用于编码的音频编码器及用于解码的音频解码器
US11881225B2 (en) 2015-03-09 2024-01-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
US11238874B2 (en) 2015-03-09 2022-02-01 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
CN110100279B (zh) * 2016-11-08 2024-03-08 弗劳恩霍夫应用研究促进协会 对多声道信号进行编码或解码的装置和方法
CN110100279A (zh) * 2016-11-08 2019-08-06 弗劳恩霍夫应用研究促进协会 使用边增益和残差增益对多声道信号进行编码或解码的装置和方法
CN107945811B (zh) * 2017-10-23 2021-06-01 北京大学 一种面向频带扩展的生成式对抗网络训练方法及音频编码、解码方法
CN107945811A (zh) * 2017-10-23 2018-04-20 北京大学 一种面向频带扩展的生成式对抗网络训练方法及音频编码、解码方法
US11462224B2 (en) 2018-05-31 2022-10-04 Huawei Technologies Co., Ltd. Stereo signal encoding method and apparatus using a residual signal encoding parameter
US11978463B2 (en) 2018-05-31 2024-05-07 Huawei Technologies Co., Ltd. Stereo signal encoding method and apparatus using a residual signal encoding parameter
WO2019227991A1 (zh) * 2018-05-31 2019-12-05 华为技术有限公司 立体声信号的编码方法和装置
US11790923B2 (en) 2018-06-29 2023-10-17 Huawei Technologies Co., Ltd. Stereo signal encoding method and apparatus, and stereo signal decoding method and apparatus
WO2020001570A1 (zh) * 2018-06-29 2020-01-02 华为技术有限公司 立体声信号的编码方法、解码方法、编码装置和解码装置
US11462223B2 (en) 2018-06-29 2022-10-04 Huawei Technologies Co., Ltd. Stereo signal encoding method and apparatus, and stereo signal decoding method and apparatus
US12148436B2 (en) 2018-06-29 2024-11-19 Huawei Technologies Co., Ltd. Stereo signal encoding method and apparatus, and stereo signal decoding method and apparatus
CN110021289A (zh) * 2019-03-28 2019-07-16 腾讯科技(深圳)有限公司 一种声音信号处理方法、装置及存储介质
CN110534120A (zh) * 2019-08-31 2019-12-03 刘秀萍 一种移动网络环境下的环绕声误码修复方法
CN110739000B (zh) * 2019-10-14 2022-02-01 武汉大学 一种适应于个性化交互系统的音频对象编码方法
CN110739000A (zh) * 2019-10-14 2020-01-31 武汉大学 一种适应于个性化交互系统的音频对象编码方法
CN112863477B (zh) * 2020-12-31 2023-06-27 出门问问(苏州)信息科技有限公司 一种语音合成方法、装置及存储介质
CN112863477A (zh) * 2020-12-31 2021-05-28 出门问问(苏州)信息科技有限公司 一种语音合成方法、装置及存储介质

Also Published As

Publication number Publication date
CN101067931B (zh) 2011-04-20

Similar Documents

Publication Publication Date Title
CN101067931A (zh) 一种高效可配置的频域参数立体声及多声道编解码方法与系统
CN1154976C (zh) 再现语音信号的方法和装置以及传输该信号的方法
CN100346392C (zh) 编码设备、解码设备、编码方法和解码方法
CN1156822C (zh) 音频信号编码方法、解码方法,及音频信号编码装置、解码装置
CN1229775C (zh) 宽带语音和音频信号解码器中的增益平滑
CN1131507C (zh) 音频信号编码装置、解码装置及音频信号编码·解码装置
CN1324558C (zh) 编码设备,解码设备以及音频数据分配系统
CN1200403C (zh) 线性预测编码参数的矢量量化装置
CN1160703C (zh) 语音编码方法和装置以及声音信号编码方法和装置
CN1242379C (zh) 音频编码装置
CN1163870C (zh) 声音编码装置和方法,声音译码装置,以及声音译码方法
CN1245706C (zh) 多模式语音编码器
CN1205603C (zh) 在用于宽带信号编码的代数码本中索引脉冲位置和符号的方法和设备
CN100338648C (zh) 在基于线性预测的语音编码解码器中有效帧删除隐藏的方法和器件
CN101046964A (zh) 基于重叠变换压缩编码的错误隐藏帧重建方法
CN101048649A (zh) 可扩展解码装置及可扩展编码装置
CN1639984A (zh) 数字信号编码方法、解码方法、编码设备、解码设备、数字信号编码程序和解码程序
CN1188957A (zh) 矢量量化方法和语音编码方法及其装置
CN1748443A (zh) 多声道音频扩展支持
CN1208288A (zh) 用于视听设备的信号处理及声象定位装置和方法
CN1926607A (zh) 多信道音频编码
CN1331826A (zh) 可变速率语音编码
CN1871501A (zh) 频谱编码装置、频谱解码装置、音响信号发送装置、音响信号接收装置及其使用方法
CN1331825A (zh) 周期性语音编码法
CN1898723A (zh) 信号解码装置以及信号解码方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: KAIWEI SEMICONDUCTOR TECHNOLOGY (SHANGHAI) CO., LT

Free format text: FORMER OWNER: XINCHENG (BEIJING) TECHNOLOGY CO., LTD.

Effective date: 20110701

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 100083 21/F, LIANGZIXIN TOWER, NO. 27, ZHICHUN ROAD, HAIDIAN DISTRICT, BEIJING TO: 200120 TOWER G, 20/F, NO. 360, SOUTH ROAD, PUDONG NEW DISTRICT, SHANGHAI

TR01 Transfer of patent right

Effective date of registration: 20110701

Address after: 200120 G block, 20 floor, No. 360 South Pudong New Area Road, Shanghai

Patentee after: Semiconductor technology (Shanghai) Co., Ltd.

Address before: 100083, Beijing, Zhichun Road, Haidian District 27, quantum core 21 layer

Patentee before: Xincheng (Beijing) Sci. & Tech. Co., Ltd.

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110420

Termination date: 20190510

CF01 Termination of patent right due to non-payment of annual fee