CN101436407B - 音频编解码方法 - Google Patents
音频编解码方法 Download PDFInfo
- Publication number
- CN101436407B CN101436407B CN200810232760XA CN200810232760A CN101436407B CN 101436407 B CN101436407 B CN 101436407B CN 200810232760X A CN200810232760X A CN 200810232760XA CN 200810232760 A CN200810232760 A CN 200810232760A CN 101436407 B CN101436407 B CN 101436407B
- Authority
- CN
- China
- Prior art keywords
- frequency
- residual signal
- signal
- low
- residual
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明公开了一种音频编解码方法,主要解决目前音频编码方法压缩比低、重构音频质量差的问题。采用时频变换与频域滤波方法或时域滤波与时频变换方法,分析音频信号,得到频域残差信号;将频域残差信号分割成低频和高频残差信号,分别对低频残差信号进行直接编码和对高频残差进行参数编码;然后用解码低频残差信号和解码高频残差重构高频残差信号;再将解码低频残差信号与重构高频残差信号重组得到重构频域残差信号;最后采用频域逆滤波与时频反变换的方法或时频反变换与时域逆滤波的方法,得到重构音频信号。本发明消除了频域残差信号中的多余度,提高了音频编码的压缩比、信道利用率和音频传输质量,用于多媒体通信和消费类电子设备。
Description
技术领域
本发明涉及音频编解码技术领域,具体涉及一种基于高频残差重构的信号重构方法,用于多媒体通信和消费类电子领域。
背景技术
在多媒体通信领域,包括语音在内的音频、尤其是宽带音频已逐渐成为主要通信业务之一。但是音频信号频带较宽、编码数据量较大,这给音频信号的实时传输和有效存储带来很大的困难。虽然MP3、AAC、EAAC和EAAC+等音频编码算法已经能够较好地音频信号进行压缩编码,满足了一定应用的要求,但还无法较好地胜任目前正在发展的移动多媒体通信和各种移动平台等业务。所以有必要研究效率更高和质量更好的音频编码算法。近年来,在音频压缩编码的研究领域,音频信号高频成分的处理、压缩和重构成为相关研究的关键技术之一,如何利用低频频段的信号来重建高频信号是重要的研究内容。
现有技术利用频域低频进行频域高频重建的方法主要有两种,简单介绍如下:
现有技术1
把音频或语音的低频信号通过一个数字滤波组处理,得到一组低频子带信号;再把该组低频子带作为一个整块信号来进行高频信号的复制。整个高频频段信号的复制方法是将高频信号按照频率由低到高划分成若干频段,每段与上述整块低频信号的带宽大致相同;然后将整块低频子带组连续复制到高频频段的每一段。这样,整块低频子带组会被周期性地在高频频段使用若干次,直到整个需要恢复的高频频段都被复制完成为止。具体方式有两种:一是把整块低频子带组平移到对应的高频频段,二是把整块低频子带组先折叠,即颠倒了子带排列顺序,再把整块低频子带组平移到对应的高频频段;在复制过程中,这两种方式可能会交叉使用。这样,整块低频子带组会被周期性地使用,直到整个需要恢复的高频频段都被复制完成为止。
现有技术2
把低频信号通过低通滤波器组处理,得到一组低频子带信号。这里不再像现有技术1那样,把选取的低频子带组作为一个整体,整段地连续复制需要恢复的高频部分,而是利用低频子带组中的子带,分别对应地恢复一些离散分布的高频子带。如果在高频部分有非常丰富的谐波分量,则其谐波分量的频率可能就是其相应基频的整数倍。在此思想的指导下,现有技术2提出,如果高频部分某些子带的子带序号是2、3、4、5等自然数的整数倍,即某些高频子带和低频子带之间存在倍数的对应关系,这些子带很可能存在丰富的谐波成分,需要重点恢复。这样,用连续的低频子带组恢复离散分布的高频子带的过程就完成了。最后,对于该方法遗漏的高频子带,还要选取波形与之相近的低频子带,对遗漏的高频子带进行恢复,从而完成所有高频子带的复制。
上述两种现有技术中无论按现有技术1把低频子带作为一个整块进行周期性地平移复制或折叠复制,还是按现有技术2进行倍频复制,都是机械性地恢复谐波,没有考虑音频语音信号的多样性和变化性,另外复制时候是按照子带序号依次提取复制,由于低频子带和高频子带的波形本来就不同,所以被复制的高频子带和原始的高频子带相比,将存在较大波形差别或峰值差异,因此重建的高频信号准确性不是太高,影响重构音频信号的质量。
发明内容
本发明的目的之一是提供一种基于频域滤波和高频残差重构的音频编解码方法,目的之二是提供一种基于时域滤波和高频残差重构的音频编解码方法,以避免上述已有技术的不足,提高重建高频残差信号的准确性和音频编解码的压缩比,保证重构音频信号质量。
本发明的技术方案是这样实现的:
技术方案一:
基于频域滤波和高频残差重构的音频编解码方法,包括如下步骤:
1)在编码端,音频原始时域信号经过时频变换处理,得到原始频域信号;
2)原始频域信号经过频域感知滤波处理,得到原始频域残差信号;
3)原始频域残差信号经过频域残差分析和编码处理,得到低频残差信号编码和高频残差参数编码,并输出到传输信道或存储介质。
4)在解码端,接收来自输出到传输信道或存储介质的低频残差信号编码和高频残差参数编码,并对其进行频域残差解码和重构处理,得到重构频域残差信号;
5)重构频域残差信号经过频域感知逆滤波处理,得到重构频域信号;
6)对重构频域信号进行时频反变换处理,得到音频重构时域信号。
技术方案二:
基于时域滤波和高频残差重构的音频编解码方法,包括如下步骤:
T1)在编码端,音频原始时域信号经过时域感知滤波处理,得到原始时域残差信号;
T2)原始时域残差信号经过时频变换处理,得到原始频域残差信号;
T3)原始频域残差信号经过频域残差分析和编码处理,得到低频残差信号编码和高频残差参数编码,并输出到传输信道或存储介质。
T4)在解码端,接收来自输出到传输信道或存储介质的低频残差信号编码和高频残差参数编码,并对其进行频域残差解码和重构处理,得到重构频域残差信号;
T5)对重构频域残差信号进行时频逆变换处理,得到重构时域残差信号;
T6)将重构时域残差信号进行时域逆滤波处理,得到音频重构时域信号。
上述两种方案的音频编解码方法,其中所述的频域残差分析和编码处理,包括如下步骤:
(A1)按照等带宽频带、或临界频带、或频程频带频的带划分方法,先对原始频域残差信号进行频带划分,然后根据音频编码器设定的编码速率选择一个频带划分端点,将原始频域残差信号分割成原始低频残差信号和原始高频残差信号两部分,使这两部分各具有若干个频带;
(A2)对原始低频残差信号进行编码,得到低频残差信号编码输出;再对低频残差信号编码在编码端进行本地解码,得到解码低频残差信号;
(A3)根据解码低频残差信号与原始高频残差信号的相似性或相关性,对高频残差参数进行分析,即选择一个频带匹配策略对解码低频残差信号和原始高频残差信号进行频带匹配,并计算最佳匹配的高频残差参数,得到包括频带划分方法、最佳匹配频带频率位置、能量匹配因子、声道耦合参数和帧间扩展参数在内的原始高频残差参数;
(A4)对原始高频残差参数进行编码,得到高频残差参数编码输出。
上述两种方案的音频编解码方法,其中所述的频域残差解码和重构处理,包括如下步骤:
(C1)对接收到的低频残差信号编码进行解码,得到解码低频残差信号;
(C2)对接收到的高频残差参数编码进行解码,得到解码高频残差参数;
(C3)利用解码低频残差信号、解码高频残差参数中的最佳匹配频带频率位置和能量匹配因子,重构高频残差信号频带RH(q0,l);
(C4)利用解码高频残差参数中的频带划分方法、声道耦合参数和帧间扩展参数,将得到的重构高频残差信号频带进行组合,得到重构高频残差信号;
(C5)利用解码高频残差参数中的频域残差高低频段分界频率,将解码低频残差信号与重构高频残差信号进行组合,得到重构频域残差信号。
上述两种方案的音频编解码方法,其中所述的频带匹配策略包括:高频残差信号频带在低频残差信号区域进行匹配、高频残差信号频带在低频残差信号区域及其扩展区域进行匹配、通过声道耦合进行高频残差信号匹配和通过帧间扩展进行高频残差信号匹配。
本发明由于充分考虑了频域残差信号频谱的白化特性和高频残差信号和低频残差信号之间的相关性和相似性,通过选择高频残差信号和低频残差信号的匹配策略,估算高频残差信号的重构参数,并用高频残差参数准确的重构高频残差信号,并以此为基础,实现音频信号的高效编码和解码,因而提高了音频信源编码的压缩比或编码效率,节省了传输音频信号所需传输带宽和节省存储音频信号所需存储容量,同时提高了音频压缩编码质量。
附图说明
图1基于频域滤波的音频编解码方法流程图;
图2基于时域滤波的音频编解码方法流程图;
图3频域残差信号分析和编码方法流程图;
图4频域残差信号解码和重构方法流程图;
图5高低频频域残差信号及高频残差信号重构示意图;
图6高频残差信号频带在低频残差信号区域进行匹配策略示意图;
图7高频残差信号频带在低频残差信号区域及其扩展区域进行匹配策略示意图;
图8通过声道耦合进行高频残差信号匹配策略示意图;
图9通过帧间扩展进行高频残差信号匹配策略示意图。
具体实施方式
实施例一
本实施例提供一种音频编解码的方法,该方法是基于频域滤波和高频残差重构的音频编码方法。高频残差信号是频域残差信号的高频部分,高频残差信号的分析和重构是为了有效的压缩频域残差信号的数据量,提高音频信号编码和传输效率。高频残差信号的分析和重构是按照一定的规则将频域残差信号分成低频残差信号和高频残差信号两部分,利用高频残差信号与低频残差信号的相关性或相似性,提取高频残差重构所需要的参数,丢弃高频残差信号,然后用高频残差参数来重构高频残差信号,从而重构整个频域残差信号。
参照图1,本实施例的音频编解码步骤如下:
步骤101,在编码端,音频原始时域信号经过时频变换处理,得到原始频域信号。
音频原始时域信号是包括语音信号、音频信号或任何人耳可以听到的各种声音信号的混合声音;音频信号的频率范围主要在0Hz到20kHz之间,音频信号的采样频率为96kHz、48kHz、44.1kHz、32kHz、22.05kHz、16kHz、11.025kHz和8kH;音频信号的编码通常是以音频帧为单位,常用音频帧的大小按照实际应用一般在50毫秒之内。时域变换采用但不限于修正离散余弦变换、修正重叠变换和快速傅里叶变换方法进行变换。
步骤102,原始频域信号经过频域感知滤波处理,得到原始频域残差信号。
频域感知滤波器是反映人耳听觉特性的频域滤波器,它对来步骤101的频域信号进行频域滤波,得到在感知意义上白化了的频域残差信号,如果用HM(f)表示频域感知滤波器的传输函数,用M(f)表示由感知参数表征的感知曲线,则HM(f)可以表示为 其中f表示频率,单位为Hz。
步骤103,频域残差分析和编码。
参见3所示,频域残差分析和编码的具体步骤包括:
步骤301,频带划分和高低频残差信号分割,即按照等带宽频带、或临界频带、或频程频带等方法,先对原始频域残差信号进行频带划分,然后根据音频编码器的编码速率选择其中一个划分频带的端点将原始频域残差信号分割成原始低频残差信号和原始高频残差信号两部分,使这两部分各具有若干个频带。
如图5所示,完整的频域残差信号用R表示,为了有效地对频域残差信号进行分析、编码和重构,将频域残差信号按照等带宽频带、或临界频带、或频程频带等方法进行频带划分,把具有一定属性,如听觉特性的相邻频率分量划分到相同的频带中去。设fCi、fLi和fHi分别为第i个频带的中心频率、低端边界频率和高端边界频率,bi为频带带宽,选择某个频带的低端边界频率fLi或高端边界频率fHi为分界频率fD,将频域残差信号在频域内分割成低频残差信号RL和高频残差信号RH两部分,在0到fD之间就具有连续NL个低频残差信号频带,在fD与fZ之间就具有连续NH个高频残差信号频带,高于频率fZ的高频残差信号频带中的信号为零。设f表示频率,单位为Hz、fS表示采样频率,归一化频率用 表示;如果用fB表示时域音频信号的带宽,则
步骤302,对原始低频残差信号进行编码,得到低频残差信号编码输出。原始低频残差信号的编码,采用各种有失真的编码方法,如线性或非线性标量量化编码、矢量量化编码,或者同时采用各种无失真的编码方法,如Huffman编码和算术编码;
步骤303,对低频残差信号编码在编码端进行本地解码,得到解码低频残差信号和低频残差信号的编码;
步骤304,根据解码低频残差信号和原始高频残差信号的相似性或相关性,对高频残差参数进行分析,即选择一个频带匹配策略对解码低频残差信号与原始高频残差信号进行频带匹配,并计算最佳匹配的高频残差参数,得到原始高频残差参数。
如图5所示,频带匹配就是在低频残差信号内寻找与高频残差频带特性最接近的频带,目的是在解码端高质量地重构高频残差信号。频带匹配采用不同的频带匹配策略,所谓频带匹配策略是指如何在低频残差信号RL中选择一段频域残差信号,并用它来重构高频残差信号RH中具有相同频带宽度的高频残差信号的方法。在图5中,因为频率fZ以上的残差信号已经归零,所以没有必要再对这部分残差进行重构。
所述频带匹配策略包括但不限于以下几种:
(P1)高频残差信号频带在低频残差信号区域进行匹配
如图6所示,将处于fD与fZ之间的NH个高频残差频带分别独立地在处于0到fD之间的低频残差信号区域RL进行匹配,寻找误差最小或相关性最大的最佳匹配频带。这时,频带划分方法、最佳匹配频带频率位置和能量匹配因子等即为高频残差重构参数。
(P2)高频残差信号频带在低频残差信号区域及其扩展区域进行匹配
如图7所示,采用上述频带匹配策略(P1),先将处于fD与fZ之间的频率最低的高频残差信号频带RH1在处于0到fD之间的低频残差信号区域RL进行匹配,寻找误差最小或相关性最大的最佳匹配频带,并用此最佳匹配频带来重构频率最低的高频残差信号频带RH1;再将这个重构的频率最低的高频残差信号频带RH1加入原来的低频残差信号RL,形成一个新组成的低频残差信号RL1=RL+RH1;然后,以这个新组成的低频残差信号为基础,采用上述频带匹配策略(P1),继续重构更高频率的高频残差信号频带;依此类推,直至完成全部fD到fZ之间的所有高频残差信号频带的匹配和重构。这时,频带划分方法、最佳匹配频带频率位置、能量匹配因子和低频残差区域扩展参数即为高频残差重构参数。
(P3)通过声道耦合进行高频残差信号匹配
如图8所示,设音频信源是具有C(C≥2)个主声道的多声道音频信源,比如5.1声道音频就有5个主声道和一个低重音效声道,这时存在C个声道的低频残差信号。因为各声道的音频信号具有较大相关性,所以各声道的频域残差信号也具有较大相关性,因此任何一个声道不仅能够利用其所在声道的低频残差信号进行高频残差信号重构,而且还能够利用其它声道的低频残差信号进行高频残差信号重构;这样可以得到更多的匹配选择,提高高频残差信号重构质量。以第1声道为例给以说明,首先可以采用上述频带匹配策略(P1)和(P2),利用所在声道的处在0到fD之间的低频残差信号RL匹配和重构处于fD与fZ之间的高频残差信号。除此之外,还可以利用其它声道的处在0到fD之间的低频残差信号RL匹配和重构第1声道内处于fD与fZ之间的高频残差信号。与第1声道一样,所有C个声道的频域残差信号多可以采用相同的方法进行处理。
(P4)通过帧间扩展进行高频残差信号匹配
上述频带匹配策略(P1)、(P2)和(P3)所描述的高频残差信号的匹配策略是利用当前帧的低频残差信号重构当前帧的高频残差信号。因为相邻帧音频信号之间通常存在很大的相关性,所以相邻帧的残差也具有较大的相关性。因此,当前音频帧的高频残差信号,不仅可以用当前帧的低频残差信号进行重构,也可以用当前帧之前若干帧的包括重构低频残差信号和重构高频残差信号的重构残差信号进行重构。如图9所示,采用上述频带匹配策略(P1)、(P2)和(P3)的方法利用第j帧的低频残差信号对第j帧的高频残差信号进行重构,或采用上述频带匹配策略(P1)、(P2)和(P3)的方法利用第j-1帧的低频残差信号对第j帧的高频残差信号进行重构,还可以采用上述频带匹配策略(P1)、(P2)和(P3)的方法利用第j-1帧的重构高频残差信号对第j帧的高频残差信号进行重构。此外,这些方法还可以扩展到第j-2帧、第j-3帧去。
上述各种频带匹配策略都需要在低频残差信号和高频残差信号之间寻找最佳匹配频带,这里所说的最佳,可以用误差或失真最小来表达,也可以用相关性最大来表示。具体计算最佳匹配的高频残差参数的步骤包括:
(B1)计算归一化低频残差频带信号和归一化高频残差频带信号设进行匹配的高频残差信号和低频残差信号的频带宽度为L个频点、RL(p,l),l=0,1,…L-1为低频残差信号频带、RH(q,l),l=0,1,…L-1为高频残差信号频带,其中p和q分别表示RL(p,l)和RH(q,l)所在频带的起始位置,p∈[0,fD]、q∈[fD,fZ],计算和其中,表示RL(p,l),l=0,1,…L-1被其自身绝对值的最大值RLmax(p)进行归一化得到的归一化低频残差信号、表示RH(p,l),l=0,1,…L-1被其自身绝对值的最大值RHmax(q)进行归一化得到的归一化高频残差信号。
(B2)计算匹配失真测度d(p,q)或匹配相关函数r(p,q),如果用失真最小来进行匹配分析,则匹配的失真测度表示为:
(B3)确定最佳频带匹配位置p0和q0,该最佳匹配就是失真测度d(p,q)的最小值或相关函数r(p,q)的最大值所对应的p和q的最佳值p0和q0,它们确定了高频残差与低频残差所匹配的频带。
(B4)利用如下公式计算最佳能量匹配因子:
这样,步骤304所得到的频带划分结果、最佳匹配频带频率位置、频域残差高低频段分界频率fD、能量匹配因子、声道耦合参数和帧间扩展参数,就是原始高频残差参数。
步骤305,高频残差参数编码。
对步骤304产生的原始高频残差参数进行编码,得到高频残差信号编码输出。原始高频残差参数的编码,采用各种有失真的编码方法,如线性或非线性标量量化编码、矢量量化编码,或者同时采用各种无失真的编码方法,如Huffman编码和算术编码。
步骤104,频域残差解码和重构。
在解码端,接收到的低频残差信号编码和高频残差参数编码经过频域残差解码和重构处理,得到重构频域残差信号,如图4所示。具体步骤包括:
步骤401,对接收到的低频残差信号编码进行解码,得到解码低频残差信号。
步骤402,对接收到的高频残差参数编码进行解码,得到解码高频残差参数,该解码高频残差参数包括频带划分结果、频域残差高低频段分界频率fD、最佳匹配频带频率位置、能量匹配因子、声道耦合参数和帧间扩展参数。
步骤403,高频残差信号重构。
根据解码高频残差参数,利用解码低频残差信号复制和重构高频残差信号,具体步骤包括:
(D1)根据步骤401和402得到的解码低频残差信号、最佳匹配频带频率位置和能量匹配因子,用下式进行高频残差信号复制和能量匹配:
RH(q0,l)=GR(p0,q0)·RL(p0,l),l=0,1,…L-1(6)
得到重构高频残差信号频带RH(q0,l);
(D2)根据步骤401和402得到的频带划分结果、声道耦合参数和帧间扩展参数,将所有重构高频残差信号频带进行组合,得到重构高频残差信号。
步骤404,根据解码得到的频域残差高低频段分界频率fD,将解码低频残差信号与重构高频残差信号进行组合,得到重构频域残差信号。
步骤105,重构频域残差信号经过频域逆滤波处理,得到重构频域信号;如果用HR(f)表示频域感知逆滤波器,则HR(f)表示为 其中f表示频率,单位为Hz。
步骤106,对重构频域信号进行时频反变换处理,得到音频重构时域信号。与时频变换相对应,时域反变换采用反向修正离散余弦变换、反向修正重叠反变换或反向快速傅里叶变换方法。
实施例二
本实施例提供一种基于时域滤波和高频残差重构的音频编解码方法。
参见图2,该方法步骤如下:
步骤201,在编码端,音频原始时域信号经过时域感知滤波处理,得到原始时域残差信号。其中,时域感知滤波器是反映人耳听觉特性的时域滤波器,它对音频原始时域信号进行时域滤波,得到在感知意义上白化了的时域残差信号;时域感知滤波器的传输函数用HM(z)表示,时域感知滤波器采用但不限于线性预测滤波器。
步骤202,原始时域残差信号经过时频变换处理,得到原始频域残差信号,其中,时域变换采用但不限于修正离散余弦变换、修正重叠变换和快速傅里叶变换方法进行变换。
步骤203,频域残差分析和编码。
参见3所示,频域残差分析和编码的具体步骤包括:
步骤301,频带划分和高低频残差信号分割,即按照等带宽频带、或临界频带、或频程频带等方法,先对原始频域残差信号进行频带划分,然后根据音频编码器的编码速率选择其中一个划分频带的端点将原始频域残差信号分割成原始低频残差信号和原始高频残差信号两部分,使这两部分各具有若干个频带。
如图5所示,完整的频域残差信号用R表示,为了有效地对频域残差信号进行分析、编码和重构,将频域残差信号按照等带宽频带、或临界频带、或频程频带等方法进行频带划分,把具有一定属性,如听觉特性的相邻频率分量划分到相同的频带中去。设fCi、fLi和fHi分别为第i个频带的中心频率、低端边界频率和高端边界频率,bi为频带带宽,选择某个频带的低端边界频率fLi或高端边界频率fHi为分界频率fD,将频域残差信号在频域内分割成低频残差信号RL和高频残差信号RH两部分,在0到fD之间就具有连续NL个低频残差信号频带,在fD与fZ之间就具有连续NH个高频残差信号频带,高于频率fZ的高频残差信号频带中的信号为零。设f表示频率,单位为Hz、fS表示采样频率,归一化频率用 表示;如果用fB表示时域音频信号的带宽,则
步骤302,对原始低频残差信号进行编码,得到低频残差信号编码输出。原始低频残差信号的编码,采用各种有失真的编码方法,如线性或非线性标量量化编码、矢量量化编码,或者同时采用各种无失真的编码方法,如Huffman编码和算术编码;
步骤303,对低频残差信号编码在编码端进行本地解码,得到解码低频残差信号和低频残差信号的编码;
步骤304,根据解码低频残差信号和原始高频残差信号的相似性或相关性,对高频残差参数进行分析,即选择一个频带匹配策略对解码低频残差信号与原始高频残差信号进行频带匹配,并计算最佳匹配的高频残差参数,得到原始高频残差参数。
如图5所示,频带匹配就是在低频残差信号内寻找与高频残差频带特性最接近的频带,目的是在解码端高质量地重构高频残差信号。频带匹配采用不同的频带匹配策略,所谓频带匹配策略是指如何在低频残差信号RL中选择一段频域残差信号,并用它来重构高频残差信号RH中具有相同频带宽度的高频残差信号的方法。在图5中,因为频率fZ以上的残差信号已经归零,所以没有必要再对这部分残差进行重构。
所述频带匹配策略包括但不限于以下几种:
(P1)高频残差信号频带在低频残差信号区域进行匹配
如图6所示,将处于fD与fZ之间的NH个高频残差频带分别独立地在处于0到fD之间的低频残差信号区域RL进行匹配,寻找误差最小或相关性最大的最佳匹配频带。这时,频带划分方法、最佳匹配频带频率位置和能量匹配因子等即为高频残差重构参数。
(P2)高频残差信号频带在低频残差信号区域及其扩展区域进行匹配
如图7所示,采用上述频带匹配策略(P1),先将处于fD与fZ之间的频率最低的高频残差信号频带RH1在处于0到fD之间的低频残差信号区域RL进行匹配,寻找误差最小或相关性最大的最佳匹配频带,并用此最佳匹配频带来重构频率最低的高频残差信号频带RH1;再将这个重构的频率最低的高频残差信号频带RH1加入原来的低频残差信号RL,形成一个新组成的低频残差信号RL1=RL+RH1;然后,以这个新组成的低频残差信号为基础,采用上述频带匹配策略(P1),继续重构更高频率的高频残差信号频带;依此类推,直至完成全部fD到fZ之间的所有高频残差信号频带的匹配和重构。这时,频带划分方法、最佳匹配频带频率位置、能量匹配因子和低频残差区域扩展参数即为高频残差重构参数。
(P3)通过声道耦合进行高频残差信号匹配
如图8所示,设音频信源是具有C(C≥2)个主声道的多声道音频信源,比如5.1声道音频就有5个主声道和一个低重音效声道,这时存在C个声道的低频残差信号。因为各声道的音频信号具有较大相关性,所以各声道的频域残差信号也具有较大相关性,因此任何一个声道不仅能够利用其所在声道的低频残差信号进行高频残差信号重构,而且还能够利用其它声道的低频残差信号进行高频残差信号重构;这样可以得到更多的匹配选择,提高高频残差信号重构质量。以第1声道为例给以说明,首先可以采用上述频带匹配策略(P1)和(P2),利用所在声道的处在0到fD之间的低频残差信号RL匹配和重构处于fD与fZ之间的高频残差信号。除此之外,还可以利用其它声道的处在0到fD之间的低频残差信号RL匹配和重构第1声道内处于fD与fZ之间的高频残差信号。与第1声道一样,所有C个声道的频域残差信号多可以采用相同的方法进行处理。
(P4)通过帧间扩展进行高频残差信号匹配
上述频带匹配策略(P1)、(P2)和(P3)所描述的高频残差信号的匹配策略是利用当前帧的低频残差信号重构当前帧的高频残差信号。因为相邻帧音频信号之间通常存在很大的相关性,所以相邻帧的残差也具有较大的相关性。因此,当前音频帧的高频残差信号,不仅可以用当前帧的低频残差信号进行重构,也可以用当前帧之前若干帧的包括重构低频残差信号和重构高频残差信号的重构残差信号进行重构。如图9所示,采用上述频带匹配策略(P1)、(P2)和(P3)的方法利用第j帧的低频残差信号对第j帧的高频残差信号进行重构,或采用上述频带匹配策略(P1)、(P2)和(P3)的方法利用第j-1帧的低频残差信号对第j帧的高频残差信号进行重构,还可以采用上述频带匹配策略(P1)、(P2)和(P3)的方法利用第j-1帧的重构高频残差信号对第j帧的高频残差信号进行重构。此外,这些方法还可以扩展到第j-2帧、第j-3帧去。
上述各种频带匹配策略都需要在低频残差信号和高频残差信号之间寻找最佳匹配频带,这里所说的最佳,可以用误差或失真最小来表达,也可以用相关性最大来表示。具体计算最佳匹配的高频残差参数的步骤包括:
(B1)计算归一化低频残差频带信号和归一化高频残差频带信号设进行匹配的高频残差信号和低频残差信号的频带宽度为L个频点、RL(p,l),l=0,1,…L-1为低频残差信号频带、RH(q,l),l=0,1,…L-1为高频残差信号频带,其中p和q分别表示RL(p,l)和RH(q,l)所在频带的起始位置,p∈[0,fD]、q∈[fD,fZ],计算和其中,表示RL(p,l),l=0,1,…L-1被其自身绝对值的最大值RLmax(p)进行归一化得到的归一化低频残差信号、表示RH(p,l),l=0,1,…L-1被其自身绝对值的最大值RHmax(q)进行归一化得到的归一化高频残差信号。
(B2)计算匹配失真测度d(p,q)或匹配相关函数r(p,q),如果用失真最小来进行匹配分析,则匹配的失真测度表示为:
(B3)确定最佳频带匹配位置p0和q0,该最佳匹配就是失真测度d(p,q)的最小值或相关函数r(p,q)的最大值所对应的p和q的最佳值p0和q0,它们确定了高频残差与低频残差所匹配的频带。
(B4)利用如下公式计算最佳能量匹配因子:
这样,步骤304所得到的频带划分结果、最佳匹配频带频率位置、频域残差高低频段分界频率fD、能量匹配因子、声道耦合参数和帧间扩展参数,就是原始高频残差参数。
步骤305,高频残差参数编码。
对步骤304产生的原始高频残差参数进行编码,得到高频残差信号编码输出。原始高频残差参数的编码,采用各种有失真的编码方法,如线性或非线性标量量化编码、矢量量化编码,或者同时采用各种无失真的编码方法,如Huffman编码和算术编码。
步骤204,频域残差解码和重构。
在解码端,接收到的低频残差信号编码和高频残差参数编码经过频域残差解码和重构处理,得到重构频域残差信号,如图4所示。具体步骤包括:
步骤401,对接收到的低频残差信号编码进行解码,得到解码低频残差信号。
步骤402,对接收到的高频残差参数编码进行解码,得到解码高频残差参数,该解码高频残差参数包括频带划分结果、频域残差高低频段分界频率fD、最佳匹配频带频率位置、能量匹配因子、声道耦合参数和帧间扩展参数。
步骤403,高频残差信号重构。
根据解码高频残差参数,利用解码低频残差信号复制和重构高频残差信号,具体步骤包括:
(D1)根据步骤401和402得到的解码低频残差信号、最佳匹配频带频率位置和能量匹配因子,用下式进行高频残差信号复制和能量匹配:
RH(q0,l)=GR(p0,q0)·RL(p0,l),l=0,1,…L-1(6)
得到重构高频残差信号频带RH(q0,l);
(D2)根据步骤401和402得到的频带划分结果、声道耦合参数和帧间扩展参数,将所有重构高频残差信号频带进行组合,得到重构高频残差信号。
步骤404,根据解码得到的频域残差高低频段分界频率fD,将解码低频残差信号与重构高频残差信号进行组合,得到重构频域残差信号。
步骤205,重构频域残差信号经过时频反变换处理,得到重构时域残差信号;与时频变换相对应,时域反变换采用反向修正离散余弦变换、反向修正重叠反变换或反向快速傅里叶变换方法。
步骤206,对重构时域残差信号进行时域感知逆滤波处理,得到音频重构时域信号输出;如果用HR(z)表示时域感知逆滤波器,则HR(f)可以表示为
本发明上述实施例提供的音频编码方法和解码方法,能够对包括语音信号在内的音频信号进行高效高质量的压缩编码,提高音频传效率。
以上实施例只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种基于频域滤波和高频残差重构的音频编解码方法,包括如下步骤:
1)在编码端,音频原始时域信号经过时频变换处理,得到原始频域信号;
2)原始频域信号经过频域感知滤波处理,得到原始频域残差信号;
3)原始频域残差信号经过频域残差分析和编码处理,得到低频残差信号编码和高频残差参数编码,并输出到传输信道或存储介质。
4)在解码端,接收来自输出到传输信道或存储介质的低频残差信号编码和高频残差参数编码,并对其进行频域残差解码和重构处理,得到重构频域残差信号;
5)重构频域残差信号经过频域感知逆滤波处理,得到重构频域信号;
6)对重构频域信号进行时频反变换处理,得到音频重构时域信号。
2.根据权利要求1所述的音频信号编解码方法,其中步骤3)所述的频域残差分析和编码处理,包括如下步骤:
(A1)按照等带宽频带、或临界频带、或频程频带的频带划分方法,先对原始频域残差信号进行频带划分,然后根据音频编码器设定的编码速率选择一个频带划分端点,将原始频域残差信号分割成原始低频残差信号和原始高频残差信号两部分,使这两部分各具有若干个频带;
(A2)对原始低频残差信号进行编码,得到低频残差信号编码输出;再对低频残差信号编码在编码端进行本地解码,得到解码低频残差信号;
(A3)根据解码低频残差信号与原始高频残差信号的相似性或相关性,对高频残差参数进行分析,即选择一个频带匹配策略对解码低频残差信号和原始高频残差信号进行频带匹配,并计算最佳匹配的高频残差参数,得到包括频带划分结果、频域残差高低频段分界频率、最佳匹配频带频率位置、能量匹配因子、声道耦合参数和帧间扩展参数在内的原始高频残差参数;
(A4)对原始高频残差参数进行编码,得到高频残差参数编码输出。
3.根据权利要求2所述的音频信号编解码方法,其中步骤(A3)所述的频带匹配策略包括:高频残差信号频带在低频残差信号区域进行匹配、高频残差信号频带在低频残差信号区域及其扩展区域进行匹配、通过声道耦合进行高频残差信号匹配和通过帧间扩展进行高频残差信号匹配。
4.根据权利要求3所述的音频信号编解码方法,其中所述的高频残差信号频带在低频残差信号区域进行匹配,是用各个高频残差信号频带在低频残差信号区域进行匹配,寻找误差最小或相关性最大的最佳匹配频带。
5.根据权利要求3所述的音频信号编解码方法,其中所述的高频残差信号频带在低频残差信号区域及其扩展区域进行匹配,是先将频率最低的高频残差信号频带在低频残差信号区域进行匹配,寻找误差最小或相关性最大的最佳匹配频带,并用此最佳匹配频带重构频率最低的高频残差信号频带;再将这个重构的频率最低的高频残差信号频带加入原来的低频残差信号,形成一个新组成的低频残差信号;然后以这个新组成的低频残差信号为基础,对更高频率的高频残差信号频带进行匹配,直至完成所有高频残差信号频带的匹配。
6.根据权利要求3所述的音频信号编解码方法,其中所述的通过声道耦合进行高频残差信号匹配,是指多声道音频信号情况下,任意一个声道的高频残差信号频带采用高频残差信号频带在低频残差信号区域进行匹配或高频残差信号频带在低频残差信号区域及其扩展区域进行匹配,利用所在声道的低频残差信号对所在声道的高频残差信号进行匹配,并采用高频残差信号频带在低频残差信号区域进行匹配或高频残差信号频带在低频残差信号区域及其扩展区域进行匹配,利用其它声道的低频残差信号对所在声道的高频残差信号进行匹配。
7.根据权利要求3所述的音频信号编解码方法,其中所述的通过帧间扩展进行高频残差信号匹配,是指当前帧的高频残差信号频带采用高频残差信号频带在低频残差信号区域进行匹配、高频残差信号频带在低频残差信号区域及其扩展区域进行匹配或通过声道耦合进行高频残差信号匹配,利用当前帧的低频残差信号对当前帧的高频残差信号进行匹配,并采用高频残差信号频带在低频残差信号区域进行匹配、高频残差信号频带在低频残差信号区域及其扩展区域进行匹配或通过声道耦合进行高频残差信号匹配,利用前一帧或前若干帧的重构频域残差信号,包括重构低频残差信号和重构高频残差信号,对当前帧的高频残差信号进行匹配。
8.根据权利要求2所述的音频信号编解码方法,其中步骤(A3)所述的计算最佳匹配的高频残差参数,包括如下步骤:
(B1)在p∈[0,fD]、q∈[fD,fZ]范围,计算归一化低频残差频带信号和归一化高频残差频带信号其中,p和q分别表示和所在频带的起始位置,fZ为残差信号不为零所对应的最高频率,fD为低频残差信号和高频残差信号分界频率,l为频带内频点指针。
(B2)在p∈[0,fD]、q∈[fD,fZ]范围,计算匹配失真测度d(p,q)或匹配相关函数r(p,q);
(B3)在p∈[0,fD]、q∈[fD,fZ]范围,将失真测度d(p,q)的最小值或相关函数r(p,q)的最大值所对应的p和q的取值p0和q0为最佳频带匹配位置;
(B4)计算最佳能量匹配因子GR(p0,q0)。
9.根据权利要求1所述的音频信号编解码方法,其中步骤4)所述的频域残差解码和重构处理,包括如下步骤:
(C1)对接收到的低频残差信号编码进行解码,得到解码低频残差信号;
(C2)对接收到的高频残差参数编码进行解码,得到解码高频残差参数;
(C3)利用解码低频残差信号、解码高频残差参数中的最佳匹配频带频率位置和能量匹配因子,重构高频残差信号频带RH(q0,l);
(C4)利用解码高频残差参数中的频带划分方法、声道耦合参数和帧间扩展参数,将得到的重构高频残差信号频带进行组合,得到重构高频残差信号;
(C5)利用解码高频残差参数中的频域残差高低频段分界频率,将解码低频残差信号与重构高频残差信号进行组合,得到重构频域残差信号。
10.一种基于时域滤波和高频残差重构的音频编解码方法,包括如下步骤:
T1)在编码端,音频原始时域信号经过时域感知滤波处理,得到原始时域残差信号;
T2)原始时域残差信号经过时频变换处理,得到原始频域残差信号;
T3)原始频域残差信号经过频域残差分析和编码处理,得到低频残差信号编码和高频残差参数编码,并输出到传输信道或存储介质。
T4)在解码端,接收来自输出到传输信道或存储介质的低频残差信号编码和高频残差参数编码,并对其进行频域残差解码和重构处理,得到重构频域残差信号;
T5)对重构频域残差信号进行时频逆变换处理,得到重构时域残差信号;
T6)将重构时域残差信号进行时域逆滤波处理,得到音频重构时域信号。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200810232760XA CN101436407B (zh) | 2008-12-22 | 2008-12-22 | 音频编解码方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200810232760XA CN101436407B (zh) | 2008-12-22 | 2008-12-22 | 音频编解码方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101436407A CN101436407A (zh) | 2009-05-20 |
CN101436407B true CN101436407B (zh) | 2011-08-24 |
Family
ID=40710814
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200810232760XA Expired - Fee Related CN101436407B (zh) | 2008-12-22 | 2008-12-22 | 音频编解码方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101436407B (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106409299B (zh) | 2012-03-29 | 2019-11-05 | 华为技术有限公司 | 信号编码和解码的方法和设备 |
CN105976824B (zh) | 2012-12-06 | 2021-06-08 | 华为技术有限公司 | 信号解码的方法和设备 |
CN109243485B (zh) * | 2018-09-13 | 2021-08-13 | 广州酷狗计算机科技有限公司 | 恢复高频信号的方法和装置 |
CN111371460B (zh) * | 2020-04-26 | 2023-05-02 | 宁夏隆基宁光仪表股份有限公司 | 一种适用于智能电表的高低频匹配数据压缩方法 |
CN113160842B (zh) * | 2021-03-06 | 2024-04-09 | 西安电子科技大学 | 一种基于mclp的语音去混响方法及系统 |
CN118038877A (zh) * | 2022-11-01 | 2024-05-14 | 抖音视界有限公司 | 一种音频信号的编码、解码方法及装置 |
CN116366014B (zh) * | 2023-05-26 | 2023-08-18 | 苏州至盛半导体科技有限公司 | 基于频域分段的动态范围控制电路、音频处理芯片及方法 |
CN117198301A (zh) * | 2023-08-10 | 2023-12-08 | 腾讯科技(深圳)有限公司 | 音频编码方法、音频解码方法、装置、可读存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1535459A (zh) * | 2001-07-26 | 2004-10-06 | 日本电气株式会社 | 语音带宽扩展装置及语音带宽扩展方法 |
WO2006103488A1 (en) * | 2005-03-30 | 2006-10-05 | Nokia Corporation | Source coding and/or decoding |
CN1849648A (zh) * | 2003-09-16 | 2006-10-18 | 松下电器产业株式会社 | 编码装置和译码装置 |
CN101048814A (zh) * | 2004-11-05 | 2007-10-03 | 松下电器产业株式会社 | 编码装置、解码装置、编码方法及解码方法 |
CN101276587A (zh) * | 2007-03-27 | 2008-10-01 | 北京天籁传音数字技术有限公司 | 声音编码装置及其方法和声音解码装置及其方法 |
-
2008
- 2008-12-22 CN CN200810232760XA patent/CN101436407B/zh not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1535459A (zh) * | 2001-07-26 | 2004-10-06 | 日本电气株式会社 | 语音带宽扩展装置及语音带宽扩展方法 |
CN1849648A (zh) * | 2003-09-16 | 2006-10-18 | 松下电器产业株式会社 | 编码装置和译码装置 |
CN101048814A (zh) * | 2004-11-05 | 2007-10-03 | 松下电器产业株式会社 | 编码装置、解码装置、编码方法及解码方法 |
WO2006103488A1 (en) * | 2005-03-30 | 2006-10-05 | Nokia Corporation | Source coding and/or decoding |
CN101276587A (zh) * | 2007-03-27 | 2008-10-01 | 北京天籁传音数字技术有限公司 | 声音编码装置及其方法和声音解码装置及其方法 |
Also Published As
Publication number | Publication date |
---|---|
CN101436407A (zh) | 2009-05-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101436407B (zh) | 音频编解码方法 | |
CN101276587B (zh) | 声音编码装置及其方法和声音解码装置及其方法 | |
CN101471072B (zh) | 高频重建方法、编码装置和解码装置 | |
TWI541797B (zh) | 使用時間雜訊修補成形以編碼及解碼已被編碼音訊的裝置及方法 | |
JP4950210B2 (ja) | オーディオ圧縮 | |
KR101589942B1 (ko) | 외적 향상 고조파 전치 | |
CN101458930B (zh) | 带宽扩展中激励信号的生成及信号重建方法和装置 | |
DK2791937T3 (en) | Generation of an højbåndsudvidelse of a broadband extended buzzer | |
CN101662288B (zh) | 音频编码、解码方法及装置、系统 | |
US9037454B2 (en) | Efficient coding of overcomplete representations of audio using the modulated complex lapped transform (MCLT) | |
CN101527138B (zh) | 超宽带扩展编码、解码方法、编解码器及超宽带扩展系统 | |
CN101202043B (zh) | 音频信号的编码方法和装置与解码方法和装置 | |
CN103366749B (zh) | 一种声音编解码装置及其方法 | |
CN102396024A (zh) | 使用自适应正弦波脉冲编码的用于音频信号的编码/解码方法及其设备 | |
EP1852851A1 (en) | An enhanced audio encoding/decoding device and method | |
JP2011504249A (ja) | 信号処理方法及び装置 | |
CN104885149A (zh) | 用于隐藏帧错误的方法和设备以及用于对音频进行解码的方法和设备 | |
CN103366750B (zh) | 一种声音编解码装置及其方法 | |
CN101086845A (zh) | 声音编码装置及方法以及声音解码装置及方法 | |
CN101436406B (zh) | 音频编解码器 | |
CN102737647A (zh) | 双声道音频音质增强编解码方法及装置 | |
JP5969614B2 (ja) | 音声信号符号化方法及び音声信号復号方法 | |
CN102460574A (zh) | 用于使用层级正弦脉冲编码对音频信号进行编码和解码的方法和设备 | |
CN103366751A (zh) | 一种声音编解码装置及其方法 | |
CN103165134B (zh) | 音频信号高频参数编解码装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20110824 Termination date: 20141222 |
|
EXPY | Termination of patent right or utility model |