CN105280189B - 带宽扩展编码和解码中高频生成的方法和装置 - Google Patents
带宽扩展编码和解码中高频生成的方法和装置 Download PDFInfo
- Publication number
- CN105280189B CN105280189B CN201510590037.9A CN201510590037A CN105280189B CN 105280189 B CN105280189 B CN 105280189B CN 201510590037 A CN201510590037 A CN 201510590037A CN 105280189 B CN105280189 B CN 105280189B
- Authority
- CN
- China
- Prior art keywords
- band
- frequency sub
- low frequency
- subband
- residual signals
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明涉及带宽扩展编码和解码中高频生成的方法和装置。所述带宽扩展编码中高频生成的方法包括如下步骤:S1、对输入单声道音频信号进行复正交分析滤波,输出多个等带宽的子带信号;S2、对滤波输出的每个子带信号进行复数线性预测分析滤波,得到各子带的残差信号,求得预测系数,并依次完成所有高频子带残差信号与低频子带残差信号的对应关系,将子带残差拷贝参数编码输出给解码端;S3、量化编码预测系数并输出给解码端。与现有带宽扩展编码技术中的高频细节产生方法相比,本发明在每个复正交滤波子带都可以得到更精细的高频子带频谱形状,从而可改善音频信号高频部分的声音质量。
Description
技术领域
本发明涉及数字音频编解码技术,更具体地说,涉及一种带宽扩展编码和解码中高频生成的方法和装置。
背景技术
传统的感觉音频编码技术(DRA、AAC和MP3等)的立体声典型工作码率是96~128kbps,且在64kbps/立体声以下时编码质量存在明显的主观感觉失真。调频广播应用的典型编码码率为48kbps~64kbps/立体声,这时传统感觉音频编码技术的主观声音质量已不能满足调频广播要求。
为此,提出了数字音频信号的带宽扩展(BandWidth Extension,简称BWE)编码技术。目前的带宽扩展编码技术有很多,性能也参差不齐。已经公开且用于国际标准中带宽扩展编码技术主要由如下两种编码算法:
第一种带宽扩展编码技术是ISO/IEC 14496-3MPEG-4中描述的频谱带复制(Spectral Bandwidth Replication,简称SBR)编码。图1示出了SBR编码的具体原理框图。SBR是频域处理的算法,其编码原理为:每帧信号通过64子带的正交镜像滤波器组(Quadrature Mirror Filter,简称QMF)获得64个均匀的子频带,每个子频带包含32个样点,根据当前信号的瞬态特性划分一个合理的时频栅格,每个栅格计算一个能量信息并进行huffman编码。该算法同时包括音调性检查并传输个别的单个正弦信号参数信息。图2示出了SBR解码的具体原理框图。SBR解码原理为:经过核心解码器(AAC)输出的解码pcm通过32子带的QMF获得32个均匀的子频带,每个子频带包含32个样点,根据SBR解复用输出的控制参数进行高频生成,然后根据控制参数以及包络数据对高频进行调整,然后将低频32子带QMF的输出以及经调整后高频子带QMF的输出一起进入到64带QMF合成,最后输出全频带pcm音频信号。
SBR中用低频子带k生成高频子带m的简要示意图如图5所示。在SBR中,低频子带k生成高频子带m的公式为:
x[m][n]=x[k][n]+bw(k)·a0·x[k][n-1]+(bw(k))2·a1·x[k][n-2] (1)
其中:a0和a1是预测系数;bw(k)为弯曲因子,范围是0~0.98,具体值由控制参数决定,其含义是当高频的音调性强时,bw(k)偏向于0;当高频的音调性弱、甚至是类噪时,bw(k)偏向于0.98。
从上述公式(1)可以看到:
当bw(k)=0时,高频子带m就是由低频子带k直接拷贝生成;
当bw(k)=0.98时,高频子带m就是由低频子带k的预测残差生成。
因此,SBR技术在高频生成时的主要问题是,SBR的高频细节就是低频拷贝或者低频残差拷贝获得,这种技术在音频信号的低频和高频差别很大时,会出现较大的问题,因为SBR高频的细节恢复比较粗糙,所以在整个高频部分的还原上难以获得较高的质量。
第二种带宽扩展编码技术是在3GPP AMR-WB+编码方法中包含的一种简单的带宽扩展技术。它是一种时域处理的算法,主要编码原理是:将输入信号分为同样带宽的低频和高频两部分时域信号,低频(LF)部分通过LPC分析滤波处理得到低频信号的残差信号,然后经过高频LPC合成滤波来模拟高频细节信号;然后通过与实际SHF(n)的实际高频信号比较,得到高频包络(能量)的增益矢量(每子帧一个增益值),最后通过低频高频和低频连接点的增益的一致性进一步修正增益矢量,然后编码此增益矢量。因此传输给解码端的包括校正的增益矢量和高频LPC系数。AMR-WB+的高频解码过程基本是编码的反过程。
AMR-WB+中高频生成方法的简要示意图如图4所示。图中Fs是指经过重采样后的信号采样率。AMR-WB+中高频生成的简要过程为:经过重采样后频率为Fs的信号经过低通滤波2倍下采样后得到采样率为Fs/2的低频信号;该低频信号经过预测后得到低频残差信号;将该残差信号的谱反转后激励高频的预测滤波器,生成高频信号。
AMR-WB+的带宽扩展技术在高频生成的起始频带固定,只能是Fs/4,降低了带宽扩展技术的灵活性。对于大多数信号来说,越靠近低频,音调性越强,越靠近高频,音调性越弱,甚至是类噪性的,可是通过图4可以看出,带宽扩展中最高频的信号部分是由核心编码器中最低频的信号部分生成,所以对于大部分信号,这种拷贝使得经AMR-WB+的带宽扩展后的信号的高频部分有强烈的音调性,使主观质量大大降低。
发明内容
本发明要解决的技术问题在于,针对现有技术的上述缺陷,提供一种带宽扩展编码和解码中高频生成的方法和装置,以改善音频信号高频部分的声音质量。
本发明解决其技术问题所采用的技术方案是:提出一种带宽扩展编码中高频生成的方法,包括如下步骤:
S1、对输入单声道音频信号进行复正交分析滤波,输出多个等带宽的子带信号;
S2、对滤波输出的每个子带信号进行复数线性预测分析滤波,得到各子带的残差信号,求得预测系数,并依次完成所有高频子带残差信号与低频子带残差信号的对应关系,将子带残差拷贝参数编码输出给解码端;
S3、量化编码预测系数并输出给解码端。
根据本发明的一个实施例中,所述步骤S2中依次完成所有高频子带残差信号与低频子带残差信号的对应关系,将子带残差拷贝参数编码输出给解码端,进一步包括:
分析每个高频子带的残差信号,从低频子带残差信号中选择最佳的一个低频子带,并将以此得到的所有低频子带的子带号编码输出。
根据本发明的一个实施例中,所述步骤S2中依次完成所有高频子带残差信号与低频子带残差信号的对应关系,将子带残差拷贝参数编码输出给解码端,进一步包括:
对连续一组高频子带残差信号,从低频子带残差信号中选择最佳的一组连续的低频子带,并将以此得到的多组低频子带的起始和终止子带号编码输出。
根据本发明的一个实施例中,所述步骤S2进一步包括:
S21、对高频子带信号使用哈明窗进行重叠加窗处理;
S22、对重叠加窗处理后的高频子带信号进行线性预测滤波,得到高频子带残差信号;
S23、在使得残差信号的均方误差最小的准则下,通过莱文森-杜宾算法求解预测系数。
本发明为解决其技术问题还提出一种带宽扩展解码中高频生成的方法,包括如下步骤:
S1、对解码得到的低频信号进行复正交滤波器组分析滤波,获得低频子带信号;
S2、对低频子带信号进行复线性预测分析滤波,获得低频子带残差信号;
S3、解码并逆量化预测系数;
S4、利用解码得到的子带残差拷贝参数,将低频子带残差信号复制到高频子带残差信号,然后依据预测系数进行高频子带的线性预测合成滤波,得到高频子带细节信号;
S5、通过高频包络调整高频子带细节信号,输出高频子带信号。
本发明为解决其技术问题还提出一种带宽扩展编码中高频生成的装置,包括:
复正交滤波分析模块,用于对输入单声道音频信号进行复正交分析滤波,输出多个等带宽的子带信号;
复线性预测分析模块,用于对滤波输出的每个子带信号进行复数线性预测分析滤波,得到各子带的残差信号,求得预测系数,并依次完成所有高频子带残差信号与低频子带残差信号的对应关系,将子带残差拷贝参数编码输出给解码端;
量化编码模块,用于量化编码预测系数并输出给解码端。
根据本发明的一个实施例中,所述复线性预测分析模块进一步用于分析每个高频子带的残差信号,从低频子带残差信号中选择最佳的一个低频子带,并将以此得到的所有低频子带的子带号编码输出。
根据本发明的一个实施例中,所述复线性预测分析模块进一步用于对连续一组高频子带残差信号,从低频子带残差信号中选择最佳的一组连续的低频子带,并将以此得到的多组低频子带的起始和终止子带号编码输出。
根据本发明的一个实施例中,所述复线性预测分析模块进一步包括:
加窗单元,用于对高频子带信号使用哈明窗进行重叠加窗处理;
线性预测滤波单元,用于对重叠加窗处理后的高频子带信号进行线性预测滤波,得到高频子带残差信号;
求解单元,用于在使得残差信号的均方误差最小的准则下,通过莱文森-杜宾算法求解预测系数。
本发明为解决其技术问题还提出一种带宽扩展解码中高频生成的装置,包括:
复正交滤波分析模块,用于对解码得到的低频信号进行复正交滤波器组分析滤波,获得低频子带信号;
复线性预测分析模块,用于对低频子带信号进行复线性预测分析滤波,获得低频子带残差信号;
逆量化模块,用于解码并逆量化预测系数;
高频合成模块,用于利用解码得到的子带残差拷贝参数,将低频子带残差信号复制到高频子带残差信号,然后依据预测系数进行高频子带的线性预测合成滤波,得到高频子带细节信号;
高频调整模块,通过高频包络调整高频子带细节信号,输出高频子带信号。
根据本发明的带宽扩展编码中高频生成的方法和装置对高频子带信号进行复线性预测分析滤波并传输预测系数,保证高频包络的准确性;根据本发明的带宽扩展解码中高频生成的方法和装置用低频子带信号中最适合的低频残差信号代替高频子带残差信号来激励高频子带的线性预测合成滤波,能够得到较好的高频细节。因而与现有带宽扩展编码技术中的高频细节产生方法相比,本发明在每个复正交滤波子带都可以得到更精细的高频子带频谱形状,从而可改善音频信号高频部分的声音质量。
附图说明
下面将结合附图及实施例对本发明作进一步说明,附图中:
图1是现有的SBR编码方法的原理框图;
图2是现有的SBR解码方法的原理框图;
图3是现有的SBR中高频生成方法的简要示意图;
图4是现有的AMR-WB+中高频生成方法的简要示意图;
图5是本发明一个实施例的带宽扩展编码中高频生成的方法的流程图;
图6是本发明一个实施例的带宽扩展解码中高频生成的方法的流程图;
图7是本发明一个实施例的带宽扩展编码中高频生成的装置的逻辑框图;
图8是本发明一个实施例的带宽扩展解码中高频生成的装置的逻辑框图;
图9是本发明一个实施例中对高频子带进行CLPC分析的简要示意图;
图10是本发明一个实施例中CLCP重叠加窗处理的示意图;
图11是本发明一个实施例中的反射系数差值的示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
图5示出了根据本发明一个实施例的带宽扩展编码中高频生成的方法100的流程图。如图1所示,该带宽扩展编码中高频生成的方法100包括如下步骤:
步骤S110中,进行CQMF(Complex Quadrature Mirror Filter,复正交镜像滤波器组)分析,即:对输入单声道音频信号利用复正交镜像滤波器组进行复正交分析滤波,输出多个等带宽的子带信号。
步骤S120中,进行高频CLPC(Complex Linear Predictive Coding,复数线性预测编码)分析,即:对CQMF滤波输出的每个子带信号进行复数线性预测分析滤波,得到各子带的残差信号,求得预测系数,并依次完成所有高频子带残差信号与低频子带残差信号的对应关系,将子带残差拷贝参数编码输出给解码端。具体来说,高频子带残差信号与低频子带残差信号的关系可以通过如下两种方法来确定:
第一种方法:分析每个需要参数编码的高频CQMF子带的残差信号,从低频CQMF子带残差信号中选择最合适的一个低频子带,并将此低频子带的子带号作为参数,以此方法得到的所有子带号作为子带残差拷贝参数编码输出给解码端。
第二种方法:对连续一组高频CQMF子带残差信号,从低频CQMF子带残差信号中选择最佳的一组连续的低频子带,将这一组低频子带的起始和终止子带号作为参数,以此方法处理所有高频子带信号,获得多组起始和终止子带号,将这些子带号作为子带残差拷贝参数编码输出给解码端。
步骤S130中,量化编码前述步骤S120得到的预测系数并输出给解码端。
本发明上述的带宽扩展编码中高频生成的方法100对高频子带进行CLPC分析并传输预测系数,保证高频包络的精确性,从而可改善音频信号高频部分的声音质量。
基于以上的带宽扩展编码中高频生成的方法,本发明还提出一种带宽扩展解码中高频生成的方法。图6示出了根据本发明一个实施例的带宽扩展解码中高频生成的方法200的流程图。如图6所示,该带宽扩展解码中高频生成的方法200包括如下步骤:
步骤S210中,进行低频CQMF分析,即:通过普通的感觉音频解码(例如DRA解码)获得的低频信号作为另外的输入信号,对此低频信号进行CQMF分析滤波,获得与编码端相似的低频子带信号。
步骤S220中,进行低频CLPC分子,即:对低频子带信号进行CLPC分析滤波,获得类似于编码端的低频子带残差信号。
步骤S230中,解码并逆量化预测系数。带宽扩展解码时通过解复用编码码流,可获得量化编码的预测系数以及子带残差拷贝参数等信息。方法200对该量化编码的预测系数进行解码和逆量化,以获得用于高频CLPC合成的预测系数。
步骤S240中,进行高频CLPC合成,即:利用解码得到的子带残差拷贝参数,将低频子带残差信号复制到高频子带残差信号,然后依据预测系数进行高频子带的线性预测合成滤波,得到高频子带细节信号。
步骤S250中,进行高频调整,即:通过高频包络调整高频子带细节信号,输出高频子带信号。
最后,将通过以上方法200获得的高频子带信号与低频子带信号进行全频带CQMF合成滤波,便可输出全频带音频信号。
本发明上述的带宽扩展解码中高频生成的方法用低频子带信号中最适合的低频残差信号代替高频子带残差信号来激励高频子带的线性预测合成滤波,能够得到较好的高频细节,从而可改善音频信号高频部分的声音质量。
下面以32子带CQMF分析为例,给出本发明带宽扩展编码中高频生成的方法和带宽扩展解码中高频生成的方法的具体实现过程。需要说明的是,本发明对于SBR等其它带宽扩展编解码方法也同样适用。同时,以下虽然给出的是在复数域的一个实施例,须知实数域只是复数域的一种特殊情况,所以,本发明在实数域同样适用。
本实施例的带宽扩展编码中高频生成的方法的具体实现过程如下:
第一步,CQMF分析。
2048个PCM样本点输入到32子带CQMF分析滤波器组中,得到32个子带,每个子带有64个CQMF样本点(每个样本点均为复数),表示为:
x[n][k] n=0,1,...,63 k=0,1,...,31
第二步,高频CLPC分析。
LPC的基本思想是信号的每个取样值能够用过去若干个取样值的线性组合(预测值)来逼近。通过使实际信号取样值和线性预测样值之间的均方误差最小,来决定惟一的一组预测器系数。从谱估计的角度看,信号的全极点模型参数给出了信号的谱估计,而LPC中的预测系数正好给出了该信号的谱包络。
由于CQMF样本点为复数值,所以本发明将该思想扩展为CLPC,其原理和LPC类似。对高频子带k的CQMF样本点xhf[n][k]做CLPC分析的简要原理如图9所示,具体包括如下步骤:
步骤121,对高频子带信号使用哈明(hamming)窗进行重叠加窗处理。为了减轻帧间块效应,首先在CQMF样本点上做重叠加窗处理,如图10所示。其中,窗长为96个CQMF样本点,包括前一帧重叠的32个CQMF样本点和当前帧的64个CQMF样本点,窗型为hamming窗。将高频子带k的CQMF样本点xhf[n][k]进行重叠加窗处理后得到whf[n][k]如下:
whf[n][k]=xhf[n][k]·win[n] n=0,1...,95
其中,win[n]为hamming窗。
接着步骤122,对重叠加窗处理后的高频子带信号进行线性预测滤波,得到高频子带残差信号:
其中,p为预测阶数,典型地可以选择3或者4;a[i]为预测系数;ehf[n][k]为高频残差样本点。
接着步骤123,在使得残差信号ehf[n][k]的均方误差最小的准则下,通过莱文森-杜宾(Levinson-Durbin)算法求解预测系数a[i]。
第三步,量化编码预测系数。
对预测系数的量化编码具体包括如下步骤:
步骤131,因为直接对预测系数a[i]量化可能会引起预测器的不稳定,所以先将其转换成反射系数k[i]。转换递推公式为:
其中,i由p到(p-1),往下一直降到1,中间变量的初始值是i=p时,*代表复数共轭。
接着步骤132,对反射系数k[i]进行量化编码。因为只要满足|k[i]|2<1,预测器就是稳定的,所以只要保证量化后的满足则预测器也是稳定的。
接着步骤133,因为k[i]是复数的,所以可以将其分成复数的模以及相位分别量化编码并传输到解码端。
本实施例的带宽扩展解码中高频生成的方法的具体实现过程如下:
第一步,低频CQMF分析。
将解码后的一帧1024个PCM样本点输入到16子带CQMF分析滤波器组中,得到16个子带,每个子带有64个CQMF样本点(每个样本点均为复数),表示为:
xlf[n][k] n=0,1,...,63 k=0,1,...,15
第二步,低频CLPC分析。
对每个低频子带的CQMF样本点xlf[n][k]做CLPC分析的原理与前述高频CLPC分析类似,具体包括如下步骤:
步骤221,在低频CQMF样本点上做重叠加窗处理,重叠、加窗方式以及窗型均和编码端一样。低频子带k的低频CQMF样本点xlf[n][k]进行加窗处理得到wlf[n][k]如下:
wlf[n][k]=xlf[n][k]·win[n] n=0,1...,95
其中,win[n]为hamming窗。
接着步骤222,对wlf[n][k]进行预测分析,如下:
其中p为预测阶数,典型地可以选择3或者4;a[i]为预测系数;elf[n][k]为低频残差样本。
接着步骤223,在使得残差信号elf[n][k]的均方误差最小的准则下,通过Levinson-Durbin算法求解预测系数a[i]。
接着步骤224,将预测系数a[i]转换成反射系数k[i]。转换递推公式为:
其中,p为预测阶数,i依次由p降到(p-1),最后一直降到1;
其中,中间变量的初始值是i=p时,1≤j≤p;*代表复数共轭。
接着步骤225,为了减轻帧间块效应,将当前帧的反射系数k(j)[i]与前一帧的反射系数k(j-1)[i]进行内插,如图11所示。即:
k1[i]=k(j)[i]
接着步骤226,将反射系数k0[i]和k1[i]分别转换成预测系数a0[i]和a1[i]。转换递推公式为:
其中,kc[i]中c取0或1,i由1递增到p;*代表复数共轭。
然后,将k0[i]和k1[i]得到的分别赋值给a0[i]和a1[i]。
接着步骤227,求低频第k子带的残差信号,如下:
其中,n=0,1,...31。
第三步,逆量化预测系数。
逆量化预测系数具体包括如下步骤:
步骤231,解码并逆量化出反射系数
步骤232,将当前帧的反射系数与前一帧的反射系数进行差值得到和差值方法可参见低频信号CLPC分析中的步骤225。
步骤233,将反射系数和分别转换成预测系数和转换递推公式可参见低频信号CLPC分析中的步骤226。
第四步,高频CLPC合成。
高频CLPC合成是用低频残差样本elf[n][k]去激励高频子带的CLPC滤波器得到的。这样,就可得到合成的高频子带信号具体步骤为:
用低频第k子带残差激励高频子带m的CLPC滤波器,得到高频子带m的高频样本:
其中,n=0,1,...31。
第五步,高频调整。
根据传输过来的能量参数,对合成的高频子带信号做调整,确保每个栅格内能量保持不变。
最后,将通过以上方法得到的低频CQMF分析输出的xlf[n][k]与高频调整后的输入到全频带CQMF合成滤波器中,输出2048点全频带音频信号。
基于以上介绍的带宽扩展编码中高频生成的方法,本发明还提出一种带宽扩展编码中高频生成的装置。图7示出了根据本发明一个实施例的带宽扩展编码中高频生成的装置300的逻辑框图。如图7所示,该装置300包括复正交滤波分析模块310、复线性预测分析模块320和量化编码模块330。其中,复正交滤波分析模块310用于对输入单声道音频信号进行CQMF分析滤波,输出多个等带宽的子带信号。复线性预测分析模块320用于对滤波输出的每个子带信号进行CLPC分析滤波,得到各子带的残差信号,求得预测系数,并依次完成所有高频子带残差信号与低频子带残差信号的对应关系,将子带残差拷贝参数编码输出给解码端。量化编码模块330用于量化编码预测系数并输出给解码端。具体来说,复线性预测分析模块320可通过如下两种方法来确定高频子带残差信号与低频子带残差信号的对应关系:
第一种方法:分析每个需要参数编码的高频CQMF子带的残差信号,从低频CQMF子带残差信号中选择最合适的一个低频子带,并将此低频子带的子带号作为参数,以此方法得到的所有子带号作为子带残差拷贝参数编码输出给解码端。
第二种方法:对连续一组高频CQMF子带残差信号,从低频CQMF子带残差信号中选择最佳的一组连续的低频子带,将这一组低频子带的起始和终止子带号作为参数,以此方法处理所有高频子带信号,获得多组起始和终止子带号,将这些子带号作为子带残差拷贝参数编码输出给解码端。
具体实施例中,复线性预测分析模块进一步包括加窗单元、线性预测滤波单元和求解单元。加窗单元用于对高频子带信号使用hamming窗进行重叠加窗处理。线性预测滤波单元用于对重叠加窗处理后的高频子带信号进行LPC滤波,得到高频子带残差信号。求解单元用于在使得残差信号的均方误差最小的准则下,通过Levinson-Durbin算法求解预测系数。
本发明上述的带宽扩展编码中高频生成的装置300对高频子带进行CLPC分析并传输预测系数,保证高频包络的精确性,从而可改善音频信号高频部分的声音质量。
基于以上介绍的带宽扩展解码中高频生成的方法,本发明还提出一种带宽扩展解码中高频生成的装置。图8示出了根据本发明一个实施例的带宽扩展解码中高频生成的装置400的逻辑框图。如图4所示,该装置400包括复正交滤波分析模块410、复线性预测分析模块420、逆量化模块430、高频合成模块440和高频调整模块450。其中,复正交滤波分析模块410用于对解码得到的低频信号进行CQMF分析滤波,获得低频子带信号。复线性预测分析模块420用于对低频子带信号进行CLPC分析滤波,获得低频子带残差信号。逆量化模块430用于解码并逆量化预测系数。高频合成模块440用于利用解码得到的子带残差拷贝参数,将低频子带残差信号复制到高频子带残差信号,然后依据预测系数进行高频子带的线性预测合成滤波,得到高频子带细节信号。高频调整模块450通过高频包络调整高频子带细节信号,输出高频子带信号。最后,将通过装置400获得的高频子带信号与低频子带信号进行全频带CQMF合成滤波,便可输出全频带音频信号。有关装置400中各模块的具体实现,可参见前述对带宽扩展解码中高频生成的方法200的相关描述。
本发明上述的带宽扩展解码中高频生成的装置400用低频子带信号中最适合的低频残差信号代替高频子带残差信号来激励高频子带的线性预测合成滤波,能够得到较好的高频细节,从而可改善音频信号高频部分的声音质量。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种带宽扩展编码中高频生成的方法,其特征在于,包括如下步骤:
S1、对输入单声道音频信号进行复正交分析滤波,输出多个等带宽的子带信号;
S2、对滤波输出的每个子带信号进行复数线性预测分析滤波,得到各子带的残差信号,求得预测系数,并依次完成所有高频子带残差信号与低频子带残差信号的对应关系,将子带残差拷贝参数编码输出给解码端;
S3、量化编码预测系数并输出给解码端;
其中,所述步骤S2进一步包括:
S21、对高频子带信号使用哈明窗进行重叠加窗处理;
S22、对重叠加窗处理后的高频子带信号进行线性预测滤波,得到高频子带残差信号;
S23、在使得残差信号的均方误差最小的准则下,通过莱文森-杜宾算法求解预测系数。
2.根据权利要求1所述的方法,其特征在于,所述步骤S2中依次完成所有高频子带残差信号与低频子带残差信号的对应关系,将子带残差拷贝参数编码输出给解码端,进一步包括:
分析每个高频子带的残差信号,从低频子带残差信号中选择最佳的一个低频子带,并将以此得到的所有低频子带的子带号编码输出。
3.根据权利要求1所述的方法,其特征在于,所述步骤S2中依次完成所有高频子带残差信号与低频子带残差信号的对应关系,将子带残差拷贝参数编码输出给解码端,进一步包括:
对连续一组高频子带残差信号,从低频子带残差信号中选择最佳的一组连续的低频子带,并将以此得到的多组低频子带的起始和终止子带号编码输出。
4.一种带宽扩展解码中高频生成的方法,其特征在于,包括如下步骤:
S1、对解码得到的低频信号进行复正交滤波器组分析滤波,获得与编码端对应的多个低频子带信号;
S2、对低频子带信号进行复线性预测分析滤波,获得低频子带残差信号;
S3、解码并逆量化预测系数;
S4、利用解码得到的子带残差拷贝参数,将低频子带残差信号复制到高频子带残差信号,然后依据预测系数进行高频子带的线性预测合成滤波,得到高频子带细节信号;
S5、通过高频包络调整高频子带细节信号,输出高频子带信号;
其中,所述步骤S2进一步包括:
S21、对低频子带信号使用哈明窗进行与编码端一样的重叠加窗处理;
S22、对重叠加窗处理后的低频子带信号进行复线性预测分析,得到低频子带残差信号;
S23、在使得残差信号的均方误差最小的准则下,通过莱文森-杜宾算法求解预测系数。
5.一种带宽扩展编码中高频生成的装置,其特征在于,包括:
复正交滤波分析模块,用于对输入单声道音频信号进行复正交分析滤波,输出多个等带宽的子带信号;
复线性预测分析模块,用于对滤波输出的每个子带信号进行复数线性预测分析滤波,得到各子带的残差信号,求得预测系数,并依次完成所有高频子带残差信号与低频子带残差信号的对应关系,将子带残差拷贝参数编码输出给解码端;
量化编码模块,用于量化编码预测系数并输出给解码端;
其中,所述复线性预测分析模块进一步包括:
加窗单元,用于对高频子带信号使用哈明窗进行重叠加窗处理;
线性预测滤波单元,用于对重叠加窗处理后的高频子带信号进行线性预测滤波,得到高频子带残差信号;
求解单元,用于在使得残差信号的均方误差最小的准则下,通过莱文森-杜宾算法求解预测系数。
6.根据权利要求5所述的装置,其特征在于,所述复线性预测分析模块进一步用于:分析每个高频子带的残差信号,从低频子带残差信号中选择最佳的一个低频子带,并将以此得到的所有低频子带的子带号编码输出。
7.根据权利要求5所述的装置,其特征在于,所述复线性预测分析模块进一步用于对连续一组高频子带残差信号,从低频子带残差信号中选择最佳的一组连续的低频子带,并将以此得到的多组低频子带的起始和终止子带号编码输出。
8.一种带宽扩展解码中高频生成的装置,其特征在于,包括:
复正交滤波分析模块,用于对解码得到的低频信号进行复正交滤波器组分析滤波,获得低频子带信号;
复线性预测分析模块,用于对低频子带信号进行复线性预测分析滤波,获得低频子带残差信号;
逆量化模块,用于解码并逆量化预测系数;
高频合成模块,用于利用解码得到的子带残差拷贝参数,将低频子带残差信号复制到高频子带残差信号,然后依据预测系数进行高频子带的线性预测合成滤波,得到高频子带细节信号;
高频调整模块,通过高频包络调整高频子带细节信号,输出高频子带信号;
其中,所述复线性预测分析模块进一步用于:
对低频子带信号使用哈明窗进行与编码端一样的重叠加窗处理;
对重叠加窗处理后的低频子带信号进行复线性预测分析,得到低频子带残差信号;
在使得残差信号的均方误差最小的准则下,通过莱文森-杜宾算法求解预测系数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510590037.9A CN105280189B (zh) | 2015-09-16 | 2015-09-16 | 带宽扩展编码和解码中高频生成的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510590037.9A CN105280189B (zh) | 2015-09-16 | 2015-09-16 | 带宽扩展编码和解码中高频生成的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105280189A CN105280189A (zh) | 2016-01-27 |
CN105280189B true CN105280189B (zh) | 2019-01-08 |
Family
ID=55149080
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510590037.9A Active CN105280189B (zh) | 2015-09-16 | 2015-09-16 | 带宽扩展编码和解码中高频生成的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105280189B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107545900B (zh) * | 2017-08-16 | 2020-12-01 | 广州广晟数码技术有限公司 | 带宽扩展编码和解码中高频弦信号生成的方法和装置 |
CN113299313B (zh) * | 2021-01-28 | 2024-03-26 | 维沃移动通信有限公司 | 音频处理方法、装置及电子设备 |
CN117198301A (zh) * | 2023-08-10 | 2023-12-08 | 腾讯科技(深圳)有限公司 | 音频编码方法、音频解码方法、装置、可读存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050004793A1 (en) * | 2003-07-03 | 2005-01-06 | Pasi Ojala | Signal adaptation for higher band coding in a codec utilizing band split coding |
CN101521014A (zh) * | 2009-04-08 | 2009-09-02 | 武汉大学 | 音频带宽扩展编解码装置 |
CN104103276A (zh) * | 2013-04-12 | 2014-10-15 | 北京天籁传音数字技术有限公司 | 一种声音编解码装置及其方法 |
WO2014199632A1 (ja) * | 2013-06-11 | 2014-12-18 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 音響信号の帯域幅拡張を行う装置及び方法 |
CN104704855A (zh) * | 2012-10-15 | 2015-06-10 | 杜比国际公司 | 用于减小基于换位器的虚拟低音系统中的延迟的系统及方法 |
-
2015
- 2015-09-16 CN CN201510590037.9A patent/CN105280189B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050004793A1 (en) * | 2003-07-03 | 2005-01-06 | Pasi Ojala | Signal adaptation for higher band coding in a codec utilizing band split coding |
CN101521014A (zh) * | 2009-04-08 | 2009-09-02 | 武汉大学 | 音频带宽扩展编解码装置 |
CN104704855A (zh) * | 2012-10-15 | 2015-06-10 | 杜比国际公司 | 用于减小基于换位器的虚拟低音系统中的延迟的系统及方法 |
CN104103276A (zh) * | 2013-04-12 | 2014-10-15 | 北京天籁传音数字技术有限公司 | 一种声音编解码装置及其方法 |
WO2014199632A1 (ja) * | 2013-06-11 | 2014-12-18 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 音響信号の帯域幅拡張を行う装置及び方法 |
Non-Patent Citations (1)
Title |
---|
Decimation-whitening filter in spectral band replication;Han-Wen Hsu et al.;《IEEE Transactions on Audio, Speech, and Language Processing, 2011》;20111130;第19卷(第8期);第2304-2313页 |
Also Published As
Publication number | Publication date |
---|---|
CN105280189A (zh) | 2016-01-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11929084B2 (en) | Audio encoder and decoder using a frequency domain processor with full-band gap filling and a time domain processor | |
US11915712B2 (en) | Audio encoder and decoder using a frequency domain processor, a time domain processor, and a cross processing for continuous initialization | |
JP5551814B2 (ja) | 音声符号器、音声復号器、音声符号化方法、音声復号化方法およびコンピュータプログラム | |
CN102177426B (zh) | 多分辨率切换音频编码/解码方案 | |
CN105280190B (zh) | 带宽扩展编码和解码方法以及装置 | |
KR101407120B1 (ko) | 오디오 신호를 처리하고 결합된 통합형 음성 및 오디오 코덱(usac)을 위한 보다 높은 시간적 입도를 제공하기 위한 장치 및 방법 | |
JP6396459B2 (ja) | 周波数領域における時間的予備整形雑音の挿入によるオーディオ帯域幅拡張 | |
MX2011000373A (es) | Aparato y metodo para la codificacion/decodificacion de una señal de audio utilizando un esquema de conmutacion de generacion de señal ajena. | |
CN101025918A (zh) | 一种语音/音乐双模编解码无缝切换方法 | |
JP2013508761A (ja) | マルチモードオーディオコーデックおよびそれに適応されるcelp符号化 | |
CN111210832B (zh) | 基于频谱包络模板的带宽扩展音频编解码方法及装置 | |
EP2888734A1 (en) | Audio classification based on perceptual quality for low or medium bit rates | |
CN105280189B (zh) | 带宽扩展编码和解码中高频生成的方法和装置 | |
CN103155035B (zh) | 基于celp的语音编码器中的音频信号带宽扩展 | |
CN102074242B (zh) | 语音音频混合分级编码中核心层残差提取系统及方法 | |
CN111210831B (zh) | 基于频谱拉伸的带宽扩展音频编解码方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20220601 Address after: 510530 No. 10, Nanxiang 2nd Road, Science City, Luogang District, Guangzhou, Guangdong Patentee after: Guangdong Guangsheng research and Development Institute Co.,Ltd. Address before: 518057 6th floor, software building, No. 9, Gaoxin Zhongyi Road, high tech Zone, Nanshan District, Shenzhen, Guangdong Province Patentee before: SHENZHEN RISING SOURCE TECHNOLOGY Co.,Ltd. |
|
TR01 | Transfer of patent right |