具体实施方式
为了在现有音频编码基础上用更低的编码速率获得更大的编码带宽,并获得更高的编码质量,本发明实施例提供一种音频编码方法,具体可以提取用于表征音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数;将所述时域包络参数、频域包络参数、音调参数和谐波间隔参数编码后,传输给解码端。
进一步的,当所述音频信号的谐波间隔与第一谐波偏移量的值不同时,提取所述音频信号的第一谐波偏移量参数,并对其编码后传输给所述解码端。
图1是本发明实施例的音频编码方法流程示意图,下面将结合图1对本发明实施例的音频编码方法进行介绍。如图1所示,具体可以包括:
11:提取需要进行编码处理的音频信号的时域包络参数;具体的,可以通过计算音频信号的子帧能量来得到信号的时域包络,也可以将信号变换到频域(或变换域)之后提取自回归(AR,Auto Regressive)模型参数来表征信号的时域包络;
12:提取音频信号的频域包络参数;具体的,可以通过计算频域(或变换域)下的子带能量得到信号的频域包络,也可以在时域提取信号的白回归模型参数来表征信号的频域包络;
13:提取音频信号的音调参数;音调参数表征了音频信号中谐波信号与噪声信号之间的比例;音调参数的表示方法有多种,可以是自相关函数的最大值与最小值之比;
14:提取音频信号的谐波间隔(PG,Pitch Grid)参数;谐波间隔参数表征了信号的不同谐波之间的间隔;具体可以通过峰值提取方法估计出谐波间隔参数;
15:提取第一谐波偏移量参数(P0,Pitch Offset);具体的,可以根据谐波间隔参数,估计第一谐波偏移量参数,并将该第一谐波偏移量参数编码传输;第一谐波偏移量参数表征了音频信号第一个谐波的位置;需要指出的是,若第一谐波偏移量的值等于谐波间隔,则该步骤可以省略;也就是当所述音频信号的谐波间隔与第一谐波偏移量的值不同时,提取所述音频信号的第一谐波偏移量参数;
对上述时域包络参数,频域包络参数,音调参数,谐波间隔参数和第一谐波偏移量参数编码后(也可以量化后编码),将其输出。
需要指出的是,上述音调参数,谐波间隔参数和第一谐波偏移量参数可以但不限于在频域(或变换域)计算得到,例如还可以在时域计算得到。并且,获取上述各参数的顺序不唯一,即不论以何种顺序,只要获取上述音频信号的时域包络参数,频域包络参数,音调参数,谐波间隔参数和第一谐波偏移量参数即可。
上述内容描述了本发明实施例的音频编码方法流程,通过上述方法,可以用包含时域包络参数,频域包络参数,音调参数,谐波间隔参数和第一谐波偏移量参数的一组参数,或用包含时域包络参数,频域包络参数,音调参数和谐波间隔参数的一组参数,来表征音频信号。相对于现有技术的基于一定模型的参数音频编码技术,本发明实施例采用的一组参数,减少了编码时需要的参数的个数,同时降低了使用参数进行编码时所需要的比特数;从而解决了传统的RIRAC编码方法比特数较高的问题;同时,与现有的参数音频编码算法相比,由于本发明实施例的这组参数可以用更少的比特数进行编码,从而进一步降低信号的编码速率,并且当信道的传输能力一定时,由于本发明的编码比特数较低,因此能够编码具有更高带宽的信号,实现了用更低的编码速率获得更大的编码带宽及更高的编码质量。
本发明实施例还提供了一种音频解码方法,具体可以包括:对收到的数据进行解码,得到用于表征音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数;根据所述时域包络参数、频域包络参数、音调参数和谐波间隔参数,合成音频信号。
进一步的,还包括:对收到的包含第一谐波偏移量参数的数据进行解码,得到用于表征所述音频信号的第一谐波偏移量参数。
所述合成音频信号的步骤包括:
根据所述谐波间隔参数得到谐波信号;或当所述音频信号的谐波间隔与第一谐波偏移量参数不同时,根据所述谐波间隔参数和所述第一谐波偏移量参数,得到谐波信号;
根据所述音调参数,调整谐波信号与噪声信号之间的比例;并根据调整后的谐波信号与噪声信号,得到重建的谱信号;
根据所述频域包络参数和时域包络参数对所述重建的谱信号进行处理得到合成音频信号。
图2是本发明实施例提供的音频解码方法流程示意图,下面将结合图2对本发明实施例的音频解码方法进行介绍。如图2所示,具体可以包括:
21:对收到的数据进行解码,得到用于表征音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数,当音频信号的谐波间隔与第一谐波偏移量的值不同时,还包括第一谐波偏移量参数;
22:根据谐波间隔参数,得到谐波信号(当所述音频信号的谐波间隔与第一谐波偏移量参数不同时,根据谐波间隔参数和第一谐波偏移量参数,得到谐波信号;否则第一谐波偏移量的值等于谐波间隔的值);该谐波结构可以由具有随机相位的谐波表示,其中第一谐波偏移量参数确定了第一个谐波的位置,各个谐波的间隔由谐波间隔参数决定;该谐波结构即为谐波信号;
23:产生噪声信号,例如,可以由一个随机数产生器产生噪声信号;
24:根据音调参数的值调整谐波信号与噪声信号之间的比例;并根据调整后的谐波信号与噪声信号,得到重建的谱信号;
25:根据频域包络参数对所述重建的谱信号进行频域整形处理,得到频域整形后的信号;例如,可以根据解码出的子带能量包络对重建的谱信号进行去归一化处理后得到频域整形后的信号;
26:根据时域包络参数对所述频域整形后的信号进行时域整形处理,得到最终的合成音频信号;例如,可以根据解码出的子帧能量包络对频域整形后的信号变换到时域以后再进行去归一化处理后,得到最终的合成音频信号。
需要指出的是频域整形和时域整形的顺序不唯一,也可以先根据时域包络参数对所述重建的谱信号进行时域整形处理,再根据频域包络参数对整形后的谱信号进行频域整形处理,得到最终的合成音频信号。
上述内容描述了本发明实施例的音频解码方法流程,通过本发明实施例提供的包含用于表征音频信号的时域包络参数、频域包络参数、音调参数、谐波间隔参数和第一谐波偏移量参数的一组参数,可以实现利用更少的比特数来合成音频信号,且该音频信号质量较高;并且,当音频信号的谐波结构明显时,解码得到的音频质量更佳。
为便于对本发明实施例的理解,下面将对本发明实施例的编码、解码具体实现方案进行详细的描述。
实施例一
本实施例中,编码端分别提取了音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数,由于本实施例中音频信号的谐波间隔与第一谐波偏移量参数相同,因此省略了提取第一谐波偏移量参数的步骤;解码端收到上述参数后,根据上述各参数进行解码,得到合成音频信号。
编码端的实施过程具体可以包括:
(1):提取信号的时域包络参数:例如,采用计算音频信号的子帧能量来得到信号的时域包络参数,可以计算信号的子帧能量包络{temp_env(0),temp(1),……,temp(N-1)},其中N为子帧个数,设帧长为15ms,子帧长度为3ms,则N=5;对此子帧能量包络进行量化,即得到时域包络参数,进一步的可以对该时域包络参数进行编码;同时可以利用量化后的时域包络对信号进行时域归一化处理;
当然,实际应用中也可以将信号变换到频域(或变换域)之后提取自回归(AR,AutoRegressive)模型参数来表征信号的时域包络;
(2):提取音频信号的频域包络参数;例如,在时域提取信号的自回归模型参数来表征信号的频域包络时,在时域计算得到信号的自回归模型参数{α0,α1,……,αM-1},其中M为自回归模型的阶数,进一步的可以对该自回归模型参数进行量化、编码和传输;同时根据量化后的自回归模型参数进行滤波,得到残差信号err(n);
具体应用中,还可以通过计算频域(或变换域)下的子带能量得到信号的频域包络参数;
(3):提取音频信号的音调参数;音调参数表征了音频信号中谐波信号与噪声信号之间的比例;音调参数的表示方法有多种,可以是自相关函数的最大值与最小值之比,例如T=max(ACF(k0))/min(ACF(k0)),也可以是其它表现形式,只要可以表征谐波与噪声之间的比例关系即可;其中,自相关函数ACF(k0)的计算可以利用FFT变化与逆FFT变换得到,例如,对(2)中的残差信号err(n)进行FFT变换,得到频域信号S(k)=FFT(err(n)),并进一步得到自相关函数ACF(k0)=IFFT(|FFT(S(k))|2);当然,也可以直接计算得到,例如 其中L为编码带宽范围内频域变换系数的个数;此外,还可以使用平均幅度差函数(AMDF,Average Mean Difference Function)来修正自相关函数;
(4):提取音频信号的谐波间隔(PG,Pitch Grid)参数;谐波间隔参数表征了信号的不同谐波之间的间隔;具体可以通过峰值提取方法估计出谐波间隔参数的整数部分,例如通过PG=arg max(ACF(k0))计算得到谐波间隔参数的整数部分;谐波间隔的分数值可以内插自相关函数ACF(k0)以后通过峰值提取的方法获得;具体地,可以只在先获得的整数谐波间隔附近进行自相关函数的内插计算,并在内插后的自相关函数中搜索出谐波间隔的分数值;为了获得更好的性能,可以对得到的谐波间隔参数进一步修正后再进行编码传输,以抑制倍频和分数频的产生;例如,将求得的当前帧的谐波间隔PG与前一帧的谐波间隔old_PG进行比较,如果当前帧的谐波间隔与前一帧谐波间隔之间的比值小于某个域值(如0.1)且ACF(old_PG)>0.95ACF(PG),则用前一帧的谐波间隔代替本帧求得的谐波间隔PG=old_PG;
(5):由于本实施例中第一谐波偏移量的值等于谐波间隔,该步骤可以省略;但在第一谐波偏移量的值不等于谐波间隔时,提取第一谐波偏移量参数时具体可以:根据谐波间隔参数,估计第一谐波偏移量参数,并将该第一谐波偏移量参数编码传输;第一谐波偏移量参数表征了音频信号第一个谐波的位置;需要指出的是,若第一谐波偏移量的值等于谐波间隔,则该步骤可以省略;也就是当所述音频信号的谐波间隔与第一谐波偏移量的值不同时,提取所述音频信号的第一谐波偏移量参数;
将上述时域包络参数,频域包络参数,音调参数和谐波间隔参数编码后(或量化后输出)输出。当然,如果(5)没有被省略,则第一谐波偏移量参数也将被编码、传输。
需要指出的是,上述音调参数,谐波间隔参数和第一谐波偏移量参数可以但不限于在频域(或变换域)计算得到,例如还可以在时域计算得到。并且,获取上述各参数的顺序不唯一,即不论以何种顺序,只要获取上述音频信号的时域包络参数,频域包络参数,音调参数,谐波间隔参数和第一谐波偏移量参数即可;
对应的,解码端对收到的数据解码,得到用于表征音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数后,合成音频信号。当然,若编码端(5)没有被省略,则解码端解码得到的参数还包括第一谐波偏移量参数。
解码端实施解码的具体处理过程可以包括:
(6):对收到的数据进行解码,得到用于表征音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数;当然,若编码端音频信号的谐波间隔与第一谐波偏移量的值不同时,还得到第一谐波偏移量参数;
(7):根据谐波间隔参数得到谐波信号;该谐波结构可以由具有随机相位的谐波表示,其中第一个谐波的位置等于谐波间隔的值,各个谐波的间隔也由谐波间隔参数决定;该谐波结构即为谐波信号;具体的,例如:从起始频点开始按照谐波间隔参数(PG)表示的谐波间隔将具有随机相位的谐波以脉冲的形式放置于信号带宽范围内相应的频点,从而产生谐波信号buf_pulses(k),例如 其中h(k)表示具有随机相位的谐波;
需要说明的是,若解码端若还收到了第一谐波偏移量参数,解码端则可以根据谐波间隔参数和第一谐波偏移量参数,得到谐波信号;该谐波结构可以由具有随机相位的谐波表示,其中第一谐波偏移量参数确定了第一个谐波的位置,各个谐波的间隔由谐波间隔参数决定;该谐波结构即为谐波信号。具体的具体的,例如,第一谐波偏移量参数(P0)为第一个脉冲的位置,从第一个脉冲位置开始按照谐波间隔参数(PG)表示的谐波间隔将具有随机相位的谐波以脉冲的形式放置于信号带宽范围内相应的频点,从而产生谐波信号buf_pulses(k),例如 其中h(k)表示具有随机相位的谐波;
(8):产生噪声信号,例如,可以由一个随机数产生器产生噪声信号buf_noise(k);
(9):根据音调参数的值调整谐波信号与噪声信号之间的比例;并根据调整后的谐波信号与噪声信号,得到重建的谱信号;具体的调整可以有多种,例如:先分别计算谐波信号与噪声信号的能量,记作enerP和enerN,再计算调整因子β
1=1-T和
其中T是音调参数;并得到修正后的重建谱信号
通过逆FFT变换将重建的谱信号变换到时域,记作
(10):根据频域包络参数对所述重建的谱信号进行频域整形处理,得到频域整形后的信号;例如,根据解码得到的自回归模型参数,对信号
进行逆滤波,得到频域整形后的信号
(11):根据时域包络参数对所述频域整形后的信号进行时域整形处理,得到最终的合成音频信号;例如,可以根据解码出的子帧能量包络对信号
进行去归一化处理后,得到最终的合成音频信号。
相对于现有技术的基于一定模型的参数音频编码技术,本发明实施例采用的一组参数,减少了编码时需要的参数的个数,同时降低了使用参数进行编码时所需要的比特数;从而解决了现有编码方法比特数较高的问题;同时,与现有的参数音频编码算法相比,由于本发明实施例的这组参数可以用更少的比特数进行编码,从而进一步降低信号的编码速率,并且当信道的传输能力一定时,由于本发明的编码比特数较低,因此能够编码具有更高带宽的信号,实现了用更低的编码速率获得更大的编码带宽及更高的编码质量。同时在解码端可以实现利用更少的比特数来合成音频信号,且该音频信号质量较高;并且,当音频信号的谐波结构明显时,解码得到的音频质量更佳。
本发明实施例还提供了一种编码处理方法,具体可以包括:当用分频带的方式对音频信号进行编码时,若当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号相似,则提取用于表征音频信号的时域包络参数和频域包络参数,并将所述时域包络参数和频域包络参数编码后发送,同时发送表示当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号相似的信息;若当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号不相似,则提取用于表征音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数,并将所述时域包络参数、频域包络参数、音调参数和谐波间隔参数编码后发送,同时发送表示当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号相似的信息。
具体的,所述表示当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号相似或不相似的信息,具体可以用编码模式参数表示;所述编码模式参数,用于指示解码端在当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号相似时,根据所述音频信号的时域包络参数和频域包络参数,对当前频带的音频信号进行解码;或者指示解码端在当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号不相似时,根据所述音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数,对当前频带的音频信号进行解码。
进一步的,若当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号不相似,且当所述音频信号的谐波间隔与第一谐波偏移量的值不同时,提取所述音频信号的第一谐波偏移量参数;并将所述第一谐波偏移量参数传输给解码端。而且,若当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号相似时,还可以提取所述音频信号的音调参数,并将所述音调参数传输给解码端。
相应的,本发明实施例还提供了一种解码处理方法,具体可以包括:接收编码端发送的数据,若接收到表示当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号相似的信息,根据用于表征音频信号的时域包络参数和频域包络参数合成音频信号,其中,所述时域包络参数和频域包络参数是从接收到的数据中解码得到;若接收到表示当前频带的音频信号的谱信号与前一个频带的音频信号间的谱信号不相似的信息,根据用于表征音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数合成音频信号,其中,所述时域包络参数、频域包络参数、音调参数和谐波间隔参数是从接收到的数据中解码得到。
具体的,根据接收到的编码模式参数,确定所述当前频带的音频信号的谱信号与前一个频带的音频信号间的谱信号相似或不相似;若当前频带的音频信号的谱信号与前一个频带的音频信号间的谱信号相似,则根据所述收到的用于表征音频信号的时域包络参数和频域包络参数合成音频信号;若当前频带的音频信号的谱信号与前一个频带的音频信号间的谱信号不相似,则根据所述收到的时域包络参数、频域包络参数、音调参数和谐波间隔参数,合成音频信号。
若当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号不相似,所述收到的时域包络参数、频域包络参数、音调参数和谐波间隔参数,还可以包括:所述音频信号的第一谐波偏移量参数;若当前频带的音频信号的谱信号与前一个频带的音频信号间的谱信号相似,所述收到的用于表征音频信号的时域包络参数和频域包络参数,还可以包括:用于表征所述音频信号的音调参数。
图3是本发明实施例的编码处理方法流程示意图,下面将结合图3对本发明实施例的编码处理方法进行介绍。如图3所示,具体可以包括:
31:当用分频带的方式对音频信号进行编码时,判断当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号是否相似;具体的可以通过确定编码模式参数CM来表示是否相似;例如具体地,可以先计算当前频带信号谱与前一个频带信号谱之间的互相关,以确定当前频带谐波结构与前一个频带谐波结构之间的相似性;当互相关大于某一域值时,可以判定为当前频带谐波结构与前一个频带谐波结构之间是相似,将CM置为1,否则将CM置为0;并且当前频带信号谱与前一个频带信号谱之间相似时,可以不再提取下面的音调参数、谐波间隔参数和第一谐波偏移量参数;
32:若相似,则提取用于表征音频信号的时域包络参数和频域包络参数;若不相似,则提取用于表征音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数;也就是说,若当前频带信号谱与前一个频带信号谱之间相似时,可以不提取音频信号的音调参数、谐波间隔参数和第一谐波偏移量参数;具体的,提取上述各参数的方法可以如下:
提取时域包络参数;例如可以通过计算当前频带信号的子帧能量包络和全局增益因子gain,并根据这两组值判断信号是稳态信号或是瞬态信号;若是稳态信号,则对全局增益因子gain进行量化,将得到的量化值作为时域包络参数;如果是瞬态信号,则对子帧能量包络进行量化,将得到的量化值作为时域包络参数;并根据时域包络参数对当前频带信号进行时域归一化处理,得到时域归一化后的信号;
提取频域包络参数;例如对时域归一化以后的信号进行MDCT(修正的离散余弦变换,Modified Discrete Cosine Transform)变换后得到了一组MDCT系数,即时域归一化以后该频带对应的频域信号,对该频域信号处理时将这组频域信号分为N个子带,提取每个子带的子代能量并量化,得到一组量化后的频域包络,即为频域包络参数;根据频域包络参数对频域信号进行频域归一化处理,得到频域归一化后的信号;
提取音调参数;具体的,可以直接在MDCT域进行参数提取;为了进一步提高编码器的性能,也可以不直接在MDCT域进行参数提取,而是根据原始频域信号计算伪谱信号,并根据此伪谱信号计算音调参数;音调参数可以通过自相关函数的最大值与最小值之间的比值表示,其中最大值和最小值的获取是在期望的范围内或者是在对谐波间隔参数计算有益的范围内进行的;
提取谐波间隔参数PG;高频带信号的谐波间隔参数,通常是在频域(或变换域)下提取的;谐波间隔的整数值可以通过峰值提取方法由自相关函数估计出来,谐波间隔的分数值可以通过峰值提取的方法由内插的自相关函数估计出来;也可以只在求得的整数谐波间隔附近进行自相关函数的内插计算,之后通过峰值提取的方法获得谐波间隔的分数值;
提取第一谐波偏移量参数,例如根据谐波间隔,估计第一谐波偏移量参数P0;具体的可以在谐波间隔范围内,即[0,PG]范围内,将第一谐波分量分别置于不同偏移位置,并按谐波间隔依次放置其它谐波,并计算由此产生的谱与伪谱之间的相关性,相关性最大的偏移位置即所求的第一谐波偏移量;同时,第一谐波偏移量参数也可以用来进一步修正谐波间隔参数的估计值,从而达到更优的参数提取效果;需要指出的是,若第一谐波偏移量的值始终等于谐波间隔,则该步骤可以省略;
33:将表示当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号相似或不相似的信息发送;例如将编码模式参数编码后发送;并将提取的参数编码后发送;具体的,当CM等于1时,包含编码模式参数、时域包络参数和频域包络参数的一组参数将会被量化或编码,并传输到解码端;当CM等于0时,包含了编码模式参数、时域包络参数、频域包络参数、音调参数和谐波间隔参数的一组参数,将会被量化、编码,并传输到解码端;
需要指出的是当CM等于1时,传输到解码端的参数还可以包括音调参数;当CM等于0时,若第一谐波偏移量的值不等于谐波间隔,则还要传输第一谐波偏移量参数。
对应的,解码端根据收到的上述包含编码模式参数、时域包络参数和频域包络参数的一组参数,或收到上述包含编码模式参数、时域包络参数、频域包络参数、音调参数和谐波间隔参数的一组参数,合成音频信号。
需要指出的是,如果编码端在CM等于1时还传输了音调参数,相应的解码端也要接收音调参数;如果编码端在CM等于0时还传输了第一谐波偏移量参数,相应的解码端也要接收第一谐波偏移量参数。
图4是本发明实施例的解码处理方法流程示意图;如图4所示,解码处理的具体处理过程如图4所示,具体可以包括:
41:接收到表示当前频带的音频信号的谱信号与前一个频带的音频信号间的谱信号相似的信息,或不相似的信息;例如根据接收到的数据,解码出编码模式参数CM,根据该编码模式参数CM,即可确定是否相似;
42:当前频带的音频信号的谱信号与前一个频带的音频信号间的谱信号相似时,根据对收到数据解码得到的用于表征音频信号的时域包络参数和频域包络参数,合成音频信号;不相似时,根据对收到数据解码得到的用于表征音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数,合成音频信号;
具体的,重建谱信号时:
若当前频带信号谱与前一个频带信号谱之间相似,例如CM等于1,则可以采用谱复制的方式用前一个频带的谱信号作为当前频带重建的谱信号;当然也可以采用不同于谱复制的方式重建谱信号;如果编码端CM等于1时还传输了音调参数也可以从码流中解码出音调参数,采用谱复制的方式通过前一个频带的谱重建当前频带的谱信号;具体的,可以根据音调参数,对前一个频带的谱信号做整形,得到整形后的重建谱信号,将整形后的谱信号作为当前频带重建的谱信号;
若当前频带信号谱与前一个频带信号谱之间的不相关,例如CM等于0,则从码流中解码出音调参数、谐波间隔参数和第一谐波偏移量参数,根据所述谐波间隔参数得到谐波信号;或根据所述谐波间隔参数和第一谐波偏移量参数,得到谐波信号;根据所述音调参数,调整谐波信号与噪声信号之间的比例;并根据调整后的谐波信号与噪声信号,得到重建的谱信号;即使用基于音调参数、谐波间隔参数和第一谐波偏移量参数的人工重建方法来重建高频带的谱信号;需要说明的是,当编码的码流中没有传输第一谐波偏移量参数时,解码端第一谐波偏移量参数等于谐波间隔参数。
根据解码出的频域包络对重建的谱信号进行频域整形,例如进行频域去归一化处理,并将整形后的谱信号变换到时域;可以通过逆MDCT变换,也可以通过逆FFT变换将修整后的谱信号变换到时域,但是必须与编码端采用的变换方法相对应;
根据解码出的时域包络参数进行时域整形处理,例如时域去归一化处理,得到参数音频解码出的高频信号;得到合成的音频信号。
需要说明的是,上述频域整形与时域整形的顺序不唯一,即也可以先对重建的谱信号进行时域整形,再进行频域整形。例如:根据所述频域包络参数对所述重建的谱信号进行频域整形处理,得到频域整形后的信号,根据所述时域包络参数对频域整形后的信号进行时域整形处理,得到合成音频信号;或者,根据所述时域包络参数对所述重建的谱信号进行时域整形处理,得到时域整形后的信号,根据所述频域包络参数对时域整形后的信号进行频域整形处理,得到合成音频信号。
上述内容描述了当用分频带的方式对音频信号进行编码时,判断当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号是否相似,当不相似时提取包含时域包络参数、频域包络参数、音调参数、谐波间隔参数和第一谐波偏移量参数的一组参数,当相似时仅提取包含时域包络参数、频域包络参数和音调参数的一组参数,也可以是仅提取包含时域包络参数和频域包络参数的一组参数,由于本发明实施例减少了编码时需要的参数的个数,同时降低了使用参数进行编码时所需要的比特数;也有效地利用了信号不同频带之间谱的相似性进一步降低了编码速率,获得更大的编码带宽。解码端根据上述参数能够在分频带解码音频信号的过程中实现针对不同信号的特征采用不同的谱信号重建方法,对信号特征的适应性更强,可以对不同信号获得同样高的合成质量。
为便于对本发明实施例的理解,下面将对本发明实施例的编码、解码具体实现方案进行详细的描述。
实施例二
在该实施例中,在编码端将输入的音频信号分为高频带信号和低频带信号,并分别对高频带信号和低频带信号进行编码处理。
图5是本发明实施例二在编码端的处理过程示意图,如图5所示,编码处理过程包括:
51:对输入的音频信号进行滤波分析;设输入的音频信号的采样率为32KHz,处理帧长为20ms;对输入的信号进行分频带、下采样处理后,对应于0~8kHz频带的信号有320个采样点,对应于8~16kHz频带的信号有320个采样点;
52:0~8kHz频带内的信号通过核心编码进行编码处理,具体应用中,核心编码可以通过G.729.1编解码器完成,也可以通过其它宽带信号编解码器完成编码,即无论采用何种编码方式,能够对0~8kHz频带内的信号进行编码即可;并输出低频信号的比特流,即输出码流;
53:对8~16kHz频带内的信号,例如时域信号{y_hi(0),y_hi(1),……,y_hi(319)},采用本发明实施例提供的编码处理方法进行参数音频编码:这里高频带即为编码处理方法中所述的当前频带,低频带即为所述的前一个频带;当高频信号的谱与低频信号的谱不具有相似性时,提取包括时域包络参数、频域包络参数、音调参数、谐波间隔参数、第一谐波偏移量参数及编码模式参数的一组参数;当具有相似性时,仅提取包括时域包络参数、频域包络参数、音调参数及编码模式参数,也可以仅提取包括时域包络参数、频域包络参数及编码模式参数的一组参数;具体处理过程可以包括:
(1)确定编码模式参数CM;具体地,可以先计算低频带信号谱与高频带信号谱之间的互相关,以确定低频带谐波结构与高频带谐波结构之间的相似性;当互相关大于某一域值时,可以判定为低频带谐波结构与高频带谐波结构之间是相似,将CM置为1,并采用谱复制整形的方式通过低频带的谱信号重建高频带的谱信号;或通过其他不同于谱复制的方式重建谱信号;当互相关小于等于所述域值时,则判定低频带谐波结构与高频带谐波结构之间是不相似的,将CM置为0,并根据参数人工重建出高频带的谱信号;当然在实际的应用中也可以采用一种简单的方式来进行编码模式判定,即当谐波间隔PG小于某一域值时,将CM置为1;否则置为0;
(2)计算信号的子帧能量包络{temp_env(0),temp(1),……,temp(N-1)}和全局增益因子gain,在本实施例中N=8;并根据这两组值判断信号是稳态信号或是瞬态信号;若是稳态信号,则对全局增益因子gain进行量化,将得到的量化值作为时域包络参数,并进行编码写入码流;如果是瞬态信号,则对子帧能量包络进行量化,将得到的量化值作为时域包络参数,并进行编码写入码流;并根据时域包络参数对8~16kHz频带信号进行时域归一化处理,得到时域归一化后的信号;
(3)时域归一化后的信号经过MDCT(修正的离散余弦变换,Modified Discrete CosineTransform)变换(例如640点)后得到了一组MDCT系数,即该频带对应的频域信号{y_swb(0),y_swb(1),……,y_swb(319)},由于超宽带编码器只要求处理8~14kHz频带内的信号,所以对频域信号仅处理{y_swb(0),y_swb(1),……,y_swb(239)}部分;处理时将这组频域信号分为N个子带,提取每个子带的子代能量并量化,得到一组量化后的频域包络{spec_env(0),spec_env(1),……,spec_env(N-1)},即为8~14kHz频带内的频域包络参数;
由于对于宽带核心编码器G.729.1,7~8kHz部分信号已不在其处理范围内,为了确保在解码端解码信号频谱的连续性,还需要提取7~8kHz部分的信号的特征参数;由于G.729.1编码器对4~8kHz的信号进行了MDCT变换(例如320点),对应的频域信号{y_wb(0),y_wb(1),……,y_wb(159)},其中7~8kHz对应的频域信号为{y_wb(120),y_wb(121),……,y_wb(159)},将其分为M个子带,提取每个子带的频域包络并量化,得到一组7~8kHz频带内的量化后的频域包络{spec_env_extra(0),spec_env_extra(1),……,spec_env_extra(M-1)},与8~14kHz频带内的频域包络参数一起组成整个的频域包络参数;这组包络经过编码可以传输到解码端;在本实施例中N=15,M=3;
(4)提取音调参数;具体的,可以直接在MDCT域进行参数提取;为了进一步提高编码器的性能,也可以不直接在MDCT域进行参数提取,而是根据原始频域信号{y_swb(0),y_swb(1),……,y_swb(239)}计算伪谱信号,并根据此伪谱信号计算音调参数;
具体的伪谱信号S(k)={S(0),S(1),……,S(239)}可以按照下面的公式计算:
当然也可以通过其它方法,如对原始频域信号直接取绝对值得到的{|y_swb(0)|,|y_swb(1)|,……,|y_swb(239)|}进行计算;接着计算自相关函数ACF(k0),自相关函数可以由伪谱信号通过频域计算得到,例如ACF(k0)=IFFT(|FFT(S(k))|2),其中FFT为快速傅立叶变换,IFFT为其逆变换;此外,也可以直接计算得到,例如 另外,还可以使用平均幅度差函数(AMDF)来增强自相关函数;
音调参数可以通过自相关函数的最大值与最小值之间的比值表示,例如T=max(ACF(k0))/min(ACF(k0)),其中最大值和最小值的获取是在期望的范围内或者是在对谐波间隔参数计算有益的范围内进行的;
(5)根据ACF(k0),估计谐波间隔参数PG;高频带信号的谐波间隔参数,通常是在频域(或变换域)下提取的;谐波间隔的整数值可以通过峰值提取方法由自相关函数估计出来,例如根据PG=argmax(ACF(k0))获得,其中最大值的获取可以是限定在一个期望的范围内或者是感兴趣的范围内进行的,谐波间隔的分数值可以在适当地内插自相关函数ACF(k0)之后,通过峰值提取的方法获得;也可以只在求得的整数谐波间隔附近进行自相关函数的内插计算,之后通过峰值提取的方法获得谐波间隔的分数值;
(6)还可以对估计的谐波间隔参数值进行修正,以抑制倍频和分数频的产生;例如,将求得的当前帧的谐波间隔PG与前一帧的谐波间隔old_PG进行比较,如果当前帧的谐波间隔与前一帧谐波间隔之间的比值小于某个域值(如0.1)且ACF(old_PG)>0.95ACF(PG),则用前一帧的谐波间隔代替本帧求得的谐波间隔PG=old_PG;
(7)根据谐波间隔,估计第一谐波偏移量参数P0;例如,具体的可以在谐波间隔范围内,即[0,PG]范围内,将第一谐波分量分别置于不同偏移位置,并按谐波间隔依次放置其它谐波,并计算由此产生的谱与伪谱之间的相关性,相关性最大的偏移位置即所求的第一谐波偏移量,例如
其中
表示向下取整;需要指出的是,实际上谐波间隔参数与第一谐波偏移量参数之间也存在着一定程度上的相关性,因此可以通过谐波间隔参数估计出高频带信号的第一谐波偏移量参数;同时,第一谐波偏移量参数也可以用来进一步修正谐波间隔参数的估计值,从而达到更优的参数提取效果;
(8)当CM等于1时,包含编码模式参数、时域包络参数、频域包络参数、及音调参数的一组参数将会被量化或编码,并传输到解码端(即传输高频参数比特流);当CM等于0时,包含了编码模式参数、时域包络参数、频域包络参数、音调参数、谐波间隔参数及第一谐波偏移量参数的一组参数,将会被量化或编码,并传输到解码端(即传输高频参数比特流);
需要指出的是,当CM等于1时,也可以只将包含编码模式参数、时域包络参数和频域包络参数的一组参数量化或编码,并传输到解码端;
54:当完成高频带信号的参数音频编码后,可以根据所剩的编码比特数选择是否利用可选择的RIRAC音频编码对参数音频编码后的高频信号进行增强;本实施例采用的增强方式是对高频带信号在MDCT域进行变换编码;当然也可以选用其它方式对参数音频编码后的高频信号进行增强,如对高频带原始信号与高频带音频编码后的残差信号进行变换编码等;并传输高频增强比特流。
对应的,解码端收到上述低频比特流、高频参数比特流、高频增强比特流之后,进行解码,并合成音频信号;图6是本发明实施例二在解码端的处理过程示意图,如图6所示,解码具体处理过程可以包括:
61:0~8kHz频带内的信号合成通过核心解码完成;
62:8~16kHz频带内的信号合成则通过参数音频解码完成;具体处理包括:(1)根据接收到的数据,解码出编码模式参数CM;
(2)从数据中解码出时域包络参数、频域包络参数;
(3)若CM等于1,则可以从收到的数据中解码出音调参数,采用谱复制整形的方式通过低频带的谱重建高频带的谱信号,或通过其它不同于谱复制的方式重建谱信号;例如具体的,可以根据音调参数,对通过核心解码得到的低频带信号的谱信号做整形,将整形后的谱信号作为重建的高频带谱信号;
需要指出的是,当编码端在CM等于1时没有传输音调参数,则解码端将核心解码得到的低频带的谱信号直接作为重建的高频带谱信号;
若CM等于0,则可以从收到的数据中解码出音调参数、谐波间隔参数和第一谐波偏移量参数,使用基于音调参数、谐波间隔参数和第一谐波偏移量参数的人工重建方法来重建高频带的谱信号;谱信号的重建方法基于谐波信号加噪声信号;具体地,具有随机相位的谐波以脉冲的形式被置于频域范围内的某些频点之上,从而重建谐波信号,其中脉冲的间隔由谐波间隔参数决定,第一个脉冲的位置可以根据第一谐波偏移量得到;噪声信号可以由一个随机数产生器获得;根据音调参数T的值,调整谐波信号与噪声信号之间的比例;并将调整后的谐波信号与噪声信号相加,得到重建的谱信号;具体的调整可以有多种,例如:先分别计算谐波信号与噪声信号的能量,记作enerP和enerN,再计算调整因子β1=1-T和 并得到重建的谱信号
(4)根据解码出的频域包络对重建的谱信号进行频域整形,例如频域去归一化处理,并将整形后的谱信号变换到时域;例如,可以通过逆MDCT变化,也可以通过逆FFT变换将修整后的谱信号变换到时域;
(5)根据解码出的时域包络参数进行时域整形处理,例如时域去归一化处理,得到解码出的高频信号;
需要说明的是,在时域和频域去归一化处理中,还可以对时域包络和频域包络进行一种可选择的平滑滤波处理。如果高频带的谱信号是按照人工重建的方式进行的,一旦谐波被放置到错误的子带中,此时去归一化所用的将是错误的包络因子。若谐波位置出现轻微的偏差,就会引入一定程度的失真,使用平滑滤波可以减轻这种失真。具体地,如果在接近子带边界的附近有一个非常强的音调成分,那么就可以用内插后的子带能量包络因子进行频域去归一化处理;然后将得到的信号变换到时域,再由自适应的子帧能量包络(ATE)在时域内插出时域增益函数;这个时域增益函数最后可以被用来对时域信号进行去归一化处理;
63:在62完成高频带信号的解码后,可以根据接收到的数据中所剩的比特数选择是否对编码后的高频信号进行增强,具体的方法与编码端采用的增强方式相对应,这里不再赘述;
64:将0~8kHz频带的合成信号,与8~16kHz频带的合成信号通过QMF合成滤波,即可得到最终的32kHz采样率的合成音频信号。
实施例二中,在将音频信号分为低频带信号和高频带信号的情况下,对其中的高频带信号进行参数编码、解码处理,即采用编码模式参数指示利用表征信号的包含时域包络、频域包络、音调、谐波间隔和第一谐波偏移量的一组参数来完成编解码,或者利用表征信号的包含时域包络、频域包络和音调的一组参数,来完成编解码。本发明实施例采用的一组参数,减少了编码时需要的参数的个数,同时降低了使用参数进行编码时所需要的比特数;从而解决了现有编码方法比特数较高的问题;同时,与现有的参数音频编码算法相比,由于本发明实施例的这组参数可以用更少的比特数进行编码,从而进一步降低信号的编码速率,并且当信道的传输能力一定时,由于木发明的编码比特数较低,因此能够编码具有更高带宽的信号,实现了用更低的编码速率获得更大的编码带宽及更高的编码质量。同时在解码端可以实现利用更少的比特数来合成音频信号,且该音频信号质量较高;并且,当音频信号的谐波结构明显时,解码得到的音频质量更佳。
实施例三
相对于实施例二采用了先提取时域包络参数后提取频域包络参数的方法,实施例三则采用了先提取频域包络参数的方法来实现编码(以实施例三中的音频信号与分频带方法,与实施例二中的相同为例)。
本实施例中,在编码端对高频带信号处理的过程具体可以包括:
(1):按照实施例二中编码端的(1)中的方法确定编码模式参数CM;
(2):8~16kHz频带内的时域信号经过MDCT变换后得到了一组MDCT系数,由于超宽带部分仅处理8~14kHz频带内的信号,所以对频域信号仅处理{y_swb(0),y_swb(1),……,y_swb(239)}部分;对于核心编码,7~8kHz部分信号已不在其处理范围之内,为了确保在解码端解码信号频谱的连续性,在编码端需要提取7~8kHz部分MDCT变换域信号{y_wb(120),y_wb(121),……,y_wb(159)};
(3):对7~14kHz频带内的MDCT系数进行分带,并计算各自的子带能量,作为频域包络参数,并对其量化后编码传输;
(4):对7~14kHz频带内的MDCT系数进行频域归一化处理,并根据频域归一化以后的MDCT系数提取线性预测系数,作为时域包络参数,并对这组线性预测系数量化后编码传输;
(5):对于频域归一化的MDCT系数进行线性预测滤波,得到MDCT域的线性预测残差;
(6):按照实施例二中编码端53的(4)~(8)中的方法提取出高频信号的音调参数、谐波间隔参数以及第一谐波偏移量参数;当编码模式为1时,只传输编码模式参数、时域包络参数、频域包络参数和音调参数到解码端;当编码模式为0时,则将编码模式参数、时域包络参数、频域包络参数、音调参数、谐波间隔参数和第一谐波偏移量参数一起传输到解码端;
对应的,解码端对高频带信号的处理的过程具体可以包括:
(7):根据接收到的码流,解码出编码模式参数CM;并从码流中解码出时域包络参数、频域包络参数;具体地,可以通过码书查找获得量化后的线性预测系数,即时域包络参数;以便于随后根据该获得的线性预测系数进行时域整形处理;通过码书查找获得量化后的子带能量,即频域包络参数;以便于随后根据该获得的子带能量进行频域整形处理;
(8):按照实施例二中解码端62中的(3)中的方法重建高频带的谱信号;
(9):使重建的高频带谱信号通过线性预测逆滤波器,也即相当于对重建的高频带谱信号进行时域整形处理;
(10):根据量化后的子带能量,对重建的高频带谱信号进行频域整形处理;
(11):通过逆MDCT变换,将整形后的高频带谱信号变换到时域,得到最终的高频带合成信号。
由上述描述可知,实施例三采用了先提取频域包络参数的方法来实现编码,由于获取上述各参数的顺序不唯一,即不论以何种顺序,只要获取上述音频信号的编码模式参数、时域包络参数,频域包络参数,音调参数,谐波间隔参数和第一谐波偏移量参数即可。本发明实施例采用的一组参数,减少了编码时需要的参数的个数,同时降低了使用参数进行编码时所需要的比特数;从而解决了现有编码方法比特数较高的问题;同时,与现有的参数音频编码算法相比,由于本发明实施例的这组参数可以用更少的比特数进行编码,从而进一步降低信号的编码速率,并且当信道的传输能力一定时,由于本发明的编码比特数较低,因此能够编码具有更高带宽的信号,实现了用更低的编码速率获得更大的编码带宽及更高的编码质量。同时在解码端可以实现利用更少的比特数来合成音频信号,且该音频信号质量较高;并且,当音频信号的谐波结构明显时,解码得到的音频质量更佳。
本发明实施例还提供了相应的音频编码装置,其结构如图7所示,具体实现结构可以包括:
参数提取单元71,用于提取用于表征音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数;当所述音频信号的谐波间隔与第一谐波偏移量的值不同时,还用于提取用于表征所述音频信号的第一谐波偏移量参数,并传送至发送单元;
发送单元72,用于将所述时域包络参数、频域包络参数、音调参数和谐波间隔参数编码后,传输给解码端,具体的,例如:对所述时域包络参数、频域包络参数、音调参数和谐波间隔参数,进行编码后,传输给解码端;或者用于将所述时域包络参数、频域包络参数、音调参数、谐波间隔参数和第一谐波偏移量参数编码后传输给解码端。
本发明实施例还提供了相应的音频解码装置,其结构如图8所示,具体实现结构可以包括:
解码单元81,用于对收到的数据进行解码,得到用于表征音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数;还用于对收到的包含第一谐波偏移量参数的数据进行解码,得到用于表征所述音频信号的第一谐波偏移量参数;
合成单元82,用于根据时域包络参数、频域包络参数、音调参数和谐波间隔参数;或者时域包络参数、频域包络参数、音调参数、谐波间隔参数和第一谐波偏移量参数,合成音频信号;具体可以包括:
谐波重建子单元821,用于根据所述谐波间隔参数,得到谐波信号;或当所述用于表征音频信号的谐波间隔与第一谐波偏移量不同时,根据所述谐波间隔参数和所述第一谐波偏移量参数,得到谐波信号;
谱信号重建子单元822,用于根据所述音调参数,调整所述谐波重建子单元821得到的谐波信号与噪声信号之间的比例;并根据调整后的谐波信号与噪声信号,得到重建的谱信号;
整形子单元823,用于根据所述频域包络参数和时域包络参数对所述谱信号重建子单元822重建的谱信号进行处理,得到合成音频信号;例如:根据所述频域包络参数对所述重建的谱信号进行频域整形处理,得到频域整形后的信号,根据所述时域包络参数对频域整形后的信号进行时域整形处理,得到所述合成音频信号;或者,根据所述时域包络参数对所述重建的谱信号进行时域整形处理,得到时域整形后的信号,根据所述频域包络参数对时域整形后的信号进行频域整形处理,得到所述合成音频信号。
本发明实施例还提供了相应的音频编解码系统,其结构如图9所示,具体实现结构可以包括:
编码装置91,用于提取用于表征音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数;对所述用于表征音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数编码后,发送至解码装置;具体可以包括:
参数提取单元911,用于提取音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数;当所述音频信号的谐波间隔与第一谐波偏移量的值不同时,还用于提取所述音频信号的第一谐波偏移量参数;
发送单元912,用于将所述时域包络参数、频域包络参数、音调参数和谐波间隔参数;或者所述时域包络参数、频域包络参数、音调参数、谐波间隔参数和第一谐波偏移量参数,编码后传输给解码装置;
解码装置92,用于对所述编码装置发送来的数据进行解码,得到所述时域包络参数、频域包络参数、音调参数和谐波间隔参数;根据所述时域包络参数、频域包络参数、音调参数和谐波间隔参数合成音频信号;具体可以包括:
解码单元921,用于对收到的数据进行解码,得到所述时域包络参数、频域包络参数、音调参数和谐波间隔参数,或者所述时域包络参数、频域包络参数、音调参数、谐波间隔参数和第一谐波偏移量参数;
合成单元922,用于根据所述时域包络参数、频域包络参数、音调参数和谐波间隔参数,或者所述时域包络参数、频域包络参数、音调参数、谐波间隔参数和第一谐波偏移量参数,合成音频信号。
本发明实施例还提供了相应的编码处理装置,其结构如图10所示,具体实现结构可以包括:
判断单元101,用于判断当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号是否相似;具体的,可以用编码模式参数的值来表示是否相似的信息;
编码单元102,用于根据所述判断单元101得到的判断结果信息,在当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号相似时,提取用于表征音频信号的时域包络参数和频域包络参数,还用于提取音调参数;或者,在当前频带的音频信号的谱信号与前一个频带的音频信号间的谱信号不相似时,提取用于表征音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数;在所述音频信号的谐波间隔与第一谐波偏移量的值不同时,还用于提取所述音频信号的第一谐波偏移量参数;
传输单元103,用于发送所述判断单元101得到的当前频带的音频信号的谱信号与前一个频带的音频信号间的谱信号相似的信息,例如将编码模式参数编码后发送;还用于对所述编码单元提取的所述音频信号的时域包络参数和频域包络参数(还可以包括音调参数)进行编码后发送;或者,发送所述判断单元得到的当前频带的音频信号的谱信号与前一个频带的音频信号间的谱信号不相似的信息,对所述编码单元提取的音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数(还可以包括第一谐波偏移量参数)进行编码后发送。
本发明实施例还提供了相应的解码处理装置,其结构如图11所示,具体实现结构可以包括:
接收信息单元111,用于接收表示当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号相似的信息,并对收到的数据解码得到用于表征音频信号的时域包络参数和频域包络参数;或者,接收表示当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号不相似的信息,并对收到的数据解码得到用于表征音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数;还用于对包含第一谐波偏移量参数的数据解码,得到用于表征音频信号的第一谐波偏移量参数;具体的,接收信息单元111可以根据接收到的编码模式参数,确定所述当前频带的音频信号的谱信号与前一个频带的音频信号间的谱信号相似或不相似;
解码单元112,用于根据所述接收信息单元111接收的所述相似的信息,以及所述用于表征音频信号的时域包络参数和频域包络参数,合成音频信号;或者,根据所述不相似的信息,以及所述用于表征音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数,合成音频信号;具体的:
当接收到当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号相似的信息,所述解码单元112,具体如图12所示,可以包括:
重建子单元121:用于重建谱信号,得到重建的谱信号;
第二整形子单元122:用于根据所述音调参数,对所述重建子单元121重建的谱信号进行整形处理,得到整形后的重建谱信号;
第一整形子单元123:用于根据所述频域包络参数和时域包络参数对所述重建的谱信号(或整形后的谱信号)进行处理得到合成音频信号;例如:根据所述频域包络参数和时域包络参数对所述第二整形子单元整形处理后的重建的谱信号进行处理,包括:根据所述频域包络参数对所述重建的谱信号进行频域整形处理,得到频域整形后的信号;根据所述时域包络参数对频域整形后的信号进行时域整形处理,得到所述合成音频信号;或,根据所述时域包络参数对所述重建的谱信号进行时域整形处理,得到时域整形后的信号;根据所述频域包络参数对时域整形后的信号进行频域整形处理,得到所述合成音频信号;
当接收到当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号不相似的信息,所述解码单元112,具体如图12所示,可以包括:
谐波重建子单元124,用于根据所述谐波间隔参数,得到谐波信号;或根据所述谐波间隔参数和第一谐波偏移量参数,得到谐波信号;
谱信号重建子单元125,用于根据所述音调参数,调整谐波信号与噪声信号之间的比例,并根据调整后的谐波信号与噪声信号,得到重建的谱信号;
第三整形子单元126,用于根据所述频域包络参数和时域包络参数对所述重建的谱信号进行处理得到合成音频信号。例如,根据所述频域包络参数对所述重建的谱信号进行频域整形处理,得到频域整形后的信号;根据所述时域包络参数对频域整形后的信号进行时域整形处理,得到所述合成音频信号;或,根据所述时域包络参数对所述重建的谱信号进行时域整形处理,得到时域整形后的信号;根据所述频域包络参数对时域整形后的信号进行频域整形处理,得到合成音频信号。
上述各个本发明实施例可以但不限于应用于音频编解码设备中。
综上所述,本发明各实施例和现有技术中相比,由于本发明实施例采用包含时域包络参数、频域包络参数、音调参数和谐波间隔参数(还可以包括第一谐波偏移量参数)的一组参数,来表征音频信号,在对音频信号编码时可以实现在现有基础上降低了使用参数进行编码时所需要的比特数,可以用更少的比特数对信号进行编码,进一步降低信号的编码速率,从而用更低的编码速率获得更大的编码带宽以及更高的编码质量,特别是对谐波结构明显的信号,采用本发明实施例可以获得很好的编码质量。同时本发明实施例提供的编码、解码处理技术方案中,当用分频带的方式对音频信号进行编码时,判断当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号是否相似,当不相似时提取包含时域包络参数、频域包络参数、音调参数和谐波间隔参数(还可以包括第一谐波偏移量参数)的一组参数,当相似时仅提取包含时域包络参数、频域包络参数(还可以包括音调参数)的一组参数,有效地利用了信号不同频带之间谱的相似性进一步降低了编码速率,获得更大的编码带宽。解码端根据上述参数能够在分频带解码音频信号的过程中实现针对不同信号的特征采用不同的谱信号重建方法,对信号特征的适应性更强,可以对不同信号获得同样高的合成质量。换句话说,当信道的传输能力一定时,由于本发明的编码比特数较低,因此能够编码具有更高带宽的信号。由于从听觉上讲信号的带宽越大获得听觉感受越好,因此当信道的传输能力一定时,本发明提供的方法可以获得更高的编码带宽及更高的合成质量。并且本发明实施例提供的一种对音频信号进行分频带编码、解码处理的技术方案,能够在分频带编解码音频信号的过程中实现用更低的编码速率获得更大的编码带宽,获得更高的编码质量。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。