CN103778918B

CN103778918B - 音频信号的比特分配的方法和装置

Info

Publication number: CN103778918B
Application number: CN201210415253.6A
Authority: CN
Inventors: 齐峰岩; 刘泽新; 苗磊
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2012-10-26
Filing date: 2012-10-26
Publication date: 2016-09-07
Anticipated expiration: 2032-10-26
Also published as: EP2892052B1; SG10201703301UA; US20170069329A1; EP2892052A1; KR20150058483A; JP6121551B2; US20150206541A1; US9530420B2; BR112015008609B1; SG11201502355PA; JP2015534129A; CN103778918A; EP2892052A4; JP2017138614A; JP6351783B2; BR112015008609A2; US9972326B2; WO2014063489A1

Abstract

本发明实施例提供了一种音频信号的比特分配的方法和装置。其中，方法包括：将音频信号的频带分为多个子带，量化每个子带的子带归一化因子；将多个子带划分为多个组，获取每个组的组内子带归一化因子之和，其中组内子带归一化因子之和是组内所有子带的子带归一化因子的和；根据每个组的组内子带归一化因子之和进行初始组间比特分配，以确定每个组的初始比特数；基于每个组的初始比特数，进行二次组间比特分配，以将编码比特分配到至少一个组，其中该至少一个组分配的比特之和为音频信号的编码比特；将分配到组的音频信号的比特分配到组内的子带中。本发明可以在中低比特率时，通过分组保证前后帧分配比较稳定，减少全局对局部不连续的影响。

Description

音频信号的比特分配的方法和装置

技术领域

本发明实施例涉及音频技术领域，并且更具体地，涉及音频信号的比特分配的方法和装置。

背景技术

目前的通信传输越来越重视音频的质量，所以要求编解码时在保证语音质量的前提下要尽可能地提高音乐质量。由于音乐信号信息量极为丰富，不能采用传统语音的CELP（Code Excited LinearPrediction，码激励线性预测）编码模式，通常是利用变换编码的方法，在频域来处理音乐信号，提升音乐信号的编码质量。但如何有效地用有限的编码比特高效率的编码信息成为目前音频编码的主要研究课题。

目前的音频编码技术通常采用FFT（Fast Fourier Transform，快速傅立叶变换）或MDCT（Modified Discrete Cosine Transform，改进离散余弦变换）将时域信号转换到频域，然后对频域信号进行编码。变换编码通常需要把频域系数进行分带，求得每个带的归一化能量，并对带内系数能量归一化，然后进行比特分配，最后根据每个带分到的比特对带内系数进行量化，其中比特分配是极为关键的一部。比特分配指在量化频谱系数的过程中，根据频谱的子带特性将音频信号用量化频谱系数的比特分配在各个子带上。

具体而言，现有的比特分配的过程包括：对频谱信号进行分带，例如根据临界频带理论从低频到高频逐渐增加带宽；频谱分带，求出每个子带的归一化能量norm，并量化得到子带归一化因子wnorm；将各子带按子带归一化因子wnorm的值从大到小降序排列；比特分配，例如根据子带归一化因子wnorm的值迭代循环分配每个子带的比特数。其中，迭代循环分配比特又可以细化为以下步骤：步骤1，初始化每个子带的比特数和迭代因子fac；步骤2，找出最大的子带归一化因子wnorm所对应的带；步骤3，将此带分配的比特数累加带宽值，并将子带归一化因子wnorm的值减去迭代因子fac；步骤4，迭代步骤2和步骤3，直至比特分配完毕。可见，在现有技术中，每次分配的比特单位最小是带宽值，而量化时所需的最低比特数要小于带宽值，这就使得这种整数的比特分配在低比特率下效率较低，好多带分配不到比特，而其它的带又分得太多。由于是全频带循环迭代分配比特，对不同的带宽的子带，循环迭代参数都是一样的，会使分配结果很随机，量化比较分散，前后帧不连续。

由此可知，在低比特率下，比特分配对性能影响较大。通常的比特分配主要是根据每个子带归一化能量的高低在全频带进行分配，在比特率不足的情况下，这种分配很随机，也比较分散，会在时域上产生量化不连续的现象。

发明内容

本发明实施例提供一种音频信号的比特分配的方法和装置，能够解决中低比特率的情况下，现有比特分配方法导致分配随机且分散，从而在时域上产生量化不连续的问题。

第一方面，提供了一种音频信号的比特分配的方法，包括：将音频信号的频带分为多个子带，量化每个子带的子带归一化因子；将所述多个子带划分为多个组，获取每个组的组内子带归一化因子之和，其中所述组内子带归一化因子之和是所述组内所有子带的子带归一化因子的和；根据所述每个组的组内子带归一化因子之和进行初始组间比特分配，以确定所述每个组的初始比特数；基于所述每个组的初始比特数，进行二次组间比特分配，以将音频信号的编码比特分配到至少一个组，其中该至少一个组分配的比特之和为音频信号的编码比特；将分配到所述组的音频信号的比特分配到所述组内的子带中。

结合第一方面，在第一方面的第一种实现方式中，进行二次组间比特分配包括：采用比特分配的饱和算法，进行二次组间比特分配。

结合第一方面的第一种实现方式，在第一方面的第二种实现方式中，采用比特分配的饱和算法，进行二次组间比特分配包括：确定所述每个组的饱和比特数；根据所述饱和比特数与所述初始比特数，确定比特饱和组以及多余比特数，其中所述多余比特数是所述比特饱和组的初始比特数比所述饱和比特数多出的比特数；将所述多余比特数分配到比特不饱和组；其中所述比特饱和组是指其初始比特数多于饱和比特数的组，所述比特不饱和组是指其初始比特数少于饱和比特数的组。

结合第一方面的第二种实现方式，在第一方面的第三种实现方式中，将所述多余比特数分配到比特不饱和组包括：将所述多余比特数均匀地分配到比特不饱和组。

结合第一方面的第一种实现方式、第二种实施方式以及第三种实施方式，在第一方面的第四种实现方式中，在所述初始组间比特分配之后，且在所述二次组间比特分配之前，还包括：根据组内子带归一化因子的平均值的差值和/或码率确定是否采用比特分配的饱和算法，其中所述组内子带归一化因子的平均值是所述组内所有子带的子带归一化因子的平均值；若是，则确定采用比特分配的饱和算法，若否，则确定采用加权算法。

结合第一方面以及第一方面的第四种实现方式，在第一方面的第五种实现方式中，进行二次组间比特分配还可以包括：采用加权算法，进行二次组间比特分配。

结合第一方面的第五种实现方式，在第一方面的第六种实现方式中，采用加权算法，进行二次组间比特分配包括：加权所述每个组的组内子带归一化因子之和，得到每个组的加权的组内子带归一化因子之和；根据每个组的加权的组内子带归一化因子之和，对所述初始比特数进行二次组间比特分配。

结合第一方面及其上述实现方式，在第一方面的第七种实现方式中，将分配到所述组的音频信号的比特分配到所述组内的子带中包括：对所述子带归一化因子进行加权，以得到加权的子带归一化因子；根据所述加权的子带归一化因子，将分配到所述组的音频信号的比特分配到所述组内的部分或全部子带，其中所述部分子带从所述组内的所有子带中按所述加权的子带归一化因子从大到小选择的。

结合第一方面及其上述实现方式，在第一方面的第八种实现方式中，将所述多个子带划分为多个组包括：将具有相同带宽的子带划分为一个组，从而所述多个子带被划分为多个组；或者将子带归一化因子接近的子带分成一组，从而所述多个子带被划分为多个组。

结合第一方面的第八种实现方式，在第一方面的第九种实现方式中，每个组中的子带具有相同的带宽，或者具体接近的归一化因子。

第二方面，提供了一种音频信号的比特分配的装置，包括：子带量化单元，用于将音频信号的频带分为多个子带，量化每个子带的子带归一化因子；分组单元，用于将所述多个子带划分为多个组，获取每个组的组内子带归一化因子之和，其中所述组内子带归一化因子之和是所述组内所有子带的子带归一化因子的和；第一分配单元，用于根据所述每个组的组内子带归一化因子之和进行初始组间比特分配，以确定所述每个组的初始比特数；第二分配单元，用于基于所述每个组的初始比特数，进行二次组间比特分配，以将音频信号的编码比特分配到至少一个组，其中该至少一个组分配的比特之和为音频信号的编码比特；第三分配单元，用于将分配到所述组的音频信号的比特分配到所述组内的子带中。

结合第二方面，在第二方面的第一种实现方式中，第二分配单元具体用于：采用比特分配的饱和算法，进行二次组间比特分配。

结合第二方面的第一种实现方式，在第二方面的第二种实现方式中，第二分配单元包括：第一确定模块，用于确定所述每个组的饱和比特数；第二确定模块，用于根据所述饱和比特数与所述初始比特数，确定比特饱和组以及多余比特数，其中所述多余比特数是所述比特饱和组的初始比特数比所述饱和比特数多出的比特数；分配模块，用于将所述多余比特数分配到比特不饱和组；其中所述比特饱和组是指其初始比特数多于饱和比特数的组，所述比特不饱和组是指其初始比特数少于饱和比特数的组。

结合第二方面的第二种实现方式，在第二方面的第三种实现方式中，分配模块具体用于：将所述多余比特数均匀地分配到比特不饱和组。

结合第二方面的第一种实现方式、第二种实施方式以及第三种实施方式，在第二方面的第四种实现方式中，音频信号的比特分配的装置还包括：确定单元，用于在所述初始组间比特分配之后，且在所述二次组间比特分配之前，根据组内子带归一化因子的平均值的差值和/或码率确定是否采用比特分配的饱和算法，其中所述组内子带归一化因子的平均值是所述组内所有子带的子带归一化因子的平均值；若是，则确定采用比特分配的饱和算法，若否，则确定采用加权算法。

结合第二方面以及第二方面的第四种实现方式，在第二方面的第五种实现方式中，第二分配单元还用于：采用加权算法，进行二次组间比特分配。

结合第二方面的第五种实现方式，在第二方面的第六种实现方式中，第二分配单元还包括：加权模块，用于加权所述每个组的组内子带归一化因子之和，得到每个组的加权的组内子带归一化因子之和；所述分配模块，用于根据每个组的加权的组内子带归一化因子之和，对所述初始比特数进行二次组间比特分配。

结合第二方面及其上述实现方式，在第二方面的第七种实现方式中，第三分配单元包括：加权模块，用于对所述子带归一化因子进行加权，以得到加权的子带归一化因子；分配模块，用于根据所述加权的子带归一化因子，将分配到所述组的音频信号的比特分配到所述组内的部分或全部子带，其中所述部分子带从所述组内的所有子带中按所述加权的子带归一化因子从大到小选择的。

结合第二方面及其上述实现方式，在第二方面的第八种实现方式中，分组单元具体用于：将具有相同带宽的子带划分为一个组，从而所述多个子带被划分为多个组；或者将子带归一化因子接近的子带分成一组，从而所述多个子带被划分为多个组。

结合第二方面的第八种实现方式，在第二方面的第九种实现方式中，每个组中的子带具有相同的带宽，或者具体接近的子带归一化因子。

本发明实施例可以在中低比特率时，通过分组保证前后帧分配比较稳定，减少全局对局部不连续的影响。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是根据本发明实施例的音频信号的比特分配的方法的流程图。

图2是根据本发明实施例的音频信号的比特分配的装置的结构示意图。

图3是根据本发明实施例的音频信号的比特分配的装置中第二分配单元的结构示意图。

图4是根据本发明实施例的音频信号的比特分配的装置的另一结构示意图。

图5是根据本发明实施例的音频信号的比特分配的装置中第三分配单元的结构示意图。

图6是根据本发明实施例的音频信号的比特分配的装置的又一结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

编码技术方案和解码技术方案，广泛应用于各种电子设备中，例如：移动电话，无线装置，个人数据助理（PDA），手持式或便携式计算机，GPS接收机/导航器，照相机，音频/视频播放器，摄像机，录像机，监控设备等。通常，这类电子设备中包括音频编码器或音频解码器，音频编码器或者解码器可以直接由数字电路或芯片例如DSP（digital signalprocessor）实现，或者由软件代码驱动处理器执行软件代码中的流程而实现。

作为示例，在一种音频编码技术方案中，首先将音频时域信号变换为频域信号，再将编码比特分配给音频频域信号进行编码，将编码后的信号通过通信系统传输给解码端，解码端对编码后的信号解码恢复。

本发明根据分组的理论和信号的特点进行比特分配。首先对带进行分组，再根据每组的特点，对组内能量进行加权，根据加权后的能量对各组进行比特分配，再根据组内的信号特点将比特分配到每个带。因为先对整组进行分配，避免了分配不连续的现象，从而提升不同信号的编码质量。而在组内分配时又考虑了信号的特点，使得有限的比特能分配到影响感知的重要的音频带中。

图1是本发明一个实施例的音频信号的比特分配的方法的流程图。

101，将音频信号的频带分为多个子带，量化每个子带的子带归一化因子。

下面以MDCT变换为例进行描述。首先对输入的音频信号进行MDCT变换，得到频域系数。这里的MDCT变换可包括加窗、时域混叠和离散DCT变换几个过程。

例如对输入时域信号x(n)加正弦窗

h (n) = \sin [(n + \frac{1}{2}) \frac{π}{2 L}], n = 0, . . ., 2 L - 1

(1)L为信号的帧长

得到加窗后的信号为：

x_{w} (n) = \{\begin{matrix} h (n) x_{OLD} (n), & n = 0, . . ., L - 1 \\ h (n) x (n - L), & n = L, . . ., 2 L - 1 \end{matrix} - - - (2)

然后进行时域混叠操作：

\tilde{x} = [\begin{matrix} 0 & 0 & - J_{L / 2} & - I_{L / 2} \\ I_{L / 2} & - J_{L / 2} & 0 & 0 \end{matrix}] x_{w} - - - (3)

这里的I_L/2和J_L/2分别表示为阶数为L/2的对角矩阵：

对时域混叠信号做离散DCT变换，最终得到频域的MDCT系数：

y (k) = Σ_{n = 0}^{L - 1} \tilde{x} (n) \cos [(n + \frac{1}{2}) (k + \frac{1}{2}) \frac{π}{L}], k = 0, . . ., L - 1 - - - (5)

然后从MDCT系数中提取频域包络并量化。将整个频带分成一些不同频域分辨率的子带，提取每个子带的归一化因子，并量化子带归一化因子。

例如对于16kHz采样的音频信号，对应8kHz带宽的频带，如帧长为20ms，共有3200个频谱系数，则可以分为如下26个子带：

8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,

16,16,16,16,16,16,16,16,

24,24

首先分成几个组，然后组内再细化子带，每个子带的归一化因子可定义为：

Norm (p) = \sqrt{\frac{1}{L_{p}} Σ_{k = s_{p}}^{e_{p}} y {(k)}^{2}}, p = 0, . . . P - 1 - - - (6)

这里L_p是子带内的系数个数，s_p是子带的起始点，e_p是子带的结束点，P为总共的子带数。

得到归一化因子后，可以在对数域对其进行量化，得到量化后的子带归一化因子wnorm。

102，将上述多个子带划分为多个组，获取每个组的组内子带归一化因子之和，其中所述组内子带归一化因子之和是所述组内所有子带的子带归一化因子的和。

也就是，将全部子带划分为多个组，获取每个组的组参数，其中组参数可以是用于表征该组的信号特点和能量属性的组内子带归一化因子之和。

这里，考虑将特性和能量相似的子带分入一组。例如，可以将具有相同带宽的子带划分为一个组，优选地将相邻的具有相同带宽的子带划分为一个组。例如，可以将全部子带分为三组，则在低比特率时，只采用前一组或前二组，而不对剩余的组进行比特分配。

或者，可以根据子带的归一化能量norm之间的关系进行分组。也就是说，可以将子带归一化因子wnorm接近的子带分成一组。例如，可以利用以下方法判断子带的子带归一化因子是否接近：将子带的子带归一化因子wnorm[i]（i=1…P-1，P是总共的子带数）与预定阈值K进行比较。如果wnorm[i]大于预定阈值K，则记录下该子带序号i，最终将其子带归一化因子wnorm[i]大于预定阈值K的子带分为一组，其余的子带分为另一组。应理解，可以根据不同的需求设定多个预定阈值，从而得到更多个组。

可选地，还可以将相邻的子带归一化因子接近的子带分成一组。例如，可以利用以下方法判断相邻子带的子带归一化因子是否接近：先计算相邻子带的子带归一化因子的差值wnorm_diff[i]，其中wnorm_diff[i]＝abs(wnorm[i]–wnorm[i-1]),i=1…P-1。P是总共的子带数。如果wnorm_diff[i]小于预定阈值K’，表明相邻子带的子带归一化因子接近，从而确定能分成一组的相邻子带序号。

一旦完成子带分组，便可获取每个组的组参数，以表征组的能量属性。一般而言，组参数可以包括以下中的一个或多个：组内子带归一化因子之和group_wnorm、组内子带归一化因子的峰均比group_sharp。

具体而言，组内子带归一化因子之和group_wnorm是组内所有子带的子带归一化因子的和，即其中S_i是第i组中的开始子带，E_i是第i组中的结束子带。

组内子带归一化因子的平均值group_avg是组内所有子带的子带归一化因子的平均值，即其中group_wnorm[i]是第i组的组内子带归一化因子之和，S_i是第i组中的开始子带，E_i是第i组中的结束子带。

103，根据每个组的组内子带归一化因子之和进行初始组间比特分配，以确定每个组的初始比特数。

由于上述组参数表征了组的能量属性，从而可以根据组参数将音频信号的比特分配到每个组。这样，在比特率不足的情况下，利用分组的原理，考虑组的能量属性，使得音频信号的比特分配更加集中，也使得帧间比特分配更加连续。应理解，组参数不限于在此列举的几种，还可以是其他能够表征组的能量属性的参数。

一个实施例中，在比特率不足情况下，仅为部分组分配比特，例如对于组内子带归一化因子之和为零的组，其不会被分配到比特；又例如，当比特数很少时，也会存在不被分配到比特的组。也就是说，在获得以上组参数的基础上，可以仅根据每个组的组内子带归一化因子之和，为至少一个组分配编码比特，其中该至少一个组分配的比特之和为音频信号的比特。

依据每组group_wnorm[i]，得到初始的每组分配的比特数。最简单的方法，是按照各组的组内子带归一化因子与全部子带的归一化能量的比例分配比特数，即，第i组的初始比特数Bi=sum_bits*group_wnorm[i]/sum_norm，其中，sum_bits为总的待分比特数，sum_norm为全部子带的归一化能量。

104，基于每个组的初始比特数，进行二次组间比特分配，以将音频信号的编码比特分配到至少一个组，其中该至少一个组分配的比特之和为音频信号的编码比特。或者，其中该至少一个组分配的比特之和为音频信号的量化比特，所述量化比特为量化频谱系数的比特。

在确定每个组的初始比特数之后，可以进行二次组间比特分配。

例如，可以通过采用比特分配的饱和算法，进行二次组间比特分配。

首先确定所述每个组的饱和比特数，饱和比特数一般是经验值，比如每个频谱系数平均1至2个比特。此外，饱和比特数还可以和编码速率、信号特点有关。然后，根据所述饱和比特数与上述初始比特数，确定比特饱和组以及多余比特数，最后将所述多余比特数分配到比特不饱和组。例如，可以将所述多余比特数均匀地分配到比特不饱和组。这里，比特饱和组是指其初始比特数多于饱和比特数的组，比特不饱和组是指其初始比特数少于饱和比特数的组。多余比特数是指所述比特饱和组的初始比特数比该组的饱和比特数多出的比特数。

或者，例如，可以通过采用加权算法，进行二次组间比特分配。

也就是，通过调整组参数来优化将音频信号的比特分配到每个组的结果。比如，根据不同的分配需求，为不同组的组参数分配不同的权重，使得有限的比特数分配在恰当的组中，再在该组中分配，使得比特分配不再分散，这样将有利于音频信号的编码。

下面示例性地给出一种实施方式。例如，加权所述每个组的组内子带归一化因子之和，得到每个组的加权的组内子带归一化因子之和；然后，根据每个组的加权的组内子带归一化因子之和，对所述初始比特数进行二次组间比特分配。

下面示例性地给出另一种实施方式。例如，在获取每个组的组内子带归一化因子之和group_wnorm以及组内子带归一化因子的峰均比group_sharp之后，可以根据组内子带归一化因子的峰均比group_sharp，加权组内子带归一化因子之和group_wnorm，得到加权的组内子带归一化因子之和group_wnorm_w。

具体的，从低频到高频的组中，连续选取相邻的两个组，比如第一组和第二组。比较第一组的组内子带归一化因子的峰均比group_sharp[i]与第二组的组内子带归一化因子的峰均比group_sharp[i-1]。若第一组的组内子带归一化因子的峰均比相对第二组的组内子带归一化因子的峰均比大于第一阈值，即根据第一加权因子调整该第一组的组内子带归一化因子之和，根据第二加权因子调整所述第二组的组内子带归一化因子之和；若第二组的组内子带归一化因子的峰均比相对第一组的组内子带归一化因子的峰均比大于第二阈值，根据第一加权因子调整该第二组的组内子带归一化因子之和，根据第二加权因子调整所述第一组的组内子带归一化因子之和。

例如，如果group_sharp[i]-group_sharp[i-1]>a，则grou p_wnorm_w[i-1]=b*group_wnorm[i-1]，group_wnorm_w[i]=（b-1）*group_wnorm[i]。或者，如果group_sharp[i-1]-group_sharp[i]>c，则group_wnorm_w[i]=b*group_wnorm[i]，group_wnorm[i-1]=（b-1）*group_wnorm[i-1]。其中，组序号i=1…P-1。P是总共的子带数。b为权重，a为第一阈值，c为第二阈值。应理解，a、b和c的选取可以根据比特分配的需求进行。

这里，仅是示意性地说明了一种简单的加权方法。本领域技术人员应很容易想到其他的加权方法，以便通过不同的加权系数来调整子带的权重。例如，可以加大需要分配更多信号比特的子带的权重，而减小无需或需要分配较少信号比特的子带的权重。

接着，根据加权的组内子带归一化因子之和，将音频信号的比特分配到每个组。例如按照加权的组内子带归一化因子之和group_wnorm[i]与全部子带的子带归一化因子之和sum_wnorm比率，确定该组的组比特数，并将音频信号的比特按照确定的组比特数分配到该组。通过以下公式确定每组的总比特数group_bits：group_bits[i]=sum_bits*group_wnorm[i]/sum_wnorm，其中sum_bits为需要分配的音频信号的总比特数，sum_wnorm是所有子带的子带归一化因子之和。

可以进一步优化上述二次组间比特分配的过程，例如根据码率和/或组内子带归一化因子的平均值的差值来采取不同的二次组间比特分配方案，比如饱和算法或加权算法。

例如，根据组内子带归一化因子的平均值的差值和/或码率确定是采用比特分配的饱和算法还是加权算法，其中所述组内子带归一化因子的平均值是所述组内所有子带的子带归一化因子的平均值。

在比特被分入各个组之后，可以进一步将每个组分到的比特再分入组内的各个子带中。

105，将分配到所述组的音频信号的比特分配到所述组内的子带中。

应理解，可以采用现有的迭代循环分配方法对组内的子带进行比特分配。但是，迭代循环分配方法仍会使得组内的比特分配结果很随机，前后帧不连续。因此，可以结合不同音频信号的信号特点，即不同的信号类型，依据该组内的各个子带的子带归一化因子，将分配到该组的音频信号的比特分配到组内的子带中。

其中一种实施方式是，对所述子带归一化因子进行加权，以得到加权的子带归一化因子；根据所述加权的子带归一化因子，将分配到所述组的音频信号的比特分配到所述组内的部分或全部子带，其中所述部分子带从所述组内的所有子带中按所述加权的子带归一化因子从大到小选择的。

根据所述加权的子带归一化因子将分配到所述组的音频信号的比特分配到所述组内的全部子带的一种典型的实施方式是，在确定全部子带的加权的子带归一化因子之后，计算得到该组内的全部子带的加权的子带归一化因子的和，然后根据需要分配比特的子带的加权的子带归一化因子与全部子带的加权的子带归一化因子的和的比值，将分配到该组的比特分别到具体的子带。

根据所述加权的子带归一化因子将分配到所述组的音频信号的比特分配到所述组内的部分子带的一种典型的实施方式是，将组内的各个子带的加权的子带归一化因子进行排序，例如从大到小的排序；根据加权的子带归一化因子的排序，选取排序靠前的加权的子带归一化因子所对应的部分子带；将分配到组的音频信号的比特分配到组内的上述部分子带。

例如，首先确定组内各个子带的子带归一化因子wnorm的加权参数factor[0]和factor[1]，将组内各个子带的子带归一化因子wnorm进行排序得到wnorm_index[i]，利用加权参数对wnorm_index[i]进行加权，最后根据加权后的wnorm_index[i]对组内的各个子带进行比特分配。

由上可知，根据本发明实施例的音频信号的比特分配的方法可以通过分组保证前后帧分配比较稳定，减少全局对局部不连续的影响；通过二次分配，有效利用饱和子带的多余比特，使得比特分配更加合理。

以下将在具体实施例中结合程序语言，详细描述如何根据码率和/或组内子带归一化因子的平均值的差值来采取不同的二次组间比特分配方案，进而如何进行组内的各个子带的比特分配。

首先，将音频信号的多个子带划分为多个组，依据每组子带归一化因子之和group_wnorm[i]，得到初始的每组分配的比特数。例如，所有子带被分成三组，

第一组的初始比特数B1=sum_bits*group_wnorm[0]/sum_norm，

第二组的初始比特数B2=sum_bits*group_wnorm[1]/sum_norm，

第三组的初始比特数B3=sum_bits*group_wnorm[2]/sum_norm，

其中，sum_bits为总的待分比特数，因此B3=sum_bits-B1-B2，从而sum_norm=group_wnorm[0]+group_wnorm[1]+group_wnorm[2]。

然后，依据码率（bit_rate）和组内子带归一化因子的平均值的差值（avg_diff）来采取不同的二次组间比特分配方案。

步骤1：计算组内子带归一化因子的平均值的差值

avg_diff[0]=group_avg[0]-group_avg[1];

avg_diff[1]=group_avg[1]-group_avg[2];

步骤2：选择二次组间比特分配方案，比如根据组内子带归一化因子的平均值的差值以及码率两个条件，确定是采用比特分配的饱和算法还是加权算法。

这里的a，b，c为经验因子。

步骤3：后处理算法：如果最高子带的group_wnorm[2]小于一定值时，将此组所分的比特分配给低子带的组。例如，当group_wnorm[2]小于阈值d，则将最高子带分配的比特分配给第二高的子带，并将最高子带所分配的比特数置零。

对于饱和算法：原则是当一个组中分到的比特趋于饱和时，则将多余的比特分给其它的组，例如：

1）首先设置每个组的饱和比特数分别为，B1_UP、B2_UP、B3_UP；

2）计算多余的比特：

这里的B1_UP、B2_UP、B3_UP为经验因子，可以分别为288、256、96。

3）将多余的比特再次分配。例如，当第一组分配的比特达到饱和时，就将B_saved平均分配给其他组，如第一组分配的比特没饱和时，就将B_saved的一半先累加到B1上；然后判断第二组分配的比特是否饱和，如第一组分配的比特没饱和，则将B2重新赋值为sum_bits–B1–B3，否则将B3重新赋值为sum_bits–B1–B2，算法的伪代码如下：

对于加权算法：

B1’=a1*B1，

B2’=a2*B2，

B3’=sum_bits-B1’-B2’，

这里，sum_bits为总的比特数，

sum_norm=group_wnorm[0]+group_wnorm[1]+group_wnorm[2]

其中，a1和a2为加权系数，例如这里可以设置a1=1.0、a2=0.92。

最后，将分配到各个组的比特通过以下方法分配到组内的各个子带。

步骤1：确定每组内的子带的子带归一化因子wnorm的加权参数factor[]，例如factor[0]=FAC1，factor[1]=FAC2；

其中，FAC1、FAC2为经验因子，可以分别为2.0、1.5或者2.0、3.0等等。

步骤2：对组内的全部子带归一化因子wnorm按照由大到小的顺序进行排序，以得到wnorm_index(i)。

步骤3：根据加权参数factor[]对排序后的wnorm_index(i)的值进行如下加权处理：

wnorm_index(i)=wnorm_index(i)*(α-β*i),0≤i<band_num

这里，band_num是该组内所包含的子带的个数，α和β可以根据条件进行设置，例如可以根据不同的组来设置不同的值，如果是第一组的低频成分则可设置α=factor[0]，如果高于第一组则可设置α=factor[1]，

β = \frac{1}{band_num} .

步骤4：根据排序后的wnorm_index(i)的值，将分配到组内的比特再分配到组内的子带中。

步骤4.1，用组内总的比特数Bx除以阀值Thr，得到组内初始分配的子带数BitBand_num。

步骤4.2，根据组内初始分配的子带数BitBand_num和组内总子带数sumBand_num的关系，确定比特分配的子带数N。例如，如果BitBand_num大于k*sumBand_num，这里k是系数，比如0.75、0.8等，则N等于sumBand_num；否则N等于BitBand_num。

步骤4.3，选取排在前面的N个子带，其中N为组内进行比特分配的子带数。

步骤4.4，初始化所述N个子带的比特数为1，并初始化循环次数j为0。

步骤4.5，确定所述N个子带中其子带归一化因子大于零的子带的子带归一化因子总和band_wnorm。

步骤4.6，为所述N个子带中其子带归一化因子大于零的子带分配比特数：

band_bits[i]=Bx*wnorm_index(i)/band_wnorm；

这里，Bx是分到每组的比特数，例如在上面的实施例中，3个组的比特数分别为B1、B2和B3。

步骤4.7，判断N个子带中最后的子带所分配的比特数是否小于固定阈值fac，如果小于固定阈值fac，则将这个子带分配的比特数置零；如果大于等于fac，则直接跳到步骤4.9；否则跳到步骤4.8。

步骤4.8，将所述循环次数j加1；

循环步骤4.5至步骤4.8，直到循环次数j等于N。

步骤4.9，对所述组内的全部子带恢复最初原始的排序，即恢复到量化每个子带的子带归一化因子之前全部子带的排序。

可以理解，本发明实施例中进行组内比特分配的方法不限于以上由步骤4.1至4.9描述的示例。

经过本发明实施例的分组方式保证了前后帧分配比较稳定，并且根据信号特点对组内进行不同侧重的比特分配，使得分配的比特都用于量化重要频谱信息上，从而能够提升音频信号的编码质量。

由上可知，根据本发明实施例的音频信号的比特分配的方法可以通过分组保证前后帧分配比较稳定，减少全局对局部不连续的影响。此外，每个组内的比特分配可以设不同的阈值参数，从而更加自适应地分配比特，并且根据频谱信号特点对组内进行不同侧重的比特分配，例如对于频谱较集中的类谐波信号重点分配在能量大的子带，谐波间的子带无需分配更多比特，而对于频谱较为平缓的信号，比特分配则尽量保证子带间平滑，这样会使得分配的比特都用于量化重要的频谱信息上。

以下将结合图2，描述根据本发明实施例的音频信号的比特分配的装置的示意结构。

在图2中，音频信号的比特分配的装置20包括子带量化单元21、分组单元22、第一分配单元23、第二分配单元24和第三分配单元25。其中：

子带量化单元21用于将音频信号的频带分为多个子带，量化每个子带的子带归一化因子。

分组单元22用于将所述多个子带划分为多个组，获取每个组的组内子带归一化因子之和，其中所述组内子带归一化因子之和是所述组内所有子带的子带归一化因子的和。

可选地，分组单元22具体用于将具有相同带宽的子带划分为一个组，从而所述多个子带被划分为多个组；或者将子带归一化因子接近的子带分成一组，从而所述多个子带被划分为多个组。优选地，每个组中的子带具有相同的带宽，或者具体接近的子带归一化因子。

第一分配单元23用于根据所述每个组的组内子带归一化因子之和进行初始组间比特分配，以确定所述每个组的初始比特数。

第二分配单元24用于基于所述每个组的初始比特数，进行二次组间比特分配，以将音频信号的编码比特分配到至少一个组，其中该至少一个组分配的比特之和为音频信号的编码比特。

可选地，具体而言，第二分配单元24可以用于采用比特分配的饱和算法，进行二次组间比特分配。例如，如图3所示，第二分配单元24可以包括第一确定模块241、第二确定模块242和分配模块243。其中：

第一确定模块241用于确定所述每个组的饱和比特数；

第二确定模块242用于根据所述饱和比特数与所述初始比特数，确定比特饱和组以及多余比特数，其中所述多余比特数是所述比特饱和组的初始比特数比所述饱和比特数多出的比特数；

分配模块243用于将所述多余比特数分配到比特不饱和组；其中所述比特饱和组是指其初始比特数多于饱和比特数的组，所述比特不饱和组是指其初始比特数少于饱和比特数的组。可选地，分配模块243可以用于将所述多余比特数均匀地分配到比特不饱和组。

或者，可选地，具体而言，第二分配单元也可以用于采用加权算法，进行二次组间比特分配。例如，第二分配单元24还可以包括加权模块244和分配模块243。其中：

加权模块244用于加权所述每个组的组内子带归一化因子之和，得到每个组的加权的组内子带归一化因子之和；

分配模块243用于根据每个组的加权的组内子带归一化因子之和，对所述初始比特数进行二次组间比特分配。

由此可见，音频信号的比特分配的装置20还可以包括确定单元26，其用于在所述初始组间比特分配之后，且在所述二次组间比特分配之前，根据组内子带归一化因子的平均值的差值和/或码率确定是否采用比特分配的饱和算法，其中所述组内子带归一化因子的平均值是所述组内所有子带的子带归一化因子的平均值。若采用比特分配的饱和算法，则确定单元26确定采用比特分配的饱和算法，否则确定采用加权算法。如图4所示。

第三分配单元25用于将分配到所述组的音频信号的比特分配到所述组内的子带中。

例如，如图5所示，第三分配单元25可以包括加权模块251和分配模块252。其中：

加权模块251用于对所述子带归一化因子进行加权，以得到加权的子带归一化因子；

分配模块252用于根据所述加权的子带归一化因子，将分配到所述组的音频信号的比特分配到所述组内的部分或全部子带，其中所述部分子带从所述组内的所有子带中按所述加权的子带归一化因子从大到小选择的。

由上可知，根据本发明实施例的音频信号的比特分配的装置可以通过分组保证前后帧分配比较稳定，减少全局对局部不连续的影响。从而，经过本发明实施例的分组方式保证了前后帧分配比较稳定，并且根据信号特点对组内进行不同侧重的比特分配，使得分配的比特都用于量化重要频谱信息上，从而能够提升音频信号的编码质量。

另外，在图6中，本发明的实施例还提供了另外一种音频信号的比特分配的装置60，该装置包括存储器61和处理器62，其中该存储器61用于存储实现上述方法实施例中各步骤的代码，所述处理器62用于处理所述存储器中存储的代码。

由此可见，根据本发明实施例的音频信号的比特分配的装置可以通过分组保证前后帧分配比较稳定，减少全局对局部不连续的影响。此外，每个组内的比特分配可以设不同的阈值参数，从而更加自适应地分配比特，并且根据频谱信号特点对组内进行不同侧重的比特分配，例如对于频谱较集中的类谐波信号重点分配在能量大的子带，谐波间的子带无需分配更多比特，而对于频谱较为平缓的信号，比特分配则尽量保证子带间平滑，这样会使得分配的比特都用于量化重要的频谱信息上。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器（ROM，Read-Only Memory）、随机存取存储器（RAM，Random Access Memory）、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应所述以权利要求的保护范围为准。

Claims

1.一种音频信号的比特分配的方法，其特征在于，包括：

将音频信号的频带分为多个子带，量化每个子带的子带归一化因子；

将所述多个子带划分为多个组，获取每个组的组内子带归一化因子之和，其中所述组内子带归一化因子之和是所述组内所有子带的子带归一化因子的和；

根据所述每个组的组内子带归一化因子之和进行初始组间比特分配，以确定所述每个组的初始比特数；

基于所述每个组的初始比特数，进行二次组间比特分配，以将音频信号的编码比特分配到至少一个组，其中该至少一个组分配的比特之和为音频信号的编码比特；

将分配到所述组的音频信号的比特分配到所述组内的子带中。

2.根据权利要求1所述的方法，其特征在于，所述进行二次组间比特分配包括：

采用比特分配的饱和算法，进行二次组间比特分配。

3.根据权利要求2所述的方法，其特征在于，所述采用比特分配的饱和算法，进行二次组间比特分配包括：

确定所述每个组的饱和比特数；

根据所述饱和比特数与所述初始比特数，确定比特饱和组以及多余比特数，其中所述多余比特数是所述比特饱和组的初始比特数比所述饱和比特数多出的比特数；

将所述多余比特数分配到比特不饱和组；

其中所述比特饱和组是指其初始比特数多于饱和比特数的组，所述比特不饱和组是指其初始比特数少于饱和比特数的组。

4.根据权利要求3所述的方法，其特征在于，所述将所述多余比特数分配到比特不饱和组包括：

将所述多余比特数均匀地分配到比特不饱和组。

5.根据权利要求1所述的方法，其特征在于，在所述初始组间比特分配之后，且在所述二次组间比特分配之前，还包括：

根据所述组内子带归一化因子的平均值的差值和/或码率确定是否采用比特分配的饱和算法，其中所述组内子带归一化因子的平均值是所述组内所有子带的子带归一化因子的平均值；

若是，则确定采用比特分配的饱和算法，

若否，则确定采用加权算法。

6.根据权利要求1所述的方法，其特征在于，所述进行二次组间比特分配包括：

采用加权算法，进行二次组间比特分配。

7.根据权利要求6所述的方法，其特征在于，所述采用加权算法，进行二次组间比特分配包括：

加权所述每个组的组内子带归一化因子之和，得到每个组的加权的组内子带归一化因子之和；

根据每个组的加权的组内子带归一化因子之和，对所述初始比特数进行二次组间比特分配。

8.根据权利要求1至7中任一项所述的方法，其特征在于，所述将分配到所述组的音频信号的比特分配到所述组内的子带中包括：

对所述子带归一化因子进行加权，以得到加权的子带归一化因子；

根据所述加权的子带归一化因子，将分配到所述组的音频信号的比特分配到所述组内的部分或全部子带，其中所述部分子带从所述组内的所有子带中按所述加权的子带归一化因子从大到小选择的。

9.根据权利要求1所述的方法，其特征在于，所述将所述多个子带划分为多个组包括：

将具有相同带宽的子带划分为一个组，从而所述多个子带被划分为多个组；或者

将子带归一化因子接近的子带分成一组，从而所述多个子带被划分为多个组。

10.根据权利要求9所述的方法，其特征在于，所述每个组中的子带具有相同的带宽，或者具体接近的子带归一化因子。

11.一种音频信号的比特分配的装置，其特征在于，包括：

子带量化单元，用于将音频信号的频带分为多个子带，量化每个子带的子带归一化因子；

分组单元，用于将所述多个子带划分为多个组，获取每个组的组内子带归一化因子之和，其中所述组内子带归一化因子之和是所述组内所有子带的子带归一化因子的和；

第一分配单元，用于根据所述每个组的组内子带归一化因子之和进行初始组间比特分配，以确定所述每个组的初始比特数；

第二分配单元，用于基于所述每个组的初始比特数，进行二次组间比特分配，以将音频信号的编码比特分配到至少一个组，其中该至少一个组分配的比特之和为音频信号的编码比特；

第三分配单元，用于将分配到所述组的音频信号的比特分配到所述组内的子带中。

12.根据权利要求11所述的装置，其特征在于，所述第二分配单元具体用于：

采用比特分配的饱和算法，进行二次组间比特分配。

13.根据权利要求12所述的装置，其特征在于，所述第二分配单元包括：

第一确定模块，用于确定所述每个组的饱和比特数；

第二确定模块，用于根据所述饱和比特数与所述初始比特数，确定比特饱和组以及多余比特数，其中所述多余比特数是所述比特饱和组的初始比特数比所述饱和比特数多出的比特数；

分配模块，用于将所述多余比特数分配到比特不饱和组；

14.根据权利要求13所述的装置，其特征在于，所述分配模块具体用于：

将所述多余比特数均匀地分配到比特不饱和组。

15.根据权利要求11所述的装置，其特征在于，还包括：确定单元，用于在所述初始组间比特分配之后，且在所述二次组间比特分配之前，根据组内子带归一化因子的平均值的差值和/或码率确定是否采用比特分配的饱和算法，其中所述组内子带归一化因子的平均值是所述组内所有子带的子带归一化因子的平均值；

若是，则确定采用比特分配的饱和算法，

若否，则确定采用加权算法。

16.根据权利要求11所述的装置，其特征在于，所述第二分配单元还用于：

采用加权算法，进行二次组间比特分配。

17.根据权利要求16所述的装置，其特征在于，所述第二分配单元还包括：加权模块，用于加权所述每个组的组内子带归一化因子之和，得到每个组的加权的组内子带归一化因子之和；

所述分配模块，用于根据每个组的加权的组内子带归一化因子之和，对所述初始比特数进行二次组间比特分配。

18.根据权利要求11至17中任一项所述的装置，其特征在于，所述第三分配单元包括：

加权模块，用于对所述子带归一化因子进行加权，以得到加权的子带归一化因子；

分配模块，用于根据所述加权的子带归一化因子，将分配到所述组的音频信号的比特分配到所述组内的部分或全部子带，其中所述部分子带从所述组内的所有子带中按所述加权的子带归一化因子从大到小选择的。

19.根据权利要求11所述的装置，其特征在于，所述分组单元具体用于：

20.根据权利要求19所述的装置，其特征在于，所述每个组中的子带具有相同的带宽，或者具体接近的子带归一化因子。