CN101521014B - 音频带宽扩展编解码装置 - Google Patents
音频带宽扩展编解码装置 Download PDFInfo
- Publication number
- CN101521014B CN101521014B CN2009100614411A CN200910061441A CN101521014B CN 101521014 B CN101521014 B CN 101521014B CN 2009100614411 A CN2009100614411 A CN 2009100614411A CN 200910061441 A CN200910061441 A CN 200910061441A CN 101521014 B CN101521014 B CN 101521014B
- Authority
- CN
- China
- Prior art keywords
- frequency
- low
- module
- spectrum envelope
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000001228 spectrum Methods 0.000 claims abstract description 131
- 238000004364 calculation method Methods 0.000 claims abstract description 45
- 238000004458 analytical method Methods 0.000 claims abstract description 40
- 238000013139 quantization Methods 0.000 claims abstract description 29
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 23
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 23
- 230000005236 sound signal Effects 0.000 claims abstract description 12
- 230000005284 excitation Effects 0.000 claims description 19
- 239000000284 extract Substances 0.000 claims description 7
- 230000005540 biological transmission Effects 0.000 claims description 5
- 238000001914 filtration Methods 0.000 claims description 2
- 238000011002 quantification Methods 0.000 claims 3
- 238000000605 extraction Methods 0.000 claims 2
- 238000000034 method Methods 0.000 description 16
- 230000008447 perception Effects 0.000 description 12
- 230000006870 function Effects 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000003595 spectral effect Effects 0.000 description 4
- 238000005192 partition Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明提供了音频带宽扩展编解码装置,能够用较少的码率对高频信号进行重建,以提高输出音频信号质量。音频带宽扩展编码装置包括分频模块、核心编码器模块、线性预测分析模块、频谱包络量化模块、高低频相关性计算模块和增益计算模块;音频带宽扩展解码装置包括核心解码器模块、高频谱包络重建模块、高频残差重构模块、高频增益调整模块、高频信号合成模块和宽带信号重建模块。
Description
技术领域
本发明属于音频技术领域,特别是涉及音频带宽扩展编解码装置。
背景技术
对人类听觉系统的研究表明,人耳对于低频信号(300-3400Hz)敏感度较高,所能容忍的量化误差较小,而对于高频信号的敏感度则较低,可容忍的量化误差较大。该特性被广泛的应用于音频压缩技术中。由于网络带宽受限,传输的码率不能太高,因此不能全频带编码;为了避免信号频谱的混叠,在对模拟信号采样量化得到数字信号的过程中,只能保留原信号中低于采样频率一半的低频成分。根据人耳听觉系统的特性,在有限码率的情况下,音频编码器会将可用比特分配给低频部分而忽略高频部分。因此,目前的数字音频存储技术不可避免地存在高频信号丧失的现象。而失去高频成分会使声音听起来沉闷,不明亮,采用一种低码率且能恢复高频成分的技术十分必要。现有带宽扩展技术没有充分考虑和利用到人耳感知特性这种非线性的感知特点,没有充分考虑和利用到高低频之间的相关性。
发明内容
本发明目的在于针对现有技术的不足,提供音频带宽扩展编解码装置,数字音频解码时能够利用较低的码率恢复原始音频信号在进行数字编码过程中所失去的高频成分,从而提高声音播放的品质。
本发明提供的音频带宽扩展编码装置,包含以下部分:
分频模块,用于将输入的宽带信号分频成高频信号和低频信号;
核心编码器模块,用于根据分频模块所得低频信号得到低频参数,并得到音频类型参数、低频谱包络参数和低频残差;
线性预测分析模块,用于对分频模块所得高频信号线性预测分析,得到高频谱包络参数和高频残差;
高频谱包络量化模块,用于根据线性预测分析模块所得高频谱包络参数、核心编码器模块所得音频类型参数和低频谱包络参数,得到量化后高频谱包络参数和高频谱包络索引;
高低频相关性计算模块,用于根据核心编码器模块所得低频残差和线性预测分析模块所得高频残差,得到高低频相关性参数;
增益计算模块,用于根据核心编码器模块所得低频残差、高频谱包络量化模块所得量化后高频谱包络参数和高低频相关性计算模块所得高低频相关性参数,得到高频重建信号,然后根据高频重建信号和分频模块所得高频信号得到高频增益参数;
其中,分频模块输出的低频信号输入到核心编码器模块,分频模块输出的高频信号输入到线性预测分析模块;核心编码器输出的音频类型参数和低频谱包络参数,以及线性预测分析模块输出的高频谱包络参数输入到高频谱包络量化模块;核心编码器模块输出的低频残差和线性预测分析模块输出的高频残差输入到高低频相关性计算模块中;核心编码器模块输出的低频残差和高低频相关性计算模块输出的高低频相关性参数,以及高频谱包络量化模块输出的量化后高频谱包络参数输入到增益计算模块中;核心编码器模块输出的低频残差放入低频码流中,增益计算模块输出的高频增益参数、高低频相关性计算模块输出的高低频相关性参数以及线性预测分析模块输出的高频谱包络索引放入高频码流中,以供传输。
而且,所述高频谱包络量化模块,实现由音频类型参数和低频谱包络参数找到对应的高频子码本,由高频谱包络参数通过高频子码本得到量化后高频谱包络参数和高频谱包络索引。
而且,所述高低频相关性计算模块,实现将低频残差变换到频域得到频域低频残差,再根据人耳感知特性将频域低频残差划分成若干个非均匀的低频子带;将高频残差变化到频域得到频域高频残差,再根据人耳感知特性将频域高频残差划分成若干个非均匀的高频子带;对高频子带和低频子带计算相关性,得到高低频相关性参数。
而且,所述增益计算模块,根据高低频相关性参数,将和高频子带相关性最大的低频子带扩展复制到高频部分,得到重构高频残差;将重构高频残差根据量化后高频谱包络参数进行合成滤波,得到高频重建信号;将高频重建信号和高频信号根据人耳感知特性划分为若干非均匀的子带,计算高频增益参数。
本发明提供的音频带宽扩展解码装置,包含以下部分:
核心解码器模块,用于从低频码流中提取低频参数,得到合成低频信号,并得到音频类型参数、低频谱包络参数和低频残差;
高频谱包络重建模块,用于从高频码流中提取高频谱包络索引,并根据核心解码器模块所得音频类型参数和低频谱包络参数,得到量化后高频谱包络参数;
高频残差重构模块,用于从高频码流中提取得到高低频相关性参数,根据高低频相关性参数和核心解码器模块所得低频残差得到高频残差;
高频增益调整模块,用于从高频码流中提取得到高频增益,由高频增益和高频残差重构模块所得高频残差得到高频激励信号;
高频信号合成模块,用于由高频谱包络重建模块所得量化后高频谱包络参数和高频残差重构模块所得高频激励信号得到合成高频信号;
宽带信号重建模块,用于根据高频信号合成模块所得合成高频信号和核心解码器模块所得合成低频信号,得到重建宽带音频信号并输出;
核心解码器模块输出的音频类型参数和低频谱包络参数,以及高频码流中的高频谱包络索引输入到高频谱包络重建模块;高频码流中的高低频相关性参数和核心解码器模块输出的低频残差输入到高频残差重构模块;高频残差重构模块输出的高频残差,高频码流中的高频增益输入到高频增益调增模块;高频增益调增模块输出的高频激励信号和高频谱包络重建模块输出的量化后高频谱包络参数输入到高频信号合成模块;高频信号合成模块输出的合成高频信号和核心解码器模块输出的合成低频信号输入到宽带信号重建模块,宽带信号重建模块输出重建宽带音频信号。
而且,所述高频谱包络重建模块,实现根据音频类型参数选取相应的低频谱包络参数码本,根据低频谱包络参数,找到相应的高频谱包络参数的子码本;根据高频谱包络索引,从高频谱包络参数的子码本中找到量化后高频谱包络参数。
而且,所述高频残差重构模块,实现根据高低频相关性参数,将和高频子带相关性最大的低频子带扩展并复制到高频,得到重构的高频残差。
而且,所述高频增益调整模块,实现将高频残差划分为若干个非均匀的子带,根据高频码流中提取的高频增益分别对各个子带调整得到高频激励信号。
本发明提供了一种音频带宽扩展方案,包括编码端装置和解码端装置。通过在编码端将低频残差放入低频码流中,将高频增益参数、高低频相关性参数以及高频谱包络索引放入高频码流中;解码端装置能够用较少的码率对高频信号进行重建,从而提高了输出音频信号质量。本发明利用高低频相关性信息,以较低的码率取得高质量的输出音频效果;并且能够通过非均匀划分子带的方式,引入人耳感知特性,进一步提高音频解码质量。
附图说明
图1为本发明编码装置的结构框图;
图2为本发明解码装置的结构框图;
图3为低高频非均匀子带划分方式示意图;
图4为码本索引图。
具体实施方式
参见图1,本发明提供的带宽扩展技术方案包括一种音频带宽扩展编码装置,包含以下部分:
分频模块,用于将输入的宽带信号分频成高频信号和低频信号;
核心编码器模块,用于根据分频模块所得低频信号得到低频参数,并得到音频类型参数、低频谱包络参数和低频残差;
线性预测分析模块,用于对分频模块所得高频信号线性预测分析,得到高频谱包络参数和高频残差;
高频谱包络量化模块,用于根据线性预测分析模块所得高频谱包络参数、核心编码器模块所得音频类型参数和低频谱包络参数,得到量化后高频谱包络参数和高频谱包络索引;
高低频相关性计算模块,用于根据核心编码器模块所得低频残差和线性预测分析模块所得高频残差,得到高低频相关性参数;
增益计算模块,用于根据核心编码器模块所得低频残差、高频谱包络量化模块所得量化后高频谱包络参数和高低频相关性计算模块所得高低频相关性参数,得到高频重建信号,然后根据高频重建信号和分频模块所得高频信号得到高频增益参数;
其中,分频模块输出的低频信号输入到核心编码器模块,分频模块输出的高频信号输入到线性预测分析模块;核心编码器输出的音频类型参数和低频谱包络参数,以及线性预测分析模块输出的高频谱包络参数输入到高频谱包络量化模块;核心编码器模块输出的低频残差和线性预测分析模块输出的高频残差输入到高低频相关性计算模块中;核心编码器模块输出的低频残差和高低频相关性计算模块输出的高低频相关性参数,以及高频谱包络量化模块输出的量化后高频谱包络参数输入到增益计算模块中;核心编码器模块输出的低频残差放入低频码流中,增益计算模块输出的高频增益参数、高低频相关性计算模块输出的高低频相关性参数以及线性预测分析模块输出的高频谱包络索引放入高频码流中,以供传输。
具体实施时,音频带宽扩展编码装置编码工作流程如下。除了以硬件方式提供音频带宽扩展编码装置,采用软件方式通过计算机实现以下流程属于等同替换方案,也应当在本发明要求保护范围内。
编码工作流程包括以下步骤:
步骤1,输入的宽带音频信号由分频模块得到高频信号和低频信号。
步骤2,由步骤1中分频模块得到的低频信号通过核心编码器模块进行编码,得到低频参数且写入低频码流,并得到音频类型参数、低频谱包络参数和低频残差。在步骤2中,如果低频参数中包含音频类型参数、低频谱包络参数和低频残差,则可从低频参数中提取音频类型参数、低频谱包络参数和低频残差。如果低频参数中不包含音频类型参数或低频谱包络参数或低频残差,则可由低频参数得到低频重建信号,对低频重建信号进行音频类型判断得到音频类型参数,对不同类型的低频重建信号进行线性预测分析得到低频谱包络参数和低频残差。
步骤3,由步骤1中分频模块所得的高频信号通过线性预测分析模块,得到高频谱包络参数和高频残差。
步骤4,由步骤3中线性预测分析模块得到的高频谱包络参数、步骤2中核心编码器模块所得的音频类型参数和低频谱包络参数通过高频谱包络量化模块,得到量化后高频谱包络参数和高频谱包络索引。
步骤5,由步骤2中核心编码器模块得到的低频残差和步骤3中线性预测分析模块得到的高频残差通过高低频相关性计算模块,得到高低频相关性参数。
步骤6,由增益计算模块根据步骤2中核心编码器模块所得低频残差、步骤4中高频谱包络量化模块所得量化后高频谱包络参数和步骤5中高低频相关性计算模块所得高低频相关性参数,得到高频重建信号;由高频重建信号和步骤1分频模块所得的高频信号,得到高频增益参数。
步骤7,将步骤4中高频谱包络量化模块得到的高频谱包络索引、步骤5中高低频相关性计算模块得到的高低频相关性参数、步骤6中增益计算模块得到的高频增益参数写入高频码流。
本发明还提供了进一步方案:
所述高频谱包络量化模块,实现由音频类型参数和低频谱包络参数找到对应的高频子码本,由高频谱包络参数通过高频子码本得到量化后高频谱包络参数和高频谱包络索引。相应的流程就是,在步骤4中,由步骤2中核心编码器模块所得音频类型参数和低频谱包络参数找到对应的高频子码本,由步骤3中线性预测分析模块所得的高频谱包络参数通过高频子码本得到量化后高频谱包络参数和高频谱包络索引。
所述高低频相关性计算模块,实现将低频残差变换到频域得到频域低频残差,再根据人耳感知特性将频域低频残差划分成若干个非均匀的低频子带;将高频残差变化到频域得到频域高频残差,再根据人耳感知特性将频域高频残差划分成若干个非均匀的高频子带;对高频子带和低频子带计算相关性,得到高低频相关性参数。根据人耳感知特性,对不同的频率感知重要性不同,对低频信号的感知更为敏感,具体实施时可以粗略地划分信号的高频部分,而更精细地划分信号的低频部分。因此采用非均匀划分方式要优于均匀划分方式。相应的流程就是,在步骤5中,将步骤2中核心编码器模块得到的低频残差变换到频域,得到频域低频残差,再根据人耳感知特性将频域低频残差划分成若干个非均匀的低频子带;将步骤3中线性预测分析模块得到的高频残差变化到频域,得到频域高频残差,再根据人耳感知特性将频域高频残差划分成若干个非均匀的高频子带。最后将高频子带和低频子带计算相关性,得到高低频相关性参数。低高频非均匀子带划分方式参见图3,频域低频残差划分成被划分成非均匀的低频子带1、低频子带2、低频子带3、低频子带4、低频子带5…;频域高频残差被划分成非均匀的高频子带1、高频子带2、高频子带3…
所述增益计算模块,根据高低频相关性参数,将和高频子带相关性最大的低频子带扩展复制到高频部分,得到重构高频残差;将重构高频残差根据量化后高频谱包络参数进行合成滤波,得到高频重建信号;将高频重建信号和高频信号根据人耳感知特性划分为若干非均匀的子带,计算高频增益参数。相应的流程就是,在步骤6中,根据步骤5中相关性计算模块所得高低频相关性参数,将和高频子带相关性最大的低频子带扩展复制到高频部分,得到重构高频残差;将重构高频残差由步骤4中高频谱包络量化模块所得量化后高频谱包络参数得到高频重建信号;将高频重建信号和步骤1中分频模块所得高频信号根据人耳感知特性划分为若干非均匀的子带计算增益。
具体实施时,高频谱包络量化模块、高低频相关性计算模块、增益计算模块也可以采用其它方式实现功能。例如当编码端将量化后高频谱包络参数直接写入码流中传输,解码器可以直接从码流中提取量化后高频谱包络参数而无需按码本检索;高低频相关性计算模块和增益计算模块也可采用均匀子带划分规则划分子带,划分所得子带数目根据划分规则而定。
参见图2,本发明提供的带宽扩展技术方案包括一种与音频带宽扩展编码装置相应的音频带宽扩展解码装置,包含以下部分:
核心解码器模块,用于从低频码流中提取低频参数,得到合成低频信号,并得到音频类型参数、低频谱包络参数和低频残差;
高频谱包络重建模块,用于从高频码流中提取高频谱包络索引,并根据核心解码器模块所得音频类型参数和低频谱包络参数,得到量化后高频谱包络参数;
高频残差重构模块,用于从高频码流中提取得到高低频相关性参数,根据高低频相关性参数和核心解码器模块所得低频残差得到高频残差;
高频增益调整模块,用于从高频码流中提取得到高频增益,由高频增益和高频残差重构模块所得高频残差得到高频激励信号;
高频信号合成模块,用于由高频谱包络重建模块所得量化后高频谱包络参数和高频残差重构模块所得高频激励信号得到合成高频信号;
宽带信号重建模块,用于根据高频信号合成模块所得合成高频信号和核心解码器模块所得合成低频信号,得到重建宽带音频信号并输出;
核心解码器模块输出的音频类型参数和低频谱包络参数,以及高频码流中的高频谱包络索引输入到高频谱包络重建模块;高频码流中的高低频相关性参数和核心解码器模块输出的低频残差输入到高频残差重构模块;高频残差重构模块输出的高频残差,高频码流中的高频增益输入到高频增益调增模块;高频增益调增模块输出的高频激励信号和高频谱包络重建模块输出的量化后高频谱包络参数输入到高频信号合成模块;高频信号合成模块输出的合成高频信号和核心解码器模块输出的合成低频信号输入到宽带信号重建模块,宽带信号重建模块输出重建宽带音频信号。
具体实施时,音频带宽扩展解码装置解码工作流程如下。除了以硬件方式提供音频带宽扩展解码装置,采用软件方式通过计算机实现以下流程属于等同替换方案,也应当在本发明要求保护范围内。
解码工作流程包括以下步骤:
步骤1,由核心解码器模块从低频码流中提取低频参数,得到合成低频信号,并得到音频类型参数、低频谱包络参数和低频残差。如果核心编码器模块没有得到音频类型参数和低频谱包络参数,则将核心编码器模块得到的合成低频信号通过音频类型判断和线性预测分析模块得到音频类型参数和低频谱包络参数。步骤2,由高频谱包络重建模块从高频码流中提取高频谱包络索引,并根据步骤1中核心解码器模块得到的音频类型参数和低频谱包络参数,得到量化后高频谱包络参数。
步骤3,通过高频残差重构模块,从高频码流中提取得到高低频相关性参数,由高低频相关性参数和步骤1中核心解码器模块所得低频残差得到高频残差。
步骤4,高频增益调整模块由高频码流中提取的高频增益和步骤3中所得的高频残差得到高频激励信号。
步骤5,高频信号合成模块由步骤2所得量化后高频谱包络参数、步骤4中高频残差重构模块所得高频激励信号得到合成高频信号。
步骤6,由宽带信号重建模块实现,通过步骤5中高频信号合成模块所得合成高频信号和步骤1中核心解码器模块所得合成低频信号得到重建宽带音频信号。
本发明还提供了进一步方案:
所述高频谱包络重建模块,实现根据音频类型参数选取相应的低频谱包络参数码本,根据低频谱包络参数,找到相应的高频谱包络参数的子码本;根据高频谱包络索引,从高频谱包络参数的子码本中找到量化后高频谱包络参数。相应的流程就是,在步骤2中,根据步骤1核心解码器模块得到的音频类型参数,选取相应的低频谱包络参数码本;根据量化后低频谱包络参数,找到相应的高频谱包络参数的子码本;根据高频谱包络索引,找到量化后高频谱包络参数。参见图4,音频类型参数有第1~N类,每类对应有低频谱包络参数码本中的一个低频谱包络参数,高频谱包络索引提供对应于每个低频谱包络参数的高频谱包络参数,一般提供的第一级高频谱包络参数内包括有多个第二级高频谱包络参数;从而可以逐步找到量化后高频谱包络参数。
所述高频残差重构模块,实现根据高低频相关性参数,将和高频子带相关性最大的低频子带扩展并复制到高频,得到重构的高频残差。相应的流程就是,在步骤3中,根据高频码流中提取得到高低频相关性参数,将和高频子带相关性最大的低频子带扩展并复制到高频,得到重构的高频残差。
所述高频增益调整模块,实现将高频残差划分为若干个非均匀的子带,根据高频码流中提取的高频增益分别对各个子带调整得到高频激励信号。相应的流程就是,在步骤4中,将步骤3中高频残差重构模块所得的高频残差划分为若干个非均匀的高频子带,根据高频码流中提取的高频增益对高频子带进行调整,得到高频激励信号。
具体实施时,高频谱包络重建模块、高频残差重构模块、高频增益调整模块也可以采用其它方式实现功能。例如编码端直接将量化后高频谱包络参数写入码流,解码端高频谱包络重建模块直接提取量化后高频谱包络参数;高频增益调整模块也可将高频残差划分为若干个均匀的子带,然后根据高频增益分别对各个子带调整得到高频激励信号。
为了便于实施,本发明提供了实施例的具体实施方式以供参考。所述音频带宽扩展编解码装置基于AMR-WB+标准的核心编码器ACELP/TCX实现,宽带信号中的低频信号是50-6400Hz、高频信号是6.4-12.8KHz。实施例中的相关谱包络信息采用LPC系数。具体实施过程详述如下:
(1)音频带宽扩展编码
在编码端,通过AMR-WB+的预处理阶段,会将信号划分成高频部分和低频部分。所得低频信号通过AMR-WB+的核心编码器模块,将低频信号通过自相关计算得到低频LPC系数,将LPC系数作为低频分析滤波器的参数,将低频信号输入16阶低频分析滤波器,得到低频残差。根据现有分析滤波器的传递函数公式,16阶低频分析滤波器的传递函数 其中ai为LPC系数,z表示离散点。
对高频信号通过线性预测分析模块得到高频谱包络参数,核心编码器所得的音频类型参数和低频谱包络参数通过高频谱包络量化模块,得到量化后高频谱包络参数和高频谱包络索引。
在线性预测分析模块中,将高频信号通过高频谱包络参数构造的8阶高频分析滤波器得到高频残差。8阶高频分析滤波器的传递函数 其中ai为高频LPC系数。
分别将高频残差和低频残差的一帧(256点)加窗,通过FFT变换,变换到频域。高低频相关性计算模块中,频域低频残差根据频率划分成4个低频子带;频域高频残差划分成2个高频子带。实施例的低频非均匀子带划分规则可见表1,高频非均匀子带划分规则可见表2。具体实施时也可采用均匀划分规则,或者其它非均匀划分规则,例如Bark带划分规则。
表1低频非均匀子带划分表
频带上限 | 频带下限 | 频带带宽 | |
1 | 50 | 400 | 350 |
2 | 400 | 1600 | 1200 |
3 | 1600 | 3600 | 2000 |
4 | 3600 | 6400 | 2800 |
表2高频非均匀子带划分表
频带上限 | 频带下限 | 频带带宽 | |
1 | 6400 | 9200 | 2800 |
2 | 9200 | 12800 | 3600 |
将每一个低频子带扩展到和高频子带相同的点数,分别将高频子带和低频子带计算相关性,将和高频子带相关性最大的低频子带复制到高频部分,得到重建高频残差。这一阶段,将高低频相关性参数写入码流,在解码端将作为解码参数使用。
在增益计算模块中,将频域上的重构高频残差作为高频激励信号,输入到由高频LPC系数组成的高频合成滤波器,得到高频重建信号。其中高频合成滤波器转移函数 其中ai为高频LPC系数,G为可根据经验取的常数值。将重建高频信号和分频模块所得原始的高频信号根据人耳感知特性划分成6个非均匀的子带,本发明实施例的非均匀子带划分规则可见表3。然后对每个子带求高频增益参数,并将高频增益参数写入码流,在解码端将作为解码参数使用。
表3高频增益参数计算中非均匀的子带划分表
频带上限 | 频带下限 | 频带带宽 | |
1 | 6400 | 6800 | 400 |
2 | 6800 | 7400 | 600 |
3 | 7400 | 8200 | 800 |
4 | 8200 | 9400 | 1200 |
5 | 9400 | 10800 | 1400 |
6 | 10800 | 12800 | 2000 |
(2)音频带宽扩展解码装置
参见图4,根据音频类型参数,选取某一类码本,再由低频谱包络参数(实施例采用低频LPC系数),根据高频谱包络索引进行码本索引,找到相应的高频子码本,由量化后高频谱包络参数,找到相应的高频LPC系数。
将编码码流中的低频残差提取出来,加窗后通过FFT变换到频域。将频域的低频残差通过高频激励选择模块,通过输入编码端传来的高低频相关性参数,将相关性最大的低频子带扩展复制到相应的高频子带,以重构频域高频残差。
将频域高频残差和编码码流中提取的高频增益相乘,得到调整后高频残差。将调整后高频残差作为高频激励信号通过由高频LPC系数组成的高频合成滤波器(即实施例的高频信号合成模块通过高频合成滤波器实现),得到重建的频域高频信号,将重建的频域高频信号通过IFFT变换到时域,得到输出的合成高频信号。
其中高频合成滤波器转移函数为 其中ai为高频LPC系数,z表示离散点。
最后,高频信号合成模块输出的合成高频信号和核心解码器模块输出的合成低频信号输入到宽带信号重建模块,宽带信号重建模块输出重建宽带音频信号。
Claims (6)
1.一种音频带宽扩展编码装置,其特征是:包含以下部分,
分频模块,用于将输入的宽带信号分频成高频信号和低频信号;
核心编码器模块,用于根据分频模块所得低频信号得到低频参数,如果低频参数中包含音频类型参数、低频谱包络参数和低频残差,则从低频参数中提取音频类型参数、低频谱包络参数和低频残差;如果低频参数中不包含音频类型参数或低频谱包络参数或低频残差,则由低频参数得到低频重建信号,对低频重建信号进行音频类型判断得到音频类型参数,对不同类型的低频重建信号进行线性预测分析得到低频谱包络参数和低频残差;
线性预测分析模块,用于对分频模块所得高频信号线性预测分析,得到高频谱包络参数和高频残差;
高频谱包络量化模块,用于根据线性预测分析模块所得高频谱包络参数、核心编码器模块所得音频类型参数和低频谱包络参数,得到量化后高频谱包络参数和高频谱包络索引;实现方式为,由音频类型参数和低频谱包络参数找到对应的高频子码本,由高频谱包络参数通过高频子码本得到量化后高频谱包络参数和高频谱包络索引;
高低频相关性计算模块,用于根据核心编码器模块所得低频残差和线性预测分析模块所得高频残差,得到高低频相关性参数;
增益计算模块,用于根据核心编码器模块所得低频残差、高频谱包络量化模块所得量化后高频谱包络参数和高低频相关性计算模块所得高低频相关性参数,得到高频重建信号,然后根据高频重建信号和分频模块所得高频信号得到高频增益参数;
其中,分频模块输出的低频信号输入到核心编码器模块,分频模块输出的高频信号输入到线性预测分析模块;核心编码器输出的音频类型参数和低频谱包络参数,以及线性预测分析模块输出的高频谱包络参数输入到高频谱包络量化模块;核心编码器模块输出的低频残差和线性预测分析模块输出的高频残差输入到高低频相关性计算模块中;核心编码器模块输出的低频残差和高低频相关性计算模块输出的高低频相关性参数,以及高频谱包络量化模块输出的量化后高频谱包络参数输入到增益计算模块中;核心编码器模块输出的低频残差放入低频码流中,增益计算模块输出的高频增益参数、高低频相关性计算模块输出的高低频相关性参数以及高频谱包络量化模块输出的高频谱包络索引放入高频码流中,以供传输。
2.根据权利要求1所述的音频带宽扩展编码装置,其特征是:所述高低频相关性计算模块,实现将低频残差变换到频域得到频域低频残差,再根据人耳感知特性将频域低频残差划分成若干个非均匀的低频子带;将高频残差变化到频域得到频域高频残差,再根据人耳感知特性将频域高频残差划分成若干个非均匀的高频子带;对高频子带和低频子带计算相关性,得到高低频相关性参数。
3.根据权利要求1所述的音频带宽扩展编码装置,其特征是:所述增益计算模块,根据高低频相关性参数,将和高频子带相关性最大的低频子带扩展复制到高频部分,得到重构高频残差;将重构高频残差根据量化后高频谱包络参数进行合成滤波,得到高频重建信号;将高频重建信号和高频信号根据人耳感知特性划分为若干非均匀的子带,计算高频增益参数。
4.一种音频带宽扩展解码装置,其特征是:包含以下部分,
核心解码器模块,用于从低频码流中提取低频参数,得到合成低频信号,并得到音频类型参数、低频谱包络参数和低频残差;
高频谱包络重建模块,用于从高频码流中提取高频谱包络索引,并根据核心解码器模块所得音频类型参数和低频谱包络参数,得到量化后高频谱包络参数;
实现方式为,根据音频类型参数选取相应的低频谱包络参数码本,根据低频谱包络参数,找到相应的高频谱包络参数的子码本;根据高频谱包络索引,从高频谱包络参数的子码本中找到量化后高频谱包络参数;
高频残差重构模块,用于从高频码流中提取得到高低频相关性参数,根据高低频相关性参数和核心解码器模块所得低频残差得到高频残差;
高频增益调整模块,用于从高频码流中提取得到高频增益,由高频增益和高频残差重构模块所得高频残差得到高频激励信号;
高频信号合成模块,用于由高频谱包络重建模块所得量化后高频谱包络参数和高频增益调整模块所得高频激励信号得到合成高频信号;
宽带信号重建模块,用于根据高频信号合成模块所得合成高频信号和核心解码器模块所得合成低频信号,得到重建宽带音频信号并输出;
核心解码器模块输出的音频类型参数和低频谱包络参数,以及高频码流中的高频谱包络索引输入到高频谱包络重建模块;高频码流中的高低频相关性参数和核心解码器模块输出的低频残差输入到高频残差重构模块;高频残差重构模块输出的高频残差,高频码流中的高频增益输入到高频增益调增模块;高频增益调增模块输出的高频激励信号和高频谱包络重建模块输出的量化后高频谱包络参数输入到高频信号合成模块;高频信号合成模块输出的合成高频信号和核心解码器模块输出的合成低频信号输入到宽带信号重建模块,宽带信号重建模块输出重建宽带音频信号。
5.根据权利要求4所述的音频带宽扩展解码装置,其特征是:所述高频残差重构模块,实现根据高低频相关性参数,将和高频子带相关性最大的低频子带扩展并复制到高频,得到重构的高频残差。
6.根据权利要求4所述的音频带宽扩展解码装置,其特征是:所述高频增益调整模块,实现将高频残差划分为若干个非均匀的子带,根据高频码流中提取的高频增益分别对各个子带调整得到高频激励信号。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2009100614411A CN101521014B (zh) | 2009-04-08 | 2009-04-08 | 音频带宽扩展编解码装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2009100614411A CN101521014B (zh) | 2009-04-08 | 2009-04-08 | 音频带宽扩展编解码装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101521014A CN101521014A (zh) | 2009-09-02 |
CN101521014B true CN101521014B (zh) | 2011-09-14 |
Family
ID=41081566
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2009100614411A Expired - Fee Related CN101521014B (zh) | 2009-04-08 | 2009-04-08 | 音频带宽扩展编解码装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101521014B (zh) |
Families Citing this family (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102044250B (zh) * | 2009-10-23 | 2012-06-27 | 华为技术有限公司 | 频带扩展方法及装置 |
CN102081927B (zh) * | 2009-11-27 | 2012-07-18 | 中兴通讯股份有限公司 | 一种可分层音频编码、解码方法及系统 |
US12002476B2 (en) | 2010-07-19 | 2024-06-04 | Dolby International Ab | Processing of audio signals during high frequency reconstruction |
EP3544009B1 (en) * | 2010-07-19 | 2020-05-27 | Dolby International AB | Processing of audio signals during high frequency reconstruction |
KR101826331B1 (ko) * | 2010-09-15 | 2018-03-22 | 삼성전자주식회사 | 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법 |
CN102543086B (zh) * | 2011-12-16 | 2013-08-14 | 大连理工大学 | 一种基于音频水印的语音带宽扩展的装置和方法 |
CN102543089B (zh) * | 2012-01-17 | 2013-04-17 | 大连理工大学 | 一种窄带码流转换为宽带码流的转换装置 |
CN103093757B (zh) * | 2012-01-17 | 2014-10-29 | 大连理工大学 | 一种窄带码流转换为宽带码流的转换方法 |
CN103474079A (zh) * | 2012-08-06 | 2013-12-25 | 苏州沃通信息科技有限公司 | 一种语音编码方法 |
RU2641461C2 (ru) * | 2013-01-29 | 2018-01-17 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Аудиокодер, аудиодекодер, способ обеспечения кодированной аудиоинформации, способ обеспечения декодированной аудиоинформации, компьютерная программа и кодированное представление с использованием сигнально-адаптивного расширения полосы пропускания |
CN103971693B (zh) * | 2013-01-29 | 2017-02-22 | 华为技术有限公司 | 高频带信号的预测方法、编/解码设备 |
KR102081043B1 (ko) * | 2013-04-05 | 2020-02-26 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 향상된 스펙트럼 확장을 사용하여 양자화 잡음을 감소시키기 위한 압신 장치 및 방법 |
JP6407150B2 (ja) * | 2013-06-11 | 2018-10-17 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 音響信号の帯域幅拡張を行う装置及び方法 |
EP2830054A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework |
CN104517611B (zh) * | 2013-09-26 | 2016-05-25 | 华为技术有限公司 | 一种高频激励信号预测方法及装置 |
CN105225671B (zh) * | 2014-06-26 | 2016-10-26 | 华为技术有限公司 | 编解码方法、装置及系统 |
CN104269173B (zh) * | 2014-09-30 | 2018-03-13 | 武汉大学深圳研究院 | 切换模式的音频带宽扩展装置与方法 |
WO2016142002A1 (en) | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
CN105070293B (zh) * | 2015-08-31 | 2018-08-21 | 武汉大学 | 基于深度神经网络的音频带宽扩展编码解码方法及装置 |
CN105280189B (zh) * | 2015-09-16 | 2019-01-08 | 深圳广晟信源技术有限公司 | 带宽扩展编码和解码中高频生成的方法和装置 |
CN105513601A (zh) * | 2016-01-27 | 2016-04-20 | 武汉大学 | 一种音频编码带宽扩展中频带复制的方法及装置 |
CN112863539B (zh) * | 2019-11-28 | 2024-04-16 | 科大讯飞股份有限公司 | 一种高采样率语音波形生成方法、装置、设备及存储介质 |
CN112000400B (zh) * | 2020-01-18 | 2024-01-12 | 惠州华阳通用电子有限公司 | 一种动画资源文件生成方法及装置 |
CN118038877A (zh) * | 2022-11-01 | 2024-05-14 | 抖音视界有限公司 | 一种音频信号的编码、解码方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1629937A (zh) * | 1997-06-10 | 2005-06-22 | 编码技术股份公司 | 采用频带复现增强源编码 |
CN101089951A (zh) * | 2006-06-16 | 2007-12-19 | 徐光锁 | 频带扩展编码方法及装置和解码方法及装置 |
CN101140759A (zh) * | 2006-09-08 | 2008-03-12 | 华为技术有限公司 | 语音或音频信号的带宽扩展方法及系统 |
-
2009
- 2009-04-08 CN CN2009100614411A patent/CN101521014B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1629937A (zh) * | 1997-06-10 | 2005-06-22 | 编码技术股份公司 | 采用频带复现增强源编码 |
CN101089951A (zh) * | 2006-06-16 | 2007-12-19 | 徐光锁 | 频带扩展编码方法及装置和解码方法及装置 |
CN101140759A (zh) * | 2006-09-08 | 2008-03-12 | 华为技术有限公司 | 语音或音频信号的带宽扩展方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN101521014A (zh) | 2009-09-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101521014B (zh) | 音频带宽扩展编解码装置 | |
CN107945811B (zh) | 一种面向频带扩展的生成式对抗网络训练方法及音频编码、解码方法 | |
EP1701340B1 (en) | Decoding device, method and program | |
TWI545560B (zh) | 具有在頻譜域填充有智慧間隙之音頻訊號之編碼或解碼裝置與方法 | |
CN101527138B (zh) | 超宽带扩展编码、解码方法、编解码器及超宽带扩展系统 | |
CA2853987C (en) | Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding | |
KR101213840B1 (ko) | 복호화 장치 및 복호화 방법, 및 복호화 장치를 구비하는 통신 단말 장치 및 기지국 장치 | |
EP2786377B1 (en) | Chroma extraction from an audio codec | |
CN101583994B (zh) | 对音频和/或语音信号进行编码和/或解码的方法和设备 | |
CN102144259A (zh) | 用于产生带宽扩展输出数据的装置和方法 | |
US11393484B2 (en) | Audio classification based on perceptual quality for low or medium bit rates | |
KR102105305B1 (ko) | 계층형 정현파 코딩을 이용한 오디오 신호의 인코딩 및 디코딩 방법 및 장치 | |
CN101297356A (zh) | 音频压缩 | |
CN104718571A (zh) | 用于隐藏帧错误的方法和设备以及用于音频解码的方法和设备 | |
KR20130042472A (ko) | 신호 처리 장치 및 방법, 부호화 장치 및 방법, 복호 장치 및 방법 및 프로그램 | |
CN111968655A (zh) | 信号编码方法和装置以及信号解码方法和装置 | |
CN105336333A (zh) | 多声道声音信号编码方法、解码方法及装置 | |
KR101108955B1 (ko) | 오디오 신호 처리 방법 및 장치 | |
Helmrich | Efficient perceptual audio coding using cosine and sine modulated lapped transforms | |
CN106205626A (zh) | 一种针对被舍弃的子空间分量的补偿编解码装置及方法 | |
Petermann et al. | Native multi-band audio coding within hyper-autoencoded reconstruction propagation networks | |
CN105336334A (zh) | 多声道声音信号编码方法、解码方法及装置 | |
CN1327408C (zh) | 一种低比特率语音编码器 | |
HE et al. | Wideband Speech And Audio Coding Based On Wavelet Transform And Psychoacoustic Model | |
Ayala et al. | Speech compression based on frequency warped cepstrum and wavelet analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20110914 |