[go: up one dir, main page]

CN101197576A - 一种音频信号编码、解码方法 - Google Patents

一种音频信号编码、解码方法 Download PDF

Info

Publication number
CN101197576A
CN101197576A CNA2006101192822A CN200610119282A CN101197576A CN 101197576 A CN101197576 A CN 101197576A CN A2006101192822 A CNA2006101192822 A CN A2006101192822A CN 200610119282 A CN200610119282 A CN 200610119282A CN 101197576 A CN101197576 A CN 101197576A
Authority
CN
China
Prior art keywords
frequency
coding
spectrum
resolution
high band
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2006101192822A
Other languages
English (en)
Inventor
周毅
欧阳合
邹艳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jade Technologies Co., Ltd.
Original Assignee
SHANGHAI JIEDE MICROELECTRONIC CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI JIEDE MICROELECTRONIC CO Ltd filed Critical SHANGHAI JIEDE MICROELECTRONIC CO Ltd
Priority to CNA2006101192822A priority Critical patent/CN101197576A/zh
Publication of CN101197576A publication Critical patent/CN101197576A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明公开了一种音频信号编码、解码方法,包括编码步骤和解码步骤;本方法采用了高、低频段不同频率分辨率的混合分辨率编码策略,在不改变原先已有宽带频谱编码框架的基础上,可获得较高的截止频率;由于仅对音频信号相对的高频部分进行降低频率分辨率的处理,能在降低编码bit需求的前提下最大限度地保证了编码音质,进而能得到比通常参数编码所难以到达的音质效果。由于本发明能在不改变编/解码体系结构的情况下得到完整应用,故本发明具有最广泛的普遍适用性。

Description

一种音频信号编码、解码方法
技术领域
本发明涉及音频信号处理技术领域,尤其涉及一种音频信号编码、解码方法。
背景技术
目前音频编码的方式可大致分为参数编码和基于子带的频谱编码。基于参数编码主要用于低码率情况,而基于子带的频谱编码则主要用于中等或者较高码率情况。参数编码虽然能使用较低码率进行编码,但编/解码后音质损失明显。子带频谱编码方法能编出较高音质的码流,但需要占用较高的码率。由于在宽带编码过程中,频谱编码所产生的比特(bit)数所占的比重是最大的,因此为了能明显降低编码bit占用,降低频谱编码部分编码占用率是最有可能的,也是效果最显著的。传统减少频谱编码bit占用的方法主要是采用降低截止频率的方法。通过降低截止频率,需要编码的频谱点个数相应会减少,从而达到减少编码bit的目的。这种降低截止频率的做法在中高码率的情况下是可行的,这是因为人耳对低频信号更加敏感而对高频段则相对不太敏感。但是如果在低码率(如10kbps以下)情况下,通常采用子带编码方法进行编码的时候截止频率已经很低(如3Khz或者更低),如果仍然采用降低截止频率的方法,会严重影响编码后听觉感受,也就直接影响到最终编码后的音质。因此如何在低码率情况下,在显著降低编码bit数的同时能获得比较好的效果的编码技术成为业界探索的目标。
发明内容
本发明要解决的技术问题是提供一种音频信号编码、解码方法,可以广泛应用于宽带编码,特别在低码率情况下,在显著降低编码bit数的同时能获得明显优于参数编码的效果。
为解决上述技术问题,本发明提出了一种音频信号编码、解码方法,包括:编码步骤,包括:(a)输入音频信号;(b)通过正常时域到频域的变换得到在截止频率以下的频谱;(c)进行高频段频域信号的降采样,即根据步骤b所得频谱,调整在截止频率内高频段各频率子带的分辨率并形成新的频谱;(d)然后进行混合频率分辨率频谱的编码;(e)最后将步骤d编码所得的比特流编入码流;其中步骤c包括:(1)选择一个高频段的频率分割点,所有高于该频率的频率子带部分为高频段;(2)在高频段范围内,从低频往高频依次选取相同个数的多个频率子带的频谱值形成一个新的频谱值;(3)依次重复步骤2一直到截止频率结束。解码步骤,包括:(f)输入步骤e所得的码流;(g)解析码流得到混合分辨率频谱;(h)进行解码后高频段的升采样,即根据步骤g所得混合分辨率频谱重构正常分辨率的频谱,并与步骤c对应;(i)通过正常频域到时域的变换,重构获得解码音频帧信号。前述步骤c降采样不限于降低一倍的降采样方法,且其降采样方法包括:直接取均值的方法或采用滤波器的方法;同样前述步骤h升采样不限于升高一倍的升采样方法,还包括所有与编码部分步骤c相适应的升采样倍数,且其升采样的方法包括:直接取均值的方法或采用滤波器的方法。
本发明由于仅对音频信号相对的高频部分进行降低频率分辨率的处理,能在降低编码bit需求的前提下最大限度地保证了编码音质,进而能得到比通常参数编码所难以到达的音质效果。此外,由于本发明方法能在不改变编/解码体系结构的情况下得到完整应用,故本发明的方法具有最广泛的普遍适用性。
附图说明
图1是本发明编码方法的流程示意图;
图2是本发明解码方法的流程示意图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步详细的说明。
在宽带编码过程中,其中频谱编码所产生的bit数所占的比重是最大的。如前所述,为了能明显降低编码bit占用,降低频谱编码部分编码占用率是最有可能的,也是效果最显著的。与常规传统降低截止频率的方法不同,本发明采用了完全不相同的方法,本发明考虑到在低码率情况下人耳对低频部分的信号很敏感,所以本发明仅对相对的高频部分进行了特殊处理,即调整高频段频率分辨率来达到降低编码bit数的目的。
如图1、图2所示,分别是本发明编码方法和解码方法的流程示意图。
图1编码方法包括:首先通过时域到频域的变换得到在截止频率以下的频谱101,根据该频谱,调整在截止频率内高频段各频率子带的分辨率并形成新的频谱102,然后进行频谱的编码103,最后将编码所得的bit流编入最终的码流104;其中时域转频域的变换过程101采用与一般的编码器完全一样的变换方法;截止频率的选择也是完全一样。
下面对上述的编码各步骤详细讲述。
102步骤:即截止频率内高频段频率分辨率的调整是本发明的最核心部分:首先选择一个高频段的频率分割点,所有高于该频率的频率子带部分为本发明所称的高频段;在高频段范围内,从低频往高频依次选取相同个数的几个频率子带的频谱值形成一个新的频谱值,该频谱值对应的频率子带带宽比原来未调整前一个子带对应的频率带宽要宽;依次重复这个过程一直到截止频率结束。通常,可以选择每两个频率子带作为一个处理单元,也即依次每两个频率子带形成一个新的频率子带,这样新的频率子带对应的频段宽度就为原先的两倍。102过程也可以理解为一种对高频段频率子带的降采样。
以两个频率子带处理单元为例,这个降采样的过程可以进一步说明如下:首先确定这种降采样的计算策略:最简单的可以是两个频率子带的均值,也可以是通过有限冲击相应(FIR)低通滤波器的输出;然后每间隔两个子带计算得到一个新子带的谱值;最后利用这些新的谱值和原先低频段的频谱组成新的混合分辨率的新频谱,并将此作为后续频谱编码的频谱。
103步骤:对混合频率分辨率频谱进行编码的过程与一般的编码过程基本完全一样,唯一不同的是在截止频率范围内所对应的频率点数已经明显减少。也即需要编码的谱值个数已经明显减少,进而最终达到减少编码bit数的目的。
104步骤:根据103过程中形成的编码bit流形成最终的编码码流。
图2解码方法包括:首先通过正常的解码过程得到混合分辨率的频谱201,然后根据混合分辨率的频谱重构正常分辨率的频谱202,随后根据正常频域到时域的变换并重构获得解码音频帧信号203。
下面对上述的解码各步骤详细讲述。
201步骤:混合分辨率频谱解码过程与正常的解码过程完全一样。
202步骤:即正常分辨率频谱重构是本发明解码部分的最核心过程。整个频谱重构过程是与编码过程中的混合频谱获取方法一一对应。202步骤过程也可以理解为一种升采样。
仍然以升采样2倍为例:由于bit流中没有相邻频率子带能量关系相关信息,所以一般可以采用升采样的原理来重构高频段频谱信号,最简单的一种处理方法可以直接将相邻两个正常子带的能量都取为相同,即如下式(1)所示
E ( f 0 + 2 k ) = E ( f 0 + 2 k + 1 ) = E ^ ( f 0 + k ) , k = 0,1 , . . . - - - ( 1 )
其中
Figure A20061011928200072
为混合频率分辨率频谱,f0为高频段起始频率点。
203步骤:根据重构的正常频率分辨率的频谱经过正常的频域到时域变换即可重构出正常的时域音频帧信号,本过程与常规的做法完全一样。
实施例:
以如下的情况为例来具体说明实施本发明的过程:(1)高频起始频率点对应的频谱索引号为200,(2)截止频率对应的频谱索引号为400,(3)降采样倍数为一倍。
则编码端:
1)通过正常的时域到频域信号的转换得到截止频率以下的400个频谱值,共400个;
2)依次采用每两个频率点取平均值得到一个低频率分辨率下的频谱值,共100个;
3)将低频段的200个值和100个低频率分辨率的值组成混合频率分辨率频谱(300个值);
4)根据混合频率分辨率频谱进行正常的频谱编码并形成最终编码码流。
解码端:
1)通过正常的解码过程,解码得到混合频率分辨率下的频谱(300个值);
2)将高频段的100个频谱值根据式(1)依次扩充重构为200个值,
其中f0=201,k=0,1,2…,99;该重构的200个值与低频段的200个值一同重构为正常频率分辨下的频谱;
3)通过正常的频域到时域的变换重构过程即获得最终重构的时域音频信号。
此外,采用本发明技术,可以在不增加编码bit需求的情况下提高编码的截止频率。具体可以举例说明如下。
假设原先的频谱需要编码300个频谱值,采用本发明可以采用200个低频率频谱值,再加100个高频段低分辨率频谱值,这样就相当于实际编码200+100×2=400个频谱值(假设降一倍采样),进而一定程度上提高了截止频率。
本发明方法由于仅对音频信号相对的高频部分进行了特殊处理,且这种处理仅仅是一种降低频率分辨率的做法,故仍然能保证最主要信息的不丢失,能在降低编码bit需求的前提下最大限度地保证了编码音质,进而能得到比通常参数编码所难以到达的音质效果。此外,由于本发明方法所对应的技术要点能在不改变编/解码体系结构的情况下得到完整应用,故本发明方法具有最广泛的普遍适用性,可以广泛应用于基于子带编码,尤其是低码率子带编码的方法。
综上所述,本发明方法是一种可以广泛应用于基于子带编码,尤其是低码率子带编码的方法,通过使用本发明能明显降低子带编码所需的码率,同时编码后的音质明显好于参数编码效果。本发明可以在不改变原先已有的宽带频谱编码框架结构的基础上,能在低码率下获得较高的截止频率,或者在相同的截止频率下获得更低的编码码率。在低码率编码情况下,能获得明显好于参数编码的音质。

Claims (3)

1.一种音频信号编码、解码方法,其特征在于,包括下述步骤:编码步骤,包括:(a)输入音频信号;(b)通过正常时域到频域的变换得到在截止频率以下的频谱;(c)进行高频段频域信号的降采样,即根据步骤b所得频谱,调整在截止频率内高频段各频率子带的分辨率并形成新的频谱;(d)然后进行混合频率分辨率频谱的编码;(e)最后将步骤d编码所得的比特流编入码流;其中步骤c包括:(1)选择一个高频段的频率分割点,所有高于该频率的频率子带部分为高频段;(2)在高频段范围内,从低频往高频依次选取相同个数的多个频率子带的频谱值形成一个新的频谱值;(3)依次重复步骤2一直到截止频率结束;
解码步骤,包括:(f)输入步骤e所得的码流;(g)解析码流得到混合分辨率频谱;(h)进行解码后高频段的升采样,即根据步骤g所得混合分辨率频谱重构正常分辨率的频谱,并与步骤c对应;(i)通过正常频域到时域的变换,重构获得解码音频帧信号。
2.根据权利要求1所述的音频信号编码、解码方法,其特征在于,所述步骤c降采样不限于降低一倍的降采样方法;所述步骤h升采样不限于升高一倍的升采样方法,还包括所有与编码部分步骤c相适应的升采样倍数。
3.根据权利要求2所述的音频信号编码、解码方法,其特征在于,所述降采样方法包括:直接取均值的方法或采用滤波器的方法;所述升采样的方法包括:直接取均值的方法或采用滤波器的方法。
CNA2006101192822A 2006-12-07 2006-12-07 一种音频信号编码、解码方法 Pending CN101197576A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNA2006101192822A CN101197576A (zh) 2006-12-07 2006-12-07 一种音频信号编码、解码方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNA2006101192822A CN101197576A (zh) 2006-12-07 2006-12-07 一种音频信号编码、解码方法

Publications (1)

Publication Number Publication Date
CN101197576A true CN101197576A (zh) 2008-06-11

Family

ID=39547763

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2006101192822A Pending CN101197576A (zh) 2006-12-07 2006-12-07 一种音频信号编码、解码方法

Country Status (1)

Country Link
CN (1) CN101197576A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101615395B (zh) * 2008-12-31 2011-01-12 华为技术有限公司 信号编码、解码方法及装置、系统
CN102099856B (zh) * 2008-07-17 2012-11-07 弗劳恩霍夫应用研究促进协会 具有可切换旁路的音频编码/解码方法及设备
CN102985969A (zh) * 2010-12-14 2013-03-20 松下电器产业株式会社 编码装置、解码装置和编码方法、解码方法
CN105374362A (zh) * 2010-01-08 2016-03-02 日本电信电话株式会社 编码方法、解码方法、编码装置、解码装置以及程序
WO2021204015A1 (zh) * 2020-04-09 2021-10-14 于江鸿 数据处理的方法和系统
CN113870872A (zh) * 2018-06-05 2021-12-31 安克创新科技股份有限公司 基于深度学习的语音音质增强方法、装置和系统
US11503306B2 (en) 2020-04-09 2022-11-15 Jianghong Yu Image and video data processing method and system
US11528488B2 (en) 2020-04-09 2022-12-13 Jianghong Yu Image and video data processing method and system
US12184844B2 (en) 2020-04-09 2024-12-31 Jianghong Yu Image and video data processing method and system

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102099856B (zh) * 2008-07-17 2012-11-07 弗劳恩霍夫应用研究促进协会 具有可切换旁路的音频编码/解码方法及设备
US8712763B2 (en) 2008-12-31 2014-04-29 Huawei Technologies Co., Ltd Method for encoding signal, and method for decoding signal
CN101615395B (zh) * 2008-12-31 2011-01-12 华为技术有限公司 信号编码、解码方法及装置、系统
CN105374362A (zh) * 2010-01-08 2016-03-02 日本电信电话株式会社 编码方法、解码方法、编码装置、解码装置以及程序
CN105374362B (zh) * 2010-01-08 2019-05-10 日本电信电话株式会社 编码方法、解码方法、编码装置、解码装置以及记录介质
US9373332B2 (en) 2010-12-14 2016-06-21 Panasonic Intellectual Property Corporation Of America Coding device, decoding device, and methods thereof
CN102985969B (zh) * 2010-12-14 2014-12-10 松下电器(美国)知识产权公司 编码装置、解码装置和编码方法、解码方法
CN102985969A (zh) * 2010-12-14 2013-03-20 松下电器产业株式会社 编码装置、解码装置和编码方法、解码方法
CN113870872A (zh) * 2018-06-05 2021-12-31 安克创新科技股份有限公司 基于深度学习的语音音质增强方法、装置和系统
WO2021204015A1 (zh) * 2020-04-09 2021-10-14 于江鸿 数据处理的方法和系统
US11503306B2 (en) 2020-04-09 2022-11-15 Jianghong Yu Image and video data processing method and system
US11528488B2 (en) 2020-04-09 2022-12-13 Jianghong Yu Image and video data processing method and system
US11677960B2 (en) 2020-04-09 2023-06-13 Jianghong Yu Image and video processing methods and systems
US12184844B2 (en) 2020-04-09 2024-12-31 Jianghong Yu Image and video data processing method and system

Similar Documents

Publication Publication Date Title
CN101197576A (zh) 一种音频信号编码、解码方法
US9047875B2 (en) Spectrum flatness control for bandwidth extension
CN101939782B (zh) 噪声填充与带宽扩展之间的自适应过渡频率
JP6321072B2 (ja) オーディオ/音声符号化方法およびオーディオ/音声復号方法
CN102598121B (zh) 增强型音频解码器
US8793126B2 (en) Time/frequency two dimension post-processing
CN1954363B (zh) 编码装置和编码方法
DK166933B1 (da) Fremgangsmaade til overfoering af et audiosignal
CN102652336B (zh) 声音信号复原装置以及声音信号复原方法
CN105280190B (zh) 带宽扩展编码和解码方法以及装置
CN102044250B (zh) 频带扩展方法及装置
US8332210B2 (en) Regeneration of wideband speech
CN1153365C (zh) 采用不同编码原理的传送系统
CN101308655B (zh) 一种音频编解码方法与装置
CN103930946A (zh) 延迟优化的重叠变换,编码/解码加权窗口
CN101436407B (zh) 音频编解码方法
CN1416561A (zh) 语音解码器和一种语音解码方法
CN101281748B (zh) 用编码索引实现的空缺子带填充方法及编码索引生成方法
EP1073209B1 (en) Subband encoding apparatus
CN101377925A (zh) 提高g.711的感知质量的自适应调整方法
CN101694773B (zh) 一种基于tda域的自适应窗切换方法
CN101320565B (zh) 感知加权滤波方法及感知加权滤波器
JP2021502597A (ja) 一時的ノイズシェーピング
CN101950562A (zh) 基于音频关注度的分级编码方法及系统
CN105261373B (zh) 用于带宽扩展编码的自适应栅格构造方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: KUNSHAN JADE TECHNOLOGIES CO., LTD.

Free format text: FORMER OWNER: SHANGHAI JADE TECHNOLOGIES CO., LTD.

Effective date: 20100721

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 201203 BUILDING 16, NO.115, LANE 572, BIBO ROAD, PUDONG NEW AREA, SHANGHAI CITY TO: 215311 TOWER ABCD, 12/F, SOUTH BUILDING, KUNSHAN PUDONG SOFTWARE PARK, BACHENG TOWN, KUNSHAN CITY

TA01 Transfer of patent application right

Effective date of registration: 20100721

Address after: A ABCD 12 layer 215311 town Kunshan city Kunshan Pudong Software Park South

Applicant after: Shanghai Jade Technologies Co., Ltd.

Address before: 201203 Building No. 115, No. 572, Lane 16, blue wave road, Shanghai, Pudong New Area

Applicant before: Shanghai Jiede Microelectronic Co., Ltd.

C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20080611