[go: up one dir, main page]

CN101662288B - 音频编码、解码方法及装置、系统 - Google Patents

音频编码、解码方法及装置、系统 Download PDF

Info

Publication number
CN101662288B
CN101662288B CN2008101191706A CN200810119170A CN101662288B CN 101662288 B CN101662288 B CN 101662288B CN 2008101191706 A CN2008101191706 A CN 2008101191706A CN 200810119170 A CN200810119170 A CN 200810119170A CN 101662288 B CN101662288 B CN 101662288B
Authority
CN
China
Prior art keywords
parameter
signal
harmonic
audio signal
domain envelope
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2008101191706A
Other languages
English (en)
Other versions
CN101662288A (zh
Inventor
张德明
李海婷
张立斌
霍克·克鲁格
本特·凯瑟
皮特·瓦里
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Gaohang Intellectual Property Operation Co ltd
Wei Fang
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN2008101191706A priority Critical patent/CN101662288B/zh
Priority to PCT/CN2009/073559 priority patent/WO2010022661A1/zh
Publication of CN101662288A publication Critical patent/CN101662288A/zh
Application granted granted Critical
Publication of CN101662288B publication Critical patent/CN101662288B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

一种音频编码、解码方法及装置、系统,方法具体包括:提取用于表征音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数;将所述时域包络参数、频域包络参数、音调参数和谐波间隔参数编码后,传输给解码端。本发明实施例采用的包含时域包络参数、频域包络参数、音调参数和谐波间隔参数的一组参数,减少了编码时需要的参数的个数,同时降低了使用参数进行编码时所需要的比特数,可以实现用更少的比特数对信号进行编码的目的。

Description

音频编码、解码方法及装置、系统
技术领域
本发明涉及音频编码、解码技术领域,尤其涉及参数音频编码、解码的方法及装置、系统。
背景技术
音频信号通常指人耳可以听到的频率在20Hz到20KHz的声波,数字音频信号是指经过模数转换后的音频信号。从模拟到数字的转换包含了以指定的采样率进行数字采样,以及以指定的分辨率对时域离散信号进行标量量化的过程。
音频编码,通常是指消除音频信号中的统计冗余和感知不敏感的编码方法RIRAC(消除音频信号中的统计冗余和感知不敏感,Redundancy and Irrelevancy Removal AudioCoding),例如变换域编码。音频编码可以用一个较低的码率来表征信号,但同时编码噪声也会被引入到信号中。利用人耳听觉系统的掩蔽效应,在对音频信号进行频域和时域整形后这些噪声将很难或不被听到。利用这种消除音频信号中的统计冗余和感知不敏感的音频编码方法,可以用较高的比特数获得较高质量的编码性能,但是当带宽不稳定时,采用这种编码方法的音频质量下降非常明显。
相对于上述消除音频信号中的统计冗余和感知不敏感的音频编码方法,利用参数对音频编码是一种利用简洁的参数描述来表征信号的方法,通过这种方法可以用更低的编码速率获得较高的编码质量,其中,参数可以是包含信号的时域和频域特征的一组参数。由于这样一组参数可以用较少的比特数来表示,因此利用参数对音频编码的方法非常适用于低速率传输机制。在将参数描述传输至解码端之后,解码端可以跟据这些参数重构音频信号。目前利用参数对音频信号进行编码的方法主要有:
现有技术一
这种方法是将MPEG-4音频标准中的先进音频编码(Advanced Audio Coding,简称AAC)、频带复制(Spectral Band Replication,简称SBR)和参数立体声(Parametric Stereo,简称PS)3种技术结合来对音频信号进行编码。
现有技术二
这种方法主要是利用各种模型,例如谐波模型、暂态模型、单谱线模型和噪声模型等对音频信号进行分析,提取相应的模型参数,在合成端利用这些模型参数还原音频信号。
发明人在实现本发明的过程中,发现现有技术中至少存在如下问题:
实际应用中,现有技术一在对音频信号进行编码的过程中一般需要用较多的编码比特数才能获得较大的编码带宽,这就对传输信道的带宽提出了很高的要求;在信道带宽较小的情况下,会影响采用该技术进行编码的音频质量。
现有技术二的方法中,需要在编码端用较多的参数来对信号进行描述,才能在解码端获得较高质量的合成音频信号;因此,实际应用中采用这种技术时需要传输的比特数也较多;当信道的传输能力进一步降低时,会影响采用该技术进行编码的音频质量。
发明内容
本发明的实施例提供了一种音频编码、解码方法及装置、系统,可以在应用中降低编码时所需要的比特数,从而实现用更少的比特数对信号进行编码。同时,本发明实施例还提供了一种对音频信号进行分频带编码、解码处理方法和装置,能够在分频带编解码音频信号的过程中实现用更少的比特数对信号进行编码。
一种音频编码方法,包括:
提取用于表征音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数;将所述时域包络参数、频域包络参数、音调参数和谐波间隔参数编码后,传输给解码端。
一种音频编码装置,包括:
参数提取单元,用于提取用于表征音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数;
发送单元,用于将所述时域包络参数、频域包络参数、音调参数和谐波间隔参数编码后,传输给解码端。
一种音频解码方法,包括:
对收到的数据进行解码,得到用于表征音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数;根据所述时域包络参数、频域包络参数、音调参数和谐波间隔参数,合成音频信号。
一种音频解码装置,包括:
解码单元,用于对收到的数据进行解码,得到用于表征音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数;
合成单元,用于根据所述时域包络参数、频域包络参数、音调参数和谐波间隔参数,合成音频信号。
一种音频编解码系统,包括:
编码装置,用于提取用于表征音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数;对所述时域包络参数、频域包络参数、音调参数和谐波间隔参数编码后,发送至解码装置;
解码装置,用于对所述编码装置发送来的数据进行解码,得到所述时域包络参数、频域包络参数、音调参数和谐波间隔参数;根据所述时域包络参数、频域包络参数、音调参数和谐波间隔参数合成音频信号。
一种编码处理方法,包括:
当用分频带的方式对音频信号进行编码时,若当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号相似,则提取用于表征音频信号的时域包络参数和频域包络参数,并将所述时域包络参数和频域包络参数编码后发送,同时发送表示当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号相似的信息;若当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号不相似,则提取用于表征音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数,并将所述时域包络参数、频域包络参数、音调参数和谐波间隔参数编码后发送,同时发送表示当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号相似的信息。
一种编码处理装置,包括:
判断单元,用于判断当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号是否相似;
编码单元,用于根据所述判断单元得到的判断结果信息,在当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号相似时,提取用于表征音频信号的时域包络参数和频域包络参数;或者,在当前频带的音频信号的谱信号与前一个频带的音频信号间的谱信号不相似时,提取用于表征音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数;
传输单元,用于发送所述判断单元得到的当前频带的音频信号的谱信号与前一个频带的音频信号间的谱信号相似的信息,对所述编码单元提取的所述音频信号的时域包络参数和频域包络参数进行编码后发送;或者,发送所述判断单元得到的当前频带的音频信号的谱信号与前一个频带的音频信号间的谱信号不相似的信息,对所述编码单元提取的音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数进行编码后发送。
一种解码处理方法,包括:
接收编码端发送的数据,若接收到表示当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号相似的信息,根据用于表征音频信号的时域包络参数和频域包络参数合成音频信号,其中,所述时域包络参数和频域包络参数是从接收到的数据中解码得到;
若接收到表示当前频带的音频信号的谱信号与前一个频带的音频信号间的谱信号不相似的信息,根据用于表征音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数合成音频信号,其中,所述时域包络参数、频域包络参数、音调参数和谐波间隔参数是从接收到的数据中解码得到。
一种解码处理装置,其特征在于,包括:
接收信息单元,用于接收表示当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号相似的信息,并对收到的数据解码得到用于表征音频信号的时域包络参数和频域包络参数;或者,接收表示当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号不相似的信息,并对收到的数据解码得到用于表征音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数;
解码单元,用于根据所述接收信息单元接收的所述相似的信息,以及所述时域包络参数和频域包络参数,合成音频信号;或者,根据所述不相似的信息,以及所述时域包络参数、频域包络参数、音调参数和谐波间隔参数,合成音频信号。
由上述本发明的实施例提供的技术方案可以看出,相对于现有技术的基于一定模型的参数音频编码技术,本发明实施例采用的包含时域包络参数、频域包络参数、音调参数和谐波间隔参数的一组参数,减少了编码时需要的参数的个数,同时降低了使用参数进行编码时所需要的比特数,可以实现用更少的比特数对信号进行编码的目的。
附图说明
图1为本发明实施例提供的音频编码方法流程示意图;
图2为本发明实施例提供的音频解码方法流程示意图;
图3为本发明实施例的编码处理方法流程示意图;
图4为本发明实施例的解码处理方法流程示意图;
图5为本发明实施例二在编码端的处理过程示意图;
图6为本发明实施例二在解码端的处理过程示意图;
图7为本发明实施例提供的音频编码装置结构示意图;
图8为本发明实施例提供的音频解码装置结构示意图;
图9为本发明实施例提供的音频编解码系统结构示意图;
图10为木发明实施例提供的编码处理装置结构示意图;
图11为本发明实施例提供的解码处理装置结构示意图;
图12为本发明实施例提供的解码单元结构示意图。
具体实施方式
为了在现有音频编码基础上用更低的编码速率获得更大的编码带宽,并获得更高的编码质量,本发明实施例提供一种音频编码方法,具体可以提取用于表征音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数;将所述时域包络参数、频域包络参数、音调参数和谐波间隔参数编码后,传输给解码端。
进一步的,当所述音频信号的谐波间隔与第一谐波偏移量的值不同时,提取所述音频信号的第一谐波偏移量参数,并对其编码后传输给所述解码端。
图1是本发明实施例的音频编码方法流程示意图,下面将结合图1对本发明实施例的音频编码方法进行介绍。如图1所示,具体可以包括:
11:提取需要进行编码处理的音频信号的时域包络参数;具体的,可以通过计算音频信号的子帧能量来得到信号的时域包络,也可以将信号变换到频域(或变换域)之后提取自回归(AR,Auto Regressive)模型参数来表征信号的时域包络;
12:提取音频信号的频域包络参数;具体的,可以通过计算频域(或变换域)下的子带能量得到信号的频域包络,也可以在时域提取信号的白回归模型参数来表征信号的频域包络;
13:提取音频信号的音调参数;音调参数表征了音频信号中谐波信号与噪声信号之间的比例;音调参数的表示方法有多种,可以是自相关函数的最大值与最小值之比;
14:提取音频信号的谐波间隔(PG,Pitch Grid)参数;谐波间隔参数表征了信号的不同谐波之间的间隔;具体可以通过峰值提取方法估计出谐波间隔参数;
15:提取第一谐波偏移量参数(P0,Pitch Offset);具体的,可以根据谐波间隔参数,估计第一谐波偏移量参数,并将该第一谐波偏移量参数编码传输;第一谐波偏移量参数表征了音频信号第一个谐波的位置;需要指出的是,若第一谐波偏移量的值等于谐波间隔,则该步骤可以省略;也就是当所述音频信号的谐波间隔与第一谐波偏移量的值不同时,提取所述音频信号的第一谐波偏移量参数;
对上述时域包络参数,频域包络参数,音调参数,谐波间隔参数和第一谐波偏移量参数编码后(也可以量化后编码),将其输出。
需要指出的是,上述音调参数,谐波间隔参数和第一谐波偏移量参数可以但不限于在频域(或变换域)计算得到,例如还可以在时域计算得到。并且,获取上述各参数的顺序不唯一,即不论以何种顺序,只要获取上述音频信号的时域包络参数,频域包络参数,音调参数,谐波间隔参数和第一谐波偏移量参数即可。
上述内容描述了本发明实施例的音频编码方法流程,通过上述方法,可以用包含时域包络参数,频域包络参数,音调参数,谐波间隔参数和第一谐波偏移量参数的一组参数,或用包含时域包络参数,频域包络参数,音调参数和谐波间隔参数的一组参数,来表征音频信号。相对于现有技术的基于一定模型的参数音频编码技术,本发明实施例采用的一组参数,减少了编码时需要的参数的个数,同时降低了使用参数进行编码时所需要的比特数;从而解决了传统的RIRAC编码方法比特数较高的问题;同时,与现有的参数音频编码算法相比,由于本发明实施例的这组参数可以用更少的比特数进行编码,从而进一步降低信号的编码速率,并且当信道的传输能力一定时,由于本发明的编码比特数较低,因此能够编码具有更高带宽的信号,实现了用更低的编码速率获得更大的编码带宽及更高的编码质量。
本发明实施例还提供了一种音频解码方法,具体可以包括:对收到的数据进行解码,得到用于表征音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数;根据所述时域包络参数、频域包络参数、音调参数和谐波间隔参数,合成音频信号。
进一步的,还包括:对收到的包含第一谐波偏移量参数的数据进行解码,得到用于表征所述音频信号的第一谐波偏移量参数。
所述合成音频信号的步骤包括:
根据所述谐波间隔参数得到谐波信号;或当所述音频信号的谐波间隔与第一谐波偏移量参数不同时,根据所述谐波间隔参数和所述第一谐波偏移量参数,得到谐波信号;
根据所述音调参数,调整谐波信号与噪声信号之间的比例;并根据调整后的谐波信号与噪声信号,得到重建的谱信号;
根据所述频域包络参数和时域包络参数对所述重建的谱信号进行处理得到合成音频信号。
图2是本发明实施例提供的音频解码方法流程示意图,下面将结合图2对本发明实施例的音频解码方法进行介绍。如图2所示,具体可以包括:
21:对收到的数据进行解码,得到用于表征音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数,当音频信号的谐波间隔与第一谐波偏移量的值不同时,还包括第一谐波偏移量参数;
22:根据谐波间隔参数,得到谐波信号(当所述音频信号的谐波间隔与第一谐波偏移量参数不同时,根据谐波间隔参数和第一谐波偏移量参数,得到谐波信号;否则第一谐波偏移量的值等于谐波间隔的值);该谐波结构可以由具有随机相位的谐波表示,其中第一谐波偏移量参数确定了第一个谐波的位置,各个谐波的间隔由谐波间隔参数决定;该谐波结构即为谐波信号;
23:产生噪声信号,例如,可以由一个随机数产生器产生噪声信号;
24:根据音调参数的值调整谐波信号与噪声信号之间的比例;并根据调整后的谐波信号与噪声信号,得到重建的谱信号;
25:根据频域包络参数对所述重建的谱信号进行频域整形处理,得到频域整形后的信号;例如,可以根据解码出的子带能量包络对重建的谱信号进行去归一化处理后得到频域整形后的信号;
26:根据时域包络参数对所述频域整形后的信号进行时域整形处理,得到最终的合成音频信号;例如,可以根据解码出的子帧能量包络对频域整形后的信号变换到时域以后再进行去归一化处理后,得到最终的合成音频信号。
需要指出的是频域整形和时域整形的顺序不唯一,也可以先根据时域包络参数对所述重建的谱信号进行时域整形处理,再根据频域包络参数对整形后的谱信号进行频域整形处理,得到最终的合成音频信号。
上述内容描述了本发明实施例的音频解码方法流程,通过本发明实施例提供的包含用于表征音频信号的时域包络参数、频域包络参数、音调参数、谐波间隔参数和第一谐波偏移量参数的一组参数,可以实现利用更少的比特数来合成音频信号,且该音频信号质量较高;并且,当音频信号的谐波结构明显时,解码得到的音频质量更佳。
为便于对本发明实施例的理解,下面将对本发明实施例的编码、解码具体实现方案进行详细的描述。
实施例一
本实施例中,编码端分别提取了音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数,由于本实施例中音频信号的谐波间隔与第一谐波偏移量参数相同,因此省略了提取第一谐波偏移量参数的步骤;解码端收到上述参数后,根据上述各参数进行解码,得到合成音频信号。
编码端的实施过程具体可以包括:
(1):提取信号的时域包络参数:例如,采用计算音频信号的子帧能量来得到信号的时域包络参数,可以计算信号的子帧能量包络{temp_env(0),temp(1),……,temp(N-1)},其中N为子帧个数,设帧长为15ms,子帧长度为3ms,则N=5;对此子帧能量包络进行量化,即得到时域包络参数,进一步的可以对该时域包络参数进行编码;同时可以利用量化后的时域包络对信号进行时域归一化处理;
当然,实际应用中也可以将信号变换到频域(或变换域)之后提取自回归(AR,AutoRegressive)模型参数来表征信号的时域包络;
(2):提取音频信号的频域包络参数;例如,在时域提取信号的自回归模型参数来表征信号的频域包络时,在时域计算得到信号的自回归模型参数{α0,α1,……,αM-1},其中M为自回归模型的阶数,进一步的可以对该自回归模型参数进行量化、编码和传输;同时根据量化后的自回归模型参数进行滤波,得到残差信号err(n);
具体应用中,还可以通过计算频域(或变换域)下的子带能量得到信号的频域包络参数;
(3):提取音频信号的音调参数;音调参数表征了音频信号中谐波信号与噪声信号之间的比例;音调参数的表示方法有多种,可以是自相关函数的最大值与最小值之比,例如T=max(ACF(k0))/min(ACF(k0)),也可以是其它表现形式,只要可以表征谐波与噪声之间的比例关系即可;其中,自相关函数ACF(k0)的计算可以利用FFT变化与逆FFT变换得到,例如,对(2)中的残差信号err(n)进行FFT变换,得到频域信号S(k)=FFT(err(n)),并进一步得到自相关函数ACF(k0)=IFFT(|FFT(S(k))|2);当然,也可以直接计算得到,例如 ACF ( k 0 ) = Σ k = 0 L - 1 S ( k ) S ( k + k 0 ) , 其中L为编码带宽范围内频域变换系数的个数;此外,还可以使用平均幅度差函数(AMDF,Average Mean Difference Function)来修正自相关函数;
(4):提取音频信号的谐波间隔(PG,Pitch Grid)参数;谐波间隔参数表征了信号的不同谐波之间的间隔;具体可以通过峰值提取方法估计出谐波间隔参数的整数部分,例如通过PG=arg max(ACF(k0))计算得到谐波间隔参数的整数部分;谐波间隔的分数值可以内插自相关函数ACF(k0)以后通过峰值提取的方法获得;具体地,可以只在先获得的整数谐波间隔附近进行自相关函数的内插计算,并在内插后的自相关函数中搜索出谐波间隔的分数值;为了获得更好的性能,可以对得到的谐波间隔参数进一步修正后再进行编码传输,以抑制倍频和分数频的产生;例如,将求得的当前帧的谐波间隔PG与前一帧的谐波间隔old_PG进行比较,如果当前帧的谐波间隔与前一帧谐波间隔之间的比值小于某个域值(如0.1)且ACF(old_PG)>0.95ACF(PG),则用前一帧的谐波间隔代替本帧求得的谐波间隔PG=old_PG;
(5):由于本实施例中第一谐波偏移量的值等于谐波间隔,该步骤可以省略;但在第一谐波偏移量的值不等于谐波间隔时,提取第一谐波偏移量参数时具体可以:根据谐波间隔参数,估计第一谐波偏移量参数,并将该第一谐波偏移量参数编码传输;第一谐波偏移量参数表征了音频信号第一个谐波的位置;需要指出的是,若第一谐波偏移量的值等于谐波间隔,则该步骤可以省略;也就是当所述音频信号的谐波间隔与第一谐波偏移量的值不同时,提取所述音频信号的第一谐波偏移量参数;
将上述时域包络参数,频域包络参数,音调参数和谐波间隔参数编码后(或量化后输出)输出。当然,如果(5)没有被省略,则第一谐波偏移量参数也将被编码、传输。
需要指出的是,上述音调参数,谐波间隔参数和第一谐波偏移量参数可以但不限于在频域(或变换域)计算得到,例如还可以在时域计算得到。并且,获取上述各参数的顺序不唯一,即不论以何种顺序,只要获取上述音频信号的时域包络参数,频域包络参数,音调参数,谐波间隔参数和第一谐波偏移量参数即可;
对应的,解码端对收到的数据解码,得到用于表征音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数后,合成音频信号。当然,若编码端(5)没有被省略,则解码端解码得到的参数还包括第一谐波偏移量参数。
解码端实施解码的具体处理过程可以包括:
(6):对收到的数据进行解码,得到用于表征音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数;当然,若编码端音频信号的谐波间隔与第一谐波偏移量的值不同时,还得到第一谐波偏移量参数;
(7):根据谐波间隔参数得到谐波信号;该谐波结构可以由具有随机相位的谐波表示,其中第一个谐波的位置等于谐波间隔的值,各个谐波的间隔也由谐波间隔参数决定;该谐波结构即为谐波信号;具体的,例如:从起始频点开始按照谐波间隔参数(PG)表示的谐波间隔将具有随机相位的谐波以脉冲的形式放置于信号带宽范围内相应的频点,从而产生谐波信号buf_pulses(k),例如 buf _ pulses ( k ) = h ( k ) * Σ n ∈ Z 0 ≤ n * PG ≤ L - 1 δ ( k - ( n * PG ) ) , 其中h(k)表示具有随机相位的谐波;
需要说明的是,若解码端若还收到了第一谐波偏移量参数,解码端则可以根据谐波间隔参数和第一谐波偏移量参数,得到谐波信号;该谐波结构可以由具有随机相位的谐波表示,其中第一谐波偏移量参数确定了第一个谐波的位置,各个谐波的间隔由谐波间隔参数决定;该谐波结构即为谐波信号。具体的具体的,例如,第一谐波偏移量参数(P0)为第一个脉冲的位置,从第一个脉冲位置开始按照谐波间隔参数(PG)表示的谐波间隔将具有随机相位的谐波以脉冲的形式放置于信号带宽范围内相应的频点,从而产生谐波信号buf_pulses(k),例如 buf _ pulses ( k ) = h ( k ) * Σ n ∈ Z 0 ≤ PO + n * PG ≤ L - 1 δ ( k - ( PO + n * PG ) ) , 其中h(k)表示具有随机相位的谐波;
(8):产生噪声信号,例如,可以由一个随机数产生器产生噪声信号buf_noise(k);
(9):根据音调参数的值调整谐波信号与噪声信号之间的比例;并根据调整后的谐波信号与噪声信号,得到重建的谱信号;具体的调整可以有多种,例如:先分别计算谐波信号与噪声信号的能量,记作enerP和enerN,再计算调整因子β1=1-T和 β 2 = enerP enerN * T , 其中T是音调参数;并得到修正后的重建谱信号 S ^ ( k ) = β 1 buf _ pulses ( k ) + β 2 buf _ noise ( k ) ; 通过逆FFT变换将重建的谱信号变换到时域,记作
Figure G2008101191706D00095
(10):根据频域包络参数对所述重建的谱信号进行频域整形处理,得到频域整形后的信号;例如,根据解码得到的自回归模型参数,对信号
Figure G2008101191706D00096
进行逆滤波,得到频域整形后的信号
Figure G2008101191706D00101
(11):根据时域包络参数对所述频域整形后的信号进行时域整形处理,得到最终的合成音频信号;例如,可以根据解码出的子帧能量包络对信号
Figure G2008101191706D00102
进行去归一化处理后,得到最终的合成音频信号。
相对于现有技术的基于一定模型的参数音频编码技术,本发明实施例采用的一组参数,减少了编码时需要的参数的个数,同时降低了使用参数进行编码时所需要的比特数;从而解决了现有编码方法比特数较高的问题;同时,与现有的参数音频编码算法相比,由于本发明实施例的这组参数可以用更少的比特数进行编码,从而进一步降低信号的编码速率,并且当信道的传输能力一定时,由于本发明的编码比特数较低,因此能够编码具有更高带宽的信号,实现了用更低的编码速率获得更大的编码带宽及更高的编码质量。同时在解码端可以实现利用更少的比特数来合成音频信号,且该音频信号质量较高;并且,当音频信号的谐波结构明显时,解码得到的音频质量更佳。
本发明实施例还提供了一种编码处理方法,具体可以包括:当用分频带的方式对音频信号进行编码时,若当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号相似,则提取用于表征音频信号的时域包络参数和频域包络参数,并将所述时域包络参数和频域包络参数编码后发送,同时发送表示当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号相似的信息;若当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号不相似,则提取用于表征音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数,并将所述时域包络参数、频域包络参数、音调参数和谐波间隔参数编码后发送,同时发送表示当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号相似的信息。
具体的,所述表示当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号相似或不相似的信息,具体可以用编码模式参数表示;所述编码模式参数,用于指示解码端在当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号相似时,根据所述音频信号的时域包络参数和频域包络参数,对当前频带的音频信号进行解码;或者指示解码端在当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号不相似时,根据所述音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数,对当前频带的音频信号进行解码。
进一步的,若当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号不相似,且当所述音频信号的谐波间隔与第一谐波偏移量的值不同时,提取所述音频信号的第一谐波偏移量参数;并将所述第一谐波偏移量参数传输给解码端。而且,若当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号相似时,还可以提取所述音频信号的音调参数,并将所述音调参数传输给解码端。
相应的,本发明实施例还提供了一种解码处理方法,具体可以包括:接收编码端发送的数据,若接收到表示当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号相似的信息,根据用于表征音频信号的时域包络参数和频域包络参数合成音频信号,其中,所述时域包络参数和频域包络参数是从接收到的数据中解码得到;若接收到表示当前频带的音频信号的谱信号与前一个频带的音频信号间的谱信号不相似的信息,根据用于表征音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数合成音频信号,其中,所述时域包络参数、频域包络参数、音调参数和谐波间隔参数是从接收到的数据中解码得到。
具体的,根据接收到的编码模式参数,确定所述当前频带的音频信号的谱信号与前一个频带的音频信号间的谱信号相似或不相似;若当前频带的音频信号的谱信号与前一个频带的音频信号间的谱信号相似,则根据所述收到的用于表征音频信号的时域包络参数和频域包络参数合成音频信号;若当前频带的音频信号的谱信号与前一个频带的音频信号间的谱信号不相似,则根据所述收到的时域包络参数、频域包络参数、音调参数和谐波间隔参数,合成音频信号。
若当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号不相似,所述收到的时域包络参数、频域包络参数、音调参数和谐波间隔参数,还可以包括:所述音频信号的第一谐波偏移量参数;若当前频带的音频信号的谱信号与前一个频带的音频信号间的谱信号相似,所述收到的用于表征音频信号的时域包络参数和频域包络参数,还可以包括:用于表征所述音频信号的音调参数。
图3是本发明实施例的编码处理方法流程示意图,下面将结合图3对本发明实施例的编码处理方法进行介绍。如图3所示,具体可以包括:
31:当用分频带的方式对音频信号进行编码时,判断当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号是否相似;具体的可以通过确定编码模式参数CM来表示是否相似;例如具体地,可以先计算当前频带信号谱与前一个频带信号谱之间的互相关,以确定当前频带谐波结构与前一个频带谐波结构之间的相似性;当互相关大于某一域值时,可以判定为当前频带谐波结构与前一个频带谐波结构之间是相似,将CM置为1,否则将CM置为0;并且当前频带信号谱与前一个频带信号谱之间相似时,可以不再提取下面的音调参数、谐波间隔参数和第一谐波偏移量参数;
32:若相似,则提取用于表征音频信号的时域包络参数和频域包络参数;若不相似,则提取用于表征音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数;也就是说,若当前频带信号谱与前一个频带信号谱之间相似时,可以不提取音频信号的音调参数、谐波间隔参数和第一谐波偏移量参数;具体的,提取上述各参数的方法可以如下:
提取时域包络参数;例如可以通过计算当前频带信号的子帧能量包络和全局增益因子gain,并根据这两组值判断信号是稳态信号或是瞬态信号;若是稳态信号,则对全局增益因子gain进行量化,将得到的量化值作为时域包络参数;如果是瞬态信号,则对子帧能量包络进行量化,将得到的量化值作为时域包络参数;并根据时域包络参数对当前频带信号进行时域归一化处理,得到时域归一化后的信号;
提取频域包络参数;例如对时域归一化以后的信号进行MDCT(修正的离散余弦变换,Modified Discrete Cosine Transform)变换后得到了一组MDCT系数,即时域归一化以后该频带对应的频域信号,对该频域信号处理时将这组频域信号分为N个子带,提取每个子带的子代能量并量化,得到一组量化后的频域包络,即为频域包络参数;根据频域包络参数对频域信号进行频域归一化处理,得到频域归一化后的信号;
提取音调参数;具体的,可以直接在MDCT域进行参数提取;为了进一步提高编码器的性能,也可以不直接在MDCT域进行参数提取,而是根据原始频域信号计算伪谱信号,并根据此伪谱信号计算音调参数;音调参数可以通过自相关函数的最大值与最小值之间的比值表示,其中最大值和最小值的获取是在期望的范围内或者是在对谐波间隔参数计算有益的范围内进行的;
提取谐波间隔参数PG;高频带信号的谐波间隔参数,通常是在频域(或变换域)下提取的;谐波间隔的整数值可以通过峰值提取方法由自相关函数估计出来,谐波间隔的分数值可以通过峰值提取的方法由内插的自相关函数估计出来;也可以只在求得的整数谐波间隔附近进行自相关函数的内插计算,之后通过峰值提取的方法获得谐波间隔的分数值;
提取第一谐波偏移量参数,例如根据谐波间隔,估计第一谐波偏移量参数P0;具体的可以在谐波间隔范围内,即[0,PG]范围内,将第一谐波分量分别置于不同偏移位置,并按谐波间隔依次放置其它谐波,并计算由此产生的谱与伪谱之间的相关性,相关性最大的偏移位置即所求的第一谐波偏移量;同时,第一谐波偏移量参数也可以用来进一步修正谐波间隔参数的估计值,从而达到更优的参数提取效果;需要指出的是,若第一谐波偏移量的值始终等于谐波间隔,则该步骤可以省略;
33:将表示当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号相似或不相似的信息发送;例如将编码模式参数编码后发送;并将提取的参数编码后发送;具体的,当CM等于1时,包含编码模式参数、时域包络参数和频域包络参数的一组参数将会被量化或编码,并传输到解码端;当CM等于0时,包含了编码模式参数、时域包络参数、频域包络参数、音调参数和谐波间隔参数的一组参数,将会被量化、编码,并传输到解码端;
需要指出的是当CM等于1时,传输到解码端的参数还可以包括音调参数;当CM等于0时,若第一谐波偏移量的值不等于谐波间隔,则还要传输第一谐波偏移量参数。
对应的,解码端根据收到的上述包含编码模式参数、时域包络参数和频域包络参数的一组参数,或收到上述包含编码模式参数、时域包络参数、频域包络参数、音调参数和谐波间隔参数的一组参数,合成音频信号。
需要指出的是,如果编码端在CM等于1时还传输了音调参数,相应的解码端也要接收音调参数;如果编码端在CM等于0时还传输了第一谐波偏移量参数,相应的解码端也要接收第一谐波偏移量参数。
图4是本发明实施例的解码处理方法流程示意图;如图4所示,解码处理的具体处理过程如图4所示,具体可以包括:
41:接收到表示当前频带的音频信号的谱信号与前一个频带的音频信号间的谱信号相似的信息,或不相似的信息;例如根据接收到的数据,解码出编码模式参数CM,根据该编码模式参数CM,即可确定是否相似;
42:当前频带的音频信号的谱信号与前一个频带的音频信号间的谱信号相似时,根据对收到数据解码得到的用于表征音频信号的时域包络参数和频域包络参数,合成音频信号;不相似时,根据对收到数据解码得到的用于表征音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数,合成音频信号;
具体的,重建谱信号时:
若当前频带信号谱与前一个频带信号谱之间相似,例如CM等于1,则可以采用谱复制的方式用前一个频带的谱信号作为当前频带重建的谱信号;当然也可以采用不同于谱复制的方式重建谱信号;如果编码端CM等于1时还传输了音调参数也可以从码流中解码出音调参数,采用谱复制的方式通过前一个频带的谱重建当前频带的谱信号;具体的,可以根据音调参数,对前一个频带的谱信号做整形,得到整形后的重建谱信号,将整形后的谱信号作为当前频带重建的谱信号;
若当前频带信号谱与前一个频带信号谱之间的不相关,例如CM等于0,则从码流中解码出音调参数、谐波间隔参数和第一谐波偏移量参数,根据所述谐波间隔参数得到谐波信号;或根据所述谐波间隔参数和第一谐波偏移量参数,得到谐波信号;根据所述音调参数,调整谐波信号与噪声信号之间的比例;并根据调整后的谐波信号与噪声信号,得到重建的谱信号;即使用基于音调参数、谐波间隔参数和第一谐波偏移量参数的人工重建方法来重建高频带的谱信号;需要说明的是,当编码的码流中没有传输第一谐波偏移量参数时,解码端第一谐波偏移量参数等于谐波间隔参数。
根据解码出的频域包络对重建的谱信号进行频域整形,例如进行频域去归一化处理,并将整形后的谱信号变换到时域;可以通过逆MDCT变换,也可以通过逆FFT变换将修整后的谱信号变换到时域,但是必须与编码端采用的变换方法相对应;
根据解码出的时域包络参数进行时域整形处理,例如时域去归一化处理,得到参数音频解码出的高频信号;得到合成的音频信号。
需要说明的是,上述频域整形与时域整形的顺序不唯一,即也可以先对重建的谱信号进行时域整形,再进行频域整形。例如:根据所述频域包络参数对所述重建的谱信号进行频域整形处理,得到频域整形后的信号,根据所述时域包络参数对频域整形后的信号进行时域整形处理,得到合成音频信号;或者,根据所述时域包络参数对所述重建的谱信号进行时域整形处理,得到时域整形后的信号,根据所述频域包络参数对时域整形后的信号进行频域整形处理,得到合成音频信号。
上述内容描述了当用分频带的方式对音频信号进行编码时,判断当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号是否相似,当不相似时提取包含时域包络参数、频域包络参数、音调参数、谐波间隔参数和第一谐波偏移量参数的一组参数,当相似时仅提取包含时域包络参数、频域包络参数和音调参数的一组参数,也可以是仅提取包含时域包络参数和频域包络参数的一组参数,由于本发明实施例减少了编码时需要的参数的个数,同时降低了使用参数进行编码时所需要的比特数;也有效地利用了信号不同频带之间谱的相似性进一步降低了编码速率,获得更大的编码带宽。解码端根据上述参数能够在分频带解码音频信号的过程中实现针对不同信号的特征采用不同的谱信号重建方法,对信号特征的适应性更强,可以对不同信号获得同样高的合成质量。
为便于对本发明实施例的理解,下面将对本发明实施例的编码、解码具体实现方案进行详细的描述。
实施例二
在该实施例中,在编码端将输入的音频信号分为高频带信号和低频带信号,并分别对高频带信号和低频带信号进行编码处理。
图5是本发明实施例二在编码端的处理过程示意图,如图5所示,编码处理过程包括:
51:对输入的音频信号进行滤波分析;设输入的音频信号的采样率为32KHz,处理帧长为20ms;对输入的信号进行分频带、下采样处理后,对应于0~8kHz频带的信号有320个采样点,对应于8~16kHz频带的信号有320个采样点;
52:0~8kHz频带内的信号通过核心编码进行编码处理,具体应用中,核心编码可以通过G.729.1编解码器完成,也可以通过其它宽带信号编解码器完成编码,即无论采用何种编码方式,能够对0~8kHz频带内的信号进行编码即可;并输出低频信号的比特流,即输出码流;
53:对8~16kHz频带内的信号,例如时域信号{y_hi(0),y_hi(1),……,y_hi(319)},采用本发明实施例提供的编码处理方法进行参数音频编码:这里高频带即为编码处理方法中所述的当前频带,低频带即为所述的前一个频带;当高频信号的谱与低频信号的谱不具有相似性时,提取包括时域包络参数、频域包络参数、音调参数、谐波间隔参数、第一谐波偏移量参数及编码模式参数的一组参数;当具有相似性时,仅提取包括时域包络参数、频域包络参数、音调参数及编码模式参数,也可以仅提取包括时域包络参数、频域包络参数及编码模式参数的一组参数;具体处理过程可以包括:
(1)确定编码模式参数CM;具体地,可以先计算低频带信号谱与高频带信号谱之间的互相关,以确定低频带谐波结构与高频带谐波结构之间的相似性;当互相关大于某一域值时,可以判定为低频带谐波结构与高频带谐波结构之间是相似,将CM置为1,并采用谱复制整形的方式通过低频带的谱信号重建高频带的谱信号;或通过其他不同于谱复制的方式重建谱信号;当互相关小于等于所述域值时,则判定低频带谐波结构与高频带谐波结构之间是不相似的,将CM置为0,并根据参数人工重建出高频带的谱信号;当然在实际的应用中也可以采用一种简单的方式来进行编码模式判定,即当谐波间隔PG小于某一域值时,将CM置为1;否则置为0;
(2)计算信号的子帧能量包络{temp_env(0),temp(1),……,temp(N-1)}和全局增益因子gain,在本实施例中N=8;并根据这两组值判断信号是稳态信号或是瞬态信号;若是稳态信号,则对全局增益因子gain进行量化,将得到的量化值作为时域包络参数,并进行编码写入码流;如果是瞬态信号,则对子帧能量包络进行量化,将得到的量化值作为时域包络参数,并进行编码写入码流;并根据时域包络参数对8~16kHz频带信号进行时域归一化处理,得到时域归一化后的信号;
(3)时域归一化后的信号经过MDCT(修正的离散余弦变换,Modified Discrete CosineTransform)变换(例如640点)后得到了一组MDCT系数,即该频带对应的频域信号{y_swb(0),y_swb(1),……,y_swb(319)},由于超宽带编码器只要求处理8~14kHz频带内的信号,所以对频域信号仅处理{y_swb(0),y_swb(1),……,y_swb(239)}部分;处理时将这组频域信号分为N个子带,提取每个子带的子代能量并量化,得到一组量化后的频域包络{spec_env(0),spec_env(1),……,spec_env(N-1)},即为8~14kHz频带内的频域包络参数;
由于对于宽带核心编码器G.729.1,7~8kHz部分信号已不在其处理范围内,为了确保在解码端解码信号频谱的连续性,还需要提取7~8kHz部分的信号的特征参数;由于G.729.1编码器对4~8kHz的信号进行了MDCT变换(例如320点),对应的频域信号{y_wb(0),y_wb(1),……,y_wb(159)},其中7~8kHz对应的频域信号为{y_wb(120),y_wb(121),……,y_wb(159)},将其分为M个子带,提取每个子带的频域包络并量化,得到一组7~8kHz频带内的量化后的频域包络{spec_env_extra(0),spec_env_extra(1),……,spec_env_extra(M-1)},与8~14kHz频带内的频域包络参数一起组成整个的频域包络参数;这组包络经过编码可以传输到解码端;在本实施例中N=15,M=3;
(4)提取音调参数;具体的,可以直接在MDCT域进行参数提取;为了进一步提高编码器的性能,也可以不直接在MDCT域进行参数提取,而是根据原始频域信号{y_swb(0),y_swb(1),……,y_swb(239)}计算伪谱信号,并根据此伪谱信号计算音调参数;
具体的伪谱信号S(k)={S(0),S(1),……,S(239)}可以按照下面的公式计算:
S ( k ) = y _ swb 2 ( 0 ) + y _ swb 2 ( 1 ) , k = 0 y _ swb 2 ( 239 ) + y _ swb 2 ( 238 ) , k = 239 y _ swb 2 ( k ) + ( y _ swb ( k + 1 ) - y _ swb ( k + 1 ) ) 2 , otherwise ,
当然也可以通过其它方法,如对原始频域信号直接取绝对值得到的{|y_swb(0)|,|y_swb(1)|,……,|y_swb(239)|}进行计算;接着计算自相关函数ACF(k0),自相关函数可以由伪谱信号通过频域计算得到,例如ACF(k0)=IFFT(|FFT(S(k))|2),其中FFT为快速傅立叶变换,IFFT为其逆变换;此外,也可以直接计算得到,例如 ACF ( k 0 ) = Σ k = 0 239 S ( k ) S ( k + k 0 ) ; 另外,还可以使用平均幅度差函数(AMDF)来增强自相关函数;
音调参数可以通过自相关函数的最大值与最小值之间的比值表示,例如T=max(ACF(k0))/min(ACF(k0)),其中最大值和最小值的获取是在期望的范围内或者是在对谐波间隔参数计算有益的范围内进行的;
(5)根据ACF(k0),估计谐波间隔参数PG;高频带信号的谐波间隔参数,通常是在频域(或变换域)下提取的;谐波间隔的整数值可以通过峰值提取方法由自相关函数估计出来,例如根据PG=argmax(ACF(k0))获得,其中最大值的获取可以是限定在一个期望的范围内或者是感兴趣的范围内进行的,谐波间隔的分数值可以在适当地内插自相关函数ACF(k0)之后,通过峰值提取的方法获得;也可以只在求得的整数谐波间隔附近进行自相关函数的内插计算,之后通过峰值提取的方法获得谐波间隔的分数值;
(6)还可以对估计的谐波间隔参数值进行修正,以抑制倍频和分数频的产生;例如,将求得的当前帧的谐波间隔PG与前一帧的谐波间隔old_PG进行比较,如果当前帧的谐波间隔与前一帧谐波间隔之间的比值小于某个域值(如0.1)且ACF(old_PG)>0.95ACF(PG),则用前一帧的谐波间隔代替本帧求得的谐波间隔PG=old_PG;
(7)根据谐波间隔,估计第一谐波偏移量参数P0;例如,具体的可以在谐波间隔范围内,即[0,PG]范围内,将第一谐波分量分别置于不同偏移位置,并按谐波间隔依次放置其它谐波,并计算由此产生的谱与伪谱之间的相关性,相关性最大的偏移位置即所求的第一谐波偏移量,例如
Figure G2008101191706D00171
其中
Figure G2008101191706D00172
表示向下取整;需要指出的是,实际上谐波间隔参数与第一谐波偏移量参数之间也存在着一定程度上的相关性,因此可以通过谐波间隔参数估计出高频带信号的第一谐波偏移量参数;同时,第一谐波偏移量参数也可以用来进一步修正谐波间隔参数的估计值,从而达到更优的参数提取效果;
(8)当CM等于1时,包含编码模式参数、时域包络参数、频域包络参数、及音调参数的一组参数将会被量化或编码,并传输到解码端(即传输高频参数比特流);当CM等于0时,包含了编码模式参数、时域包络参数、频域包络参数、音调参数、谐波间隔参数及第一谐波偏移量参数的一组参数,将会被量化或编码,并传输到解码端(即传输高频参数比特流);
需要指出的是,当CM等于1时,也可以只将包含编码模式参数、时域包络参数和频域包络参数的一组参数量化或编码,并传输到解码端;
54:当完成高频带信号的参数音频编码后,可以根据所剩的编码比特数选择是否利用可选择的RIRAC音频编码对参数音频编码后的高频信号进行增强;本实施例采用的增强方式是对高频带信号在MDCT域进行变换编码;当然也可以选用其它方式对参数音频编码后的高频信号进行增强,如对高频带原始信号与高频带音频编码后的残差信号进行变换编码等;并传输高频增强比特流。
对应的,解码端收到上述低频比特流、高频参数比特流、高频增强比特流之后,进行解码,并合成音频信号;图6是本发明实施例二在解码端的处理过程示意图,如图6所示,解码具体处理过程可以包括:
61:0~8kHz频带内的信号合成通过核心解码完成;
62:8~16kHz频带内的信号合成则通过参数音频解码完成;具体处理包括:(1)根据接收到的数据,解码出编码模式参数CM;
(2)从数据中解码出时域包络参数、频域包络参数;
(3)若CM等于1,则可以从收到的数据中解码出音调参数,采用谱复制整形的方式通过低频带的谱重建高频带的谱信号,或通过其它不同于谱复制的方式重建谱信号;例如具体的,可以根据音调参数,对通过核心解码得到的低频带信号的谱信号做整形,将整形后的谱信号作为重建的高频带谱信号;
需要指出的是,当编码端在CM等于1时没有传输音调参数,则解码端将核心解码得到的低频带的谱信号直接作为重建的高频带谱信号;
若CM等于0,则可以从收到的数据中解码出音调参数、谐波间隔参数和第一谐波偏移量参数,使用基于音调参数、谐波间隔参数和第一谐波偏移量参数的人工重建方法来重建高频带的谱信号;谱信号的重建方法基于谐波信号加噪声信号;具体地,具有随机相位的谐波以脉冲的形式被置于频域范围内的某些频点之上,从而重建谐波信号,其中脉冲的间隔由谐波间隔参数决定,第一个脉冲的位置可以根据第一谐波偏移量得到;噪声信号可以由一个随机数产生器获得;根据音调参数T的值,调整谐波信号与噪声信号之间的比例;并将调整后的谐波信号与噪声信号相加,得到重建的谱信号;具体的调整可以有多种,例如:先分别计算谐波信号与噪声信号的能量,记作enerP和enerN,再计算调整因子β1=1-T和 β 2 = enerP enerN * T , 并得到重建的谱信号 S ^ ( k ) = β 1 buf _ pulses ( k ) + β 2 buf _ noise ( k ) ;
(4)根据解码出的频域包络对重建的谱信号进行频域整形,例如频域去归一化处理,并将整形后的谱信号变换到时域;例如,可以通过逆MDCT变化,也可以通过逆FFT变换将修整后的谱信号变换到时域;
(5)根据解码出的时域包络参数进行时域整形处理,例如时域去归一化处理,得到解码出的高频信号;
需要说明的是,在时域和频域去归一化处理中,还可以对时域包络和频域包络进行一种可选择的平滑滤波处理。如果高频带的谱信号是按照人工重建的方式进行的,一旦谐波被放置到错误的子带中,此时去归一化所用的将是错误的包络因子。若谐波位置出现轻微的偏差,就会引入一定程度的失真,使用平滑滤波可以减轻这种失真。具体地,如果在接近子带边界的附近有一个非常强的音调成分,那么就可以用内插后的子带能量包络因子进行频域去归一化处理;然后将得到的信号变换到时域,再由自适应的子帧能量包络(ATE)在时域内插出时域增益函数;这个时域增益函数最后可以被用来对时域信号进行去归一化处理;
63:在62完成高频带信号的解码后,可以根据接收到的数据中所剩的比特数选择是否对编码后的高频信号进行增强,具体的方法与编码端采用的增强方式相对应,这里不再赘述;
64:将0~8kHz频带的合成信号,与8~16kHz频带的合成信号通过QMF合成滤波,即可得到最终的32kHz采样率的合成音频信号。
实施例二中,在将音频信号分为低频带信号和高频带信号的情况下,对其中的高频带信号进行参数编码、解码处理,即采用编码模式参数指示利用表征信号的包含时域包络、频域包络、音调、谐波间隔和第一谐波偏移量的一组参数来完成编解码,或者利用表征信号的包含时域包络、频域包络和音调的一组参数,来完成编解码。本发明实施例采用的一组参数,减少了编码时需要的参数的个数,同时降低了使用参数进行编码时所需要的比特数;从而解决了现有编码方法比特数较高的问题;同时,与现有的参数音频编码算法相比,由于本发明实施例的这组参数可以用更少的比特数进行编码,从而进一步降低信号的编码速率,并且当信道的传输能力一定时,由于木发明的编码比特数较低,因此能够编码具有更高带宽的信号,实现了用更低的编码速率获得更大的编码带宽及更高的编码质量。同时在解码端可以实现利用更少的比特数来合成音频信号,且该音频信号质量较高;并且,当音频信号的谐波结构明显时,解码得到的音频质量更佳。
实施例三
相对于实施例二采用了先提取时域包络参数后提取频域包络参数的方法,实施例三则采用了先提取频域包络参数的方法来实现编码(以实施例三中的音频信号与分频带方法,与实施例二中的相同为例)。
本实施例中,在编码端对高频带信号处理的过程具体可以包括:
(1):按照实施例二中编码端的(1)中的方法确定编码模式参数CM;
(2):8~16kHz频带内的时域信号经过MDCT变换后得到了一组MDCT系数,由于超宽带部分仅处理8~14kHz频带内的信号,所以对频域信号仅处理{y_swb(0),y_swb(1),……,y_swb(239)}部分;对于核心编码,7~8kHz部分信号已不在其处理范围之内,为了确保在解码端解码信号频谱的连续性,在编码端需要提取7~8kHz部分MDCT变换域信号{y_wb(120),y_wb(121),……,y_wb(159)};
(3):对7~14kHz频带内的MDCT系数进行分带,并计算各自的子带能量,作为频域包络参数,并对其量化后编码传输;
(4):对7~14kHz频带内的MDCT系数进行频域归一化处理,并根据频域归一化以后的MDCT系数提取线性预测系数,作为时域包络参数,并对这组线性预测系数量化后编码传输;
(5):对于频域归一化的MDCT系数进行线性预测滤波,得到MDCT域的线性预测残差;
(6):按照实施例二中编码端53的(4)~(8)中的方法提取出高频信号的音调参数、谐波间隔参数以及第一谐波偏移量参数;当编码模式为1时,只传输编码模式参数、时域包络参数、频域包络参数和音调参数到解码端;当编码模式为0时,则将编码模式参数、时域包络参数、频域包络参数、音调参数、谐波间隔参数和第一谐波偏移量参数一起传输到解码端;
对应的,解码端对高频带信号的处理的过程具体可以包括:
(7):根据接收到的码流,解码出编码模式参数CM;并从码流中解码出时域包络参数、频域包络参数;具体地,可以通过码书查找获得量化后的线性预测系数,即时域包络参数;以便于随后根据该获得的线性预测系数进行时域整形处理;通过码书查找获得量化后的子带能量,即频域包络参数;以便于随后根据该获得的子带能量进行频域整形处理;
(8):按照实施例二中解码端62中的(3)中的方法重建高频带的谱信号;
(9):使重建的高频带谱信号通过线性预测逆滤波器,也即相当于对重建的高频带谱信号进行时域整形处理;
(10):根据量化后的子带能量,对重建的高频带谱信号进行频域整形处理;
(11):通过逆MDCT变换,将整形后的高频带谱信号变换到时域,得到最终的高频带合成信号。
由上述描述可知,实施例三采用了先提取频域包络参数的方法来实现编码,由于获取上述各参数的顺序不唯一,即不论以何种顺序,只要获取上述音频信号的编码模式参数、时域包络参数,频域包络参数,音调参数,谐波间隔参数和第一谐波偏移量参数即可。本发明实施例采用的一组参数,减少了编码时需要的参数的个数,同时降低了使用参数进行编码时所需要的比特数;从而解决了现有编码方法比特数较高的问题;同时,与现有的参数音频编码算法相比,由于本发明实施例的这组参数可以用更少的比特数进行编码,从而进一步降低信号的编码速率,并且当信道的传输能力一定时,由于本发明的编码比特数较低,因此能够编码具有更高带宽的信号,实现了用更低的编码速率获得更大的编码带宽及更高的编码质量。同时在解码端可以实现利用更少的比特数来合成音频信号,且该音频信号质量较高;并且,当音频信号的谐波结构明显时,解码得到的音频质量更佳。
本发明实施例还提供了相应的音频编码装置,其结构如图7所示,具体实现结构可以包括:
参数提取单元71,用于提取用于表征音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数;当所述音频信号的谐波间隔与第一谐波偏移量的值不同时,还用于提取用于表征所述音频信号的第一谐波偏移量参数,并传送至发送单元;
发送单元72,用于将所述时域包络参数、频域包络参数、音调参数和谐波间隔参数编码后,传输给解码端,具体的,例如:对所述时域包络参数、频域包络参数、音调参数和谐波间隔参数,进行编码后,传输给解码端;或者用于将所述时域包络参数、频域包络参数、音调参数、谐波间隔参数和第一谐波偏移量参数编码后传输给解码端。
本发明实施例还提供了相应的音频解码装置,其结构如图8所示,具体实现结构可以包括:
解码单元81,用于对收到的数据进行解码,得到用于表征音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数;还用于对收到的包含第一谐波偏移量参数的数据进行解码,得到用于表征所述音频信号的第一谐波偏移量参数;
合成单元82,用于根据时域包络参数、频域包络参数、音调参数和谐波间隔参数;或者时域包络参数、频域包络参数、音调参数、谐波间隔参数和第一谐波偏移量参数,合成音频信号;具体可以包括:
谐波重建子单元821,用于根据所述谐波间隔参数,得到谐波信号;或当所述用于表征音频信号的谐波间隔与第一谐波偏移量不同时,根据所述谐波间隔参数和所述第一谐波偏移量参数,得到谐波信号;
谱信号重建子单元822,用于根据所述音调参数,调整所述谐波重建子单元821得到的谐波信号与噪声信号之间的比例;并根据调整后的谐波信号与噪声信号,得到重建的谱信号;
整形子单元823,用于根据所述频域包络参数和时域包络参数对所述谱信号重建子单元822重建的谱信号进行处理,得到合成音频信号;例如:根据所述频域包络参数对所述重建的谱信号进行频域整形处理,得到频域整形后的信号,根据所述时域包络参数对频域整形后的信号进行时域整形处理,得到所述合成音频信号;或者,根据所述时域包络参数对所述重建的谱信号进行时域整形处理,得到时域整形后的信号,根据所述频域包络参数对时域整形后的信号进行频域整形处理,得到所述合成音频信号。
本发明实施例还提供了相应的音频编解码系统,其结构如图9所示,具体实现结构可以包括:
编码装置91,用于提取用于表征音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数;对所述用于表征音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数编码后,发送至解码装置;具体可以包括:
参数提取单元911,用于提取音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数;当所述音频信号的谐波间隔与第一谐波偏移量的值不同时,还用于提取所述音频信号的第一谐波偏移量参数;
发送单元912,用于将所述时域包络参数、频域包络参数、音调参数和谐波间隔参数;或者所述时域包络参数、频域包络参数、音调参数、谐波间隔参数和第一谐波偏移量参数,编码后传输给解码装置;
解码装置92,用于对所述编码装置发送来的数据进行解码,得到所述时域包络参数、频域包络参数、音调参数和谐波间隔参数;根据所述时域包络参数、频域包络参数、音调参数和谐波间隔参数合成音频信号;具体可以包括:
解码单元921,用于对收到的数据进行解码,得到所述时域包络参数、频域包络参数、音调参数和谐波间隔参数,或者所述时域包络参数、频域包络参数、音调参数、谐波间隔参数和第一谐波偏移量参数;
合成单元922,用于根据所述时域包络参数、频域包络参数、音调参数和谐波间隔参数,或者所述时域包络参数、频域包络参数、音调参数、谐波间隔参数和第一谐波偏移量参数,合成音频信号。
本发明实施例还提供了相应的编码处理装置,其结构如图10所示,具体实现结构可以包括:
判断单元101,用于判断当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号是否相似;具体的,可以用编码模式参数的值来表示是否相似的信息;
编码单元102,用于根据所述判断单元101得到的判断结果信息,在当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号相似时,提取用于表征音频信号的时域包络参数和频域包络参数,还用于提取音调参数;或者,在当前频带的音频信号的谱信号与前一个频带的音频信号间的谱信号不相似时,提取用于表征音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数;在所述音频信号的谐波间隔与第一谐波偏移量的值不同时,还用于提取所述音频信号的第一谐波偏移量参数;
传输单元103,用于发送所述判断单元101得到的当前频带的音频信号的谱信号与前一个频带的音频信号间的谱信号相似的信息,例如将编码模式参数编码后发送;还用于对所述编码单元提取的所述音频信号的时域包络参数和频域包络参数(还可以包括音调参数)进行编码后发送;或者,发送所述判断单元得到的当前频带的音频信号的谱信号与前一个频带的音频信号间的谱信号不相似的信息,对所述编码单元提取的音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数(还可以包括第一谐波偏移量参数)进行编码后发送。
本发明实施例还提供了相应的解码处理装置,其结构如图11所示,具体实现结构可以包括:
接收信息单元111,用于接收表示当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号相似的信息,并对收到的数据解码得到用于表征音频信号的时域包络参数和频域包络参数;或者,接收表示当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号不相似的信息,并对收到的数据解码得到用于表征音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数;还用于对包含第一谐波偏移量参数的数据解码,得到用于表征音频信号的第一谐波偏移量参数;具体的,接收信息单元111可以根据接收到的编码模式参数,确定所述当前频带的音频信号的谱信号与前一个频带的音频信号间的谱信号相似或不相似;
解码单元112,用于根据所述接收信息单元111接收的所述相似的信息,以及所述用于表征音频信号的时域包络参数和频域包络参数,合成音频信号;或者,根据所述不相似的信息,以及所述用于表征音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数,合成音频信号;具体的:
当接收到当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号相似的信息,所述解码单元112,具体如图12所示,可以包括:
重建子单元121:用于重建谱信号,得到重建的谱信号;
第二整形子单元122:用于根据所述音调参数,对所述重建子单元121重建的谱信号进行整形处理,得到整形后的重建谱信号;
第一整形子单元123:用于根据所述频域包络参数和时域包络参数对所述重建的谱信号(或整形后的谱信号)进行处理得到合成音频信号;例如:根据所述频域包络参数和时域包络参数对所述第二整形子单元整形处理后的重建的谱信号进行处理,包括:根据所述频域包络参数对所述重建的谱信号进行频域整形处理,得到频域整形后的信号;根据所述时域包络参数对频域整形后的信号进行时域整形处理,得到所述合成音频信号;或,根据所述时域包络参数对所述重建的谱信号进行时域整形处理,得到时域整形后的信号;根据所述频域包络参数对时域整形后的信号进行频域整形处理,得到所述合成音频信号;
当接收到当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号不相似的信息,所述解码单元112,具体如图12所示,可以包括:
谐波重建子单元124,用于根据所述谐波间隔参数,得到谐波信号;或根据所述谐波间隔参数和第一谐波偏移量参数,得到谐波信号;
谱信号重建子单元125,用于根据所述音调参数,调整谐波信号与噪声信号之间的比例,并根据调整后的谐波信号与噪声信号,得到重建的谱信号;
第三整形子单元126,用于根据所述频域包络参数和时域包络参数对所述重建的谱信号进行处理得到合成音频信号。例如,根据所述频域包络参数对所述重建的谱信号进行频域整形处理,得到频域整形后的信号;根据所述时域包络参数对频域整形后的信号进行时域整形处理,得到所述合成音频信号;或,根据所述时域包络参数对所述重建的谱信号进行时域整形处理,得到时域整形后的信号;根据所述频域包络参数对时域整形后的信号进行频域整形处理,得到合成音频信号。
上述各个本发明实施例可以但不限于应用于音频编解码设备中。
综上所述,本发明各实施例和现有技术中相比,由于本发明实施例采用包含时域包络参数、频域包络参数、音调参数和谐波间隔参数(还可以包括第一谐波偏移量参数)的一组参数,来表征音频信号,在对音频信号编码时可以实现在现有基础上降低了使用参数进行编码时所需要的比特数,可以用更少的比特数对信号进行编码,进一步降低信号的编码速率,从而用更低的编码速率获得更大的编码带宽以及更高的编码质量,特别是对谐波结构明显的信号,采用本发明实施例可以获得很好的编码质量。同时本发明实施例提供的编码、解码处理技术方案中,当用分频带的方式对音频信号进行编码时,判断当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号是否相似,当不相似时提取包含时域包络参数、频域包络参数、音调参数和谐波间隔参数(还可以包括第一谐波偏移量参数)的一组参数,当相似时仅提取包含时域包络参数、频域包络参数(还可以包括音调参数)的一组参数,有效地利用了信号不同频带之间谱的相似性进一步降低了编码速率,获得更大的编码带宽。解码端根据上述参数能够在分频带解码音频信号的过程中实现针对不同信号的特征采用不同的谱信号重建方法,对信号特征的适应性更强,可以对不同信号获得同样高的合成质量。换句话说,当信道的传输能力一定时,由于本发明的编码比特数较低,因此能够编码具有更高带宽的信号。由于从听觉上讲信号的带宽越大获得听觉感受越好,因此当信道的传输能力一定时,本发明提供的方法可以获得更高的编码带宽及更高的合成质量。并且本发明实施例提供的一种对音频信号进行分频带编码、解码处理的技术方案,能够在分频带编解码音频信号的过程中实现用更低的编码速率获得更大的编码带宽,获得更高的编码质量。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (27)

1.一种音频编码方法,其特征在于,包括:
提取用于表征音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数,音调参数表征音频信号中谐波信号与噪声信号之间的比例;
将所述时域包络参数、频域包络参数、音调参数和谐波间隔参数编码后,传输给解码端;
所述方法还包括:当所述音频信号的谐波间隔与第一谐波偏移量的值不同时,进一步提取用于表征所述音频信号的第一谐波偏移量参数,并对其进行编码后,传输给所述解码端,第一谐波偏移量参数表征了音频信号第一个谐波的位置。
2.一种音频编码装置,其特征在于,包括:
参数提取单元,用于提取用于表征音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数,音调参数表征音频信号中谐波信号与噪声信号之间的比例;
发送单元,用于将所述时域包络参数、频域包络参数、音调参数和谐波间隔参数编码后,传输给解码端;
所述参数提取单元,还用于:
当所述音频信号的谐波间隔与第一谐波偏移量的值不同时,进一步提取用于表征所述音频信号的第一谐波偏移量参数,并传送至所述发送单元,第一谐波偏移量参数表征了音频信号第一个谐波的位置;
所述发送单元,还用于将第一谐波偏移量参数编码后,传输给解码端。
3.一种音频解码方法,其特征在于,包括:
对收到的数据进行解码,得到用于表征音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数,音调参数表征音频信号中谐波信号与噪声信号之间的比例;
根据所述时域包络参数、频域包络参数、音调参数和谐波间隔参数,合成音频信号,所述合成音频信号的步骤包括:
根据所述谐波间隔参数得到谐波信号;
根据所述音调参数,调整所述谐波信号与噪声信号之间的比例;根据调整后的谐波信号与噪声信号,得到重建的谱信号;
根据所述频域包络参数和时域包络参数对所述重建的谱信号进行处理得到合成音频信号;
所述方法还包括:对收到的包含第一谐波偏移量参数的数据进行解码,得到用于表征所述音频信号的第一谐波偏移量参数,第一谐波偏移量参数表征了音频信号第一个谐波的位置,所述合成音频信号的步骤包括:
根据所述谐波间隔参数和所述第一谐波偏移量参数得到谐波信号;
根据所述音调参数,调整所述谐波信号与噪声信号之间的比例;根据调整后的谐波信号与噪声信号,得到重建的谱信号;
根据所述频域包络参数和时域包络参数对所述重建的谱信号进行处理得到合成音频信号。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:当所述用于表征音频信号的谐波间隔与第一谐波偏移量参数不同时,接收包含第一谐波偏移量参数的数据,对收到的数据进行解码,得到用于表征所述音频信号的第一谐波偏移量参数。
5.根据权利要求3或4所述的方法,其特征在于,所述根据所述频域包络参数和时域包络参数对所述重建的谱信号进行处理得到合成音频信号,包括:
根据所述频域包络参数对所述重建的谱信号进行频域整形处理,得到频域整形后的信号,根据所述时域包络参数对频域整形后的信号进行时域整形处理,得到所述合成音频信号;
或者,
根据所述时域包络参数对所述重建的谱信号进行时域整形处理,得到时域整形后的信号,根据所述频域包络参数对时域整形后的信号进行频域整形处理,得到所述合成音频信号。
6.一种音频解码装置,其特征在于,包括:
解码单元,用于对收到的数据进行解码,得到用于表征音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数,音调参数表征音频信号中谐波信号与噪声信号之间的比例;
合成单元,用于根据所述时域包络参数、频域包络参数、音调参数和谐波间隔参数,合成音频信号;所述合成单元,包括:
谐波重建子单元,用于根据所述谐波间隔参数得到谐波信号;或当所述用于表征音频信号的谐波间隔与第一谐波偏移量不同时,根据所述谐波间隔参数和所述第一谐波偏移量参数,得到谐波信号;
谱信号重建子单元,用于根据所述音调参数,调整所述谐波重建子单元得到的谐波信号与噪声信号之间的比例;并根据调整后的谐波信号与噪声信号,得到重建的谱信号;
整形子单元,用于根据所述频域包络参数和时域包络参数对所述重建的谱信号进行处理,得到合成音频信号;
所述解码单元还用于:
对收到的包含第一谐波偏移量参数的数据进行解码,得到用于表征所述音频信号的第一谐波偏移量参数,第一谐波偏移量参数表征了音频信号第一个谐波的位置。
7.一种音频编解码系统,其特征在于,包括:
如权利要求2所述的编码装置;
以及如权利要求6所述的解码装置。
8.一种编码处理方法,其特征在于,包括:
当用分频带的方式对音频信号进行编码时,若当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号相似,则提取用于表征音频信号的时域包络参数和频域包络参数,并将所述时域包络参数和频域包络参数编码后发送,同时发送表示当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号相似的信息;
若当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号不相似,则提取用于表征音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数,并将所述时域包络参数、频域包络参数、音调参数和谐波间隔参数编码后发送,同时发送表示当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号相似的信息,音调参数表征音频信号中谐波信号与噪声信号之间的比例;
所述表示当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号相似或不相似的信息,具体用编码模式参数表示。
9.根据权利要求8所述的方法,其特征在于,所述方法,还包括:
所述编码模式参数,用于指示解码端在当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号相似时,根据所述音频信号的时域包络参数和频域包络参数对当前频带的音频信号进行解码,以及指示解码端在当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号不相似时,根据所述用于表征音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数,对当前频带的音频信号进行解码。
10.根据权利要求8所述的方法,其特征在于,所述方法还包括:所述提取用于表征音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数时,当所述音频信号的谐波间隔与第一谐波偏移量的值不同时,还提取所述音频信号的第一谐波偏移量参数,并对其编码后发送。
11.根据权利要求8所述的方法,其特征在于,所述方法还包括:所述提取用于表征音频信号的时域包络参数和频域包络参数时,还提取所述音频信号的音调参数,并对其编码后发送。
12.一种编码处理装置,其特征在于,包括:
判断单元,用于判断表示当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号是否相似;
编码单元,用于根据所述判断单元得到的判断结果信息,在当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号相似时,提取用于表征音频信号的时域包络参数和频域包络参数;或者,在当前频带的音频信号的谱信号与前一个频带的音频信号间的谱信号不相似时,提取用于表征音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数,音调参数表征音频信号中谐波信号与噪声信号之间的比例;所述表示当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号相似或不相似的信息,具体用编码模式参数表示;
传输单元,用于发送所述判断单元得到的当前频带的音频信号的谱信号与前一个频带的音频信号间的谱信号相似的信息,对所述编码单元提取的所述音频信号的时域包络参数和频域包络参数进行编码后发送;或者,发送所述判断单元得到的当前频带的音频信号的谱信号与前一个频带的音频信号间的谱信号不相似的信息,对所述编码单元提取的音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数进行编码后发送。
13.根据权利要求12所述的编码处理装置,其特征在于,
所述编码单元,进行所述在当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号不相似时,提取用于表征音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数时,还用于:
在所述音频信号的谐波间隔与第一谐波偏移量的值不同时,提取所述音频信号的第一谐波偏移量参数;
所述传输单元,还用于将所述第一谐波偏移量参数编码后发送。
14.根据权利要求12所述的编码处理装置,其特征在于,
所述编码单元,进行所述在当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号相似时,提取用于表征音频信号的时域包络参数和频域包络参数时,还用于:提取所述音频信号的音调参数;
所述传输单元,还用于将所述音调参数编码后发送。
15.一种解码处理方法,其特征在于,包括:
接收编码端发送的数据,若接收到表示当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号相似的信息,根据用于表征音频信号的时域包络参数和频域包络参数合成音频信号,其中,所述时域包络参数和频域包络参数是从接收到的数据中解码得到;
若接收到表示当前频带的音频信号的谱信号与前一个频带的音频信号间的谱信号不相似的信息,根据用于表征音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数合成音频信号,其中,所述时域包络参数、频域包络参数、音调参数和谐波间隔参数是从接收到的数据中解码得到,音调参数表征音频信号中谐波信号与噪声信号之间的比例;所述表示当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号相似或不相似的信息,具体用编码模式参数表示。
16.根据权利要求15所述的方法,其特征在于,所述表示当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号相似或不相似的信息具体用编码模式参数表示,所述方法包括:
根据接收到的编码模式参数,确定所述当前频带的音频信号的谱信号与前一个频带的音频信号间的谱信号相似或不相似。
17.根据权利要求16所述的方法,其特征在于,若当前频带的音频信号的谱信号与前一个频带的音频信号间的谱信号相似,则所述合成音频信号的步骤包括:
重建谱信号;根据所述频域包络参数和时域包络参数对所述重建的谱信号进行处理得到合成音频信号。
18.根据权利要求17所述的方法,其特征在于,所述重建谱信号,包括:
采用谱复制的方式重建谱信号。
19.根据权利要求17所述的方法,其特征在于,所述编码端发送的数据还包括:用于表征所述音频信号的音调参数;
所述重建谱信号之后还包括:
根据所述音调参数,对重建的谱信号进行整形处理,得到整形后的重建谱信号。
20.根据权利要求15所述的方法,其特征在于,所述编码端发送的数据还包括:第一谐波偏移量参数。
21.根据权利要求20所述的方法,其特征在于,若当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号不相似,则所述合成音频信号的步骤包括:
根据所述谐波间隔参数得到谐波信号;或根据所述谐波间隔参数和第一谐波偏移量参数,得到谐波信号;
根据所述音调参数,调整谐波信号与噪声信号之间的比例;并根据调整后的谐波信号与噪声信号,得到重建的谱信号;
根据所述频域包络参数和时域包络参数对所述重建的谱信号进行处理得到合成音频信号。
22.根据权利要求17或21所述的方法,其特征在于,所述根据所述频域包络参数和时域包络参数对所述重建的谱信号进行处理得到合成音频信号,包括:
根据所述频域包络参数对所述重建的谱信号进行频域整形处理,得到频域整形后的信号,根据所述时域包络参数对频域整形后的信号进行时域整形处理,得到合成音频信号;
或者,
根据所述时域包络参数对所述重建的谱信号进行时域整形处理,得到时域整形后的信号,根据所述频域包络参数对时域整形后的信号进行频域整形处理,得到合成音频信号。
23.一种解码处理装置,其特征在于,包括:
接收信息单元,用于接收表示当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号相似的信息,并对收到的数据解码得到用于表征音频信号的时域包络参数和频域包络参数;或者,接收表示当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号不相似的信息,并对收到的数据解码得到用于表征音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数,音调参数表征音频信号中谐波信号与噪声信号之间的比例;所述表示当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号相似或不相似的信息,具体用编码模式参数表示;
解码单元,用于根据所述接收信息单元接收的所述相似的信息,以及所述时域包络参数和频域包络参数,合成音频信号;或者,根据所述不相似的信息,以及所述时域包络参数、频域包络参数、音调参数和谐波间隔参数,合成音频信号。
24.根据权利要求23所述的装置,其特征在于,当接收到当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号相似的信息,所述解码单元,具体包括:
重建子单元:用于重建谱信号;
第一整形子单元:用于根据所述频域包络参数和时域包络参数对所述重建的谱信号进行处理得到合成音频信号。
25.根据权利要求24所述的装置,其特征在于,所述接收信息单元还用于对接收到的包含音调参数的数据解码,并得到用于表征音频信号的音调参数;
所述解码单元还包括:
第二整形子单元:用于根据所述音调参数,对所述重建子单元重建的谱信号进行整形处理,得到整形后的重建谱信号;
所述第一整形子单元,根据所述频域包络参数和时域包络参数对所述第二整形子单元整形处理后的重建的谱信号进行处理得到所述合成音频信号。
26.根据权利要求23所述的装置,其特征在于,当接收到当前频带的音频信号的谱信号与前一个频带的音频信号的谱信号不相似的信息,所述接收信息单元对收到的数据解码得到用于表征音频信号的时域包络参数、频域包络参数、音调参数和谐波间隔参数时,还接收包含第一谐波偏移量参数的数据,并解码得到用于表征音频信号的第一谐波偏移量参数。
27.根据权利要求26所述的装置,其特征在于,所述解码单元,包括:
谐波重建子单元,用于根据所述谐波间隔参数,得到谐波信号;或根据所述谐波间隔参数和第一谐波偏移量参数,得到谐波信号;
谱信号重建子单元,用于根据所述音调参数,调整谐波信号与噪声信号之间的比例,并根据调整后的谐波信号与噪声信号,得到重建的谱信号;
第三整形子单元,用于根据所述频域包络参数和时域包络参数对所述重建的谱信号进行处理得到合成音频信号。
CN2008101191706A 2008-08-28 2008-08-28 音频编码、解码方法及装置、系统 Expired - Fee Related CN101662288B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN2008101191706A CN101662288B (zh) 2008-08-28 2008-08-28 音频编码、解码方法及装置、系统
PCT/CN2009/073559 WO2010022661A1 (zh) 2008-08-28 2009-08-27 音频编码、解码方法及装置、系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2008101191706A CN101662288B (zh) 2008-08-28 2008-08-28 音频编码、解码方法及装置、系统

Publications (2)

Publication Number Publication Date
CN101662288A CN101662288A (zh) 2010-03-03
CN101662288B true CN101662288B (zh) 2012-07-04

Family

ID=41720840

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008101191706A Expired - Fee Related CN101662288B (zh) 2008-08-28 2008-08-28 音频编码、解码方法及装置、系统

Country Status (2)

Country Link
CN (1) CN101662288B (zh)
WO (1) WO2010022661A1 (zh)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5316896B2 (ja) * 2010-03-17 2013-10-16 ソニー株式会社 符号化装置および符号化方法、復号装置および復号方法、並びにプログラム
CN103516440B (zh) * 2012-06-29 2015-07-08 华为技术有限公司 语音频信号处理方法和编码装置
CN104243734B (zh) * 2013-06-18 2019-03-01 深圳市共进电子股份有限公司 音频处理系统和方法
EP2916319A1 (en) 2014-03-07 2015-09-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for encoding of information
JP6457552B2 (ja) * 2014-11-27 2019-01-23 日本電信電話株式会社 符号化装置、復号装置、これらの方法及びプログラム
RU2679254C1 (ru) * 2015-02-26 2019-02-06 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для обработки аудиосигнала для получения обработанного аудиосигнала с использованием целевой огибающей во временной области
US9768793B2 (en) * 2015-12-17 2017-09-19 Analog Devices Global Adaptive digital quantization noise cancellation filters for mash ADCs
CN106920559B (zh) * 2017-03-02 2020-10-30 奇酷互联网络科技(深圳)有限公司 通话音的优化方法、装置及通话终端
CN113192521B (zh) * 2020-01-13 2024-07-05 华为技术有限公司 一种音频编解码方法和音频编解码设备
CN113593586B (zh) * 2020-04-15 2025-01-10 华为技术有限公司 音频信号编码方法、解码方法、编码设备以及解码设备
CN113963703A (zh) * 2020-07-03 2022-01-21 华为技术有限公司 一种音频编码的方法和编解码设备
CN113948094A (zh) * 2020-07-16 2022-01-18 华为技术有限公司 音频编解码方法和相关装置及计算机可读存储介质
CN113821934B (zh) * 2021-09-30 2024-01-19 国网青海省电力公司电力科学研究院 一种工况参数的预测方法、装置、设备及存储介质
CN114067817B (zh) * 2021-11-08 2025-03-25 易兆微电子(杭州)股份有限公司 低音增强方法、装置、电子设备及存储介质
CN114550732B (zh) * 2022-04-15 2022-07-08 腾讯科技(深圳)有限公司 一种高频音频信号的编解码方法和相关装置
CN114566174B (zh) * 2022-04-24 2022-07-19 北京百瑞互联技术有限公司 一种优化语音编码的方法、装置、系统、介质及设备
CN114743559B (zh) * 2022-05-25 2024-11-08 北京百瑞互联技术股份有限公司 一种语音降噪方法、装置、系统、介质及设备
CN119724202A (zh) * 2023-09-28 2025-03-28 杭州阿里云飞天信息技术有限公司 音频信号处理方法、电子设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1174457A (zh) * 1996-07-22 1998-02-25 日本电气株式会社 语音信号传输方法及语音编码和解码系统
JP2004109809A (ja) * 2002-09-20 2004-04-08 Nippon Telegr & Teleph Corp <Ntt> 音声分析合成方法及びその装置、音声分析合成プログラム及びそのプログラムを記録した記録媒体
JP4125322B2 (ja) * 2001-09-28 2008-07-30 日本電信電話株式会社 基本周波数抽出装置、その方法、そのプログラム並びにそのプログラムを記録した記録媒体

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2071565B1 (en) * 2003-09-16 2011-05-04 Panasonic Corporation Coding apparatus and decoding apparatus
CN101197577A (zh) * 2006-12-07 2008-06-11 展讯通信(上海)有限公司 一种用于音频处理框架中的编码和解码方法
KR20080073925A (ko) * 2007-02-07 2008-08-12 삼성전자주식회사 파라메트릭 부호화된 오디오 신호를 복호화하는 방법 및장치

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1174457A (zh) * 1996-07-22 1998-02-25 日本电气株式会社 语音信号传输方法及语音编码和解码系统
JP4125322B2 (ja) * 2001-09-28 2008-07-30 日本電信電話株式会社 基本周波数抽出装置、その方法、そのプログラム並びにそのプログラムを記録した記録媒体
JP2004109809A (ja) * 2002-09-20 2004-04-08 Nippon Telegr & Teleph Corp <Ntt> 音声分析合成方法及びその装置、音声分析合成プログラム及びそのプログラムを記録した記録媒体

Also Published As

Publication number Publication date
WO2010022661A1 (zh) 2010-03-04
CN101662288A (zh) 2010-03-03

Similar Documents

Publication Publication Date Title
CN101662288B (zh) 音频编码、解码方法及装置、系统
US8112284B2 (en) Methods and apparatus for improving high frequency reconstruction of audio and speech signals
JP4934427B2 (ja) 音声信号復号化装置及び音声信号符号化装置
KR101586317B1 (ko) 신호 처리 방법 및 장치
JP5047268B2 (ja) Mdct係数を使用する音声後処理
CN102089816B (zh) 音频信号合成器及音频信号编码器
EP2491555B1 (en) Multi-mode audio codec
JP3881943B2 (ja) 音響符号化装置及び音響符号化方法
CN100507485C (zh) 频谱编码装置和频谱解码装置
CN101458930B (zh) 带宽扩展中激励信号的生成及信号重建方法和装置
US20100063812A1 (en) Efficient Temporal Envelope Coding Approach by Prediction Between Low Band Signal and High Band Signal
CN104170009B (zh) 感知音频编解码器中的谐波信号的相位相干性控制
KR20190072647A (ko) 위상 보상을 이용하여 멀티 채널 신호를 다운믹싱 또는 업믹싱하는 장치 및 방법
JP2011248378A (ja) 符号化装置、復号化装置、およびこれらの方法
CN102144259A (zh) 用于产生带宽扩展输出数据的装置和方法
CN102194458B (zh) 频带复制方法、装置及音频解码方法、系统
KR20050107812A (ko) 다중-채널 신호들의 처리
CN101436406B (zh) 音频编解码器
CN101192410B (zh) 一种在编解码中调整量化质量的方法和装置
CN103999153B (zh) 用于以带选择的方式量化语音信号的方法和设备
Zhan et al. Bandwidth extension for China AVS-M standard
JP2004302259A (ja) 音響信号の階層符号化方法および階層復号化方法
CN101604524A (zh) 立体声编码方法及其装置、立体声解码方法及其装置
CN1327408C (zh) 一种低比特率语音编码器

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20171218

Address after: Jinxi town of Hengyang County in Hunan province 421200 Hengyang Rong Guang Cun Zu Tang rope group

Patentee after: Wei Fang

Address before: 510640 Guangdong City, Tianhe District Province, No. five, road, public education building, unit 371-1, unit 2401

Patentee before: GUANGDONG GAOHANG INTELLECTUAL PROPERTY OPERATION Co.,Ltd.

Effective date of registration: 20171218

Address after: 510640 Guangdong City, Tianhe District Province, No. five, road, public education building, unit 371-1, unit 2401

Patentee after: GUANGDONG GAOHANG INTELLECTUAL PROPERTY OPERATION Co.,Ltd.

Address before: 518129 Bantian HUAWEI headquarters office building, Longgang District, Guangdong, Shenzhen

Patentee before: HUAWEI TECHNOLOGIES Co.,Ltd.

TR01 Transfer of patent right
CB03 Change of inventor or designer information

Inventor after: Wei Fang

Inventor before: Zhang Deming

Inventor before: Li Haiting

Inventor before: Zhang Libin

Inventor before: Krueger Hauke

Inventor before: Geiser Bernd

Inventor before: Peter Wally

CB03 Change of inventor or designer information
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120704

Termination date: 20180828

CF01 Termination of patent right due to non-payment of annual fee