CN101421780B - 用于编码和解码时变信号的方法和设备 - Google Patents
用于编码和解码时变信号的方法和设备 Download PDFInfo
- Publication number
- CN101421780B CN101421780B CN2007800126258A CN200780012625A CN101421780B CN 101421780 B CN101421780 B CN 101421780B CN 2007800126258 A CN2007800126258 A CN 2007800126258A CN 200780012625 A CN200780012625 A CN 200780012625A CN 101421780 B CN101421780 B CN 101421780B
- Authority
- CN
- China
- Prior art keywords
- signal
- carrier
- time
- envelope
- varying signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 77
- 230000005540 biological transmission Effects 0.000 claims abstract description 16
- 238000004891 communication Methods 0.000 claims description 5
- 230000001131 transforming effect Effects 0.000 claims 3
- 230000008569 process Effects 0.000 abstract description 38
- 230000006870 function Effects 0.000 description 26
- 238000012545 processing Methods 0.000 description 19
- 238000010586 diagram Methods 0.000 description 16
- 230000014509 gene expression Effects 0.000 description 16
- 238000006073 displacement reaction Methods 0.000 description 13
- 238000005070 sampling Methods 0.000 description 11
- 238000005516 engineering process Methods 0.000 description 10
- 238000001228 spectrum Methods 0.000 description 7
- 230000009466 transformation Effects 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 3
- 230000005284 excitation Effects 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 230000021615 conjugation Effects 0.000 description 2
- 238000013523 data management Methods 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000000631 nonopiate Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
在一种设备和方法中,经由频域线性预测(FDLP)方案来处理并编码时变信号以获得全极点模型。估计由所述方案产生的残留信号并将其变换为时域信号。通过外差过程,将所述时域信号朝向基带电平频移为经向下移位的载波信号。将所述全极点模型和所述经向下移位的载波信号的频率变换的量化值包化为适合于传输或存储的经编码信号。为了重构所述时变信号,解码所述经编码信号。解码过程基本上是编码过程的颠倒。
Description
根据35U.S.C§119主张优先权
本专利申请案主张2006年4月10日申请的题为“音频编码中基于子带中的频谱动态的激励处理(Processing of Excitation in Audio Coding Based on Spectral Dynamics inSub-Bands)”的第60/791,042号美国临时申请案的优先权,所述临时申请案转让给本受让人且明确地以引用的方式并入本文中。
技术领域
本发明大体上涉及信号处理,且更明确地说,涉及编码和解码信号以供存储和检索或以供通信。
背景技术
在数字电信中,信号需要经编码以供传输且需要经解码以供接收。信号的编码与将原始信号转换为适于在传输媒体上传播的格式相关。目标是保持原始信号的质量,但消耗较少的媒体带宽。信号的解码涉及编码过程的反转。
已知的编码方案使用脉冲编码调制(PCM)技术。举例来说,参看图1,其展示可为语音信号的片段的时变信号x(t)。y轴和x轴分别表示振幅和时间。模拟信号x(t)由多个脉冲20取样。每一脉冲20具有表示特定时间的信号x(t)的振幅。举例来说,此后可将所述脉冲20中的每一者的振幅编码为数字值以供稍后传输。
为了节省带宽,在传输之前可使用对数压扩过程来压缩PCM脉冲20的数字值。在接收端处,接收器仅执行上述编码过程的反转以恢复原始时变信号x(t)的近似型式。采用上述方案的设备通常称为α法则或μ法则编解码器。
随着用户数目增大,存在对带宽节省的进一步实际需要。举例来说,在无线通信系统中,大量用户可共享有限的频谱。通常为每一用户在其它用户之间分配有限带宽。
在过去十年左右,语音编码器的发展已取得相当大的进步。通常采用的技术使用代码激励线性预测(CELP)方法。CELP方法的细节可参阅下列出版物:普伦蒂斯霍尔(Prentice Hall)于1978年9月出版的ISBN为0132136031的由拉比纳(Rabiner)和谢弗(Schafer)编著的题为“语音信号的数字处理(Digital Processing of Speech Signals)”的出版物;和威利电气与电子工程师协会出版社(Wiley-IEEE Press)于1999年9月出版的ISBN为0780353862的由德乐(Deller)、普罗科斯(Proakis)和汉森(Hansen)编 著的题为“语音信号的离散时间处理(Discrete-Time Processing of Speech Signals)”的出版物。下文简要描述作为CELP方法的基础的基本原理。
现返回参看图1。通过使用CELP方法而非个别地数字编码并传输每一PCM样本20,以群组形式编码并传输PCM样本20。举例来说,首先将图1中的时变信号x(t)的PCM脉冲20分割为多个帧22。每一帧22具有固定的持续时间(例如,20ms)。将每一帧22内的PCM样本20经由CELP方案共同编码且随后进行传输。经取样脉冲的示范性帧是图1中所展示的PCM脉冲群组22A到22C。
为简单起见,仅采用三个PCM脉冲群组22A到22C以进行说明。在传输之前的编码期间,将PCM脉冲群组22A到22C的数字值连续地馈送到线性预测器(LP)模块。所得输出是一组频率值,还称为“LP滤波器”或简称为“滤波器”,其基本上表示脉冲群组22A到22C的频谱内容。接着量化所述LP滤波器。
LP模块产生PCM脉冲群组22A到22C的频谱表示的近似值。如此,在预测过程期间,引入误差或残值。将残值映射到代码簿,所述代码簿载运可用于紧密匹配PCM脉冲群组22A到22C的经编码数字值的各种组合的条目。映射代码簿中的最拟合的值。经映射的值是待传输的值。整个过程被称为时域线性预测(TDLP)。
因此,在电信中使用CELP方法,编码器(未图示)仅必须产生LP滤波器和经映射的代码簿值。传输器仅需要传输LP滤波器和经映射的代码簿值,而非如上述a法则和μ法则编码器中传输经个别编码的PCM脉冲值。因此,可节省实质量的通信信道带宽。
在接收器端上,也具有与传输器中的代码簿类似的代码簿。接收器中的解码器(未图示)(依赖于同一代码簿)仅必须反转如上所述的编码过程。与所接收的LP滤波器一起,可恢复时变信号x(t)。
迄今为止,已知语音编码方案中的许多者(例如上述CELP方案)基于正被编码的信号为短时静态的假设。也就是说,所述方案基于经编码帧的频率内容为静态的且可由简单的(全极点)滤波器和在激励滤波器中的某种输入表示来近似的前提。获得如上所述的代码簿的各种TDLP算法基于此模型。然而,个体之间的话音模式可为非常不同的。非人类音频信号(例如从各种乐器发出的声音)也与人类对应物的音频信号截然不同。此外,在如上所述的CELP过程中,为了加速实时信号处理,通常选择短时帧。更具体地说,如图1中所示,为了在将PCM脉冲群组(例如22A到22C)的值映射到代码簿中的相应向量条目中减小算法延迟,界定短时窗22,例如如图1中所示的20ms。然而,从每一帧导出的频谱或共振峰信息通常是普通的且可在其它帧之间共享。因此,以并非 为带宽节省的最佳关注的方式,通过通信信道或多或少重复地发送所述共振峰信息。
因此,需要提供一种具有信号质量的改进保持的编码和解码方案,所述方案不仅适用于人类语音而且适用于多种其它声音,且进一步可用于有效利用信道资源。
转让给与当前申请案相同的受让人的共同待决的第11/583,537号美国专利申请案通过使用首先将时变信号转换为频域信号的频域线性预测(FDLP)方案来解决前述需要。接着,识别频域信号的包络和载波部分。接着,将频域信号分类为多个子带。通过FDLP方案将包络部分近似为全极点模型。近似估计载波部分,其也表示全极点模型的剩余部分。将全极点模型信号包络和所估计载波的所得数据包化为适用于传输或存储的经编码信号。为了重构时变信号,解码所述经编码信号。解码过程基本上是编码过程的反转。
为了获得改进的信号质量,可在包化和编码之前更精确地确定信号载波,但大致上没有额外带宽的额外消耗。
发明内容
在一种设备和方法中,将时变信号分割为子带。经由频域线性预测(FDLP)方案处理和编码每一子带以获得全极点模型。估计在每一子带中由所述方案产生的残留信号。全极点模型和残留信号分别表示每一子带中的希尔伯特(Hilbert)包络和希尔伯特载波。通过外差过程,将时域残留信号朝向基带电平而频移为经向下移位的载波信号。将全极点模型和经向下移位的载波信号的量化值包化为适用于传输或存储的经编码信号。为了重构时变信号,解码所述经编码信号。解码过程基本上是编码过程的反转。
可将经分割的帧选择为持续时间相对较长,从而导致更有效使用信号源的格式或共同频谱信息。如描述那样实施的设备和方法不仅适用于元音话音,而且还适用于例如由各种乐器发出的声音等其它声音,或其组合。
所属领域的技术人员通过结合附图参看以下详细描述将易于了解这些和其它特征及优势,在附图中相同参考数字指代相同部分。
附图说明
图1展示经取样为离散信号的时变信号的图形表示;
图2为展示本发明示范性实施例的硬件实施方案的一般示意图;
图3为说明在示范性实施例的编码过程中所涉及的步骤的流程图;
图4为经分割为多个帧的时变信号的图形表示;
图5为图4的时变信号的片段的图形表示;
图6为图5中所展示的信号的频率变换;
图7为图5中所展示的时变信号的子带信号的图形表示,还展示所述子带信号的包络部分;
图8为图7的子带信号的载波部分的图形表示;
图9为图7的子带信号的频域变换的图形表示,还展示频域变换的所估计的全极点模型;
图10为图8的经向下移位的频域变换的图形表示;
图11为用于分类多个子带的经变换数据的多个重叠高斯窗的图形表示;
图12为展示频域线性预测过程的图形表示;
图13为图10的频域变换的重构型式的图形表示;
图14为图8的载波部分信号的重构型式的图形表示;
图15为说明在示范性实施例的解码过程中所涉及的步骤的流程图;
图16为根据示范性实施例的编码器的电路的一部分的示意图;和
图17为根据示范性实施例的解码器的电路的一部分的示意图。
具体实施方式
呈现以下描述是为了使得所属领域的技术人员能够制作并使用本发明。出于解释目的,在以下描述中阐述细节。应了解,所属领域的技术人员将认识到可在不使用这些特定细节的情况下实践本发明。在其它实例中,未详细阐述众所周知的结构和过程以免用不必要的细节混淆对本发明的描述。因此,本发明并不希望由所示实施例限制,而是应符合与本文所揭示的原理和特征一致的最广范围。
图2为用于实施本发明示范性实施例的硬件的一般示意图。系统整体上由参考数字30表示。可将系统30近似划分为编码区32和解码区34。数据处置器36设置在区32与区34之间。数据处置器36的实例可为数据存储装置或通信信道。
在编码区32中,具有连接到数据包化器40的编码器38。时变输入信号x(t)在通过编码器38和数据包化器40之后被引导到数据处置器36。
在解码区34中,以稍微类似的方式但以相反次序,具有连接到数据解包化器44的解码器42。将来自数据处置器36的数据馈送到数据解包化器44,所述数据解包化器44又将经解包化的数据发送到解码器42以供重构原始时变信号x(t)。
图3为说明在图2中所示的系统30的编码区32中所涉及的处理步骤的流程图。在以下描述中,结合图4到14来参看图3。
在图3的步骤S1中,首先(例如)经由脉冲编码调制(PCM)过程对时变信号x(t) 进行取样。由x(n)表示信号x(t)的离散型式。在图4中,仅展示连续信号x(t)。为了清楚起见以免混淆图4,未展示x(n)的大量离散脉冲。
在本说明书和所附权利要求书中,除非在适当之处特别指定,否则术语“信号”是作广义解释的。因此,术语“信号”包括连续信号和离散信号,且进一步包括频域信号和时域信号。此外,在下文中,小写符号表示时域信号且大写符号表示经频率变换的信号。将在后续描述中介绍其余记号。
前进到步骤S2,将经取样的信号x(n)分割为多个帧。如图4所示,此帧的一者由参考数字46表示。在示范性实施例中,帧46的持续时间经选择为1秒。
选定帧46内的时变信号在图4中标记为s(t)。在图5中强调并复制连续信号s(t)。请注意,图5中所示的信号片段s(t)与如图4中所说明的同一信号片段s(t)相比具有大大拉长的时间标度。也就是说,与图4的相应x轴标度相比,图5中的x轴的时间标度显著地拉开。y轴是相反的情况。
信号s(t)的离散型式由s(n)表示,其中n是索引样本编号的整数。同样,为了清楚起见以免混淆图式,在图5中仅展示s(n)的少许样本。时间连续信号s(t)通过以下代数表达式而与离散信号s(n)相关:
s(t)=s(nτ)
(1)
其中τ为如图5中所示的取样周期。
前进到图3的步骤S3,经取样的信号s(n)经历频率变换。在此实施例中,使用离散余弦变换(DCT)方法。然而,还可使用其它类型的变换,例如在此项技术中众所周知的各种类型的正交、非正交和依赖于信号的变换。下文中,在本说明书和所附权利要求书中,互换使用术语“频率变换”和“频域变换”。类似地,互换使用术语“时间变换”和“时域变换”。在算术上,离散信号s(n)经由DCT过程从时域到频域的变换可表达如下:
(2)
其中s(n)如上文所定义,f为离散频率(其中0≤f≤N),T为s(n)的N个脉冲的N个经变换值的线性阵列,且系数c由 和 (其中1≤f≤N-1)给定。
在s(n)的时域参数的DCT之后,所得频域参数T(f)在图6中图解展示且由参考数字51表示。在此实施例中频域变换T(f)的N个脉冲样本被称为DCT系数。同样,在图6中仅展示少许DCT系数。
进入图3的步骤S4,将DCT变换T(f)的N个DCT系数分组且此后使其拟合于多个频率子带窗。子带窗的相对布置在图11中展示。例如子带窗50等每一子带窗经表示为可变大小的窗。在示范性实施例中,采用高斯分布来表示子带。如所说明,子带窗的中心并非是线性间隔的。而是,所述窗是根据巴克标度(Bark scale)(即,根据人类感知的某些已知特征而实施的标度)而分离的。具体地说,子带窗在低频率端处比在高频率端处要窄。此布置基于以下发现:与在音频频谱的高端处的较宽频率范围相比,哺乳动物听觉系统的感觉生理学更适合在低端处的较窄频率范围。应注意,其它分组子带的方法也可为实用的。举例来说,子带可具有相等带宽且经相等间隔,而非如此示范性实施例中所描述根据巴克标度而分组。
在选择子带数目M中,在复杂性与信号质量之间应存在平衡。也就是说,如果需要经编码信号的较高质量,则可选择较多子带,但代价是具有较多包化数据位和进一步造成的残留信号的较复杂处理,所述两者将在稍后解释。另一方面,为简单起见,可选择较少数目的子带,但可能产生具有相对较低质量的经编码信号。此外,可依据取样频率来选择子带的数目。举例来说,当取样频率为16,000Hz时,可将M选择为15。在示范性实施例中,将取样频率选择为8,000Hz且将M设定为13(即,M=13)。
如图11中所示且如上所述,在分离N个DCT系数且使其拟合于呈M个重叠高斯窗形式的M个子带之后,需要进一步处理每一子带中的经分离的DCT系数。编码过程现进入图3的步骤S5到S16。在此实施例中,步骤S5到S16中的每一者包括并行处理M组子步骤。也就是说,大致同时实行M组子步骤的处理。下文中,为清楚和简明起见,仅描述用于处理第k个子带的包含子步骤S5k到S16k的组。应注意,其它子带组的处理是大致类似的。
在以下对所述实施例的描述中,M=13且1≤k≤M,其中k为整数。另外,分类于第k个子带中的DCT系数由Tk(f)表示,Tk(f)为频域项。第k个子带中的DCT系数Tk(f)具有表达为sk(n)的时域对应物。
此时,离题以定义并区分各种频域和时域项是有帮助的。
第k个子带中的时域信号sk(n)可通过其相应频率对应物Tk(f)的反离散余弦变换(IDCT)而获得。在算术上,其表达如下:
(3)
其中sk(n)和Tk(f)如上文所定义。同样,f为离散频率,其中0≤f≤N,且系数c由 和 (其中1≤f≤N-1)给定。
将论述从频域切换到时域,第k个子带中的时域信号sk(n)基本上由两个部分(即,时域希尔伯特包络和希尔伯特载波ck(n))组成。时域希尔伯特包络在图7中图解展示。然而,同样为了清楚,在图7中未展示希尔伯特包络的离散分量,而是信号包络经标记且如通过参考数字52表示。宽松地规定,在希尔伯特包络下方是有时被称为激励的载波信号。去掉希尔伯特包络在图8中展示载波信号或希尔伯特载波ck(n)。换句话说,用如图7中所展示的希尔伯特包络调制如图8中所展示的希尔伯特载波ck(n)将产生如图7中所展示的第k个子带中的时域信号sk(n)。在代数上,其可表达如下:
(4)
因此,根据等式(4),如果已知时域希尔伯特包络和希尔伯特载波ck(n),则可重构第k个子带中的时域信号sk(n)。经重构的信号近似于无损耗重构的信号。
还可从图7和图9中看到时域信号sk(n)与其频域对应物Tk(f)之间的图解关系。在图7中,时域信号sk(n)经展示且还通过参考数字54表示。图9说明图7的时域信号sk(n)的频域变换Tk(f)。参数Tk(f)也通过参考数字28指示。频域变换Tk(f)可经由(例如)如早先所述的DCT从时域信号sk(n)产生。
现返回到图3,子步骤S5k和S6k基本上关于在子带k中确定希尔伯特包络和希尔伯特载波ck(n)。具体地说,子步骤S5k和S6k处理估算希尔伯特包络且子步 骤S7k到S16k与计算希尔伯特载波ck(n)相关。如上所述,一旦已知两个参数和ck(n),便可根据等式(4)重构第k个子带中的时域信号sk(n)。
还如早先所述,第k个子带中的时域项希尔伯特包络可从相应频域参数Tk(f)导出。然而,在子步骤S5k中,代替针对参数Tk(f)的精确变换使用IDCT过程,在示范性实施例中采用参数Tk(f)的频域线性预测(FDLP)过程。由FDLP过程产生的数据可更具流线化,且因此更适用于传输或存储。
在以下段落中,简要描述FDLP过程,且随后进行更详细的解释。
简要地规定,在FDLP过程中,估计希尔伯特包络的频域对应物,所述估计的对应物在代数上表达为且在图9中展示并标记为56。应注意,由于参数为基本上失去任何载波信息的希尔伯特包络的频率变换,所以参数朝向基带而频移。然而,既定被编码的信号是具有载波信息的sk(n)。参数sk(n)的精确(即,非估计)频域对应物为Tk(f),其也在图9中展示且标记为28。如图9中所示且下文中还将进一步描述,由于参数是近似值,所以还可确定近似值与实际值Tk(f)之间的差值,所述差值表达为Ck(f)。参数Ck(f)称为频域希尔伯特载波,且有时还称为残值。
下文中,描述FDLP过程和估计参数Ck(f)的进一步细节。
在FDLP过程中,可采用列文逊-杜宾(Levinson-Durbin)算法。在算术上,待由列文逊-杜宾算法估计的参数可表达如下:
(5)
在普伦蒂斯霍尔(Prentice Hall)出版的ISBN为0137549202的由艾伦·V.奥本海姆(Alan V.Oppenheim)、罗纳德·W.谢弗(Ronald W.Schafer)、约翰·R.巴克(John R.Buck)编著的题为“离散时间信号处理(Discrete-Time Signal Processing)”(第2版)的出版物中可找到z域中的Z变换的基本原理,且此处不进行进一步详细阐述。
在等式(5)中,可基于帧46(图4)的长度来选择K的值。在示范性实施例中,将K选择为20,其中帧46的持续时间设定为1秒。
本质上,在如由等式(5)示范的FDLP过程中,在第k个子带中的频域变换Tk(f)的DCT系数经由列文逊-杜宾算法处理,从而产生一组系数a(i)(其中0≤i≤K-1)。所述组系数a(i)表示时域希尔伯特包络(图7)的频率对应物(图9)。在图12中图解展示FDLP过程。
列文逊-杜宾算法在此项技术中是众所周知的且在此处也不加以解释。在普伦蒂斯霍尔(Prentice Hall)于1978年9月出版的ISBN为0132136031的由拉比纳(Rabiner)和谢弗(Schafer)编著的题为“语音信号的数字处理(Digital Processing ofSpeech Signals)”的出版物中可以找到所述算法的基本原理。
前进到图3的子步骤S6k,量化所得系数a(i)。也就是说,针对每一值a(i),从代码簿(未图示)识别紧密拟合以获得近似值。所述过程称为有损耗近似。在量化期间,可量化a(i)(其中i=0到i=K-1)的整个向量,或者可独立分段并量化全部向量。同样,经由代码簿映射的量化过程也是众所周知的且并不需要进一步详细阐述。
FDLP过程的结果是参数,其如上所述是以频域项表达的希尔伯特包络参数在图9中由参考数字56识别。参数的经量化系数a(i)还可在图9中以图表形式显示,其中其两者被标记为61和63,其存在于参数56的包络上。
如上文所述且此处所重复,由于参数为原始参数Tk(f)的有损耗近似,所以两个参数之间的差值可经俘获并表示为残值,其在代数上表达为Ck(f)。换句话说,在子步骤S5k和S6k中的经由如上所述的列文逊-杜宾算法以获得全极点模型的拟合过程中,无法俘获关于原始信号的某些信息。如果希望获得高质量的信号编码,即如果需要无损耗编码,则需要估计残值Ck(f)。残值Ck(f)基本上对应于信号sk(n)的载波频率ck(n)的频率分量且将进一步加以解释。
在图3的子步骤S8k中实行对在频域中表达为Ck(f)或在时域中表达为ck(n)的残值的 估计。在此实施例中,简单地通过将原始时域子带信号sk(n)直接除以其希尔伯特包络 来导出时域残值ck(n)。在算术上,其表达如下:
(6)
其中所有参数如上文所定义。
应注意,等式(6)经展示为估计残值的直接方法。其它方法也可用于估计。举例来说,可非常良好地从参数Tk(f)与之间的差值产生频域残值Ck(f)。此后,可通过值Ck(f)的直接时域变换来获得时域残值ck(n)。
在图3中,子步骤S9k和S11k处理将希尔伯特载波ck(n)朝向基带频率而向下移位。明确地说,子步骤S9k和S10k与产生解析信号zk(t)相关。频率向下移位经由子步骤S11k中的外差过程来实行。子步骤S12k和S13k描绘选择性地选择经向下移位载波ck(n)的值的方式。
现返回参看图3的子步骤S9k。如此项技术中众所周知的,将时域信号转换为复解析信号消除了傅立叶变换中的负频率分量。因此,可显著简化此后实行的信号计算和信号分析。如在此情况下,将相同处理应用于时域残值ck(n)。
(7)
其中所有参数如上文所定义。等式(7)基本上是时域中的通常已知的希尔伯特变换等式。
(8)
其中j为虚数。
在导出解析信号之后,执行外差过程,如图3的子步骤S11k中所示。本质上,外差简单地为两个参数(即,解析信号zk(n)和希尔伯特载波ck(n))的标量乘法。所得信号常称为经向下取样的希尔伯特载波dk(n)。作为替代方案,信号dk(n)可被称为经解调、经向下取样的希尔伯特载波,其基本上为原始希尔伯特载波ck(n)朝向零值或基带频率的频移和向下取样的信号。应注意,参数dk(n)的其它术语也是适用的。这些术语包括经解调、经向下移位的希尔伯特载波,或简称为经解调的希尔伯特载波、经向下移位的希尔伯特载波或经向下取样的希尔伯特载波。此外,术语“希尔伯特”有时可被省略,且代替术语“希尔伯特载波”来使用,将其简称为“载波”。在本说明书和所附权利要求书中,如上所述的所有这些术语可互换使用。
在算术上,经解调的信号(经向下取样的希尔伯特载波)dk(n)从以下等式中导出:
dk(n)=zk(Rn)ck(Rn)
(9)
其中所有项如上文所定义;R为向下取样速率。
通过将参数ck(n)的频率向下移位以获得参数dk(n),实质上可使得每一子带中的希尔伯特载波的处理(例如下文将描述的滤波和定限)更容易。具体地说,不需要预先确定或已知每一子带中的希尔伯特载波的偏移频率。举例来说,在滤波器算法的实施方案中,所有子带可采取一个偏移频率(即,基带频率)。
在频率向下移位的过程之后,经向下取样的希尔伯特载波dk(n)接着通过低通滤波器,如图3的子步骤S12k中所示。
应注意,经解调的载波dk(n)为复合和解析的。如此,参数dk(n)的傅立叶变换不是共轭对称的。换句话说,外差解析信号zk(n)的过程本质上将希尔伯特载波ck(n)的频率朝向基带频率而移位为dk(n),但在负频率中没有共轭对称项。如从图10中的经向下移位的载波dk(n)的频域变换Dk(f)可见,其中参数Dk(f)经移位为靠近由参考数字60表示的原点。将经向下移位的载波dk(n)频率变换为频域对应物Dk(f)的过程在图3的步骤S13k中描绘。
进入图3的步骤S14k,经解调的希尔伯特载波dk(n)的频域变换Dk(f)经受阈值滤波。通过参考数字62表示的示范性阈值线如图10中展示。
在此示范性实施例中,动态应用阈值。也就是说,对于每一子带,阈值62可基于其它参数(例如,参数Dk(f)的样本的平均量值和最大量值,和/或参数Dk(f)的邻近子带的相同参数)而进行调整。另外,所述参数还可包括参数Dk(f)的样本的平均量值和最大量值,和/或参数Dk(f)的相邻时间帧的相同参数。此外,阈值还可基于所选择系数的数目来动态调适。在示范性实施例中,仅选择在阈值线62上方的频域变换Dk(f)的值。
此后,量化大于阈值的参数Dk(f)的选定分量。在此实例中,每一选定分量包括量值值bm(i)和相位值bp(i),其中0≤i≤L-1。经量化的值bm(i)和bp(i)表示为如在图3的子步骤S15k中展示的量化值。
经阈值滤波的参数Dk(f)的经量化值bm(i)和bp(i)(其中i=0到L-1)将连同经量化的系数a(i)(其中i=0到K-1)一起作为如上所述待发送到数据处置器36(图2)的经编码信息的另一部分。
此后,级联并包化来自M个子带中的每一者的所有数据,如图3的步骤S17中所示。视需要,在包化过程中可实施此项技术中众所周知的各种算法,包括数据压缩和加密。此后,可将经包化的数据发送到数据处置器36(图2),如图3的步骤S18中所示。
可从数据处置器36检索数据以用于解码和重构。参看图2,在解码期间,将来自数据处置器36的经包化数据发送到解包化器44,且接着使其经历由解码器42执行的解码过程。解码过程实质上为如上所述的编码过程的反转。为清楚起见,不详细阐述解码过程,而是在图15的流程图中对其进行概述。
在传输期间,如果所述M个频率子带的少数几个中的数据被破坏,则不会较大影响经重构信号的质量。这是因为相对较长的帧46(图4)可俘获足以补偿微小数据缺陷的频谱信息。
经解调的希尔伯特载波dk(t)的示范性重构的频域变换Dk(f)分别在图13和图14中展示。
图16和图17为分别说明图2的编码区32和解码区34的示范性硬件实施方案的示意图。
首先参看图16的编码区32。可以各种形式来构建或合并编码区32,例如(仅列举少许实例)计算机、移动音乐播放器、个人数字助理(PDA)、无线电话等。
编码区32包含中央数据总线70,所述总线将若干电路链接在一起。所述电路包括中央处理单元(CPU)或控制器72、输入缓冲器74和存储器单元78。在此实施例中,还包括传输电路76。
如果编码区32为无线装置的一部分,则传输电路74可连接到射频(RF)电路,但在所述图式中未图示。传输电路76在将来自数据总线70的数据发送出电路区32之前处理并缓冲所述数据。CPU/控制器72执行数据总线70的数据管理功能且进一步执行一般数据处理功能,包括执行存储器单元78的指令内容。
代替如图12中所示被独立设置,作为替代方案,传输电路76可作为CPU/控制器72的一部分。
输入缓冲器74可连接到其它装置(未图示),例如麦克风或记录器的输出端。
存储器单元78包括大体上由参考数字77表示的计算机可读指令集合。在本说明书和所附权利要求书中,可互换使用术语“计算机可读指令”和“计算机可读程序代码”。在此实施例中,指令包括例如DCT功能80、开窗功能84、FDLP功能86、外差功能88、希尔伯特变换功能90、滤波功能92、向下取样功能94、动态定限功能96、量化器功能98、熵编码功能100和包化器102等部分。
所述各种功能例如在对图3所示的编码过程的描述中已被描述,且不再进一步重复。
现参看图17的解码区34。同样,如同上文所述的编码区32,可以各种形式构建或合并解码区34。
解码区34也具有中央总线190,所述总线连接到各种电路,例如CPU/控制器192、输出缓冲器196和存储器单元197。此外,还可包括接收电路194。同样,如果解码区34为无线装置的一部分,则接收电路194可连接到RF电路(未图示)。接收电路194在将来自数据总线190的数据发送到电路区34之前处理并缓冲所述数据。作为替代方案,接收电路194可为CPU/控制器192的部分,而非如图示那样独立设置。CPU/控制器192执行数据总线190的数据管理功能且进一步执行一般数据处理功能,包括执行存储器单元197的指令内容。
输出缓冲器196可连接到其它装置(未图示),例如扬声器或放大器的输入端。
存储器单元197包括大体上由参考数字199表示的指令集合。在此实施例中,所述指令包括例如解包化器功能198、熵解码器功能200、反量化器功能202、向上取样功能204、反希尔伯特变换功能206、反外差功能208、DCT功能210、合成功能212和IDCT功能214等部分。
所述各种功能例如在对图15展示的解码过程的描述中已被描述,且同样不需要进一步重复。
应注意,在图16和图17中分别独立地展示编码区32和解码区34。在某些应用中,极经常地一起实施所述两个区32和34。举例来说,在例如电话等通信装置中,需要安装编码区32和解码区34两者。如此,在所述区之间通常可共享某些电路或单元。举例来说,图16的编码区32中的CPU/控制器72可与图17的解码区34中的CPU/控制器192相同。类似地,图16中的中央数据总线70可连接到图17中的中央数据总线190或与其相同。此外,分别用于编码区32和解码区34中的功能的所有指令77和199可汇集在一起,且设置在与图16的存储器单元78或图17的存储器单元197类似的一个存储器单元中。
在此实施例中,存储器单元78或197是RAM(随机存取存储器)电路。示范性指令部分80、84、86、88、90、92、94、96、98、100、102、197、198、200、202、204、206、208、210、212和214是软件例行程序或模块。存储器单元78或197可连接到另一存储器电路(未图示),所述存储器电路可为易失性类型或非易失性类型的。作为替代方案,存储器单元78或197可由其它电路类型制成,例如EEPROM(电可擦除可编程只读存储器)、EPROM(电可编程只读存储器)、ROM(只读存储器)、磁盘、光盘和此项技术中众所周知的其它装置。
此外,存储器单元78或197可为专用集成电路(ASIC)。也就是说,用于所述功能的指令或代码77和199可经硬连线或由硬件实施,或其组合。另外,用于所述功能的指令77和199不需要区别地分类为硬件或软件实施。指令77和199当然可作为软件与硬件两者的组合实施在装置中。
应进一步注意,如上文图3和图15中描述且展示的编码和解码过程还可经编码为在此项技术中已知的任何计算机可读媒体上实行的计算机可读指令或程序代码。在本说明书和所附权利要求书中,术语“计算机可读媒体”指代参与将指令提供到任何处理器(例如分别在图16或图17中展示并描述的CPU/控制器72或192)以供执行的任何媒体。此媒体可为存储类型,且可采用易失性或非易失性存储媒体的形式,如先前也例如分别在对图16和图17的存储器单元78和197的描述中所描述。此媒体还可为传输类型,且可包括同轴电缆、铜线、光缆,和载运能够载运可由机器或计算机读取的信号的声波、电磁波或光波的空气界面。在本说明书和所附权利要求书中,除非特别识别,否则信号载运波总称为包括光波、电磁波和声波的中波。
最后,能够在本发明的范围内作出其它改变。在如所描述的示范性实施例中,仅描绘音频信号的处理。然而,应注意,本发明并不限于此。例如超声信号等其它类型信号的处理也是可能的。还应注意,本发明可非常良好地用于广播环境中,即可将来自一个编码器的信号发送到多个解码器。此外,如所描述的示范性实施例不需要限制于用于无线应用中。举例来说,常规有线电话当然可安装有如所描述的示范性编码器和解码器。另外,在描述所述实施例中,使用列文逊-杜宾算法,还可采用此项技术中已知的用于估计预测滤波器参数的其它算法。另外,结合实施例而描述的任何逻辑区块、电路和算法步骤可在硬件、软件、固件或其组合中实施。所属领域的技术人员将了解,在不脱离本发明的范围和精神的情况下,可对本发明进行形式和细节上的这些和其它改变。
Claims (17)
1.一种用于编码时变信号的方法,其包含:
将所述时变信号分割为多个子带信号;
确定所述子带信号中的每一者的包络和载波部分,所述包络为希尔伯特包络,所述载波为希尔伯特载波;
将所述载波部分朝向所述时变信号的基带频率频移为经向下移位的载波信号;
选择性地选择所述经向下移位的载波信号的值;和
将所选定的值包括为所述时变信号的经编码数据。
2.根据权利要求1所述的方法,其进一步包含在编码之前将所述时变信号转换为离散信号。
3.根据权利要求1所述的方法,其进一步包含将所述时变信号变换为频域变换,其中所述多个子带信号选自所述时变信号的所述频域变换。
4.根据权利要求3所述的方法,其中所述包络和载波部分是频域信号,所述方法进一步包含在将所述载波部分朝向所述基带频率频移之前将所述频域信号的所述载波部分变换到时域。
5.一种用于解码时变信号的方法,其包含:
提供对应于所述时变信号的多个子带的多组值,所述多组值包含所述时变信号的包络和载波信息;
将来自所述多组值的所述载波信息识别为对应于所述多个子带的多个载波信号;
将所述多个载波信号中的每一者远离所述时变信号的基带频率频移为经向上移位的载波信号,所述包络为希尔伯特包络,所述载波为希尔伯特载波;和
通过时变信号的包络将所述经向上移位的载波信号调制为所述时变信号的经解码数据。
6.根据权利要求5所述的方法,其进一步包含将所述多个载波信号中的每一者反外差为经向上移位的载波信号。
7.根据权利要求6所述的方法,其进一步包含将来自所述多组值的所述包络信息识别为对应于所述多个子带的多个包络信号,且此后通过所述多个包络信号将多个所述经向上移位的载波信号调制为所述时变信号的经重构型式。
8.一种用于编码时变信号的设备,其包含:
用于将所述时变信号分割为多个子带信号的装置;
用于确定所述子带信号中的每一者的包络和载波部分的装置,所述包络为希尔伯特包络,所述载波为希尔伯特载波;
用于将所述载波部分朝向所述时变信号的基带频率频移为经向下移位的载波信号的装置;
用于选择性地选择所述经向下移位的载波信号的值的装置;和
用于将所选定的值包括为所述时变信号的经编码数据的装置。
9.根据权利要求8所述的设备,其进一步包含用于在编码之前将所述时变信号转换为离散信号的装置。
10.根据权利要求8所述的设备,其进一步包含用于将所述时变信号变换为频域变换的装置,其中所述多个子带信号选自所述时变信号的所述频域变换。
11.根据权利要求10所述的设备,其中所述包络和载波部分是频域信号,所述设备进一步包含用于在将所述载波部分朝向所述基带频率频移之前将所述频域信号的所述载波部分变换到时域的装置。
12.一种用于解码时变信号的设备,其包含:
用于提供对应于所述时变信号的多个子带的多组值的装置,所述多组值包含所述时变信号的包络和载波信息,所述包络为希尔伯特包络,所述载波为希尔伯特载波;
用于将来自所述多组值的所述载波信息识别为对应于所述多个子带的多个载波信号的装置;
用于将所述多个载波信号中的每一者远离所述时变信号的基带频率频移为经向上移位的载波信号的装置;和
用于通过时变信号的包络将所述经向上移位的载波信号调制为所述时变信号的经解码数据的装置。
13.根据权利要求12所述的设备,其进一步包含用于将所述多个载波信号中的每一者反外差为经向上移位的载波信号的装置。
14.根据权利要求12所述的设备,其进一步包含用于将来自所述多组值的所述包络信息识别为对应于所述多个子带的多个包络信号的装置,和用于通过所述多个包络信号将多个所述经向上移位的载波信号调制为所述时变信号的经重构型式的装置。
15.一种用于编码时变信号的设备,其包含:
编码器,其经配置以将所述时变信号分割为多个子带信号,确定所述子带信号中的每一者的包络和载波部分,所述包络为希尔伯特包络,所述载波为希尔伯特载波,将所述载波部分朝向所述时变信号的基带频率频移为经向下移位的载波信号,且选择性地选择所述经向下移位的载波信号的值;和
数据包化器,其连接到所述编码器且用于将所选定的值包化为所述时变信号的经编码数据的部分。
16.根据权利要求15所述的设备,其进一步包含传输电路,其连接到所述数据包化器且用于通过通信信道发送所述经编码数据。
17.一种用于解码时变信号的设备,其包含:
数据解包化器,其经配置以:提供对应于所述时变信号的多个子带的多组值,其中所述多组值包含所述时变信号的包络和载波信息,所述包络为希尔伯特包络,所述载波为希尔伯特载波;和进一步将来自所述多组值的所述包络和载波信息识别为对应于所述多个子带的多个包络和载波信号;将所述多个载波信号中的每一者远离所述时变信号的基带频率频移为经向上移位的载波信号,和
解码器,其连接到所述数据解包化器,所述解码器经配置以通过时变信号的包络将所述经向上移位的载波信号调制为时域值。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US79104206P | 2006-04-10 | 2006-04-10 | |
US60/791,042 | 2006-04-10 | ||
US11/696,974 US8392176B2 (en) | 2006-04-10 | 2007-04-05 | Processing of excitation in audio coding and decoding |
US11/696,974 | 2007-04-05 | ||
PCT/US2007/066243 WO2007121140A1 (en) | 2006-04-10 | 2007-04-09 | Processing of excitation in audio coding and decoding |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101421780A CN101421780A (zh) | 2009-04-29 |
CN101421780B true CN101421780B (zh) | 2012-07-18 |
Family
ID=38353590
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2007800126258A Expired - Fee Related CN101421780B (zh) | 2006-04-10 | 2007-04-09 | 用于编码和解码时变信号的方法和设备 |
Country Status (8)
Country | Link |
---|---|
US (1) | US8392176B2 (zh) |
EP (1) | EP2005423B1 (zh) |
JP (1) | JP2009533716A (zh) |
KR (1) | KR101019398B1 (zh) |
CN (1) | CN101421780B (zh) |
AT (1) | ATE547787T1 (zh) |
TW (1) | TWI332193B (zh) |
WO (1) | WO2007121140A1 (zh) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090198500A1 (en) * | 2007-08-24 | 2009-08-06 | Qualcomm Incorporated | Temporal masking in audio coding based on spectral dynamics in frequency sub-bands |
US8428957B2 (en) | 2007-08-24 | 2013-04-23 | Qualcomm Incorporated | Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands |
US8472912B2 (en) * | 2009-12-11 | 2013-06-25 | Maxlinear, Inc. | Low-complexity diversity using preequalization |
EP2659486B1 (en) * | 2010-12-30 | 2016-03-23 | Nokia Technologies Oy | Method, apparatus and computer program for emotion detection |
CN102419978B (zh) * | 2011-08-23 | 2013-03-27 | 展讯通信(上海)有限公司 | 音频解码器、音频解码的频谱重构方法及装置 |
RU2662921C2 (ru) | 2013-06-10 | 2018-07-31 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Устройство и способ для кодирования, обработки и декодирования огибающей аудиосигнала путем моделирования представления совокупной суммы с использованием квантования и кодирования распределения |
KR101789085B1 (ko) * | 2013-06-10 | 2017-11-20 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. | 분포 양자화 및 코딩을 사용하는 오디오 신호 엔벨로프의 분할에 의한 오디오 신호 엔벨로프 인코딩, 처리 및 디코딩을 위한 장치 및 방법 |
EP2830055A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Context-based entropy coding of sample values of a spectral envelope |
KR101448823B1 (ko) * | 2013-09-06 | 2014-10-13 | 주식회사 사운들리 | 시변 주파수 기반의 심볼을 이용한 음파 송수신 방법 및 이를 이용한 장치 |
WO2015058818A1 (en) * | 2013-10-22 | 2015-04-30 | Huawei Technologies Co., Ltd. | Apparatus and method for compressing a set of n binaural room impulse responses |
US10571390B2 (en) * | 2015-12-21 | 2020-02-25 | The Boeing Company | Composite inspection |
JPWO2018198454A1 (ja) * | 2017-04-28 | 2019-06-27 | ソニー株式会社 | 情報処理装置、および情報処理方法 |
WO2021262760A1 (en) * | 2020-06-22 | 2021-12-30 | Cornell University | Adaptive subband compression of streaming data for power system monitoring and control |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1458646A (zh) * | 2003-04-21 | 2003-11-26 | 北京阜国数字技术有限公司 | 一种滤波参数矢量量化和结合量化模型预测的音频编码方法 |
CN1509469A (zh) * | 2001-05-16 | 2004-06-30 | ��˹��ŵ�� | 语音编解码器中用于线频谱频率矢量量化的方法和系统 |
Family Cites Families (60)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
NL180062C (nl) * | 1977-09-27 | Motorola Inc | Radio-ontvanger. | |
US4184049A (en) * | 1978-08-25 | 1980-01-15 | Bell Telephone Laboratories, Incorporated | Transform speech signal coding with pitch controlled adaptive quantizing |
FR2533095A1 (fr) * | 1982-09-09 | 1984-03-16 | Europ Agence Spatiale | Procede et dispositif de demodulation d'une onde porteuse modulee en phase par une onde sous-porteuse qui est modulee en deplacement de phase par des signaux en bande de base |
WO1986005617A1 (en) | 1985-03-18 | 1986-09-25 | Massachusetts Institute Of Technology | Processing of acoustic waveforms |
US4849706A (en) * | 1988-07-01 | 1989-07-18 | International Business Machines Corporation | Differential phase modulation demodulator |
US4902979A (en) * | 1989-03-10 | 1990-02-20 | General Electric Company | Homodyne down-converter with digital Hilbert transform filtering |
JPH03127000A (ja) | 1989-10-13 | 1991-05-30 | Fujitsu Ltd | 音声のスペクトル予測符号化方式 |
AU671952B2 (en) * | 1991-06-11 | 1996-09-19 | Qualcomm Incorporated | Variable rate vocoder |
JP2950077B2 (ja) | 1993-02-05 | 1999-09-20 | 日産自動車株式会社 | 内燃機関の排気浄化装置 |
JPH0777979A (ja) | 1993-06-30 | 1995-03-20 | Casio Comput Co Ltd | 音声制御音響変調装置 |
US5517595A (en) | 1994-02-08 | 1996-05-14 | At&T Corp. | Decomposition in noise and periodic signal waveforms in waveform interpolation |
US5574825A (en) * | 1994-03-14 | 1996-11-12 | Lucent Technologies Inc. | Linear prediction coefficient generation during frame erasure or packet loss |
CA2144596A1 (en) * | 1994-04-05 | 1995-10-06 | Richard Prodan | Modulator/demodulator using baseband filtering |
US5651090A (en) * | 1994-05-06 | 1997-07-22 | Nippon Telegraph And Telephone Corporation | Coding method and coder for coding input signals of plural channels using vector quantization, and decoding method and decoder therefor |
JPH08102945A (ja) | 1994-09-30 | 1996-04-16 | Toshiba Corp | 階層符号復号化装置 |
DE69624020T2 (de) * | 1995-02-21 | 2003-07-17 | Tait Electronics Ltd., Christchurch | Nullzwischenfrequenz-Empfänger |
US5640698A (en) * | 1995-06-06 | 1997-06-17 | Stanford University | Radio frequency signal reception using frequency shifting by discrete-time sub-sampling down-conversion |
DE69620967T2 (de) * | 1995-09-19 | 2002-11-07 | At & T Corp., New York | Synthese von Sprachsignalen in Abwesenheit kodierter Parameter |
FR2742568B1 (fr) | 1995-12-15 | 1998-02-13 | Catherine Quinquis | Procede d'analyse par prediction lineaire d'un signal audiofrequence, et procedes de codage et de decodage d'un signal audiofrequence en comportant application |
US5781888A (en) * | 1996-01-16 | 1998-07-14 | Lucent Technologies Inc. | Perceptual noise shaping in the time domain via LPC prediction in the frequency domain |
JP3248668B2 (ja) | 1996-03-25 | 2002-01-21 | 日本電信電話株式会社 | ディジタルフィルタおよび音響符号化/復号化装置 |
US5764704A (en) * | 1996-06-17 | 1998-06-09 | Symmetricom, Inc. | DSP implementation of a cellular base station receiver |
US5802463A (en) * | 1996-08-20 | 1998-09-01 | Advanced Micro Devices, Inc. | Apparatus and method for receiving a modulated radio frequency signal by converting the radio frequency signal to a very low intermediate frequency signal |
US5872628A (en) * | 1996-09-27 | 1999-02-16 | The Regents Of The University Of California | Noise pair velocity and range echo location system |
US5838268A (en) * | 1997-03-14 | 1998-11-17 | Orckit Communications Ltd. | Apparatus and methods for modulation and demodulation of data |
JP3064947B2 (ja) | 1997-03-26 | 2000-07-12 | 日本電気株式会社 | 音声・楽音符号化及び復号化装置 |
US6356639B1 (en) | 1997-04-11 | 2002-03-12 | Matsushita Electric Industrial Co., Ltd. | Audio decoding apparatus, signal processing device, sound image localization device, sound image control method, audio signal processing device, and audio signal high-rate reproduction method used for audio visual equipment |
SE512719C2 (sv) | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
US6091773A (en) * | 1997-11-12 | 2000-07-18 | Sydorenko; Mark R. | Data compression method and apparatus |
US6686879B2 (en) * | 1998-02-12 | 2004-02-03 | Genghiscomm, Llc | Method and apparatus for transmitting and receiving signals having a carrier interferometry architecture |
US7430257B1 (en) * | 1998-02-12 | 2008-09-30 | Lot 41 Acquisition Foundation, Llc | Multicarrier sub-layer for direct sequence channel and multiple-access coding |
US6260010B1 (en) | 1998-08-24 | 2001-07-10 | Conexant Systems, Inc. | Speech encoder using gain normalization that combines open and closed loop gains |
US6173257B1 (en) | 1998-08-24 | 2001-01-09 | Conexant Systems, Inc | Completed fixed codebook for speech encoder |
US6243670B1 (en) * | 1998-09-02 | 2001-06-05 | Nippon Telegraph And Telephone Corporation | Method, apparatus, and computer readable medium for performing semantic analysis and generating a semantic structure having linked frames |
SE519563C2 (sv) | 1998-09-16 | 2003-03-11 | Ericsson Telefon Ab L M | Förfarande och kodare för linjär prediktiv analys-genom- synteskodning |
US6418405B1 (en) | 1999-09-30 | 2002-07-09 | Motorola, Inc. | Method and apparatus for dynamic segmentation of a low bit rate digital voice message |
US6704711B2 (en) * | 2000-01-28 | 2004-03-09 | Telefonaktiebolaget Lm Ericsson (Publ) | System and method for modifying speech signals |
EP1158494B1 (en) | 2000-05-26 | 2002-05-29 | Lucent Technologies Inc. | Method and apparatus for performing audio coding and decoding by interleaving smoothed critical band evelopes at higher frequencies |
US6941263B2 (en) | 2001-06-29 | 2005-09-06 | Microsoft Corporation | Frequency domain postfiltering for quality enhancement of coded speech |
US7173966B2 (en) * | 2001-08-31 | 2007-02-06 | Broadband Physics, Inc. | Compensation for non-linear distortion in a modem receiver |
US6934677B2 (en) * | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
US7206359B2 (en) * | 2002-03-29 | 2007-04-17 | Scientific Research Corporation | System and method for orthogonally multiplexed signal transmission and reception |
US20030194082A1 (en) * | 2002-04-15 | 2003-10-16 | Eli Shoval | Method and apparatus for transmitting signaling tones over a packet switched network |
TWI288915B (en) | 2002-06-17 | 2007-10-21 | Dolby Lab Licensing Corp | Improved audio coding system using characteristics of a decoded signal to adapt synthesized spectral components |
CN1692426B (zh) * | 2002-11-20 | 2010-05-12 | Lg电子有限公司 | 具有管理数据重现的数据结构的记录介质及记录和重现的方法和装置 |
US7127008B2 (en) * | 2003-02-24 | 2006-10-24 | Ibiquity Digital Corporation | Coherent AM demodulator using a weighted LSB/USB sum for interference mitigation |
US7620545B2 (en) | 2003-07-08 | 2009-11-17 | Industrial Technology Research Institute | Scale factor based bit shifting in fine granularity scalability audio coding |
CN1839426A (zh) | 2003-09-17 | 2006-09-27 | 北京阜国数字技术有限公司 | 多分辨率矢量量化的音频编解码方法及装置 |
WO2005031597A1 (en) | 2003-09-29 | 2005-04-07 | Agency For Science, Technology And Research | Process and device for determining a transforming element for a given transformation function, method and device for transforming a digital signal from the time domain into the frequency domain and vice versa and computer readable medium |
WO2005096274A1 (fr) | 2004-04-01 | 2005-10-13 | Beijing Media Works Co., Ltd | Dispositif et procede de codage/decodage audio ameliores |
TWI242935B (en) | 2004-10-21 | 2005-11-01 | Univ Nat Sun Yat Sen | Encode system, decode system and method |
US7292985B2 (en) * | 2004-12-02 | 2007-11-06 | Janus Development Group | Device and method for reducing stuttering |
KR100721537B1 (ko) | 2004-12-08 | 2007-05-23 | 한국전자통신연구원 | 광대역 음성 부호화기의 고대역 음성 부호화 장치 및 그방법 |
US20070036228A1 (en) | 2005-08-12 | 2007-02-15 | Via Technologies Inc. | Method and apparatus for audio encoding and decoding |
US7532676B2 (en) * | 2005-10-20 | 2009-05-12 | Trellis Phase Communications, Lp | Single sideband and quadrature multiplexed continuous phase modulation |
US8027242B2 (en) * | 2005-10-21 | 2011-09-27 | Qualcomm Incorporated | Signal coding and decoding based on spectral dynamics |
WO2007080211A1 (en) | 2006-01-09 | 2007-07-19 | Nokia Corporation | Decoding of binaural audio signals |
EP1852849A1 (en) | 2006-05-05 | 2007-11-07 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream |
US8428957B2 (en) * | 2007-08-24 | 2013-04-23 | Qualcomm Incorporated | Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands |
US20090198500A1 (en) * | 2007-08-24 | 2009-08-06 | Qualcomm Incorporated | Temporal masking in audio coding based on spectral dynamics in frequency sub-bands |
-
2007
- 2007-04-05 US US11/696,974 patent/US8392176B2/en active Active
- 2007-04-09 AT AT07760327T patent/ATE547787T1/de active
- 2007-04-09 CN CN2007800126258A patent/CN101421780B/zh not_active Expired - Fee Related
- 2007-04-09 KR KR1020087027512A patent/KR101019398B1/ko active IP Right Grant
- 2007-04-09 JP JP2009505561A patent/JP2009533716A/ja active Pending
- 2007-04-09 WO PCT/US2007/066243 patent/WO2007121140A1/en active Application Filing
- 2007-04-09 EP EP07760327A patent/EP2005423B1/en not_active Not-in-force
- 2007-04-10 TW TW096112540A patent/TWI332193B/zh not_active IP Right Cessation
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1509469A (zh) * | 2001-05-16 | 2004-06-30 | ��˹��ŵ�� | 语音编解码器中用于线频谱频率矢量量化的方法和系统 |
CN1458646A (zh) * | 2003-04-21 | 2003-11-26 | 北京阜国数字技术有限公司 | 一种滤波参数矢量量化和结合量化模型预测的音频编码方法 |
Non-Patent Citations (2)
Title |
---|
Marios Athineos et al.FREQUENCY-DOMAIN LINEAR PREDICTION FOR TEMPORAL FEATURES.《2003 IEEE Workshop on Automatic Speech Recognition and Understanding》.2003,第261-266页. * |
Steven Schimmel et al.COHERENT ENVELOPE DETECTION FOR MODULATION FILTERING OF SPEECH.《IEEE International Conference on Acoustics, Speech, and Signal Processing, 2005. Proceedings》.2005,第1卷第I-221-I-224页. * |
Also Published As
Publication number | Publication date |
---|---|
EP2005423A1 (en) | 2008-12-24 |
CN101421780A (zh) | 2009-04-29 |
US8392176B2 (en) | 2013-03-05 |
KR20080110892A (ko) | 2008-12-19 |
KR101019398B1 (ko) | 2011-03-07 |
WO2007121140A1 (en) | 2007-10-25 |
US20070239440A1 (en) | 2007-10-11 |
ATE547787T1 (de) | 2012-03-15 |
TW200816168A (en) | 2008-04-01 |
TWI332193B (en) | 2010-10-21 |
EP2005423B1 (en) | 2012-02-29 |
JP2009533716A (ja) | 2009-09-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101421780B (zh) | 用于编码和解码时变信号的方法和设备 | |
CN101779236A (zh) | 基于频率子频带中的频谱动态的音频译码中的时间掩蔽 | |
US8428957B2 (en) | Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands | |
US9037454B2 (en) | Efficient coding of overcomplete representations of audio using the modulated complex lapped transform (MCLT) | |
TW563094B (en) | Method and apparatus for high performance low bit-rate coding of unvoiced speech | |
JP4142292B2 (ja) | オーディオ信号の符号化効率を向上させる方法 | |
CN107025909B (zh) | 能量无损编码方法和设备以及能量无损解码方法和设备 | |
EP3046105B1 (en) | Lossless coding method | |
CN104718572A (zh) | 音频编码方法和装置、音频解码方法和装置及采用该方法和装置的多媒体装置 | |
US20070016417A1 (en) | Method and apparatus to quantize/dequantize frequency amplitude data and method and apparatus to audio encode/decode using the method and apparatus to quantize/dequantize frequency amplitude data | |
JP2011154378A (ja) | 階層的な帯域幅構造を有する音声圧縮および復元装置、ならびにその方法 | |
US8027242B2 (en) | Signal coding and decoding based on spectral dynamics | |
KR102386737B1 (ko) | 신호 부호화방법 및 장치와 신호 복호화방법 및 장치 | |
CA2551281A1 (en) | Voice/musical sound encoding device and voice/musical sound encoding method | |
CN105957533B (zh) | 语音压缩方法、语音解压方法及音频编码器、音频解码器 | |
EP1672619A2 (en) | Speech coding apparatus and method therefor | |
CN102436822A (zh) | 信号控制装置及其方法 | |
CN101331540A (zh) | 基于频谱动力学的信号编码和解码 | |
Matta et al. | Distributed Audio Coding with Efficient Source Correlation Extraction | |
Fink et al. | Low-delay vector-quantized subband ADPCM coding | |
Schroeder et al. | Speech Compression | |
Schroeder et al. | Speech Compression |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20120718 |