CN102067211B - 一种线性预测分析方法、装置及系统 - Google Patents
一种线性预测分析方法、装置及系统 Download PDFInfo
- Publication number
- CN102067211B CN102067211B CN2009800001092A CN200980000109A CN102067211B CN 102067211 B CN102067211 B CN 102067211B CN 2009800001092 A CN2009800001092 A CN 2009800001092A CN 200980000109 A CN200980000109 A CN 200980000109A CN 102067211 B CN102067211 B CN 102067211B
- Authority
- CN
- China
- Prior art keywords
- input signal
- windowing
- signal
- centerdot
- signals information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 109
- 238000005070 sampling Methods 0.000 claims description 60
- 238000006243 chemical reaction Methods 0.000 claims 1
- 238000000034 method Methods 0.000 abstract description 16
- 230000006870 function Effects 0.000 description 58
- 238000002474 experimental method Methods 0.000 description 13
- 230000005540 biological transmission Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明公开了一种线性预测分析方法、装置及系统,涉及通信领域,能够提高线性预测编码的预测性能,并且分析运算复杂度低。解决方案为:获取输入信号至少一个样点的信号特性信息;对所述信号特性信息进行比较分析,得到分析结果;根据所述分析结果选择窗函数对所述输入信号进行自适应加窗,得到加窗后信号;对所述加窗后信号进行处理,得到线性预测编码系数用于线性预测。本发明用于线性预测编码。
Description
技术领域
本发明涉及通信领域,尤其涉及一种线性预测分析方法、装置及系统。
背景技术
为节省语音与音频信号传输和存储的带宽,相应的语音与音频编码技术得到了广泛的应用,目前主要分为有损编码和无损编码,有损编码的重建信号与原始信号并不能保持完全一致,但可以根据声源特点及人的感知特点最大程度上减少信号的冗余信息。无损编码则必须保证重建信号与原始信号完全一致,可以使得最后的解码质量没有任何损伤,一般来讲有损编码压缩率比较高,但重建语音质量没有保证,无损编码可以保证语音质量,但压缩率较低,大约50%左右。
无论在有损编码或无损编码中,线性预测编码(LPC,Linear PredictionCoding)模型被广泛地应用在语音编码领域中,在有损编码中码激励线性预测编码模型是其典型应用的成功。基本原理为:先利用短时线性预测去除语音信号的近样点冗余度,再用长时预测器去除语音信号的远样点冗余度,最后对预测过程中产生的参数以及经过两级预测得到的残差信号进行编码传输。
目前大多数有损和无损音频编解码的线性预测分析一般包括加窗、求自相关和Levinson算法求解三个模块,通过线性预测来得到残差信号,再用熵编码对残差信号进行编码来实现音频压缩。
在实现上述线性预测编码的过程中,发明人发现现有技术中至少存在以下问题:
加窗时采用固定窗函数,会使得线性预测性能达不到最优;
或者,对输入信号分别进行两次线性预测分析,一次给信号加短窗,另一次给信号加长窗,会因为对输入信号进行了两次线性预测分析,使得线性预测分析的复杂度较大。
发明内容
本发明的实施例提供一种线性预测分析方法、装置及系统,能够提高线性预测性能,降低分析运算复杂度。
一种线性预测分析方法,包括:
获取输入信号至少一个样点的信号特性信息;
对信号特性信息进行比较分析,得到分析结果;
根据分析结果选择窗函数对输入信号进行自适应加窗,得到加窗后信号;
对加窗后信号进行处理,得到线性预测编码系数用于线性预测。
本发明实施例提供的线性预测分析方法,通过对输入信号进行分析,得到结果,并根据分析结果自适应分配加窗所需的窗函数,因此,能够在增加较少的编码复杂度的情况下,提高了线性预测编码的预测性能。
一种线性预测分析装置,包括:
获取单元,用于获取输入信号至少一个样点的信号特性信息;
分析单元,用于对信号特性信息进行比较分析,得到分析结果;
加窗单元,用于根据分析结果选择窗函数对输入信号进行自适应加窗,得到加窗后信号;
处理单元,用于对加窗后信号进行处理,得到线性预测编码系数,用于线性预测。
本发明实施例提供的线性预测分析装置,通过对输入信号进行分析,得到结果,并根据分析结果自适应分配加窗所需的窗函数,因此,能够在增加较少的编码复杂度的情况下,提高了线性预测编码的预测性能。
一种线性预测编码系统,包括:
线性预测分析装置,用于获取输入信号至少一个样点的信号特性信息;对信号特性信息进行比较分析,得到分析结果;根据分析结果选择窗函数对输入信号进行自适应加窗,得到加窗后信号;对加窗后信号进行处理,得到线性预测编码系数;
编码装置,用于根据线性预测分析装置得到的线性预测编码系数进行编码。
本发明实施例提供的线性预测编码系统,能够先通过对输入信号进行分析,得到结果,并根据分析结果自适应分配加窗所需的窗函数,进而得到线性预测编码系数;然后再根据该线性预测编码系数进行编码。因此,能够在增加较少的编码复杂度的情况下,提高了线性预测编码的预测性能。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的线性预测分析方法的流程框图;
图2为本发明实施例一提供的线性预测分析方法的流程框图;
图3为本发明实施例二提供的线性预测分析方法的流程框图;
图4为本发明实施例三提供的线性预测分析方法的流程框图;
图5为本发明实施例四提供的线性预测分析方法的流程框图;
图6为本发明实施例五提供的线性预测分析方法的流程框图;
图7为本发明实施例六提供的线性预测分析方法的流程框图;
图8为本发明实施例七提供的线性预测分析方法的流程框图;
图9为本发明实施例提供的线性预测分析装置的结构框图;
图10为本发明另一实施例提供的线性预测分析装置的结构框图;
图11为本发明实施例提供的线性预测编码系统的构造框图;
图12为本发明另一实施例提供的线性预测编码系统的构造框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的实施例提供一种线性预测分析方法、装置及系统,能够提高线性预测性能,降低分析运算复杂度。
下面结合附图对本发明实施例进行详细描述。
本发明实施例提供的线性预测分析方法,如图1所示,该方法的步骤包括:
S101、获取输入信号至少一个样点的信号特性信息;
S102、对信号特性信息进行比较分析,得到分析结果;
S103、根据分析结果选择窗函数对输入信号进行自适应加窗,得到加窗后信号;
S104、对加窗后信号进行处理,得到线性预测编码系数用于线性预测。
本发明实施例提供的线性预测分析方法,通过对输入信号进行分析,得到结果,并根据分析结果自适应分配加窗所需的窗函数,因此,能够在增加较少的编码复杂度的情况下,提高了线性预测编码的预测性能。
其中,信号特性信息包括幅值、能量、过零率、信号类型、帧长、编码方式中的任意一个或任意多个。
下面通过具体实施例加以说明。
实施例一:
本发明实施例一提供的线性预测分析方法,如图2所示,该方法步骤包括:
S201、获取输入信号的第一个样点的幅值|x[0]|和最后一个样点的幅值|x[N-1]|,其中,x[i],i=0,1,...,N-1为输入信号,N为输入信号的样点个数(如40、80、160、240、320等);输入信号在这里是指输入进行LPC分析的信号,可能是一帧信号,也可能是一帧信号加上历史缓冲区的一段信号(如历史缓冲区的L个样点,L可根据不同的编解码器采用不同的正整数,如40、80、160、240、320等);
S202、对样点幅值|x[0]|和|x[N-1]|进行分析,并根据分析结果对输入信号进行自适应加窗:
如当输入样点数为40时:
如果输入信号的第一个样点的幅值|x[0]|小于某个预先设定阈值thr(如thr=128),则对窗函数的最前面4个点设置为:
w(n)=0.23+0.77·cos(2·π·(31-8·n)/127),n=0,1,2,3
否则对窗函数的最前面4个点设置为:
w(n)=0.26+0.74·cos(2·π·(31-8·n)/127),n=0,1,2,3
对窗函数第5至第36个点都设为1,即:
w(n)=1,n=4,...,35
如果输入信号的最后一个样点的幅值|x[39]|小于某个预先设定阈值thr(如thr=128),则对窗函数的最后面4个点设置为:
w(n)=0.23+0.77·cos(2·π·(8·n-281)/127),n=36,37,38,39
否则对窗函数的最后面4个点设置为:
w(n)=0.26+0.74·cos(2·π·(8·n-281)/127),n=36,37,38,39
然后用上述自适应设置后的窗函数w(n),n=1,2,...,38,39对信号x(n),n=1,2,...,38,39进行加窗,即
xd[n]=x[n]·w[n],n=0,1,...,38,39
得到自适应加窗后的信号xd[n]],n=0,1,...,38,39
又如当输入样点数为80时:
如果输入信号的第一个样点的幅值|x[0]|小于某个预先设定阈值thr(如thr=128),则对窗函数的最前面8个点设置为:
w(n)=0.26+0.74·cos(2·π·(31-4·n)/127)n=0,1,2,...,7
否则对窗函数的最前面8个点设置为:
w(n)=0.16+0.84·cos(2·π·(31-4·n)/127),n=0,1,2,...,7
对窗函数第9至第72个点都设为1,即:
w(n)=1,n=8,...,71
如果输入信号的最后一个样点的幅值|x[79]|小于某个预先设定阈值thr(如thr=128),则对窗函数的最后面8个点设置为:
w(n)=0.26+0.74·cos(2·π·(4·n-285)/127),n=72,73,74,...,79
否则对窗函数的最后面8个点设置为:
w(n)=0.16+0.84·cos(2·π·(4·n-285)/127),n=72,73,74,...,79
然后用上述自适应设置后的窗函数w(n),n=0,1,...,78,79对信号x(n),n=0,1,...,78,79进行加窗,即
xd[n]=x[n]·w[n],n=0,1,...,78,79
得到自适应加窗后的信号xd[n]],n=0,1,...,78,79
窗函数w[n]的调整策略可根据不同的语音频编码器通过大量实验来选定,分别适用于不同的信号。阈值thr也是通过大量实验选定,如thr=128或thr=157等;
S203、对加窗后信号进行处理,得到线性预测编码系数,用于线性预测。
本发明实施例一提供的线性预测分析方法,通过获取输入信号的第一个样点和最后一个样点的幅值,并根据该样点幅值对输入信号进行自适应加窗,因此,能够在增加较少的编码复杂度的情况下,提高了线性预测编码的预测性能。
实施例二:
本发明实施例二提供的线性预测分析方法,如图3所示,该方法步骤包括:
S301、获取输入信号的第一个样点的幅值|x[0]|,其中,x[i],i=0,1,...,N-1为输入信号,N为输入信号的样点个数;输入信号在这里是指输入进行LPC分析的信号,可能是一帧信号,也可能是一帧信号加上历史缓冲区的一段信号(如历史缓冲区的L个样点,L可根据不同的编解码器采用不同的正整数,如40、80等);
S302、对样点幅值|x[0]|进行分析,并根据分析结果对输入信号进行自适应加窗:
如果输入信号的第一个样点的幅值|x[0]|大于(或大于等于)某个预先设定阈值thr,用第一窗函数对输入信号进行加窗,即令xd[i]=x[i]·w1[i],i=0,1,...,N-1,其中xd[i]为加窗后的信号,w1[i]为第一窗函数;
否则,则用第二窗函数对输入信号进行加窗,即令xd[i]=x[i]·w2[i],i=0,1,...,N-1,其中w2[i]为第二窗函数;
窗函数w1[i]和w2[i]可根据不同的语音频编码器通过大量实验来选定,分别适用于不同的信号,例如w1[i]为正弦窗,w2[i]为汉明窗;或者w1[i]为海明窗,w2[i]为正弦窗。阈值thr也是通过大量实验选定,如thr=128或thr=157;
在一个具体的实现中,thr=128,当帧长N=80时,
当帧长N=40时,
S303、对加窗后信号进行处理,得到线性预测编码系数,用于线性预测。
本发明实施例二提供的线性预测分析方法,通过获取输入信号的第一个样点的幅值,并根据该样点幅值对输入信号进行自适应加窗,因此,能够在增加较少的编码复杂度的情况下,提高了线性预测编码的预测性能。
实施例三:
本发明实施例三提供的线性预测分析方法,如图4所示,该方法步骤包括:
其中,x[i],i=0,1,...,N-1为输入信号,N为输入信号的样点个数;输入信号在这里是指输入进行LPC分析的信号,可能是一帧信号,也可能是一帧信号加上历史缓冲区的一段信号(如历史缓冲区的L个样点,L可根据不同的编解码器采用不同的正整数,如40、80等);
如果前(或后)M个样点的幅值平均值大于(或大于等于)某个预先设定阈值thr,用第一窗函数对输入信号进行加窗,即令xd[i]=x[i]·w1[i],i=0,1,...,N-1,其中xd[i]为加窗后的信号,w1[i]为第一窗函数;
否则,则用第二窗函数对输入信号进行加窗,即令xd[i]=x[i]·w2[i],i=0,1,...,N-1,其中w2[i]为第二窗函数;
窗函数w1[i]和w2[i]可根据不同的语音频编码器通过大量实验来选定,分别适用于不同的信号,例如w1[i]为正弦窗,w2[i]为汉明窗;或者w1[i]为海明窗,w2[i]为正弦窗。阈值thr也是通过大量实验选定,如thr=127或thr=152;
在一个具体的实现中,thr=128,当帧长N=80时,
当帧长N=40时,
S403、对加窗后信号进行处理,得到线性预测编码系数,用于线性预测。
本发明实施例三提供的线性预测分析方法,通过获取输入信号前(或后)M个样点的幅值平均值,并根据该平均值对输入信号进行自适应加窗,因此,能够在增加较少的编码复杂度的情况下,提高了线性预测编码的预测性能。
实施例四:
本发明实施例四提供的线性预测分析方法,如图5所示,该方法步骤包括:
S501、获取输入信号的前(或后)M个样点的平均能量其中,x[i],i=0,1,...,N-1为输入信号,N为输入信号的样点个数。输入信号在这里是指输入进行LPC分析的信号,可能是一帧信号,也可能是一帧信号加上历史缓冲区的一段信号(如历史缓冲区的L个样点,L可根据不同的编解码器采用不同的正整数,如40、80等);
如果前(或后)M个样点的幅值平均值大于(或大于等于)某个预先设定阈值thr,用第一窗函数对输入信号进行加窗,即令xd[i]=x[i]·w1[i],i=0,1,...,N-1,其中xd[i]为加窗后的信号,w1[i]为第一窗函数。
否则,则用第二窗函数对输入信号进行加窗,即令xd[i]=x[i]·w2[i],i=0,1,...,N-1,其中w2[i]为第二窗函数。
窗函数w1[i]和w2[i]可根据不同的语音频编码器通过大量实验来选定,分别适用于不同的信号,例如w1[i]为正弦窗,w2[i]为汉明窗;或者w1[i]为海明窗,w2[i]为正弦窗。阈值thr也是通过大量实验选定,如thr=1024或thr=2573。
在一个具体的实现中,thr=1280,当帧长N=80时,
当帧长N=40时,
S503、对加窗后信号进行处理,得到线性预测编码系数,用于线性预测。
本发明实施例四提供的线性预测分析方法,通过获取输入信号前(或后)M个样点的平均能量,并根据该平均能量对输入信号进行自适应加窗,因此,能够在增加较少的编码复杂度的情况下,提高了线性预测编码的预测性能。
实施例五:
本发明实施例五提供的线性预测分析方法,如图6所示,该方法步骤包括:
S601、获取输入信号的过零率其中,x[i],i=0,1,...,N-1为输入信号,N为输入信号的样点个数,为与(AND)操作。输入信号在这里是指输入进行LPC分析的信号,可能是一帧信号,也可能是一帧信号加上历史缓冲区的一段信号(如历史缓冲区的L个样点,L可根据不同的编解码器采用不同的正整数,如40、80等);
S602、对过零率zc进行分析,并根据分析结果对输入信号进行自适应加窗:
如果过零率zc大于(或大于等于)某个预先设定阈值thr,用第一窗函数对输入信号进行加窗,即令xd[i]=x[i]·w1[i],i=0,1,...,N-1,其中xd[i]为加窗后的信号,w1[i]为第一窗函数;
否则,则用第二窗函数对输入信号进行加窗,即令xd[i]=x[i]·w2[i],i=0,1,...,N-1,其中w2[i]为第二窗函数;
窗函数w1[i]和w2[i]可根据不同的语音频编码器通过大量实验来选定,分别适用于不同的信号,例如w1[i]为正弦窗,w2[i]为汉明窗;或者w1[i]为海明窗,w2[i]为正弦窗。阈值thr也是通过大量实验选定,如thr=15或thr=23;
在一个具体的实现中,thr=18,当帧长N=80时,
当帧长N=40时,
S603、对加窗后信号进行处理,得到线性预测编码系数,用于线性预测。
本发明实施例五提供的线性预测分析方法,通过获取输入信号的过零率,并根据该过零率对输入信号进行自适应加窗,因此,能够在增加较少的编码复杂度的情况下,提高了线性预测编码的预测性能。
实施例六:
本发明实施例六提供的线性预测分析方法,如图7所示,该方法步骤包括:
S701、获取输入信号的过零率和前(或后)M个样点的平均能量其中,x[i],i=0,1,...,N-1为输入信号,N为输入信号的样点个数,为与(AND)操作。输入信号在这里是指输入进行LPC分析的信号,可能是一帧信号,也可能是一帧信号加上历史缓冲区的一段信号(如历史缓冲区的L个样点,L可根据不同的编解码器采用不同的正整数,如40、80等);
如果过零率zc大于(或大于等于)某个预先设定阈值thr1或小于等于某个预先设定的阈值thr2,用第一窗函数对输入信号进行加窗,即令xd[i]=x[i]·w1[i],i=0,1,...,N-1,其中xd[i]为加窗后的信号,w1[i]为第一窗函数。
否则,则用第二窗函数对输入信号进行加窗,即令xd[i]=x[i]·w2[i],i=0,1,...,N-1,其中w2[i]为第二窗函数。
窗函数w1[i]和w2[i]可根据不同的语音频编码器通过大量实验来选定,分别适用于不同的信号,例如w1[i]为正弦窗,w2[i]为汉明窗;或者w1[i]为海明窗,w2[i]为正弦窗。阈值thr1和thr2也是通过大量实验选定,如thr1=15、thr2=1023或thr1=23、thr2=1012。
在一个具体的实现中,thr1=17、thr2=1012,当帧长N=80时,
当帧长N=40时,
S703、对加窗后信号进行处理,得到线性预测编码系数,用于线性预测。
本发明实施例六提供的线性预测分析方法,通过获取输入信号的过零率和前(或后)M个样点的平均能量,并根据该过零率和平均能量对输入信号进行自适应加窗,因此,能够在增加较少的编码复杂度的情况下,提高了线性预测编码的预测性能。
实施例七:
本发明实施例七提供的线性预测分析方法,如图8所示,该方法步骤包括:
S801、获取输入信号编码方式,输入信号为G.711信号,可能为A-law信号,也可能为mu-law信号;对输入信号进行转换,得到PCM信号;
S802、对输入信号编码方式进行分析,并根据分析结果对PCM信号进行自适应加窗如:
如果编码方式为A-law,用第一窗函数对PCM信号进行加窗,即令xd[i]=x[i]·w1[i],i=0,1,...,N-1,其中xd[i]为加窗后的信号,w1[i]为第一窗函数,x[i]为PCM信号。
否则,则用第二窗函数对PCM信号进行加窗,即令xd[i]=x[i]·w2[i],i=0,1,...,N-1,其中w2[i]为第二窗函数。
窗函数w1[i]和w2[i]可根据不同的语音频编码器通过大量实验来选定,分别适用于不同的信号,例如w1[i]为正弦窗,w2[i]为汉明窗;或者w1[i]为海明窗,w2[i]为正弦窗;
在一个具体的实现中,当编码方式为A-law或mu-law时,当帧长N=80时,
当帧长N=40时,
S803、对加窗后信号进行处理,得到线性预测编码系数,用于线性预测。
本发明实施例七提供的线性预测分析方法,获取输入信号编码方式,并对输入信号进行转换,得到PCM信号,根据该信号编码方式对输入信号进行自适应加窗,因此,能够在增加较少的编码复杂度的情况下,提高了线性预测编码的预测性能。
本发明实施例提供的线性预测分析装置,如图9所示,包括:
获取单元901,用于获取输入信号至少一个样点的信号特性信息;
分析单元902,用于对信号特性信息进行比较分析,得到分析结果;
加窗单元903,用于根据分析结果选择窗函数对输入信号进行自适应加窗,得到加窗后信号;
处理单元904,用于述加窗后信号进行处理,得到线性预测编码系数,用于线性预测。
本发明实施例提供的线性预测分析装置,通过对输入信号进行分析,得到结果,并根据分析结果自适应分配加窗所需的窗函数,因此,能够在增加较少的编码复杂度的情况下,提高了线性预测编码的预测性能。
其中,在本发明另一实施例中,如图10所示,分析单元902包括:
计算模块902A,用于计算获取单元901获取的信号特性信息的值,信号特性信息的值包括某一个样点的信号特性信息的值和/或某多个样点的信号特性信息的值的平均值;
判断模块902B,用于判断计算模块902A得出的信号特性信息的值是否大于或大于等于某一阈值;或者用于判断获取单元901获取的输入信号的信号类型和/或编码方式。
进一步地,在上述分析单元902中,还包括:
转换模块902C,用于将获取单元901获取的输入信号转换为脉冲编码调制信号。
本发明实施例提供的线性预测分析装置,通过对输入信号进行分析,得到结果,并根据分析结果自适应分配加窗所需的窗函数,因此,能够在增加较少的编码复杂度的情况下,提高了线性预测编码的预测性能。
本发明实施例提供的线性预测编码系统,如图11所示,包括:
线性预测分析装置1101,用于获取输入信号至少一个样点的信号特性信息;对信号特性信息进行比较分析,得到分析结果;根据分析结果选择窗函数对输入信号进行自适应加窗,得到加窗后信号;对加窗后信号进行处理,得到线性预测编码系数;
编码装置1102,用于根据线性预测分析装置1101得到的线性预测编码系数进行编码。
本发明实施例提供的线性预测编码系统,能够先通过对输入信号进行分析,得到结果,并根据分析结果自适应分配加窗所需的窗函数,进而得到线性预测编码系数;然后再根据该线性预测编码系数进行编码。因此,能够在增加较少的编码复杂度的情况下,提高了线性预测编码的预测性能。
其中,在本发明的另一实施例中,如图12所示,线性预测分析装置1101与上述实施例中的线性预测分析装置构造相同,在此就不再赘述。
本发明实施例提供的线性预测编码系统,能够先通过对输入信号进行分析,得到结果,并根据分析结果自适应分配加窗所需的窗函数,进而得到线性预测编码系数;然后再根据该线性预测编码系数进行编码。因此,能够在增加较少的编码复杂度的情况下,提高了线性预测编码的预测性能。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-OnlyMemory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (7)
1.一种线性预测分析方法,其特征在于,包括:
获取输入信号至少一个样点的信号特性信息;所述信号特性信息包括:幅值、能量、过零率、帧长中的任意一个或任意多个;
计算获取的信号特性信息的值,并判断所述信号特性信息的值是否大于或大于等于某一阈值,其中,所述信号特性信息的值包括某一个或多个样点的信号特性信息的值和/或某多个样点的信号特性信息的值的平均值;
当确定所述信号特性信息的值大于或大于等于某一阈值时,用第一窗函数对所述输入信号进行自适应加窗,得到加窗后信号;否则,用第二窗函数对所述输入信号进行自适应加窗,得到加窗后信号;
对所述加窗后信号进行处理,得到线性预测编码系数用于线性预测。
2.根据权利要求1所述的线性预测分析方法,其特征在于,获取输入信号至少一个样点的信号特性信息包括:
将所述输入信号转换为脉冲编码调制信号;
获取转换后的所述输入信号至少一个样点的信号特性信息。
3.一种线性预测分析方法,其特征在于,包括:
获取输入信号的信号类型、输入信号的编码方式中的任意一个或任意多个;
当确定所述输入信号的类型和/或编码方式时,根据所述输入信号的类型和/或编码方式的不同,选择第一窗函数或第二窗函数对所述输入信号进行自适应加窗,得到加窗后信号;
对所述加窗后信号进行处理,得到线性预测编码系数用于线性预测。
4.一种线性预测分析装置,其特征在于,包括:
获取单元,用于获取输入信号至少一个样点的信号特性信息;
分析单元,用于对所述信号特性信息进行比较分析,得到分析结果;
加窗单元,用于根据所述分析结果选择窗函数对所述输入信号进行自适应加窗,得到加窗后信号;
处理单元,用于对所述加窗后信号进行处理,得到线性预测编码系数,用于线性预测;其中所述分析单元包括:
计算模块,用于计算所述获取单元获取的信号特性信息的值,所述信号特性信息的值包括某一个样点的信号特性信息的值和/或某多个样点的信号特性信息的值的平均值;
判断模块,用于判断所述计算模块得出的所述信号特性信息的值是否大于或大于等于某一阈值;或者用于判断所述获取单元获取的输入信号的信号类型和/或编码方式。
5.根据权利要求4所述的线性预测分析装置,其特征在于,所述分析单元还包括:
转换模块,用于将所述获取单元获取的输入信号转换为脉冲编码调制信号。
6.根据权利要求4所述的线性预测分析装置,其特征在于,所述加窗单元包括:
选择模块,用于根据所述判断模块判断出的结果,选择窗函数;
加窗计算模块,用于根据所述选择模块选择的窗函数对所述输入信号进行自适应加窗,得到加窗后信号。
7.一种线性预测编码系统,其特征在于,包括:
线性预测分析装置,用于获取输入信号至少一个样点的信号特性信息;对所述信号特性信息进行比较分析,得到分析结果;根据所述分析结果选择窗函数对所述输入信号进行自适应加窗,得到加窗后信号;对所述加窗后信号进行处理,得到线性预测编码系数;
编码装置,用于根据所述线性预测分析装置得到的所述线性预测编码系数进行编码。其中,所述线性预测分析装置包括:
获取单元,用于获取输入信号至少一个样点的信号特性信息;
分析单元,用于对所述信号特性信息进行比较分析,得到分析结果;
加窗单元,用于根据所述分析结果选择窗函数对所述输入信号进行自适应加窗,得到加窗后信号;
处理单元,用于对所述加窗后信号进行处理,得到线性预测编码系数,用于线性预测;所述分析单元包括:
计算模块,用于计算所述获取单元获取的信号特性信息的值,所述信号特性信息的值包括某一个样点的信号特性信息的值和/或某多个样点的信号特性信息的值的平均值;
判断模块,用于判断所述计算模块得出的所述信号特性信息的值是否大于或大于等于某一阈值;或者用于判断所述获取单元获取的输入信号的信号类型和/或编码方式。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2009/070729 WO2010102446A1 (zh) | 2009-03-11 | 2009-03-11 | 一种线性预测分析方法、装置及系统 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210462237.2A Division CN102930871B (zh) | 2009-03-11 | 2009-03-11 | 一种线性预测分析方法、装置及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102067211A CN102067211A (zh) | 2011-05-18 |
CN102067211B true CN102067211B (zh) | 2013-04-17 |
Family
ID=42727779
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2009800001092A Active CN102067211B (zh) | 2009-03-11 | 2009-03-11 | 一种线性预测分析方法、装置及系统 |
Country Status (5)
Country | Link |
---|---|
US (1) | US8812307B2 (zh) |
EP (1) | EP2407963B1 (zh) |
KR (1) | KR101397512B1 (zh) |
CN (1) | CN102067211B (zh) |
WO (1) | WO2010102446A1 (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101397512B1 (ko) | 2009-03-11 | 2014-05-22 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 선형 예측 코딩 분석을 위한 방법, 장치 및 시스템 |
JP6117359B2 (ja) * | 2013-07-18 | 2017-04-19 | 日本電信電話株式会社 | 線形予測分析装置、方法、プログラム及び記録媒体 |
CN103700386B (zh) * | 2013-12-16 | 2017-09-29 | 联想(北京)有限公司 | 一种信息处理方法及电子设备 |
CN111105807B (zh) | 2014-01-15 | 2023-09-15 | 三星电子株式会社 | 对线性预测编码系数进行量化的加权函数确定装置和方法 |
PL3462448T3 (pl) * | 2014-01-24 | 2020-08-10 | Nippon Telegraph And Telephone Corporation | Urządzenie, sposób i program do analizy liniowo-predykcyjnej oraz nośnik zapisu |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1338096A (zh) * | 1998-12-30 | 2002-02-27 | 诺基亚移动电话有限公司 | 用于分析-合成celp型语音编码的自适应窗 |
CN1732530A (zh) * | 2002-11-07 | 2006-02-08 | 三星电子株式会社 | 运动图像专家组音频编码方法及装置 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3902948A1 (de) * | 1989-02-01 | 1990-08-09 | Telefunken Fernseh & Rundfunk | Verfahren zur uebertragung eines signals |
US5305421A (en) * | 1991-08-28 | 1994-04-19 | Itt Corporation | Low bit rate speech coding system and compression |
US5642464A (en) | 1995-05-03 | 1997-06-24 | Northern Telecom Limited | Methods and apparatus for noise conditioning in digital speech compression systems using linear predictive coding |
FR2742568B1 (fr) | 1995-12-15 | 1998-02-13 | Catherine Quinquis | Procede d'analyse par prediction lineaire d'un signal audiofrequence, et procedes de codage et de decodage d'un signal audiofrequence en comportant application |
US5848391A (en) * | 1996-07-11 | 1998-12-08 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Method subband of coding and decoding audio signals using variable length windows |
CA2246532A1 (en) * | 1998-09-04 | 2000-03-04 | Northern Telecom Limited | Perceptual audio coding |
US6978236B1 (en) * | 1999-10-01 | 2005-12-20 | Coding Technologies Ab | Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching |
JP4207568B2 (ja) * | 2000-12-14 | 2009-01-14 | ソニー株式会社 | 情報抽出装置および方法、情報合成装置および方法、並びに記録媒体 |
JP3859462B2 (ja) | 2001-05-18 | 2006-12-20 | 株式会社東芝 | 予測パラメータ分析装置および予測パラメータ分析方法 |
AUPS102902A0 (en) * | 2002-03-13 | 2002-04-11 | Hearworks Pty Ltd | A method and system for reducing potentially harmful noise in a signal arranged to convey speech |
US7231344B2 (en) * | 2002-10-29 | 2007-06-12 | Ntt Docomo, Inc. | Method and apparatus for gradient-descent based window optimization for linear prediction analysis |
AU2003208517A1 (en) * | 2003-03-11 | 2004-09-30 | Nokia Corporation | Switching between coding schemes |
US7148415B2 (en) * | 2004-03-19 | 2006-12-12 | Apple Computer, Inc. | Method and apparatus for evaluating and correcting rhythm in audio data |
JP4533386B2 (ja) * | 2004-07-22 | 2010-09-01 | 富士通株式会社 | オーディオ符号化装置及びオーディオ符号化方法 |
KR200421226Y1 (ko) | 2006-04-18 | 2006-07-10 | 솔렌스(주) | 기능성 조경 나무명패 설치장치 |
US7987089B2 (en) * | 2006-07-31 | 2011-07-26 | Qualcomm Incorporated | Systems and methods for modifying a zero pad region of a windowed frame of an audio signal |
US8630863B2 (en) * | 2007-04-24 | 2014-01-14 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding and decoding audio/speech signal |
US9653088B2 (en) * | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
KR101441896B1 (ko) * | 2008-01-29 | 2014-09-23 | 삼성전자주식회사 | 적응적 lpc 계수 보간을 이용한 오디오 신호의 부호화,복호화 방법 및 장치 |
KR101397512B1 (ko) | 2009-03-11 | 2014-05-22 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 선형 예측 코딩 분석을 위한 방법, 장치 및 시스템 |
-
2009
- 2009-03-11 KR KR1020117023175A patent/KR101397512B1/ko active Active
- 2009-03-11 WO PCT/CN2009/070729 patent/WO2010102446A1/zh active Application Filing
- 2009-03-11 CN CN2009800001092A patent/CN102067211B/zh active Active
- 2009-03-11 EP EP09841315.6A patent/EP2407963B1/en active Active
-
2011
- 2011-09-09 US US13/228,965 patent/US8812307B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1338096A (zh) * | 1998-12-30 | 2002-02-27 | 诺基亚移动电话有限公司 | 用于分析-合成celp型语音编码的自适应窗 |
CN1732530A (zh) * | 2002-11-07 | 2006-02-08 | 三星电子株式会社 | 运动图像专家组音频编码方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2010102446A1 (zh) | 2010-09-16 |
US20110320195A1 (en) | 2011-12-29 |
EP2407963A1 (en) | 2012-01-18 |
KR20110132435A (ko) | 2011-12-07 |
US8812307B2 (en) | 2014-08-19 |
KR101397512B1 (ko) | 2014-05-22 |
EP2407963A4 (en) | 2012-08-01 |
CN102067211A (zh) | 2011-05-18 |
EP2407963B1 (en) | 2015-05-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8862463B2 (en) | Adaptive time/frequency-based audio encoding and decoding apparatuses and methods | |
CN101488344B (zh) | 一种量化噪声泄漏控制方法及装置 | |
CN103109318B (zh) | 利用前向混迭消除技术的编码器 | |
CN102067211B (zh) | 一种线性预测分析方法、装置及系统 | |
CN102150202A (zh) | 对音频/语音信号进行编码和解码的方法和设备 | |
EP1982329A1 (en) | Adaptive time and/or frequency-based encoding mode determination apparatus and method of determining encoding mode of the apparatus | |
KR20060088542A (ko) | 오디오 인코딩에서 mdct 데이터에 기초한 윈도우유형의 결정 방법 | |
US10580423B2 (en) | Method and apparatus for processing temporal envelope of audio signal, and encoder | |
US8380495B2 (en) | Transcoding method, transcoding device and communication apparatus used between discontinuous transmission | |
CN102930871B (zh) | 一种线性预测分析方法、装置及系统 | |
CN101609677B (zh) | 一种预处理方法、装置及编码设备 | |
CN101609681A (zh) | 编码方法、编码器、解码方法及解码器 | |
CN102098057B (zh) | 一种量化编解码方法和装置 | |
CN101604525B (zh) | 基音增益获取方法、装置及编码器、解码器 | |
WO2007028280A1 (fr) | Codeur et decodeur pour commande de pre echo et son procede | |
JP5320508B2 (ja) | 符号化装置、復号装置、これらの方法、プログラム及び記録媒体 | |
CN101651457A (zh) | 音频编解码器及编解码方法 | |
KR20240066586A (ko) | 복소수 양자화를 이용하는 오디오 신호의 부호화 및 복호화 방법 및 장치 | |
CN102446509A (zh) | 增强抗丢包的音频编解码方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |