[go: up one dir, main page]

CN102930871B - 一种线性预测分析方法、装置及系统 - Google Patents

一种线性预测分析方法、装置及系统 Download PDF

Info

Publication number
CN102930871B
CN102930871B CN201210462237.2A CN201210462237A CN102930871B CN 102930871 B CN102930871 B CN 102930871B CN 201210462237 A CN201210462237 A CN 201210462237A CN 102930871 B CN102930871 B CN 102930871B
Authority
CN
China
Prior art keywords
windowing
input signal
signal
sampling point
centerdot
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210462237.2A
Other languages
English (en)
Other versions
CN102930871A (zh
Inventor
许剑峰
苗磊
齐峰岩
张德军
张清
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201210462237.2A priority Critical patent/CN102930871B/zh
Publication of CN102930871A publication Critical patent/CN102930871A/zh
Application granted granted Critical
Publication of CN102930871B publication Critical patent/CN102930871B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明公开了一种线性预测分析方法、装置及系统,涉及通信领域,能够提高线性预测编码的预测性能,并且分析运算复杂度低。解决方案为:获取输入信号至少一个样点的信号特性信息;对所述信号特性信息进行比较分析,得到分析结果;根据所述分析结果选择窗函数对所述输入信号进行自适应加窗,得到加窗后信号;对所述加窗后信号进行处理,得到线性预测编码系数用于线性预测。本发明用于线性预测编码。

Description

一种线性预测分析方法、装置及系统
技术领域
本发明涉及通信领域,尤其涉及一种线性预测分析方法、装置及系统。
背景技术
为节省语音与音频信号传输和存储的带宽,相应的语音与音频编码技术得到了广泛的应用,目前主要分为有损编码和无损编码,有损编码的重建信号与原始信号并不能保持完全一致,但可以根据声源特点及人的感知特点最大程度上减少信号的冗余信息。无损编码则必须保证重建信号与原始信号完全一致,可以使得最后的解码质量没有任何损伤,一般来讲有损编码压缩率比较高,但重建语音质量没有保证,无损编码可以保证语音质量,但压缩率较低,大约50%左右。
无论在有损编码或无损编码中,线性预测编码(LPC,Linear PredictionCoding)模型被广泛地应用在语音编码领域中,在有损编码中码激励线性预测编码模型是其典型应用的成功。基本原理为:先利用短时线性预测去除语音信号的近样点冗余度,再用长时预测器去除语音信号的远样点冗余度,最后对预测过程中产生的参数以及经过两级预测得到的残差信号进行编码传输。
目前大多数有损和无损音频编解码的线性预测分析一般包括加窗、求自相关和Levinson算法求解三个模块,通过线性预测来得到残差信号,再用熵编码对残差信号进行编码来实现音频压缩。
在实现上述线性预测编码的过程中,发明人发现现有技术中至少存在以下问题:
加窗时采用固定窗函数,会使得线性预测性能达不到最优;
或者,对输入信号分别进行两次线性预测分析,一次给信号加短窗,另一次给信号加长窗,会因为对输入信号进行了两次线性预测分析,使得线性预测分析的复杂度较大。
发明内容
本发明的实施例提供一种线性预测分析方法、装置及系统,能够提高线性预测性能,降低分析运算复杂度。
一种线性预测分析方法,包括:
获取输入信号的第一个样点的幅值和最后一个样点的幅值,所述输入信号包含N个样点,N为正整数;
对所述第一个样点的幅值和最后一个样点的幅值进行分析,并根据分析结果对输入信号进行自适应加窗,得到加窗后信号;
对加窗后信号进行处理,得到线性预测编码系数用于线性预测。
本发明实施例提供的线性预测分析方法,通过获取输入信号的第一个样点和最后一个样点的幅值,并根据该样点幅值对输入信号进行自适应加窗,因此,能够在增加较少的编码复杂度的情况下,提高了线性预测编码的预测性能。
一种线性预测分析方法,包括:
一种线性预测分析方法,其特征在于,包括:
获取输入信号编码方式,所述输入信号为G.711信号;
对输入信号进行转换,得到PCM信号;
对输入信号编码方式进行分析,并根据分析结果对PCM信号进行自适应加窗,得到加窗后信号;
对所述加窗后信号进行处理,得到线性预测编码系数用于线性预测。
本发明实施例提供的线性预测分析方法,通过对输入信号编码方式进行分析,根据该信号编码方式对输入信号进行自适应加窗,因此,能够在增加较少的编码复杂度的情况下,提高了线性预测编码的预测性能。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的线性预测分析方法的流程框图;
图2为本发明实施例一提供的线性预测分析方法的流程框图;
图3为本发明实施例二提供的线性预测分析方法的流程框图;
图4为本发明实施例三提供的线性预测分析方法的流程框图;
图5为本发明实施例四提供的线性预测分析方法的流程框图;
图6为本发明实施例五提供的线性预测分析方法的流程框图;
图7为本发明实施例六提供的线性预测分析方法的流程框图;
图8为本发明实施例七提供的线性预测分析方法的流程框图;
图9为本发明实施例提供的线性预测分析装置的结构框图;
图10为本发明另一实施例提供的线性预测分析装置的结构框图;
图11为本发明实施例提供的线性预测编码系统的构造框图;
图12为本发明另一实施例提供的线性预测编码系统的构造框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的实施例提供一种线性预测分析方法、装置及系统,能够提高线性预测性能,降低分析运算复杂度。
下面结合附图对本发明实施例进行详细描述。
本发明实施例提供的线性预测分析方法,如图1所示,该方法的步骤包括:
S101、获取输入信号至少一个样点的信号特性信息;
S102、对信号特性信息进行比较分析,得到分析结果;
S103、根据分析结果选择窗函数对输入信号进行自适应加窗,得到加窗后信号;
S104、对加窗后信号进行处理,得到线性预测编码系数用于线性预测。
本发明实施例提供的线性预测分析方法,通过对输入信号进行分析,得到结果,并根据分析结果自适应分配加窗所需的窗函数,因此,能够在增加较少的编码复杂度的情况下,提高了线性预测编码的预测性能。
其中,信号特性信息包括幅值、能量、过零率、信号类型、帧长、编码方式中的任意一个或任意多个。
下面通过具体实施例加以说明。
实施例一:
本发明实施例一提供的线性预测分析方法,如图2所示,该方法步骤包括:
S201、获取输入信号的第一个样点的幅值|x[0]|和最后一个样点的幅值|x[N-1]|,其中,x[i],i=0,1,...,N-1为输入信号,N为输入信号的样点个数(如40、80、160、240、320等);输入信号在这里是指输入进行LPC分析的信号,可能是一帧信号,也可能是一帧信号加上历史缓冲区的一段信号(如历史缓冲区的L个样点,L可根据不同的编解码器采用不同的正整数,如40、80、160、240、320等);
S202、对样点幅值|x[0]|和|x[N-1]|进行分析,并根据分析结果对输入信号进行自适应加窗:
如当输入样点数为40时:
如果输入信号的第一个样点的幅值|x[0]|小于某个预先设定阈值thr(如thr=128),则对窗函数的最前面4个点设置为:
w(n)=0.23+0.77·cos(2·π·(31-8·n)/127),n=0,1,2,3
否则对窗函数的最前面4个点设置为:
w(n)=0.26+0.74·cos(2·π·(31-8·n)/127),n=0,1,2,3
对窗函数第5至第36个点都设为1,即:
w(n)=1,n=4,...,35
如果输入信号的最后一个样点的幅值|x[39]|小于某个预先设定阈值thr(如thr=128),则对窗函数的最后面4个点设置为:
w(n)=0.23+0.77·cos(2·π·(8·n-281)/127),n=36,37,38,39
否则对窗函数的最后面4个点设置为:
w(n)=0.26+0.74·cos(2·π·(8·n-281)/127),n=36,37,38,39
然后用上述自适应设置后的窗函数w(n),n=1,2,...,38,39对信号x(n),n=1,2,...,38,39进行加窗,即
xd[n]=x[n]·w[n],n=0,1,...,38,39
得到自适应加窗后的信号xd[n]],n=0,1,...,38,39
又如当输入样点数为80时:
如果输入信号的第一个样点的幅值|x[0]|小于某个预先设定阈值thr(如thr=128),则对窗函数的最前面8个点设置为:
w(n)=0.26+0.74·cos(2·π·(31-4·n)/127),n=0,1,2,...,7
否则对窗函数的最前面8个点设置为:
w(n)=0.16+0.84·cos(2·π·(31-4·n)/127),n=0,1,2,...,7
对窗函数第9至第72个点都设为1,即:
w(n)=1,n=8,...,71
如果输入信号的最后一个样点的幅值|x[79]|小于某个预先设定阈值thr(如thr=128),则对窗函数的最后面8个点设置为:
w(n)=0.26+0.74·cos(2·π·(4·n-285)/127),n=72,73,74,...,79
否则对窗函数的最后面8个点设置为:
w(n)=0.16+0.84·cos(2·π·(4·n-285)/127),n=72,73,74,...,79
然后用上述自适应设置后的窗函数w(n),n=0,1,...,78,79对信号x(n),n=0,1,...,78,79进行加窗,即
xd[n]=x[n]·w[n],n=0,1,...,78,79
得到自适应加窗后的信号xd[n]],n=0,1,...,78,79
窗函数w[n]的调整策略可根据不同的语音频编码器通过大量实验来选定,分别适用于不同的信号。阈值thr也是通过大量实验选定,如thr=128或thr=157等;
S203、对加窗后信号进行处理,得到线性预测编码系数,用于线性预测。
本发明实施例一提供的线性预测分析方法,通过获取输入信号的第一个样点和最后一个样点的幅值,并根据该样点幅值对输入信号进行自适应加窗,因此,能够在增加较少的编码复杂度的情况下,提高了线性预测编码的预测性能。
实施例二:
本发明实施例二提供的线性预测分析方法,如图3所示,该方法步骤包括:
S301、获取输入信号的第一个样点的幅值|x[0]|,其中,x[i],i=0,1,...,N-1为输入信号,N为输入信号的样点个数;输入信号在这里是指输入进行LPC分析的信号,可能是一帧信号,也可能是一帧信号加上历史缓冲区的一段信号(如历史缓冲区的L个样点,L可根据不同的编解码器采用不同的正整数,如40、80等);
S302、对样点幅值|x[0]|进行分析,并根据分析结果对输入信号进行自适应加窗:
如果输入信号的第一个样点的幅值|x[0]|大于(或大于等于)某个预先设定阈值thr,用第一窗函数对输入信号进行加窗,即令xd[i]=x[i]·w1[i],i=0,1,...,N-1,其中xd[i]为加窗后的信号,w1[i]为第一窗函数;
否则,则用第二窗函数对输入信号进行加窗,即令xd[i]=x[i]·w2[i],i=0,1,...,N-1,其中w2[i]为第二窗函数;
窗函数w1[i]和w2[i]可根据不同的语音频编码器通过大量实验来选定,分别适用于不同的信号,例如w1[i]为正弦窗,w2[i]为汉明窗;或者w1[i]为海明窗,w2[i]为正弦窗。阈值thr也是通过大量实验选定,如thr=128或thr=157;
在一个具体的实现中,thr=128,当帧长N=80时,
w 1 [ i ] = 0.16 + 0.84 · cos ( 2 · π · ( 31 - 4 · i ) / 127 ) , i = 0,1 , . . . , 7 1 , i = 8,9 , . . . , 71 0.16 + 0.84 · cos ( 2 · π ( 4 · i - 285 ) / 127 ) , i = 72,73 , . . . , 79
w 2 [ i ] = 0.26 + 0.74 · cos ( 2 · π ( 31 - 4 · i ) / 127 ) , i = 0,1 , . . . , 7 1 , i = 8,9 , . . . , 71 0.26 + 0.74 · cos ( 2 · π · ( 4 · i - 285 ) / 127 ) , i = 72,73 , . . . , 79
当帧长N=40时,
w 1 [ i ] = 0.26 + 0.74 · cos ( 2 · π ( 31 - 8 · i ) / 127 ) , i = 0,1 , . . . , 3 1 , i = 4,5 , . . . , 35 0.26 + 0.74 · cos ( 2 · π · ( 8 · i - 281 ) / 127 ) , i = 36,37 , . . . , 39
w 1 [ i ] = 0.23 + 0.77 · cos ( 2 · π · ( 31 - 8 · i ) / 127 ) , i = 0,1 , . . . , 3 1 , i = 4,5 , . . . , 35 0.23 + 0.77 · cos ( 2 · π · ( 8 · i - 281 ) / 127 ) , i = 36,37 , . . . , 39
S303、对加窗后信号进行处理,得到线性预测编码系数,用于线性预测。
本发明实施例二提供的线性预测分析方法,通过获取输入信号的第一个样点的幅值,并根据该样点幅值对输入信号进行自适应加窗,因此,能够在增加较少的编码复杂度的情况下,提高了线性预测编码的预测性能。
实施例三:
本发明实施例三提供的线性预测分析方法,如图4所示,该方法步骤包括:
S401、获取输入信号的前(或后)M个样点的幅值平均值其中,x[i],i=0,1,...,N-1为输入信号,N为输入信号的样点个数;输入信号在这里是指输入进行LPC分析的信号,可能是一帧信号,也可能是一帧信号加上历史缓冲区的一段信号(如历史缓冲区的L个样点,L可根据不同的编解码器采用不同的正整数,如40、80等);
S402、对前(或后)M个样点的幅值平均值进行分析,并根据分析结果对输入信号进行自适应加窗:
如果前(或后)M个样点的幅值平均值大于(或大于等于)某个预先设定阈值thr,用第一窗函数对输入信号进行加窗,即令xd[i]=x[i]·w1[i],i=0,1,...,N-1,其中xd[i]为加窗后的信号,w1[i]为第一窗函数;
否则,则用第二窗函数对输入信号进行加窗,即令xd[i]=x[i]·w2[i],i=0,1,...,N-1,其中w2[i]为第二窗函数;
窗函数w1[i]和w2[i]可根据不同的语音频编码器通过大量实验来选定,分别适用于不同的信号,例如w1[i]为正弦窗,w2[i]为汉明窗;或者w1[i]为海明窗,w2[i]为正弦窗。阈值thr也是通过大量实验选定,如thr=127或thr=152;
在一个具体的实现中,thr=128,当帧长N=80时,
w 1 [ i ] = 0.15 + 0.85 · cos ( 2 · π · ( 31 - 4 · i ) / 127 ) , i = 0,1 , . . . , 7 1 , i = 8,9 , . . . , 71 0.15 + 0.85 · cos ( 2 · π · ( 4 · i - 285 ) / 127 ) , i = 72,73 , . . . , 79
w 2 [ i ] = 0.27 + 0.73 · cos ( 2 · π · ( 31 - 4 · i ) / 127 ) , i = 0,1 , . . . , 7 1 , i = 8,9 , . . . , 71 0.27 + 0.73 · cos ( 2 · π · ( 4 · i - 285 ) / 127 ) , i = 72,73 , . . . , 79
当帧长N=40时,
w 1 [ i ] = 0.26 + 0.74 · cos ( 2 · π · ( 31 - 8 · i ) / 127 ) , i = 0,1 , . . . , 3 1 , i = 4,5 , . . . , 35 0.26 + 0.74 · cos ( 2 · π · ( 8 · i - 281 ) / 127 ) , i = 36.37 , . . . , 39
w 1 [ i ] = 0.23 + 0.77 · cos ( 2 · π · ( 31 - 8 · i ) / 127 ) , i = 0,1 , . . . , 3 1 , i = 4,5 , . . . , 35 0.23 + 0.77 · cos ( 2 · π · ( 8 · i - 281 ) / 127 ) , i = 36,37 , . . . , 39
S403、对加窗后信号进行处理,得到线性预测编码系数,用于线性预测。
本发明实施例三提供的线性预测分析方法,通过获取输入信号前(或后)M个样点的幅值平均值,并根据该平均值对输入信号进行自适应加窗,因此,能够在增加较少的编码复杂度的情况下,提高了线性预测编码的预测性能。
实施例四:
本发明实施例四提供的线性预测分析方法,如图5所示,该方法步骤包括:
S501、获取输入信号的前(或后)M个样点的平均能量其中,x[i],i=0,1,...,N-1为输入信号,N为输入信号的样点个数。输入信号在这里是指输入进行LPC分析的信号,可能是一帧信号,也可能是一帧信号加上历史缓冲区的一段信号(如历史缓冲区的L个样点,L可根据不同的编解码器采用不同的正整数,如40、80等);
S502、对前(或后)M个样点的平均能量进行分析,并根据分析结果对输入信号进行自适应加窗:
如果前(或后)M个样点的幅值平均值大于(或大于等于)某个预先设定阈值thr,用第一窗函数对输入信号进行加窗,即令xd[i]=x[i]·w1[i],i=0,1,...,N-1,其中xd[i]为加窗后的信号,w1[i]为第一窗函数。
否则,则用第二窗函数对输入信号进行加窗,即令xd[i]=x[i]·w2[i],i=0,1,...,N-1,其中w2[i]为第二窗函数。
窗函数w1[i]和w2[i]可根据不同的语音频编码器通过大量实验来选定,分别适用于不同的信号,例如w1[i]为正弦窗,w2[i]为汉明窗;或者w1[i]为海明窗,w2[i]为正弦窗。阈值thr也是通过大量实验选定,如thr=1024或thr=2573。
在一个具体的实现中,thr=1280,当帧长N=80时,
w 1 [ i ] = 0.18 + 0.82 · cos ( 2 · π · ( 31 - 4 · i ) / 127 ) , i = 0,1 , . . . , 7 1 , i = 8,9 , . . . , 71 0.18 + 0.82 · cos ( 2 · π · ( 4 · i - 285 ) / 127 ) , i = 72,73 , . . . , 79
w 2 [ i ] = 0.25 + 0.75 · cos ( 2 · π · ( 31 - 4 · i ) / 127 ) , i = 0,1 , . . . , 7 1 , i = 8,9 , . . . , 71 0.25 + 0.75 · cos ( 2 · π · ( 4 · i - 285 ) / 127 ) , i = 72,73 , . . . , 79
当帧长N=40时,
w 1 [ i ] = 0.25 + 0.75 · cos ( 2 · π · ( 31 - 8 · i ) / 127 ) , i = 0,1 , . . . , 3 1 , i = 4,5 , . . . , 35 0.25 + 0.75 · cos ( 2 · π · ( 8 · i - 281 ) / 127 ) , i = 36,37 , . . . , 39
w 1 [ i ] = 0.24 + 0.76 · cos ( 2 · π · ( 31 - 8 · i ) / 127 ) , i = 0,1 , . . . , 3 1 , i = 4,5 , . . . , 35 0.24 + 0.76 · cos ( 2 · π · ( 8 · i - 281 ) / 127 ) , i = 36,37 , . . . , 39
S503、对加窗后信号进行处理,得到线性预测编码系数,用于线性预测。
本发明实施例四提供的线性预测分析方法,通过获取输入信号前(或后)M个样点的平均能量,并根据该平均能量对输入信号进行自适应加窗,因此,能够在增加较少的编码复杂度的情况下,提高了线性预测编码的预测性能。
实施例五:
本发明实施例五提供的线性预测分析方法,如图6所示,该方法步骤包括:
S601、获取输入信号的过零率其中,x[i],i=0,1,...,N-1为输入信号,N为输入信号的样点个数,为与(AND)操作。输入信号在这里是指输入进行LPC分析的信号,可能是一帧信号,也可能是一帧信号加上历史缓冲区的一段信号(如历史缓冲区的L个样点,L可根据不同的编解码器采用不同的正整数,如40、80等);
S602、对过零率zc进行分析,并根据分析结果对输入信号进行自适应加窗:
如果过零率zc大于(或大于等于)某个预先设定阈值thr,用第一窗函数对输入信号进行加窗,即令xd[i]=x[i]·w1[i],i=0,1,...,N-1,其中xd[i]为加窗后的信号,w1[i]为第一窗函数;
否则,则用第二窗函数对输入信号进行加窗,即令xd[i]=x[i]·w2[i],i=0,1,...,N-1,其中w2[i]为第二窗函数;
窗函数w1[i]和w2[i]可根据不同的语音频编码器通过大量实验来选定,分别适用于不同的信号,例如w1[i]为正弦窗,w2[i]为汉明窗;或者w1[i]为海明窗,w2[i]为正弦窗。阈值thr也是通过大量实验选定,如thr=15或thr=23;
在一个具体的实现中,thr=18,当帧长N=80时,
w [ i ] = 0.16 + 0.84 · cos ( 2 · π · ( 31 - 4 · i ) / 127 ) , i = 0,1 , . . . , 7 1 , i = 8,9 , . . . , 71 0.16 + 0.84 · cos ( 2 · π ( 4 · i - 285 ) / 127 ) , i = 72,73 , . . . , 79
w 2 [ i ] = 0.26 + 0.74 · cos ( 2 · π ( 31 - 4 · i ) / 127 ) , i = 0,1 , . . . , 7 1 , i = 8,9 , . . . , 71 0.26 + 0.74 · cos ( 2 · π · ( 4 · i - 285 ) / 127 ) , i = 72,73 , . . . , 79
当帧长N=40时,
w 1 [ i ] = 0.27 + 0.73 · cos ( 2 · π · ( 31 - 8 · i ) / 127 ) , i = 0,1 , . . . , 3 1 , i = 4,5 , . . . , 35 0.27 + 0.73 · cos ( 2 · π · ( 8 · i - 281 ) / 127 ) , i = 36,37 , . . . , 39
w 1 [ i ] = 0.25 + 0.75 · cos ( 2 · π · ( 31 - 8 · i ) / 127 ) , i = 0,1 , . . . , 3 1 , i = 4,5 , . . . , 35 0.25 + 0.75 · cos ( 2 · π · ( 8 · i - 281 ) / 127 ) , i = 36,37 , . . . , 39
S603、对加窗后信号进行处理,得到线性预测编码系数,用于线性预测。
本发明实施例五提供的线性预测分析方法,通过获取输入信号的过零率,并根据该过零率对输入信号进行自适应加窗,因此,能够在增加较少的编码复杂度的情况下,提高了线性预测编码的预测性能。
实施例六:
本发明实施例六提供的线性预测分析方法,如图7所示,该方法步骤包括:
S701、获取输入信号的过零率和前(或后)M个样点的平均能量其中,x[i],i=0,1,...,N-1为输入信号,N为输入信号的样点个数,为与(AND)操作。输入信号在这里是指输入进行LPC分析的信号,可能是一帧信号,也可能是一帧信号加上历史缓冲区的一段信号(如历史缓冲区的L个样点,L可根据不同的编解码器采用不同的正整数,如40、80等);
S702、对过零率zc和前(或后)M个样点的平均能量进行分析,并根据分析结果对输入信号进行自适应加窗:
如果过零率zc大于(或大于等于)某个预先设定阈值thr1或小于等于某个预先设定的阈值thr2,用第一窗函数对输入信号进行加窗,即令xd[i]=x[i]·w1[i],i=0,1,...,N-1,其中xd[i]为加窗后的信号,w1[i]为第一窗函数。
否则,则用第二窗函数对输入信号进行加窗,即令xd[i]=x[i]·w2[i],i=0,1,...,N-1,其中w2[i]为第二窗函数。
窗函数w1[i]和w2[i]可根据不同的语音频编码器通过大量实验来选定,分别适用于不同的信号,例如w1[i]为正弦窗,w2[i]为汉明窗;或者w1[i]为海明窗,w2[i]为正弦窗。阈值thr1和thr2也是通过大量实验选定,如thr1=15、thr2=1023或thr1=23、thr2=1012。
在一个具体的实现中,thr1=17、thr2=1012,当帧长N=80时,
w 1 [ i ] = 0.16 + 0.84 · cos ( 2 · π · ( 31 - 4 · i ) / 127 ) , i = 0,1 , . . . , 7 1 , i = 8,9 , . . . , 71 0.16 + 0.84 · cos ( 2 · π ( 4 · i - 285 ) / 127 ) , i = 72,73 , . . . , 79
w 2 [ i ] = 0.26 + 0.74 · cos ( 2 · π ( 31 - 4 · i ) / 127 ) , i = 0,1 , . . . , 7 1 , i = 8,9 , . . . , 71 0.26 + 0.74 · cos ( 2 · π · ( 4 · i - 285 ) / 127 ) , i = 72,73 , . . . , 79
当帧长N=40时,
w 1 [ i ] = 0.28 + 0.72 · cos ( 2 · π · ( 31 - 8 · i ) / 127 ) , i = 0,1 , . . . , 3 1 , i = 4,5 , . . . , 35 0.28 + 0.72 · cos ( 2 · π · ( 8 · i - 281 ) / 127 ) , i = 36,37 , . . . , 39
w 1 [ i ] = 0.22 + 0.78 · cos ( 2 · π · ( 31 - 8 · i ) / 127 ) , i = 0,1 , . . . , 3 1 , i = 4,5 , . . . , 35 0.22 + 0.78 · cos ( 2 · π · ( 8 · i - 281 ) / 127 ) , i = 36,37 , . . . , 39
S703、对加窗后信号进行处理,得到线性预测编码系数,用于线性预测。
本发明实施例六提供的线性预测分析方法,通过获取输入信号的过零率和前(或后)M个样点的平均能量,并根据该过零率和平均能量对输入信号进行自适应加窗,因此,能够在增加较少的编码复杂度的情况下,提高了线性预测编码的预测性能。
实施例七:
本发明实施例七提供的线性预测分析方法,如图8所示,该方法步骤包括:
S801、获取输入信号编码方式,输入信号为G.711信号,可能为A-law信号,也可能为mu-law信号;对输入信号进行转换,得到PCM信号;
S802、对输入信号编码方式进行分析,并根据分析结果对PCM信号进行自适应加窗如:
如果编码方式为A-law,用第一窗函数对PCM信号进行加窗,即令xd[i]=x[i]·w1[i],i=0,1,...,N-1,其中xd[i]为加窗后的信号,w1[i]为第一窗函数,x[i]为PCM信号。
否则,则用第二窗函数对PCM信号进行加窗,即令xd[i]=x[i]·w2[i],i=0,1,...,N-1,其中w2[i]为第二窗函数。
窗函数w1[i]和w2[i]可根据不同的语音频编码器通过大量实验来选定,分别适用于不同的信号,例如w1[i]为正弦窗,w2[i]为汉明窗;或者w1[i]为海明窗,w2[i]为正弦窗;
在一个具体的实现中,当编码方式为A-law或mu-law时,当帧长N=80时,
w 1 [ i ] = 0.16 + 0.84 · cos ( 2 · π · ( 31 - 4 · i ) / 127 ) , i = 0,1 , . . . , 7 1 , i = 8,9 , . . . , 71 0.16 + 0.84 · cos ( 2 · π ( 4 · i - 285 ) / 127 ) , i = 72,73 , . . . , 79
w 2 [ i ] = 0.26 + 0.74 · cos ( 2 · π ( 31 - 4 · i ) / 127 ) , i = 0,1 , . . . , 7 1 , i = 8,9 , . . . , 71 0.26 + 0.74 · cos ( 2 · π · ( 4 · i - 285 ) / 127 ) , i = 72,73 , . . . , 79
当帧长N=40时,
w 1 [ i ] = 0.28 + 0.72 · cos ( 2 · π · ( 31 - 8 · i ) / 127 ) , i = 0,1 , . . . , 3 1 , i = 4,5 , . . . , 35 0.28 + 0.72 · cos ( 2 · π · ( 8 · i - 281 ) / 127 ) , i = 36,37 , . . . , 39
w 1 [ i ] = 0.22 + 0.78 · cos ( 2 · π · ( 31 - 8 · i ) / 127 ) , i = 0,1 , . . . , 3 1 , i = 4,5 , . . . , 35 0.22 + 0.78 · cos ( 2 · π · ( 8 · i - 281 ) / 127 ) , i = 36,37 , . . . , 39
S803、对加窗后信号进行处理,得到线性预测编码系数,用于线性预测。
本发明实施例七提供的线性预测分析方法,获取输入信号编码方式,并对输入信号进行转换,得到PCM信号,根据该信号编码方式对输入信号进行自适应加窗,因此,能够在增加较少的编码复杂度的情况下,提高了线性预测编码的预测性能。
本发明实施例提供的线性预测分析装置,如图9所示,包括:
获取单元901,用于获取输入信号至少一个样点的信号特性信息;
分析单元902,用于对信号特性信息进行比较分析,得到分析结果;
加窗单元903,用于根据分析结果选择窗函数对输入信号进行自适应加窗,得到加窗后信号;
处理单元904,用于述加窗后信号进行处理,得到线性预测编码系数,用于线性预测。
本发明实施例提供的线性预测分析装置,通过对输入信号进行分析,得到结果,并根据分析结果自适应分配加窗所需的窗函数,因此,能够在增加较少的编码复杂度的情况下,提高了线性预测编码的预测性能。
其中,在本发明另一实施例中,如图10所示,分析单元902包括:
计算模块902A,用于计算获取单元901获取的信号特性信息的值,信号特性信息的值包括某一个样点的信号特性信息的值和/或某多个样点的信号特性信息的值的平均值;
判断模块902B,用于判断计算模块902A得出的信号特性信息的值是否大于或大于等于某一阈值;或者用于判断获取单元901获取的输入信号的信号类型和/或编码方式。
进一步地,在上述分析单元902中,还包括:
转换模块902C,用于将获取单元901获取的输入信号转换为脉冲编码调制信号。
本发明实施例提供的线性预测分析装置,通过对输入信号进行分析,得到结果,并根据分析结果自适应分配加窗所需的窗函数,因此,能够在增加较少的编码复杂度的情况下,提高了线性预测编码的预测性能。
本发明实施例提供的线性预测编码系统,如图11所示,包括:
线性预测分析装置1101,用于获取输入信号至少一个样点的信号特性信息;对信号特性信息进行比较分析,得到分析结果;根据分析结果选择窗函数对输入信号进行自适应加窗,得到加窗后信号;对加窗后信号进行处理,得到线性预测编码系数;
编码装置1102,用于根据线性预测分析装置1101得到的线性预测编码系数进行编码。
本发明实施例提供的线性预测编码系统,能够先通过对输入信号进行分析,得到结果,并根据分析结果自适应分配加窗所需的窗函数,进而得到线性预测编码系数;然后再根据该线性预测编码系数进行编码。因此,能够在增加较少的编码复杂度的情况下,提高了线性预测编码的预测性能。
其中,在本发明的另一实施例中,如图12所示,线性预测分析装置1101与上述实施例中的线性预测分析装置构造相同,在此就不再赘述。
本发明实施例提供的线性预测编码系统,能够先通过对输入信号进行分析,得到结果,并根据分析结果自适应分配加窗所需的窗函数,进而得到线性预测编码系数;然后再根据该线性预测编码系数进行编码。因此,能够在增加较少的编码复杂度的情况下,提高了线性预测编码的预测性能。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (11)

1.一种线性预测分析方法,其特征在于,包括:
获取输入信号的第一个样点的幅值和最后一个样点的幅值,所述输入信号包含N个样点,N为正整数;
对所述第一个样点的幅值和最后一个样点的幅值进行分析,并根据分析结果对输入信号进行自适应加窗,得到加窗后信号;
当N=40时,对所述第一个样点的幅值和最后一个样点的幅值进行分析,并根据分析结果对输入信号进行自适应加窗,得到加窗后信号,包括:
如果所述第一个样点的幅值大于或大于等于某一阈值时,用第一窗函数对所述输入信号最前面4个样点进行自适应加窗,得到加窗后信号;否则,用第二窗函数对所述输入信号最前面4个样点进行自适应加窗,得到加窗后信号;
对输入信号第5至第36个样点,窗函数都设为1;
如果所述最后一个样点的幅值大于或大于等于某一阈值时,用第三窗函数对所述输入信号最后面4个样点进行自适应加窗,得到加窗后信号;否则,用第四窗函数对所述输入信号最后面4个样点进行自适应加窗,得到加窗后信号;
对所述加窗后信号进行处理,得到线性预测编码系数用于线性预测。
2.根据权利要求1所述的线性预测分析方法,其特征在于,
所述第一窗函数w(n)为:
w(n)=0.26+0.74·cos(2·π·(31-8·n)/127),n=0,1,2,3
所述第二窗函数w(n)为:
w(n)=0.23+0.77·cos(2·π·(31-8·n)/127),n=0,1,2,3
所述第三窗函数为:
w(n)=0.26+0.74·cos(2·π·(8·n-281)/127),n=36,37,38,39
所述第四窗函数为:
w(n)=0.23+0.77·cos(2·π·(8·n-281)/127),n=36,37,38,39。
3.根据权利要求1或2所述的线性预测分析方法,其特征在于,
所述阈值为128或157。
4.根据权利要求1所述的线性预测分析方法,其特征在于,获取输入信号的第一个样点的幅值和最后一个样点的幅值包括:
将所述输入信号转换为脉冲编码调制信号;
获取转换后的所述输入信号的第一个样点的幅值和最后一个样点的幅值。
5.根据权利要求1所述的线性预测分析方法,其特征在于,
所述输入信号的第一个样点的幅值为|x[0]|,最后一个样点的幅值为|x[N-1]|;其中,x[i],i=0,1,...,N-1为输入信号。
6.一种线性预测分析方法,其特征在于,包括:
获取输入信号的第一个样点的幅值和最后一个样点的幅值,所述输入信号包含N个样点,N为正整数;
对所述第一个样点的幅值和最后一个样点的幅值进行分析,并根据分析结果对输入信号进行自适应加窗,得到加窗后信号;
当N=80时,对所述第一个样点的幅值和最后一个样点的幅值进行分析,并根据分析结果对输入信号进行自适应加窗,得到加窗后信号,包括:
如果所述第一个样点的幅值大于或大于等于某一阈值时,用第五窗函数对所述输入信号最前面8个样点进行自适应加窗,得到加窗后信号;否则,用第六窗函数对所述输入信号最前面8个样点进行自适应加窗,得到加窗后信号;
对输入信号第9至第72个样点,窗函数都设为1;
如果所述最后一个样点的幅值大于或大于等于某一阈值时,用第七窗函数对所述输入信号最后面8个样点进行自适应加窗,得到加窗后信号;否则,用第八窗函数对所述输入信号最后面8个样点进行自适应加窗,得到加窗后信号;
对所述加窗后信号进行处理,得到线性预测编码系数用于线性预测。
7.根据权利要求6所述的线性预测分析方法,其特征在于,
所述第五窗函数w(n)为:
w(n)=0.16+0.84·cos(2·π·(31-4·n)/127),n=0,1,2,...,7
所述第六窗函数w(n)为:
w(n)=0.26+0.74·cos(2·π·(31-4·n)/127),n=0,1,2,...,7
所述第七窗函数为:
w(n)=0.16+0.84·cos(2·π·(4·n-285)/127),n=72,73,74,...,79
所述第八窗函数为:
w(n)=0.26+0.74·cos(2·π·(4·n-285)/127),n=72,73,74,...,79。
8.根据权利要求6或7所述的线性预测分析方法,其特征在于,
所述阈值为128或157。
9.一种线性预测分析方法,其特征在于,包括:
获取输入信号编码方式,所述输入信号为G.711信号;
对输入信号进行转换,得到PCM信号;
对输入信号编码方式进行分析,并根据分析结果对PCM信号进行自适应加窗,得到加窗后信号;
对所述加窗后信号进行处理,得到线性预测编码系数用于线性预测。
10.根据权利要求9所述的线性预测分析方法,其特征在于,所述对输入信号编码方式进行分析,并根据分析结果对PCM信号进行自适应加窗,得到加窗后信号,包括:
如果编码方式为A-law,用第一窗函数对PCM信号进行加窗;
否则,则用第二窗函数对PCM信号进行加窗。
11.根据权利要求9或10所述的线性预测分析方法,其特征在于,所述第一窗函数为正弦窗,第二窗函数为为汉明窗;或者第一窗函数为海明窗,第二窗函数为正弦窗。
CN201210462237.2A 2009-03-11 2009-03-11 一种线性预测分析方法、装置及系统 Active CN102930871B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210462237.2A CN102930871B (zh) 2009-03-11 2009-03-11 一种线性预测分析方法、装置及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210462237.2A CN102930871B (zh) 2009-03-11 2009-03-11 一种线性预测分析方法、装置及系统

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN2009800001092A Division CN102067211B (zh) 2009-03-11 2009-03-11 一种线性预测分析方法、装置及系统

Publications (2)

Publication Number Publication Date
CN102930871A CN102930871A (zh) 2013-02-13
CN102930871B true CN102930871B (zh) 2014-07-16

Family

ID=47645652

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210462237.2A Active CN102930871B (zh) 2009-03-11 2009-03-11 一种线性预测分析方法、装置及系统

Country Status (1)

Country Link
CN (1) CN102930871B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
PL3462448T3 (pl) * 2014-01-24 2020-08-10 Nippon Telegraph And Telephone Corporation Urządzenie, sposób i program do analizy liniowo-predykcyjnej oraz nośnik zapisu
CN104980751B (zh) * 2014-04-02 2018-06-15 扬智科技股份有限公司 图像数据处理装置及图像数据处理的方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5305421A (en) * 1991-08-28 1994-04-19 Itt Corporation Low bit rate speech coding system and compression
CN1338096A (zh) * 1998-12-30 2002-02-27 诺基亚移动电话有限公司 用于分析-合成celp型语音编码的自适应窗
CN1732530A (zh) * 2002-11-07 2006-02-08 三星电子株式会社 运动图像专家组音频编码方法及装置
US7231344B2 (en) * 2002-10-29 2007-06-12 Ntt Docomo, Inc. Method and apparatus for gradient-descent based window optimization for linear prediction analysis

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2003208517A1 (en) * 2003-03-11 2004-09-30 Nokia Corporation Switching between coding schemes
JP4533386B2 (ja) * 2004-07-22 2010-09-01 富士通株式会社 オーディオ符号化装置及びオーディオ符号化方法
US7987089B2 (en) * 2006-07-31 2011-07-26 Qualcomm Incorporated Systems and methods for modifying a zero pad region of a windowed frame of an audio signal

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5305421A (en) * 1991-08-28 1994-04-19 Itt Corporation Low bit rate speech coding system and compression
CN1338096A (zh) * 1998-12-30 2002-02-27 诺基亚移动电话有限公司 用于分析-合成celp型语音编码的自适应窗
US7231344B2 (en) * 2002-10-29 2007-06-12 Ntt Docomo, Inc. Method and apparatus for gradient-descent based window optimization for linear prediction analysis
CN1732530A (zh) * 2002-11-07 2006-02-08 三星电子株式会社 运动图像专家组音频编码方法及装置

Also Published As

Publication number Publication date
CN102930871A (zh) 2013-02-13

Similar Documents

Publication Publication Date Title
US8862463B2 (en) Adaptive time/frequency-based audio encoding and decoding apparatuses and methods
CN101488344B (zh) 一种量化噪声泄漏控制方法及装置
CN112154502B (zh) 支持生成舒适噪声
CN102368385B (zh) 后向块自适应Golomb-Rice编解码方法及装置
CN102150202A (zh) 对音频/语音信号进行编码和解码的方法和设备
CN102067211B (zh) 一种线性预测分析方法、装置及系统
CN101030373A (zh) 使用自适应掩蔽阈值的立体声感知音频编码的系统和方法
JP2009524846A (ja) 適応的時間/周波数ベース符号化モード決定装置およびこのための符号化モード決定方法
WO2011044700A1 (en) Simultaneous time-domain and frequency-domain noise shaping for tdac transforms
JP2012194574A (ja) 符号化方法、装置及び機器、及び復号化方法
JP2019135551A (ja) オーディオ信号の時間包絡線を処理するための方法および装置、ならびにエンコーダ
US8380495B2 (en) Transcoding method, transcoding device and communication apparatus used between discontinuous transmission
CN102930871B (zh) 一种线性预测分析方法、装置及系统
JP6408125B2 (ja) オーディオ信号内の雑音を推定するための方法、雑音推定器、オーディオ符号化器、オーディオ復号器、およびオーディオ信号を送信するためのシステム
CN101609677B (zh) 一种预处理方法、装置及编码设备
CN102098057B (zh) 一种量化编解码方法和装置
CN112669857B (zh) 一种语音处理的方法、装置及设备
CN101604525B (zh) 基音增益获取方法、装置及编码器、解码器
JPWO2012008330A1 (ja) 符号化装置、復号装置、これらの方法、プログラム及び記録媒体
KR20240066586A (ko) 복소수 양자화를 이용하는 오디오 신호의 부호화 및 복호화 방법 및 장치
KR20250001019A (ko) 음성 신호의 부호화/복호화 방법 및 이를 수행하는 장치
CN102446509A (zh) 增强抗丢包的音频编解码方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant