CN103700375B - 语音降噪方法及其装置 - Google Patents
语音降噪方法及其装置 Download PDFInfo
- Publication number
- CN103700375B CN103700375B CN201310743950.9A CN201310743950A CN103700375B CN 103700375 B CN103700375 B CN 103700375B CN 201310743950 A CN201310743950 A CN 201310743950A CN 103700375 B CN103700375 B CN 103700375B
- Authority
- CN
- China
- Prior art keywords
- frequency domain
- voice signal
- signal
- noise
- frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 28
- 238000001228 spectrum Methods 0.000 claims abstract description 80
- 238000009499 grossing Methods 0.000 claims abstract description 52
- 230000004913 activation Effects 0.000 claims abstract description 33
- 230000009467 reduction Effects 0.000 claims abstract description 24
- 238000012546 transfer Methods 0.000 claims abstract description 21
- 238000001914 filtration Methods 0.000 claims abstract description 19
- 238000004364 calculation method Methods 0.000 claims abstract description 18
- 230000006870 function Effects 0.000 description 17
- 230000009977 dual effect Effects 0.000 description 4
- 230000021615 conjugation Effects 0.000 description 3
- 210000000056 organ Anatomy 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000012076 audiometry Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005315 distribution function Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000005314 correlation function Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000007115 recruitment Effects 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Landscapes
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明提供一种语音降噪方法及其装置,该方法包括:根据语音激活判断的结果计算出平滑因子,并根据平滑因子计算得出第一频域语音信号的第一能量谱和互相关能量谱;根据第一能量谱和互相关能量谱计算得出互相关传递函数;根据噪声补偿因子、初步噪声能量和第一能量谱计算得出初步频域滤波器;根据初步频域滤波器和第一频域语音信号的幅度计算出平滑窗长度;初步频域滤波器和平滑窗长度进行卷积得出频域滤波器;第一频域语音信号通过频域滤波器滤波后输出滤波后的第一频域语音信号。以及实现上述降噪方法的语音降噪装置。本发明语音降噪方法及其装置具有噪声跟踪速度快、计算量少且能够有效抑制环境噪声等特点。
Description
技术领域
本发明涉及音频信号处理技术领域,尤其涉及一种对语音信号进行降噪的方法及其装置。
背景技术
随着社会技术的发展,人们对声音质量的要求越来越高,尤其是对语音通话质量的要求。要确保清晰、无噪声和自然的高质量通话,语音降噪功能则是手机、平板电脑等通讯工具不可缺少的。以手机或平板电脑为例,目前市场上的产品一般都安装了两个麦克风,利用其中一个麦克风在安装靠近人体发声器官的位置上,该麦克风拾取人发出的语音信号外还拾取了环境噪声,另外一个麦克风安装在远离人体发声器官的位置上以捡拾环境噪声,通过两个麦克风拾取的声音进行分析,并对人体发出的语音信号进行降噪处理,从而获得过滤出高质量的语音信号。
目前,应用于手机或平板电脑的双麦克风语音降噪方法中,降噪效果较好的一般均为计算量较大的,需要通过配备独立降噪芯片来运行复杂的算法。而对于一些较为简单的双麦克风降噪方法,往往降噪效果不理想、残留噪声过大,或者该降噪方法对语音源方位有严格要求,使用方式不正确的话将会消去语音信号。
针对以上问题,本发明提出一种应用于手机终端的双麦克风降噪算法,该算法噪声跟踪速度快,能有效的抑制环境噪声,对于声源方位有很好的鲁棒性,而且算法复杂度低、计算量小。
发明内容
本发明的第一目的是提供一种噪声跟踪速度快、计算量少且能够有效抑制环境噪声的语音降噪方法。
本发明的第二目的是提供一种噪声跟踪速度快、计算量少且能够有效抑制环境噪声的语音降噪装置。
为了实现本发明的第一目的,本发明提供一种语音降噪方法,包括:将第一麦克风接收的时域语音信号进行短时傅里叶变换后获取第一频域语音信号;将第二麦克风接收的时域语音信号进行短时傅里叶变换后获取第二频域语音信号;将第一频域语音信号进行语音激活判断;根据第一频域语音信号计算得出初步噪声能量,其中,根据语音激活判断的结果和前一帧的频域滤波器计算出平滑因子,并根据平滑因子计算得出第一频域语音信号的第一能量谱,根据平滑因子计算得出第一频域语音信号和第二频域语音信号之间的互相关能量谱;根据第一能量谱、互相关能量谱和第一麦克风与第二麦克风之间的距离计算得出互相关传递函数;根据语音激活判断的结果和互相关传递函数计算出噪声补偿因子;根据噪声补偿因子、初步噪声能量和第一能量谱计算得出初步频域滤波器;根据初步频域滤波器和第一频域语音信号的幅度计算出平滑窗长度;初步频域滤波器和平滑窗长度进行卷积得出频域滤波器;第一频域语音信号通过频域滤波器滤波后输出滤波后的第一频域语音信号;将滤波后的第一频域语音信号进行短时傅里叶逆变换后输出滤波后的第一时域语音信号。
由上述方案可见,根据语音激活判断的不同结果,对初步噪声能量进行计算并在滤波器中进行动态补偿,同时再根据两个麦克风之间的互相关传递函数,对语音信号或环境噪声进行采样并在滤波器进行过滤,使得本发明语音降噪方法具有跟踪速度快、计算量少且能够有效抑制环境噪声等特点。
更进一步的方案是,语音激活判断步骤包括:根据当前帧的第一频域语音信号的幅度和初步噪声能量计算出当前帧的信噪比后,如果前一帧的第一频域语音信号为语音信号时,且判断当前帧的信噪比大于预设的信噪比阀值时,将当前帧的第一频域语音信号判断为语音信号,如果前一帧的第一频域语音信号为噪声信号时,且判断当前帧的信噪比大于预设的信噪比阀值且前一帧的信噪比大于预设的信噪比阀值时,将当前帧的第一频域语音信号判断为语音信号,反之将当前帧的第一频域语音信号判断为噪声信号。
更进一步的方案是,根据当前帧的第一频域语音信号的幅度和初步噪声能量计算出当前帧的信噪比后,判断当前帧在第一帧到第二十帧之间时,将当前帧的第一频域语音信号判断为语音信号。
更进一步的方案是,如果前一帧的第一频域语音信号为语音信号时,判断当前帧的信噪比小于或等于预设的信噪比阀值时,判断在前十九帧的信噪比中大于预设的信噪比阀值的信噪比数量为三个以上时,将当前帧的第一频域语音信号判断为语音信号,反之将当前帧的第一频域语音信号判断为噪声信号。
更进一步的方案是,平滑因子包括第一平滑因子和第二平滑因子,根据语音激活判断的结果和前一帧的初步频域滤波器计算出平滑因子步骤包括:如当前帧的第一频域语音信号为语音信号时,根据第一平滑因子计算得出第一频域语音信号的第一能量谱和第一频域语音信号和第二频域语音信号之间的互相关能量谱,如当前帧的第一频域语音信号为噪声信号时,根据第二平滑因子计算得出第一频域语音信号的第一能量谱和第一频域语音信号和第二频域语音信号之间的互相关能量谱。
由上可见,根据语音激活判断的结果,分别对语音帧或噪声则采用不同的平滑因子进行能量谱和互相关能量谱的计算,使得平滑因子在滤波器中进行动态补偿的作用,其具有响应时间短、计算量少等特点。
为了实现本发明的第二目的,本发明提供一种语音降噪装置,包括:用于接收时域语音信号并输出第一频域语音信号的第一短时傅里叶变换单元、用于接收时域语音信号并输出第二频域语音信号的第二短时傅里叶变换单元、用于判断第一频域语音信号为语音信号或噪声信号的语音激活判断单元、用于根据第一频域语音信号的幅度计算初步噪声能量的初步噪声能量计算单元,其中,语音降噪装置还包括能量计算单元,能量计算单元包括能量谱计算模块、互相关能量谱计算模块和平滑因子计算模块,平滑因子计算模块向能量谱计算模块和互相关能量谱计算模块输出平滑因子系数,能量谱计算模块根据平滑因子系数和第一频域语音信号计算得出第一能量谱,互相关能量谱计算模块根据平滑因子系数、第一频域语音信号和第二频域语音信号计算得出互相关能量谱;互相关传递计算单元,用于根据第一能量谱、互相关能量谱和第一麦克风与第二麦克风之间的距离计算得出互相关传递函数;初步频域滤波器计算单元,用于根据语音激活判断单元输出的信号和互相关传递函数计算单元输出的信号计算出噪声补偿因子,并根据噪声补偿因子、初步噪声能量和第一能量谱计算得出初步频域滤波器;修正单元,根据初步频域滤波器和第一频域语音信号的幅度计算出平滑窗长度;频域滤波器计算单元,由初步频域滤波器和平滑窗长度进行卷积得出频域滤波器,频域滤波器计算单元用于接收第一频域语音信号;短时傅里叶逆变换单元,用于接收频域滤波器计算单元输出的滤波后的第一频域语音信号,并向外输出滤波后的第一时域语音信号。
由上述方案可见,根据语音激活判断单元输出不同的判断结果,对噪声补偿因子进行计算,并在滤波器中进行动态补偿,同时在根据两个麦克风之间的互相关传递函数,对语音信号或环境噪声进行采样并在滤波器进行过滤,使得本发明语音降噪方法具有噪声跟踪速度快、计算量少且能够有效抑制环境噪声等特点。
附图说明
图1是本发明语音降噪方法实施例的流程图。
图2是本发明语音降噪方法实施例中语音激活判断的流程图。
图3是本发明语音降噪装置的系统框图。
以下结合附图及实施例对本发明作进一步说明。
具体实施方式
语音降噪方法实施例:
参照图1,图1是本发明语音降噪的流程图。在本实施例通过两个麦克风拾取声音信号,通过本发明语音降噪方法对拾取的声音信号进行降噪。
本发明的具体降噪方法如下:首先执行步骤S1,将两个麦克风拾取的时域语音信号进行短时傅里叶变换,从而变换成频域的语音信号。具体是,第一麦克风将拾取的时域语音信号进行短时傅里叶变换,以获得第一频域语音信号,第二麦克风将拾取的时域语音信号进行短时傅里叶变换,以获得第二频域语音信号。本实施例采用的短时傅里叶变换的窗函数均采用汉明窗,相邻帧之间的重叠范围为75%。
然后执行步骤S2,根据第一频域语音信号进行语音激活判断。由于麦克风接收到的语音信号不仅具有人体发出的声音信号,还具有环境的噪声,而语音激活判断的目的是能够正确地区分当前声音信号为包含了环境噪声的语音信号还是只含有环境噪声的信号。
参照图2,图2是本发明语音激活判断步骤S2的流程图。首先对第一频域语音信号执行步骤S21,即根据当前帧第一频域语音信号和前一帧初步噪声能量计算当前帧的信噪比,其信噪比计算公式如下:
其中,在式1.1中SNR(n)为当前帧的信噪比,NFFT为傅里叶变换系数,f为频域系数,n为时间帧系数,X1为第一频域语音信号的幅度,N为初步噪声能量。
然后执行步骤S22,判断n是否大于20,如否,则执行步骤S23,即将当前帧的第一频域语音信号判断为语音信号。由于判断当前帧为语音帧,所以将当前帧vad_flag(n)设置为1,即vad_flag(n)=1。
当n>20时,则执行步骤S24,判断前一帧,即n-1帧的语音信号是否为语音帧,即判断vad_flag(n-1)是否等于1。
当vad_flag(n-1)=1时,则执行步骤S25,即判断当前帧的信噪比SNR(n)是否大于预设信噪比阀值SNR_THR,如是,则执行步骤S251,将当前帧语音信号判断为语音帧,即vad_flag(n)=1,如否则执行步骤S26。
当当前帧的信噪比SNR(n)是否小于或等于预设信噪比阀值SNR_THR时,执行步骤S26,即判断在前十九帧的信噪比中大于预设信噪比阀值的信噪比数量为三个以上时,则执行步骤S261,将前帧语音信号判断为语音帧即vad_flag(n)=1,否则,执行步骤S262将前帧语音信号判断噪声帧即vad_flag(n)=0。
步骤S24中,如判断vad_flag(n-1)≠1时,则执行步骤S27,判断当前帧信噪比大于预设信噪比阀值的同时前一帧信噪比大于预设信噪比阀值时,将执行步骤S271,即将前帧语音信号判断为语音帧即vad_flag(n)=1,否则执行步骤S272,即将前帧语音信号判断为噪声帧即vad_flag(n)=0。
以此完成语音激活判断步骤S2,通过当前帧信噪比的计算和与预设信噪比阀值的比较,将输入的当前帧语音信号正确地区分当前语音信号为语音帧还是噪声帧。
步骤S2执行完毕后将执行步骤S3,即根据上述语音激活判断步骤S2不同的判断结果和前一帧的初步频域滤波器计算相应的平滑因子λ,平滑因子λ的计算公式如下:
λ(n,f)=0.98-0.2×G(n-1,f),vad_flag(n)=0(式1.2)
λ(n,f)=0.90-0.15×G(n-1,f),vad_flag(n)=1(式1.3)
其中,式1.2和式1.3中的G(n-1,f)前一帧的初步频域滤波器。
然后根据当前帧语音信号的判断结果选择不同的平滑因子λ来计算第一频域语音信号的能量谱和第二频域语音信号的能量谱,即执行步骤S4,第一频域语音信号的能量谱的计算公式如下:
PX1X1(n,f)=λ(n,f)PX1X1(n-1,f)+(1-λ(n,f))X1(n,f)X1(n,f)*(式1.4)
PX2X2(n,f)=λ(n,f)PX2X2(n-1,f)+(1-λ(n,f))X2(n,f)X2(n,f)*(式1.5)
其中,式1.4中的PX1X1表示第一频域语音信号的第一能量谱,X1(n,f)表示第一频域语音信号的幅度,X1(n,f)*表示第一频域语音信号幅度求共轭。式1.5中的PX2X2表示第二频域语音信号的第二能量谱,X2(n,f)表示第二频域语音信号的幅度,X2(n,f)*表示第二频域语音信号幅度求共轭。
随后执行步骤S5,根据当前帧语音信号的判断结果选择不同的平滑因子λ来计算第一频域语音信号和第二频域语音信号之间的互相关能量谱,互相关能量谱的计算公式如下:PX1X2(n,f)=λ(n,f)PX1X2(n-1,f)+(1-λ(n,f))X1(n,f)X2(n,f)*(式1.6)
其中,式1.6中的PX1X2表示第一频域语音信号和第二频域语音信号之间的互相关能量谱,X1(n,f)表示第一频域语音信号的幅度,X2(n,f)*表示第二频域语音信号幅度求共轭。
从式1.4、式1.5和式1.6中可见,如果当前帧语音信号为语音帧即vad_flag(n)=1时,则将采用式1.3中的λ(n,f)来计算第一能量谱、第二能量谱和互相关能量谱。
如果当前帧语音信号为噪声帧即vad_flag(n)=0时,则将采用式1.2中的λ(n,f)来计算第一能量谱、第二能量谱和互相关能量谱。
可见,通过对拾取的语音信号对其进行判断,根据其不同的结果采用相应的能量计算,并且还对前一帧的初步频域滤波器进行采样,使得对语音信号的能量谱跟踪较快、计算量少且具有良好动态调节效果。
然后执行步骤S6,根据第一频域语音信号幅度进行初步噪声能量的计算。其中,步骤S6包括:首先根据第一频域语音信号计算先验信噪比,先验信噪比的计算公式如下:
其中,式1.7中的ζDD表示先验信噪比,|N(n-1),f|2为前一帧的初步噪声能量,ε为固定平滑因子,可取0到1之间的值,优选地,ε=0.98。
然后在根据先验信噪比来计算噪声补偿量,其公式如下:
其中,式1.8中的B(n,f)表示噪声补偿量,γ(u,v)为伽马分布函数。
最后根据计算噪声补偿量B(n,f)计算当前帧的初步噪声能量,其计算公式如下:
其中,式1.9中的|N(n,f)|2表示初步噪声能量,β为平滑系数取0.8,|N(n-1,f)|2为前一帧的初步噪声能量,
为采用最小均方误差方法计算的噪声能量。
可见,上述对初步噪声能量进行计算,通过对前一帧初步噪声能量的采样和对其进行伽马分布函数分析,由于对语音信号进行降噪是也会抑制部分语音,使得主观上测听有明显的语音畸变,通过在初步噪声能量的加入噪声补充量,可使得在噪声抑制和语音畸变之间取得平衡,有利于提高主观听觉感受,使得主观测听的语音畸变不明显且一定噪声程度也不影响听觉感受。
随后进行执行步骤S7,根据第一能量谱和互相关能量谱对互相关传递函数进行计算,其计算公式如下:
其中,式1.10和式1.11中Γ(n,f)为混响场两个麦克风之间的相关函数,d为两个麦克风之间的距离,c为声音在空气中传播的速度,H12(n,f)为互相关传递函数。
可见,上述对互相关传递函数进行计算,通过两个麦克风分别位于靠近人体发声器官的位置上和远离人体发声器官的位置上,通过双麦克风对语音声源的定位,从而采样出人体发出语音声音的样本和环境的噪声的样本,继而对麦克风拾取的同时具有人发出的语音信号和环境噪声的声音进行有效地分析滤波,从而过滤出高质量的语音信号。
然后执行步骤S8,根据第一能量谱、噪声补偿因子、初步噪声能量计算初步频域滤波器,其计算公式如下:
其中,式1.12中的G(n,f)为初步频域滤波器,α|H12(n,f)|2为噪声补偿因子。如果当前帧语音信号为语音帧即vad_flag(n)=1时,则设置α=2.5。如果当前帧语音信号为噪声帧即vad_flag(n)=0时,则设置α=1。通过对当前语音信号的判断利用α进行不同的补偿,即当前语音信号为语音帧时则不需要补偿,则设置α为1,而当前语音信号为噪声帧时,则设置α为2.5,进行一定的补偿。
然后执行步骤S9,对初步频域滤波器进行去噪处理,并得出去噪过滤后的频域滤波器,其步骤S9具体为:
首先是对降噪方法中系统内产生的系统噪声进行计算,通过输入的第一频域语音信号的幅度与第一频域语音信号经过初步频域滤波器滤波后的幅度的比值,具体计算公式为:
从式1.13中η(n)可知,η(n)为输入信号与输出信号的比值,即为系统内产生的系统噪声比。
然后通过系统噪声比计算初步滤波器的平滑窗长度,其计算公式为:
其中,式1.14的ηthr为滤波器的预设系统噪声比阀值,并将ηthr=0.4,L(n)为平滑窗长度。
最后将初步频域滤波器G(n,f)与平滑窗长度L(n)进行卷积,得出经过去噪滤波后的频域滤波器GPF(n,f),GPF(n,f)的计算公式如下:
GPF(n,f)=G(n,f)*L(n)(式1.15)
可见通过平滑窗将初步频域滤波器进行进一步的去噪处理,使得频域滤波器GPF(n,f)滤波效果更为平滑。
然后执行步骤S10,将第一频域语音信号输入到频域滤波器GPF(n,f)中进行滤波处理,并得出滤波后的第一频域语音信号。随后再执行步骤S11,将滤波后的第一频域语音信号进行傅里叶逆变换还原成滤波后的时域语音信号。最后,执行步骤S12,向外输出滤波后的时域语音信号。
由上述方案可见,根据语音激活判断的结果,分别对语音帧或噪声则采用不同的平滑因子进行能量谱和互相关能量谱的计算,在根据上述的判断结果对初步噪声能量进行计算并在滤波器中进行动态补偿,同时在根据两个麦克风之间的互相关传递函数,对语音信号或环境噪声进行采样并在滤波器进行过滤,使得本发明语音降噪方法具有跟踪速度快、计算量少且能够有效抑制环境噪声等特点,并且本发明语音降噪方法不需要配备专用的独立降噪芯片。
语音降噪装置实施例:
参照图3,图3是本发明语音降噪装置的系统框图。语音降噪装置包括短时傅里叶变换单元31、短时傅里叶变换单元32、语音激活判断单元33、能量估计单元34、初步噪声能量计算单元35、互相关传递函数计算单元36、初步频域滤波器计算单元37、修正单元38、频域滤波器计算单元39和傅里叶逆变换单元40。
短时傅里叶变换单元31用于接收第一麦克风输出的时域语音信号并将其进行短时傅里叶变换输出第一频域语音信号,短时傅里叶变换单元31用于接收第二麦克风输出的时域语音信号并将其进行短时傅里叶变换输出第二频域语音信号。语音激活判断单元33接收到由短时傅里叶变换单元31输出的第一频域语音信号并对第一频域语音信号进行语音激活判断,语音激活判断单元33向能量估计单元34输出其处理的判断结果。
能量估计单元34包括能量谱计算模块341、互相关能量谱计算模块342和平滑因子计算模块343,能量估计单元34用于接收第一频域语音信号、第二频域语音信号和语音激活判断结果。平滑因子计算模块343根据初步频域滤波器计算模块37输出的反馈信号和语音激活判断结果做出相应的平滑因子系数调整。能量谱计算模块341根据平滑因子系数、第一频域语音信号和第二频域语音信号计算出第一频域语音信号的第一能量谱和第二频域语音信号的第二能量谱,互相关能量谱计算模块342根据平滑因子系数、第一频域语音信号和第二频域语音信号计算出第一频域语音信号和第二频域语音信号之间的互相关能量谱。
初步噪声能量计算单元35用于接收第一频域语音信号并根据第一频域语音信号的幅度计算初步噪声能量,初步噪声能量计算单元35分别向初步频域滤波器计算单元37和互相关传递函数计算单元36输出初步噪声能量。
互相关传递函数计算单元36用于接收第一能量谱、互相关能量谱和初步噪声能量并计算得出互相关传递函数,互相关传递函数计算单元36向初步频域滤波器计算单元37输出互相关传递函数。
初步频域滤波器计算单元37用于根据语音激活判断单元33输出的信号和互相关传递函数计算单元36输出的信号计算出噪声补偿因子,并根据噪声补偿因子、初步噪声能量和第一能量谱并计算得出初步频域滤波器。
修正单元38接收初步频域滤波器计算单元37输出的信号并根据第一频域语音信号的幅度计算出平滑窗长度。
频域滤波器计算单元39用于接收初步频域滤波器计算单元37计算得出的初步频域滤波器和修正单元38计算得出的平滑窗长度,还根据该平滑窗长度对初步频域滤波器进行卷积,从而计算得出具有平滑滤波曲线的频域滤波器。
频域滤波器计算单元39接收由短时傅里叶变换单元31输出的第一频域语音信号,并利用频域滤波器对第一频域语音信号进行滤波后输出滤波后的第一频域语音信号。
短时傅里叶逆变换单元40接收滤波后的第一频域语音信号并对其进行短时傅里叶逆变换,将第一频域语音信号还原成经滤波的第一时域语音信号并将其向外输出。
由上述方案可见,通过本发明语音降噪装置对双麦克风接收的语音信号进行滤波降噪后输出高质量的语音信号,利用本发明语音降噪装置具有噪声跟踪速度快、计算量少且能够有效抑制环境噪声等特点,可高效地对输入的语音信号进行噪声抑制并提高其通话质量。
Claims (10)
1.语音降噪方法,包括
将第一麦克风接收的时域语音信号进行短时傅里叶变换后获取第一频域语音信号;
将第二麦克风接收的时域语音信号进行短时傅里叶变换后获取第二频域语音信号;
将所述第一频域语音信号进行语音激活判断,所述语音激活判断步骤用于将当前帧的第一频域语音信号设置为语音帧或噪声帧;
根据所述第一频域语音信号计算得出初步噪声能量;
其特征在于:
根据所述语音激活判断的结果和前一帧的初步频域滤波器计算出平滑因子,并根据所述平滑因子计算得出所述第一频域语音信号的第一能量谱,根据所述平滑因子计算得出所述第一频域语音信号和所述第二频域语音信号之间的互相关能量谱;
根据所述第一能量谱、所述互相关能量谱和所述第一麦克风与所述第二麦克风之间的距离计算得出互相关传递函数;
根据所述语音激活判断的结果和所述互相关传递函数计算出噪声补偿因子;
根据所述噪声补偿因子、所述初步噪声能量和所述第一能量谱计算得出初步频域滤波器;
根据所述初步频域滤波器和所述第一频域语音信号的幅度计算出平滑窗长度;
所述初步频域滤波器和所述平滑窗长度进行卷积得出频域滤波器;
所述第一频域语音信号通过所述频域滤波器滤波后输出滤波后的第一频域语音信号;
将滤波后的第一频域语音信号进行短时傅里叶逆变换后输出滤波后的第一时域语音信号。
2.根据权利要求1所述的语音降噪方法,其特征在于:
所述语音激活判断步骤包括:根据当前帧的第一频域语音信号的幅度和前一帧的初步噪声能量计算出当前帧的信噪比后,如果前一帧的第一频域语音信号为语音帧时,且判断所述当前帧的信噪比大于预设的信噪比阀值时,将当前帧的第一频域语音信号设置为语音帧;
如果前一帧的第一频域语音信号为噪声帧时,且判断所述当前帧的信噪比大于预设的信噪比阀值且前一帧的信噪比大于预设的信噪比阀值时,将当前帧的第一频域语音信号设置为语音帧,反之,将当前帧的第一频域语音信号设置为噪声帧。
3.根据权利要求2所述的语音降噪方法,其特征在于:
根据当前帧的第一频域语音信号的幅度和所述初步噪声能量计算出当前帧的信噪比后,判断当前帧在第一帧到第二十帧之间时,将所述当前帧的第一频域语音信号判断为语音帧。
4.根据权利要求3所述的语音降噪方法,其特征在于:
如果所述前一帧的第一频域语音信号为语音帧时,判断所述当前帧的信噪比小于或等于预设的信噪比阀值时,判断在前十九帧的信噪比中大于所述预设的信噪比阀值的信噪比数量为三个以上时,将所述当前帧的第一频域语音信号设置为语音帧,反之,将所述当前帧的第一频域语音信号判断为噪声帧。
5.根据权利要求4所述的语音降噪方法,其特征在于:
所述平滑因子包括第一平滑因子和第二平滑因子,根据所述语音激活判断的结果和前一帧的初步频域滤波器计算出平滑因子步骤包括:
如果所述当前帧的第一频域语音信号为语音帧时,根据所述第一平滑因子计算得出所述第一频域语音信号的第一能量谱,根据所述第一平滑因子计算得出所述第一频域语音信号和所述第二频域语音信号之间的互相关能量谱;
如果所述当前帧的第一频域语音信号为噪声帧时,根据所述第二平滑因子计算得出所述第一频域语音信号的第一能量谱,根据所述第二平滑因子计算得出所述第一频域语音信号和所述第二频域语音信号之间的互相关能量谱。
6.语音降噪装置,包括
第一短时傅里叶变换单元,用于接收时域语音信号并输出第一频域语音信号;
第二短时傅里叶变换单元,用于接收时域语音信号并输出第二频域语音信号;
语音激活判断单元,用于判断所述第一频域语音信号为语音帧或噪声帧;
初步噪声能量计算单元,用于根据所述第一频域语音信号的幅度计算初步噪声能量;
其特征在于:
所述语音降噪装置还包括
能量计算单元,所述能量计算单元包括能量谱计算模块、互相关能量谱计算模块和平滑因子计算模块,所述平滑因子计算模块向所述能量谱计算模块和所述互相关能量谱计算模块输出平滑因子系数,所述能量谱计算模块根据所述平滑因子系数和所述第一频域语音信号计算得出第一能量谱,所述互相关能量谱计算模块根据所述平滑因子系数、所述第一频域语音信号和所述第二频域语音信号计算得出互相关能量谱;
互相关传递函数计算单元,用于根据所述第一能量谱、所述互相关能量谱和第一麦克风与第二麦克风之间的距离计算得出互相关传递函数;
初步频域滤波器计算单元,用于根据所述语音激活判断单元输出的信号和所述互相关传递函数计算单元输出的信号计算出噪声补偿因子,并根据所述噪声补偿因子、所述初步噪声能量和所述第一能量谱计算得出初步频域滤波器;
修正单元,根据所述初步频域滤波器和所述第一频域语音信号的幅度计算出平滑窗长度;
频域滤波器计算单元,由所述初步频域滤波器和所述平滑窗长度进行卷积得出频域滤波器,所述频域滤波器计算单元用于接收所述第一频域语音信号;
短时傅里叶逆变换单元,用于接收所述频域滤波器计算单元输出的滤波后的第一频域语音信号,并向外输出滤波后的第一时域语音信号。
7.根据权利要求6所述的语音降噪装置,其特征在于:
所述语音激活判断单元还用于:根据当前帧的第一频域语音信号的幅度和前一帧的初步噪声能量计算出当前帧的信噪比后,如果前一帧的第一频域语音信号为语音帧时,且判断所述当前帧的信噪比大于预设的信噪比阀值时,将当前帧的第一频域语音信号设置为语音帧;
如果前一帧的第一频域语音信号为噪声帧时,且判断所述当前帧的信噪比大于预设的信噪比阀值且前一帧的信噪比大于预设的信噪比阀值时,将当前帧的第一频域语音信号设置为语音帧,反之,将当前帧的第一频域语音信号设置为噪声帧。
8.根据权利要求7所述的语音降噪装置,其特征在于:
所述语音激活判断单元还用于:在根据当前帧的第一频域语音信号的幅度和前一帧的初步噪声能量计算出当前帧的信噪比后,判断当前帧在第一帧到第二十帧之间时,将所述当前帧的第一频域语音信号判断为语音帧。
9.根据权利要求8所述的语音降噪装置,其特征在于:
所述语音激活判断单元还用于:如果所述前一帧的第一频域语音信号为语音帧时,判断所述当前帧的信噪比小于或等于预设的信噪比阀值时,判断在前十九帧的信噪比中大于所述预设的信噪比阀值的信噪比数量为三个以上时,将所述当前帧的第一频域语音信号设置为语音帧,反之,将所述当前帧的第一频域语音信号判断为噪声帧。
10.根据权利要求9所述的语音降噪装置,其特征在于:
所述平滑因子系数包括第一平滑因子系数和第二平滑因子系数,所述语音激活判断单元还用于:
如果所述当前帧的第一频域语音信号为语音帧时,根据所述第一平滑因子系数计算得出所述第一频域语音信号的第一能量谱,根据所述第一平滑因子系数计算得出所述第一频域语音信号和所述第二频域语音信号之间的互相关能量谱;
如果所述当前帧的第一频域语音信号为噪声帧时,根据所述第二平滑因子系数计算得出所述第一频域语音信号的第一能量谱,根据所述第二平滑因子系数计算得出所述第一频域语音信号和所述第二频域语音信号之间的互相关能量谱。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310743950.9A CN103700375B (zh) | 2013-12-28 | 2013-12-28 | 语音降噪方法及其装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310743950.9A CN103700375B (zh) | 2013-12-28 | 2013-12-28 | 语音降噪方法及其装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103700375A CN103700375A (zh) | 2014-04-02 |
CN103700375B true CN103700375B (zh) | 2016-06-15 |
Family
ID=50361881
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310743950.9A Active CN103700375B (zh) | 2013-12-28 | 2013-12-28 | 语音降噪方法及其装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103700375B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI640982B (zh) * | 2017-07-21 | 2018-11-11 | 宏達國際電子股份有限公司 | 音源訊號處理方法、音源訊號處理電子裝置、及非暫態電腦可讀取記錄媒體 |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB201512278D0 (en) * | 2015-07-14 | 2015-08-19 | Apical Ltd | Hybrid neural network |
CN106875951A (zh) * | 2017-01-23 | 2017-06-20 | 珠海全志科技股份有限公司 | 一种无损播放的dsd信号解码系统及方法 |
CN108806712B (zh) * | 2018-04-27 | 2020-08-18 | 深圳市沃特沃德股份有限公司 | 减少频域处理量的方法与装置 |
CN110232905B (zh) * | 2019-06-12 | 2021-08-27 | 会听声学科技(北京)有限公司 | 上行降噪方法、装置和电子设备 |
CN110632563B (zh) * | 2019-09-06 | 2021-07-16 | 北京理工大学 | 一种基于短时傅里叶变换的脉内频率编码信号参数测量方法 |
CN110970051A (zh) * | 2019-12-06 | 2020-04-07 | 广州国音智能科技有限公司 | 语音数据采集方法、终端及可读存储介质 |
CN113205824B (zh) * | 2021-04-30 | 2022-11-11 | 紫光展锐(重庆)科技有限公司 | 声音信号处理方法、装置、存储介质、芯片及相关设备 |
CN115273880A (zh) * | 2022-07-21 | 2022-11-01 | 百果园技术(新加坡)有限公司 | 语音降噪方法、模型训练方法、装置、设备、介质及产品 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1874386A (zh) * | 2005-05-24 | 2006-12-06 | 美国博通公司 | 具有改进性能的电话机及在其中处理音频信号的方法 |
CN102411936A (zh) * | 2010-11-25 | 2012-04-11 | 歌尔声学股份有限公司 | 语音增强方法、装置及头戴式降噪通信耳机 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8503686B2 (en) * | 2007-05-25 | 2013-08-06 | Aliphcom | Vibration sensor and acoustic voice activity detection system (VADS) for use with electronic systems |
US8488803B2 (en) * | 2007-05-25 | 2013-07-16 | Aliphcom | Wind suppression/replacement component for use with electronic systems |
US20110099010A1 (en) * | 2009-10-22 | 2011-04-28 | Broadcom Corporation | Multi-channel noise suppression system |
US20110096937A1 (en) * | 2009-10-28 | 2011-04-28 | Fortemedia, Inc. | Microphone apparatus and sound processing method |
-
2013
- 2013-12-28 CN CN201310743950.9A patent/CN103700375B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1874386A (zh) * | 2005-05-24 | 2006-12-06 | 美国博通公司 | 具有改进性能的电话机及在其中处理音频信号的方法 |
CN102411936A (zh) * | 2010-11-25 | 2012-04-11 | 歌尔声学股份有限公司 | 语音增强方法、装置及头戴式降噪通信耳机 |
Non-Patent Citations (1)
Title |
---|
一种双通道语音增强方法;钟金荣等;《计算机工程与科学》;20120531;第34卷(第5期);第172-177页 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI640982B (zh) * | 2017-07-21 | 2018-11-11 | 宏達國際電子股份有限公司 | 音源訊號處理方法、音源訊號處理電子裝置、及非暫態電腦可讀取記錄媒體 |
Also Published As
Publication number | Publication date |
---|---|
CN103700375A (zh) | 2014-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103700375B (zh) | 语音降噪方法及其装置 | |
US11056130B2 (en) | Speech enhancement method and apparatus, device and storage medium | |
CN104053092B (zh) | 用于双麦克风通信装置的降噪 | |
CN109845288B (zh) | 用于麦克风之间的输出信号均衡的方法和装置 | |
EP3703052A1 (en) | Echo cancellation method and apparatus based on time delay estimation | |
US9812147B2 (en) | System and method for generating an audio signal representing the speech of a user | |
CN103871421B (zh) | 一种基于子带噪声分析的自适应降噪方法与系统 | |
CN102074246B (zh) | 基于双麦克风语音增强装置及方法 | |
CN109195042B (zh) | 低功耗的高效降噪耳机及降噪系统 | |
CN101916567B (zh) | 应用于双麦克风系统的语音增强方法 | |
CN111418010A (zh) | 一种多麦克风降噪方法、装置及终端设备 | |
CN102074245A (zh) | 基于双麦克风语音增强装置及语音增强方法 | |
CN101976565A (zh) | 基于双麦克风语音增强装置及方法 | |
CN102543095B (zh) | 用于减少音频处理算法中的非自然信号的方法和装置 | |
CN109239667A (zh) | 一种基于双麦克风阵列的声源定位方法 | |
CN106663445A (zh) | 声音处理装置、声音处理方法及程序 | |
CN110349598A (zh) | 一种低信噪比环境下的端点检测方法 | |
CN108022595A (zh) | 一种语音信号降噪方法和用户终端 | |
CN103426433A (zh) | 噪声消除方法 | |
JPWO2010052749A1 (ja) | 雑音抑圧装置 | |
CN103021405A (zh) | 基于music和调制谱滤波的语音信号动态特征提取方法 | |
WO2022247494A1 (zh) | 音频信号补偿方法及装置、耳机、存储介质 | |
JPWO2010046954A1 (ja) | 雑音抑圧装置および音声復号化装置 | |
CN105144290A (zh) | 信号处理装置、信号处理方法和信号处理程序 | |
CN114898762A (zh) | 基于目标人的实时语音降噪方法、装置和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |