CN1113335A - 降低语音信号中噪声的方法和检测噪声域的方法 - Google Patents
降低语音信号中噪声的方法和检测噪声域的方法 Download PDFInfo
- Publication number
- CN1113335A CN1113335A CN95104844A CN95104844A CN1113335A CN 1113335 A CN1113335 A CN 1113335A CN 95104844 A CN95104844 A CN 95104844A CN 95104844 A CN95104844 A CN 95104844A CN 1113335 A CN1113335 A CN 1113335A
- Authority
- CN
- China
- Prior art keywords
- value
- noise
- frame
- rms
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000007476 Maximum Likelihood Methods 0.000 claims abstract description 21
- 238000001914 filtration Methods 0.000 claims abstract description 19
- 238000001228 spectrum Methods 0.000 claims description 25
- 238000001514 detection method Methods 0.000 claims description 13
- 230000003044 adaptive effect Effects 0.000 claims description 5
- 238000009795 derivation Methods 0.000 claims description 2
- 238000009499 grossing Methods 0.000 abstract 3
- 206010038743 Restlessness Diseases 0.000 description 7
- 230000007774 longterm Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 238000005070 sampling Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 230000002401 inhibitory effect Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000009467 reduction Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000013016 damping Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000002708 enhancing effect Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 3
- 125000000205 L-threonino group Chemical group [H]OC(=O)[C@@]([H])(N([H])[*])[C@](C([H])([H])[H])([H])O[H] 0.000 description 2
- 230000004069 differentiation Effects 0.000 description 2
- 238000009432 framing Methods 0.000 description 2
- 230000005764 inhibitory process Effects 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 101100366000 Caenorhabditis elegans snr-1 gene Proteins 0.000 description 1
- 241001269238 Data Species 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- ZPUCINDJVBIVPJ-LJISPDSOSA-N cocaine Chemical compound O([C@H]1C[C@@H]2CC[C@@H](N2C)[C@H]1C(=O)OC)C(=O)C1=CC=CC=C1 ZPUCINDJVBIVPJ-LJISPDSOSA-N 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000001915 proofreading effect Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 210000004243 sweat Anatomy 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02168—Noise filtering characterised by the method used for estimating noise the estimation exclusively taking place during speech pauses
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L2025/783—Detection of presence or absence of voice signals based on threshold decision
- G10L2025/786—Adaptive threshold
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Noise Elimination (AREA)
- Time-Division Multiplex Systems (AREA)
Abstract
一种语音信号降噪方法,通过用输入信号频谱减
去估计噪声谱的谱减法计算语音出现概率,按计算的
语音出现概率自适应控制最大似然滤波器。按输入
信号的信噪比获得最佳抑制因子,因此用户不必要在
实际应用前实行调节。此外,一种检测噪声域的方
法,利用当前帧RMS值或以前帧乘以系数α的值
th,不管哪个值较小来计算为实际噪声域鉴别用于得
出阈值Th1的值th,系数α依据当前帧的RMS值
而变。
Description
本发明涉及降低语音信号中噪声的方法以及检测噪声域的方法。更准确地说,是涉及一种通过自适应控制用于根据语音出现概率和按输入语音信号计算的信噪比计算语音分量的最大似然滤波器而达到噪声抑制的降低语音信号中噪声的方法,以及适用于该降噪方法的噪声域检测方法。
在便携式电话或语音识别中,认为有必要抑制收集的语音信号中所含的环境噪音或背景噪声并增强语音分量。
作为增强语音或降低噪声的技术,在IEEE文集“Acoust,Speech,Signal Processing”的1980年4月第28卷第137-145页R.J.McAulay和M.L.Malpass所著“利用软判定(Soft-Decision)噪声抑制滤波器实现语音增强”以及IEEE ICASSP 1993年4月第二卷第363-366页J.Yang所著“移动电话系统中频域噪声抑制方法”中说明了利用条件概率函数调整衰减因子的技术。
利用这些噪声抑制技术,常常会出现这样的情况,由于基于不适当的固定信噪比(S/N)或不适当的抑制因子的操作而产生不自然的音调或畸变的语音。在实际应用中,在达到最佳性能的噪声抑制系统的参数中用户不希望调节信噪比。此外,用常规语音信号增强技术难于在不附带产生对短期信噪比相当大起伏敏感的语音信号畸变的情况下充分地消除噪声。
对于上述语音增强或降噪方法而言,用到了检测噪声域的技术,其中将输入电平或功率与用于区分噪声域的预定阈值相比较。然而,如果为防止跟踪语音而增大阈值的时间常数,跟随噪声电平的变化尤其是噪声电平的增加就变得不可能,由此导至错误区分。
鉴于以上所述,本发明的目的是提供一种降低语音信号中噪声的方法,根据输入语音信号,将抑制因子调节到相对实际输入的信噪比最佳的值,并达到充分消除噪声而不产生作为附加效应的畸变或不必由用户预先调节。
本发明的另一目的是提供一种检测噪声域的方法,按照响应输入信号的最佳阈值实现噪声域区分,即使在噪声电平起伏时也可排除错误区分。
一方面,本发明提供降低输入语音信号中噪声的方法,通过自适应控制适用于根据语音出现概率和按输入语音信号计算的信噪比计算语音分量的最大似然滤波器而实现噪声抑制。特别地,在计算语音出现概率时利用频谱差,亦即输入信号的频谱减去预计噪声谱。
最好不管哪个值较大用上述频谱差值或预定值来计算语音出现的概率。最好不管哪个值较大对当前帧及以前帧计算上述差值或预定值,用预定衰减系数乘以前帧的值,不管哪个值较大,用当前帧值或以预定衰减系数乘以前帧的值计算语音出现的概率。
用沿频率轴或时间轴的平滑滤波处理最大似然滤波器的特性。最好用最大似然滤波器在所考虑频率范围内特性和最大似然滤波器在相邻左和右边频率范围内的中值特性进行沿频率轴的平滑滤波。
另一方面,本发明提供通过按帧划分输入语音信号,按帧得出RMS值并将RMS值与用于检测噪声域的阈值Th1相比检测噪声域的方法。尤其,不管哪个值较小,用当前帧和以系数α乘的以前帧的RMS值来计算用于得出阈值Th1的值th,系数α依据当前帧的RMS值就化。在下列实施例中,阈值Th1为Noise RMSthres[k],而得出它的值th为MinNoiseshert[k],其中k是帧号。如将在方程(7)中说明的,将以系数α[k]乘的以前帧的值MinNoiseshert[k-1]与当前帧的RMS值RMS[k]相比较,并将这二者中的较小值设定为MinNoiseshert[k]。系数[k]依照RMS值RMS[k]从1到0变化或相反。
最好是,得出阈值Th1的值th可以是当前帧的RMS值与以前帧值用系数α乘的值th二者中较小的值,亦即如后文说明的MinNoiseshert[k],或多个帧中的最小RMS值,即MinNoiselong[k],不管哪个大些。
此外,根据用阈值th2进行当前帧的相对能量区分的结果检测噪声域,阈值Th2是利用输入语音信号的最大信噪声比和RMS值与阈值Th1的比较结果来计算的。在以下实施例中,阈值Th2为dBthresrel[k],基于帧的相对能量为dBrel。相对能量dBrel是相应于正如前一信号能量本身峰值的相对值,并描述当前信号能量。
在按照本发明的降噪方法中最好利用上述噪声域检测方法。
对于本发明的语音信号降噪方法来说,由于语音出现概率是用从输入信号频谱中减去估计噪声频谱的频谱减法来计算的,并按照计算出的语音出现概率自适应控制最大似然滤波器,依照输入语音信号的信噪的比完成最佳抑制因子的调节,因此用户无需在实际应用之前进行调整。
另外,对按照本发明的检测噪声域的方法而言,由于用于得出作噪声域鉴别的阈值Th1的值th是用当前帧的RMS值或以系数α乘的以前帧值th来计算的,不管哪个值小些,而且系数α是依照当前帧的RMS值变化的,从而可实现用响应输入信号的最佳阈值进行的噪声域鉴别,即使在噪声电平起伏时也不会产生错误判断。
图1是说明用于实现按照本发明实施例的语音信号降噪方法的电路布局的电路框图。
图2是表明图1所示实施例中所用噪声估算电路的说明性实例的电路方块图。
图3是说明图1所示实施例中能量E[k]和衰减能量Edecay[k]的实例的曲线图。
图4是说明图1实施例中短期RMS值RMS[k],最小噪声RMS值MinNoise[k]和最大信号RMS值MaxSignal[k]的实例的曲线图。
图5是说明以dB表示的相对能量dBrel[k],最大信噪比值MaxSNR[k]和作为噪声鉴别的阈值之一的dBthresrel[k]的实例的曲线图。
图6是表示图1所示实施例中作为相应于最大信噪比值MaxSNR[k]定义的函数的NR电平[k]的曲线图。
参见附图,详细说明本发明语音信号降噪方法的最佳实施例。
在图1中,以方块电路图示出了按照本发明最佳实施例实现语音信号降噪方法的降噪装置的示意性布局。
参见图1,包括语音分量和噪声分量的输入信号y[t]施加于输入端11。为具有抽样频率FS的数字信号的输入信号y[t]馈入成帧/开窗电路12,在其中将它划分为各具有等于FL抽样的长度的帧,由此按帧顺序处理输入信号。成帧间隔亦即沿时间轴的帧移动量是FI抽样,这些在FL个样本之后如由第K帧起开始第(k+1)个抽样。在由下一电路快速傅里叶交换(FFT)电路13处理之前,成帧/开窗电路12以开窗函数进行帧基准信号的开窗。同时,逆傅里叶变换或IFFT之后在帧基准信号的最后信号处理阶段,通过用开窗函数Woutput进行开窗来处理输出信号。开窗函数Winput和Woutput的实例由下列方程(1)和(2)给出:
0≤j≤FL……(2)
若抽样频率FS是8000Hz=8KHz,或帧间隔FI是80和160个样本,则成帧间隔分别为10毫秒和20毫秒。
FFT电路13以256点执行FFT以产生被频率划分电路14划分为18个频带的频谱幅度值。下列表1示出了各频带频率范围的实例。
表1
这些频率的设置是基于以下事实,即人的听觉系统的分辨率降低到较高频率侧。作为各个范围的幅度,运用各个频率范围内的最大FFT幅度。
噪声估值电路15区分输入信号y[t]中的语音与噪声并检测估计为噪声的帧。估计噪声域或检测噪声帧的操作是通过组合三类检测操作来实现的。以下参照图2说明噪声域估计的说明性实例。
在该图中,进入输入端11的输入信号y[t]馈入均方根值(RMS)计算电路15A,该电路15A按帧基准计算短期RMS值。RMS计算电路15A的输出加到相对能量计算电路15B、最小RMS计算电路15C、最大信号计算电路15D及噪声谱估计电路15E。噪声谱估计电路15E还与相对能量计算电路15B、最小RMS计算电路15C及最大信号计算电路15D的输出相连,同时还与频率划分电路14的输出端相连。
RMS计算电路15A计算帧基准信号的RMS值。第k帧的RMS值RMS[k]用下列方程计算:
………(3)
相对能量计算电路15B计算第k帧的相对能量dBrel[k]。以dB为单位的相对能量dBrel[k]由下列方程(4)计算:
dBrel[K]=10log10( (Edecay[K])/(E[K]) )
…………(4)
在以上方程(4)中,能量值E[k]和衰减能量值Edecay[k]可分别用方程(5)和(6)计算:
…………(5)
…………(6)
由于方程(5)可用EL·(RMS[k])2表示,所以可以使用RMS计算电路15A的输出RMS[k]。然而,在RMS计算电路15A中方程(3)计算过程中得到的方程(5)的值可直接传输到相对能量计算电路15B。在方程(6)中,作为举例衰减时间仅设置为0.65秒。
图3示出了能量E[k]和衰减能量Edecay[k]的实例。
最小RMS计算电路15C得出适用于估计背景噪声电平的最小RMS值。帧基上基于帧的最小短期RMS值和最小长期RMS值,亦即许多帧上的最小RMS值也得出。当短期值不能跟踪或跟随噪声电平的显著变化时用长期值。最小短期RMS噪声值MinMoiseshert用下列方程(7)计算:
a(k)=1 RMS[k]<MAX_NOISE_RMS,and
RMS[k]<3 MinNoiseshort[k-1]
0 其它
设置最小短期RMS噪声值MinNoiseshort相对背景噪声增大,背景噪声是与语音无关的周围噪声。当高噪声电平的上升率为指数时,产生较大上升率的低噪声电平用固定上升率。
每0.6秒计算最小长期RMS噪声值MinNoiselong。MinNoiselong是在dBrel>19dB的帧RMS值的前1.8秒上最小。如果在前1.8秒中,不存在dBrel>19的RMS值,则不用MinNoiselong,因为信号的前一秒可能不含仅有背景噪声的任何帧。在每0.6秒间隔上,若MinNoiselong>MinNoiseshort则将该间隔上的MinNoiseshort设置为MinNoiselong。
最大信号计算电路15D计算最大RMS值或SNR(信噪比)的最大值。最大RMS值用来计算最佳或最大SNR值。对最大RMS值而言,既计算短期也计算长期。短期最大RMS值MaxSignalshort由下列方程(8)得出:
………(8)
在例如0.4秒间隔上计算最大长期RMS噪声值MzxSignallong。该值MaxSignallong是暂时超过当前时间点0.8秒期间帧RMS值的最大值。在每-0.4秒范畴内,如果MaxSingallong小于MaxSignalshert,则将MaxSignalshert值设定为(0.7MaxSignalshert+0.3MaxSignallong)的值。
图4示出短期RMS值[k],最小噪声RMS值MinNoise[k]以及最大信号RMS值MaxSignal[k]。在图4中,最小噪声RMS值MinNoise[k]表示考虑长期值MinNoiselong的短期值MinNoiseshert。此外,最大信号RMS值MaxSignal[k]表示考虑长期值MaxSignallong的短期值MaxSignalshert。
可利用短期最大信号RMS值MaxSignalshert和短期最小噪声RMS值MinNoiseshert来估算最大信号SNR值。噪声抑制特性及噪声域鉴别的域值按该估值修改,以减小造成无噪声纯语音信号畸变的可能性。用下列方程计算最大SNR值MaxSNR:
MaxSNR[k]=20.0·log10( (max(1000.0,MaxSignalshort[k]))/(max(0.5,MinNoisesnort[k]) -1.0)
………(9)
由MaxSNR值计算在0到1范围内表示相对噪声电平的归一化参数NR-level。下面运用NT-level方程。
NR_level[k]=
( 1/2 + 1/2 cos(π· (MaxSNR[k]-30)/20 ))×(1-0.002(MaxSNR[k]-30)2)
30<MaxSNR[k]≤50
0.0 MaxSNR[k]>50
1.0 其它 (10)
现对噪声谱估计电路15E的工作加以解释。由相对能量计算电路15B、最小RMS计算电路15C及最大信号计算电路15D计算的值用于将语音与背景噪声分开。如果满足下列条件,第k帧的信号归为背景噪声。
((RMS[k]<NoiseRMSthres[k])
或 (dBrel[k]>dBthresrel[k]))and(RMS[k]<RMS[k-1]+200)
(11)
其中 NoiseRMSrel[k]=min(1.05+0.45·NR_level[k])
MinNoise[k],MinNoise[k]+
Max_△_NOISE_RMS)
dBthresrel[k]=max(MaxSNR[k]-4.0,0.9·MaxSNR[k])
图5示出了以上方程(11)中的相对能量dBrel[k],最大SNR值MaxSNR[k]和作为噪声鉴别阈值之一的dBthresrel[k]的值。
图6示出方程(10)中作为MaxSNR[k]的函数的NR-level[k]。
若将第k帧归类为背景噪声或噪声,则噪声谱Y[w,k]的时间平均估计值由当前帧的信号谱Y[w,k]更新,如下列方程(12)所示:
N[w,k]=α·max(N[w,k-1],Y[w,k])
+(1-α)·min(N[w,k-1],Y[w,k]) ……(12)
其中W表示频带分离的频带号。
如果第k帧归类为语音,N[w,k-1]的值直接用作N[w,k]。
图2所示噪声估计电路15的输出传输到语音估计电路16,Pr[Sp]计算电路17,Pr[Sp/Y]计算电路18并传输到最大似然滤波器19。
在噪声估值电路15的噪声谱估计电路15E中进行算术-逻辑运算时,可至少利用相对能量计算电路15B、最小RMS计算电路15C及最大信号计算电路15D的输出数据之一进行算术-逻辑运算。虽然估计电路15E产生的数据精度下降,但只需较小电路规模的噪声估计电路15就足够了。当然,可利用三个计算电路15B,15C及15D的所有输出数据产生估计电路15E的高精度输出数据。但是,可用计算电路15B,15C及15D中两个电路进行估计电路15E的算术-逻辑运算。
语音估算电路16计算频带基上的信噪比。语音估算电路16馈接来自频带分离电14的频谱幅度数据Y[w.k]和来自噪声估计电路15的估计噪声谱谱幅度数据。估计的语音谱数据S[w,k]由这些数据导出。如后面说明的无噪声纯语音频谱的粗略估计值可用来计算概率Pr[Sp/Y]。通过按下列方程(13)取频谱值的差计算该值。
……(13)
然后,运用如由上述方程(13)计算的语音谱粗略估值S′[w,k],按照下列方程(14)计算在频带基上取时间平均的语音谱的估算值S[w,k]:
S[w,k]=max(S′[w,k],S′[w,k-1]·decay_rate)
……(14)
当方程(14)中,利用此处所示出的decay-rate。
按照下列方程(15)计算基于频带的信噪比:
SNR[w,k]=20·log10( (0.2·S[w-1,k]+0.6·S[w,k]+0.2S[w+1,k])/(0.2·N[w+1,k]+0.6·N[w,k]+0.2N[w-1,k])
…… (15)
其中可分别由方程(12)和(14)得出噪声谱N[]的估算值和语音谱的估算值。
说明Pr(Sp)计算电路17的操作。概率Pr(Sp)是在假定输入信号中出现的语音信号的概率。该概率迄今恒定于0.5。对于具有高信噪比的信号而言,概率Pr[Sp]可增大以防止音质畸变。可按照下列方程(16)计算这种概率Pr(Sp):
运用最大信号计算电路15D计算的NR_level方程。
现说明Pr(Sp/Y)计算电路18的操作。Pr(Sp/Y)值是输入信号Y[t]中存在的语音信号的概率,并是用Pr(Sp)和SNR[w,k]计算的。用值Pr(Sp/Y)将无语音域减小为较窄值。为进行计算,利用1980年4月出版的IEEE文集“Acouso,Speech,and Signal Processing”ASSP-28卷2号中R.J.McAulay和M.L.Malpass所著“利用软判定噪声抑制滤波器实现语音增强”公开的方法,现参照方程(17)至(20)加以说明。
Pr(Hl︱Y)[w,k]= (Pr(Hl)·P(Y︱Hl))/(Pr(Hl)·P(Y︱Hl)+Pr(HO)·P(Y︱HO))
(Bayes 规则)……(17)
(修正第一类Bessel方程)……(20)
在上述方程(17)至(20)中,HO表示无语音事件,亦即输入信号y(t)是噪声n(t)的事件,而H1表示语音事件,即输入信号y(t)是语音信号S(t)与噪声信号n(t)之和且S(t)不等于0的事件。此外,w,k,Y,S和δ分别表示频带号、帧号、输入信号[w,k],语音信号S[w,k]的估计值以及估算噪声信号N[w,k]2的平方值。
由方程(17)计算Pr(H1~Y)[w,k],而方程(17)中的P(Y/HO)和P(Y/H1)可由方程(19)导出,由方程(20)计算Bessel方程I。(|X|)。
可用于列方程(21)近似Bessel方程:
I0=(|X|)=
至此,为导出Pr(H1/Y)利用了信噪比的固定值,如SNR=5,而不用估算的语音信号值S[w,k]。因此简化了P(Y/H1),如下列方程(22)所示:
……(22)
瞬时信噪比低于计算P(Y/H1)中所用信噪比值SNR的信号得到显著抑制。如果假定信噪比的值SNR设定为过高值,则搀杂有低电平噪声的语音在其低电平语音部分被过于削弱,于是产生的语音变得不自然。反之,若将信噪比的值SNR设定为过低值,掺杂有较高电平噪声的语音的噪声抑制率低,甚至在其低电平部分都听得到噪音。这样如在本实施例中一样利用信噪比的变化值SNRnew[w.k]代替信噪比的固定值得到满足宽范围背景/语音电平的值P(Y/H1)。可从下列方程(23)得出SNRnew[w.k]值:
SNRmew[w,k]=max(MIN_SNR[w,k]), (S′[w,k])/(N[w,k])
……(23)
其中MIN-SNR值由方程(24)得出:
MIN_SNR(x)=
3- (x-10)/35 ·1.5,10≤X≤45
1.5,其它 ……(24)
值SNRnew[w,k]是第k帧中的瞬时SNR,其中对最小,值加有限制。对于总体上具有高信噪比的信号来说,可将SNRnew[w,k]值减小到1.5。在这种情况下,对具有低瞬时信噪比的段不进行抑制。总之对于低瞬时信噪比的信号值SNRnew[w,k]不能减小到3以下。因此,对具有低瞬时信噪比的段可保证足够的抑制。
现对最大似然滤波器19的操作加以说明。最大似然滤波器19是为分离噪声信号的相应输入信号频率而提供的预滤波器之一。在最大似然滤波器19中,利用来自噪声估值电路15的噪声谱幅度数据N[w,k]将来自频带分离滤波器14的频谱幅度数据Y[w.k]转换为信号H[w,k]。按照下列方程(25)计算信号H[w,k]:
H[w,k]=
其它 α=0.7-0.4·NR_level[k]. ……(25)
尽管通常将上述方程(25)右的值α设置为1/2,噪声抑制度可依赖于SNR变化,因为SNR的近似值是已知的。
下面说明软判定抑制电路20的操作。软判定抑制电路20是用于增强信号语音部分的预滤波器之一。利用来自Pr(Sp/Y)计算电路18的信号H[w,k]和值Pr[H1/Y]用下列方程(26)所表示的方法进行变换:
H[w,k] - Pr(H1|Y)[w,k]·H[w,k]+(1-Pr(H1|Y[w,k]·MIN_GAIN
(26)
在上述方程(26)中,MIN-GAIN是表示最小增益的参数,可设定为例如0.1,即-15dB。
现说明滤波器处理电路21的操作。沿频率轴和时间轴对来自软判定抑制电路20的信号H[w,k]滤波。沿频率轴的滤波具有缩短信号H[w,k]的有效脉冲响应长度的效果。这消除了频域中与乘法滤波相关联的环形卷积混淆效应。沿时间轴的滤波具有在抑制噪声脉冲中限制滤波器变化率的效应。
现在说明沿频率轴的滤波。对由频带划分得出的18个频带每一频带的信号H[w,k]进行中值滤波。该方法由下列方程(27)和(28)说明:
步骤1:
H1[w,k]=max(median(H[w-1,k],H[w,k],H[w+1,k],H[w,k] (27)
其中H1[w,k]=H[w,k]如果(w-1)或(w+1)不存在
步骤2:H2[w,k]=min(median(H[w-1,k],H[w,k],H[w+1,k],H[w,k]
其中H2[w,k]=H1[w,k]如果(w-1)或(w+1)不存在
在步骤1中,H1[w,k]是无信号带零点的H[w,k]。在步骤2中,H2[w,k]是不存在单独频带峰值的H1[w,k]。由沿频率轴滤波得出的信号是H2[w,k]。
其次说明沿时间轴的滤波。沿时间轴滤波考虑输入语音信号即语音、背景噪声及为语音上升部分的瞬态三个状态。语音信号沿时间轴平滑如下列方程(29)所示:
Hspeech[w,k]=0.7·H2[w,k]+0.3·H2[w,k-1] (29)
沿时间轴平滑背景噪声的下列方程(30)所示:
Hnoise[w,k]=0.7·Min_H+0.3·Max_H (30)
其中Min_H和Max_H为:
Min_H=min(H2[w,k],H2[w,k-1]
Max_H=max(H2[w,k],H2[w,k-1]
对于瞬时信号,不进行沿时间轴的平滑。最后,用于列方程(31)计算产生平滑的输出信号Ht_smooth[w,k]
Ht_smooth[w,k]
=(1-αtr)(αsp·Hspeech[w,k]+(1-αsp)·Hnoise[w,k]+αtr·H2[w,k]
(31)
分别由方程(32)和(33)得出方程(31)中的αsp和αtr:
αsp=
1.0,SNRinst>4.0
(SNRinst-1)· 1/3 ,1.0<SNRinst<4.0
0,其它
(32)
其中
SNRinst= (RMS[k])/(MinNoise[k])
αtr=
1.0,δrms>3.5
(δrms-2)· 2/3 ,2.0<δrms<3.5
0,其它
(33)
其中
说明频带转换电路22的操作。来自滤波电路21的18频带信号Ht-smooth[w,k]被插入例如128频带信号H128[w,k]。以两个阶段进行插入,即用零阶保持进行由18到64频带的插入,用低通滤波器内插实现自64到128频带的内插。
现说明频谱校正电路23的操作。在FFT溻路13得到的输入信号FFT系数的实部和虚部与上述信号H128[w,k]相乘,以进行频谱校正。结果是频谱幅度得到校正,而不对频谱进行相位修正。
IFFT电路24对在频谱校正电路23获得的信号进行逆FFT变换。
叠加电路25将基于帧的输出信号的帧边缘部分叠加。通过上述过程在输出端26获得噪声下降的输出信号。
这样获得的输出信号传输给手提电话的多个编码器或语音识别装置的信号处理电路。另一方面,可用本发明的降噪方法处理手提电话设备的解码输出信号。
本发明不限于以上实施例。例如,在利用最大似然滤波器的常规噪声抑制技术中可利用上述用滤波电路21实现的滤波。用滤波器处理电路15实现的噪声域检测方法可用在除噪声抑制装置以外的多种装置中。
Claims (14)
1、一种降低输入语音信号噪声的方法,通过自适应控制适用于根据语音出现的概率和按输入语音信号计算的信噪比来计算语音分量的最大似然滤波器进行噪声抑制,其特征在于:改进部分包含计算语音出现概率时用输入信号频谱减去估计噪声频谱。
2、如权利要求1所述的方法,其特征在于:不管哪个值较大上述差值成预定值用于计算语音出现的概率。
3、如权利要求1所述的方法,其特征在于:不管哪个值较大上述差值成预定值由当前帧和以前帧得出,对应以前帧的值用预定衰减系数相乘,不管哪个值较大用当前帧的值或以前帧乘以预定衰减系数的值计算语音出现的概率。
4、如权利要求1所述的方法,其特征在于:用沿频率轴和时间轴的平滑滤波处理最大似然滤波器的特性。
5、如权利要求1所述的方法,其特征在于:为得出语音出现概率通过比较基于帧的RMS值与阈值Th1检测噪声域,用于导出阈值Th1的值th按照当前帧的RMS值或以前帧的值th乘以系数α导出,而不管哪个值较小,系数α依据当前帧的RMS值变化。
6、如权利要求5所述的方法,其特征在于:利用当前帧的RMS值和以前帧的th乘以系数α之一,不管哪个值较小,或多个帧上RMS值的最小值,不管哪个值较大,导出得出阈值Th1的值th。
7、如权利要求6所述的方法,其特征在于:通过利用用输入语音信号最大信噪声计算的阈值Th2鉴别当前帧的相对能量进行噪声域检测。
8、一种降低输入语音信号中噪声的方法,通过自适应控制适用于根据语音出现概率和按输入语音信号计算的信噪比计算语音分量的最大似然滤波器实现噪声抑制,其特征在于改进部分包括:
沿频率轴和时间轴对最大似然滤波器的特性进行平滑滤波。
9、如权利要求8所述的方法,其特征在于:最大似然滤波器在所考虑频率范围内的特性以及最大似然滤波器在相邻左边和右边频率范围内的特性的中值用作沿频率轴平滑滤波。
10、如权利要求8所述的方法,其特征在于:沿频率轴的平滑滤波包括以下步骤:
选择中值或最大似然滤波器在所考虑频率范围内的特性,不管哪个值较大,
所考虑频率范围的中值对应于处理结果或最大似然滤波器在频率范围中的特性,不管哪个较小。
11、如权利要求9所述的方法,其特征在于:沿时间轴的平滑滤波包括对语音部分信号的平滑和噪声部分信号的平滑。
12、一种检测噪声域的方法,通过划分帧基准上的输入语音信号,找出帧基准上的RMS值并将该RMS值与用于检测噪声域的阈值Th1比较,其特征在于改进部分包括:计算当前帧利用RMS值得出阈值Th1的值th和以前帧被系数α相乘的值th,不管哪个值较小,并依据当前帧的RMS值变更系数α。
13、如权利要求12所述的方法,其特征在于:包括计算当前帧的用较小RMS值导出阈值Th1的值th以及以前帧乘以系数α的值th,或多个帧上的最小RMS值,不管哪个值大些。
14、如权利要求13所述的方法,其特征在于:根据利用用输入语音信号最大信噪比计算的阈值鉴别当前帧的相对能量所得的结果和将RMS值与阈值Th1比较所得结果检测噪声域。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP09986994A JP3484757B2 (ja) | 1994-05-13 | 1994-05-13 | 音声信号の雑音低減方法及び雑音区間検出方法 |
JP099869/94 | 1994-05-13 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1113335A true CN1113335A (zh) | 1995-12-13 |
Family
ID=14258823
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN95104844A Pending CN1113335A (zh) | 1994-05-13 | 1995-05-12 | 降低语音信号中噪声的方法和检测噪声域的方法 |
Country Status (8)
Country | Link |
---|---|
US (3) | US5668927A (zh) |
EP (3) | EP1065657B1 (zh) |
JP (1) | JP3484757B2 (zh) |
KR (1) | KR100335162B1 (zh) |
CN (1) | CN1113335A (zh) |
DE (3) | DE69531710T2 (zh) |
MY (1) | MY121946A (zh) |
TW (1) | TW262620B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1841500B (zh) * | 2005-03-30 | 2010-04-14 | 松下电器产业株式会社 | 一种基于自适应非线性谱减的抗噪方法和装置 |
CN1584984B (zh) * | 2003-08-19 | 2010-05-26 | 微软公司 | 使用瞬时信噪比作为最优估计的主量的降噪方法 |
CN101859568B (zh) * | 2009-04-10 | 2012-05-30 | 比亚迪股份有限公司 | 一种语音背景噪声的消除方法和装置 |
CN105103218A (zh) * | 2013-02-08 | 2015-11-25 | 卷藤逻辑公司 | 环境噪声均方根(rms)检测器 |
CN106885971A (zh) * | 2017-03-06 | 2017-06-23 | 西安电子科技大学 | 一种用于电缆故障检测定点仪的智能背景降噪方法 |
CN112000047A (zh) * | 2020-09-07 | 2020-11-27 | 广东众科智能科技股份有限公司 | 一种远程智能化监控系统 |
CN113488032A (zh) * | 2021-07-05 | 2021-10-08 | 湖北亿咖通科技有限公司 | 车辆以及车辆用语音识别系统和方法 |
Families Citing this family (73)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3484801B2 (ja) * | 1995-02-17 | 2004-01-06 | ソニー株式会社 | 音声信号の雑音低減方法及び装置 |
JP3453898B2 (ja) * | 1995-02-17 | 2003-10-06 | ソニー株式会社 | 音声信号の雑音低減方法及び装置 |
FI100840B (fi) * | 1995-12-12 | 1998-02-27 | Nokia Mobile Phones Ltd | Kohinanvaimennin ja menetelmä taustakohinan vaimentamiseksi kohinaises ta puheesta sekä matkaviestin |
US6256394B1 (en) * | 1996-01-23 | 2001-07-03 | U.S. Philips Corporation | Transmission system for correlated signals |
JP3483695B2 (ja) * | 1996-03-14 | 2004-01-06 | 株式会社リコー | 音声通信装置 |
KR100250561B1 (ko) * | 1996-08-29 | 2000-04-01 | 니시무로 타이죠 | 잡음소거기 및 이 잡음소거기를 사용한 통신장치 |
US5933495A (en) * | 1997-02-07 | 1999-08-03 | Texas Instruments Incorporated | Subband acoustic noise suppression |
US6104993A (en) * | 1997-02-26 | 2000-08-15 | Motorola, Inc. | Apparatus and method for rate determination in a communication system |
US6353809B2 (en) * | 1997-06-06 | 2002-03-05 | Olympus Optical, Ltd. | Speech recognition with text generation from portions of voice data preselected by manual-input commands |
DE19747885B4 (de) * | 1997-10-30 | 2009-04-23 | Harman Becker Automotive Systems Gmbh | Verfahren zur Reduktion von Störungen akustischer Signale mittels der adaptiven Filter-Methode der spektralen Subtraktion |
US6549586B2 (en) * | 1999-04-12 | 2003-04-15 | Telefonaktiebolaget L M Ericsson | System and method for dual microphone signal noise reduction using spectral subtraction |
US6175602B1 (en) * | 1998-05-27 | 2001-01-16 | Telefonaktiebolaget Lm Ericsson (Publ) | Signal noise reduction by spectral subtraction using linear convolution and casual filtering |
US7209567B1 (en) | 1998-07-09 | 2007-04-24 | Purdue Research Foundation | Communication system with adaptive noise suppression |
US6351731B1 (en) | 1998-08-21 | 2002-02-26 | Polycom, Inc. | Adaptive filter featuring spectral gain smoothing and variable noise multiplier for noise reduction, and method therefor |
US6453285B1 (en) | 1998-08-21 | 2002-09-17 | Polycom, Inc. | Speech activity detector for use in noise reduction system, and methods therefor |
US6122610A (en) * | 1998-09-23 | 2000-09-19 | Verance Corporation | Noise suppression for low bitrate speech coder |
US6711540B1 (en) * | 1998-09-25 | 2004-03-23 | Legerity, Inc. | Tone detector with noise detection and dynamic thresholding for robust performance |
US6574334B1 (en) | 1998-09-25 | 2003-06-03 | Legerity, Inc. | Efficient dynamic energy thresholding in multiple-tone multiple frequency detectors |
US6289309B1 (en) | 1998-12-16 | 2001-09-11 | Sarnoff Corporation | Noise spectrum tracking for speech enhancement |
WO2000049602A1 (en) * | 1999-02-18 | 2000-08-24 | Andrea Electronics Corporation | System, method and apparatus for cancelling noise |
US6363345B1 (en) * | 1999-02-18 | 2002-03-26 | Andrea Electronics Corporation | System, method and apparatus for cancelling noise |
JP2001016057A (ja) | 1999-07-01 | 2001-01-19 | Matsushita Electric Ind Co Ltd | 音響装置 |
US6349278B1 (en) * | 1999-08-04 | 2002-02-19 | Ericsson Inc. | Soft decision signal estimation |
JP3961290B2 (ja) | 1999-09-30 | 2007-08-22 | 富士通株式会社 | 雑音抑圧装置 |
DE69920461T2 (de) * | 1999-10-29 | 2005-12-01 | Telefonaktiebolaget Lm Ericsson (Publ) | Verfahren und Vorrichtung zur robusten Merkmalsextraktion für die Spracherkennung |
JP3454206B2 (ja) * | 1999-11-10 | 2003-10-06 | 三菱電機株式会社 | 雑音抑圧装置及び雑音抑圧方法 |
US7058572B1 (en) * | 2000-01-28 | 2006-06-06 | Nortel Networks Limited | Reducing acoustic noise in wireless and landline based telephony |
US6804640B1 (en) * | 2000-02-29 | 2004-10-12 | Nuance Communications | Signal noise reduction using magnitude-domain spectral subtraction |
US6898566B1 (en) | 2000-08-16 | 2005-05-24 | Mindspeed Technologies, Inc. | Using signal to noise ratio of a speech signal to adjust thresholds for extracting speech parameters for coding the speech signal |
JP3566197B2 (ja) * | 2000-08-31 | 2004-09-15 | 松下電器産業株式会社 | 雑音抑圧装置及び雑音抑圧方法 |
GB2367467B (en) * | 2000-09-30 | 2004-12-15 | Mitel Corp | Noise level calculator for echo canceller |
SE516346C2 (sv) * | 2000-10-06 | 2001-12-17 | Xcounter Ab | Metod för reducering av högfrekvent brus i bilder med hjälp av medelvärdesbildning av pixlar och parvis addering av pixelpar som uppfyller ett villkor |
US7139711B2 (en) * | 2000-11-22 | 2006-11-21 | Defense Group Inc. | Noise filtering utilizing non-Gaussian signal statistics |
EP1376539B8 (en) | 2001-03-28 | 2010-12-15 | Mitsubishi Denki Kabushiki Kaisha | Noise suppressor |
US7013273B2 (en) * | 2001-03-29 | 2006-03-14 | Matsushita Electric Industrial Co., Ltd. | Speech recognition based captioning system |
CN1240051C (zh) | 2001-04-09 | 2006-02-01 | 皇家菲利浦电子有限公司 | 语音增强设备 |
US7136813B2 (en) * | 2001-09-25 | 2006-11-14 | Intel Corporation | Probabalistic networks for detecting signal content |
US7149684B1 (en) | 2001-12-18 | 2006-12-12 | The United States Of America As Represented By The Secretary Of The Army | Determining speech reception threshold |
US7096184B1 (en) * | 2001-12-18 | 2006-08-22 | The United States Of America As Represented By The Secretary Of The Army | Calibrating audiometry stimuli |
US6864104B2 (en) | 2002-06-28 | 2005-03-08 | Progressant Technologies, Inc. | Silicon on insulator (SOI) negative differential resistance (NDR) based memory device with reduced body effects |
DE10252946B3 (de) * | 2002-11-14 | 2004-07-15 | Atlas Elektronik Gmbh | Verfahren zur Unterdrückung des Rauschanteils eines Sensorsignals |
US6874796B2 (en) * | 2002-12-04 | 2005-04-05 | George A. Mercurio | Sulky with buck-bar |
JP4128916B2 (ja) | 2003-08-15 | 2008-07-30 | 株式会社東芝 | 字幕制御装置および方法ならびにプログラム |
US7720233B2 (en) * | 2003-09-02 | 2010-05-18 | Nec Corporation | Signal processing method and apparatus |
JP3909709B2 (ja) * | 2004-03-09 | 2007-04-25 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 雑音除去装置、方法、及びプログラム |
DE102004017486A1 (de) * | 2004-04-08 | 2005-10-27 | Siemens Ag | Verfahren zur Geräuschreduktion bei einem Sprach-Eingangssignal |
US7729456B2 (en) * | 2004-11-17 | 2010-06-01 | Via Technologies, Inc. | Burst detection apparatus and method for radio frequency receivers |
GB2422237A (en) * | 2004-12-21 | 2006-07-19 | Fluency Voice Technology Ltd | Dynamic coefficients determined from temporally adjacent speech frames |
US20060184363A1 (en) * | 2005-02-17 | 2006-08-17 | Mccree Alan | Noise suppression |
US20060206320A1 (en) * | 2005-03-14 | 2006-09-14 | Li Qi P | Apparatus and method for noise reduction and speech enhancement with microphones and loudspeakers |
WO2006104555A2 (en) * | 2005-03-24 | 2006-10-05 | Mindspeed Technologies, Inc. | Adaptive noise state update for a voice activity detector |
KR100745977B1 (ko) * | 2005-09-26 | 2007-08-06 | 삼성전자주식회사 | 음성 구간 검출 장치 및 방법 |
US20070100611A1 (en) * | 2005-10-27 | 2007-05-03 | Intel Corporation | Speech codec apparatus with spike reduction |
JP4863713B2 (ja) * | 2005-12-29 | 2012-01-25 | 富士通株式会社 | 雑音抑制装置、雑音抑制方法、及びコンピュータプログラム |
JP4753821B2 (ja) * | 2006-09-25 | 2011-08-24 | 富士通株式会社 | 音信号補正方法、音信号補正装置及びコンピュータプログラム |
ATE427589T1 (de) * | 2006-12-27 | 2009-04-15 | Abb Technology Ag | Verfahren zur bestimmung von kanalqualitat und modem |
KR20090122143A (ko) * | 2008-05-23 | 2009-11-26 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
KR20100006492A (ko) | 2008-07-09 | 2010-01-19 | 삼성전자주식회사 | 부호화 방식 결정 방법 및 장치 |
TWI355771B (en) | 2009-02-23 | 2012-01-01 | Acer Inc | Multiband antenna and communication device having |
EP2401872A4 (en) * | 2009-02-25 | 2012-05-23 | Conexant Systems Inc | SYSTEM AND METHOD FOR REDUCING SPEAKER DISTORTION |
FR2944640A1 (fr) * | 2009-04-17 | 2010-10-22 | France Telecom | Procede et dispositif d'evaluation objective de la qualite vocale d'un signal de parole prenant en compte la classification du bruit de fond contenu dans le signal. |
CN101599274B (zh) * | 2009-06-26 | 2012-03-28 | 瑞声声学科技(深圳)有限公司 | 语音增强的方法 |
EP2451359B1 (en) * | 2009-07-07 | 2017-09-06 | Koninklijke Philips N.V. | Noise reduction of breathing signals |
DE112009005215T8 (de) * | 2009-08-04 | 2013-01-03 | Nokia Corp. | Verfahren und Vorrichtung zur Audiosignalklassifizierung |
JP2011100029A (ja) * | 2009-11-06 | 2011-05-19 | Nec Corp | 信号処理方法、情報処理装置、及び信号処理プログラム |
JP5609157B2 (ja) * | 2010-02-26 | 2014-10-22 | ヤマハ株式会社 | 係数設定装置および雑音抑圧装置 |
CN103594094B (zh) * | 2012-08-15 | 2016-09-07 | 湖南涉外经济学院 | 自适应谱减法实时语音增强 |
US9231740B2 (en) | 2013-07-12 | 2016-01-05 | Intel Corporation | Transmitter noise in system budget |
WO2015191470A1 (en) * | 2014-06-09 | 2015-12-17 | Dolby Laboratories Licensing Corporation | Noise level estimation |
US10149047B2 (en) * | 2014-06-18 | 2018-12-04 | Cirrus Logic Inc. | Multi-aural MMSE analysis techniques for clarifying audio signals |
CN106199549B (zh) * | 2016-06-30 | 2019-01-22 | 南京理工大学 | 一种采用谱减法提升lfmcw雷达信噪比的方法 |
US10504538B2 (en) | 2017-06-01 | 2019-12-10 | Sorenson Ip Holdings, Llc | Noise reduction by application of two thresholds in each frequency band in audio signals |
CN118629417B (zh) * | 2024-08-13 | 2024-11-22 | 华中师范大学 | 一种多模态课堂教师教学言语行为分析方法及系统 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3370423D1 (en) * | 1983-06-07 | 1987-04-23 | Ibm | Process for activity detection in a voice transmission system |
EP0140249B1 (en) * | 1983-10-13 | 1988-08-10 | Texas Instruments Incorporated | Speech analysis/synthesis with energy normalization |
US4630305A (en) * | 1985-07-01 | 1986-12-16 | Motorola, Inc. | Automatic gain selector for a noise suppression system |
US5036540A (en) * | 1989-09-28 | 1991-07-30 | Motorola, Inc. | Speech operated noise attenuation device |
CA2040025A1 (en) * | 1990-04-09 | 1991-10-10 | Hideki Satoh | Speech detection apparatus with influence of input level and noise reduced |
FI92535C (fi) * | 1992-02-14 | 1994-11-25 | Nokia Mobile Phones Ltd | Kohinan vaimennusjärjestelmä puhesignaaleille |
DE4405723A1 (de) * | 1994-02-23 | 1995-08-24 | Daimler Benz Ag | Verfahren zur Geräuschreduktion eines gestörten Sprachsignals |
JP3484801B2 (ja) * | 1995-02-17 | 2004-01-06 | ソニー株式会社 | 音声信号の雑音低減方法及び装置 |
-
1994
- 1994-05-13 JP JP09986994A patent/JP3484757B2/ja not_active Expired - Lifetime
-
1995
- 1995-05-01 US US08/431,746 patent/US5668927A/en not_active Expired - Lifetime
- 1995-05-02 EP EP00120757A patent/EP1065657B1/en not_active Expired - Lifetime
- 1995-05-02 DE DE69531710T patent/DE69531710T2/de not_active Expired - Lifetime
- 1995-05-02 TW TW084104386A patent/TW262620B/zh not_active IP Right Cessation
- 1995-05-02 DE DE69522605T patent/DE69522605T2/de not_active Expired - Lifetime
- 1995-05-02 DE DE69529002T patent/DE69529002T2/de not_active Expired - Lifetime
- 1995-05-02 EP EP00120756A patent/EP1065656B1/en not_active Expired - Lifetime
- 1995-05-02 EP EP95303004A patent/EP0683482B1/en not_active Expired - Lifetime
- 1995-05-09 MY MYPI95001231A patent/MY121946A/en unknown
- 1995-05-12 CN CN95104844A patent/CN1113335A/zh active Pending
- 1995-05-13 KR KR1019950011826A patent/KR100335162B1/ko not_active IP Right Cessation
-
1996
- 1996-11-07 US US08/744,918 patent/US5974373A/en not_active Expired - Lifetime
- 1996-11-07 US US08/744,915 patent/US5771486A/en not_active Expired - Lifetime
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1584984B (zh) * | 2003-08-19 | 2010-05-26 | 微软公司 | 使用瞬时信噪比作为最优估计的主量的降噪方法 |
CN1841500B (zh) * | 2005-03-30 | 2010-04-14 | 松下电器产业株式会社 | 一种基于自适应非线性谱减的抗噪方法和装置 |
CN101859568B (zh) * | 2009-04-10 | 2012-05-30 | 比亚迪股份有限公司 | 一种语音背景噪声的消除方法和装置 |
CN105103218A (zh) * | 2013-02-08 | 2015-11-25 | 卷藤逻辑公司 | 环境噪声均方根(rms)检测器 |
CN105103218B (zh) * | 2013-02-08 | 2019-01-04 | 卷藤逻辑公司 | 环境噪声均方根(rms)检测器 |
CN106885971A (zh) * | 2017-03-06 | 2017-06-23 | 西安电子科技大学 | 一种用于电缆故障检测定点仪的智能背景降噪方法 |
CN106885971B (zh) * | 2017-03-06 | 2020-07-03 | 西安电子科技大学 | 一种用于电缆故障检测定点仪的智能背景降噪方法 |
CN112000047A (zh) * | 2020-09-07 | 2020-11-27 | 广东众科智能科技股份有限公司 | 一种远程智能化监控系统 |
CN113488032A (zh) * | 2021-07-05 | 2021-10-08 | 湖北亿咖通科技有限公司 | 车辆以及车辆用语音识别系统和方法 |
Also Published As
Publication number | Publication date |
---|---|
US5668927A (en) | 1997-09-16 |
EP1065656B1 (en) | 2003-09-03 |
DE69531710T2 (de) | 2004-07-15 |
JPH07306695A (ja) | 1995-11-21 |
EP0683482A3 (en) | 1997-12-03 |
DE69522605D1 (de) | 2001-10-18 |
EP1065656A3 (en) | 2001-01-10 |
EP0683482A2 (en) | 1995-11-22 |
EP0683482B1 (en) | 2001-09-12 |
KR950034057A (ko) | 1995-12-26 |
JP3484757B2 (ja) | 2004-01-06 |
EP1065657B1 (en) | 2002-11-27 |
EP1065657A1 (en) | 2001-01-03 |
TW262620B (en) | 1995-11-11 |
US5771486A (en) | 1998-06-23 |
DE69529002D1 (de) | 2003-01-09 |
EP1065656A2 (en) | 2001-01-03 |
DE69522605T2 (de) | 2002-07-04 |
MY121946A (en) | 2006-03-31 |
KR100335162B1 (ko) | 2002-09-27 |
US5974373A (en) | 1999-10-26 |
DE69529002T2 (de) | 2003-07-24 |
DE69531710D1 (de) | 2003-10-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1113335A (zh) | 降低语音信号中噪声的方法和检测噪声域的方法 | |
CN1282155C (zh) | 噪声抑制装置和方法 | |
CN1145931C (zh) | 降低语音信号中的噪声的方法和采用该方法的系统和电话机 | |
CN1083183C (zh) | 用来降低语音信号中噪声的方法和装置 | |
CN1193644C (zh) | 用频谱减少来降低双送话器信号噪声的系统和方法 | |
CN1223109C (zh) | 回波抑制系统中增强近端语音信号 | |
CN1110034C (zh) | 谱削减噪声抑制方法 | |
CN1171202C (zh) | 噪声抑制 | |
CN1302462C (zh) | 降噪装置和降噪方法 | |
CN1794757A (zh) | 一种电话及在该电话中处理音频信号的方法 | |
CN101031963A (zh) | 处理有噪声的声音信号的方法以及实现该方法的装置 | |
CN1192360C (zh) | 噪声抑制装置 | |
CN1488136A (zh) | 噪声减少的方法和装置 | |
CN1918461A (zh) | 在存在背景噪声时用于语音增强的方法和设备 | |
CN1146155C (zh) | 噪声抑制装置 | |
CN1140869A (zh) | 用于降低噪声的方法 | |
CN1223991C (zh) | 声频信号处理设备及方法 | |
CN1185620C (zh) | 声音合成装置和方法以及电话装置 | |
CN1620751A (zh) | 声音增强系统 | |
CN1451225A (zh) | 用于消除收发信机单元中回波的回波消除设备 | |
CN1281576A (zh) | 声音信号加工方法和声音信号加工装置 | |
CN1220177C (zh) | 话音解码装置和编码差错补偿方法 | |
CN1746973A (zh) | 分布式语音识别系统和方法 | |
CN1669074A (zh) | 话音增强装置 | |
CN1261713A (zh) | 接收装置和方法,通信装置和方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |