CN1134768C - 由时域频谱相减进行信号噪声减小的电话机、处理器及方法 - Google Patents
由时域频谱相减进行信号噪声减小的电话机、处理器及方法 Download PDFInfo
- Publication number
- CN1134768C CN1134768C CNB008088667A CN00808866A CN1134768C CN 1134768 C CN1134768 C CN 1134768C CN B008088667 A CNB008088667 A CN B008088667A CN 00808866 A CN00808866 A CN 00808866A CN 1134768 C CN1134768 C CN 1134768C
- Authority
- CN
- China
- Prior art keywords
- gain function
- time
- spectral substraction
- noise
- processor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000003595 spectral effect Effects 0.000 title claims abstract description 110
- 238000000034 method Methods 0.000 title claims abstract description 21
- 230000009467 reduction Effects 0.000 title description 5
- 238000001914 filtration Methods 0.000 claims abstract description 36
- 238000004891 communication Methods 0.000 claims description 16
- 238000006243 chemical reaction Methods 0.000 claims description 14
- 230000009466 transformation Effects 0.000 claims description 7
- 230000003111 delayed effect Effects 0.000 claims description 5
- 238000012545 processing Methods 0.000 abstract description 22
- 230000001934 delay Effects 0.000 abstract 1
- 230000006870 function Effects 0.000 description 151
- 238000001228 spectrum Methods 0.000 description 38
- 230000000694 effects Effects 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 9
- 206010038743 Restlessness Diseases 0.000 description 8
- 230000008901 benefit Effects 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 6
- 238000012935 Averaging Methods 0.000 description 4
- 230000006835 compression Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 230000001364 causal effect Effects 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000033228 biological regulation Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000005309 stochastic process Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 230000005534 acoustic noise Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000001143 conditioned effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephone Function (AREA)
- Noise Elimination (AREA)
- Image Processing (AREA)
Abstract
为了抑制噪声,通过使用在频域中按块地计算的频谱相减增益函数的时域表示式而在时域中按样本方式执行频谱相减滤波。通过按逐个样本的原则连续地执行时域滤波,所公开的方法和设备避免了与基于频域的频谱相减系统有关的方块处理延时。因此,公开的方法和设备特别适用于需要非常短的处理延时的应用项。而且,因为频谱相减增益函数是在频域以方块方式计算的,所以,在减小的人工声音和低的信号失真方面得到高质量的性能。
Description
相关专利申请
本发明涉及1998年5月27日提交的、题目为“Signal NoiseReduction by Spectral Subtraction using Linear Convolutionand Causal Filtering(通过使用线性卷积和因果滤波的频谱相减的信号噪声减小)”的、未决的美国专利申请序列号No.09/084,387。本发明也涉及1998年5月27日提交的、题目为“Signal Noise Reductionby Spectral Subtraction using Spectrum Dependent ExponentialGain Function Averaging(通过使用取决于频谱的指数增益函数平均的频谱相减的信号噪声减小)”的、未决的美国专利申请序列号No.09/084,503。
发明领域
本发明涉及通信系统,更具体地,涉及用于减轻通信信号中破坏性背景噪声分量的影响。
发明背景
今天的通信是在各种各样的潜在的破坏性环境下进行的,所以,常常配备现代化通信解决方案来补偿这样的环境。例如,在典型的地面线路或移动电话中的话筒常常不单拾取近端电话用户的话音,也拾取可能存在的、周围的近端背景噪声。这在办公室和汽车的免提解决方案的情况下,特别是如此。由于这样的背景噪声对于远端用户来说是骚扰的,甚至是不可容忍的,许多今天的电话都配备有噪声减小处理器,它试图抑制背景噪声,而同时许可讲话人的话音不失真地传送通过。这样的噪声减小处理器常常是基于熟知的频谱减小技术,其中嘈杂的语音信号的频谱内容被分析,以及具有很差的信号噪声比的那些频率分量被衰减。例如,参阅S.F.Boll,“Suppression of AcousticNoise in Speech using Spectral Subtraction(使用频谱相减来抑制语音中的声音噪声)”,IEEE Trans.Acoust.Speech and Sig.Proc.,27:113-120,1979。
当实施噪声减小处理器时,重要的是使得可能被引入的任何人为声音或延时最小化,因为这样的人为声音和延时对于远端用户就像背景噪声一样讨厌。因此,以上引用的专利申请公开了频谱相减噪声减小系统,它比起传统的频谱相减技术,引入的信号失真低。具体地,未决的专利申请09/084,387公开了基于方块的频谱相减噪声减小处理器,其中使用减小变化的、减小分辨率的增益函数滤波器在频域中实行信号滤波。优点在于,增益函数的阶数被选择使得频域滤波相应于在时域中真正的非圆环卷积,以及相位被加到增益函数,以使得增益函数是因果的。结果,所公开的噪声减小处理器比起传统的频谱相减技术引入更少的人为声音和更少的方块间不连续性。而且,未决专利申请09/084,503公开了用于进一步减小滤波增益函数的变化和由此进一步减小人为声音的引入的技术。具体地,滤波器增益函数在方块中被平均,例如取决于在带有噪声的语音信号的谱密度和单独噪声的谱密度之间的测量偏差。
虽然专利申请09/084,387和09/084,503的频域频谱相减滤波技术在基于块的系统方面(即,诸如熟知的全球移动通信系统或GSM,其中信号按定义是逐个样本块被处理的)工作得特别好,但是与这些技术有关的方块处理技术可能不适合于需要极短的信号处理延时的应用项。例如,在有线电话系统,最大可容忍的信号延时可以是短到2ms(相应于标准8kHz电话采样速率时16个样本)。因此,需要一种用于通过频谱相减执行噪声减小的方法和设备。
在美国专利No.4,630,305中,描述了结合噪声抑制系统使用的自动增益选择器,对于在输入端可提供的、具有噪声的语音信号通过频谱增益修正执行语音质量改进,在输出端产生噪声抑制的语音信号。信道增益控制器产生修正的信号,包括各个信道增益值,以便应用到信道增益修正器。由选择器开关和噪声电平量化器根据多信道噪声参量,诸如输入信号的总的平均背景噪声电平,在多个增益表之一中自动选择特定的增益表组。
发明概要
本发明通过提供噪声减小技术来满足上述的和其它的需要,其中通过使用在频域中以方块的方式计算的频谱相减增益函数的时域表示式而在时域中以样本方式执行频谱相减滤波。通过按逐个样本的原则连续地执行时域滤波,所公开的方法和设备可以避免与基于频域的频谱相减系统有关的方块处理延时。结果,公开的方法和设备特别适用于需要非常短的处理延时的应用项。而且,因为频谱相减增益函数是在频域以方块方式计算的(例如,使用以上引用的共同未决的专利申请09/084,387和09/084,503的技术),在减小的人工声音和低的信号失真方面得到高的质量性能。在其中只存在稳定的、低能量的背景噪声的应用项中,计算复杂性可以通过在初始化时间间隔期间产生多个分开地频谱相减增益函数而被减小,每个增益函数适合于几种预定的类别的输入信号中的一种(例如,适合于几个预定的信号能量范围中的一个范围),此后固定几个增益函数,直至输入信号特性改变为止。
在示例性实施例中,噪声减小处理器包括时域滤波器,用来把带有噪声的输入信号与时域频谱相减增益函数进行卷积,提供噪声减小的输出信号,频谱相减增益函数处理器,用来计算频域频谱相减增益函数作为带有噪声的输入信号的函数,以及变换处理器,用来通过变换频域频谱相减增益函数而提供时域频谱相减增益函数。优点是,时域滤波器可以连续地把带有噪声的输入信号与占优势的时域频谱相减增益函数进行卷积,以及占优势的时域频谱相减增益函数可以由变换处理器周期地更新。结果,示例的噪声减小处理器可以提供在带有噪声的输入信号和噪声压缩的输出信号之间的极短的延时。而且,带有噪声的输入信号的样本可以在与卷积之前被延时,以使得噪声压缩的输出信号的声音质量可被调节。另外,最小相位可被加到频域频谱相减增益函数,以便提供具有短的延时的因果的时域滤波器。
根据本发明的另一实施例,提供一种抑制通信信号的噪声分量的方法,包括以下步骤:把通信信号与时域频谱相减增益函数进行卷积,提供噪声减小的输出信号;计算频域频谱相减增益函数,作为通信信号的函数;以及变换频域频谱相减增益函数,以便提供时域频谱相减增益函数。其中通信信号与占优势的时域频谱相减增益函数连续地进行卷积,以及其中占优势的时域频谱相减增益函数被周期地更新。另外,在把通信信号的样本与时域频谱相减增益函数进行卷积之前,延时该通信信号样本。该方法可以还包括在变换频域频谱相减增益函数之前,把最小相位加到频域频谱相减增益函数。以及,变换频域频谱相减增益函数的步骤包括计算反快速富立叶逆变换的步骤。
根据本发明的再另一实施例,提供一种电话机,包括:话筒,接收近端声音并提供相应的近端信号;以及频谱相减噪声减小处理器,用来抑制近端信号的噪声分量,所述频谱相减处理器包括:时域滤波器,用来把近端信号与时域频谱相减增益函数进行卷积,频谱相减增益函数处理器,用来计算频域频谱相减增益函数,作为近端信号的函数;以及变换处理器,用来通过变换频域频谱相减增益函数而提供时域频谱相减增益函数。其中所述时域滤波器把近端信号与占优势的时域频谱相减增益函数连续地进行卷积,以及其中占优势的时域频谱相减增益函数被所述变换处理器周期地更新。此外,其中近端信号的样本在与时域频谱相减增益函数进行卷积之前被延时。其中最小相位在频域频谱相减增益函数被变换之前被加到频域频谱相减增益函数。变换处理器通过计算反快速富立叶逆变换而变换频域频谱相减增益函数。
后面参照如附图所示的说明性例子详细地解释本发明的上述的和其它的特性和优点。本领域技术人员将会看到,所描述的实施例是为了说明和理解而提供的,以及在这里预料有多个等价的实施例。
附图简述
图1是按照本发明的示例性噪声减小系统的方框图。
图2是可以在图1的系统中使用的示例性频谱相减增益函数处理器的方框图。
图3是按照本发明的另一个噪声减小系统的方框图。
图4是在图3的系统中可以使用的示例性增益函数处理器的方框图。
发明详细描述
图1显示按照本发明的示例性噪声减小系统100。如图所示,示例性系统100包括延时缓存器110,帧缓存器120,频域频谱相减增益函数处理器130,快速富立叶逆变换(IFFT)处理器140,以及时域频谱相减滤波器150。本领域技术人员将会看到,以下描述的、图1的系统100的各个方块的功能实际上可以通过使用任何的各种各样的已知的硬件配置被实施,包括通用数字计算机,标准数字信号处理部件和一个或多个专用集成电路。
在图1上,带有噪声的语音信号x(n)被耦合到延时缓存器110的输入端和帧缓存器120的输入端。延时缓存器110的输出端被耦合到时域频谱相减滤波器150的信号输入端,以及帧缓存器120的输出端被耦合到频域频谱相减增益函数处理器130的信号输入端。增益函数处理器130的输出端被耦合到IFFT处理器140的输入端,以及IFFT处理器140的输出端被耦合到时域滤波器150的增益函数输入端。滤波器150提供噪声压缩的语音信号y(n)。
在运行时,带有噪声的语音信号x(n)(例如,包括近端背景噪声的近端话筒信号)的接连的样本被馈送到延时缓存器110和帧缓存器120。帧缓存器120收集进入的样本,以及把它们一次一帧地传送到增益函数处理器130(其中一帧被理解为整数L个接连的信号样本的集合)。另外,延时缓存器110把可调节的零的延时引入到L个样本,和把延时的样本一次一个地传送到时域频谱相减滤波器150。频谱相减滤波器150把延时的样本与占优势的时域频谱相减增益函数(其中M是整数的子帧的长度,以及i是整数帧的计数,如下面详细地描述的)连续地进行卷积,提供噪声减小的语音信号y(n)。M-样本时域增益函数
所以可被看作为时域滤波器150的冲击函数,正如已有技术中熟知的。
按照本发明,时域增益函数
由增益函数处理器130和IFFT处理器140按每帧地被计算。更具体地,对于每个帧i,增益函数处理器130使用帧样本xL(i)来计算M频率片频域频谱相减增益函数(正如下面详细描述的),以及IFFT处理器140把频域增益函数
变换成相应的时域增益函数
然后它被使用来更新时域滤波器150的冲击响应(即,先前存在的滤波器系数
用信道计算的系数
代替)。然而,因为滤波器150通过使用占优势的增益函数连续地运行在带有噪声的语音样本,在噪声压缩的输出y(n)与带有噪声的输入x(n)之间的延时仅仅由延时缓存器110和滤波器确定,而不是由帧缓存器120、增益函数处理器130或IFFT处理器140确定。
图1的示例性系统100的上述的运行与频谱相减系统的运行(诸如在以上引用的专利申请09/084,387和09/084,503中描述的那样)(其中滤波是在频域上实行的)相对照。在这样的系统中,一帧带有噪声的语音样本的频域表示式被乘以频域增益函数(相应于在时域中的卷积),提供噪声减小输出信号的频域代表,然后它被变换回时域。结果,在带有噪声的语音信号x(n)的相应的样本与噪声减小的输出信号y(n)之间的延时是多到一个帧周期(因为在输入帧的所有样本一起被处理,提供相应的输出帧)加上总的帧的处理时间(即,把一帧带有噪声的语音样本从时域变换到频域所需要的时间,然后计算频域增益函数,实行频域乘法,以及把结果变换回时域)。
优点是,图1的示例性系统许可信号延时对于给予特定的应用项最好的结果被设置。例如,在其中信号延时不太关键的应用项中,延时缓存器110可被设置为引入一个帧周期的延时,这样,带有噪声的语音信号x(n)的每个样本通过使用根据该样本计算的增益函数来被滤波。这样做使得图1的系统100的运行等价于以上引用的专利申请09/084,387和09/084,503的运行,以及提供最佳声音质量。另外,在其中信号延时是关键的应用项中,延时缓存器110可被设置为引入很小的或不引入延时,这样,带有噪声的语音信号x(n)的每个样本通过使用根据最近的以前的样本计算的增益函数来被滤波。虽然声音质量可能轻微地降低,但得到极短的信号延时。在声音质量与信号延时之间的折衷将是对于每个特定的应用项的设计选择的问题。
为了确保由滤波器150执行的时域滤波等价于频域滤波,在构建频域频谱相减增益函数
时必须当心。用于构建频域增益函数的方法(即,用于实施图1的增益函数处理器130)在以上引用的专利申请09/084,387和09/084,503中详细描述。概略地,频谱相减是基于语音信号和背景噪声信号是随机的,不相关的,以及相加在一起形成带有噪声的语音信号x(n)的假定作出的。换句话说,如果s(n),w(n)和x(n)分别是代表语音,噪声和带有噪声的语音的短时间平稳随机过程,则:
x(n)=s(n)+w(n)和
Rx(f)=Rs(f)+Rw(f),
其中f∈[0,N-1]是相应于一个频率片的离散变量,以及R(·)(f)表示随机过程的功率谱密度。
短时间谱密度然后通过使用熟知的巴特利特(Bartlett)方法如下地被估值:
其中xL,P(i)是第i个L长度的帧,每个带有M个数据样本的子帧p。这个计算方法减少变量以及最后得到的频谱的频率分辨率。实际上,在变量减少与分辨率之间的折衷是设计选择的问题,以及实验表明,M=64频率片的分辨率典型地提供合格的结果。
其中是指数平均时间常数。为了检测语音暂停,可以使用话音活动检测器(VAD),正如技术上熟知的。
用于频域增益函数的表示式然后被给出为:
其中k控制相减的程度,以及a控制使用幅度频谱相减还是使用功率频谱相减。参量k和a的组合因此控制噪声减小的总量。
为了进一步减小增益函数的可变性,原始的频域增益函数GM(f,i)可自适应地被平均,产生平滑的频域增益函数
GM(f,i)。例如,自适应可以做成取决于在噪声谱与带有噪声的语音的谱之间的频谱偏差。这样做趋向于增加平均值,因为输入信号变为更平稳,由此提供对于平稳的噪声和低能量语音的增益函数的减小的可变性。
为了实施具有短延时的因果滤波器,最小相位可被施加到计算的零相位增益函数
GM(f,i),以便产生最后的频域增益函数
(f,i)。这可以通过使用Hilbert(希尔伯特)变换关系式被实施。例如,参阅A.V.Oppenheim和R.W.Schafer,“Discrete-Time SignalProcessing(离散时间信号处理)”,Prentice-Hal1,Inter.Ed.,1989.
上述的频域增益函数
(f,i)的计算显示于图2,其中示例性频域增益函数处理器200被显示为包括话音活动检测器210,频谱估值处理器220,噪声平均处理器230,频域增益函数计算处理器240,频谱偏差分析器250,自适应平均处理器260,和相位处理器2 70。图2的示例性增益函数处理器200可被使用来实施图1的频域增益函数处理器130。本领域技术人员将会看到,下面描述的、图2的系统200的各个方块的功能实际上可以通过使用任何的各个已知的硬件配置被实施,包括通用数字计算机,标准数字信号处理部件和一个或多个专用集成电路。
在图2上,带有噪声的语音样本的帧被输入到频谱估值处理器220的输入端,以及频谱估值处理器220的输出端在话音活动检测器210的控制下被切换地耦合到噪声平均处理器230的输入端。频谱估值处理器220的输出也被耦合到每个增益函数计算处理器和频谱偏差处理器250的输入端,正如是噪声平均处理器230的输出。增益函数计算处理器和频谱偏差处理器250的输出被耦合到自适应平均处理器260的各个输入端,以及自适应平均处理器260的输出被耦合到相位处理器270的输入端。相位处理器270提供频域增益函数(例如,用于输入到图1的IFFT处理器140)。
在运行时,频谱估值处理器220产生带有噪声的语音信号x(n)的第i帧的频谱密度的M-长度的估值
Px,M(f,i)。另外,在语音暂停期间,话音活动检测器210把频谱估值处理器220的输出耦合到噪声平均处理器230,以及噪声平均处理器平均(例如,使用指数平均)带有噪声的语音频谱估值。因为在语音暂停期间频谱估值处理器230的输出是单独噪声的频谱密度的估值,噪声平均处理器230提供背景噪声w(n)的频谱密度的平均估值
Pw,M(f,i)。
增益函数计算处理器240然后使用带有噪声的语音频谱估值Px,Af(f,i)和平均噪声频谱估值
Pw,M(f,i),结合以上规定的、实验确定的参量a和k,计算原始的频域增益函数GM(f,i)。另外,频谱偏差处理器250确定频谱估值
Px,M(f,i),
Pw,M(f,i)之间相差度,该相差度被自适应平均处理器260使用来平均(例如,使用带有可变存储器的指数平均)原始的增益函数GM(f,i),以便提供平均的,或平滑的增益函数GM(f,i)(参阅以上引用的专利申请09/084,387和09/084,503,进一步详细描述基于频谱偏差的增益函数平均的实施和优点)。此后,相位处理器270施加最小相位在平均的增益函数
GM(f,i)上,以便提供最后的频域增益函数
(再次地,参阅以上引用的专利申请09/084,387和09/084,503,进一步详细描述基于频谱偏差的增益函数平均的实施和优点)。
一旦最后的频域增益函数
被计算,它就被变换(例如,通过图1的IFFT处理器140),提供更新的时域增益函数
(例如,对于图1的滤波器150)。如上所述,噪声减小的输出信号y(n)是通过把带有噪声的信号x(n)与占优势的时域增益函数
进行卷积而得出的:
实验研究表明,观察到的滤波延时典型地在0到8个样本的范围中,其中延时被规定为滤波器沿着时间轴的质量中心(因为群延时测量不能被使用于宽带语音信号)。K=0.7,a=1,L=256和M=64的参量设置给出约10dB的噪声减小。
虽然上述的技术在计算上并不复杂,但在预期只有相当低的能量的噪声的情形下,复杂性可以进一步减小。具体地,当平稳的低的能量的噪声干扰语音信号时,实验研究表明,只需要小的数目的固定的增益函数来提供良好的语音质量。换句话说,有限的数目的增益函数之一,每个增益函数被特定地定做用于相等数目的预定的信号类别中的一个信号类别(例如,根据相应于高的能量的说话声音,摩擦而生的声音,停止声音等等的信号能量电平),可以根据占优势的信号类别的决定动态地被选择。因此,本发明提供用于建立或提取适当的固定滤波器增益函数组的方法和设备。
通常,在处理器初始化时间间隔期间,上述的增益函数计算技术被使用来产生固定的滤波器增益函数。更具体地,对于在初始化时间间隔期间的每个帧,带有噪声的语音信号被分类,研究被分配使用于该信号类别的增益函数被训练或被更新(例如,通过用带有如上所述地计算的增益函数的指数平均)。在初始化时间间隔结束时(例如,当小的迭代改变表示被分配给每个类别的增益函数已达到合理的稳定状态),增益函数被冻结,此后,被选择地使用来滤波带有噪声的语音信号。换句话说,对于每个初始化后的帧,带有噪声的语音信号被分类,以及相应的固定的滤波器增益函数被使用来滤波带有噪声的语音。
优点在于,只在信号特性改变时(即,当背景噪声改变时),固定的滤波器增益函数才需要被重新训练,或被提取。这样的噪声改变在语音暂停期间通过噪声形状的伪随机测试(例如,通过监视噪声的幅度谱估值的改变)被检测。替换地,当在当前选择的固定的增益函数与动态计算的增益函数(例如,通过使用上述的技术计算的)之间检测到太大的偏差时,固定的滤波器可以通过重新开始平均而被重新提取。而且,固定的滤波器可以通过以某个预定的或可变的速率(例如,每秒太多的事例)再继续平均函数而被重新提取。
信号分类可以以多种方式来实行。例如,带有噪声的语音信号可变分类为属于几种预定的能量级别区域之一。如果是这样的话,带有噪声的语音信号x(n)可以如下地通过指数平均而被计算:
e(n)=e(n-1)·γ+x(n)2·(1-γ),其中是平均时间常数或存储器。信号能量类别eclass(n)然后被确定为:
在初始化期间,每个每类别增益函数
GM(f,t,i)(t∈[0,T])然后可在频域中被平均为:
GM(f,t,i)=
GM(f,t,i-1)·δ1+GM(f,i)·(1-δ1),其中δt是每类别平均时间常数,以及GM(f,i)是上述的原始频域增益函数。
在初始化后,当检测到其分配用于的信号类别时,特定的固定滤波器
GM(f,t,i)被选择。为了使得滤波的延时最小化,如上所述地,把最小相位施加到该滤波器上,提供最后的频域滤波器
最后的频域滤波器
被变换成时域,提供想要的时域滤波器
上述的固定滤波器技术可以通过使用图3的示例的噪声减小系统300被实施。如图所示,系统300包括图1的帧缓存器120,IFFT处理器140和时域频谱相减滤波器150,以及信号分类处理器305和另一个频谱相减增益函数处理器330。本领域技术人员将会看到,以下描述的、图3的系统300的各个方块的功能实际上可以通过使用任何的各种各样的已知的硬件配置被实施,包括通用数字计算机,标准数字信号处理部件和一个或多个专用集成电路。
在图3上,带有噪声的语音信号x(n)被耦合到帧缓存器120、信号分类处理器305、和时域滤波器150的输入端。帧缓存器120和信号分类处理器305的输出被耦合到另一个增益函数处理器330的输入端,以及增益函数处理器的输出被耦合到IFFT处理器140的输入端。IFFT处理器140的输出被耦合到时域滤波器150的增益函数输入端,以及时域滤波器150提供噪声抑制的输出信号y(n)。
在高的电平下,图3的系统300非常像图1的系统100。具体地,时域滤波器150继续处理具有噪声的语音信号的样本,而同时帧缓存器120收集带有噪声的语音样本,然后把它们一次一帧地传送到增益函数处理器330。增益函数处理器330按帧的方式计算频域增益函数以及IFFT处理器140把频域增益函数提供时域增益函数被使用来更新时域滤波器150的抽头。然而,不像图1的系统100那样,图3的系统300使用信号分类处理器305来确定哪些预定的类别最好地描述当前的带有噪声的语音样本(例如,按照上述的能量类别分类方案)。信号分类处理器305然后提供类别号(即,t∈[0,T])给增益函数处理器330,在如上所述地按帧地计算频域增益函数
中使用(即,通过在初始化时间间隔期间提取T个固定的滤波器,以及此后根据信号分类处理器的输出来选择T个固定的滤波器的适当的滤波器)。
图4显示可被使用来实施图3的增益函数处理器的示例性频域增益函数处理器400。如图所示,处理器400包括图2的话音活动检测器210,频谱估值处理器220,噪声平均处理器230,增益函数计算处理器240,和相位处理器270以及多个滤波器提取器405和相等数目的滤波器平均处理器415。本领域技术人员将会看到,下面描述的、图4的系统400的各个方块的功能实际上可以通过使用任何的各个已知的硬件配置被实施,包括通用数字计算机,标准数字信号处理部件和一个或多个专用集成电路。
在图4上,带有噪声的语音样本的帧被输入到频谱估值处理器220的输入端,以及频谱估值处理器220的输出端在话音活动检测器210的控制下被切换地耦合到噪声平均处理器230的输入端。频谱估值处理器220的输出也被耦合到增益函数计算处理器240的输入端,正如是噪声平均处理器230的输出。增益函数计算处理器的输出被可切换地耦合到几个滤波器提取器405之一(例如,取决于图3的信号分类处理器305的输出),以及每个滤波器提取器405的输出被耦合到几个平均处理器415中各个平均处理器的输入端。相位处理器270的输入端被选择地耦合到平均处理器之一的输出端(例如,也取决于图3的信号分类处理器305的输出),以及相位处理器270提供频域增益函数作为输出。
在运行时,话音活动检测器210,频谱估值处理器220,噪声平均处理器230,和增益函数计算处理器240如上面参照图2的系统所描述的那样起作用。然而,在图4的系统中,并不使用取决于频谱的指数增益函数平均在帧上平滑原始的频域增益函数。而是在初始化期间使用瞬时频域增益函数GM(f,i)来更新如上所述的、选择的一个(例如,由信号分类处理器305提供的信号类别号t所表示的)每类别的增益函数405。
具体地,与选择的滤波器405有关的平均处理器415用先前存在的选择滤波器增益函数
GM(f,t,i-1)来指数平均瞬时频域增益函数GM(f,t,i),提供更新的选择滤波器增益函数
GM(f,t,i)。因此,在初始化时间间隔结束时,处理器400已提取T个固定的增益函数GM(f,t,i)以及进一步的更新被冻结,除非背景噪声的特性改变。在初始化后,适当的固定的滤波器增益函数
GM(f,t,i)仅仅按照由信号分类处理器305提供的信号类别号被选择。
在初始化期间和以后,相位处理器270加上最小相位,正如上面参照图2描述的,提供最后的频域增益函数
最后的频域增益函数
然后被变换(例如,通过图3的IFFT处理器140),提供更新的时域增益函数
(例如,对于图3的滤波器150)。像前面一样,通过把带有噪声的语音信号x(n)与占优势的时域增益函数进行卷积,得出噪声减小的输出信号y(n),以及在输入和输出之间的信号延时是低的(典型地,约8个样本)。
总之,本发明提供通过频谱相减执行短的延时的噪声抑制的方法和设备。在示例性实施例中,通过使用在频域中按帧的方式被计算的频谱相减增益函数的时域代表,而在时域中按样本的方式执行信号滤波。最小相位在变换到时域以前被加到频域增益函数,这样,相应的时域增益函数是因果的,以及引入最小的滤波延时。结果是良好的声音质量的噪声减小,具有约10dB的典型的信号噪声比(SNR)改进和约8个样本的典型的引入的延时。这样的延时在有线电话系统中可允许的延时的范围内是很好的。计算复杂性在低的能量、长的时间的平稳噪声环境中可以通过提取和利用一组固定的滤波器而被减小。在这样的情形下,信号噪声比改进典型地约为6-10dB,具有良好的声音质量,以及引入的延时再次约为8个样本。
本领域技术人员将会看到,本发明并不限于为了说明目的描述的特定的示例性实施例,以及也预期有多种替换的实施例。例如,虽然本发明是结合免提电话应用项方面描述的,但本领域技术人员将会看到,本发明的教导同样可应用于任何的、希望抑制特定的信号分量的信号处理应用中。所以,本发明的范围由附属权利要求限定,而不是由以上的说明规定,以及与权利要求的意义一致的所有的等价物都打算被包括在内。
Claims (15)
1.一种噪声减小处理器,其特征在于:
时域滤波器(150),用来把带有噪声的输入信号与时域频谱相减增益函数进行卷积,提供噪声减小的输出信号;
频谱相减增益函数处理器(130),用来计算频域频谱相减增益函数,作为带有噪声输入信号的函数;以及
变换处理器(140),用来通过变换频域频谱相减增益函数而提供时域频谱相减增益函数。
2.按照权利要求1的噪声减小处理器,
其中所述时域滤波器把带有噪声的输入信号与占优势的时域频谱相减增益函数连续地进行卷积,以及
其中占优势的时域频谱相减增益函数被所述变换处理器周期地更新。
3.按照权利要求1的噪声减小处理器,
其中带有噪声的输入信号的样本在与时域频谱相减增益函数进行卷积之前被延时。
4.按照权利要求1的噪声减小处理器,其中最小相位在频域频谱相减增益函数被变换之前被加到频域频谱相减增益函数。
5.按照权利要求1的噪声减小处理器,其中所述变换处理器通过计算反快速富立叶逆变换而变换频域频谱相减增益函数。
6.一种抑制通信信号的噪声分量的方法,其特征在于以下步骤:
把通信信号与时域频谱相减增益函数进行卷积(150),提供噪声减小的输出信号;
计算(130)频域频谱相减增益函数,作为通信信号的函数;以及
变换(140)频域频谱相减增益函数,以便提供时域频谱相减增益函数。
7.按照权利要求6的方法,
其中通信信号与占优势的时域频谱相减增益函数连续地进行卷积,以及
其中占优势的时域频谱相减增益函数被周期地更新。
8.按照权利要求6的方法,还包括以下步骤:
在把通信信号的样本与时域频谱相减增益函数进行卷积之前,延时该通信信号样本。
9.按照权利要求6的方法,还包括以下步骤:
在变换频域频谱相减增益函数之前,把最小相位加到频域频谱相减增益函数。
10.按照权利要求6的方法,其中所述变换频域频谱相减增益函数的步骤包括计算反快速富立叶逆变换的步骤。
11.一种电话机,包括:
话筒,接收近端声音并提供相应的近端信号;以及
频谱相减噪声减小处理器,用来抑制近端信号的噪声分量,所述频谱相减处理器的特征在于:
时域滤波器(150),用来把近端信号与时域频谱相减增益函数进行卷积,
频谱相减增益函数处理器(130),用来计算频域频谱相减增益函数,作为近端信号的函数;以及
变换处理器(140),用来通过变换频域频谱相减增益函数而提供时域频谱相减增益函数。
12.按照权利要求11的电话机,
其中所述时域滤波器把近端信号与占优势的时域频谱相减增益函数连续地进行卷积,以及
其中占优势的时域频谱相减增益函数被所述变换处理器周期地更新。
13.按照权利要求11的电话机,
其中近端信号的样本在与时域频谱相减增益函数进行卷积之前被延时。
14.按照权利要求11的电话机,其中最小相位在频域频谱相减增益函数被变换之前被加到频域频谱相减增益函数。
15.按照权利要求11的电话机,其中所述变换处理器通过计算反快速富立叶逆变换而变换频域频谱相减增益函数。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/289,555 US6507623B1 (en) | 1999-04-12 | 1999-04-12 | Signal noise reduction by time-domain spectral subtraction |
US09/289555 | 1999-04-12 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1355916A CN1355916A (zh) | 2002-06-26 |
CN1134768C true CN1134768C (zh) | 2004-01-14 |
Family
ID=23112036
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB008088667A Expired - Fee Related CN1134768C (zh) | 1999-04-12 | 2000-04-03 | 由时域频谱相减进行信号噪声减小的电话机、处理器及方法 |
Country Status (7)
Country | Link |
---|---|
US (1) | US6507623B1 (zh) |
JP (1) | JP2002541529A (zh) |
CN (1) | CN1134768C (zh) |
AU (1) | AU3817600A (zh) |
DE (1) | DE10084459T1 (zh) |
MY (1) | MY124031A (zh) |
WO (1) | WO2000062281A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1727860B (zh) * | 2004-06-15 | 2010-05-05 | 微软公司 | 语音噪音抑制方法和语音噪音抑制器 |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE10017646A1 (de) * | 2000-04-08 | 2001-10-11 | Alcatel Sa | Geräuschunterdrückung im Zeitbereich |
US7844059B2 (en) * | 2005-03-16 | 2010-11-30 | Microsoft Corporation | Dereverberation of multi-channel audio streams |
US7599430B1 (en) * | 2006-02-10 | 2009-10-06 | Xilinx, Inc. | Fading channel modeling |
US20110098583A1 (en) * | 2009-09-15 | 2011-04-28 | Texas Instruments Incorporated | Heart monitors and processes with accelerometer motion artifact cancellation, and other electronic systems |
US8085941B2 (en) * | 2008-05-02 | 2011-12-27 | Dolby Laboratories Licensing Corporation | System and method for dynamic sound delivery |
JP5245714B2 (ja) * | 2008-10-24 | 2013-07-24 | ヤマハ株式会社 | 雑音抑圧装置及び雑音抑圧方法 |
JP5654955B2 (ja) * | 2011-07-01 | 2015-01-14 | クラリオン株式会社 | 直接音抽出装置および残響音抽出装置 |
CN105931649A (zh) * | 2016-03-31 | 2016-09-07 | 欧仕达听力科技(厦门)有限公司 | 基于频谱分析的超低时延音频处理方法与系统 |
US10880427B2 (en) | 2018-05-09 | 2020-12-29 | Nureva, Inc. | Method, apparatus, and computer-readable media utilizing residual echo estimate information to derive secondary echo reduction parameters |
US12062369B2 (en) * | 2020-09-25 | 2024-08-13 | Intel Corporation | Real-time dynamic noise reduction using convolutional networks |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4630305A (en) | 1985-07-01 | 1986-12-16 | Motorola, Inc. | Automatic gain selector for a noise suppression system |
US4658426A (en) * | 1985-10-10 | 1987-04-14 | Harold Antin | Adaptive noise suppressor |
US4853903A (en) | 1988-10-19 | 1989-08-01 | Mobil Oil Corporation | Method and apparatus for removing sinusoidal noise from seismic data |
FR2726392B1 (fr) * | 1994-10-28 | 1997-01-10 | Alcatel Mobile Comm France | Procede et dispositif de suppression de bruit dans un signal de parole, et systeme avec annulation d'echo correspondant |
US5687243A (en) | 1995-09-29 | 1997-11-11 | Motorola, Inc. | Noise suppression apparatus and method |
US6122610A (en) * | 1998-09-23 | 2000-09-19 | Verance Corporation | Noise suppression for low bitrate speech coder |
-
1999
- 1999-04-12 US US09/289,555 patent/US6507623B1/en not_active Expired - Lifetime
-
2000
- 2000-04-03 DE DE10084459T patent/DE10084459T1/de not_active Withdrawn
- 2000-04-03 CN CNB008088667A patent/CN1134768C/zh not_active Expired - Fee Related
- 2000-04-03 JP JP2000611269A patent/JP2002541529A/ja not_active Withdrawn
- 2000-04-03 AU AU38176/00A patent/AU3817600A/en not_active Abandoned
- 2000-04-03 WO PCT/EP2000/002947 patent/WO2000062281A1/en active Application Filing
- 2000-04-11 MY MYPI20001522A patent/MY124031A/en unknown
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1727860B (zh) * | 2004-06-15 | 2010-05-05 | 微软公司 | 语音噪音抑制方法和语音噪音抑制器 |
Also Published As
Publication number | Publication date |
---|---|
US6507623B1 (en) | 2003-01-14 |
AU3817600A (en) | 2000-11-14 |
CN1355916A (zh) | 2002-06-26 |
DE10084459T1 (de) | 2002-04-25 |
JP2002541529A (ja) | 2002-12-03 |
MY124031A (en) | 2006-06-30 |
WO2000062281A1 (en) | 2000-10-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1122970C (zh) | 由时域频谱减法减少信号噪声的降噪处理器、方法和电话 | |
CN1727860B (zh) | 语音噪音抑制方法和语音噪音抑制器 | |
CN103871421B (zh) | 一种基于子带噪声分析的自适应降噪方法与系统 | |
CN1225104C (zh) | 抑制噪声信号的方法 | |
JP4210521B2 (ja) | 雑音低減法および装置 | |
CN1145931C (zh) | 降低语音信号中的噪声的方法和采用该方法的系统和电话机 | |
CN1210608A (zh) | 一种有噪语音参数增强的方法和装置 | |
WO2022012195A1 (zh) | 音频信号处理方法和相关装置 | |
WO2022160593A1 (zh) | 一种语音增强方法、装置、系统及计算机可读存储介质 | |
US20120197638A1 (en) | Method and Device for Noise Reduction Control Using Microphone Array | |
EP1080463B1 (en) | Signal noise reduction by spectral subtraction using spectrum dependent exponential gain function averaging | |
CN1460323A (zh) | 次波带指数平滑噪声消除系统 | |
JP2003534570A (ja) | 適応ビームフォーマーにおいてノイズを抑制する方法 | |
CN1356014A (zh) | 利用频谱减除的双拾音器信号降噪系统和方法 | |
CN109643554A (zh) | 自适应语音增强方法和电子设备 | |
CN111554315B (zh) | 单通道语音增强方法及装置、存储介质、终端 | |
CN101505443A (zh) | 一种虚拟重低音增强方法及系统 | |
CN102549659A (zh) | 抑制音频信号中的噪声 | |
CN1134768C (zh) | 由时域频谱相减进行信号噪声减小的电话机、处理器及方法 | |
JP2012522255A (ja) | オーディオ信号分類の方法および装置 | |
CN109961799A (zh) | 一种基于迭代维纳滤波的助听器多通道语音增强算法 | |
CN109523999A (zh) | 一种提升远场语音识别的前端处理方法和系统 | |
CN109920444B (zh) | 回声时延的检测方法、装置以及计算机可读存储介质 | |
CN110248300B (zh) | 一种基于自主学习的啸叫抑制方法及扩声系统 | |
CN118899005B (zh) | 一种音频信号处理方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C06 | Publication | ||
PB01 | Publication | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C19 | Lapse of patent right due to non-payment of the annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |