CN1129486A - 通信系统中降低传输噪声的方法 - Google Patents
通信系统中降低传输噪声的方法 Download PDFInfo
- Publication number
- CN1129486A CN1129486A CN94191041A CN94191041A CN1129486A CN 1129486 A CN1129486 A CN 1129486A CN 94191041 A CN94191041 A CN 94191041A CN 94191041 A CN94191041 A CN 94191041A CN 1129486 A CN1129486 A CN 1129486A
- Authority
- CN
- China
- Prior art keywords
- frame
- noise
- voice
- iteration
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004891 communication Methods 0.000 title claims description 19
- 230000009467 reduction Effects 0.000 title description 3
- 238000000034 method Methods 0.000 claims abstract description 62
- 238000012545 processing Methods 0.000 claims abstract description 23
- 238000001228 spectrum Methods 0.000 claims description 54
- 238000001914 filtration Methods 0.000 claims description 17
- 230000005540 biological transmission Effects 0.000 claims description 13
- 230000008569 process Effects 0.000 claims description 11
- 238000005070 sampling Methods 0.000 claims description 6
- 230000014509 gene expression Effects 0.000 claims description 5
- 230000004044 response Effects 0.000 claims description 5
- 238000001514 detection method Methods 0.000 claims description 3
- 230000008030 elimination Effects 0.000 claims description 3
- 238000003379 elimination reaction Methods 0.000 claims description 3
- 230000008054 signal transmission Effects 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 9
- 230000003595 spectral effect Effects 0.000 abstract description 2
- 230000002452 interceptive effect Effects 0.000 abstract 1
- 238000009499 grossing Methods 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 230000006872 improvement Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000001066 destructive effect Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 102000003712 Complement factor B Human genes 0.000 description 1
- 108090000056 Complement factor B Proteins 0.000 description 1
- 241001417516 Haemulidae Species 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013016 damping Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000003292 diminished effect Effects 0.000 description 1
- 238000012854 evaluation process Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000002203 pretreatment Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000005654 stationary process Effects 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/18—Automatic or semi-automatic exchanges with means for reducing interference or noise; with means for reducing effects due to line faults with means for protecting lines
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/40—Applications of speech amplifiers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02168—Noise filtering characterised by the method used for estimating noise the estimation exclusively taking place during speech pauses
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0264—Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/12—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/24—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Monitoring And Testing Of Exchanges (AREA)
- Noise Elimination (AREA)
- Telephonic Communication Services (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
- Monitoring And Testing Of Transmission In General (AREA)
Abstract
通过使用线性预测编码语音模型的交互评估以滤除噪声的信号处理过程,电信网络的服务可克服传输噪声带来的恼人的后果。语音模型滤波器使用了根据由话音活动检测器判定否为仅噪声帧的输入信号帧的取样值,对当前噪声功率谱密度的精确修改评估。使用线性预测编码语音模型以计算输入信号的独特的方法基于选定数目的最近过去帧和至多两个将来帧对当前帧进行帧内迭代。当无法从噪声源推知噪声信号时这种处理方法是有效的。
Description
本发明涉及在一个嘈杂的的通信信道或网络中改善语音质量,尤其涉及一种装置,它通过使用独有的线性预测编码,来连续地消除噪声成份,从而改善语音质量。
在所有形式的语音通信系统中,由于多种原因而产生的噪声可以干扰用户的通信,破坏性的噪声可能在系统的输入端、传输通路中和接收端产生,混入在语音中。噪声的存在是恼人的或干扰用户的通话,极大地影响语音质量,并且降低语音编码和语音识别设备的性能。
语音改善技术对于蜂窝无线电话系统是很重要的,因为这些系统可能是在吵闹的汽车上和嘈杂的信道上使用,或在喧闹环境中的付费话机中使用,或在嘈杂的无线链路或其它低质量的通路和连接上的长途通信系统中使用,或在具有很大噪声的话源的电话会议系统中使用,或使用在空一地通信系统中,这里驾驶舱中极大的噪声会破环驾驶员的通信,这将是具有破坏性和危险的。进一步地说,在自动拔号的语音识别系统中,如果识别器的算法是基于纯净语音的统计模型,那么在嘈杂环境中识别的精度将大大降低。
在传输通路中的噪声尤其难于消除,其中一个原因是由于无法由噪声源中推断出噪声信号,因此就不能通过从噪声的直接测量中产生一个“误差”信号,然后由相位反转来消除这个误差信号的方法来抑制噪声。
各种方法已经尝试及使用,用于当噪声分量无法直接测量到时改善具有噪声的语音质量。对这些技术的论述可在“Proceedings ofthe IEEE”Vot 67,No.12,December 1979,SectionV.pp1586—1604中由J.S.Lim和A.V.Oppenhein所著的“具有噪声的语音的质量改善和带宽压缩“文章中找到。这些技术包括从所得到的具有噪声的信号计算出的整个谱中减去估计的噪声幅度谱,和由Lim和Oppenhein提出的一种基于迭代模型的滤波器,此滤波器尝试找到语音分量的最佳全极点模型,此模型给出了全部具有噪声的信号和对噪声能量谱的评估。J.H.L.Hansen和M.A.demets,在IEEE Transaction On signal processing,Vol 39,No.4,April 1991,PP.795—805的文章“语音识别应用中的受限迭代语音质量改善”中,根据这种模型的方法,提出了一种非实时的语音平滑器,其中在Lim—Oppenhein迭代中的语音模型上加上了时间的约束用以限制模型对语音特性的改变。
使用在Lim/Oppenhein参考资料中所提出的早期方法可以在处理后改善信噪比,但由于在滤波后引入非平稳噪声,其对语音质量的改善并不理想,即使很小的非平稳噪声也会影响人的听力。使用Hansen的非实时的平滑器的方法的好处在于其可减少仍存在的非平稳噪声,Hansen的平滑方法比在Lim/Oppenhein参考资料中所给出的方法提供了更好的语音质量,但这种方法无法在实时环境下使用,因为它要在每个时间帧处理所有的过去和将来的数据,这样此技术就无法在一个通信环境下有效地使用,以下所述的是对Hansen平滑器的一个改进方法,使得滤波器可在这种环境下使用。
本发明是一个用于通信网络的信号处理方法,它使用LPC语音模型及在实时操作中对噪声功率谱的连续的评估,由在每次迭代产生的重滤波信号的修改,及在极点数目和它们在时间帧间的移动的时间约束来滤去噪声。具有破坏性噪声的输入语音信号输入到特殊的迭代线性Wiener滤波器中,其目的是实时地输出传送到网络中的语音的评估值。
滤波器要求对当前噪声功率谱密度有一个精确的评估,这可以由在语音技术中典型使用的从噪声间隔的的评估而获得。对这些仅噪声帧的检测是由话音活动检测器(VAD)完成的。当在VAD中检测到仅噪声状态时,滤波器的输出就会衰减以使噪声的能量不会在网络中传播开来。
当具有噪声的语音由滤波器在时间帧中检测到时,就要作出评估,这个语间是活音的还是非话音的,根据所检测的语音的类型相应地改变在迭代滤波器中所假定的LPC模型的阶数。普遍地,如果在该时间帧中为一个话音语音,LPC模型的阶数为M=Fs+(4或);如果在该时间帧中为非话音语音,M=Fs,其中Fs为以KHZ为单位的语音的带宽。这种动态调整模型阶数的方法用于抑制杂散的模型极点,这些极点可以在滤波后的语音中产生依赖时间的调制的类话音噪声。
根据本发明的另一方面,提供了跟踪噪声谱变化的功能,此功能由在某种程度上依赖于新的与老的噪声谱评估的“距离”以修改新的反噪声帧来实现。可根据在评估新的噪声谱修改前必须检测到的连续新的噪声帧的最小数目和给出的新噪声帧的权重来设置参数。
以下详细描述了在电信网络中使用的遵循本发明的特殊专有实施方式的改进方法,此方法用在使用滤波器的迭代评估技术领域中,此滤波器结合使用一个自适应的语音模式和噪音谱评估,及用于抑制属于无法直接测量类型的噪声的方法。
图1是一个包含本发明的通信网络的说明性示意图。
图1A是信号处理资源;
图2是按照本发明实现的平滑操作的示意图;
图3是显示语音改善方法框架的流程图,
图4是产生受限的语音改善的迭代序列的装置的示意图;
图5是一个示意图,描述了对语音模型的LPC根的帧间平滑操作和从这次迭代到下次迭代的帧内LPC自相关矩阵的驰豫;
图6a是显示了修改当前帧的每次迭代的方法的示意图;
图6b是显示了修改当前帧的每次迭代的改进方法的示意图;
图7a和7b是一个平滑权重表,此权重用于LSP的位置根在当前帧邻近的7个语音帧间进行平滑处理;
图8和图9显示了噪声预测器功能的信号轨迹;
图10是对修改在Wiener滤波器中使用的所要求的噪声的步骤的描述。
本发明是一个对信道内无法获得单独的噪声基准的语音加噪声进行滤波的改进过程,可实时操作。虽然本发明的原理同样可应用于其它需要减少在电子语音传输媒介上的噪声的许多场合,但这里就结合电信网络加以说明。一个典型的电信网络在图1中显示,它包括了一个位于远端的交换机10,许多通信终端如话机11,通过本地线路,如可能为双绞线的线路12,连到这个交换机上。出局的信道如通路13从远端局12发散出来,通路13可能跨越国际边界14,通路13继续连接到美国的基地中心局15,此局包括一个交换机16,这个交换机可以是N0.4ESS交换机。它可以连入包含许多条入局通路的输入集17,其中就包括了通路13。
交换机16建立一条内部路径,如路径18,在例子中,用来连接从信道13来的入局呼叫到最终的出局传输信道19,此信道为出局信道组19中的一条,假定在从信道13来的入局呼叫中包含了在任何连接段10,11,12,13所产生的噪声,因此无法直接测量噪声源。
根据本发明,在逻辑单元20做出决定,在从信道13来的交换机的输出中是否存在高于某个预定阀值的噪声。逻辑单元20在排除了传真,调制解调器及其它可能后,决定呼叫是否为话音的。逻辑单元20进一步决定发端号码是否为要提供降低传输噪声服务的客户。如果逻辑单元20作出了上述所有3个决定,呼叫由交换机22连接到处理单元21,否则呼叫直接传到信道19。在图中只显示了一个处理单元21,所有交换机16的出局信道都与另外处理器21(在图中没有显示)相连。
从具有噪声的信道13来的呼入信号最好由一个模拟滤波器(在图中设有显示)处理,这个滤波器具有受限于基带电话信号的频率响应。
在这里讨论的系统中,带有噪声的语音在处理器21中以8KHZ频率被数字化,时间序列在帧中处理。使用的帧的大小为160个取样值(20ms),并且,在这些数据块中有50%的数据重叠以保持重构滤波后语音的连续性。
参考图1A,处理器21包括一个Wiener滤波器,其中通过假定全极点LPC模型和迭代处理每帧获得的未知参数来评估滤波器的信号谱。带有噪声的呼叫被连到滤波器23,这个呼叫也通过旁路24连到话音活动检测器(VAD)25,此检测器可以检测到噪声或语音加噪声帧,决定一个语音帧是话音的或是非话音的。在Wiener滤波器中使用的所要求的噪声谱可收VAD检测到的反噪声帧来评估。
当检测到一个处理为反噪声时,VAD25向噪声抑制电路26发送信号,接通抑制器27在这种方式下,当输入到滤波器23的仅噪声进入到连到在终端28的远端收听人的出局通路19之前,这个噪声被显著地衰减掉。另外,当以噪声帧被检测到时,VAD向滤波器23中的修改功能块29发信号,根据当前噪声帧来评估一个新的噪声谱,及用以前的噪声的评估值加权这个新的噪声谱。
当VAD检测到语音时,单元26的输入连接到单元23,以便滤波后的语音传送到出局线路19。此外,如果检测到话音语音,用于在单元23中的迭代Wiener滤波器的LPC语音模型的阶数被设置为10阶;如果检测到非话音语音,其被设置为4或6阶。这样调整语音模型阶数的目的在于对于LPC极点的迭代搜索会导致在信号功率谱与噪声功率谱之比较低的频带部分产生错误的共振峰,从而在滤波后的输出中产生具有随机频率和持续时间的对人耳有害的噪声音调,即使这时相对于平均信号振幅来说噪声是非常小的。因此,从带宽考虑非话音语音的LPC阶数通常为话音语音的一半,并且非话音语音比话音语音弱,调整4C的阶数以使语音模型适当是很重要的。
迭代滤波器23所使用的处理过程根据3Lim/Oppenheim参考资料中所给出的方法和J.H.L.Hansen在Hansen/Clements的参考资料中提出的用于非实时AVTO—LSP平滑器的用以改进迭代收敛性的帧间和帧内的平滑方法。可根据本发明原理实现不同的方法。滤波器23对呼入带有噪声的语音进行处理,获得近似准确的语音内容。滤波器的操作在以下描述。
如果语音还没被转换成数字形式,滤波器21包含一个输入信号的模拟一数字变换器30,它产生取样输入的帧数据块。帧的大小为160个取样值或20msec,帧的持续时间是足够地长,可把语音认为是LPC模型的一个近似统计平稳的过程。迭代Wiener滤波器和作为此滤波器一部分使用的语音过程的LPC模型都基于平稳过程的假设。因此,帧在这些很短的时间块内被处理是很重要的。
参考图2,输入信号加上噪声可表示为y[n]=s[n]+d[n],其中y是可获得的输入取样值,s和d分别是信号与噪声部分。这些取样值放入重叠的帧中,重叠率如50%,每个数据块由一个时间窗口加权,如Hanning窗口,以便在时间上正确分隔的重叠的加窗帧之和加在一起给出了初始的输入时间序列。窗口的使用减少了用于对数据块进行评估的LPC模型的差,重叠帧的使用可以使输出到图2中单元19的重构滤波信号保持连续性。
正如在Hansen/coements参考资料中的迭代AVTO—LSP平滑器中那样,在处理当前输入数据帧的过程中,根据本发明,对Wiener滤波器的每次迭代存在二类约束。它们是应用于当前帧的每次帧内迭代的LPC自相关矩陈驰豫约束和当前帧的LPC语音模型极点位置用在对相邻的过去和将来帧的每次迭代中实现的LPC极点位置进行帧间平滑。LPC极点约束并不直接应用,因为它们以Z平面上的复数形式出现,并且帧间平滑的复极点位置的关系也不清楚。一个间接但较简单的方法可能是使用一个与LPC极点等价的叫做线谱偶对的表示方法。此方法的细节在Hansen/Clements的参考资料和由S.Fururi,Marcel Dekker公司(NewYork,NY)在1989年出版的“数字语音处理、合成和识别“一书中的第五章中讨论。N阶LPC模型的极点位置可等价地由一套位于复数Z平面单位圆上N/2LSP“位置”根和N/2LSP“差分”根表示。这种LPC极点的等价LSP表达方法的用处在于信号LPC模型的谱的轻微阻尼共振峰的位置与LSP位置根紧密相关,并且在这些共振峰处的LPC谱的带宽与LSP的差分根紧密相关。对于一个稳定的LPC模型,这两类LSP根正好位于单位圆上并在圆上相互交替出现。LSP根的位置顺序是很明显的,它们在时间帧间的平滑过程比复数LPC根的平滑过程简单得多。总之,通过平滑等价的LSP位置根,和应用一个下限值于“差分”根到相邻的“位置”根的最小距离,在相邻帧的同次迭代的LPC极点间来平滑被滤波的每次迭代的LPC极点。后一种约束限制了任何LPC模型的共振峰的尖锐度,使之接近于语音波形。
本发明要求在邻近的时间帧间进行LSP位置平滑,但在通信网络的实时应用所实现的滤波器中,仅可得到在正进行滤波的当前帧之后的几个帧。对于20msec,重叠率为50%的帧,由在图2所示的使用两个将来帧所施加的最小延时为30msec,即使这么小的延时在一些通信网络中也是重要的。在此讨论的滤波器假设使用四个过去帧和2个将来帧进行平滑;虽然可得到所有的过去帧,但只使用与当前帧相关的那些帧。
对当前帧K所执行的受限的迭代步骤在图3所示,迭代1,…,J的细节在图4中所示。在Wiener滤波器(WF)中使用信号和噪声功率谱的评估为C.Sy(f)和Sd(f),由在频率域中滤波输入块y[n]起始了由这种滤波器处理的Wiener滤波器的LSP循环,即初始的滤波器的信号谱为总的输入谱乘以C,使之有预期的信号功率:Psignal=Ptotal-Pnoise。初始化后,图3的循环执行以下步骤,对帧个进行迭代滤波;
(1)从在时间域评估WF输出信号的LPC参数来起始迭代的循环,在LPC的自相关计算依赖于该帧的前几次迭代的自相关值的驰豫。这个驰豫步骤尝试地进一步稳定最佳语音LPC模型的迭代搜索。这在以下结合图5讨论。
(2)从由(1)中对语音帧K的第3次迭代所发现的LPC模型中,解出LSP的位置根Pj和差分根Qj,这要求每个次数为LPC阶数一半的两个多项式有实数根的解。
(3)按照图2和图5C所示,在相邻帧间对当前帧K平滑LSP的位置根Pj,并限制LSP差分根Qj偏离平滑的Pj根的距离,每个差分根Qj被限制为它与最近的平滑Pj根的距离要比一个最小距离Dmin大。这可以防止平滑的LPC极点位置被驱动到复平面Z的单位园上。这种“发散性”在Hansen/Clements为参考资料中提出,认为其是在Lim/Oppenheim参考资料的Lim-Oppenheim迭代滤波器的一个问题,这种约束是实际语音传输所必须的。Dmin=0.086弧度已在本发明的通信测试中使用。
(4)把平滑的LSP根转换为平滑的LSP参数,计算LPC信号模型的功率谱Ss(f)j并定标使平均的功率等于估计的当前K帧的信号功率:
Psignel=Ptotal-Pnoise
(5)如在图3和图4所示,使用平滑的LPC模型的信号谱Ss(f)j估计的当前噪声功率谱Sd(f)去构造下一次迭代的Wiener滤波函数项,因为这个滤波函数是具有幂数Pow的通常的非随机的WF。在0.6至1.0之间的Pow值已在本方法的通信测试中使用。较大的Pow值使每次迭代产生的变化也较大,而较小的Pow值使对信号分量的迭代搜索较为稳定。
(6)用当时的Hj(f)过滤以前迭代的WF时间序列输出Sj-1[n]与初始的输入数据y[n]的组合,以获得信号评估Sj[n]的下一次迭代。使用的线性组合为(1-B)Xy[n]+BXSy-1[n],其中0≤B≤1。如果B=0,滤波器变成非受限的Lim/Op-penheim迭式滤波器;如果B=1,下一个WF的输入是前一上WF的输出,正如Hansen/Clements参考资料中给出的AVTO—LSP平滑器所做的那样。在0.8至0.95之间的B值在本滤波器的绝在部分实验中使用。使用这些B值,可同时具有Lim/Oppenheim滤波器和Hansen平滑器的一些所要求的特性。本发明中的这种权概念是新颖的,它提供了最终噪声内容相对在迭代滤波语音中观测的高频滤波程度的额外控制。
结合在Lim/Oppenheim和Hansen/Clements参考资料中给出的以前两种信号模型的迭代算法的特性,特别是Wiener滤波器输入的每次迭代的加权组合,发现可产生具有较少消声的语音评估,同时折衷地会稍微增加输出的残留噪声。组合方法在图2和图3中所示,其中可见第2次迭代的滤波器的输入信号为总输入y[n]和Wiener滤波器在第(j-1)次迭代的输出S[n]j-1。
(7)在本方法的当前实施过程中,迭代的次数intra是通过实验来决定的输入参数。由实验结果,4至7次的帧内迭代成[Intra,pon]的形式表示,如[7,0.65],[5,0.8]和[4,1.0],其中反馈因子B在0.80至0.95之间。它们的最佳值取决于噪声类别和语音类型。对于宽带白噪声,典型地可取intra=6;当噪声功率谱在0至4KHZ的活音频带谱内偏离了1KHz,迭代4或5次就足够了。
本发明的一个重要方面如在图1A部件25中和图3中所示,话音活动检测器(VAD)有多个应用,它既可检测仅噪声帧,也可在语音存在时通过检测这帧为话音或非话音来决定这帧模型的最佳阶数。正如以前所指出的,对话音和非话音语音帧,LPC语音模型的最佳阶数是不同的。同样的,正如以前指出的,仅当在足够多的相继帧中设有检测到语音信号时,才修改噪声谱。在检测到仅噪声的一个时间间隔内,在交换机26中的噪声抑制器27被激活以衰减输出信号,而迭代滤波器23停用。但是如果检测到语音,交换机26连通30到输出19上。语音的类别,即其为话音的或非话音,决定了用于迭代的LPC语音模型的阶数。检测到三种可能状态(噪声帧,话音帧和非话音帧)的变化,在平滑当前第K帧前,会引起以前帧K—4,K—3,K—2和K—1的LSP历程重新初始化,这样做对最佳语音滤波是必须的符合逻辑的,因为对过去时间帧平滑的目的是通过使用平均帧间的短期平稳性来平均各异的噪声。
图6b显示的为取得滤波器23的实时操作的处理帧的方法。第K帧假定为当前时间的参考点,第K—4,K—3,K—2和K—1帧是以前处理过的归档帧,第K+1和K+2帧是可获得的将来帧。正如在Hansen/Clements参考资料给出的平滑方法,通过使用在处理多次迭代中过去帧的LSP历史状况,滤波器23在第K帧每次迭代时使用过去和将来帧的LSP根来平滑第K帧语音模型的LSP根。但是,与Hansen/Clements参考资料中的非实时平滑器不同的是,对每个帧本发明只使用两个将来帧,在为每个帧进行迭代期间也存储所要求的过去帧的LSP历史状况,以便于在帧内迭代时,使用累积的前四个帧的历史状况来平滑当前帧。按照在Hansen/Clements资料给出的方法,帧间的权重逐渐减小,每个LSP根的锥度取决于当前帧的SNR值和到第K帧为止的SNR的历史状况。
本发明的另一个改进是使用表来查寻用在帧间的帧的LSP权重,用在本发明的权重表可为在图7所示的类型,但在Hansen/Clements参考资料要求的权重是由公式很费时计算得出的,与在Hansen/Clements参考资料使用的公式所施加的约束不同,在图7表中使用的可以容易和独立地调整。语音帧的阈值可以独立地选择,据此一个加到特定LSP根的权重矢量可从一个表转换到另一个表。构造平滑矢量的一般方法是对较高阶的LSP位置(即较高的其振峰频率)平滑得多一些,如在这些表中从左到右所示。这是由于在较高阶LSP语音位置观测到的给定SNR对应噪声的较大影响所致影响表中值的另一个因素是当帧的SNR较低时,平滑程度宽广而均匀;而当SNR增大时,平滑程度变小,当SNR达到最高时,就设有平滑作用了。这种趋势是由于当帧的SNR改善时,噪声对滤波后的语音的影响也随着减小。用于从一个权重矢量表转换到另一个表的帧的SNR阈值目前被选为在VAD中评估的噪声功率运行评估Npow的倍数,阈值是逐渐增加的,当从表Win1转到Win2时,Th1=2Npow;当从表Win2转到Win3时,Th2=3Npow;当从表Win3转到Win4时,Th3=7Npow;当从表Win4转到Win5时,Th4=11Npow;如果在足够长时间内,都出现具有较低SNR的帧时,就使用表WinO。
根据本发明,使用一个话音活动检测器(VAD)从仅噪音中评估噪音的功率谱Sd(f)是一个较好的方法。在图3所示的滤波过程是基于这样一种假设,即语音中存在的噪声具有与评估的Sd(f)相同的平均功率谱。如果噪声在统计上是广义平稳的,噪声评估就无需修改。但是,对于在这里所示的语音改善应用及对于其它的降低传输噪声的应用,噪声的能量只是大致平稳。在这些情况下,需要对Sd(f)进行连续的评估,相应地,一个VAD,如在图1A中的检测器25,它对噪声有较强的抗干扰能力,可以在实际环境SNR下识别何时语音不存在。正如在图10所示,使用在语音段间检测到的仅噪声帧修改噪声功率谱的评估。一个在图1A应用中合适使用的VAD可以在IEEE Conf,ICA ssp1989,Section S706,PP.369—372中D.K.Freeman etal所著“用于PAN—EVRO—PEAN的数字蜂窝移动电话服务的话音活动检测器“文章所讨论的GSMO6.32VAD标准中获得。
滤波前和滤波后的语音信号在图8和图9中所示,它表明了当没有检测到语音时,如何使用话音活动检测方法去触发对输出信号的衰减。如在Freeman etal的参考资料中讨论的,在一个噪声帧VAD的激活是被检测的输入电平和“非语音”属性的重复帧判定的卷积平衡。
优选地,一个VAD语音类别的判定可以在图3所示的LPC模型步骤的前端使用。这是由于可以按照在当前处理帧的正被滤波的语音类别(话音的或非话音的)最好地调整如在AVTO—LSP算法中的LPC阶数那样的参数设置。如果在噪声存在情况下能可靠地鉴别处理帧的语音类别,语音质量就可以更好地改善。
按照本发明的另一方面,参考图3和图10,可以使用一种装置来改进噪声信号谱变化的灵敏度,这种装置可根据新的噪声谱评估Sd(f)new与前次评估Sd(f)间的差异程度修改新的仅噪音谱函数Sd(f)。如果用Sd(f)L-1表示前次噪声谱,那么修改谱为:
Sd(f)L=(1-A)Sd(f)L-1+A.Sd(f)LSd(f)new
其中0≤A≤1,为频带内误差Sd(f)L-1-Sd(f)new p的归一化平均数,P的典型值为1→2。当新的噪声谱评估按近于前次评估形状时,A的值接近为0;但当两个谱的形状差别较大时,A的值将接近为1,并且在Sd(f)L中这些新的噪声帧将占很大比重。由在合适SNR范围下评估相对保守的VAD做出噪声帧的制定,因此在高于10dBSNR条件下,正确判定噪声的概率很高。噪声修改的时间间隔并不是本方法中的一个参数,而只用于平均谱的差异。为了减少评估谱Sd(f)new的方差,需要得到VAD做出的前多个相邻噪声帧的判定且修改是有效的。在改进方法测试中,使用5或6个相连的噪声帧去修改谱。
正如以前讨论的,在AVTO—LSP滤波方法中使用两种约束的改进基于Lim/Oppenheim模型的迭代滤波器,它们是应用于LPC模型每次迭代可计算的自相关矩阵上的帧内自相关驰豫和用在对被滤波帧周围的时间帧的迭代中所产生的LSP根进行帧平滑。每次迭代中执行的约束操作在图5显示。平滑操作显示了在从前次迭代信号结果S[n]j-1获得这次迭代的Wiener滤波器(WF)的信号功率评估Ss(f)j的迭代期间约束施加的次序。采用WF滤波整个信号加噪声y[n],在这个WF中每次迭代对信号谱的新的评估插入到WF模型中,在Lim/Oppenheim参考资料定义的统计假设下,滤波的迭代序列在理论上将收敛至“最佳”的信号评估。在实际应的语音信号和噪声类型中,需要额外的帧内和帧间约束帮助加快收敛及施加类语音的要求于WF中的信号谱上。帧内自相关驰豫在图5的部分B显示,其中所要求的LPC模型参数以a表示,最后的信号评估S[n]j的自相关矩阵以Rj表示,且bj为Yale-Walker AR方法中的互相关矢量。建义采用驰豫因子C=0.7。驰豫可以扩充使之不仅只对前次帧进行平滑,但这样做并没有观察出有什么重大的好处。平滑过程在图5C显示。每个大圆表示为在复数Z平面上的单位圆,对于第K帧和第3次迭代,符号“0”标识了LSP的差分根Qkj,符号“·”标识了位置根Pkj。对于一个最小相位的LPC模型,极点位于单位圆内,且Pkj和Qkj沿着圆相互交替出现。在过去和将来帧中进行LSP平滑,其中当前集为帧K—4,K—3,K—2,K—1,K,K+1,K+2,只有位置根Pkj直按被平滑,而差分根Qkj跟着平滑后的Pkj而变化。一种逆向步骤给出了经平滑、定标的LPC信号模型的谱Ss(f)j。一个等价LSP表达式的复数根只是两个阶为初始LPC多项式阶的一半的实根多项式的解。这种方法在Hansen/Clements和Furni的参考资料中详尽描述。
用AVTO—LSP方法平滑LSP根直接平滑自回归模型的复数域根具有计算简捷的优点。即使LPC和LSP模型的表达式是相同,帧间平滑LSP根的可能缺点是存在LPC谱的其振峰位置/带宽和相应的LSP位置/距离根间的非线性关系。特别是当LPC的根离开单位圆时,LSP位置根不能很好地识别LPC的共振峰频率或带宽。但是,这种非线性的映射看起来并没有在改进语音质量时限制受限LSP根的有效性。
在从噪声功率谱的评估开始到使用这种噪声评估处理语音加噪声结束的这段时间间隔内如果噪声在统计上是广义平稳的,所述的处理过程是特别有效的。此方法对于大于10dB的信噪比的信号是最有效的。对于如汔车道路的噪声和飞机驾驶舱中噪声,即这类噪声的大部分谱能量处于音频频带的低频部分,此方法在5dBSNR时,也是有用的。对于如网格内哼声这种平稳的类话音噪声,当VAD能准确指明仅噪声帧时,在低于0dB SNR下滤波器可以成功使用。
Claims (11)
1.在一个包括交换节点连按到所述节点传输从远地来的信号和噪声的入局传输信道和出局信号传输信道的通信网络中,一个用于从所述入局传输信号中滤去噪声的处理过程,包括步骤;
将所述的入局传输信号转换成相继重叠和加了时间窗的信息帧,以创建一种改进的语音信号,每个帧包含了以足够频率采样的数字信号,表示由线性预测编码(LPC)的语音模型的入局信号;在信号滤波器中存贮每个所述的帧,所述滤波器包含了用于根据所述LPC语音模型进行的迭代评估的装置;
通过如下方法对当前帧执行多次帧内迭代:
根据总的输入信号谱和对噪声谱的当前评估在所述信号滤波器中对当前帧作出语音信号分量的初次评估,
对所述的当前帧从所述的初次评估中产生一系列等价的LSP位置根,
对于每个所述当前帧的每次帧内迭代,采用一些位置根,这些位置根来自于过去帧的迭代和在多个未来帧的从第一次所述迭代而得到的多个LSP位置根的相应迭代而得到的位置根,去平滑所述当前帧的所述位置根;
重复执行选定次数的帧内迭代步骤;
最后所述迭代的输出包括一个入局语音信号的实时评估的经滤波的帧。
2.按照权利要求1的过程,其中所述的所选择的过去帧包括多至4个最近过去帧和最近的2个所选的将来帧,
3.按照权利要求2的过程,进一步包含以下步骤:
区分帧为仅含噪声的帧还是有语音内容的帧;
使用所述的仅噪声帧产生噪声谱的一个连续的评估;和
为响应所检测到的反噪声帧,修改所述的噪声谱评估,
4.按照权利要求3的处理过程,还包括以下步骤:把所述滤波器的输出与所述出局传输信道断开以响应检测到一个反噪声帧,把通过一个衰减器所术入局传输信号直接转接到所述的出局传输信道,
5.按照权利要求4,进一步包括以下步骤:
检测每个所述语音帧以确定其为话音的还是非话音的,
为响应检测到一个所述的话音帧,设置所述语音模型为10阶LPC;并且
为响应检测到一个所述的非话音语音帧,设置所述的阶数小于所述的10阶,
6.按照权利要求5的处理过程,其中响应检测的所述话音语音帧的所述阶数设置是在4阶与6阶之间,
7.按照权利要求6的处理过程,其中所述的当前噪声帧的当前评估可由包含以下步骤的处理过程导出:
确定在所术滤波器当前存储了多少个连续的反噪声帧;
如果所述的连续帧超过了一个预定的数目,计算所述连续帧的平均噪声功率谱,
测量所述平均功率谱和以前计算的噪声功率谱的差异;并且
通过与所述测量到的差异相关的加权因子调整上述这两个谱,所述的调整使得所述的谱的结果和与一个预定的功率谱电平一致。
8.按照权利要求7的处理过程,进一步包括以下步骤:设置传输入局噪声阈值和决定是否存在超过所述闽值的噪声;
决定入局呼叫是否包括语音信号内容,
决定发端号码是否为提供降低传输噪声能量的电信服务的客户,并且
如果所有上述这些判决都是肯定的话,在所述交换节点激活所述处理过程,
9.按照权利要求8的处理过程,进一步包括这样一个步骤:在每一帧中加权所述的LSP位置根,其中所述加权因子由以下因素的选择性组合决定,即LSP的共振峰数目,全部帧的功率值,帧的功率阈值,连续噪声阈值失配Pcount和Pcount是否超过所述的记数阈值Lmax。
10.按照权利要求9的处理过程,其每个所述当前帧的帧内迭代数目在1和7之间,
11.按照权利要求10的处理过程,进一步包括这样一个步骤:对每个相继帧重复所述的帧内处理过程;并且组合时间重叠帧的结果以产生一个所述的输出。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US16077093A | 1993-11-30 | 1993-11-30 | |
US08/160,770 | 1993-11-30 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1129486A true CN1129486A (zh) | 1996-08-21 |
Family
ID=22578366
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN94191041A Pending CN1129486A (zh) | 1993-11-30 | 1994-11-15 | 通信系统中降低传输噪声的方法 |
Country Status (9)
Country | Link |
---|---|
US (3) | US5706394A (zh) |
EP (1) | EP0681730A4 (zh) |
JP (1) | JPH08506434A (zh) |
KR (1) | KR0175965B1 (zh) |
CN (1) | CN1129486A (zh) |
CA (1) | CA2153170C (zh) |
PL (1) | PL174216B1 (zh) |
UA (1) | UA41913C2 (zh) |
WO (1) | WO1995015550A1 (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100336307C (zh) * | 2005-04-28 | 2007-09-05 | 北京航空航天大学 | 接收机射频系统电路内部噪声的分配方法 |
CN101322183B (zh) * | 2006-02-16 | 2011-09-28 | 日本电信电话株式会社 | 信号失真消除装置、方法 |
CN101577847B (zh) * | 2008-05-08 | 2013-01-02 | 索尼株式会社 | 信号处理设备和信号处理方法 |
CN110383700A (zh) * | 2017-03-10 | 2019-10-25 | 英特尔Ip公司 | 杂散降低电路和装置、无线电收发器、移动终端、用于杂散降低的方法和计算机程序 |
Families Citing this family (123)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5790754A (en) * | 1994-10-21 | 1998-08-04 | Sensory Circuits, Inc. | Speech recognition apparatus for consumer electronic applications |
SE505156C2 (sv) * | 1995-01-30 | 1997-07-07 | Ericsson Telefon Ab L M | Förfarande för bullerundertryckning genom spektral subtraktion |
DE19521258A1 (de) * | 1995-06-10 | 1996-12-12 | Philips Patentverwaltung | Spracherkennungssystem |
SE513892C2 (sv) * | 1995-06-21 | 2000-11-20 | Ericsson Telefon Ab L M | Spektral effekttäthetsestimering av talsignal Metod och anordning med LPC-analys |
FI100840B (fi) * | 1995-12-12 | 1998-02-27 | Nokia Mobile Phones Ltd | Kohinanvaimennin ja menetelmä taustakohinan vaimentamiseksi kohinaises ta puheesta sekä matkaviestin |
US5794199A (en) * | 1996-01-29 | 1998-08-11 | Texas Instruments Incorporated | Method and system for improved discontinuous speech transmission |
SE506034C2 (sv) * | 1996-02-01 | 1997-11-03 | Ericsson Telefon Ab L M | Förfarande och anordning för förbättring av parametrar representerande brusigt tal |
DE69716266T2 (de) * | 1996-07-03 | 2003-06-12 | British Telecommunications P.L.C., London | Sprachaktivitätsdetektor |
US5742694A (en) * | 1996-07-12 | 1998-04-21 | Eatwell; Graham P. | Noise reduction filter |
US5950154A (en) * | 1996-07-15 | 1999-09-07 | At&T Corp. | Method and apparatus for measuring the noise content of transmitted speech |
US6118758A (en) | 1996-08-22 | 2000-09-12 | Tellabs Operations, Inc. | Multi-point OFDM/DMT digital communications system including remote service unit with improved transmitter architecture |
US6771590B1 (en) | 1996-08-22 | 2004-08-03 | Tellabs Operations, Inc. | Communication system clock synchronization techniques |
SE507370C2 (sv) * | 1996-09-13 | 1998-05-18 | Ericsson Telefon Ab L M | Metod och anordning för att alstra komfortbrus i linjärprediktiv talavkodare |
JP3556419B2 (ja) * | 1996-12-09 | 2004-08-18 | 株式会社東芝 | 携帯無線電話機 |
JP3067676B2 (ja) * | 1997-02-13 | 2000-07-17 | 日本電気株式会社 | Lspの予測符号化装置及び方法 |
US5983183A (en) * | 1997-07-07 | 1999-11-09 | General Data Comm, Inc. | Audio automatic gain control system |
US6044341A (en) * | 1997-07-16 | 2000-03-28 | Olympus Optical Co., Ltd. | Noise suppression apparatus and recording medium recording processing program for performing noise removal from voice |
DE19747885B4 (de) * | 1997-10-30 | 2009-04-23 | Harman Becker Automotive Systems Gmbh | Verfahren zur Reduktion von Störungen akustischer Signale mittels der adaptiven Filter-Methode der spektralen Subtraktion |
JP3584458B2 (ja) * | 1997-10-31 | 2004-11-04 | ソニー株式会社 | パターン認識装置およびパターン認識方法 |
SE515674C2 (sv) * | 1997-12-05 | 2001-09-24 | Ericsson Telefon Ab L M | Apparat och metod för brusreducering |
US6415253B1 (en) * | 1998-02-20 | 2002-07-02 | Meta-C Corporation | Method and apparatus for enhancing noise-corrupted speech |
US5991718A (en) * | 1998-02-27 | 1999-11-23 | At&T Corp. | System and method for noise threshold adaptation for voice activity detection in nonstationary noise environments |
WO1999050825A1 (fr) * | 1998-03-30 | 1999-10-07 | Mitsubishi Denki Kabushiki Kaisha | Dispositif et procede de reduction de bruits |
US7440498B2 (en) | 2002-12-17 | 2008-10-21 | Tellabs Operations, Inc. | Time domain equalization for discrete multi-tone systems |
DK1068704T3 (da) | 1998-04-03 | 2012-09-17 | Tellabs Operations Inc | Filter til impulssvarforkortning, med yderligere spektrale begrænsninger, til multibærebølgeoverførsel |
US6081776A (en) * | 1998-07-13 | 2000-06-27 | Lockheed Martin Corp. | Speech coding system and method including adaptive finite impulse response filter |
US6453289B1 (en) * | 1998-07-24 | 2002-09-17 | Hughes Electronics Corporation | Method of noise reduction for speech codecs |
JP4308345B2 (ja) * | 1998-08-21 | 2009-08-05 | パナソニック株式会社 | マルチモード音声符号化装置及び復号化装置 |
US6826528B1 (en) | 1998-09-09 | 2004-11-30 | Sony Corporation | Weighted frequency-channel background noise suppressor |
US6272460B1 (en) * | 1998-09-10 | 2001-08-07 | Sony Corporation | Method for implementing a speech verification system for use in a noisy environment |
US6122610A (en) * | 1998-09-23 | 2000-09-19 | Verance Corporation | Noise suppression for low bitrate speech coder |
US6108610A (en) * | 1998-10-13 | 2000-08-22 | Noise Cancellation Technologies, Inc. | Method and system for updating noise estimates during pauses in an information signal |
US6289309B1 (en) * | 1998-12-16 | 2001-09-11 | Sarnoff Corporation | Noise spectrum tracking for speech enhancement |
US6331835B1 (en) | 1999-02-02 | 2001-12-18 | The Charles Stark Draper Laboratory, Inc. | Deeply-integrated adaptive GPS-based navigator with extended-range code tracking |
WO2000049602A1 (en) * | 1999-02-18 | 2000-08-24 | Andrea Electronics Corporation | System, method and apparatus for cancelling noise |
US6363345B1 (en) * | 1999-02-18 | 2002-03-26 | Andrea Electronics Corporation | System, method and apparatus for cancelling noise |
JP2000259198A (ja) * | 1999-03-04 | 2000-09-22 | Sony Corp | パターン認識装置および方法、並びに提供媒体 |
US6556967B1 (en) * | 1999-03-12 | 2003-04-29 | The United States Of America As Represented By The National Security Agency | Voice activity detector |
US6233552B1 (en) * | 1999-03-12 | 2001-05-15 | Comsat Corporation | Adaptive post-filtering technique based on the Modified Yule-Walker filter |
US6519260B1 (en) | 1999-03-17 | 2003-02-11 | Telefonaktiebolaget Lm Ericsson (Publ) | Reduced delay priority for comfort noise |
US7423983B1 (en) * | 1999-09-20 | 2008-09-09 | Broadcom Corporation | Voice and data exchange over a packet based network |
US6618701B2 (en) * | 1999-04-19 | 2003-09-09 | Motorola, Inc. | Method and system for noise suppression using external voice activity detection |
US6480824B2 (en) * | 1999-06-04 | 2002-11-12 | Telefonaktiebolaget L M Ericsson (Publ) | Method and apparatus for canceling noise in a microphone communications path using an electrical equivalence reference signal |
CN1145928C (zh) * | 1999-06-07 | 2004-04-14 | 艾利森公司 | 用参数噪声模型统计量产生舒适噪声的方法及装置 |
US6519559B1 (en) * | 1999-07-29 | 2003-02-11 | Intel Corporation | Apparatus and method for the enhancement of signals |
AU2297301A (en) * | 1999-10-21 | 2001-04-30 | Sony Electronics Inc. | Method for implementing a noise suppressor in a speech recognition system |
US6731237B2 (en) | 1999-11-09 | 2004-05-04 | The Charles Stark Draper Laboratory, Inc. | Deeply-integrated adaptive GPS-based navigator with extended-range code tracking |
FI19992453A (fi) | 1999-11-15 | 2001-05-16 | Nokia Mobile Phones Ltd | Kohinanvaimennus |
EP1104925A1 (en) * | 1999-12-03 | 2001-06-06 | Siemens Aktiengesellschaft | Method for processing speech signals by substracting a noise function |
US7263074B2 (en) * | 1999-12-09 | 2007-08-28 | Broadcom Corporation | Voice activity detection based on far-end and near-end statistics |
US7058572B1 (en) * | 2000-01-28 | 2006-06-06 | Nortel Networks Limited | Reducing acoustic noise in wireless and landline based telephony |
CA2401672A1 (en) * | 2000-03-28 | 2001-10-04 | Tellabs Operations, Inc. | Perceptual spectral weighting of frequency bands for adaptive noise cancellation |
AU2002211881A1 (en) * | 2000-10-13 | 2002-04-22 | Science Applications International Corporation | System and method for linear prediction |
US6463408B1 (en) * | 2000-11-22 | 2002-10-08 | Ericsson, Inc. | Systems and methods for improving power spectral estimation of speech signals |
WO2002054744A1 (en) * | 2000-12-29 | 2002-07-11 | Nokia Corporation | Audio signal quality enhancement in a digital network |
US6708147B2 (en) * | 2001-02-28 | 2004-03-16 | Telefonaktiebolaget Lm Ericsson(Publ) | Method and apparatus for providing comfort noise in communication system with discontinuous transmission |
US7319954B2 (en) * | 2001-03-14 | 2008-01-15 | International Business Machines Corporation | Multi-channel codebook dependent compensation |
US20030028386A1 (en) * | 2001-04-02 | 2003-02-06 | Zinser Richard L. | Compressed domain universal transcoder |
GB2380644A (en) * | 2001-06-07 | 2003-04-09 | Canon Kk | Speech detection |
WO2003001173A1 (en) * | 2001-06-22 | 2003-01-03 | Rti Tech Pte Ltd | A noise-stripping device |
US7277722B2 (en) * | 2001-06-27 | 2007-10-02 | Intel Corporation | Reducing undesirable audio signals |
DE10137348A1 (de) * | 2001-07-31 | 2003-02-20 | Alcatel Sa | Verfahren und Schaltungsanordnung zur Geräuschreduktion bei der Sprachübertragung in Kommunikationssystemen |
US7274794B1 (en) | 2001-08-10 | 2007-09-25 | Sonic Innovations, Inc. | Sound processing system including forward filter that exhibits arbitrary directivity and gradient response in single wave sound environment |
JP3453130B2 (ja) * | 2001-08-28 | 2003-10-06 | 日本電信電話株式会社 | 雑音源判別装置及び方法 |
US6959276B2 (en) * | 2001-09-27 | 2005-10-25 | Microsoft Corporation | Including the category of environmental noise when processing speech signals |
JP3826032B2 (ja) * | 2001-12-28 | 2006-09-27 | 株式会社東芝 | 音声認識装置、音声認識方法及び音声認識プログラム |
AUPS102902A0 (en) * | 2002-03-13 | 2002-04-11 | Hearworks Pty Ltd | A method and system for reducing potentially harmful noise in a signal arranged to convey speech |
EP1351479A1 (en) * | 2002-04-04 | 2003-10-08 | Castel GmbH | Generating an undisturbed signal out of an audio signal including a disturbing signal |
US7139703B2 (en) * | 2002-04-05 | 2006-11-21 | Microsoft Corporation | Method of iterative noise estimation in a recursive framework |
US7065486B1 (en) * | 2002-04-11 | 2006-06-20 | Mindspeed Technologies, Inc. | Linear prediction based noise suppression |
CN100370517C (zh) * | 2002-07-16 | 2008-02-20 | 皇家飞利浦电子股份有限公司 | 一种对编码信号进行解码的方法 |
US7246059B2 (en) * | 2002-07-26 | 2007-07-17 | Motorola, Inc. | Method for fast dynamic estimation of background noise |
US7024353B2 (en) * | 2002-08-09 | 2006-04-04 | Motorola, Inc. | Distributed speech recognition with back-end voice activity detection apparatus and method |
US20040064314A1 (en) * | 2002-09-27 | 2004-04-01 | Aubert Nicolas De Saint | Methods and apparatus for speech end-point detection |
US7415065B2 (en) * | 2002-10-25 | 2008-08-19 | Science Applications International Corporation | Adaptive filtering in the presence of multipath |
US7162420B2 (en) * | 2002-12-10 | 2007-01-09 | Liberato Technologies, Llc | System and method for noise reduction having first and second adaptive filters |
EP1443498B1 (en) * | 2003-01-24 | 2008-03-19 | Sony Ericsson Mobile Communications AB | Noise reduction and audio-visual speech activity detection |
US8271279B2 (en) | 2003-02-21 | 2012-09-18 | Qnx Software Systems Limited | Signature noise removal |
US8326621B2 (en) * | 2003-02-21 | 2012-12-04 | Qnx Software Systems Limited | Repetitive transient noise removal |
US7885420B2 (en) * | 2003-02-21 | 2011-02-08 | Qnx Software Systems Co. | Wind noise suppression system |
US7949522B2 (en) | 2003-02-21 | 2011-05-24 | Qnx Software Systems Co. | System for suppressing rain noise |
TWI233590B (en) * | 2003-09-26 | 2005-06-01 | Ind Tech Res Inst | Energy feature extraction method for noisy speech recognition |
GB0326263D0 (en) * | 2003-11-11 | 2003-12-17 | Nokia Corp | Speech codecs |
AU2003288042A1 (en) * | 2003-11-12 | 2005-06-08 | Telecom Italia S.P.A. | Method and circuit for noise estimation, related filter, terminal and communication network using same, and computer program product therefor |
FR2865310A1 (fr) * | 2004-01-20 | 2005-07-22 | France Telecom | Procede de restauration de partiels d'un signal sonore |
JP4434813B2 (ja) * | 2004-03-30 | 2010-03-17 | 学校法人早稲田大学 | 雑音スペクトル推定方法、雑音抑圧方法および雑音抑圧装置 |
US20060018460A1 (en) * | 2004-06-25 | 2006-01-26 | Mccree Alan V | Acoustic echo devices and methods |
US7573947B2 (en) * | 2004-07-15 | 2009-08-11 | Terayon Communication Systems, Inc. | Simplified narrowband excision |
US20060020454A1 (en) * | 2004-07-21 | 2006-01-26 | Phonak Ag | Method and system for noise suppression in inductive receivers |
KR100657912B1 (ko) * | 2004-11-18 | 2006-12-14 | 삼성전자주식회사 | 잡음 제거 방법 및 장치 |
JP4283212B2 (ja) * | 2004-12-10 | 2009-06-24 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 雑音除去装置、雑音除去プログラム、及び雑音除去方法 |
US7567903B1 (en) | 2005-01-12 | 2009-07-28 | At&T Intellectual Property Ii, L.P. | Low latency real-time vocal tract length normalization |
WO2006116132A2 (en) * | 2005-04-21 | 2006-11-02 | Srs Labs, Inc. | Systems and methods for reducing audio noise |
US7418394B2 (en) * | 2005-04-28 | 2008-08-26 | Dolby Laboratories Licensing Corporation | Method and system for operating audio encoders utilizing data from overlapping audio segments |
US8767974B1 (en) * | 2005-06-15 | 2014-07-01 | Hewlett-Packard Development Company, L.P. | System and method for generating comfort noise |
TWI330355B (en) | 2005-12-05 | 2010-09-11 | Qualcomm Inc | Systems, methods, and apparatus for detection of tonal components |
JPWO2008007616A1 (ja) * | 2006-07-13 | 2009-12-10 | 日本電気株式会社 | 無音声発声の入力警告装置と方法並びにプログラム |
ATE425532T1 (de) * | 2006-10-31 | 2009-03-15 | Harman Becker Automotive Sys | Modellbasierte verbesserung von sprachsignalen |
US20080312916A1 (en) * | 2007-06-15 | 2008-12-18 | Mr. Alon Konchitsky | Receiver Intelligibility Enhancement System |
KR20100006492A (ko) | 2008-07-09 | 2010-01-19 | 삼성전자주식회사 | 부호화 방식 결정 방법 및 장치 |
US9253568B2 (en) * | 2008-07-25 | 2016-02-02 | Broadcom Corporation | Single-microphone wind noise suppression |
JP4660578B2 (ja) * | 2008-08-29 | 2011-03-30 | 株式会社東芝 | 信号補正装置 |
CN101983402B (zh) * | 2008-09-16 | 2012-06-27 | 松下电器产业株式会社 | 声音分析装置、方法、系统、合成装置、及校正规则信息生成装置、方法 |
EP2226794B1 (en) * | 2009-03-06 | 2017-11-08 | Harman Becker Automotive Systems GmbH | Background noise estimation |
CN101859568B (zh) * | 2009-04-10 | 2012-05-30 | 比亚迪股份有限公司 | 一种语音背景噪声的消除方法和装置 |
US8526754B2 (en) * | 2009-05-28 | 2013-09-03 | Aptina Imaging Corporation | System for enhancing depth of field with digital image processing |
EP2444966B1 (en) * | 2009-06-19 | 2019-07-10 | Fujitsu Limited | Audio signal processing device and audio signal processing method |
KR20120054081A (ko) * | 2009-08-25 | 2012-05-29 | 난양 테크놀러지컬 유니버시티 | 속삭임을 포함하는 입력 신호로부터 음성을 재구성하는 방법 및 시스템 |
US8577678B2 (en) * | 2010-03-11 | 2013-11-05 | Honda Motor Co., Ltd. | Speech recognition system and speech recognizing method |
JP5566846B2 (ja) * | 2010-10-15 | 2014-08-06 | 本田技研工業株式会社 | ノイズパワー推定装置及びノイズパワー推定方法並びに音声認識装置及び音声認識方法 |
US20120143604A1 (en) * | 2010-12-07 | 2012-06-07 | Rita Singh | Method for Restoring Spectral Components in Denoised Speech Signals |
US8838445B1 (en) * | 2011-10-10 | 2014-09-16 | The Boeing Company | Method of removing contamination in acoustic noise measurements |
GB2499781A (en) * | 2012-02-16 | 2013-09-04 | Ian Vince Mcloughlin | Acoustic information used to determine a user's mouth state which leads to operation of a voice activity detector |
CN104508737B (zh) | 2012-06-10 | 2017-12-05 | 纽昂斯通讯公司 | 用于具有多个声学区域的车载通信系统的噪声相关的信号处理 |
US9805738B2 (en) | 2012-09-04 | 2017-10-31 | Nuance Communications, Inc. | Formant dependent speech signal enhancement |
US9613633B2 (en) | 2012-10-30 | 2017-04-04 | Nuance Communications, Inc. | Speech enhancement |
CN109119096B (zh) * | 2012-12-25 | 2021-01-22 | 中兴通讯股份有限公司 | 一种vad判决中当前激活音保持帧数的修正方法及装置 |
CN104916292B (zh) * | 2014-03-12 | 2017-05-24 | 华为技术有限公司 | 检测音频信号的方法和装置 |
CN113114866A (zh) * | 2017-03-10 | 2021-07-13 | 株式会社Bonx | 便携通信终端及其控制方法、通信系统和记录介质 |
GB201814408D0 (en) * | 2018-09-05 | 2018-10-17 | Calrec Audio Ltd | A method and apparatus for processing an audio signal stream to attenuate an unwanted signal portion |
CN111341333B (zh) * | 2020-02-10 | 2023-01-17 | 腾讯科技(深圳)有限公司 | 噪声检测方法、噪声检测装置、介质及电子设备 |
CN114141222A (zh) * | 2022-01-26 | 2022-03-04 | 浙江振东光电科技有限公司 | 高速累加卡残留噪声抑制装置及抑制方法 |
CN116312545B (zh) * | 2023-05-26 | 2023-07-21 | 北京道大丰长科技有限公司 | 多噪声环境下的语音识别系统和方法 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3266042D1 (en) * | 1981-09-24 | 1985-10-10 | Gretag Ag | Method and apparatus for reduced redundancy digital speech processing |
US4628529A (en) * | 1985-07-01 | 1986-12-09 | Motorola, Inc. | Noise suppression system |
US5012518A (en) * | 1989-07-26 | 1991-04-30 | Itt Corporation | Low-bit-rate speech coder using LPC data reduction processing |
KR950013551B1 (ko) * | 1990-05-28 | 1995-11-08 | 마쯔시다덴기산교 가부시기가이샤 | 잡음신호예측장치 |
US5195132B1 (en) * | 1990-12-03 | 1996-03-19 | At & T Bell Lab | Telephone network speech signal enhancement |
US5319703A (en) * | 1992-05-26 | 1994-06-07 | Vmx, Inc. | Apparatus and method for identifying speech and call-progression signals |
US5533133A (en) * | 1993-03-26 | 1996-07-02 | Hughes Aircraft Company | Noise suppression in digital voice communications systems |
US5459814A (en) * | 1993-03-26 | 1995-10-17 | Hughes Aircraft Company | Voice activity detector for speech signals in variable background noise |
US5544250A (en) * | 1994-07-18 | 1996-08-06 | Motorola | Noise suppression system and method therefor |
-
1994
- 1994-11-15 CN CN94191041A patent/CN1129486A/zh active Pending
- 1994-11-15 WO PCT/US1994/012998 patent/WO1995015550A1/en not_active Application Discontinuation
- 1994-11-15 UA UA95083924A patent/UA41913C2/uk unknown
- 1994-11-15 CA CA002153170A patent/CA2153170C/en not_active Expired - Fee Related
- 1994-11-15 KR KR1019950703183A patent/KR0175965B1/ko not_active IP Right Cessation
- 1994-11-15 JP JP7515622A patent/JPH08506434A/ja active Pending
- 1994-11-15 EP EP95902517A patent/EP0681730A4/en not_active Ceased
- 1994-11-15 PL PL94310056A patent/PL174216B1/pl unknown
-
1995
- 1995-05-31 US US08/455,932 patent/US5706394A/en not_active Expired - Lifetime
-
1996
- 1996-10-30 US US08/755,796 patent/US5781883A/en not_active Expired - Lifetime
-
1997
- 1997-01-28 US US08/790,006 patent/US5708754A/en not_active Expired - Lifetime
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100336307C (zh) * | 2005-04-28 | 2007-09-05 | 北京航空航天大学 | 接收机射频系统电路内部噪声的分配方法 |
CN101322183B (zh) * | 2006-02-16 | 2011-09-28 | 日本电信电话株式会社 | 信号失真消除装置、方法 |
CN101577847B (zh) * | 2008-05-08 | 2013-01-02 | 索尼株式会社 | 信号处理设备和信号处理方法 |
CN110383700A (zh) * | 2017-03-10 | 2019-10-25 | 英特尔Ip公司 | 杂散降低电路和装置、无线电收发器、移动终端、用于杂散降低的方法和计算机程序 |
Also Published As
Publication number | Publication date |
---|---|
PL310056A1 (en) | 1995-11-13 |
KR0175965B1 (ko) | 1999-04-01 |
US5708754A (en) | 1998-01-13 |
UA41913C2 (uk) | 2001-10-15 |
PL174216B1 (pl) | 1998-06-30 |
CA2153170A1 (en) | 1995-06-08 |
CA2153170C (en) | 2000-12-19 |
WO1995015550A1 (en) | 1995-06-08 |
US5781883A (en) | 1998-07-14 |
EP0681730A1 (en) | 1995-11-15 |
JPH08506434A (ja) | 1996-07-09 |
KR960700498A (ko) | 1996-01-20 |
EP0681730A4 (en) | 1997-12-17 |
US5706394A (en) | 1998-01-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1129486A (zh) | 通信系统中降低传输噪声的方法 | |
EP1154408B1 (en) | Multimode speech coding and noise reduction | |
EP1253581B1 (en) | Method and system for speech enhancement in a noisy environment | |
EP2362389B1 (en) | Noise suppressor | |
CN1111973C (zh) | 改进了的数字蜂窝应用的回波消除器 | |
EP2346032B1 (en) | Noise suppressor and voice decoder | |
CN114175152A (zh) | 用于增强劣化音频信号的系统和方法 | |
KR102316712B1 (ko) | 심화 신경망을 이용한 다채널 기반의 잡음 및 에코 신호 통합 제거 장치 | |
CN114333912B (zh) | 语音激活检测方法、装置、电子设备和存储介质 | |
CN113593599A (zh) | 一种去除语音信号中噪声信号的方法 | |
KR102316626B1 (ko) | 병렬 구조의 심화신경망을 이용한 잡음 및 에코 신호 통합 제거 방법 및 장치 | |
US9875748B2 (en) | Audio signal noise attenuation | |
CN114724574B (zh) | 一种期望声源方向可调的双麦克风降噪方法 | |
CN116959467A (zh) | 一种融合噪声场景的通信增强方法、系统及存储介质 | |
KR102374167B1 (ko) | 어텐션 메커니즘을 이용한 음성 신호 추정 방법 및 장치 | |
KR20130094246A (ko) | 반도체 장치 및 음성 통신 장치 | |
Stadermann et al. | Voice activity detection in noisy environments. | |
CN115101082B (zh) | 语音增强方法、装置、设备、存储介质及程序产品 | |
Rao et al. | Speech enhancement using perceptual Wiener filter combined with unvoiced speech—A new Scheme | |
Wang et al. | Analysis of Morse Signal Noise Reduction Methods | |
Priyanka et al. | Implementation and comparison of echo cancellation algorithms using adaptive filtering techniques in TMS320C6748 DSK | |
CN119091901A (zh) | 一种回声消除的方法和装置 | |
CN119091900A (zh) | 一种回声消除和降噪的方法和装置 | |
CN115910090A (zh) | 数据信号处理方法、装置、设备及存储介质 | |
MXPA95001343A (en) | Transmitted noise reduction in communication systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |