CN108154885A - 一种使用qr-rls算法对多通道语音信号去混响方法 - Google Patents
一种使用qr-rls算法对多通道语音信号去混响方法 Download PDFInfo
- Publication number
- CN108154885A CN108154885A CN201711353578.5A CN201711353578A CN108154885A CN 108154885 A CN108154885 A CN 108154885A CN 201711353578 A CN201711353578 A CN 201711353578A CN 108154885 A CN108154885 A CN 108154885A
- Authority
- CN
- China
- Prior art keywords
- signal
- reverberation
- coefficient
- speech
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0224—Processing in the time domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
- G10L21/0308—Voice signal separating characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明涉及一种使用QR‑RLS算法对多通道语音信号去混响方法,属于信号处理技术领域。该方法将采集得到的带混响语音信号进行短时傅里叶变换,并在频域对输入信号进行延迟处理,通过混响时间T60计算混响语音信号的衰减常数Δ,从而估计出晚期混响信号和期望信号的功率谱密度;然后根据得到的期望信号功率谱密度的估计值计算期望信号2范数的加权系数;最后将延迟信号和带混响语音信号作为QR‑RLS算法的输入数据,对其进行迭代更新,最后输出预测滤波器系数。本发明有效避免了当输入信号不具有一致性激励性时,自相关矩阵及其对应的求逆问题是病态的问题;使在病态环境下可以很容易的随时检查变换信息矩阵的正定性,从而有效提升了去混响系统中自适应模块的稳定性。
Description
技术领域
本发明属于信号处理技术领域,涉及一种使用QR-RLS算法对多通道语音信号去混响方法。
背景技术
房间的混响问题严重的影响了语音的质量和识别系统的识别率。近年来,发展出很多的去混响算法来解决这一问题,比如波束形成技术(beamforming)和房间传输函数的逆滤波技术等。然而这些方法需要精确的DOA(direction of arrival)估计或者房间的声学参数等,因此,这些算法性能有限。
去混响技术可以根据是否需要对声学冲激响应进行估计来分类。于是把去混响技术分为混响抑制和混响消除,前者不需要估计冲激响应,而后者需要冲激响应的估计。混响抑制技术是基于以下假设:①混响是一个加性过程,②目标信号与混响信号不相关,③混响信号模型服从正态分布。混响抑制可以继续分为五大类,分别为:语音建模技术、线性预测残留增强技术、时域包络滤波技术、谱增强技术和空间处理技术。混响消除技术可以看作是冲激响应逆滤波问题。而该技术又可以继续分为:盲反卷积技术,同态解卷积技术和基于调和的去混响技术等。
现阶段使用比较广泛的去混响技术就是WPE(weighted prediction error)技术。在WPE中,MCLP(multi-channel linear predictor)被用在STFT域通过混响语音的前几帧来估计晚期混响成分。然后将混响语音与晚期混响作差,即可得到增强后的语音信号。该方法认为STFT参数独立同服从高斯分布,预测滤波器的系数在每一帧中通过最大似然估计的方法计算。
另一种基于MCLP去混响的算法是利用语音的稀疏性来实现的,使期望信号在STFT域的最大稀疏性达到去混响的目的。在此基础上产生了使用RLS算法自适应去混响的方法,但是由于RLS计算复杂度高,数值不稳定等特性,当房间的冲激响应或者声源发生移动时,去混响的效果往往不是很理想。因此,需要一种使用QR-RLS算法对语音信号去混响方法。
发明内容
有鉴于此,本发明的目的在于提供一种使用QR-RLS算法对多通道语音信号去混响方法,采用QR-RLS算法来代替基于MCLP方法中的RLS算法,改善自适应去混响算法在收敛速度不变的基础上提高数值的稳定性,并且避免RLS算法中的求逆运算,使得当房间冲激响应或者声源发生移动时,可以有效的提高去混响系统的稳定性。
为达到上述目的,本发明提供如下技术方案,具体包括以下步骤:
步骤1:使用多个全指向性麦克风在封闭房间内采集带混响的语音信号;
步骤2:使用赛宾公式估计房间的混响时间T60,即直达声声压级下降60dB对应的时间,计算公式如下:
其中,α为房间吸声系数,V和S分别为房间的体积和表面积;
步骤3:将采集得到的带混响语音信号进行短时傅里叶变换,把信号由时域转化为频域,并在频域对带混响语音信号进行延迟处理得到延迟信号,延迟信号延迟的阶数由预测滤波器的长度决定;
步骤4:通过混响时间T60计算混响语音信号的衰减常数Δ,从而估计出晚期混响信号和期望信号的功率谱密度,Δ的计算公式如下:
其中,Td为语音早期反射成分的时间;
步骤5:根据步骤4得到的期望信号功率谱密度的估计值计算期望信号2范数的加权系数;
步骤6:将延迟信号和带混响语音信号作为QR-RLS算法的输入数据,对其进行迭代更新,最后输出预测滤波器系数;
步骤7:将延迟信号与预测滤波器系数相乘得到晚期混响信号,带混响语音信号减去晚期混响信号等于去混响后的期望信号,对去混响后的期望信号进行逆傅里叶变换,得到时域上的去混响后的期望信号。
进一步,所述步骤4中,采用多个间隔一定距离的麦克风对混响语音进行采集,产生多通道的带混响语音数据,采用多通道线性预测(MCLP)模型对晚期混响信号进行建模,晚期混响信号成分u(n)即为延迟麦克风信号的和,即:
其中G(n)=[g1(n),…,gM(n)]代表多输入多输出预测滤波器的预测系数,gM(n)为第M个麦克风的预测系数,为延迟后的带混响数据。
进一步,所述步骤4中,晚期混响信号和期望信号的功率谱密度的估计:
假设晚期混响信号的功率谱密度是基于指数衰减的模型,首先计算衰减系数Δ,估计房间的混响时间T60、语音早期反射成分的时间Td;然后估计晚期混响信号和带混响语音信号的PSD,两者相减得到期望信号的PSD;在期望信号PSD的计算中需要对其平滑处理。
进一步,所述步骤5中,计算期望信号2范数的加权系数;
线性预测滤波器系数估计基于期望信号在时域的最大稀疏性,即期望信号的混合p范数;预测滤波器系数的最优化问题使用QR-RLS算法来解决,使用加权2范数来近似表示p范数,加权2范数的权系数依赖于期望信号PSD,则期望信号2范数的加权系数计算公式如下:
其中,M是麦克风的数量,ε是非常小的正数,p是范数,是期望信号的PSD估计值。
进一步,所述步骤6中,QR-RLS算法自适应计算预测滤波器的系数:
首先对QR-RLS算法中的参数进行初始化,对输入数据的矩阵进行对角化,通过基本的Givens旋转矩阵得到所有的三角化矩阵;计算Givens旋转元素,将旋转元素分别用于信息矩阵和期望的信息向量,应用Givens旋转余弦元素计算误差信号,最后通过迭代更新的方式得到预测滤波器的预测系数。
本发明的有益效果在于:在收敛速度不变的基础上,充分利用QR-RLS算法的数值稳定性特性,有效避免了当输入信号不具有一致性激励性时,自相关矩阵及其对应的求逆问题是病态的问题;而且QR-RLS算法采用的QR分解方法避免了RLS问题不准确求解问题,在病态环境下可以很容易的随时检查变换信息矩阵的正定性,从而有效提升了去混响系统中自适应模块的稳定性。
附图说明
为了使本发明的目的、技术方案和有益效果更加清楚,本发明提供如下附图进行说明:
图1为多通道线性预测模型图;
图2为使用QR-RLS算法去语音混响的流程图。
具体实施方式
下面将结合附图,对本发明的优选实施例进行详细的描述。
图2为使用QR-RLS算法去语音混响的流程图,一种使用QR-RLS算法对多通道语音信号去混响方法的具体实施步骤包括:
步骤1:使用两个全指向性麦克风在封闭房间内采集带混响的语音信号;
步骤2:使用赛宾公式估计房间的混响时间T60,即直达声声压级下降60dB对应的时间,计算公式如下:
其中,α为房间吸声系数,V和S分别为房间的体积和表面积;
步骤3:将采集得到的带混响语音信号进行短时傅里叶变换,把信号由时域转化为频域,并在频域对带混响语音信号进行延迟处理得到延迟信号,延迟信号延迟的阶数由预测滤波器的长度决定;
步骤4:通过混响时间T60计算混响语音信号的衰减常数Δ,从而估计出晚期混响信号和期望信号的功率谱密度,Δ的计算公式如下:
其中,Td为语音早期反射成分的时间。
采用两个间隔一定距离的麦克风对混响语音进行采集,产生两通道的带混响语音数据,采用多通道线性预测(MCLP)模型对晚期混响信号进行建模,晚期混响信号成分u(n)即为延迟麦克风信号的和,即:
其中G(n)=[g1(n),…,gM(n)]代表多输入多输出预测滤波器的预测系数,gM(n)为第M个麦克风的预测系数,为延迟后的带混响数据,原理图如图1,使用过去的信号来估计当前信号。
晚期混响信号和期望信号的功率谱密度的估计:假设晚期混响信号的功率谱密度是基于指数衰减的模型,首先计算衰减系数Δ,估计房间的混响时间T60、语音早期反射成分的时间Td;然后估计晚期混响信号和带混响语音信号的PSD,两者相减得到期望信号的PSD;在期望信号PSD的计算中需要对其平滑处理。
步骤5:根据步骤4得到的期望信号功率谱密度的估计值计算期望信号2范数的加权系数:线性预测滤波器系数估计基于期望信号在时域的最大稀疏性,即期望信号的混合p范数;预测滤波器系数的最优化问题使用QR-RLS算法来解决,使用加权2范数来近似表示p范数,加权2范数的权系数依赖于期望信号PSD,则期望信号2范数的加权系数计算公式如下:
其中,M是麦克风的数量,ε是非常小的正数,p是范数,是期望信号的PSD估计值。
步骤6:将延迟信号和带混响语音信号作为QR-RLS算法的输入数据,对输入数据的矩阵进行对角化,通过基本的Givens旋转矩阵得到所有的三角化矩阵;计算Givens旋转元素,将旋转元素分别用于信息矩阵和期望的信息向量,应用Givens旋转余弦元素计算误差信号,最后通过迭代更新的方式得到预测滤波器的预测系数。
步骤7:将延迟的带混响信号与预测滤波器系数相乘得到晚期混响信号,带混响语音信号减去晚期混响信号等于去混响后的期望信号,对去混响后的期望信号进行逆傅里叶变换,得到时域上的去混响后的期望信号。
最后说明的是,以上优选实施例仅用以说明本发明的技术方案而非限制,尽管通过上述优选实施例已经对本发明进行了详细的描述,但本领域技术人员应当理解,可以在形式上和细节上对其作出各种各样的改变,而不偏离本发明权利要求书所限定的范围。
Claims (5)
1.一种使用QR-RLS算法对多通道语音信号去混响方法,其特征在于,该方法具体包括以下步骤:
S1:使用麦克风在封闭房间内采集带混响的语音信号;
S2:使用赛宾公式估计房间的混响时间T60,即直达声声压级下降60dB对应的时间,计算公式如下:
其中,α为房间吸声系数,V和S分别为房间的体积和表面积;
S3:将采集得到的带混响语音信号进行短时傅里叶变换,把信号由时域转化为频域,并在频域对带混响语音信号进行延迟处理得到延迟信号,信号延迟的阶数由预测滤波器的长度决定;
S4:通过混响时间T60计算混响语音信号的衰减常数Δ,从而估计出晚期混响信号和期望信号的功率谱密度,Δ的计算公式如下:
其中,Td为语音早期反射成分的时间;
S5:根据S4得到的期望信号功率谱密度的估计值计算期望信号2范数的加权系数;
S6:将延迟信号和带混响语音信号作为基于QR分解的RLS算法(QR-decomposition-based recursive least squares,QR-RLS)算法的输入数据,对其进行迭代更新,最后输出预测滤波器系数;
S7:将延迟信号与预测滤波器系数相乘得到晚期混响信号,带混响语音信号减去晚期混响信号等于去混响后的期望信号,对去混响后的期望信号进行逆傅里叶变换,得到时域上的去混响后的期望信号。
2.如权利要求1所述的一种使用QR-RLS算法对多通道语音信号去混响方法,其特征在于,所述步骤S4中,采用间隔一定距离的麦克风对混响语音进行采集,产生带混响语音数据,采用多通道线性预测(MCLP)模型对晚期混响信号进行建模,晚期混响信号成分u(n)即为延迟信号的和,即:
其中G(n)=[g1(n),…,gM(n)]代表多输入多输出预测滤波器的预测系数,gM(n)为第M个麦克风的预测系数,为延迟后的带混响数据。
3.如权利要求1所述的一种使用QR-RLS算法对多通道语音信号去混响方法,其特征在于,所述步骤S4中,晚期混响信号和期望信号的功率谱密度的估计:
假设晚期混响信号的功率谱密度是基于指数衰减的模型,首先计算衰减系数Δ,估计房间的混响时间T60、语音早期反射成分的时间Td;然后估计晚期混响信号和带混响语音信号的功率谱密度(power spectral density,PSD),两者相减得到期望信号的PSD;在期望信号PSD的计算中需要对其平滑处理。
4.如权利要求1所述的一种使用QR-RLS算法对多通道语音信号去混响方法,其特征在于,所述步骤S5中,所述期望信号2范数的加权系数计算为:
线性预测滤波器系数估计基于期望信号在时域的最大稀疏性,即期望信号的混合p范数;预测滤波器系数的最优化问题使用QR-RLS算法来解决,使用加权2范数来近似表示p范数,加权2范数的权系数依赖于期望信号PSD,则期望信号2范数的加权系数计算公式如下:
其中,M是麦克风的数量,ε是非常小的正数,p是范数,是期望信号的PSD估计值。
5.如权利要求1所述的一种使用QR-RLS算法对多通道语音信号去混响方法,其特征在于,所述步骤S6中,QR-RLS算法自适应计算预测滤波器的预测系数:
首先对QR-RLS算法中的参数进行初始化,对输入数据的矩阵进行对角化,通过基本的Givens旋转矩阵得到所有的三角化矩阵;计算Givens旋转元素,将旋转元素分别用于信息矩阵和期望的信息向量,应用Givens旋转余弦元素计算误差信号,最后通过迭代更新的方式得到预测滤波器的预测系数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711353578.5A CN108154885A (zh) | 2017-12-15 | 2017-12-15 | 一种使用qr-rls算法对多通道语音信号去混响方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711353578.5A CN108154885A (zh) | 2017-12-15 | 2017-12-15 | 一种使用qr-rls算法对多通道语音信号去混响方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108154885A true CN108154885A (zh) | 2018-06-12 |
Family
ID=62466330
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711353578.5A Pending CN108154885A (zh) | 2017-12-15 | 2017-12-15 | 一种使用qr-rls算法对多通道语音信号去混响方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108154885A (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109637554A (zh) * | 2019-01-16 | 2019-04-16 | 辽宁工业大学 | 基于cdr的mclp语音去混响方法 |
WO2020078210A1 (zh) * | 2018-10-18 | 2020-04-23 | 电信科学技术研究院有限公司 | 混响语音信号中后混响功率谱的自适应估计方法及装置 |
CN111341303A (zh) * | 2018-12-19 | 2020-06-26 | 北京猎户星空科技有限公司 | 一种声学模型的训练方法及装置、语音识别方法及装置 |
CN111599374A (zh) * | 2020-04-16 | 2020-08-28 | 云知声智能科技股份有限公司 | 一种单通道语音去混响方法及装置 |
CN113160842A (zh) * | 2021-03-06 | 2021-07-23 | 西安电子科技大学 | 一种基于mclp的语音去混响方法及系统 |
CN113393853A (zh) * | 2021-04-29 | 2021-09-14 | 青岛海尔科技有限公司 | 混合声信号的处理方法及装置、存储介质及电子装置 |
CN113409810A (zh) * | 2021-08-19 | 2021-09-17 | 成都启英泰伦科技有限公司 | 一种联合去混响的回声消除方法及装置 |
CN114813129A (zh) * | 2022-04-30 | 2022-07-29 | 北京化工大学 | 基于wpe与emd的滚动轴承声信号故障诊断方法 |
CN115019819A (zh) * | 2022-05-30 | 2022-09-06 | 深圳万兴软件有限公司 | 基于增益补偿的音频处理方法、装置、设备及介质 |
CN115273871A (zh) * | 2021-04-29 | 2022-11-01 | 阿里巴巴新加坡控股有限公司 | 数据处理方法、装置、电子设备和存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1142302A (zh) * | 1994-12-30 | 1997-02-05 | 马特端通讯法国公司 | 一种用子带滤波的声音回声消除器 |
US20050008145A1 (en) * | 2003-07-09 | 2005-01-13 | Gunther Jacob H. | Echo cancellation filter |
CN102394847A (zh) * | 2011-11-17 | 2012-03-28 | 浙江三维无线科技有限公司 | 一种采用复数qr-rls算法完成dpd功能的系统及方法 |
CN106533500A (zh) * | 2016-11-25 | 2017-03-22 | 上海伟世通汽车电子系统有限公司 | 一种优化回声消除器收敛特性的方法 |
-
2017
- 2017-12-15 CN CN201711353578.5A patent/CN108154885A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1142302A (zh) * | 1994-12-30 | 1997-02-05 | 马特端通讯法国公司 | 一种用子带滤波的声音回声消除器 |
US20050008145A1 (en) * | 2003-07-09 | 2005-01-13 | Gunther Jacob H. | Echo cancellation filter |
CN102394847A (zh) * | 2011-11-17 | 2012-03-28 | 浙江三维无线科技有限公司 | 一种采用复数qr-rls算法完成dpd功能的系统及方法 |
CN106533500A (zh) * | 2016-11-25 | 2017-03-22 | 上海伟世通汽车电子系统有限公司 | 一种优化回声消除器收敛特性的方法 |
Non-Patent Citations (2)
Title |
---|
ANTE JUKI´等: ""Adaptive Speech Dereverberation Using Constrained Sparse Multichannel Linear Prediction"", 《IEEE SIGNAL PROCESSING LETTERS》 * |
张明友等: "《近代信号处理理论与方法》", 31 January 2005, 国防工业出版社 * |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020078210A1 (zh) * | 2018-10-18 | 2020-04-23 | 电信科学技术研究院有限公司 | 混响语音信号中后混响功率谱的自适应估计方法及装置 |
CN111341303A (zh) * | 2018-12-19 | 2020-06-26 | 北京猎户星空科技有限公司 | 一种声学模型的训练方法及装置、语音识别方法及装置 |
CN111341303B (zh) * | 2018-12-19 | 2023-10-31 | 北京猎户星空科技有限公司 | 一种声学模型的训练方法及装置、语音识别方法及装置 |
CN109637554A (zh) * | 2019-01-16 | 2019-04-16 | 辽宁工业大学 | 基于cdr的mclp语音去混响方法 |
CN111599374A (zh) * | 2020-04-16 | 2020-08-28 | 云知声智能科技股份有限公司 | 一种单通道语音去混响方法及装置 |
CN113160842A (zh) * | 2021-03-06 | 2021-07-23 | 西安电子科技大学 | 一种基于mclp的语音去混响方法及系统 |
CN113160842B (zh) * | 2021-03-06 | 2024-04-09 | 西安电子科技大学 | 一种基于mclp的语音去混响方法及系统 |
CN115273871A (zh) * | 2021-04-29 | 2022-11-01 | 阿里巴巴新加坡控股有限公司 | 数据处理方法、装置、电子设备和存储介质 |
CN113393853A (zh) * | 2021-04-29 | 2021-09-14 | 青岛海尔科技有限公司 | 混合声信号的处理方法及装置、存储介质及电子装置 |
CN113409810A (zh) * | 2021-08-19 | 2021-09-17 | 成都启英泰伦科技有限公司 | 一种联合去混响的回声消除方法及装置 |
CN113409810B (zh) * | 2021-08-19 | 2021-10-29 | 成都启英泰伦科技有限公司 | 一种联合去混响的回声消除方法 |
CN114813129A (zh) * | 2022-04-30 | 2022-07-29 | 北京化工大学 | 基于wpe与emd的滚动轴承声信号故障诊断方法 |
CN114813129B (zh) * | 2022-04-30 | 2024-03-26 | 北京化工大学 | 基于wpe与emd的滚动轴承声信号故障诊断方法 |
CN115019819A (zh) * | 2022-05-30 | 2022-09-06 | 深圳万兴软件有限公司 | 基于增益补偿的音频处理方法、装置、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108154885A (zh) | 一种使用qr-rls算法对多通道语音信号去混响方法 | |
CN110100457B (zh) | 基于噪声时变环境的加权预测误差的在线去混响算法 | |
CN108172231B (zh) | 一种基于卡尔曼滤波的去混响方法及系统 | |
CN107452389B (zh) | 一种通用的单声道实时降噪方法 | |
CN108141656B (zh) | 用于麦克风的数字信号处理的方法和装置 | |
CN112863535B (zh) | 一种残余回声及噪声消除方法及装置 | |
CN109841206A (zh) | 一种基于深度学习的回声消除方法 | |
CN110148420A (zh) | 一种适用于噪声环境下的语音识别方法 | |
CN109979476B (zh) | 一种语音去混响的方法及装置 | |
CN108293170B (zh) | 波束成形应用中的自适应无相位失真幅度响应均衡的方法及装置 | |
CN115424627A (zh) | 基于卷积循环网络和wpe算法的语音增强混合处理方法 | |
Dietzen et al. | Partitioned block frequency domain Kalman filter for multi-channel linear prediction based blind speech dereverberation | |
Wung et al. | Robust multichannel linear prediction for online speech dereverberation using weighted householder least squares lattice adaptive filter | |
CN114220453A (zh) | 基于频域卷积传递函数的多通道非负矩阵分解方法及系统 | |
Albu | The constrained stability least mean square algorithm for active noise control | |
CN110111802A (zh) | 基于卡尔曼滤波的自适应去混响方法 | |
WO2020078210A1 (zh) | 混响语音信号中后混响功率谱的自适应估计方法及装置 | |
Málek et al. | Sparse target cancellation filters with application to semi-blind noise extraction | |
Jin | Adaptive reverberation cancelation for multizone soundfield reproduction using sparse methods | |
CN111968659B (zh) | 一种基于优化imcra的麦克风阵列语音增强方法 | |
CN116052702A (zh) | 一种基于卡尔曼滤波的低复杂度多通道去混响降噪方法 | |
US11195540B2 (en) | Methods and apparatus for an adaptive blocking matrix | |
Jukić et al. | Speech dereverberation with convolutive transfer function approximation using MAP and variational deconvolution approaches | |
Braun et al. | Low complexity online convolutional beamforming | |
Gao et al. | A physical model-based self-supervised learning method for signal enhancement under reverberant environment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180612 |