[go: up one dir, main page]

CN115223580A - 一种基于球形麦克风阵列与深度神经网络的语音增强方法 - Google Patents

一种基于球形麦克风阵列与深度神经网络的语音增强方法 Download PDF

Info

Publication number
CN115223580A
CN115223580A CN202210606103.7A CN202210606103A CN115223580A CN 115223580 A CN115223580 A CN 115223580A CN 202210606103 A CN202210606103 A CN 202210606103A CN 115223580 A CN115223580 A CN 115223580A
Authority
CN
China
Prior art keywords
microphone array
signal
noise
voice
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210606103.7A
Other languages
English (en)
Other versions
CN115223580B (zh
Inventor
朱凤霞
张开生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian Peihua University
Original Assignee
Xian Peihua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian Peihua University filed Critical Xian Peihua University
Priority to CN202210606103.7A priority Critical patent/CN115223580B/zh
Publication of CN115223580A publication Critical patent/CN115223580A/zh
Application granted granted Critical
Publication of CN115223580B publication Critical patent/CN115223580B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明公开了一种基于球形麦克风阵列与深度神经网络的语音增强方法,具体包括如下步骤:步骤1:麦克风阵列前期处理阶段;步骤2:对语音模型进行训练;步骤3:DNN语音增强阶段;本发明以声学分析到语音增强为路线,利用球形麦克风阵列产生空间滤波器,使噪声功率最小化。针对单通道语音增强对实际噪声环境、传统波束形成算法语音增强效果不理想的问题,通过深度神经网络对前期处理后的噪声及语音信号之间的复杂非线性关系进行学习,分类出语音信号和噪声信号,实现对语音信号的增强。本发明方法与单一波束形成算法及深度神经网络语音增强相比,改善效果较为明显,且在多种噪声环境下同样适用,具有较强的鲁棒性。

Description

一种基于球形麦克风阵列与深度神经网络的语音增强方法
技术领域
本发明属于语音信号处理技术领域,具体涉及一种基于球形麦克风阵列与深度神经网络的语音增强方法。
背景技术
语音识别因其简洁便利的特性,跻身自动化领域的热点话题,它可以将人们从繁杂记忆中解放出来,仅用一句机器可识别的指令即可完成相应操作,因此在具有人机交互的系统如车载音响设备、手机及家电等领域应用十分广泛,极大方便了人们的生产生活。近十几年来,随着大数据语料的积累量不断提升及机器学习研究不断深入,语音识别技术取得了跨越式的发展。虽然传统的单通道语音识别已经取得较高的识别率,但是仍然需要根据实际需要进行进一步优化,尤其是在低信噪比及混响条件下语音识别率不能得到保障,存在语音增强效果不理想的问题。
发明内容
本发明的目的是提供一种基于球形麦克风阵列与深度神经网络的语音增强方法,解决了目前语音识别在低信噪比及混响条件下的识别率不够高,用户体验有待进一步提高和优化的问题。
本发明所采用的技术方案是,
一种基于球形麦克风阵列与深度神经网络的语音增强方法,具体包括如下步骤:
步骤1:麦克风阵列前期处理阶段:通过球形麦克风阵列对多通道语音进行拾取,阵列形成的波束能够定位到目标语音,使噪声信号得到抑制,从而提取到目标语音;
步骤2:对语音模型进行训练;将经过麦克风阵列前期处理后残留下的噪声信号与目标语音信号分为两组特征样本,分别输入到DNN的输入端进行训练,利用DNN的前向传播和反向传播算法得到网络模型;
步骤3:DNN语音增强阶段:输入语音,经过麦克风阵列处理之后得到特征向量,然后将特征向量输入到步骤2得到的网络模型中进行增强处理,最后将输出的特征向量,利用波形重构方法合成纯净语音。
本发明的特点还在于;
球形麦克风阵列为三维阵列,球形麦克风阵列可以得到信号的水平方向角、垂直方位角,还可以得到声源与麦克风阵列参考点距离的三维信息。
步骤1中,采用线性约束最小方差波束形成LCMV结构,随着输出信号的变化,对滤波的权重系数进行动态调整,适应多变的噪声,并根据DNN对残余噪声进行处理,首先将麦克风阵列各阵元接收到的信号进行时延补偿,做DFT变换到频域,然后在频域内划分子频带,在每个子频带内运用窄带LCVM算法,最后将得到的结果作IDFT逆变换回到时域。
步骤1中,麦克风阵列由多个阵元组合而成,利用时延补偿特性可以获得xn(t),表示时序一致的信号,然后对其采样,得到如下公式(1):
x(n)=1Ms(n)+v(n) (1);
其中,xn(t)为采样后信号向量,值为x(n)=[x1(n)x2(n)...xM(n)]T,1M=[11...1]T;s(n)为期望信号,v(n)=[v1(n)v2(n)...vM(n)]T为噪声向量,将接收到的信号划分为S段,每段包含N个采样点,对其做DFT,得到式(2):
x(k,s)=[x1(k,s)x2(k,s)...xM(K,S)]T (2);
由式(1)和式(2)可得式(3):
x(k,s)=1Ms(k,s)+v(k,s) (3);
其中s(k,s)为期望输出信号v(k,s)=[v1(k,s)v2(k,s)...vM(k,s)]T,在第s段做N次窄带LCMV波束形成。
球形麦克风阵列选用直径为8.4cm的球形麦克风阵列,设置球形麦克风阵列为球状且为等距分布。
本发明的有益效果是,本发明一种基于球形麦克风阵列与深度神经网络的语音增强方法,在进行基音检测的过程中,第一步根据线性预测法对输入的语音信号进行分析处理,求出预测系数,线性预测处理的过程能够很好的去除共振峰效应。第二步使用OM-LSA算法对语音信号进行消噪,再使用维纳滤波算法对残余噪声进行进一步滤除。第三步利用主体延伸法对消噪后的语音进行基音检测。该方法在低信噪比不同噪声环境依然能够准确的检测出基音周期,检测准确率达到82%以上,具有较强的鲁棒性。
附图说明
图1是本发明一种基于球形麦克风阵列与深度神经网络的语音增强方法的球形麦克风阵列拓扑结构示意图;
图2是本发明一种基于球形麦克风阵列与深度神经网络的语音增强方法的实施例中涉及语音数据的自适应波束形成器阵元结构示意图;
图3是本发明一种基于球形麦克风阵列与深度神经网络的语音增强方法的算法框架图;
图4是本发明一种基于球形麦克风阵列与深度神经网络的语音增强方法与原始算法检测结果的LSD得分对比示意图;
图5是本发明一种基于球形麦克风阵列与深度神经网络的语音增强方法与原始算法语音增强结果的PESQ得分对比示意图;
具体实施方式
下面结合附图和具体实施方式对本发明一种基于球形麦克风阵列与深度神经网络的语音增强方法进行详细说明。
本发明提供一种基于球形麦克风阵列与深度神经网络的语音增强方法,以声学分析到语音增强为路线,利用球形麦克风阵列产生空间滤波器,使噪声功率最小化。通过深度神经网络(Deep Neural Networks,DNN)进一步对前期处理后的噪声及语音信号之间的复杂非线性关系进行学习,分类出语音信号和噪声信号,实现对语音信号的增强。此外,本发明所提方法在多种噪声环境下也同样适用,具有鲁棒性强、实施效果好的特点。
参阅附图1,本发明球形麦克风阵列拓扑结构示意图。球形麦克风阵列属于一种新型的三维阵列,相对于一维和二维来说,不仅可以得到信号的水平方向角、垂直方位角,还可以得到声源与麦克风阵列参考点距离等三维信息。此外,还有助于产生空间滤波器,并且对称可旋转的结构更利于使用波束形成算法确定声源位置。
参阅附图2,本发明自适应波束形成器阵元结构示意图。波束形成是声源信号对于空间进行选择的一种体现,麦克风阵列可获取来自于声源信号的位置信息,并且可以削弱方向性噪声,保留期望的语音信号,实现空间滤波。本发明采用线性约束最小方差波束形成(Linearly constrained minimum variance,LCMV)结构,随着输出信号的变化,对滤波的权重系数进行动态调整,适应多变的噪声,并根据DNN对残余噪声进行处理。首先将麦克风阵列各阵元接收到的信号进行时延补偿,做DFT变换到频域,然后在频域内划分子频带,在每个子频带内运用窄带LCVM算法,最后将得到的结果作IDFT逆变换回到时域,大大减少计算复杂度。
附图2中y1(t)为阵元接收到的信号,实际麦克风阵列往往是由多个阵元组合而成的,利用时延补偿特性可以获得xn(t),表示时序一致的信号,然后对其采样,得到式(1):
x(n)=1Ms(n)+v(n) (1);
其中xn(t)为采样后信号向量,值为x(n)=[x1(n)x2(n)...xM(n)]T,1M=[11...1]T,s(n)为期望信号,v(n)=[v1(n)v2(n)...vM(n)]T为噪声向量,将接收到的信号划分为S段,每段包含N个采样点,对其做DFT,得到式(2):
x(k,s)=[x1(k,s)x2(k,s)...xM(K,S)]T (2);
由式(1)和式(2)可得式(3):
x(k,s)=1Ms(k,s)+v(k,s) (3);
其中s(k,s)为期望输出信号v(k,s)=[v1(k,s)v2(k,s)...vM(k,s)]T,在第s段做N次窄带LCMV波束形成。
参阅附图3,本发明算法框架图。算法可分为三个主体部分:麦克风阵列前期处理阶段,语音模型训练阶段,DNN语音增强阶段。
麦克风阵列前期处理阶段,通过球形麦克风阵列对多通道语音进行拾取,阵列形成的波束能够较为准确的定位到目标语音,而使噪声信号得到抑制,从而更准确的提取到目标语音。本发明选用直径为8.4cm的球形麦克风阵列,设置阵列为球状且为等距分布,可从任何方向上以相同的语音输入效果来接收语音信息,其波束模式不受观测方向的影响,其识别精度可与孔径为126cm的大型线性阵列相媲美甚至效果更好。
语音模型训练阶段,经过麦克风阵列前期处理后,一部分与目标信号的无关信号被处理掉,残留下的噪声信号与目标语音信号将被分为两组特征样本,分别输入到DNN的输入端进行训练,利用DNN的前向传播和反向传播算法得到最优的网络模型。
DNN语音增强阶段,输入真实语音,经过麦克风阵列处理之后,得到特征向量,然后将特征向量输入到优化网络模型中进行增强处理,最后将输出的特征向量利用波形重构方法合成纯净语音,实现语音增强功能。
参阅附图4,本发明的语音LSD得分图。为了更好的说明本发明所提方法的可靠性,附图4中将本发明所提出的方法与无噪声分类的非负矩阵分解算法(Nonnegative MatrixFactorization,NMF)以及单独DNN语音增强算法在不同噪声背景下进行比较,对数谱距离(Log Spectral Distance,LSD),其定义如式(4)所示:
Figure BDA0003671384310000061
其中M表示帧长,L{S(l,m)}表示在一定动态范围内的对数谱,LSD数值越小,表示语音失真程度越小。它是对语音质量的客观评价指标,能够反映重构信号与原始信号的差异。
参阅附图5,本发明语音增强PESQ得分图。对不同算法进行语音质量感知评估(Perceptual Evaluation of Speech Quality,PESQ),PESQ用于现场和模拟网络中端到端的测量,对于环境噪声和噪声处理,通过PESQ进行评估,PESQ的得分范围在-0.5~4.5之间的条件下,得分越高表示语音的质量越好。本发明对未经处理的语音信号、最小方差无畸变响应(Minimum Variance Distortionless Response,MVDR)波束形成算法以及本发明算法进行质量评价,可以看出本发明算法在多种噪声背景下,PESQ得分均大于2.0,平均得分2.74,单一MVDR波束形成算法PESQ得分多数处于2.0以下,平均得分1.86。
可见,本发明一种基于球形麦克风阵列与深度神经网络的语音增强方法,相对于MVDR波束形成算法其性能得到一定的提高。另外,综合两种指标及语音增强结果,本发明所采用的球形麦克风阵列作为一次语音增强,结合DNN噪声语音分类进行第二步语音增强,结合目前主流语音识别利用神经网络的趋势,使用DNN进行语音二次增强,不仅可以有效去除噪声带来的影响,而且对于多种噪声环境表现出较强的鲁棒性。

Claims (5)

1.一种基于球形麦克风阵列与深度神经网络的语音增强方法,其特征在于,具体包括如下步骤:
步骤1:麦克风阵列前期处理阶段:通过球形麦克风阵列对多通道语音进行拾取,阵列形成的波束能够定位到目标语音,使噪声信号得到抑制,从而提取到目标语音;
步骤2:对语音模型进行训练;将经过麦克风阵列前期处理后残留下的噪声信号与目标语音信号分为两组特征样本,分别输入到DNN的输入端进行训练,利用DNN的前向传播和反向传播算法得到网络模型;
步骤3:DNN语音增强阶段:输入语音,经过麦克风阵列处理之后得到特征向量,然后将特征向量输入到步骤2得到的网络模型中进行增强处理,最后将输出的特征向量,利用波形重构方法合成纯净语音。
2.根据权利要求1所述的一种基于球形麦克风阵列与深度神经网络的语音增强方法,其特征在于,所述球形麦克风阵列为三维阵列,所述球形麦克风阵列可以得到信号的水平方向角、垂直方位角,还可以得到声源与麦克风阵列参考点距离的三维信息。
3.根据权利要求2所述的一种基于球形麦克风阵列与深度神经网络的语音增强方法,其特征在于,步骤1中,采用线性约束最小方差波束形成LCMV结构,随着输出信号的变化,对滤波的权重系数进行动态调整,适应多变的噪声,并根据DNN对残余噪声进行处理,首先将麦克风阵列各阵元接收到的信号进行时延补偿,做DFT变换到频域,然后在频域内划分子频带,在每个子频带内运用窄带LCVM算法,最后将得到的结果作IDFT逆变换回到时域。
4.根据权利要求3所述的一种基于球形麦克风阵列与深度神经网络的语音增强方法,其特征在于,步骤1中,所述麦克风阵列由多个阵元组合而成,利用时延补偿特性可以获得xn(t),表示时序一致的信号,然后对其采样,得到如下公式(1):
x(n)=1Ms(n)+v(n) (1);
其中,xn(t)为采样后信号向量,值为x(n)=[x1(n)x2(n)...xM(n)]T,1M=[11...1]T;s(n)为期望信号,v(n)=[v1(n)v2(n)...vM(n)]T为噪声向量,将接收到的信号划分为S段,每段包含N个采样点,对其做DFT,得到式(2):
x(k,s)=[x1(k,s)x2(k,s)...xM(K,S)]T (2);
由式(1)和式(2)可得式(3):
x(k,s)=1Ms(k,s)+v(k,s) (3);
其中s(k,s)为期望输出信号v(k,s)=[v1(k,s)v2(k,s)...vM(k,s)]T,在第s段做N次窄带LCMV波束形成。
5.根据权利要求2所述的一种基于球形麦克风阵列与深度神经网络的语音增强方法,其特征在于,所述球形麦克风阵列选用直径为8.4cm的球形麦克风阵列,设置球形麦克风阵列为球状且为等距分布。
CN202210606103.7A 2022-05-31 2022-05-31 一种基于球形麦克风阵列与深度神经网络的语音增强方法 Active CN115223580B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210606103.7A CN115223580B (zh) 2022-05-31 2022-05-31 一种基于球形麦克风阵列与深度神经网络的语音增强方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210606103.7A CN115223580B (zh) 2022-05-31 2022-05-31 一种基于球形麦克风阵列与深度神经网络的语音增强方法

Publications (2)

Publication Number Publication Date
CN115223580A true CN115223580A (zh) 2022-10-21
CN115223580B CN115223580B (zh) 2025-03-14

Family

ID=83608024

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210606103.7A Active CN115223580B (zh) 2022-05-31 2022-05-31 一种基于球形麦克风阵列与深度神经网络的语音增强方法

Country Status (1)

Country Link
CN (1) CN115223580B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060153360A1 (en) * 2004-09-03 2006-07-13 Walter Kellermann Speech signal processing with combined noise reduction and echo compensation
US20110293103A1 (en) * 2010-06-01 2011-12-01 Qualcomm Incorporated Systems, methods, devices, apparatus, and computer program products for audio equalization
US20130343571A1 (en) * 2012-06-22 2013-12-26 Verisilicon Holdings Co., Ltd. Real-time microphone array with robust beamformer and postfilter for speech enhancement and method of operation thereof
US20160240210A1 (en) * 2012-07-22 2016-08-18 Xia Lou Speech Enhancement to Improve Speech Intelligibility and Automatic Speech Recognition
US20190287546A1 (en) * 2018-03-19 2019-09-19 Bose Corporation Echo control in binaural adaptive noise cancellation systems in headsets
CN110600050A (zh) * 2019-09-12 2019-12-20 深圳市华创技术有限公司 基于深度神经网络的麦克风阵列语音增强方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060153360A1 (en) * 2004-09-03 2006-07-13 Walter Kellermann Speech signal processing with combined noise reduction and echo compensation
US20110293103A1 (en) * 2010-06-01 2011-12-01 Qualcomm Incorporated Systems, methods, devices, apparatus, and computer program products for audio equalization
US20130343571A1 (en) * 2012-06-22 2013-12-26 Verisilicon Holdings Co., Ltd. Real-time microphone array with robust beamformer and postfilter for speech enhancement and method of operation thereof
US20160240210A1 (en) * 2012-07-22 2016-08-18 Xia Lou Speech Enhancement to Improve Speech Intelligibility and Automatic Speech Recognition
US20190287546A1 (en) * 2018-03-19 2019-09-19 Bose Corporation Echo control in binaural adaptive noise cancellation systems in headsets
CN110600050A (zh) * 2019-09-12 2019-12-20 深圳市华创技术有限公司 基于深度神经网络的麦克风阵列语音增强方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
杨明;周顺;: "基于经验模态分解的宽带阵列DBF研究", 压电与声光, no. 04, 15 August 2012 (2012-08-15) *

Also Published As

Publication number Publication date
CN115223580B (zh) 2025-03-14

Similar Documents

Publication Publication Date Title
Bhat et al. A real-time convolutional neural network based speech enhancement for hearing impaired listeners using smartphone
CN107703486B (zh) 一种基于卷积神经网络cnn的声源定位方法
CN111415676B (zh) 一种基于分离矩阵初始化频点选择的盲源分离方法及系统
CN113129918B (zh) 联合波束形成和深度复数U-Net网络的语音去混响方法
CN106057210B (zh) 双耳间距下基于频点选择的快速语音盲源分离方法
CN112992121B (zh) 基于注意力残差学习的语音增强方法
CN116013344A (zh) 一种多种噪声环境下的语音增强方法
CN115424627A (zh) 基于卷积循环网络和wpe算法的语音增强混合处理方法
CN112885375A (zh) 基于听觉滤波器组和卷积神经网络的全局信噪比估计方法
CN118212929A (zh) 一种个性化Ambisonics语音增强方法
CN118351881A (zh) 一种基于降噪水声信号的融合特征分类识别方法
Qiu et al. Adversarial multi-task learning with inverse mapping for speech enhancement
Strauss et al. Improved normalizing flow-based speech enhancement using an all-pole gammatone filterbank for conditional input representation
CN110544485A (zh) 一种利用cnn的se-ed网络进行远场语音去混响的方法
CN114895245A (zh) 一种麦克风阵列声源定位方法、装置及存储介质
CN119360872A (zh) 一种基于生成对抗网络的人声增强降噪方法
CN110333484A (zh) 基于环境背景声感知与分析的室内区域级定位方法
CN118609574A (zh) 一种基于人工智能的声纹采集分析方法及系统
CN117409799B (zh) 音频信号处理系统及方法
Hu et al. Recognition and location of marine animal sounds using two-stream ConvNet with attention
CN115223580A (zh) 一种基于球形麦克风阵列与深度神经网络的语音增强方法
Pang et al. Multichannel speech enhancement based on neural beamforming and a context-focused post-filtering network
CN110838303A (zh) 一种利用传声器阵列的语音声源定位方法
CN117437930A (zh) 用于多通道语音信号的处理方法、装置、设备和存储介质
CN115713943A (zh) 基于复空间角中心高斯混合聚类模型和双向长短时记忆网络的波束成形语音分离方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant