[go: up one dir, main page]

CN1354455A - 一种从噪声环境中识别出语音和音乐的声音活动检测方法 - Google Patents

一种从噪声环境中识别出语音和音乐的声音活动检测方法 Download PDF

Info

Publication number
CN1354455A
CN1354455A CN 00127494 CN00127494A CN1354455A CN 1354455 A CN1354455 A CN 1354455A CN 00127494 CN00127494 CN 00127494 CN 00127494 A CN00127494 A CN 00127494A CN 1354455 A CN1354455 A CN 1354455A
Authority
CN
China
Prior art keywords
ratio
noise
signal
foreground
noise ratio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 00127494
Other languages
English (en)
Other versions
CN1175398C (zh
Inventor
黎家力
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CNB001274945A priority Critical patent/CN1175398C/zh
Publication of CN1354455A publication Critical patent/CN1354455A/zh
Application granted granted Critical
Publication of CN1175398C publication Critical patent/CN1175398C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • User Interface Of Digital Computer (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明公开了一种从噪声环境中识别出语音和音乐的声音活动检测方法。本方法以信噪比为声音活动检测的判断标准。首先把采样数据通过FFT转变到频域上,在频域上非线性地划分成不同的子带,然后分别计算各子带的能量及信噪比测度。子带噪声能量更新,子带信噪比测度的计算分前、后台进行,前、后台交错控制,由信噪比测度的作为判断噪音、语音及音乐的标准。本方法在噪音环境中能准确检测出语音和音乐,使系统具有很强的抗环境噪声能力,同时又对各种有效声音信号具有很强的适应性。

Description

一种从噪声环境中识别出语音和音乐的声音活动检测方法
本发明涉及数字通信系统中的声音活动检测技术,更具体地,涉及一种能从混有环境噪声的输入信号中准确地识别出语音和音乐信号的声音活动检测(Voice Activity Detection)方法。
声音活动检测技术广泛应用于通讯系统,例如,在移动通信系统中应用声音活动检测技术,可以提高系统的流量处理能力。又如,在视频会议的多点控制单元的混音模块中应用声音活动检测技术,只让检测到有人说话的音频码流参加混音,可以减少参加混音的终端数,提高混音的质量。
一般的声音活动检测方法是利用能量、过零率、基音周期或其他语音信号的短时参数来作为判断是否有人讲话的依据,当背景噪声较大时,采用这些方法会导致误判,并且这些参数都是建立在人的发声模型上,故不适用于音乐。而在多媒体通讯系统中,音乐作为一种重要媒体经常被应用,而一般的声音活动检测方法只适用于人说话的语音检测,适应不了音乐这样的非平稳过程。
本发明的目的是提供一种适用于噪音环境中并能准确检测出语音和音乐的声音活动检测方法,使系统具有很强的抗环境噪声能力,同时又对各种有效声音信号具有很强的适应性,特别适用于多媒体通讯系统中,如视频会议系统。
为了完成发明目的,所述的一种从噪声环境中识别出语音和音乐的声音活动检测方法包括以下步骤:1、首先将所得到的采样数据通过快速傅立叶变换FFT转变到频域上;2、在频域上非线性地划分成不同的子带,然后分别计算各子带的能量及前台信噪比,并由前台信噪比算出前台信噪比测度;3、如果当前帧是第一帧,则把当前状态置为前台状态;4、根据当前信噪比测度的各种统计量控制前台和后台的工作;5、如果当前状态处于前台状态时,将当前的前台信噪比测度与所选阀值相比较,进行判断和处理;6、如果当前状态处于后台状态时,启动后台子带噪声能量更新,计算后台信噪比和后台信噪比测度,并根据信噪比测度的统计量进行判断和处理;7、如果当前状态处于过渡状态,则进入过渡状态处理,再根据信噪比测度的统计量进一步判断,确定最终进入前台状态还是后台状态;8、根据外部模块的要求输出前台信噪比测度或输出由前台信噪比测度判断得出的静音标志作为声音活动检测(VAD)的控制标志;9、根据外部模块的要求计算并输出该帧各子带的总能量(该步可选);10、回到步骤1,继续处理下一帧。
在上述的声音活动检测方法,所述的步骤8中,若前台信噪比测度大于阀值一,则置声音标志,否则置静音标志。
由上述方案可见,因本发明实现的声音活动检测方法使用了信噪比这一具有普遍性的物理量。故与其他方法相比具有适应性广的明显优点,既可检测出语音,又可检测出音乐,同时又有很强的抗噪声能力,适用于各种噪声环境,并且能适应各种输入增益及不同信噪比的硬件。特别适用于多媒体通讯系统。
下面结合附图和实施例对本发明作进一步说明。
    图1是本发明所述方法的流程图。
    图2是应用该方法于一个系统的流程图。
以下结合图1对本方法作具体说明:
本发明把声音活动检测的判断标准建立在信噪比这一物理量上。由于人耳可感知的频谱主要集中在4KHz以下,同时为了降低运算量,本发明以8K采样为例,但对于其他采样率,只要改变某些参数,本发明所采用的方法同样适用。第一步,首先将所得到的采样数据通过快速傅立叶变换(FFT)转变到频域上:
输入语音用s(n)表示。算法的帧长为10ms,即80点数据为一帧(L=80),并且采用帧间重叠的方法,重叠的数据点数D为24。这样,输入数据帧缓冲区d(m,n)的数据点数为L+D=104点,其中前D点数据为前一帧的最后D点数据,即
         d(m,n)=d(m-1,L+n),0≤n<D这里m表示当前帧。
对输入语音s(n)进行预加重处理,则有
         d(m,D+n)=s(n)+ξps(n-1),0≤n<L其中ξp=-0.8为预加重系数。
对预加重后的输入数据d(m,n)用平滑的梯形窗进行加窗处理,然后补零,形成M=128点的离散傅立叶变换输入数据g(n),即:
Figure A0012749400071
对g(n)进行离散傅立叶变换,得到输入信号的频谱G(k): G ( k ) = 2 M &Sigma; n = 0 M - 1 g ( n ) e - j 2 &pi;nk / M ; 0 &le; k < M
在实际计算中,考虑到g(n)是实数,因此可用M/2点的复数快速傅立叶变换快速计算M点的实数快速傅立叶变换。
对16K采样,160点数据为一帧(L=160),并且采用帧间重叠的方法,重叠的数据点数D为48。这样,输入数据帧缓冲区d(m,n)的数据点数为L+D=208点,进行256点快速傅立叶变换。第二步,非线性地划分成不同的子带,然后分别计算各子带的能量及前台信噪比,
并由前台信噪比算得前台信噪比测度:(1)、当前帧每个子带的能量Ech(m)按下式进行计算: E ch ( m , i ) = max { E min , &alpha; ch ( m ) E ch ( m - 1 , i ) + ( 1 - &alpha; ch ( m ) ) 1 f H ( i ) - f L ( i ) + 1 &Sigma; k = f L ( i ) f H ( i ) | G ( k ) | 2 } 0≤i<NC其中NC=16为子带数,Emin=0.0625为子带最小能量,αch(m)为子带能量平滑因子。平滑因子αch(m)定义为fL(i)和fH(i)为第i个子带起始和结束的位置,其中fL和fH定义如下:fL={2,4,6,8,10,12,14,17,20,23,27,31,36,42,49,56},fH={3,5,7,9,11,13,16,19,22,26,30,35,41,48,55,63}对于16K采样:fL={2,4,6,8,10,12,14,17,20,23,27,31,36,42,49,57,66,77,90,106},fH={3,5,7,9,11,13,16,19,22,26,39,35,41,48,56,65,76,89,105,127}(2)、子带信噪比估计按下式计算子带的信噪比σq(i) &sigma; q ( i ) = max { 0 , min { 89 , round { 101 og 10 ( E ch ( m , i ) E n ( m , i ) ) / 0.375 } } } ; 0 &le; i < N c 其中En(m,i)是当前帧第i个子带噪声能量的估计值,0.375是信噪比的量化步长。σq(i)量化为整数,并限定在0和89之间。
(3)、计算信噪比测度(SNR Metric)
信噪比测度v(m)是根据子带信噪比来描述当前帧与语音的相似程度,它是表征当前帧是语音还是噪声的衡量标准 v ( m ) = &Sigma; i = 0 N c - 1 V ( &sigma; q ( i ) ) 其中V(k)为信噪比测度表{V}中第k个值。{V}共有90个元素,定义为
V={2,2,2,2,2,2,2,2,2,2,2,3,3,3,3,3,4,4,4,5,5,5,6,6,7,7,7,8,8,9,9,10,10,11,12,12,13,13,14,15,15,16,17,17,18,19,20,20,21,22,23,24,24,25,26,27,28,28,29,30,31,32,33,34,35,36,37,37,38,39,40,41,42,43,44,45,46,47,48,49,50,50,50,50,50,50,50,50,50,50}。第三步,如果该帧是第一帧,则把当前状态置为前台状态。第四步,根据信噪比测度的各种统计量控制前台和后台的工作。第五步,如果当前状态是前台状态时,进行以下判断和处理:1)当前台信噪比测度低于阀值一时认为是噪声,启动前台噪声能量更新;2)若当前为前台状态,且如果连续2秒前台信噪比测度大于阀值一时认为将进入过渡状态,则把当前各子带能量作为后台子带噪声能量,并置当前状态为过渡状态;3)当连续2秒前台信噪比测度大于阀值二时认为是音乐,同时禁止前台子带噪声能量更新,并置当前状态为后台状态;4)转第八步。第六步,如果当前状态处于后台状态时,启动后台子带噪声能量更新,计算后台
    信噪比和后台信噪比测度,同时进行以下判断和处理:1)计算后台信噪比和后台信噪比测度;2)如果连续6秒后台信噪比测度大于阀值一,把当前各子带能量作为后台子带噪声能量;3)当后台信噪比测度在一段时间内的统计量满足特定条件或判断出前台信噪比测度连续1秒小于阀值二时,则把后台子带噪声能量作为前台子带噪声能量,同时置当前状态为前台状态,停止后台过程,重新启动前台噪声能量更新过程,并转第八步;4)当后台信噪比测度低于阀值一时,启动后台噪声能量更新;5)转第八步。第七步,如果当前状态是过渡状态,则进行以下的判断:1)当连续2秒前台信噪比测度大于阀值二时认为是音乐,并置当前状态为后台状态;2)计算后台信噪比和后台信噪比测度;3)若连续6秒后台信噪比测度大于阀值一,把当前各子带能量作为后台子带噪声能量;4)当后台信噪比测度在一段时间内的统计量满足特定条件或判断出前台信噪比测度连续1秒小于阀值二时,则把后台子带噪声能量作为前台子带噪声能量,同时置当前状态为前台状态,转步骤6);5)当后台信噪比测度低于阀值一时启动后台噪声更新;6)当前台信噪比测度低于阀值一时认为是噪声,启动前台噪声更新;7)转第八步。第八步,据外部模块的要求,输出前台信噪比测度或输出由前台信噪比测度判断
    得出的静音标志作为VAD的控制标志。第九步,根据外部模块的要求计算并输出该帧各子带的总能量(该步可选)。第十步,重复第一步,对下一帧数据进行处理。
在所述的声音活动检测方法中,阀值一的取值范围是35~40,阀值二的取值范围是阀值一加上五到阀值一加上十。
所述的第八步中,若前台信噪比测度大于阀值一,则置声音标志,否则置静音标志。
在所述第六步和第七步中,后台信噪比测度的统计包括:以20个子帧为一个复帧(200ms),对每个子帧,若该子帧的后台信噪比测度大于阀值一,则统计量减1;否则统计量加1。
以下情况之一满足所述的特定条件:
1.连续30个复帧,统计量大于零;
2.统计量大于零与小于零的复帧数之比大于35比7;以上两个条件都说明当前声音的噪声特性明显。
在所述的声音活动检测方法中,下一帧的背景噪声能量按下式更新:
En(m+1,i)=max{Emin,αnEn(m,i)+(l-αn)Ech(m,i)},0≤i<NC其中Emin=0.00625是允许的子带最小能量。αn=0.9是子带噪声能量平滑因子,它直接影响子带噪声能量估计值的更新速度。通常,用前四帧中的每一帧子带能量作为子带噪声能量的初值
        En(m,i)=max{Einit,Ech(m,i)},1≤m≤4,0≤i<NC其中Einit=16。
下面结合图2对本发明应用在整个系统中的流程进行说明:
每路语音的压缩码流输入后,经过解码,将解码后信号用本方法进行分析和处理,然后输出每一路的信噪比测度(SNR)和各子带的总能量(tce)给混音模块,最后由混音模块根据SNR及tce的大小,选出前n路参加混音。由于本方法的运算量非常小,故可与解码做在同一片数字信号处理(DSP)芯片上,也可与混音算法做在同一片DSP芯片上。

Claims (8)

1、一种从噪声环境中识别出语音和音乐的声音活动检测方法,其特征在于,包括以下步骤:1)首先将所得到的采样数据通过快速傅立叶变换转变到频域上;2)在频域上非线性地划分成不同的子带,然后分别计算各子带的能量及前台信噪比,并由前台信噪比算出前台信噪比测度;3)如果当前帧是第一帧,则置当前状态为前台;4)根据当前信噪比测度的各种统计量控制前台和后台的工作;5)如果当前状态处于前台状态时,将当前的前台信噪比测度与所选阀值相比较,进行判断和处理;6)如果当前状态处于后台状态时,启动后台子带噪声能量更新,计算后台信噪比和后台信噪比测度,并根据信噪比测度的统计量进行判断和处理;7)如果当前状态处于过渡状态,则进入过渡状态处理,再根据信噪比测度的统计量进一步判断,确定最终进入前台状态还是后台状态;8)根据外部模块的要求输出前台信噪比测度或输出由前台信噪比测度判断得出的静音标志作为声音活动检测的控制标志,如果外部模块同时要求计算并输出该帧各子带的总能量,则作相应的处理;9)回到步骤1,继续处理下一帧。
2、如权利要求1所述的声音活动检测方法,其特征在于,所述步骤6)和步骤7)中,后台信噪比测度的统计量是这样计算的:以20个子帧为一个复帧,对每个子帧,若该子帧的后台信噪比测度大于阀值一,则统计量减1;否则,统计量加1。
3、如权利要求1所述的声音活动检测方法,其特征在于,所述步骤5)的判断和处理具体包括:(1)当前台信噪比测度低于阀值一时认为是噪声,启动前台噪声能量更新;(2)若当前为前台状态,且如果连续2秒前台信噪比测度大于阀值一时认为处于过渡状态,则把当前各子带能量作为后台子带噪声能量,并置当前状态为过渡状态;(3)当连续2秒前台信噪比测度大于阀值二时认为是音乐,同时禁止前台子带噪声能量更新,并置当前状态为后台状态;(4)转步骤8)。
4、如权利要求1所述的声音活动检测方法,其特征在于所述步骤6)的判断和
处理具体包括:(1)计算后台信噪比和后台信噪比测度;(2)如果连续6秒后台信噪比测度大于阀值一,把当前各子带能量作为后台子带噪声能量;(3)当后台信噪比测度在一段时间内的统计量满足特定条件或判断出前台信噪比测度连续1秒小于阀值二时,则把后台子带噪声能量作为前台子带噪声能量,同时置当前状态为前台状态,停止后台过程,重新启动前台噪声能量更新过程,并转步骤8);(4)当后台信噪比测度低于阀值一时,启动后台噪声能量更新;(5)转步骤8)。
5、权利要求1所述的声音活动检测方法,其特征在于所述步骤7)具体包括:(1)当连续2秒前台信噪比测度大于阀值二时认为是音乐,并置当前状态为后台状态;(2)计算后台信噪比和后台信噪比测度;(3)若连续6秒后台信噪比测度大于阀值一,把当前各子带能量作为后台子带噪声能量;(4)当后台信噪比测度在一段时间内的统计量满足特定条件或判断出前台信噪比测度连续1秒小于阀值二时,则把后台子带噪声能量作为前台子带噪声能量,同时置当前状态为前台状态,转步骤(6);(5)当后台信噪比测度低于阀值一时启动后台噪声更新;(6)当前台信噪比测度低于阀值一时认为是噪声,启动前台噪声更新;(7)转步骤8)。
6、如权利要求1所述的声音活动检测方法,其特征在于所述步骤8)中,若前台信噪比测度大于阀值一,则置声音标志,否则置静音标志。
7、如权利要求2至6之一所述的声音活动检测方法,其特征在于:所述的阀值一的取值范围是35~40。
8、如权利要求3至5之一所述的声音活动检测方法,其特征在于:所述的阀值二的取值范围是所述阀值一的值加上五与所述阀值一的值加上十之间。
CNB001274945A 2000-11-18 2000-11-18 一种从噪声环境中识别出语音和音乐的声音活动检测方法 Expired - Fee Related CN1175398C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB001274945A CN1175398C (zh) 2000-11-18 2000-11-18 一种从噪声环境中识别出语音和音乐的声音活动检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB001274945A CN1175398C (zh) 2000-11-18 2000-11-18 一种从噪声环境中识别出语音和音乐的声音活动检测方法

Publications (2)

Publication Number Publication Date
CN1354455A true CN1354455A (zh) 2002-06-19
CN1175398C CN1175398C (zh) 2004-11-10

Family

ID=4592509

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB001274945A Expired - Fee Related CN1175398C (zh) 2000-11-18 2000-11-18 一种从噪声环境中识别出语音和音乐的声音活动检测方法

Country Status (1)

Country Link
CN (1) CN1175398C (zh)

Cited By (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1303425C (zh) * 2003-03-17 2007-03-07 因芬尼昂技术股份公司 决定直流马达中的操作状态或操作状态变化的方法和装置
WO2008067719A1 (fr) * 2006-12-07 2008-06-12 Huawei Technologies Co., Ltd. Procédé de détection d'activité sonore et dispositif de détection d'activité sonore
WO2008067735A1 (fr) * 2006-12-05 2008-06-12 Huawei Technologies Co., Ltd. Procédé et dispositif de classement pour un signal sonore
WO2008106852A1 (fr) * 2007-03-02 2008-09-12 Huawei Technologies Co., Ltd. Méthode et dispositif de classification d'un signal audio sans bruit
CN100454388C (zh) * 2004-06-01 2009-01-21 佳能株式会社 信息处理设备和信息处理方法
CN100456356C (zh) * 2004-11-12 2009-01-28 中国科学院声学研究所 一种应用于语音识别系统的语音端点检测方法
WO2011044798A1 (zh) * 2009-10-15 2011-04-21 华为技术有限公司 信号分类方法和装置
CN101399039B (zh) * 2007-09-30 2011-05-11 华为技术有限公司 一种确定非噪声音频信号类别的方法及装置
CN101515454B (zh) * 2008-02-22 2011-05-25 杨夙 用于语音、音乐、噪音自动分类的信号特征提取方法
CN102096798A (zh) * 2011-01-25 2011-06-15 上海交通大学 电磁感应的状态识别的信号处理方法
WO2011079624A1 (zh) * 2009-12-28 2011-07-07 中兴通讯股份有限公司 一种标志音识别方法及装置
CN101645265B (zh) * 2008-08-05 2011-07-13 中兴通讯股份有限公司 一种音频类别的实时识别方法及装置
CN101379548B (zh) * 2006-02-10 2012-07-04 艾利森电话股份有限公司 语音检测器和用于其中抑制子频带的方法
CN101681619B (zh) * 2007-05-22 2012-07-04 Lm爱立信电话有限公司 改进的话音活动性检测器
CN101310327B (zh) * 2005-12-27 2012-07-18 三菱电机株式会社 乐曲区间检测方法及其装置、及数据记录方法及其装置
CN102655010A (zh) * 2008-12-31 2012-09-05 无锡中星微电子有限公司 录音控制方法和录音设备
CN102708859A (zh) * 2012-06-20 2012-10-03 太仓博天网络科技有限公司 一种实时音乐语音识别系统
CN101458943B (zh) * 2008-12-31 2013-01-30 无锡中星微电子有限公司 一种录音控制方法和录音设备
CN103325386A (zh) * 2012-03-23 2013-09-25 杜比实验室特许公司 用于信号传输控制的方法和系统
CN103632681A (zh) * 2013-11-12 2014-03-12 广州海格通信集团股份有限公司 一种谱包络静音检测方法
CN105810201A (zh) * 2014-12-31 2016-07-27 展讯通信(上海)有限公司 语音活动检测方法及其系统
CN105810214A (zh) * 2014-12-31 2016-07-27 展讯通信(上海)有限公司 语音激活检测方法及装置
CN106782608A (zh) * 2016-12-10 2017-05-31 广州酷狗计算机科技有限公司 噪声检测方法及装置
CN107086043A (zh) * 2014-03-12 2017-08-22 华为技术有限公司 检测音频信号的方法和装置
CN107767863A (zh) * 2016-08-22 2018-03-06 科大讯飞股份有限公司 语音唤醒方法、系统及智能终端
CN108461081A (zh) * 2018-03-21 2018-08-28 广州蓝豹智能科技有限公司 语音控制的方法、装置、设备和存储介质
CN109545192A (zh) * 2018-12-18 2019-03-29 百度在线网络技术(北京)有限公司 用于生成模型的方法和装置
CN115811574A (zh) * 2023-02-03 2023-03-17 合肥炬芯智能科技有限公司 一种声音信号处理方法、装置、主设备和分体式会议系统

Cited By (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1303425C (zh) * 2003-03-17 2007-03-07 因芬尼昂技术股份公司 决定直流马达中的操作状态或操作状态变化的方法和装置
CN100454388C (zh) * 2004-06-01 2009-01-21 佳能株式会社 信息处理设备和信息处理方法
CN100456356C (zh) * 2004-11-12 2009-01-28 中国科学院声学研究所 一种应用于语音识别系统的语音端点检测方法
CN101310327B (zh) * 2005-12-27 2012-07-18 三菱电机株式会社 乐曲区间检测方法及其装置、及数据记录方法及其装置
CN101379548B (zh) * 2006-02-10 2012-07-04 艾利森电话股份有限公司 语音检测器和用于其中抑制子频带的方法
WO2008067735A1 (fr) * 2006-12-05 2008-06-12 Huawei Technologies Co., Ltd. Procédé et dispositif de classement pour un signal sonore
CN100483509C (zh) * 2006-12-05 2009-04-29 华为技术有限公司 声音信号分类方法和装置
WO2008067719A1 (fr) * 2006-12-07 2008-06-12 Huawei Technologies Co., Ltd. Procédé de détection d'activité sonore et dispositif de détection d'activité sonore
CN101197130B (zh) * 2006-12-07 2011-05-18 华为技术有限公司 声音活动检测方法和声音活动检测器
WO2008106852A1 (fr) * 2007-03-02 2008-09-12 Huawei Technologies Co., Ltd. Méthode et dispositif de classification d'un signal audio sans bruit
CN101681619B (zh) * 2007-05-22 2012-07-04 Lm爱立信电话有限公司 改进的话音活动性检测器
CN101399039B (zh) * 2007-09-30 2011-05-11 华为技术有限公司 一种确定非噪声音频信号类别的方法及装置
CN101515454B (zh) * 2008-02-22 2011-05-25 杨夙 用于语音、音乐、噪音自动分类的信号特征提取方法
CN101645265B (zh) * 2008-08-05 2011-07-13 中兴通讯股份有限公司 一种音频类别的实时识别方法及装置
CN102655010A (zh) * 2008-12-31 2012-09-05 无锡中星微电子有限公司 录音控制方法和录音设备
CN102655010B (zh) * 2008-12-31 2014-09-03 无锡中星微电子有限公司 录音控制方法和录音设备
CN101458943B (zh) * 2008-12-31 2013-01-30 无锡中星微电子有限公司 一种录音控制方法和录音设备
US8050916B2 (en) 2009-10-15 2011-11-01 Huawei Technologies Co., Ltd. Signal classifying method and apparatus
CN102044244B (zh) * 2009-10-15 2011-11-16 华为技术有限公司 信号分类方法和装置
US8438021B2 (en) 2009-10-15 2013-05-07 Huawei Technologies Co., Ltd. Signal classifying method and apparatus
WO2011044798A1 (zh) * 2009-10-15 2011-04-21 华为技术有限公司 信号分类方法和装置
WO2011079624A1 (zh) * 2009-12-28 2011-07-07 中兴通讯股份有限公司 一种标志音识别方法及装置
CN102096798A (zh) * 2011-01-25 2011-06-15 上海交通大学 电磁感应的状态识别的信号处理方法
CN102096798B (zh) * 2011-01-25 2013-08-21 上海交通大学 电磁感应的状态识别的信号处理方法
CN103325386A (zh) * 2012-03-23 2013-09-25 杜比实验室特许公司 用于信号传输控制的方法和系统
US9373343B2 (en) 2012-03-23 2016-06-21 Dolby Laboratories Licensing Corporation Method and system for signal transmission control
CN103325386B (zh) * 2012-03-23 2016-12-21 杜比实验室特许公司 用于信号传输控制的方法和系统
CN102708859A (zh) * 2012-06-20 2012-10-03 太仓博天网络科技有限公司 一种实时音乐语音识别系统
CN103632681A (zh) * 2013-11-12 2014-03-12 广州海格通信集团股份有限公司 一种谱包络静音检测方法
CN103632681B (zh) * 2013-11-12 2016-09-07 广州海格通信集团股份有限公司 一种谱包络静音检测方法
CN107086043A (zh) * 2014-03-12 2017-08-22 华为技术有限公司 检测音频信号的方法和装置
US11417353B2 (en) 2014-03-12 2022-08-16 Huawei Technologies Co., Ltd. Method for detecting audio signal and apparatus
US10818313B2 (en) 2014-03-12 2020-10-27 Huawei Technologies Co., Ltd. Method for detecting audio signal and apparatus
CN105810201A (zh) * 2014-12-31 2016-07-27 展讯通信(上海)有限公司 语音活动检测方法及其系统
CN105810201B (zh) * 2014-12-31 2019-07-02 展讯通信(上海)有限公司 语音活动检测方法及其系统
CN105810214B (zh) * 2014-12-31 2019-11-05 展讯通信(上海)有限公司 语音激活检测方法及装置
CN105810214A (zh) * 2014-12-31 2016-07-27 展讯通信(上海)有限公司 语音激活检测方法及装置
CN107767863A (zh) * 2016-08-22 2018-03-06 科大讯飞股份有限公司 语音唤醒方法、系统及智能终端
CN106782608B (zh) * 2016-12-10 2019-11-05 广州酷狗计算机科技有限公司 噪声检测方法及装置
CN106782608A (zh) * 2016-12-10 2017-05-31 广州酷狗计算机科技有限公司 噪声检测方法及装置
CN108461081A (zh) * 2018-03-21 2018-08-28 广州蓝豹智能科技有限公司 语音控制的方法、装置、设备和存储介质
CN108461081B (zh) * 2018-03-21 2020-07-31 北京金山安全软件有限公司 语音控制的方法、装置、设备和存储介质
CN109545192A (zh) * 2018-12-18 2019-03-29 百度在线网络技术(北京)有限公司 用于生成模型的方法和装置
CN109545192B (zh) * 2018-12-18 2022-03-08 百度在线网络技术(北京)有限公司 用于生成模型的方法和装置
CN115811574A (zh) * 2023-02-03 2023-03-17 合肥炬芯智能科技有限公司 一种声音信号处理方法、装置、主设备和分体式会议系统
CN115811574B (zh) * 2023-02-03 2023-06-16 合肥炬芯智能科技有限公司 一种声音信号处理方法、装置、主设备和分体式会议系统

Also Published As

Publication number Publication date
CN1175398C (zh) 2004-11-10

Similar Documents

Publication Publication Date Title
CN1354455A (zh) 一种从噪声环境中识别出语音和音乐的声音活动检测方法
US6766292B1 (en) Relative noise ratio weighting techniques for adaptive noise cancellation
US6529868B1 (en) Communication system noise cancellation power signal calculation techniques
US6523003B1 (en) Spectrally interdependent gain adjustment techniques
US6324502B1 (en) Noisy speech autoregression parameter enhancement method and apparatus
RU2251750C2 (ru) Обнаружение активности сложного сигнала для усовершенствованной классификации речи/шума в аудиосигнале
US7873114B2 (en) Method and apparatus for quickly detecting a presence of abrupt noise and updating a noise estimate
CN101847412B (zh) 音频信号的分类方法及装置
CN1125430C (zh) 基于波形的周期性检测器
US20050108004A1 (en) Voice activity detector based on spectral flatness of input signal
CN1354870A (zh) 噪声信号中语音的端点定位
EP1887559B1 (en) Yule walker based low-complexity voice activity detector in noise suppression systems
CN1271593C (zh) 一种语音信号检测方法
WO2004021333A1 (en) Multichannel voice detection in adverse environments
US6671667B1 (en) Speech presence measurement detection techniques
CN1835073A (zh) 基于语音特征判别的静音检测方法
Sakhnov et al. Approach for Energy-Based Voice Detector with Adaptive Scaling Factor.
US6996524B2 (en) Speech enhancement device
CN110867192A (zh) 基于门控循环编解码网络的语音增强方法
JPH0644195B2 (ja) エネルギ正規化および無声フレーム抑制機能を有する音声分析合成システムおよびその方法
CN1044293C (zh) 背景音的编码/译码方法和设备
CN1685336A (zh) 用于背景噪声快速动态估计的方法
Wu et al. Voice activity detection based on auto-correlation function using wavelet transform and teager energy operator
Sakhnov et al. Dynamical energy-based speech/silence detector for speech enhancement applications
Sorqvist et al. Kalman filtering for low distortion speech enhancement in mobile communication

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20041110

Termination date: 20141118

EXPY Termination of patent right or utility model