CN109686380B - 语音信号的处理方法、装置及电子设备 - Google Patents
语音信号的处理方法、装置及电子设备 Download PDFInfo
- Publication number
- CN109686380B CN109686380B CN201910120548.2A CN201910120548A CN109686380B CN 109686380 B CN109686380 B CN 109686380B CN 201910120548 A CN201910120548 A CN 201910120548A CN 109686380 B CN109686380 B CN 109686380B
- Authority
- CN
- China
- Prior art keywords
- reverberation time
- reverberation
- absorption coefficient
- time
- room
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title abstract description 25
- 238000010521 absorption reaction Methods 0.000 claims abstract description 111
- 239000000463 material Substances 0.000 claims abstract description 33
- 230000001629 suppression Effects 0.000 claims abstract description 30
- 238000000034 method Methods 0.000 claims description 38
- 238000012545 processing Methods 0.000 claims description 34
- 238000004364 calculation method Methods 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 7
- 230000002238 attenuated effect Effects 0.000 claims description 5
- 230000008054 signal transmission Effects 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 238000005259 measurement Methods 0.000 description 5
- 230000004044 response Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 239000012814 acoustic material Substances 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Reverberation, Karaoke And Other Acoustics (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本申请涉及音频技术领域,本申请提供了一种语音信号的处理方法、装置及电子设备,该语音信号的处理方法包括:测量第一混响时间;根据声波反射材料生成声波吸收系数或者反射系数;根据第一混响时间和吸收系数预测第二混响时间;或者根据第一混响时间和反射系数预测第二混响时间;根据第二混响时间调整混响抑制参数。本申请实施例可以直接部署在特定的电子设备上。针对不同的应用场景,电子设备可以以较低的信号发射功率方便快捷地预测周围环境的混响时间,并根据预测的混响时间调整混响抑制参数,提升了语音信号的质量,提高了电子设备在特定应用场景下的性能鲁棒性,提升了用户在不同应用场景下的听觉体验。
Description
技术领域
本申请涉及音频技术领域,具体而言,涉及一种语音信号的处理方法、装置及电子设备。
背景技术
在视频会议或者语音控制的应用场景中,环境中的混响,特别是长时间的混响,会降低语音信号在听觉上或者识别中的质量。但目前用户在不同应用场景下听觉体验不佳。
发明内容
为了解决不同应用场景下用户听觉体验不佳的问题,本申请实施例提供了一种语音信号的处理方法、装置及电子设备,使用户在不同应用场景下都能够获得良好的听觉体验。
第一方面,本申请实施例提供了一种语音信号的处理方法,包括以下步骤:测量第一混响时间;根据声波反射材料生成声波吸收系数或者反射系数;根据所述第一混响时间和所述吸收系数预测第二混响时间;或者根据所述第一混响时间和所述反射系数预测第二混响时间;根据所述第二混响时间调整混响抑制参数。
其中,所述根据所述第一混响时间和所述吸收系数预测第二混响时间;或者根据所述第一混响时间和所述反射系数预测第二混响时间包括:
利用计算式:
拟合出房间六面墙体吸收系数的权重值,其中,T为所述第一混响时间,V为房间容积,αi为房间第i面墙体的吸收系数,wi为吸收系数αi的权重值,Si为房间第i面墙体的面积;将房间第i面墙体的吸收系数αi与该吸收系数的权重值wi相乘得到第i面墙体最终的吸收系数;利用房间六面墙体的所述最终的吸收系数得到所述第二混响时间。
其中,所述测量第一混响时间之后还包括:对所述第一混响时间进行补偿。
其中,所述对所述第一混响时间进行补偿包括:将所述第一混响时间加上补偿值,所述补偿值为8-24ms。
其中,所述测量第一混响时间之前包括:通过触摸屏或者物理按键接收开始测量所述第一混响时间的指令。
其中,所述根据声波反射材料生成声波吸收系数或者反射系数包括:显示反射声波材料信息,接收用户选择的反射声波材料。
其中,所述根据所述第二混响时间调整混响抑制参数包括:将所述第二混响时间分为多个等级;针对不同等级的所述第二混响时间,选择不同的混响抑制参数。
其中,所述第一混响时间为当室内声源停止发声后,室内声能密度衰减20dB所需要的时间;所述第二混响时间为当室内声源停止发声后,室内声能密度衰减60dB所需要的时间。
第二方面,本申请实施例提供了一种语音信号的处理装置,包括:
测量单元,用于测量第一混响时间;
生成单元,用于根据声波反射材料生成声波吸收系数或者反射系数;
预测单元,用于根据所述第一混响时间和所述吸收系数预测第二混响时间;或者用于根据所述第一混响时间和所述反射系数预测第二混响时间;
调整单元,用于根据所述第二混响时间调整混响抑制参数。
其中,所述预测单元还用于:
利用计算式:
拟合出房间六面墙体吸收系数的权重值,其中,T为所述第一混响时间,V为房间容积,αi为房间第i面墙体的吸收系数,wi为吸收系数αi的权重值,Si为房间第i面墙体的面积;将房间第i面墙体的吸收系数αi与该吸收系数的权重值wi相乘得到第i面墙体最终的吸收系数;利用房间六面墙体的所述最终的吸收系数得到所述第二混响时间。
其中,所述语音信号的处理装置还包括:补偿单元,用于对所述第一混响时间进行补偿。
第三方面,本申请实施例提供了一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任一项方法的步骤。
第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任一项方法的步骤。
本申请实施例语音信号的处理方法具有如下有益效果:
本申请实施例提供了一种语音信号的处理方法,包括测量第一混响时间,根据测量的第一混响时间以及吸收系数(或者反射系数)预测第二混响时间,根据第二混响时间调整混响抑制参数,与现有技术中直接测量第二混响时间相比,本申请实施例中先测量第一混响时间,再预测第二混响时间,根据预测的混响时间来调整混响抑制参数,从而提升了语音信号的质量,使用户在不同应用场景下能够获得良好的听觉体验。
本申请实施例可以直接部署在特定的电子设备上,并能以较低的发射功率自动测量室内混响时间,然后根据测量的混响时间定制电子设备中抑制混响的方案参数,提高了电子设备在特定应用场景下的性能鲁棒性,提升了用户在不同应用场景下的听觉体验。
附图说明
图1为已有的测量混响时间的原理示意图;
图2为本申请实施例语音信号的处理方法第一流程示意图;
图3为本申请实施例语音信号的处理方法第二流程示意图;
图4为本申请实施例语音信号的处理方法第三流程示意图;
图5为本申请实施例语音信号的处理装置第一结构示意图;
图6本申请实施例语音信号的处理装置第三结构示意图;
图7为本申请实施例电子设备的结构示意图。
具体实施方式
下面结合附图和实施例对本申请进行进一步的介绍。
在下述介绍中,术语“第一”、“第二”仅为用于描述的目的,而不能理解为指示或暗示相对重要性。下述介绍提供了本申请的多个实施例,不同实施例之间可以替换或者合并组合,因此本申请也可认为包含所记载的相同和/或不同实施例的所有可能组合。因而,如果一个实施例包含特征A、B、C,另一个实施例包含特征B、D,那么本申请也应视为包括含有A、B、C、D的一个或多个所有其他可能的组合的实施例,尽管该实施例可能并未在以下内容中有明确的文字记载。
在下述介绍中,表述“具有”、“可以具有”、“包含”和“包括”或“可以包含”和“可以包括”表示存在对应的特征(例如,诸如数值、功能、操作或组件之类的要素),但是不排除存在附加的特征。
在下述介绍中,当一个元件(例如,第一元件)被称为“(操作或通信)耦接到”或“连接到”另一个元件(例如,第二元件)时,其可以直接耦接或连接到其他元件,或者可以存在中间元件(例如,第三元件)。另一方面,当一个元件(例如,第一元件)被称为“直接耦接到”或“直接连接到”另一元件(例如,第二元件)时,应理解,不存在中间元件(例如,第三元件)。
下面的描述提供了示例,并且不对权利要求书中阐述的范围、适用性或示例进行限制。可以在不脱离本申请内容的范围的情况下,对描述的元素的功能和布置做出改变。各个示例可以适当省略、替代或添加各种过程或组件。例如所描述的方法可以以所描述的顺序不同的顺序来执行,并且可以添加、省略或组合各种步骤。此外,可以将关于一些示例描述的特征组合到其他示例中。
在实际生活中,声波在室内传播时,会被墙壁、天花板、地板等障碍物反射,每反射一次都要被障碍物吸收一些。这样,当声源停止发声后,声波在室内要经过多次反射和吸收,最后才消失,用户会感觉到声源停止发声后,还有若干个声波混合持续一段时间,即室内声源停止发声后仍然存在声波延续现象,这种现象叫做混响,这段时间叫做混响时间。
不同的应用场景需要的混响时间不相同。例如,音乐厅和剧场的混响时间比讲演厅要长些。同一场景中不同的语音信号需要的混响时间也不相同。例如,在音乐厅中,轻音乐要求节奏鲜明,混响时间要短些,而交响乐的混响时间要长些。但是在视频会议或者语音控制的应用场景中,环境中的混响,特别是长时间的混响会降低语音信号在听觉上或者识别中的质量,使用户听觉体验不佳。因此在不同的应用场景中需要设定不同的混响时间以使用户获得较佳的体验效果。但是已有的测量混响时间的方法和混响抑制方案并不能使用户在不同的应用场景下获得较佳的体验效果。
图1为已有的测量混响时间的原理示意图,如图1所示,混响时间的具体测量步骤包括:发声设备11首先在环境中建立稳定的声场;然后关掉发声设备11,接收设备12测量信号的衰减时间以得到混响时间;最后根据测量的混响时间设定应用设备的混响抑制方案参数。在测量混响时间时,已有的混响时间接收设备12和应用设备是分开的,测量环境中的混响时间需要发声设备11具有较高的信号发射功率和接收设备12具有较大的动态范围。已有的应用设备难以满足上述两个条件,导致将混响时间测量方案直接集成到应用设备中难以实现。因此,已有的混响时间接收设备12和应用设备是分开的,接收设备12并不能快速实时的服务于提升应用设备的产品性能。因此,需要一种能够集成于应用设备的混响测量方案,以提升用户在不同应用场景下的听觉体验。
为了解决不同应用场景下用户听觉体验不佳的问题,本申请实施例提供了一种语音信号的处理方法,包括:测量第一混响时间;根据声波反射材料生成声波吸收系数或者反射系数;根据第一混响时间和吸收系数预测第二混响时间;或者根据第一混响时间和反射系数预测第二混响时间;根据第二混响时间调整混响抑制参数。
通过本申请实施例的技术方案,针对不同的应用场景,电子设备可以以较低的信号发射功率方便快捷地预测周围环境的混响时间,并根据预测的混响时间来调整电子设备的混响抑制参数。从而提升了语音信号的质量和电子设备在特定应用场景下的性能鲁棒性,使用户在不同应用场景下都能够获得良好的听觉体验。
为了便于本领域技术人员的理解,本申请通过以下实施例对本申请提供的技术方案的具体实现过程进行说明。
实施例一
图2为本申请实施例语音信号的处理方法第一流程示意图,如图2所示,本申请实施例语音信号的处理方法包括以下步骤:步骤101,测量第一混响时间;步骤102,根据声波反射材料生成声波吸收系数或者反射系数;步骤103,根据第一混响时间和吸收系数预测第二混响时间;或者根据第一混响时间和反射系数预测第二混响时间;步骤104,根据第二混响时间调整混响抑制参数。下面详细介绍步骤101-104。
步骤101,测量第一混响时间。
在一些实施例中,电子设备可以通过稳态噪声法测量第一混响时间,第一混响时间为当室内声源停止发声后,室内声能密度衰减20dB所需要的时间。该稳态噪声法包括:用户在电子设备的触摸屏或通过物理按键输入开始测量第一混响时间的指令后,电子设备先在房间内建立一个稳定的语音信号;然后电子设备切段该语音信号,开启麦克风接收该语音信号,同时记录该语音信号的衰变曲线;最后电子设备通过测量衰变曲线中语音信号下降20dB的时间得到第一混响时间。电子设备一般测量语音信号衰变曲线中-5dB和-35dB两个电平之间的时间得到第一混响时间。其中切段该语音信号例如可以包括用户在电子设备的触摸屏或通过物理按键输入切段语音信号的指令。切段该语音信号例如还可以包括用户在电子设备设定语音信号播放的预设时间,超过该预设时间,电子设备切段该语音信号。
在另一些实施例中,电子设备可以通过脉冲积分响应法测量第一混响时间,该方法根据谱密度和被测房间的脉冲响应,计算语音信号的声压衰减函数,最后测量声压衰减函数中语音信号下降20dB的时间得到第一混响时间。
步骤102,根据声波反射材料生成声波吸收系数或者反射系数。
在一些实施例中,用户在电子设备上设计显示屏幕以及选择按键。用户通过选择按键确定电子设备周围环境的声波反射材料。电子设备通过显示屏幕显示最终的选择结果,并根据用户确定的声波反射材料生成声波吸收系数。
在另一些实施例中,电子设备存储周围环境中不同的声波反射材料以及声波反射材料对应的吸收系数,并根据用户选择的声波反射材料生成声波吸收系数。
在另一些实施例中,用户在电子设备上设计显示屏幕以及选择按键。用户通过选择按键确定电子设备周围环境的声波反射材料。电子设备通过显示屏幕显示最终的选择结果,并根据用户确定的声波反射材料生成声波反射系数。
在另一些实施例中,电子设备存储周围环境中不同的声波反射材料以及声波反射材料对应的反射系数,并根据用户选择的声波反射材料生成声波反射系数。
在另一些实施例中,电子设备可以根据用户选择的声波反射材料生成声波吸收系数α,通过计算式(1):
β2+α=1 (1)
得到反射系数β。例如根据计算式(1)和第一面墙体的吸收系数α1得到第一面墙体的反射系数β1。
步骤103,根据第一混响时间和吸收系数预测第二混响时间;或者根据第一混响时间和反射系数预测第二混响时间。
在一些实施例中,电子设备根据第一混响时间、吸收系数α和计算式,预测第二混响时间。第二混响时间为当室内声源停止发声后,室内声能密度衰减60dB所需要的时间。
在另一些实施例中,电子设备根据第一混响时间、反射系数β和计算式,预测第二混响时间。
步骤104,根据第二混响时间调整混响抑制参数。
在一些实施例中,电子设备根据预测的第二混响时间,调整混响抑制参数,以便用户能够拥有良好的听觉体验。
在另一些实施例中,电子设备可以根据不同的应用需求将第二混响时间分为多个等级,针对当前电子设备的语音信号和不同等级的第二混响时间,选择不同的混响抑制参数。
本申请实施例提供了一种语音信号的处理方法,通过本申请实施例的技术方案,针对不同的应用场景,电子设备可以以较低的信号发射功率测量第一混响时间,根据第一混响时间和吸收系数预测第二混响时间,并根据第二混响时间调整混响抑制参数,与现有技术中直接测量第二混响时间相比,本申请实施例中先测量第一混响时间,再预测第二混响时间,根据预测的混响时间来调整混响抑制参数,从而提升了语音信号的质量,使用户在不同应用场景都能够获得良好的听觉体验。
本申请实施例可以直接部署在特定的电子设备上,电子设备初次在某个应用环境中播放语音信号时,能以较低的发射功率自动测量室内混响时间,然后根据测量的混响时间定制电子设备中抑制混响的方案参数。这种针对特定应用场景混响抑制参数的调整会使得语音信号处理算法的性能更加优异,提高了电子设备在特定应用场景下的性能鲁棒性,提升了用户在不同应用场景下的听觉体验。
本申请实施例可以自动获取环境混响参数,并能够针对性地调整语音信号处理方法的相关参数。通过本申请实施例的技术方案可以复用电子设备本身的声源发声设备和接收装备,降低了测量混响时间的成本,提升了用户在不同应用场景下的听觉体验。
实施例二
图3为本申请实施例语音信号的处理方法第二流程示意图,如图3所示,本申请实施例语音信号的处理方法包括以下步骤:步骤201,测量第一混响时间;步骤202,根据声波反射材料生成声波吸收系数或者反射系数;步骤203A,利用计算式:
拟合出房间六面墙体吸收系数的权重值,其中,T为第一混响时间,V为房间容积,αi为房间第i面墙体的吸收系数,wi为吸收系数αi的权重值,Si为房间第i面墙体的面积;步骤203B,将房间第i面墙体的吸收系数αi与该吸收系数的权重值wi相乘得到第i面墙体最终的吸收系数;步骤203C,利用房间六面墙体的最终的吸收系数得到第二混响时间;步骤204,根据第二混响时间调整混响抑制参数。其中步骤201-202、204和步骤101-102、104基本相同,请参见步骤101-102、104。下面详细介绍步骤203A-203C。
步骤203A,利用计算式:
拟合出房间六面墙体吸收系数的权重值,其中,T为第一混响时间,V为房间容积,αi为房间第i面墙体的吸收系数,wi为吸收系数αi的权重值,Si为房间第i面墙体的面积。
在一些实施例中,电子设备根据声波反射材料生成声波吸收系数,利用计算式(2):
可以拟合出房间六面墙体吸收系数的权重值。在计算式(2)中,根据步骤201-202,可以得到已知量:T为第一混响时间,V为房间容积,αi为房间第i面墙体的吸收系数,Si为房间第i面墙体的面积。根据已知量和计算式(2)拟合出吸收系数αi的权重值的wi,例如根据计算式(2)可以拟合得到第一面墙的吸收系数α1的权重值w1,第二面墙的吸收系数α2的权重值w2等。其中,权重值wi的最佳值为使计算式(2)中等式左右两边差值最小的权重值wi。
步骤203B,将房间第i面墙体的吸收系数αi与该吸收系数的权重值wi相乘得到第i面墙体最终的吸收系数。
在一些实施例中,利用计算式(3):
αi0=αi*ωi (3)
得到第i面墙体最终的吸收系数,即将房间第i面墙体的吸收系数αi与该吸收系数的权重值wi相乘得到第i面墙体最终的吸收系数,例如第一面墙体的吸收系数为α10=α1*ω1。电子设备通过计算式(1)得到第i面墙体最终的反射系数。
步骤203C,利用房间六面墙体的最终的吸收系数得到第二混响时间。
在一些实施例中,电子设备将得到房间六面墙体最终的反射系数带入到计算式(4)计算t时刻的冲击响应:
其中:γ=0.5772157…;
Ei(·)表示标准的一阶指数积分函数;
Lx,Ly,Lz分别表示三维空间的长宽高;
在另一些实施例中,电子设备计算得到h(t)之后,将h(t)带入到计算式(5):
得到能量随时间衰减的曲线。基于这个曲线,电子设备可以预测得到第二混响时间。
在另一些实施例中,电子设备根据声波反射材料生成第i面墙体的反射系数βi,通过计算式(1)得到吸收系数αi,利用计算式(2)拟合出房间第i面墙体吸收系数的权重值wi。电子设备利用计算式(3)得到第i面墙体最终的吸收系数后,再通过计算式(1)得到第i面墙体最终的反射系数,最后利用房间六面墙体的最终的反射系数得到第二混响时间。
本申请实施例提供了一种语音信号的处理方法,通过本申请实施例的技术方案,针对不同的应用场景,电子设备可以拟合房间六面墙体吸收系数的权重值,得到最终的吸收系数,再利用房间六面墙体的最终的吸收系数得到第二混响时间,与现有技术中直接测量第二混响时间相比,本申请实施例中先测量第一混响时间,拟合最终的吸收系数,再预测第二混响时间,根据预测的混响时间来调整混响抑制参数,从而提升了语音信号的质量,使用户在不同应用场景都能够获得良好的听觉体验。
本申请实施例可以直接部署在特定的电子设备上,电子设备初次在某个应用环境中播放语音信号时,能以较低的发射功率自动测量室内混响时间,然后根据测量的混响时间定制电子设备中抑制混响的方案参数。这种针对特定应用场景混响抑制参数的调整会使得语音信号处理算法的性能更加优异,提高了电子设备在特定应用场景下的性能鲁棒性,提升了用户在不同应用场景下的听觉体验。
本申请实施例可以自动获取环境混响参数,并能够针对性地调整语音信号处理方法的相关参数。通过本申请实施例的技术方案可以复用电子设备本身的声源发声设备和接收装备,降低了测量混响时间的成本,提升了用户在不同应用场景下的听觉体验。
实施例三
图4为本申请实施例语音信号的处理方法第三流程示意图,如图3所示,本申请实施例语音信号的处理方法包括以下步骤:步骤301A,测量第一混响时间;步骤301B,对第一混响时间进行补偿;步骤302,根据声波反射材料生成声波吸收系数或者反射系数;步骤303,根据第一混响时间和吸收系数预测第二混响时间;或者根据第一混响时间和反射系数预测第二混响时间;步骤304,根据第二混响时间调整混响抑制参数。其中步骤302-304和步骤102-104基本相同,请参见步骤102-104,步骤301A和步骤101相同的部分,请参见步骤101。下面详细介绍步骤301B。
步骤301B,对第一混响时间进行补偿。
在一些实施例中,电子设备采用稳态噪声法或者脉冲响应冲击法测量第一混响时间过程中,由于电子设备本身性能的原因,从电子设备切段该语音信号到电子设备的麦克风接收到的语音信号之间会出现时延。因此电子设备需要对测量的第一混响时间进行补偿。
在另一些实施例中,电子设备从打开麦克风到麦克风第一次接收到信号之间会有一定的时延,计算最终的第一混响时间时需要将第一混响时间加上补偿值。该补偿值为打开麦克风到麦克风第一次接收到语音信号之间的时延,且该补偿值为8-24ms。
在一些实施例中,步骤301B也可以在其他步骤执行,只要在301A之后和步骤303之前就可以。例如步骤301B可以在301A之后和步骤302之前执行。例如步骤301B还可以在步骤302之后和步骤303之前执行。
本申请实施例提供了一种语音信号的处理方法,通过本申请实施例的技术方案,针对不同的应用场景,电子设备可以对第一混响时间进行补偿,得到最终的第一混响时间,与现有技术中直接测量第二混响时间相比,本申请实施例中先测量第一混响时间,对第一混响时间进行补偿,再预测第二混响时间,根据预测的混响时间来调整混响抑制参数,从而提升了语音信号的质量,使用户在不同应用场景都能够获得良好的听觉体验。
本申请实施例可以直接部署在特定的电子设备上,电子设备初次在某个应用环境中播放语音信号时,能以较低的发射功率自动测量室内混响时间,然后根据测量的混响时间定制电子设备中抑制混响的方案参数。这种针对特定应用场景混响抑制参数的调整会使得语音信号处理算法的性能更加优异,提高了电子设备在特定应用场景下的性能鲁棒性,提升了用户在不同应用场景下的听觉体验。
本申请实施例可以自动获取环境混响参数,并能够针对性地调整语音信号处理方法的相关参数。通过本申请实施例的技术方案可以复用电子设备本身的声源发声设备和接收装备,降低了测量混响时间的成本,提升了用户在不同应用场景下的听觉体验。
图5为本申请实施例语音信号的处理装置第一结构示意图,如图5所示,本申请实施例语音信号的处理装置50包括:测量单元51、生成单元52、预测单元53和调整单元54。
测量单元51,用于测量第一混响时间。
生成单元52,用于根据声波反射材料生成声波吸收系数或者反射系数。
预测单元53,用于根据第一混响时间和吸收系数预测第二混响时间;或者用于根据第一混响时间和反射系数预测第二混响时间。
调整单元54,用于根据第二混响时间调整混响抑制参数。
其中,预测单元53还用于利用计算式:
拟合出房间六面墙体吸收系数的权重值,其中,T为第一混响时间,V为房间容积,αi为房间第i面墙体的吸收系数,wi为吸收系数αi的权重值,Si为房间第i面墙体的面积;将房间第i面墙体的吸收系数αi与该吸收系数的权重值wi相乘得到第i面墙体最终的吸收系数;利用房间六面墙体的最终的吸收系数得到第二混响时间。
本说明书中,对于第一语音信号的处理装置的实施例而言,由于其基本相似于第一语音信号的处理方法和第二语音信号的处理方法的实施例,相关之处请参见第一语音信号的处理方法和第二语音信号的处理方法的实施例介绍。
图6为本申请实施例语音信号的处理装置第三结构示意图,如图6所示,本申请实施例语音信号的处理装置60包括:测量单元61、生成单元62、预测单元63、调整单元64和补偿单元65。
测量单元61,用于测量第一混响时间。
生成单元62,用于根据声波反射材料生成声波吸收系数或者反射系数。
预测单元63,用于根据第一混响时间和吸收系数预测第二混响时间;或者用于根据第一混响时间和反射系数预测第二混响时间。
调整单元64,用于根据第二混响时间调整混响抑制参数。
补偿单元65,用于对第一混响时间进行补偿。
本说明书中,对于第三语音信号的处理装置的实施例而言,由于其基本相似于第三语音信号的处理方法的实施例,相关之处请参见第三语音信号的处理方法的实施例介绍。
图7为本申请实施例电子设备的结构示意图,本申请的电子设备例如可以为向用户提供语音和/或数据联通性的设备,具有扬声器和听筒的手持式设备或可以播放音频文件的处理设备。本申请的电子设备例如可以为交互智能平板、手机、平板电脑、个人计算机、笔记本电脑、台式计算机、个人数字助理(Personal Digital Assistant,PDA)等,但不限于此。如图7所示,电子设备70包括存储器71、处理器72、麦克风74和扬声器75,存储器71、处理器72、麦克风74和扬声器75之间通过总线73进行通信。
在一些实施例中,处理器72例如可以为单核或多核中央处理单元,或者为特定集成电路,或者被配置成实施本申请的一个或多个集成电路。存储器71可以为高速随机存取存储器(Random Access Memory,RAM),也可以为非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。存储器71用于存储计算机指令711,计算机指令711中可以包括程序代码。
在另一些实施例中,扬声器75用于发出语音信号。麦克风74用于接收语音信号。处理器72用于测量第一混响时间;根据声波反射材料生成声波吸收系数或者反射系数;根据第一混响时间和吸收系数预测第二混响时间;或者根据第一混响时间和反射系数预测第二混响时间;根据第二混响时间调整混响抑制参数。
在另一些实施例中,处理器72还用于:利用计算式:
拟合出房间六面墙体吸收系数的权重值,其中,T为第一混响时间,V为房间容积,αi为房间第i面墙体的吸收系数,wi为吸收系数αi的权重值,Si为房间第i面墙体的面积;将房间第i面墙体的吸收系数αi与该吸收系数的权重值wi相乘得到第i面墙体最终的吸收系数;利用房间六面墙体的最终的吸收系数得到第二混响时间。
在另一些实施例中,处理器72还用于:测量第一混响时间之后,对第一混响时间进行补偿。
在另一些实施例中,处理器72还用于:对第一混响时间进行补偿,包括将第一混响时间加上补偿值,补偿值为8-24ms。
在另一些实施例中,处理器72还用于:测量第一混响时间之前,通过触摸屏或者物理按键接收开始测量第一混响时间的指令。
在另一些实施例中,处理器72还用于:根据声波反射材料生成声波吸收系数或者反射系数,显示反射声波材料信息,接收用户选择的反射声波材料。
在另一些实施例中,处理器72还用于:将第二混响时间分为多个等级;针对不同等级的第二混响时间,选择不同的混响抑制参数。
在另一些实施例中,第一混响时间为当室内声源停止发声后,室内声能密度衰减20dB所需要的时间;第二混响时间为当室内声源停止发声后,室内声能密度衰减60dB所需要的时间。
本领域的技术人员可以清楚地了解到本申请的技术方案可借助软件和/或硬件来实现。本说明书中的“单元”和“模块”是指能够独立完成或与其他部件配合完成特定功能的软件和/或硬件,其中硬件例如可以是FPGA(Field-ProgrammaBLE Gate Array,现场可编程门阵列)、IC(Integrated Circuit,集成电路)等。
本申请的各处理单元和/或模块,可通过实现本申请所述的功能的模拟电路而实现,也可以通过执行本申请所述的功能的软件而实现。
本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述方法的步骤。其中,计算机可读存储介质可以包括但不限于任何类型的盘,包括软盘、光盘、DVD、CD-ROM、微型驱动器以及磁光盘、ROM、RAM、EPROM、EEPROM、DRAM、VRAM、闪速存储器设备、磁卡或光卡、纳米系统(包括分子存储器IC),或适合于存储指令和/或数据的任何类型的媒介或设备。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
在本申请各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
以上介绍仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (10)
1.一种语音信号的处理方法,其特征在于,包括:
测量第一混响时间;所述第一混响时间为当室内声源停止发声后,室内声能密度衰减20dB所需要的时间;
根据声波反射材料生成声波吸收系数或者反射系数;
根据所述第一混响时间和所述吸收系数预测第二混响时间;或者根据所述第一混响时间和所述反射系数预测第二混响时间,所述第二混响时间为当室内声源停止发声后,室内声能密度衰减60dB所需要的时间;
根据所述第二混响时间调整混响抑制参数;
其中,所述根据所述第一混响时间和所述吸收系数预测第二混响时间;或者根据所述第一混响时间和所述反射系数预测第二混响时间包括:
利用计算式:
拟合出房间六面墙体吸收系数的权重值,其中,T为所述第一混响时间,V为房间容积,αi为房间第i面墙体的吸收系数,wi为吸收系数αi的权重值,Si为房间第i面墙体的面积;
将房间第i面墙体的吸收系数αi与该吸收系数的权重值wi相乘得到第i面墙体最终的吸收系数;
利用房间六面墙体的所述最终的吸收系数得到所述第二混响时间。
2.根据权利要求1所述的语音信号的处理方法,其特征在于,所述测量第一混响时间之后还包括:
对所述第一混响时间进行补偿。
3.根据权利要求2所述的语音信号的处理方法,其特征在于,所述对所述第一混响时间进行补偿包括:
将所述第一混响时间加上补偿值,所述补偿值为8-24ms。
4.根据权利要求1所述的语音信号的处理方法,其特征在于,所述测量第一混响时间之前包括:
通过触摸屏或者物理按键接收开始测量所述第一混响时间的指令。
5.根据权利要求1所述的语音信号的处理方法,其特征在于,所述根据声波反射材料生成声波吸收系数或者反射系数包括:
显示反射声波材料信息,
接收用户选择的反射声波材料。
6.根据权利要求1所述的语音信号的处理方法,其特征在于,所述根据所述第二混响时间调整混响抑制参数包括:
将所述第二混响时间分为多个等级;
针对不同等级的所述第二混响时间,选择不同的混响抑制参数。
7.一种语音信号的处理装置,其特征在于,包括:
测量单元,用于测量第一混响时间;所述第一混响时间为当室内声源停止发声后,室内声能密度衰减20dB所需要的时间;
生成单元,用于根据声波反射材料生成声波吸收系数或者反射系数;
预测单元,用于根据所述第一混响时间和所述吸收系数预测第二混响时间;或者用于根据所述第一混响时间和所述反射系数预测第二混响时间;所述第二混响时间为当室内声源停止发声后,室内声能密度衰减60dB所需要的时间;
调整单元,用于根据所述第二混响时间调整混响抑制参数;
其中,所述预测单元还用于:
利用计算式:
拟合出房间六面墙体吸收系数的权重值,其中,T为所述第一混响时间,V为房间容积,αi为房间第i面墙体的吸收系数,wi为吸收系数αi的权重值,Si为房间第i面墙体的面积;
将房间第i面墙体的吸收系数αi与该吸收系数的权重值wi相乘得到第i面墙体最终的吸收系数;
利用房间六面墙体的所述最终的吸收系数得到所述第二混响时间。
8.根据权利要求7所述的语音信号的处理装置,其特征在于,所述语音信号的处理装置还包括:
补偿单元,用于对所述第一混响时间进行补偿。
9.一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求1-6中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现所述权利要求1-6中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910120548.2A CN109686380B (zh) | 2019-02-18 | 2019-02-18 | 语音信号的处理方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910120548.2A CN109686380B (zh) | 2019-02-18 | 2019-02-18 | 语音信号的处理方法、装置及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109686380A CN109686380A (zh) | 2019-04-26 |
CN109686380B true CN109686380B (zh) | 2021-06-18 |
Family
ID=66196407
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910120548.2A Active CN109686380B (zh) | 2019-02-18 | 2019-02-18 | 语音信号的处理方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109686380B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111627460B (zh) * | 2020-05-13 | 2022-11-15 | 广州国音智能科技有限公司 | 环境混响检测方法、装置、设备与计算机可读存储介质 |
CN116489572B (zh) * | 2022-01-14 | 2024-09-06 | 华为技术有限公司 | 一种电子设备控制方法、装置及电子设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102790931A (zh) * | 2011-05-20 | 2012-11-21 | 中国科学院声学研究所 | 一种三维声场合成中的距离感合成方法 |
CN104703111A (zh) * | 2013-12-09 | 2015-06-10 | 中国科学院声学研究所 | 一种房间混响合成方法 |
CN107071636A (zh) * | 2016-12-29 | 2017-08-18 | 北京小鸟听听科技有限公司 | 对带麦克风的设备的去混响控制方法和装置 |
CN109151702A (zh) * | 2018-09-21 | 2019-01-04 | 歌尔科技有限公司 | 音频设备的音效调节方法、音频设备及可读存储介质 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8988970B2 (en) * | 2010-03-12 | 2015-03-24 | University Of Maryland | Method and system for dereverberation of signals propagating in reverberative environments |
US9386373B2 (en) * | 2012-07-03 | 2016-07-05 | Dts, Inc. | System and method for estimating a reverberation time |
CN103440869B (zh) * | 2013-09-03 | 2017-01-18 | 大连理工大学 | 一种音频混响的抑制装置及其抑制方法 |
US9558757B1 (en) * | 2015-02-20 | 2017-01-31 | Amazon Technologies, Inc. | Selective de-reverberation using blind estimation of reverberation level |
CN107680603B (zh) * | 2016-08-02 | 2021-08-31 | 电信科学技术研究院 | 一种混响时间估计方法及装置 |
KR101871604B1 (ko) * | 2016-12-15 | 2018-06-27 | 한양대학교 산학협력단 | 심화 신경망을 이용한 다채널 마이크 기반의 잔향시간 추정 방법 및 장치 |
CN106710602B (zh) * | 2016-12-29 | 2020-03-17 | 南方科技大学 | 一种声学混响时间估计方法和装置 |
US10262672B2 (en) * | 2017-07-25 | 2019-04-16 | Verizon Patent And Licensing Inc. | Audio processing for speech |
-
2019
- 2019-02-18 CN CN201910120548.2A patent/CN109686380B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102790931A (zh) * | 2011-05-20 | 2012-11-21 | 中国科学院声学研究所 | 一种三维声场合成中的距离感合成方法 |
CN104703111A (zh) * | 2013-12-09 | 2015-06-10 | 中国科学院声学研究所 | 一种房间混响合成方法 |
CN107071636A (zh) * | 2016-12-29 | 2017-08-18 | 北京小鸟听听科技有限公司 | 对带麦克风的设备的去混响控制方法和装置 |
CN109151702A (zh) * | 2018-09-21 | 2019-01-04 | 歌尔科技有限公司 | 音频设备的音效调节方法、音频设备及可读存储介质 |
Non-Patent Citations (2)
Title |
---|
《基于最大似然估计的混响时间盲估计方法》;王华;《中国优秀硕士学位论文全文数据库信息科技辑》;20190115(第01期);全文 * |
《测量混响时间的几种方法》;刘亚涛,乔晓亮,王立峰;《农家科技(下旬刊)》;20130607(第1期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN109686380A (zh) | 2019-04-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109658942B (zh) | 一种音频数据处理方法、装置以及相关设备 | |
EP2761617B1 (en) | Processing audio signals | |
US9210504B2 (en) | Processing audio signals | |
GB2495472B (en) | Processing audio signals | |
US20140270182A1 (en) | Sound For Map Display | |
JP2017514392A (ja) | ユーザ端末ならびに端末の音量を調整する方法および装置 | |
JP2010537465A (ja) | 狭い指向性のラウドスピーカと広い指向性のラウドスピーカとを有するオーディオ再生システム | |
CN108235181B (zh) | 在音频处理装置中降噪的方法 | |
CN109686380B (zh) | 语音信号的处理方法、装置及电子设备 | |
US20230007421A1 (en) | Live data distribution method, live data distribution system, and live data distribution apparatus | |
JPWO2018193826A1 (ja) | 情報処理装置、情報処理方法、音声出力装置、および音声出力方法 | |
CN107396237A (zh) | 自定位的智能音箱 | |
CN111989935A (zh) | 声音处理装置、声音处理方法及程序 | |
KR20230113853A (ko) | 오디오 소스 지향성에 기초한 심리음향 강화 | |
CN116437268B (zh) | 自适应分频的环绕声上混方法、装置、设备及存储介质 | |
CN117205546A (zh) | 虚拟场景的声音处理方法、装置、计算机设备及存储介质 | |
US11269587B2 (en) | Information processing apparatus and information processing method | |
CN112382305B (zh) | 调节音频信号的方法、装置、设备和存储介质 | |
JP7403436B2 (ja) | 異なる音場の複数の録音音響信号を合成する音響信号合成装置、プログラム及び方法 | |
CN111933170B (zh) | 语音信号的处理方法、装置、设备及存储介质 | |
JP2021177588A (ja) | 信号処理装置および信号処理方法 | |
CN115362499A (zh) | 用于在各种环境中增强音频的系统和方法 | |
JP4867542B2 (ja) | マスキング装置 | |
CN120416734A (zh) | 音频设备、音频设备的声音控制方法及可读存储介质 | |
JP5446927B2 (ja) | マスカ音生成装置およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |