CN106060707B - 混响处理方法及装置 - Google Patents
混响处理方法及装置 Download PDFInfo
- Publication number
- CN106060707B CN106060707B CN201610365847.9A CN201610365847A CN106060707B CN 106060707 B CN106060707 B CN 106060707B CN 201610365847 A CN201610365847 A CN 201610365847A CN 106060707 B CN106060707 B CN 106060707B
- Authority
- CN
- China
- Prior art keywords
- audio
- clip
- segment
- value
- segments
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 15
- 238000012545 processing Methods 0.000 claims abstract description 71
- 238000000034 method Methods 0.000 claims abstract description 24
- 230000000694 effects Effects 0.000 claims abstract description 16
- 238000004364 calculation method Methods 0.000 claims description 11
- 230000008859 change Effects 0.000 claims description 7
- 238000004891 communication Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 5
- 230000005428 wave function Effects 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Circuit For Audible Band Transducer (AREA)
- Stereophonic System (AREA)
Abstract
本公开是关于一种混响处理方法及装置,属于音视频处理技术领域。所述方法包括:获取至少两个音频片段,每个音频片段由一个声道采集,且所述至少两个音频片段具有相同的音频内容及时长;获取每个音频片段的音量值;根据所述至少两个音频片段的音量值,从所述至少两个音频片段中,确定待处理的音频片段;对所述待处理的音频片段进行混响处理。本公开并未直接将获取到的多个音频片段进行混响处理,而是基于每个声道所采集的音频片段的音量值,从多个音频片段中,确定出待处理的音频片段,由于该待处理的音频片段更能反映出所采集到的多个音频片段的录制场景,因而避免了混响处理后的音频片段失真,使得所得到的混响音频片段的音效较佳。
Description
技术领域
本公开涉及音视频处理技术领域,尤其涉及一种混响处理方法及装置。
背景技术
在音视频处理领域,原始音频片段是指采集后未经过任何后期处理和加工的音频片段,通常由麦克风直接采集到的音频片段都是原始音频片段。混响音频片段是指对原始音频片段经过混响处理后得到的音频片段。一般情况下,原始音频片段中的声音较为生涩、干瘪,混响音频片段中的声音圆润、饱满。为使用户获取较佳的听觉体验,常常需要对获取的原始音频片段进行混响处理。
目前,在音视频录制过程中,终端通过双声道或多声道采集原始音频片段后,对双声道或多声道所采集的原始音频片段直接进行混响处理。
发明内容
本公开提供一种混响处理方法及装置。
根据本公开实施例的第一方面,提供一种混响处理方法,包括:
获取至少两个音频片段,每个音频片段由一个声道采集,且所述至少两个音频片段具有相同的音频内容及时长;
获取每个音频片段的音量值;
根据所述至少两个音频片段的音量值,从所述至少两个音频片段中,确定待处理的音频片段;
对所述待处理的音频片段进行混响处理。
在本公开的另一个实施例中,所述获取每个音频片段的音量值,包括:
获取每个音频片段在单位时长内的能量值;
将所述每个音频片段在单位时长内的能量值,作为每个音频片段的音量值。
在本公开的另一个实施例中,所述获取每个音频片段在单位时长内的能量值,包括:
对于任一音频片段,应用以下公式,计算所述音频片段的能量值:
其中,y表示所述音频片段在所述单位时长内的能量值,T表示所述单位时长,t表示所述单位时长内的任一时刻,|St|表示所述音频片段在t时刻的振幅。
在本公开的另一个实施例中,所述根据所述至少两个音频片段的音量值,从所述至少两个音频片段中,确定待处理的音频片段,包括:
从所述至少两个音频片段的音量值中,获取最大的音量值;
将所述最大的音量值对应的音频片段,作为所述待处理的音频片段。
在本公开的另一个实施例中,所述根据所述至少两个音频片段的音量值,从所述至少两个音频片段中,确定待处理的音频片段,包括:
根据所述至少两个音频片段的音量值,确定每个音频片段的音量值在所有音频片段的音量值总和中的权重值;
根据每个音量片段的音量值及权重值,确定目标音量值;
根据所述目标音量值,调节所述至少两个音频片段中一个音频片段的音量值,得到所述待处理的音频片段。
在本公开的另一个实施例中,所述对所述待处理的音频片段进行混响处理之后,还包括:
将通过混响处理得到的混响音频片段拷贝到每个声道对应的存储单元中。
根据本公开实施例的第二方面,提供一种混响处理装置,包括:
第一获取模块,用于获取至少两个音频片段,每个音频片段由一个声道采集,且所述至少两个音频片段具有相同的音频内容及时长;
第二获取模块,用于获取每个音频片段的音量值;
确定模块,用于根据所述至少两个音频片段的音量值,从所述至少两个音频片段中,确定待处理的音频片段;
处理模块,用于对所述待处理的音频片段进行混响处理。
在本公开的另一个实施例中,所述第二获取模块,用于获取每个音频片段在单位时长内的能量值;将所述每个音频片段在单位时长内的能量值,作为每个音频片段的音量值。
在本公开的另一个实施例中,所述第二获取模块,还用于对于任一音频片段,应用以下公式,计算所述音频片段的能量值:
其中,y表示所述音频片段在所述单位时长内的能量值,T表示所述单位时长,t表示所述单位时长内的任一时刻,|St|表示所述音频片段在t时刻的振幅。
在本公开的另一个实施例中,所述确定模块,用于从所述至少两个音频片段的音量值中,获取最大的音量值;将所述最大的音量值对应的音频片段,作为所述待处理的音频片段。
在本公开的另一个实施例中,所述确定模块,用于根据所述至少两个音频片段的音量值,确定每个音频片段的音量值在所有音频片段的音量值总和中的权重值;根据每个音量片段的音量值及权重值,确定目标音量值;根据所述目标音量值,调节所述至少两个音频片段中一个音频片段的音量值,得到所述待处理的音频片段。
在本公开的另一个实施例中,所述装置还包括:
拷贝模块,用于将通过混响处理得到的混响音频片段拷贝到每个声道对应的存储单元中。
根据本公开实施例的第三方面,提供一种混响处理装置,包括:
处理器;
用于存储处理器可执行的指令的存储器;
其中,所述处理器被配置为:
获取至少两个音频片段,每个音频片段由一个声道采集,且所述至少两个音频片段具有相同的音频内容及时长;
获取每个音频片段的音量值;
根据所述至少两个音频片段的音量值,从所述至少两个音频片段中,确定待处理的音频片段;
对所述待处理的音频片段进行混响处理。
本公开的实施例提供的技术方案可以包括以下有益效果:
本公开并未直接将获取到的多个音频片段进行混响处理,而是基于每个声道所采集的音频片段的音量值,从多个音频片段中,确定出待处理的音频片段,由于该待处理的音频片段更能反映出所采集到的多个音频片段的录制场景,因而避免了混响处理后的音频片段失真,使得所得到的混响音频片段的音效较佳。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1是根据一示例性实施例示出的一种音频采集场景的示意图。
图2是根据一示例性实施例示出的一种混响处理方法的流程图。
图3是根据一示例性实施例示出的一种混响处理方法的流程图。
图4是根据一示例性实施例示出的一种音频片段的波形图。
图5是根据一示例性实施例示出的一种混响处理过程的示意图。
图6是根据一示例性实施例示出的一种混响处理装置的结构示意图。
图7是根据一示例性实施例示出的一种混响处理装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
随着科技的发展,具有音视频录制功能的终端广泛应用在用户的生活中,例如,智能手机、平板电脑、录音笔、录像机等等。由于这些终端一般具有至少两个麦克风,而每个麦克风都可采集声源发出的声音,因此,在使用这些终端进行音视频录制时,终端可采集到至少两个音频片段。实际上,由于每个麦克风与声源的距离不同,每个麦克风所采集到的音频片段的音量大小是不同的,参见图1,其示出了一种音频采集场景。在该场场景下,当用户使用智能手机录制音频片段时,位于智能手机上方的麦克风A与声源的距离大于位于智能手机下方的麦克风B,因而当声源发出声音后,麦克风B先采集到,麦克风A后采集到,且麦克风B采集到的音频片段的音量值大于麦克风A采集的音频片段的音量值。在音视频处理领域,基于终端内麦克风对声源所发出的声音的采集时间,将不同麦克风划分为不同的声道,每个麦克风对应一个声道,在本实施例中,每个麦克风采集到的音频片段可以看作对应声道采集的。
基于不同声道所采集的到音频片段,目前的混响处理方法,根据至少两个声道采集的音频片段的音量值,计算出至少两个音频片段的平均音量值,并基于这个平均音量值,通过调整至少两个音频片段中一个音频片段的音量值,得到一个待处理的音频片段,进而对该待处理的音频片段进行混响处理。然而,实际上不同声道采集到的音频片段的音量值不同,将不同声道采集到的音频片段的音量值进行平均处理,使得混响处理后得到的混响音频片段失真,无法真实地还原原来的录制场景,因而播放时音效较差。
图2是根据一示例性实施例示出的一种混响处理方法的流程图,如图2所示,混响处理方法用于终端中,包括以下步骤。
在步骤201中,获取至少两个音频片段,每个音频片段由一个声道采集,且至少两个音频片段具有相同的音频内容及时长。
在步骤202中,获取每个音频片段的音量值。
在步骤203中,根据至少两个音频片段的音量值,从至少两个音频片段中,确定待处理的音频片段。
在步骤204中,对待处理的音频片段进行混响处理。
本公开实施例提供的方法,并未直接将获取到的多个音频片段进行混响处理,而是基于每个声道所采集的音频片段的音量值,从多个音频片段中,确定出待处理的音频片段,由于该待处理的音频片段更能反映出所采集到的多个音频片段的录制场景,因而避免了混响处理后的音频片段失真,使得所得到的混响音频片段的音效较佳。
在本公开的另一个实施例中,获取每个音频片段的音量值,包括:
获取每个音频片段在单位时长内的能量值;
将每个音频片段在单位时长内的能量值,作为每个音频片段的音量值。
在本公开的另一个实施例中,获取每个音频片段在单位时长内的能量值,包括:
对于任一音频片段,应用以下公式,计算音频片段的能量值:
其中,y表示音频片段在单位时长内的能量值,T表示单位时长,t表示单位时长内的任一时刻,|St|表示音频片段在t时刻的振幅。
在本公开的另一个实施例中,根据至少两个音频片段的音量值,从至少两个音频片段中,确定待处理的音频片段,包括:
从至少两个音频片段的音量值中,获取最大的音量值;
将最大的音量值对应的音频片段,作为待处理的音频片段。
在本公开的另一个实施例中,根据至少两个音频片段的音量值,从至少两个音频片段中,确定待处理的音频片段,包括:
根据至少两个音频片段的音量值,确定每个音频片段的音量值在所有音频片段的音量值总和中的权重值;
根据每个音量片段的音量值及权重值,确定目标音量值;
根据目标音量值,调节至少两个音频片段中一个音频片段的音量值,得到待处理的音频片段。
在本公开的另一个实施例中,对待处理的音频片段进行混响处理之后,还包括:
将通过混响处理得到的混响音频片段拷贝到每个声道对应的存储单元中。
上述所有可选技术方案,可以采用任意结合形成本公开的可选实施例,在此不再一一赘述。
图3是根据一示例性实施例示出的一种混响处理方法的流程图,如图3所示,混响处理方法用于终端中,包括以下步骤。
在步骤301中,终端获取至少两个音频片段,每个音频片段由一个声道采集,且至少两个音频片段具有相同的音频内容及时长。
在本公开的一个实施例中,终端中安装有至少两个麦克风,每个麦克风对应一个声道,在音视频录制过程中,每个麦克风可实时采集周围环境中的声音,得到一个音频片段,终端获取至少两个麦克风采集到的音频片段,作为获取到的至少两个音频片段。在本实施例中,每个麦克风对应一个声道,每个麦克风采集到的音频片段可以看作对应声道采集的。由于至少两个麦克风采集的声音由相同的声源发出,因此,至少两个音频片段均具有相同的音频内容及时长。
在本公开的另一个实施例中,终端的本地存储器可存储麦克风采集到的音频片段,为了减轻处理压力,终端可在音视频录制完成后,从本地存储器中获取至少两个麦克风所采集的至少两个音频片段。其中,本地存储器可以为易失性存储器(如内存,memory)和非易失性存储器(如硬盘,storage)中的至少一种,本实施例不对本地存储器作具体的限定。
在步骤302中,终端获取每个音频片段的音量值。
由于声音是由物体震动产生的,每一个音频片段都对应一个波形,波形上每一时刻的振幅主要取决于该时刻的采集到音频片段的音量值,一般情况下音量值越大,振幅越大。而波形上的任一时刻的振幅可以反映出音频片段在该时刻的能量值,振幅越大,能量值越大。其中,音量用于表征声音的强弱,音量的单位为分贝。
由上述内容可知,音频片段的能量值也能够反映出该音频片段的音量值,音频片段的能量值与音量值成正比关系,如果一个音频片段在某一时刻的能量值相对其他音频片段的能量值较大,说明该音频片段在该时刻的音量值较大,相应地在该时刻音频片段对应的波形上振幅值较大;相反,如果一个音频片段在某一时刻的能量值相对其他音频片段的能量值较小,说明该音频片段在该时刻的音量值较小,相应地在该时刻音频片段对应的波形上振幅值较小。基于音频片段的能量值与音量值之间的关系,本实施例可通过获取每个音频片段的能量值,获取每个音频片段的音量值。
由于在使用终端录制音视频的过程中,用户相对声源的位置可能会发生变化,因而在不同时间段内不同麦克风所采集到的音频片段的音量值可能是不同的。为了适应用户的位置变化,以获取到更为准确的音量值,在本实施例中终端可获取每个音频片段在单位时长内的能量值,并将每个音频片段在单位时长作为每个音频片段的能量值。其中,单位时长可由终端根据自身计算能力或用户位置发生变化的最小时长设置,该单位时长可以为1秒、2秒等,本实施例不对单位时长作具体的限定。
对于任一音频片段,终端在获取该音频片段在单位时长内的能量值时,分为如下两种情况。
在本公开的一个实施例中,如果音频片段的时长小于等于单位时长,则直接计算音频片段在该时长内的能量值,并将音频片段在该时长内的能量值,作为音频片段的能量值。
在本公开的另一个实施例中,如果音频片段的时长大于单位时长,则根据单位时长,将音频片段划分为多个音频子片段,获取每个音频子片段在单位时长内的能量值,并将每个音频子片段在单位时长内的能量值,作为每个音频子片段的能量值。
在本实施例中,对于任一音频片段,可以应用以下公式,计算该音频片段的能量值:
其中,y表示音频片段在单位时长内的能量值,T表示单位时长,t表示单位时长内的任一时刻,|St|表示音频片段在t时刻的振幅。需要注意的是,上述公式中振幅的叠加为标量叠加,并不是矢量叠加。
需要说明的是,上述以音频片段的时长小于等于单位时长为例进行说明的,当音频片段的时长大于单位时长时,y表示音频片段的一个音频子片段在单位时长内的能量值,T表示单位时长,t表示单位时长内的任一时刻,|St|表示音频子片段在t时刻的振幅。参见图4,其示出了任一音频片段的波形,由图4可知,该音频片段的时长大于单位时长,则计算该音频片段在单位时长内的能量值时,将该音频片段划分为多个音频子片段,并分别计算每个音频子片段在单位时长内的能量值。
在步骤303中,终端根据至少两个音频片段的音量值,从至少两个音频片段中,确定待处理的音频片段。
在本实施例中,终端根据至少两个音频片段的音量值,从至少两个音频片段中,确定待处理的音频片段,可采用如下两种方式:
第一种方式:终端从至少两个音频片段的音量值中,获取最大的音量值,并将最大的音量值对应的音频片段,作为待处理的音频片段。
例如,终端获取到4个音频片段,分别为音频片段a、音频片段b、音频片段c、音频片段d,其中,音频片段a的音量值为10分贝、音频片段b的音量值为12分贝、音频片段c的音量值为15分贝、音频片段d的音量值为13分贝,由于音频片段c的音量值最大,因此,将音频片段c作为待处理的音频片段。
第二种方式:终端根据至少两个音频片段的音量值,确定每个音频片段的音量值在所有音频片段的音量值总和中的权重值,并根据每个音量片段的音量值及权重值,确定目标音量值,进而根据目标音量值,调节至少两个音频片段中一个音频片段的音量值,得到待处理的音频片段。
例如,终端获取到3个音频片段,分别为音频片段a、音频片段b、音频片段c,其中,音频片段a的音量值为5分贝、音频片段b的音量值为8分贝、音频片段c的音量值为12分贝。终端所获取到的所有音频片段的音量值总和为25分贝,音频片段a的音量值在所有音频片段的音量值总和中的权重值为0.2,音频片段b的音量值在所有音频片段的音量值总和中的权重值为0.32,音频片段c的音量值在所有音频片段的音量值总和中的权重值为0.48,则根据每个音量片段的音量值及权重值,可确定目标音量值=5*0.2+8*0.32+12*0.48=9.32分贝,根据该目标音量值,通过调整音频片段a、音频片段b、音频片段c中的任一个,可得到待处理的音频片段。
需要说明的是,如果每个音频片段的时长大于单位时长,则在确定待处理的音频片段时,需要分别确定待处理的每个音频子片段,并将所确定的多个待处理的音频子片段按照时间顺序组合成待处理的音频片段。
在步骤304中,终端对待处理的音频片段进行混响处理。
基于所确定的待处理的音频片段,终端通过对待处理的音频片段与需要添加的混响效果文件进行叠加计算,得到混响音频文件。具体叠加计算时,包括但不限于采用卷积计算的方法将待处理的音频片段的波形与混响效果文件对应的波形进行叠加。由于待处理的音频片段的波形可用一个波函数表示,混响效果文件对应的波形也可用一个波函数表示,而通过卷积计算可将待处理的音频片段对应的波函数与混响效果文件对应的波函数合成一个波函数,因此,可通过卷积计算将待处理的音频片段的波形与混响效果文件对应的波形进行叠加。其中,卷积计算是分析数学中一种重要的运算,通过卷积计算可将两个函数合成第三个函数。例如,若h(x)=(f*g)(x),则称h(x)为f和g的卷积。
在步骤305中,终端将通过混响处理得到的混响音频片段拷贝到每个声道对应的存储单元中。
终端通过混响处理得到混响音频片段之后,将得到的混响音频片段拷贝到每个声道对应的存储单元中,从而在后续播放时,终端可从每个声道对应的存储单元中获取混响音频片段,并按照该声道对应的播放方式进行播放。
对于上述混响处理过程,为了便于理解,下面将以图5为例进行说明。
参见图5,在音频或视频文件的录制过程中,终端内的至少两个麦克风采集环境中的声音,得到至少两个音频片段,由于每个麦克风对应一个声道,因而采集到的至少两个音频片段可以看作至少两个声道采集的。在音频或视频文件录制过程中,或音频或视频文件录制完成后,终端获取至少两个声道采集的音频片段,并获取每个音频片段的音量值,基于至少两个音频片段的音量值,将音量值最大的音频片段作为待处理的音频片段,或者,根据每个音频片段的音量值,确定出目标音量值,并根据该目标音量值,通过调整一个音频片段的音量值得到待处理的音频片段。之后,终端对待处理的音频片段进行混响处理,得到混响音频片段,并将得到的混响音频片段拷贝到每个声道对应的存储单元中。
本公开实施例提供的方法,并未直接将获取到的多个音频片段进行混响处理,而是基于每个声道所采集的音频片段的音量值,从多个音频片段中,确定出待处理的音频片段,由于该待处理的音频片段更能反映出所采集到的多个音频片段的录制场景,因而避免了混响处理后的音频片段失真,使得所得到的混响音频片段的音效较佳。
图6是根据一示例性实施例示出的一种混响处理装置示意图。参照图6,该装置包括:第一获取模块601、第二获取模块602、确定模块603及处理模块604。
该第一获取模块601被配置为获取至少两个音频片段,每个音频片段由一个声道采集,且至少两个音频片段具有相同的音频内容及时长;
该第二获取模块602被配置为获取每个音频片段的音量值;
该确定模块603被配置为根据至少两个音频片段的音量值,从至少两个音频片段中,确定待处理的音频片段;
该处理模块604被配置为对待处理的音频片段进行混响处理。
在本公开的另一个实施例中,该第二获取模块602被配置为获取每个音频片段在单位时长内的能量值;将每个音频片段在单位时长内的能量值,作为每个音频片段的音量值。
在本公开的另一个实施例中,该第二获取模块602被配置为对于任一音频片段,应用以下公式,计算音频片段的能量值:
其中,y表示音频片段在单位时长内的能量值,T表示单位时长,t表示单位时长内的任一时刻,|St|表示音频片段在t时刻的振幅。
在本公开的另一个实施例中,该确定模块603被配置为从至少两个音频片段的音量值中,获取最大的音量值;将最大的音量值对应的音频片段,作为待处理的音频片段。
在本公开的另一个实施例中,该确定模块603被配置为根据至少两个音频片段的音量值,确定每个音频片段的音量值在所有音频片段的音量值总和中的权重值;根据每个音量片段的音量值及权重值,确定目标音量值;根据目标音量值,调节至少两个音频片段中一个音频片段的音量值,得到待处理的音频片段。
在本公开的另一个实施例中,该装置还包括:拷贝模块。
该拷贝模块被配置为将通过混响处理得到的混响音频片段拷贝到每个声道对应的存储单元中。
本公开实施例提供的装置,并未直接将获取到的多个音频片段进行混响处理,而是基于每个声道所采集的音频片段的音量值,从多个音频片段中,确定出待处理的音频片段,由于该待处理的音频片段更能反映出所采集到的多个音频片段的录制场景,因而避免了混响处理后的音频片段失真,使得所得到的混响音频片段的音效较佳。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图7是根据一示例性实施例示出的一种用于混响处理的装置700的框图。例如,装置700可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图7,装置700可以包括以下一个或多个组件:处理组件702,存储器704,电源组件706,多媒体组件708,音频组件710,输入/输出(I/O)接口712,传感器组件714,以及通信组件716。
处理组件702通常控制装置700的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件702可以包括一个或多个处理器720来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件702可以包括一个或多个模块,便于处理组件702和其他组件之间的交互。例如,处理组件702可以包括多媒体模块,以方便多媒体组件708和处理组件702之间的交互。
存储器704被配置为存储各种类型的数据以支持在装置700的操作。这些数据的示例包括用于在装置700上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器704可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件706为装置700的各种组件提供电力。电源组件706可以包括电源管理系统,一个或多个电源,及其他与为装置700生成、管理和分配电力相关联的组件。
多媒体组件708包括在所述装置700和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件708包括一个前置摄像头和/或后置摄像头。当装置700处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件710被配置为输出和/或输入音频信号。例如,音频组件710包括一个麦克风(MIC),当装置700处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器704或经由通信组件716发送。在一些实施例中,音频组件710还包括一个扬声器,用于输出音频信号。
I/O接口712为处理组件702和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件714包括一个或多个传感器,用于为装置700提供各个方面的状态评估。例如,传感器组件714可以检测到装置700的打开/关闭状态,组件的相对定位,例如所述组件为装置700的显示器和小键盘,传感器组件714还可以检测装置700或装置700一个组件的位置改变,用户与装置700接触的存在或不存在,装置700方位或加速/减速和装置700的温度变化。传感器组件714可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件714还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件714还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件716被配置为便于装置700和其他设备之间有线或无线方式的通信。装置700可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件716经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件716还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置700可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器704,上述指令可由装置700的处理器720执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本公开实施例提供的装置,并未直接将获取到的多个音频片段进行混响处理,而是基于每个声道所采集的音频片段的音量值,从多个音频片段中,确定出待处理的音频片段,由于该待处理的音频片段更能反映出所采集到的多个音频片段的录制场景,因而避免了混响处理后的音频片段失真,使得所得到的混响音频片段的音效较佳。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行一种混响处理方法,所述方法包括:
获取至少两个音频片段,每个音频片段由一个声道采集,且至少两个音频片段具有相同的音频内容及时长;
获取每个音频片段的音量值;
根据至少两个音频片段的音量值,从至少两个音频片段中,确定待处理的音频片段;
对待处理的音频片段进行混响处理。
在本公开的另一个实施例中,获取每个音频片段的音量值,包括:
获取每个音频片段在单位时长内的能量值;
将每个音频片段在单位时长内的能量值,作为每个音频片段的音量值。
在本公开的另一个实施例中,获取每个音频片段在单位时长内的能量值,包括:
对于任一音频片段,应用以下公式,计算音频片段的能量值:
其中,y表示音频片段在单位时长内的能量值,T表示单位时长,t表示单位时长内的任一时刻,|St|表示音频片段在t时刻的振幅。
在本公开的另一个实施例中,根据至少两个音频片段的音量值,从至少两个音频片段中,确定待处理的音频片段,包括:
从至少两个音频片段的音量值中,获取最大的音量值;
将最大的音量值对应的音频片段,作为待处理的音频片段。
在本公开的另一个实施例中,根据至少两个音频片段的音量值,从至少两个音频片段中,确定待处理的音频片段,包括:
根据至少两个音频片段的音量值,确定每个音频片段的音量值在所有音频片段的音量值总和中的权重值;
根据每个音量片段的音量值及权重值,确定目标音量值;
根据目标音量值,调节至少两个音频片段中一个音频片段的音量值,得到待处理的音频片段。
在本公开的另一个实施例中,对待处理的音频片段进行混响处理之后,还包括:
将通过混响处理得到的混响音频片段拷贝到每个声道对应的存储单元中。
本公开实施例提供的非临时性计算机可读存储介质,并未直接将获取到的多个音频片段进行混响处理,而是基于每个声道所采集的音频片段的音量值,从多个音频片段中,确定出待处理的音频片段,由于该待处理的音频片段更能反映出所采集到的多个音频片段的录制场景,因而避免了混响处理后的音频片段失真,使得所得到的混响音频片段的音效较佳。
本领域技术人员在考虑说明书及实践这里公开的公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (5)
1.一种混响处理方法,其特征在于,应用于终端中,所述方法包括:
获取至少两个音频片段,每个音频片段由一个声道采集,且所述至少两个音频片段具有相同的音频内容及时长,在与声源距离不同的位置采集到的音频片段的音量大小不同;计算所述至少两个音频片段的能量值,基于音频片段的能量值与音量值之间的正比关系,根据所述至少两个音频片段的能量值,获取所述至少两个音频片段的音量值;
根据所述至少两个音频片段的音量值,从所述至少两个音频片段中,确定待处理的音频片段;采用卷积计算的方法将所述待处理的音频片段的波形与需要添加的混响效果文件的波形进行叠加,以实现对所述待处理的音频片段的混响处理;将得到的混响音频片段拷贝到每个声道对应的存储单元中,以使终端从每个声道对应的存储单元中获取混响音频片段,并按照每个声道对应的播放方式进行播放;
对于所述至少两个音频片段中的每个音频片段,所述获取所述至少两个音频片段的音量值,包括:
如果每个音频片段的时长小于或等于单位时长,计算每个音频片段在所述单位时长内的能量值,将每个音频片段在单位时长内的能量值,作为每个音频片段的音量值,所述单位时长由所述终端根据自身计算能力或用户位置发生变化的最小时长设置;如果每个音频片段的时长大于所述单位时长,则根据所述单位时长,将每个音频片段划分为多个音频子片段,获取每个音频子片段在所述单位时长内的能量值,将每个音频子片段在所述单位时长内的能量值,作为每个音频子片段的能量值;
所述根据所述至少两个音频片段的音量值,从所述至少两个音频片段中,确定待处理的音频片段,包括:
从所述至少两个音频片段的音量值中,获取最大的音量值,将所述最大的音量值对应的音频片段,作为所述待处理的音频片段;或者,根据所述至少两个音频片段的音量值,确定每个音频片段的音量值在所有音频片段的音量值总和中的权重值,根据每个音频片段的音量值及权重值,确定目标音量值,根据所述目标音量值,调节所述至少两个音频片段中一个音频片段的音量值,得到所述待处理的音频片段。
3.一种混响处理装置,其特征在于,所述装置包括:
第一获取模块,用于获取至少两个音频片段,每个音频片段由一个声道采集,且所述至少两个音频片段具有相同的音频内容及时长,在与声源距离不同的位置采集到的音频片段的音量大小不同;
第二获取模块,用于计算所述至少两个音频片段的能量值,基于音频片段的能量值与音量值之间的正比关系,根据所述至少两个音频片段的能量值,获取所述至少两个音频片段的音量值;
确定模块,用于根据所述至少两个音频片段的音量值,从所述至少两个音频片段中,确定待处理的音频片段;
拷贝模块,用于将通过混响处理得到的混响音频片段拷贝到每个声道对应的存储单元中,以使终端从每个声道对应的存储单元中获取混响音频片段,并按照每个声道对应的播放方式进行播放;
处理模块,用于采用卷积计算的方法将所述待处理的音频片段的波形与需要添加的混响效果文件的波形进行叠加,以实现对所述待处理的音频片段的混响处理;
所述第二获取模块,用于对于所述至少两个音频片段中的每个音频片段,如果每个音频片段的时长小于或等于单位时长,计算每个音频片段在所述单位时长内的能量值,将每个音频片段在单位时长内的能量值,作为每个音频片段的音量值,所述单位时长由所述终端根据自身计算能力或用户位置发生变化的最小时长设置;如果每个音频片段的时长大于所述单位时长,则根据所述单位时长,将每个音频片段划分为多个音频子片段,获取每个音频子片段在所述单位时长内的能量值,将每个音频子片段在所述单位时长内的能量值,作为每个音频子片段的能量值;
所述确定模块,用于从所述至少两个音频片段的音量值中,获取最大的音量值,将所述最大的音量值对应的音频片段,作为所述待处理的音频片段;或者,用于根据所述至少两个音频片段的音量值,确定每个音频片段的音量值在所有音频片段的音量值总和中的权重值,根据每个音频片段的音量值及权重值,确定目标音量值,根据所述目标音量值,调节所述至少两个音频片段中一个音频片段的音量值,得到所述待处理的音频片段。
5.一种混响处理装置,其特征在于,包括:
处理器;
用于存储处理器可执行的指令的存储器;
其中,所述处理器被配置为:
获取至少两个音频片段,每个音频片段由一个声道采集,且所述至少两个音频片段具有相同的音频内容及时长,在与声源距离不同的位置采集到的音频片段的音量大小不同;
计算所述至少两个音频片段的能量值,基于音频片段的能量值与音量值之间的正比关系,根据所述至少两个音频片段的能量值,获取所述至少两个音频片段的音量值;
根据所述至少两个音频片段的音量值,从所述至少两个音频片段中,确定待处理的音频片段;采用卷积计算的方法将所述待处理的音频片段的波形与需要添加的混响效果文件的波形进行叠加,以实现对所述待处理的音频片段的混响处理;将得到的混响音频片段拷贝到每个声道对应的存储单元中,以使终端从每个声道对应的存储单元中获取混响音频片段,并按照每个声道对应的播放方式进行播放;
对于所述至少两个音频片段中的每个音频片段,所述获取所述至少两个音频片段的音量值,包括:
如果每个音频片段的时长小于或等于单位时长,计算每个音频片段在所述单位时长内的能量值,将每个音频片段在单位时长内的能量值,作为每个音频片段的音量值,所述单位时长由所述终端根据自身计算能力或用户位置发生变化的最小时长设置;如果每个音频片段的时长大于所述单位时长,则根据所述单位时长,将每个音频片段划分为多个音频子片段,获取每个音频子片段在所述单位时长内的能量值,将每个音频子片段在所述单位时长内的能量值,作为每个音频子片段的能量值;
所述根据所述至少两个音频片段的音量值,从所述至少两个音频片段中,确定待处理的音频片段,包括:
从所述至少两个音频片段的音量值中,获取最大的音量值,将所述最大的音量值对应的音频片段,作为所述待处理的音频片段;或者,根据所述至少两个音频片段的音量值,确定每个音频片段的音量值在所有音频片段的音量值总和中的权重值,根据每个音频片段的音量值及权重值,确定目标音量值,根据所述目标音量值,调节所述至少两个音频片段中一个音频片段的音量值,得到所述待处理的音频片段。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610365847.9A CN106060707B (zh) | 2016-05-27 | 2016-05-27 | 混响处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610365847.9A CN106060707B (zh) | 2016-05-27 | 2016-05-27 | 混响处理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106060707A CN106060707A (zh) | 2016-10-26 |
CN106060707B true CN106060707B (zh) | 2021-05-04 |
Family
ID=57174943
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610365847.9A Active CN106060707B (zh) | 2016-05-27 | 2016-05-27 | 混响处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106060707B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109413492B (zh) * | 2017-08-18 | 2021-05-28 | 武汉斗鱼网络科技有限公司 | 一种直播过程中音频数据混响处理方法及系统 |
CN108198572A (zh) * | 2017-12-29 | 2018-06-22 | 珠海市君天电子科技有限公司 | 一种音频处理方法及装置 |
CN111045633A (zh) * | 2018-10-12 | 2020-04-21 | 北京微播视界科技有限公司 | 用于检测音频信号的响度的方法和装置 |
CN112863530B (zh) * | 2021-01-07 | 2024-08-27 | 广州欢城文化传媒有限公司 | 一种声音作品的生成方法和装置 |
CN115314826A (zh) * | 2022-06-30 | 2022-11-08 | 青岛海尔科技有限公司 | 麦克风校准方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1845573A (zh) * | 2006-04-30 | 2006-10-11 | 南京大学 | 支持大容量混音的同声传译视频会议系统及方法 |
CN1953048A (zh) * | 2005-10-18 | 2007-04-25 | 腾讯科技(深圳)有限公司 | 一种混音的处理方法 |
CN101335867A (zh) * | 2007-09-27 | 2008-12-31 | 深圳市迪威新软件技术有限公司 | 一种会议电视系统的语音激励控制方法 |
CN101841379A (zh) * | 2009-03-13 | 2010-09-22 | 三洋电机株式会社 | 接收装置 |
CN103888580A (zh) * | 2014-03-31 | 2014-06-25 | 宇龙计算机通信科技(深圳)有限公司 | 一种终端录音过程中降噪处理方法及终端 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010112996A (ja) * | 2008-11-04 | 2010-05-20 | Sony Corp | 音声処理装置、音声処理方法およびプログラム |
-
2016
- 2016-05-27 CN CN201610365847.9A patent/CN106060707B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1953048A (zh) * | 2005-10-18 | 2007-04-25 | 腾讯科技(深圳)有限公司 | 一种混音的处理方法 |
CN1845573A (zh) * | 2006-04-30 | 2006-10-11 | 南京大学 | 支持大容量混音的同声传译视频会议系统及方法 |
CN101335867A (zh) * | 2007-09-27 | 2008-12-31 | 深圳市迪威新软件技术有限公司 | 一种会议电视系统的语音激励控制方法 |
CN101841379A (zh) * | 2009-03-13 | 2010-09-22 | 三洋电机株式会社 | 接收装置 |
CN103888580A (zh) * | 2014-03-31 | 2014-06-25 | 宇龙计算机通信科技(深圳)有限公司 | 一种终端录音过程中降噪处理方法及终端 |
Also Published As
Publication number | Publication date |
---|---|
CN106060707A (zh) | 2016-10-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3163748B1 (en) | Method, device and terminal for adjusting volume | |
CN107105314B (zh) | 视频播放方法及装置 | |
EP3125530A1 (en) | Video recording method and device | |
CN105828201B (zh) | 视频处理方法及装置 | |
CN106060707B (zh) | 混响处理方法及装置 | |
CN107360326B (zh) | 终端音量调节处理方法及音量调节终端 | |
CN107493500B (zh) | 多媒体资源播放方法及装置 | |
CN104519282A (zh) | 图像拍摄方法及装置 | |
CN108845787B (zh) | 音频调节的方法、装置、终端及存储介质 | |
CN103927165A (zh) | 一种壁纸图片的处理方法及装置 | |
CN104021148A (zh) | 调节音效的方法和装置 | |
CN108462784A (zh) | 通话音量调整方法及装置 | |
CN111883164A (zh) | 模型训练方法、装置、电子设备及存储介质 | |
CN111510846B (zh) | 音场调节方法、装置及存储介质 | |
CN108629814B (zh) | 相机调整方法及装置 | |
CN108600503B (zh) | 语音通话的控制方法及装置 | |
CN105245898B (zh) | 图像数据存储方法和装置 | |
EP3851876A1 (en) | Method and device for processing information based on radar waves, terminal, and storage medium | |
CN105204841B (zh) | 量程调整方法及装置 | |
CN104065877A (zh) | 一种图片推送方法、装置及终端设备 | |
CN103973883B (zh) | 一种控制语音输入设备的方法及装置 | |
CN108366237B (zh) | 投影图像调节方法、装置及计算机可读存储介质 | |
CN112954596B (zh) | 数据共享方法、装置、设备及存储介质 | |
CN109712629B (zh) | 音频文件的合成方法及装置 | |
CN108491180B (zh) | 音频播放方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |