CN105847611B - 一种回声时延检测方法、回声消除芯片及终端设备 - Google Patents
一种回声时延检测方法、回声消除芯片及终端设备 Download PDFInfo
- Publication number
- CN105847611B CN105847611B CN201610162686.3A CN201610162686A CN105847611B CN 105847611 B CN105847611 B CN 105847611B CN 201610162686 A CN201610162686 A CN 201610162686A CN 105847611 B CN105847611 B CN 105847611B
- Authority
- CN
- China
- Prior art keywords
- frame
- signal
- processed
- value
- echo
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 35
- 230000005236 sound signal Effects 0.000 claims abstract description 116
- 238000000034 method Methods 0.000 claims abstract description 82
- 238000012545 processing Methods 0.000 claims description 126
- 238000009825 accumulation Methods 0.000 claims description 91
- 238000001228 spectrum Methods 0.000 claims description 25
- 238000009499 grossing Methods 0.000 claims description 24
- 230000006854 communication Effects 0.000 claims description 15
- 238000004891 communication Methods 0.000 claims description 13
- 238000004364 calculation method Methods 0.000 claims description 12
- 238000006243 chemical reaction Methods 0.000 claims description 10
- 238000003491 array Methods 0.000 claims description 2
- 238000004590 computer program Methods 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 11
- 230000000694 effects Effects 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 230000000644 propagated effect Effects 0.000 description 2
- 101001120757 Streptococcus pyogenes serotype M49 (strain NZ131) Oleate hydratase Proteins 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 229940083712 aldosterone antagonist Drugs 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M9/00—Arrangements for interconnection not involving centralised switching
- H04M9/08—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M9/00—Arrangements for interconnection not involving centralised switching
- H04M9/08—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
- H04M9/10—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic with switching of direction of transmission by voice frequency
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B17/00—Monitoring; Testing
- H04B17/30—Monitoring; Testing of propagation channels
- H04B17/309—Measuring or estimating channel quality parameters
- H04B17/336—Signal-to-interference ratio [SIR] or carrier-to-interference ratio [CIR]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B17/00—Monitoring; Testing
- H04B17/30—Monitoring; Testing of propagation channels
- H04B17/309—Measuring or estimating channel quality parameters
- H04B17/364—Delay profiles
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Electromagnetism (AREA)
- Computer Networks & Wireless Communication (AREA)
- Telephone Function (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
Abstract
本发明实施例提供一种回声时延检测方法、回声消除芯片及终端设备,该方法包括:在检测到通话接入请求时,获取终端设备的音频输入器件采集的通过空气传播的音频信号,所述音频信号与所述终端设备的音频输出器件输出的音频相应;对所述音频信号进行转换,得到待处理信号;确定与所述音频信号相应的基准信号;根据所述基准信号和所述待处理信号确定回声时延值。本发明实施例可在通话前确定出回声时延值,为在通话过程中及时、准确的进行回声消除提供基础。
Description
技术领域
本发明涉及音频技术领域,具体涉及一种回声时延检测方法、回声消除芯片及终端设备。
背景技术
回声是终端设备在通话过程中,扬声器播放的音频被终端设备自身的麦克风回采而产生的;由于终端设备的麦克风在通话过程中会采集终端用户的音频,并传输给通话对方,因此如果存在回声的话,那么回声会随同终端用户的音频传输给通话对方,使得通话对方同时听到回声及终端用户的音频;可见,通话过程中的回声将极大的降低通话质量,为提升通话质量,消除在通话过程中产生的回声显得尤为必要。
回声消除是指基于终端设备的扬声器播放的音频信号,将终端设备自身的麦克风采集的与该音频信号对应的回声信号进行消除。为准确的进行回声消除需确定扬声器播放音频信号与麦克风回采该音频信号间的回声时延,因此回声时延的检测对于回声消除至为重要。
发明内容
本发明的发明人发现,目前的回声时延检测方式主要是在通话过程中进行,由于通话开始后需要一定时间基于通话语音信号进行回声时延的检测,这就导致在回声时延的检测时间内,终端设备无法对通话语音信号进行回声消除,使得通话对方接收到回声的概率极大,导致通话质量效果较差。
有鉴于此,本发明实施例提供一种回声时延检测方法、回声消除芯片及终端设备,以在终端设备通话前检测出回声时延,为在通话过程中及时、准确的进行回声消除提供基础。
为实现上述目的,本发明实施例提供如下技术方案:
一种回声时延检测方法,包括:
在检测到通话接入请求时,获取终端设备的音频输入器件采集的通过空气传播的音频信号,所述音频信号与所述终端设备的音频输出器件输出的音频相应;
对所述音频信号进行转换,得到待处理信号;
确定与所述音频信号相应的基准信号;
根据所述基准信号和所述待处理信号确定回声时延值。
本发明实施例还提供一种回声消除芯片,包括:
音频信号获取模块,用于在检测到通话接入请求时,获取终端设备的音频输入器件采集的通过空气传播的音频信号,所述音频信号与所述终端设备的音频输出器件输出的音频相应;
音频转换模块,用于对所述音频信号进行转换,得到待处理信号;
基准信号确定模块,用于确定与所述音频信号相应的基准信号;
回声时延值确定模块,用于根据所述基准信号和所述待处理信号确定回声时延值。
本发明实施例还提供一种终端设备,包括:回声消除芯片,音频输出器件和音频输入器件;
其中,回声消除芯片,用于在检测到通话接入请求时,获取终端设备的音频输入器件采集的通过空气传播的音频信号,所述音频信号与所述终端设备的音频输出器件输出的音频相应;对所述音频信号进行转换,得到待处理信号;确定与所述音频信号相应的基准信号;根据所述基准信号和所述待处理信号确定回声时延值;
所述音频输出器件,用于输出所述音频信号;
所述音频输入器件,用于采集所述音频输出器件输出并通过空气传播的音频信号。
基于上述技术方案,本发明实施例提供的回声时延检测方法包括:在检测到通话接入请求时,获取终端设备的音频输入器件采集的通过空气传播的音频信号,所述音频信号与所述终端设备的音频输出器件输出的音频相应;对所述音频信号进行转换,得到待处理信号;确定与所述音频信号相应的基准信号;根据所述基准信号和所述待处理信号确定回声时延值。可以看出,本发明实施例可在回声消除芯片检测到通话接入请求时,获取音频输入器件采集的通过空气传播的音频信号,并基于该所获取的音频信号转换后对应的待处理信号,及该音频信号的基准信号确定回声时延值,实现在检测到通话接入请求的阶段确定回声时延值,即在通话前确定出回声时延值,从而为在通话过程中及时、准确的进行回声消除提供基础。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的终端设备的结构框图;
图2为本发明实施例提供的回声时延检测方法的流程图;
图3为本发明实施例提供的回声消除方法的流程图;
图4为本发明实施例提供的确定回声时延值的方法流程图;
图5为本发明实施例提供的确定回声时延值的另一方法流程图;
图6为本发明实施例提供的确定各帧基准信号对应的二值化数组的方法流程图;
图7为本发明实施例提供的确定各帧待处理信号对应的加权系数的方法流程图;
图8为本发明实施例提供的回声消除芯片的结构框图;
图9为本发明实施例提供的回声消除芯片的另一结构框图;
图10为本发明实施例提供的基准信号确定模块的结构框图;
图11为本发明实施例提供的基准信号确定模块的另一结构框图;
图12为本发明实施例提供的回声消除芯片的再一结构框图;
图13为本发明实施例提供的回声时延值确定模块的结构框图;
图14为本发明实施例提供的选取单元的结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例提供的终端设备的结构框图,本发明实施例所提供的回声时延检测方法可基于图1所示终端设备实现;终端设备可以如手机、平板电脑、笔记本电脑等具有音频输出及输入能力的用户设备;
参照图1,本发明实施例提供的终端设备可以包括:音频输出器件1,回声消除芯片2,音频输入器件3;
音频输出器件1可以如扬声器、音箱等具有音频输出能力的器件;
回声消除芯片2可以为具有信号处理能力的电路,控制芯片,处理芯片等;
音频输入器件3可以如麦克风等具有音频采集能力的器件;
本发明实施例中,回声消除芯片2可在检测到通话接入请求时,控制音频输入器件3采集音频输出器件1输出的通过空气传播的音频信号,并将所采集的音频信号转换为数学信号形式的待处理信号;从而基于音频输出器件1输出的该音频信号对应的数字信号形式的基准信号,以所述基准信号和待处理信号,在检测到通话接入请求的阶段确定出回声时延值;
回声消除芯片只要在通话过程中,至少首次以该回声时延值进行回声消除,则可在通话过程中及时、准确的进行回声消除,解决现有技术在通话初始阶段由于未确定出回声时延,而无法进行回声消除带来的问题;
可选的,通话接入请求可以是请求通话的终端通过基站或网络设备,传输给终端设备的基带芯片,再由基带芯片传输给终端设备的回声消除芯片,实现回声消除芯片对通话接入请求的检测;
可选的,若用户在设置终端设备接收到通话接入请求时进行提示(如响铃),则基带芯片可控制音频输出器件1输出音频信号,以便音频输入器件3回采输出后通过空气传播的该音频信号;
另一方面,也可以是在检测到通话接入请求时,由回声消除芯片控制音频输出器件1输出音频信号。
下面以回声消除芯片的角度,对本发明实施例提供的回声时延检测方法进行介绍,下文描述的回声时延检测方法,可与上文描述内容相互对应参照。
图2为本发明实施例提供的回声时延检测方法的流程图,该方法可应用于回声消除芯片,该回声消除芯片可设置在终端设备中,同时该终端设备还可设置音频输出器件和音频输入器件;
参照图2,本发明实施例提供的回声时延检测方法可以包括:
步骤S100、在检测到通话接入请求时,获取终端设备的音频输入器件采集的通过空气传播的音频信号;
通话接入请求可以是其他终端发送给所述终端设备,用于请求与所述终端设备进行通话连接的请求信息;在用户层面,终端设备接收到通话接入请求后,终端设备将展示通话请求界面,同时以响铃、振动等方式(也可能是静音,视用户的设置情况而定)提醒终端用户,并等待终端用户对通话接入请求的应答;
终端设备在获取到通话接入请求后,终端设备可通过用户操作应答所述通话接入请求,应答所述通话接入请求包括:确定接入通话或拒绝接入通话,具体由用户的应答操作而定;即图2所示方法的应用阶段,可以认为是回声消除芯片检测到通话接入请求,至检测到用户应答所述通话接入请求的过程;
可选的,本发明实施例可以是终端设备的基带芯片接收到通话接入请求后,将通话接入请求传输给回声消除芯片,实现回声消除芯片对通话接入请求的检测;用户应答所述通话接入请求的信息也可由基带芯片检测后,传输给回声消除芯片;
音频输入器件采集的通过空气传播的音频信号,可与终端设备的音频输出器件输出的音频相应;即在检测到通话接入请求时,回声消除芯片可控制音频输入器件采集音频输出器件输出的,通过空气传播的音频信号;
在检测到通话接入请求时,可以是基带芯片控制音频输出器件输出音频信号(如传统响铃),也可以是由回声消除芯片控制音频输出器件输出音频信号;若是由回声消除芯片控制音频输出器件输出音频信号,则本发明实施例还可在检测到通话接入请求时,控制所述音频输出器件输出所述音频信号;
音频输出器件输出的音频信号可基于相应的基准信号实现,即本发明实施例需将数字形式的基准信号转换为模拟信号形式的音频信号,而音频输出器件输出的则是该模拟信号形式的音频信号;
可选的,基准信号可能是终端用户设置或终端设备默认的,在接收到通话接入请求时的响铃文件;显然,基准信号不限于响铃文件,也可以是预置的其他可输出音频的文件。
步骤S110、对所述音频信号进行转换,得到待处理信号;
在获取到音频输入器件采集的通过空气传播的音频信号后,本发明实施例可将模拟信号形式的音频信号,转换为数字信号形式的待处理信号,以便后续处理。
步骤S120、确定与所述音频信号相应的基准信号;
可选的,基准信号是音频输出器件在终端设备获取到通话接入请求时的音频输出基础,基准信号为数字信号形式,音频输出器件输出的音频信号可以是对基准信号进行数模转换后得到的模拟信号;
由于终端设备在获取到通话接入请求时,音频输出器件输出的音频一般基于终端用户设置或终端设备默认的响铃文件等基准信号实现,因此回声消除芯片可预置基准信号,并在需要使用基准信号时,通过调取预置的所述基准信号,实现与所述音频信号相应的基准信号的确定;
可选的,本发明实施例也可设置回声消除芯片与音频输出器件电连接,即回声消除芯片与音频输出器件之间可以传递信号,则回声消除芯片可从相连接的音频输出器件获取该基准信号,实现对基准信号的确定;值得注意的是,音频输出器件在输出音频信号时,需要将基准信号输入音频输出器件,由音频输出器件进行数模转换并输出,实现音频信号的输出,因此回声消除芯片可通过获取输入音频输出器件的基准信号,实现从音频输出器件获取基准信号。
步骤S130、根据所述基准信号和所述待处理信号确定回声时延值。
可选的,所确定的回声时延值可在通话过程中至少首次用于进行回声消除;即在通话过程中,回声消除芯片可以在初始的回声消除中,以在检测到通话接入请求阶段确定的回声时延值进行回声消除,也可以是在通过过程中一直以该回声时延值进行回声消除;但本发明实施例不排除,在通话过程中,至少首次以在检测到通话接入请求阶段确定的回声时延值进行回声消除后,后续以通话过程中确定的回声时延值进行回声消除。
本发明实施例提供的回声时延检测方法包括:在检测到通话接入请求时,获取终端设备的音频输入器件采集的通过空气传播的音频信号,所述音频信号与所述终端设备的音频输出器件输出的音频相应;对所述音频信号进行转换,得到待处理信号;确定与所述音频信号相应的基准信号;根据所述基准信号和所述待处理信号确定回声时延值。可以看出,本发明实施例可在回声消除芯片检测到通话接入请求时,获取音频输入器件采集的通过空气传播的音频信号,并基于该所获取的音频信号转换后对应的待处理信号,及该音频信号的基准信号确定回声时延值,实现在检测到通话接入请求的阶段确定回声时延值,即在通话前确定出回声时延值,从而为在通话过程中及时、准确的进行回声消除提供基础。
可选的,本发明实施例提供的回声时延检测方法可应用于终端设备装载的任一通话应用,实现通话应用在通话过程中用于消除回声的回声时延值的确定。
可选的,在检测到通话语音信号时,本发明实施例可至少首次以所述回声时延值进行回声消除;检测到通话语音信号说明终端设备接入了通话,则在终端设备接入通话至通话结束的过程中(此过程中,终端用户与通话对方的通话语音信号将持续被检测),本发明实施例可至少首次以所述回声时延值进行回声消除,以对通话过程中产生的回声进行消除,提升通话质量效果;
可选的,通话语音信号可由音频输入器件采集,并由回声消除芯片处理确定。
具体的,在终端设备接入通话至通话结束的过程中,终端设备的音频输出器件将输出通话对方传输的音频信号,同时,终端设备的音频输入器件将采集终端用户的对话音频及,回采音频输出器件输出的音频信号;在这个过程中,本发明实施例可基于所确定的回声时延值,对音频输入器采集的终端用户的对话音频及所回采的音频输出器件输出的音频信号进行回声消除,使得终端设备传输给通话对话的音频与终端用户的对话音频相应,提升通话质量效果;
可选的,由于回声时延可能存在波动的情况,因此本发明实施例也可在在接入通话至通话结束的过程中,根据终端设备的音频输出器件输出的音频信号(与通话对方音频相应)及音频输入器件回采的对应音频信号,确定回声时延值,进而以所确定的新回声时延值进行回声消除;
即,本发明实施例可在终端设备接收到通话接入请求至应答所述通话接入请求的过程中,可通过音频输入器件回采的音频信号相应的待处理信号及基准信号,确定回声时延值,并在终端设备接入通话时,至少首次以该回声时延值进行回声消除;同时本发明实施例也可在接入通话后,根据音频输出器件输出的音频信号及音频输入器件回采的对应音频信号,循环的确定回声时延值以更新回声时延值,保证通话过程中回声信号的有效消除;
具体的,本发明实施例可在检测到通话语音信号时,根据所述音频输出器件输出的音频信号及所述音频输入器件回采的对应音频信号,确定回声时延值;以该回声时延值进行非首次的回声消除。
可选的,图3示出了本发明实施例提供的回声消除方法的流程图,参照图3,该方法可以包括:
步骤S200、在检测到通话接入请求时,获取终端设备的音频输入器件采集的通过空气传播的音频信号;
步骤S210、对所述音频信号进行转换,得到待处理信号;
步骤S220、确定与所述音频信号相应的基准信号;
步骤S230、根据所述基准信号和所述待处理信号确定回声时延值;
步骤S240、在检测到通话语音信号时,至少首次以所述回声时延值进行回声消除;
检测到通话语音信号说明终端设备已处于通话中。
步骤S250、在通话过程中,根据音频输出器件输出的通话语音信号,及音频输入器件回采的相应通话语音信号,确定回声时延值;
步骤S260、在通话过程中,以该回声时延值进行回声消除。
值得注意的是,本发明实施例并不是在接入通话后,才开始检测回声时延值,而是在接入通话前的接收通话接入请求至应答所述通话接入请求的过程中(即检测到通话接入请求时),确定回声时延值;通过这样的设置可使得终端设备接入通话时,已存在回声时延值,后续通话过程中,则可基于通话前确定的回声时延值进行回声消除,减少通过过程中的回声传输;虽然通话过程中也存在回声时延值的测定,但通话过程中的回声时延值的测定,及基于已通话前确定的回声时延值进行回声消除是相并行的。
另外,在终端设备第一次使用某一通话应用(如该通话应用刚被下载使用)时,一开始的回声时延值可能为0,但本发明实施例可在接收到通话接入请求至应答所述通话接入请求的过程中,确定出回声时延值并进行更新,使得即使是终端设备的某一通话应用第一次使用,也可在通话过程中实现回声的消除,能够有较好的通话质量。
下面对本发明实施例基于音频输出器件输出的信号及音频输入器件回采的相应信号,进行回声时延值确定的过程进行介绍;下面内容可通用于在接收到通话接入请求至应答所述通话接入请求的过程中的回声时延值确定,及在接入通话至通话结束的过程中的回声时延值确定。
为便于说明,以在检测到通话接入请求的阶段(接收到通话接入请求至应答所述通话接入请求的过程)为例,进行回声时延值的确定介绍,接入通话至通话结束的过程的回声时延值确定可相应参照。
可选的,在本发明实施例中,预置的基准信号可以是多帧,相应的音频输出器件可以输出多帧的音频信号;待处理信号也可以是多帧,相应的音频输入器件将回采到相应帧数的音频信号;
图4示出了本发明实施例提供的确定回声时延值的方法流程图,参照图4,该方法可以包括:
步骤S300、确定各帧基准信号对应的二值化数组,及各帧待处理信号对应的二值化数组;
可选的,一帧基准信号对应的二值化数组可以包括该帧基准信号的各频点对应的二值化值,一帧待处理信号对应的二值化数组可以包括该帧待处理信号的各频点对应的二值化值。
步骤S310、将同一帧的基准信号和待处理信号对应的二值化数组进行异或累加处理,得到各帧对应的异或累加处理结果;
步骤S320、根据n帧对应的异或累加处理结果,选取符合设定要求的处理结果,确定所选取的处理结果所对应的帧序数相应的时延值,将所确定的时延值确定为候选时延值;
步骤S330、若所述候选时延值符合设定收敛条件,则确定所述候选时延值为所述回声时延值。
在本发明实施例中,回声时延检测须经过自适应迭代运算过程,该过程需要多次迭代后才可能让算法收敛得到相对准确、可靠的回声时延值;因此本发明实施例确定出各帧对应的异或累加处理结果后,需根据n帧对应的异或累加处理结果,选取符合设定要求的处理结果,同时通过设定收敛条件,判断所选取的处理结果所对应的帧序数相应的时延值是否达到设定收敛条件,进而在达到时,则认为该时延值多次迭代后已收敛,是较为准确的回声时延检测结果。
可选的,为提升所计算回声时延值的准确度,本发明实施例可先对各帧对应的异或累加处理结果进行平滑处理,得到各帧对应的平滑异或累加处理结果,再从n帧对应的平滑异或累加处理结果中,选取符合设定要求的平滑异或累加处理结果;具体的,在对各帧对应的异或累加处理结果进行平滑处理时,本发明实施例可根据各帧待处理信号对应的加权系数实现;
图5示出了本发明实施例提供的确定回声时延值的另一方法流程图,参照图5,该方法可以包括:
步骤S400、确定各帧基准信号对应的二值化数组,及各帧待处理信号对应的二值化数组;
步骤S410、将同一帧的基准信号和待处理信号对应的二值化数组进行异或累加处理,得到各帧对应的异或累加处理结果;
步骤S420、对各帧对应的异或累加处理结果进行平滑处理,得到各帧对应的平滑异或累加处理结果;
可选的,本发明实施例可根据各帧待处理信号对应的加权系数,对相应帧的异或累加处理结果进行平滑处理,得到各帧对应的平滑异或累加处理结果;
各帧待处理信号对应的加权系数,可基于各帧待处理信号的各频点对应的信噪比均值确定;由于本发明实施例可基于各帧待处理信号的各频点对应的信噪比均值,对各帧对应的异或累加处理结果进行平滑处理,使得平滑处理后,各帧对应的异或累加处理结果更为准确,提升了后续回声时延值确定的准确性。
步骤S430、从n帧对应的平滑异或累加处理结果中,选取符合设定要求的平滑异或累加处理结果,确定所选取的平滑异或累加处理结果所对应的帧序数相应的时延值,将所确定的时延值确定为候选时延值;
可选的,本发明实施例记录各帧基准信号对应的输出时间,及各种待处理信号对应的采集时间;则终端设备在回采到某一帧信号后,该帧的时延值可以认为是该帧的待处理信号对应的采集时间,与基准信号对应的输出时间的差值;
即本发明实施例可确定所选取的平滑异或累加处理结果所对应的帧序数,将所述帧序数对应的待处理信号的采集时间,与对应的基准信号的输出时间的差值,确定为所述帧序数相应的时延值。
步骤S440、若所述候选时延值符合设定收敛条件,则确定所述候选时延值为所述回声时延值。
可选的,图5对各帧对应的异或累加处理结果进行平滑处理后,再选取符合设定要求的处理结果的方式,仅为优选方式;本发明实施例并不排除直接从各帧对应的异或累加处理结果中选取符合设定要求的处理结果的方式。
可选的,各帧基准信号对应的二值化数组的确定过程可以如图6所示,包括:
步骤S500、分别对各帧基准信号进行2M频点的fft(快速傅氏变换)处理,得到各帧基准信号的各频点对应的fft处理结果,M为设定值;
步骤S510、设j为频点序数,分别根据各帧基准信号的各频点对应的fft处理结果,计算各帧基准信号的各j频点对应的功率谱Ref(j);
其中,j属于m1至m2的整数,m1为对(M*a)/(fs*c)的计算结果向下取整得到,m2为对(M*b)/(fs*c)的计算结果向下取整得到,a为第一设定值,b为第二设定值,c为第三设定值,fs为所述音频基准信号的采集频率;
可选的,a可以为500,b可以为1200,c可以为2;相应的,m1可以通过公式INT[(M*500)/(fs*2)]得到,m2可通过公式INT[(M*1200)/(fs*2)]得到,INT表示向下取整;a、b、c的具体值可视实际情况而定,上述取值仅为可选;
在本发明实施例中,j频点对应的功率谱可以Ref(j)表示,j∈(m1,m2)。
步骤S520、分别计算各帧基准信号的各频点功率谱Ref(j)的平滑值;
可选的,本发明实施例可设一帧基准信号的j频点功率谱对应的平滑值为Refsm(j),则本发明实施例可采用如下代码计算一帧基准信号的j频点功率谱对应的平滑值:
Refsm(j)=0.98*Refsm(j)+0.02Ref(j)。
步骤S530、对于各帧基准信号,若一频点的功率谱大于平滑值,则为该频点设置第一值,若一频点的功率谱不大于平滑值,则为该频点设置第二值,得到各频点对应的二值化值,以构成各帧基准信号对应的二值化数组。
对于各帧基准信号,本发明实施例可将Ref(j)与Refsm(j)进行比较,如果Ref(j)大于Refsm(j),则j频点设置第一值(如1),否则j频点设置第二值(如0),以此处理,可得到每一帧基准信号的各频点对应的二值化值,构成每一帧基准信号对应的二值化数组。
可选的,确定各帧待处理信号对应的二值化数组的过程与确定各帧基准信号对应的二值化数组的过程类似,即确定各帧基准信号对应的二值化数组的过程可以如下:
对于各帧基准信号,进行2M频点的fft处理,得到各频点对应的fft处理结果;
设j为频点序数,对于各帧基准信号,根据各频点对应的fft处理结果计算各j频点对应的功率谱Ref(j);
对于各帧基准信号,计算各频点Ref(j)的平滑值;
对于各帧基准信号,若一频点的功率谱大于平滑值,则为该频点设置第一值,若一频点的功率谱不大于平滑值,则为该频点设置第二值,得到各频点对应的二值化值,以构成各帧基准信号对应的二值化数组。
可选的,各帧待处理信号对应的加权系数的确定过程可以如图7所示,包括:
步骤S600、分别确定各帧待处理信号的各频点所对应的噪声电平;
本发明实施例可对于各帧待处理信号,确定各频点对应的噪声电平;可设各帧待处理信号的j频点对应的噪声电平为N(j);相应的,j属于m1至m2的整数,m1为对(M*a)/(fs*c)的计算结果向下取整得到,m2为对(M*b)/(fs*c)的计算结果向下取整得到,a为第一设定值,b为第二设定值,c为第三设定值,fs为所述音频基准信号的采集频率。
步骤S610、分别根据各帧待处理信号的各频点所对应的噪声电平,确定各频点对应的信噪比均值;
步骤S620、分别根据各帧待处理信号的各频点对应的信噪比均值,确定各帧待处理信号对应的加权系数。
可选的,对于各帧待处理信号,可根据公式s=log2(SNR/d)确定各帧待处理信号对应的加权系数,s为一帧待处理信号对应的加权系数,d为第四设定值;d的具体数值可视实际情况而定,如选取8。
可选的,将同一帧的基准信号和待处理信号对应的二值化数组进行异或累加处理的过程可以如下:
基准信号和待处理信号对应的二值化数组进行异或累加处理包括:
其中,Capb(j)表示第i帧待处理信号的第j频点的二值化值,Refbbur(i)(j)表示第i帧基准信号的第j频点的二值化值,CoxrR(i)表示第i帧对应的异或累加处理结果,Xor表示异或处理。
可选的,本发明实施例可以缓存当前帧以前若干帧的异或累加处理结果,得到n帧的异或累加处理结果,并对各帧对应的异或累加处理结果进行平滑处理;对各帧对应的异或累加处理结果进行平滑处理可根据代码:CxorRsm(i)=(1-d)*CxorRsm(i)+d*CxorR(i)实现;其中,i为帧序数,CxorRsm(i)为第i帧对应的平滑异或累加处理结果。
在选取符合设定要求的平滑异或累加处理结果时,本发明实施例可以n帧对应的平滑异或累加处理结果为单位,从n帧对应的平滑异或累加处理结果中,选取符合设定要求的平滑异或累加处理结果;
具体过程可以为:从n帧对应的平滑异或累加处理结果中,选取最小值的平滑异或累加处理结果;
相应的,本发明实施例可将n帧对应的平滑异或累加处理结果中,最小值的平滑异或累加处理结果所对应的帧序数相应的时延值,确定为候选时延值;进而在该候选时延值符合设定收敛条件时,以该候选时延值作为回声时延值;
可选的,候选时延值符合设定收敛条件需满足以下3条件:
n帧对应的平滑异或累加处理结果的最大值和最小值的差值,大于设定差值门限;差值门限如5.5
且,n帧对应的平滑异或累加处理结果中的最小值小于设定门限值;设定门限值如17.5
且,所述候选时延值维持K帧不变,K帧包括多个连续n帧,一个n帧对应计算出一个候选时延值。
可选的,在接收到通话接入请求至应答所述通话接入请求的过程中,音频输出器件输出的音频信号可能是多个K帧,因此本发明实施例可在接收到通话接入请求至应答所述通话接入请求的过程中,循环的确定多次回声时延值,并以最新确定的回声时延值进行回声消除。
可选的,在确定所述基准信号和所述待处理信号后,以每一帧的基准信号和待处理信号的处理角度而言,回声时延值的确定过程可以如下:
(1)将当前帧基准信号进行2M频点的fft处理,再求各频点的功率谱Ref(j),j表示频点序数,j∈(m1,m2),m1=INT[(M*500)/(fs*2)],m2=INT[(M*1200)/(fs*2)];
计算各频点的功率谱Ref(j)的平滑值Refsm(j);具体可通过代码Refsm(j)=0.98*Refsm(j)+0.02Ref(j)实现;
将各Ref(j)与Refsm(j)进行比较,大于则相应频点设置1,否则相应频点设置0,得到当前帧基准信号的各频点的二值化值构成的二值化数组;
缓存n帧的二值化数组,保存Ref(j)到Refbbuf(i)(j)数组;
(2)将当前帧待处理信号进行2M频点的fft处理,再求各频点的功率谱Cap(j),j表示频点序数,j∈(m1,m2),m1=INT[(M*500)/(fs*2)],m2=INT[(M*1200)/(fs*2)];
计算各频点的功率谱Cap(j)的平滑值Capsm(j);具体可通过代码Capsm(j)=0.98*Capsm(j)+0.02Cap(j)实现;
将各Cap(j)与Refsm Capsm(j)进行比较,大于则相应频点设置1,否则相应频点设置0,得到当前帧基准信号的各频点的二值化值构成的二值化数组;
(4)进行异或累加处理:对当前帧的异或累加处理结果进行平滑处理:CxorRsm(i)=(1-a)*CxorRsm(i)+a*CxorR(i),i为帧序数;
(5)以n个CxorRsm(i)值中的最小值的帧序数对应时延作为候选时延值;
(6)候选时延值满足如下收敛条件,则确定候选时延值为所确定的回声时延值:
n个CxorRsm(i)值的峰谷差距大于5.5;
CxorRsm(i)最小值小于17.5
候选时延值维持K帧不变,K帧由多个连续n帧构成。
可选的,本发明实施例可能存在接收到通话接入请求至接入通话的过程中,未确定出符合设定收敛条件的回声时延值的情况,此时,本发明实施例可在接入通话至通话结束的过程中,以历史回声时延值进行回声消除,保证通话过程中的回声消除得以进行;
具体的,本发明实施例若在检测到通话语音信号时,未确定出符合设定收敛条件的回声时延值,则可以以历史回声时延值进行回声消除;其中,所述历史回声时延值为上次检测到通话接入请求时,所确定的回声时延值,或,上次通话时所确定的回声时延值。
下面对本发明实施例提供的应用例进行介绍:
手机在接收到一个通话接入请求时,手机调取响铃文件(基准信号),并通过扬声器播放相应响铃以提示用户;
手机的麦克风回采响铃信号;
手机的回声消除芯片将回采的响铃信号转换为待处理信号;
手机的回声消除芯片根据该待处理信号与响铃文件的处理,确定出回声时延值;
当用户确认接听该通话时,响铃结束,手机接入该通话,此时手机的回声消除芯片可至少首次采用该回声时延值,对麦克风采集的回声信号进行消除。
本发明实施例提供的回声时延检测方法,可在通话前确定出回声时延值,从而为在通话过程中及时、准确的进行回声消除提供基础。
下面对本发明实施例提供的回声消除芯片进行介绍,下文描述的回声消除芯片可与上文以回声消除芯片角度描述的回声时延检测方法相互对应参照。
图8为本发明实施例提供的回声消除芯片的结构框图,参照图8,该回声消除芯片可以包括:
音频信号获取模块100,用于在检测到通话接入请求时,获取终端设备的音频输入器件采集的通过空气传播的音频信号,所述音频信号与所述终端设备的音频输出器件输出的音频相应;
音频转换模块200,用于对所述音频信号进行转换,得到待处理信号;
基准信号确定模块300,用于确定与所述音频信号相应的基准信号;
回声时延值确定模块400,用于根据所述基准信号和所述待处理信号确定回声时延值。
可选的,图9示出了本发明实施例提供的回声消除芯片的另一结构框图,结合图8和图9所示,该回声消除芯片还可以包括:
回声消除模块500,用于在检测到通话语音信号时,至少首次以所述回声时延值进行回声消除。
可选的,回声消除方式如自适应滤波回声消除法、非线性回声抑制处理法等。
可选的,图10示出了本发明实施例提供的基准信号确定模块300的可选结构,参照图10,基准信号确定模块300可以包括:
基准信号获取单元310,用于从相连接的所述音频输出器件获取所述基准信号。
可选的,图11示出了本发明实施例提供的基准信号确定模块300的另一种可选结构,参照图11,基准信号确定模块300可以包括:
调取单元320,用于调取预置的所述基准信号。
可选的,若由回声消除芯片控制音频输出器件输出所述音频信号,则图12示出了本发明实施例提供的回声消除芯片的再一可选结构,结合图8和图12所示,该回声消除芯片还可以包括:
音频控制输出模块600,用于在检测到通话接入请求时,控制所述音频输出器件输出所述音频信号。
可选的,也可能是由终端设备的基带芯片,在检测到通话接入请求时,控制所述音频输出器件输出所述音频信号。
可选的,所述基准信号具有多帧,所述待处理信号具有多帧;相应的,图13示出了本发明实施例提供的回声时延值确定模块400的可选结构,参照图13,回声时延值确定模块400可以包括:
第一二值化数组确定单元410,用于确定各帧基准信号对应的二值化数组;其中,一帧基准信号对应的二值化数组包括该帧基准信号的各频点对应的二值化值;
第二二值化数组确定单元420,用于确定各帧待处理信号对应的二值化数组;其中,一帧待处理信号对应的二值化数组包括该帧待处理信号的各频点对应的二值化值;
异或累加处理单元430,用于将同一帧的基准信号和待处理信号对应的二值化数组进行异或累加处理,得到各帧对应的异或累加处理结果;
选取单元440,用于根据n帧对应的异或累加处理结果,选取符合设定要求的处理结果;
候选时延值确定单元450,用于确定所选取的处理结果所对应的帧序数相应的时延值,将所确定的时延值确定为候选时延值;
回声时延值确定单元460,用于若所述候选时延值符合设定收敛条件,则确定所述候选时延值为所述回声时延值。
可选的,图14示出了本发明实施例提供的选取单元440的可选结构,参照图14,选取单元440可以包括:
平滑处理子单元441,用于根据各帧待处理信号对应的加权系数,对相应帧的异或累加处理结果进行平滑处理,得到各帧对应的平滑异或累加处理结果;
选取执行子单元442,用于从n帧对应的平滑异或累加处理结果中,选取符合设定要求的平滑异或累加处理结果。
可选的,本发明实施例提供的回声消除芯片还可以包括:
加权系数确定模块(未图示),同于分别确定各帧待处理信号的各频点所对应的噪声电平;分别根据各帧待处理信号的各频点所对应的噪声电平,确定各频点对应的信噪比均值;分别根据各帧待处理信号的各频点对应的信噪比均值,确定各帧待处理信号对应的加权系数。
可选的,设各帧待处理信号的j频点对应的噪声电平为N(j),j属于m1至m2的整数,m1为对(M*a)/(fs*c)的计算结果向下取整得到,m2为对(M*b)/(fs*c)的计算结果向下取整得到,a为第一设定值,b为第二设定值,c为第三设定值,fs为所述音频基准信号的采集频率;
则加权系数确定模块具体可用于:
对于各帧待处理信号,根据公式s=log2(SNR/d)确定各帧待处理信号对应的加权系数,s为一帧待处理信号对应的加权系数,d为第四设定值。
可选的,第一二值化数组确定单元410具体可用于,分别对各帧基准信号进行2M频点的fft处理,得到各帧基准信号的各频点对应的fft处理结果,M为设定值;设j为频点序数,分别根据各帧基准信号的各频点对应的fft处理结果,计算各帧基准信号的各j频点对应的功率谱Ref(j);j属于m1至m2的整数,m1为对(M*a)/(fs*c)的计算结果向下取整得到,m2为对(M*b)/(fs*c)的计算结果向下取整得到,a为第一设定值,b为第二设定值,c为第三设定值,fs为所述音频基准信号的采集频率;分别计算各帧基准信号的各频点功率谱Ref(j)的平滑值;对于各帧基准信号,若一频点的功率谱大于平滑值,则为该频点设置第一值,若一频点的功率谱不大于平滑值,则为该频点设置第二值,得到各频点对应的二值化值,以构成各帧基准信号对应的二值化数组。
其中,Capb(j)表示第i帧待处理信号的第j频点的二值化值,Refbbur(i)(j)表示第i帧基准信号的第j频点的二值化值,CoxrR(i)表示第i帧对应的异或累加处理结果,Xor表示异或处理。
可选的,本发明实施例提供的回声消除芯片还可以包括:
时间记录模块(未图示),用于记录各帧基准信号对应的输出时间,及各种待处理信号对应的采集时间;
相应的,候选时延值确定单元450具体可用于,确定所选取的处理结果所对应的帧序数;将所述帧序数对应的待处理信号的采集时间,与对应的基准信号的输出时间的差值,确定为所述帧序数相应的时延值,将所确定的时延值确定为候选时延值。
可选的,选取执行子单元442具体可用于,从n帧对应的平滑异或累加处理结果中,选取最小值的平滑异或累加处理结果;
相应的,候选时延值符合设定收敛条件可以包括:
所述n帧对应的平滑异或累加处理结果的最大值和最小值的差值大于设定差值门限;
且,n帧对应的平滑异或累加处理结果中的最小值小于设定门限值;
且,所述候选时延值维持K帧不变,K帧包括多个连续n帧,一个n帧对应计算出一个候选时延值。
可选的,回声消除芯片还可以在检测到通话语音信号时,根据所述音频输出器件输出的音频信号及所述音频输入器件回采的对应音频信号,确定回声时延值;以该回声时延值进行非首次的回声消除。
可选的,若在检测到通话语音信号时,未确定出符合设定收敛条件的回声时延值,则回声消除芯片可以历史回声时延值进行回声消除;
其中,所述历史回声时延值为上次检测到通话接入请求时,所确定的回声时延值,或,上次通话时所确定的回声时延值。
本发明实施例提供的回声消除芯片能够确定出回声时延值,实现终端设备的回声时延值测定,为准确的进行回声消除提供基础。
下面对本发明实施例提供的终端设备进行介绍,本发明实施例提供的终端设备的结构可以如图1所示,包括:回声消除芯片,音频输出器件和音频输入器件;
其中,回声消除芯片,用于在检测到通话接入请求时,获取终端设备的音频输入器件采集的通过空气传播的音频信号,所述音频信号与所述终端设备的音频输出器件输出的音频相应;对所述音频信号进行转换,得到待处理信号;确定与所述音频信号相应的基准信号;根据所述基准信号和所述待处理信号确定回声时延值;
所述音频输出器件,用于输出所述音频信号;
所述音频输入器件,用于采集所述音频输出器件输出并通过空气传播的音频信号。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (15)
1.一种回声时延检测方法,其特征在于,包括:
在检测到通话接入请求时,获取终端设备的音频输入器件采集的通过空气传播的音频信号,所述音频信号与所述终端设备的音频输出器件输出的音频相应;
对所述音频信号进行模数转换,得到待处理信号;所述待处理信号具有多帧;
确定与所述音频信号相应的预置的基准信号;所述基准信号具有多帧;
确定各帧基准信号对应的二值化数组,及各帧待处理信号对应的二值化数组;其中,一帧基准信号对应的二值化数组包括该帧基准信号的各频点对应的二值化值,一帧待处理信号对应的二值化数组包括该帧待处理信号的各频点对应的二值化值;
将同一帧的基准信号和待处理信号对应的二值化数组进行异或累加处理,得到各帧对应的异或累加处理结果;
根据各帧待处理信号对应的加权系数,对相应帧的异或累加处理结果进行平滑处理,得到各帧对应的平滑异或累加处理结果;
从n帧对应的平滑异或累加处理结果中,选取值最小的平滑异或累加处理结果,确定所选取的处理结果所对应的帧序数相应的时延值,将所确定的时延值确定为候选时延值;
若所述n帧对应的平滑异或累加处理结果的最大值和最小值的差值,大于设定差值门限;且,n帧对应的平滑异或累加处理结果中的最小值小于设定门限值;且,所述候选时延值维持K帧不变,K帧包括多个连续n帧,一个n帧对应计算出一个候选时延值,则确定所述候选时延值为所述回声时延值。
2.根据权利要求1所述的回声时延检测方法,其特征在于,所述方法还包括:
在检测到通话语音信号时,至少首次以所述回声时延值进行回声消除。
3.根据权利要求1所述的回声时延检测方法,其特征在于,所述确定与所述音频信号相应的预置的基准信号包括:
从相连接的所述音频输出器件获取所述基准信号;
或,调取预置的所述基准信号。
4.根据权利要求1所述的回声时延检测方法,其特征在于,若检测到通话接入请求时,所述方法还包括:
控制所述音频输出器件输出所述音频信号。
5.根据权利要求1所述的回声时延检测方法,其特征在于,所述各帧待处理信号对应的加权系数的确定过程包括:
分别确定各帧待处理信号的各频点所对应的噪声电平;
分别根据各帧待处理信号的各频点所对应的噪声电平,确定各频点对应的信噪比均值;
分别根据各帧待处理信号的各频点对应的信噪比均值,确定各帧待处理信号对应的加权系数。
6.根据权利要求5所述的回声时延检测方法,其特征在于,设各帧待处理信号的j频点对应的噪声电平为N(j),j属于m1至m2的整数,m1为对(M*a)/(fs*c)的计算结果向下取整得到,m2为对(M*b)/(fs*c)的计算结果向下取整得到,a为第一设定值,b为第二设定值,c为第三设定值,fs为所述音频信号的采集频率;
对于各帧待处理信号,根据公式s=log2(SNR/d)确定各帧待处理信号对应的加权系数,s为一帧待处理信号对应的加权系数,d为第四设定值。
7.根据权利要求1所述的回声时延检测方法,其特征在于,所述确定各帧基准信号对应的二值化数组包括:
分别对各帧基准信号进行2M频点的快速傅氏变换fft处理,得到各帧基准信号的各频点对应的fft处理结果,M为设定值;
设j为频点序数,分别根据各帧基准信号的各频点对应的fft处理结果,计算各帧基准信号的各j频点对应的功率谱Ref(j);j属于m1至m2的整数,m1为对(M*a)/(fs*c)的计算结果向下取整得到,m2为对(M*b)/(fs*c)的计算结果向下取整得到,a为第一设定值,b为第二设定值,c为第三设定值,fs为所述音频信号的采集频率;
分别计算各帧基准信号的各频点功率谱Ref(j)的平滑值;
对于各帧基准信号,若一频点的功率谱大于平滑值,则为该频点设置第一值,若一频点的功率谱不大于平滑值,则为该频点设置第二值,得到各频点对应的二值化值,以构成各帧基准信号对应的二值化数组。
9.根据权利要求1所述的回声时延检测方法,其特征在于,所述方法还包括:
记录各帧基准信号对应的输出时间,及各种待处理信号对应的采集时间;
确定所选取的处理结果所对应的帧序数相应的时延值包括:
确定所选取的处理结果所对应的帧序数;
将所述帧序数对应的待处理信号的采集时间,与对应的基准信号的输出时间的差值,确定为所述帧序数相应的时延值。
10.根据权利要求1所述的回声时延检测方法,其特征在于,所述方法还包括:在检测到通话语音信号时,根据所述音频输出器件输出的音频信号及所述音频输入器件回采的对应音频信号,确定回声时延值;以该回声时延值进行非首次的回声消除。
11.根据权利要求1所述的回声时延检测方法,其特征在于,所述方法还包括:
若在检测到通话语音信号时,未确定出符合设定收敛条件的回声时延值,则以历史回声时延值进行回声消除;
其中,所述历史回声时延值为上次检测到通话接入请求时,所确定的回声时延值,或,上次通话时所确定的回声时延值。
12.一种回声消除芯片,其特征在于,包括:
音频信号获取模块,用于在检测到通话接入请求时,获取终端设备的音频输入器件采集的通过空气传播的音频信号,所述音频信号与所述终端设备的音频输出器件输出的音频相应;
音频转换模块,用于对所述音频信号进行模数转换,得到待处理信号;所述待处理信号具有多帧;
基准信号确定模块,用于确定与所述音频信号相应的预置的基准信号;所述基准信号具有多帧;
回声时延值确定模块,用于根据所述基准信号和所述待处理信号确定回声时延值,包括:
第一二值化数组确定单元,用于确定各帧基准信号对应的二值化数组;其中,一帧基准信号对应的二值化数组包括该帧基准信号的各频点对应的二值化值;
第二二值化数组确定单元,用于确定各帧待处理信号对应的二值化数组;其中,一帧待处理信号对应的二值化数组包括该帧待处理信号的各频点对应的二值化值;
异或累加处理单元,用于将同一帧的基准信号和待处理信号对应的二值化数组进行异或累加处理,得到各帧对应的异或累加处理结果;
选取单元,用于根据各帧待处理信号对应的加权系数,对相应帧的异或累加处理结果进行平滑处理,得到各帧对应的平滑异或累加处理结果;从n帧对应的平滑异或累加处理结果中,选取值最小的平滑异或累加处理结果;
候选时延值确定单元,用于确定所选取的处理结果所对应的帧序数相应的时延值,将所确定的时延值确定为候选时延值;
回声时延值确定单元,用于若所述n帧对应的平滑异或累加处理结果的最大值和最小值的差值,大于设定差值门限;且,n帧对应的平滑异或累加处理结果中的最小值小于设定门限值;且,所述候选时延值维持K帧不变,K帧包括多个连续n帧,一个n帧对应计算出一个候选时延值,则确定所述候选时延值为所述回声时延值。
13.根据权利要求12所述的回声消除芯片,其特征在于,所述基准信号确定模块包括:
基准信号获取单元,用于从相连接的所述音频输出器件获取所述基准信号;
或,调取单元,用于调取预置的所述基准信号。
14.一种终端设备,其特征在于,包括:回声消除芯片,音频输出器件和音频输入器件;
其中,回声消除芯片,用于在检测到通话接入请求时,获取终端设备的音频输入器件采集的通过空气传播的音频信号,所述音频信号与所述终端设备的音频输出器件输出的音频相应;对所述音频信号进行模数转换,得到待处理信号;所述待处理信号具有多帧;确定与所述音频信号相应的预置的基准信号;所述基准信号具有多帧;根据所述基准信号和所述待处理信号确定回声时延值;确定各帧基准信号对应的二值化数组,及各帧待处理信号对应的二值化数组;其中,一帧基准信号对应的二值化数组包括该帧基准信号的各频点对应的二值化值,一帧待处理信号对应的二值化数组包括该帧待处理信号的各频点对应的二值化值;将同一帧的基准信号和待处理信号对应的二值化数组进行异或累加处理,得到各帧对应的异或累加处理结果;根据各帧待处理信号对应的加权系数,对相应帧的异或累加处理结果进行平滑处理,得到各帧对应的平滑异或累加处理结果;从n帧对应的平滑异或累加处理结果中,选取值最小的平滑异或累加处理结果,确定所选取的处理结果所对应的帧序数相应的时延值,将所确定的时延值确定为候选时延值;若所述n帧对应的平滑异或累加处理结果的最大值和最小值的差值,大于设定差值门限;且,n帧对应的平滑异或累加处理结果中的最小值小于设定门限值;且,所述候选时延值维持K帧不变,K帧包括多个连续n帧,一个n帧对应计算出一个候选时延值,则确定所述候选时延值为所述回声时延值;
其中,所述回声消除芯片根据n帧对应的异或累加处理结果,选取符合设定要求的处理结果时,具体用于:根据各帧待处理信号对应的加权系数,对相应帧的异或累加处理结果进行平滑处理,得到各帧对应的平滑异或累加处理结果;
所述音频输出器件,用于输出所述音频信号;
所述音频输入器件,用于采集所述音频输出器件输出并通过空气传播的音频信号。
15.一种可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1-11中任一项所述的回声时延检测方法的各个步骤。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610162686.3A CN105847611B (zh) | 2016-03-21 | 2016-03-21 | 一种回声时延检测方法、回声消除芯片及终端设备 |
KR1020187009673A KR102191934B1 (ko) | 2016-03-21 | 2017-03-20 | 에코 지연 검출 방법, 에코 제거 칩 및 단말 디바이스 |
US15/761,694 US10356249B2 (en) | 2016-03-21 | 2017-03-20 | Echo time delay detection method, echo elimination chip, and terminal equipment |
PCT/CN2017/077266 WO2017162115A1 (zh) | 2016-03-21 | 2017-03-20 | 一种回声时延检测方法、回声消除芯片及终端设备 |
US16/426,546 US10542152B2 (en) | 2016-03-21 | 2019-05-30 | Echo time delay detection method, echo elimination chip, and terminal equipment |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610162686.3A CN105847611B (zh) | 2016-03-21 | 2016-03-21 | 一种回声时延检测方法、回声消除芯片及终端设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105847611A CN105847611A (zh) | 2016-08-10 |
CN105847611B true CN105847611B (zh) | 2020-02-11 |
Family
ID=56587865
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610162686.3A Active CN105847611B (zh) | 2016-03-21 | 2016-03-21 | 一种回声时延检测方法、回声消除芯片及终端设备 |
Country Status (4)
Country | Link |
---|---|
US (2) | US10356249B2 (zh) |
KR (1) | KR102191934B1 (zh) |
CN (1) | CN105847611B (zh) |
WO (1) | WO2017162115A1 (zh) |
Families Citing this family (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105847611B (zh) | 2016-03-21 | 2020-02-11 | 腾讯科技(深圳)有限公司 | 一种回声时延检测方法、回声消除芯片及终端设备 |
CN106331958A (zh) * | 2016-08-26 | 2017-01-11 | 深圳市新国都支付技术有限公司 | 一种回音消除方法及装置 |
EP3490199B1 (en) | 2016-09-22 | 2021-07-21 | Tencent Technology (Shenzhen) Company Limited | Calling method and terminal |
CN106506872B (zh) * | 2016-11-02 | 2019-05-24 | 腾讯科技(深圳)有限公司 | 通话状态检测方法及装置 |
CN107360530B (zh) * | 2017-07-03 | 2020-12-01 | 苏州科达科技股份有限公司 | 一种回声消除的测试方法和装置 |
CN109658946A (zh) * | 2017-10-12 | 2019-04-19 | 深圳前海黑鲸科技有限公司 | 一种回声处理方法、装置、存储介质及终端设备 |
CN109961797B (zh) * | 2017-12-25 | 2023-07-18 | 阿里巴巴集团控股有限公司 | 一种回声消除方法、装置以及电子设备 |
CN109040501A (zh) * | 2018-09-10 | 2018-12-18 | 成都擎天树科技有限公司 | 一种改善voip通话质量的回声消除方法 |
TWI703561B (zh) * | 2018-09-25 | 2020-09-01 | 塞席爾商元鼎音訊股份有限公司 | 消除聲音之方法及執行該方法之電子裝置 |
CN111262749B (zh) | 2018-11-30 | 2023-05-23 | 华为技术有限公司 | 一种检测网络可靠性的方法及设备 |
CN111383655B (zh) * | 2018-12-29 | 2023-08-04 | 嘉楠明芯(北京)科技有限公司 | 一种波束形成方法、装置及计算机可读存储介质 |
CN110931032B (zh) * | 2019-11-19 | 2022-08-02 | 西安合谱声学科技有限公司 | 一种动态回声消除方法及装置 |
CN110956974A (zh) * | 2019-12-05 | 2020-04-03 | 浙江大华技术股份有限公司 | 回声消除方法及其相关装置 |
CN112929506B (zh) * | 2019-12-06 | 2023-10-17 | 阿里巴巴集团控股有限公司 | 音频信号的处理方法及装置,计算机存储介质及电子设备 |
CN110931053B (zh) * | 2019-12-09 | 2021-10-08 | 广州酷狗计算机科技有限公司 | 检测录音时延、录制音频的方法、装置、终端及存储介质 |
CN111415675B (zh) * | 2020-02-14 | 2023-09-12 | 北京声智科技有限公司 | 音频信号处理方法、装置、设备及存储介质 |
CN111402868B (zh) * | 2020-03-17 | 2023-10-24 | 阿波罗智联(北京)科技有限公司 | 语音识别方法、装置、电子设备及计算机可读存储介质 |
KR20220102451A (ko) * | 2021-01-13 | 2022-07-20 | 삼성전자주식회사 | 외부 장치에 의해 유입되는 에코를 제거하는 방법 및 전자 장치 |
TWI811685B (zh) * | 2021-05-21 | 2023-08-11 | 瑞軒科技股份有限公司 | 會議室系統及音訊處理方法 |
CN113870889A (zh) * | 2021-09-13 | 2021-12-31 | 支付宝(杭州)信息技术有限公司 | 一种回声消除中的时延估计方法、装置以及电子设备 |
CN113891152A (zh) * | 2021-09-28 | 2022-01-04 | 广州华多网络科技有限公司 | 音频播放控制方法及其装置、设备、介质、产品 |
CN114141224B (zh) * | 2021-11-30 | 2023-06-09 | 北京百度网讯科技有限公司 | 信号处理方法和装置、电子设备、计算机可读介质 |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6766021B2 (en) | 2001-03-13 | 2004-07-20 | Adaptive Digital Technologies | Echo canceller |
JP4457639B2 (ja) * | 2003-11-04 | 2010-04-28 | 沖電気工業株式会社 | エコーキャンセラ |
US7583621B2 (en) * | 2004-10-05 | 2009-09-01 | Cisco Technology, Inc. | Method and apparatus for suppressing echo cancelling in a packet switched network |
US7613264B2 (en) * | 2005-07-26 | 2009-11-03 | Lsi Corporation | Flexible sampling-rate encoder |
CN101026659B (zh) | 2006-02-23 | 2010-04-07 | 中兴通讯股份有限公司 | 一种回声延时定位的实现方法 |
US20080140767A1 (en) * | 2006-06-14 | 2008-06-12 | Prasad Rao | Divitas description protocol and methods therefor |
US20080247535A1 (en) * | 2007-04-09 | 2008-10-09 | Microsoft Corporation | Method and apparatus for mitigating impact of nonlinear effects on the quality of audio echo cancellation |
US8155304B2 (en) * | 2007-04-10 | 2012-04-10 | Microsoft Corporation | Filter bank optimization for acoustic echo cancellation |
US8391472B2 (en) * | 2007-06-06 | 2013-03-05 | Dreamworks Animation Llc | Acoustic echo cancellation solution for video conferencing |
CN101321201B (zh) * | 2007-06-06 | 2011-03-16 | 联芯科技有限公司 | 回声消除装置、通信终端及确定回声时延的方法 |
CN101426274B (zh) * | 2007-10-29 | 2010-07-21 | 大唐移动通信设备有限公司 | 一种随机接入过程中资源分配位置的指示方法、系统及装置 |
CN101163178B (zh) * | 2007-11-01 | 2011-05-11 | 中兴通讯股份有限公司 | 一种无线通信系统中回声抵消方法及其系统 |
CN101465789B (zh) * | 2007-12-17 | 2011-06-01 | 大唐移动通信设备有限公司 | 一种带宽分配控制方法及装置 |
CN102625006B (zh) | 2011-01-31 | 2013-12-04 | 陈剑勇 | 一种回声消除数据同步对齐方法、系统及音频通信设备 |
US8861713B2 (en) * | 2013-03-17 | 2014-10-14 | Texas Instruments Incorporated | Clipping based on cepstral distance for acoustic echo canceller |
GB201309777D0 (en) * | 2013-05-31 | 2013-07-17 | Microsoft Corp | Echo suppression |
GB201309771D0 (en) * | 2013-05-31 | 2013-07-17 | Microsoft Corp | Echo removal |
CN104778950B (zh) * | 2014-01-15 | 2018-03-27 | 华平信息技术股份有限公司 | 一种基于回声消除的麦克风信号延时补偿控制方法 |
CN103854624B (zh) * | 2014-03-17 | 2016-04-27 | 深圳市华星光电技术有限公司 | 一种液晶显示装置的驱动方法和一种液晶显示装置 |
GB2527865B (en) * | 2014-10-30 | 2016-12-14 | Imagination Tech Ltd | Controlling operational characteristics of an acoustic echo canceller |
GB2525947B (en) * | 2014-10-31 | 2016-06-22 | Imagination Tech Ltd | Automatic tuning of a gain controller |
GB2532042B (en) * | 2014-11-06 | 2017-02-08 | Imagination Tech Ltd | Pure delay estimation |
US20160171988A1 (en) * | 2014-12-15 | 2016-06-16 | Wire Swiss Gmbh | Delay estimation for echo cancellation using ultrasonic markers |
CN104902116B (zh) * | 2015-03-27 | 2018-05-25 | 腾讯科技(深圳)有限公司 | 一种音频数据与参考信号的时间对齐方法及装置 |
CN105847611B (zh) * | 2016-03-21 | 2020-02-11 | 腾讯科技(深圳)有限公司 | 一种回声时延检测方法、回声消除芯片及终端设备 |
-
2016
- 2016-03-21 CN CN201610162686.3A patent/CN105847611B/zh active Active
-
2017
- 2017-03-20 US US15/761,694 patent/US10356249B2/en active Active
- 2017-03-20 KR KR1020187009673A patent/KR102191934B1/ko active Active
- 2017-03-20 WO PCT/CN2017/077266 patent/WO2017162115A1/zh active Application Filing
-
2019
- 2019-05-30 US US16/426,546 patent/US10542152B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20180352095A1 (en) | 2018-12-06 |
WO2017162115A1 (zh) | 2017-09-28 |
US20190281162A1 (en) | 2019-09-12 |
KR102191934B1 (ko) | 2020-12-17 |
KR20180049047A (ko) | 2018-05-10 |
US10356249B2 (en) | 2019-07-16 |
CN105847611A (zh) | 2016-08-10 |
US10542152B2 (en) | 2020-01-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105847611B (zh) | 一种回声时延检测方法、回声消除芯片及终端设备 | |
US10522164B2 (en) | Method and device for improving audio processing performance | |
US20160205263A1 (en) | Echo Cancellation Method and Apparatus | |
US20190027160A1 (en) | Echo delay tracking method and apparatus | |
JP6123503B2 (ja) | 音声補正装置、音声補正プログラム、および、音声補正方法 | |
US8903097B2 (en) | Information processing device and method and program | |
EP2330807A1 (en) | Method and electronic device for improving communication quality based on ambient noise sensing | |
CN106961509B (zh) | 通话参数处理方法、装置及电子设备 | |
CN105744056A (zh) | 音量调节方法及装置 | |
CN112509595A (zh) | 音频数据处理方法、系统及存储介质 | |
CN106066782B (zh) | 一种数据处理方法及电子设备 | |
CN111798864A (zh) | 一种回声消除方法、装置、电子设备及存储介质 | |
US8924206B2 (en) | Electrical apparatus and voice signals receiving method thereof | |
CN118540647A (zh) | 堵孔检测方法及装置、电子设备、存储介质 | |
CN106210290A (zh) | 一种语音通信方法及移动终端 | |
CN115835094A (zh) | 音频信号处理方法、系统、设备、产品及介质 | |
CN112333534B (zh) | 杂音消除方法、装置、智能电视系统及可读存储介质 | |
CN115174724A (zh) | 通话降噪方法、装置、设备及可读存储介质 | |
CN108307070A (zh) | 通话音量增大方法及装置 | |
US20210174820A1 (en) | Signal processing apparatus, voice speech communication terminal, signal processing method, and signal processing program | |
CN113573205B (zh) | 信号处理方法、设备及计算机存储介质 | |
JP2006211250A (ja) | 無線機同定方法及び装置 | |
TWI837542B (zh) | 聲音浮水印的辨識方法及聲音浮水印的辨識裝置 | |
CN114724576B (zh) | 一种啸叫检测中的门限实时更新方法、装置以及系统 | |
CN113709626B (zh) | 音频录制方法、装置、存储介质以及计算机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |