CN105847611B

CN105847611B - 一种回声时延检测方法、回声消除芯片及终端设备

Info

Publication number: CN105847611B
Application number: CN201610162686.3A
Authority: CN
Inventors: 梁俊斌
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2016-03-21
Filing date: 2016-03-21
Publication date: 2020-02-11
Anticipated expiration: 2036-03-21
Also published as: US20180352095A1; WO2017162115A1; US20190281162A1; KR102191934B1; KR20180049047A; US10356249B2; CN105847611A; US10542152B2

Abstract

本发明实施例提供一种回声时延检测方法、回声消除芯片及终端设备，该方法包括：在检测到通话接入请求时，获取终端设备的音频输入器件采集的通过空气传播的音频信号，所述音频信号与所述终端设备的音频输出器件输出的音频相应；对所述音频信号进行转换，得到待处理信号；确定与所述音频信号相应的基准信号；根据所述基准信号和所述待处理信号确定回声时延值。本发明实施例可在通话前确定出回声时延值，为在通话过程中及时、准确的进行回声消除提供基础。

Description

一种回声时延检测方法、回声消除芯片及终端设备

技术领域

本发明涉及音频技术领域，具体涉及一种回声时延检测方法、回声消除芯片及终端设备。

背景技术

回声是终端设备在通话过程中，扬声器播放的音频被终端设备自身的麦克风回采而产生的；由于终端设备的麦克风在通话过程中会采集终端用户的音频，并传输给通话对方，因此如果存在回声的话，那么回声会随同终端用户的音频传输给通话对方，使得通话对方同时听到回声及终端用户的音频；可见，通话过程中的回声将极大的降低通话质量，为提升通话质量，消除在通话过程中产生的回声显得尤为必要。

回声消除是指基于终端设备的扬声器播放的音频信号，将终端设备自身的麦克风采集的与该音频信号对应的回声信号进行消除。为准确的进行回声消除需确定扬声器播放音频信号与麦克风回采该音频信号间的回声时延，因此回声时延的检测对于回声消除至为重要。

发明内容

本发明的发明人发现，目前的回声时延检测方式主要是在通话过程中进行，由于通话开始后需要一定时间基于通话语音信号进行回声时延的检测，这就导致在回声时延的检测时间内，终端设备无法对通话语音信号进行回声消除，使得通话对方接收到回声的概率极大，导致通话质量效果较差。

有鉴于此，本发明实施例提供一种回声时延检测方法、回声消除芯片及终端设备，以在终端设备通话前检测出回声时延，为在通话过程中及时、准确的进行回声消除提供基础。

为实现上述目的，本发明实施例提供如下技术方案：

一种回声时延检测方法，包括：

在检测到通话接入请求时，获取终端设备的音频输入器件采集的通过空气传播的音频信号，所述音频信号与所述终端设备的音频输出器件输出的音频相应；

对所述音频信号进行转换，得到待处理信号；

确定与所述音频信号相应的基准信号；

根据所述基准信号和所述待处理信号确定回声时延值。

本发明实施例还提供一种回声消除芯片，包括：

音频信号获取模块，用于在检测到通话接入请求时，获取终端设备的音频输入器件采集的通过空气传播的音频信号，所述音频信号与所述终端设备的音频输出器件输出的音频相应；

音频转换模块，用于对所述音频信号进行转换，得到待处理信号；

基准信号确定模块，用于确定与所述音频信号相应的基准信号；

回声时延值确定模块，用于根据所述基准信号和所述待处理信号确定回声时延值。

本发明实施例还提供一种终端设备，包括：回声消除芯片，音频输出器件和音频输入器件；

其中，回声消除芯片，用于在检测到通话接入请求时，获取终端设备的音频输入器件采集的通过空气传播的音频信号，所述音频信号与所述终端设备的音频输出器件输出的音频相应；对所述音频信号进行转换，得到待处理信号；确定与所述音频信号相应的基准信号；根据所述基准信号和所述待处理信号确定回声时延值；

所述音频输出器件，用于输出所述音频信号；

所述音频输入器件，用于采集所述音频输出器件输出并通过空气传播的音频信号。

基于上述技术方案，本发明实施例提供的回声时延检测方法包括：在检测到通话接入请求时，获取终端设备的音频输入器件采集的通过空气传播的音频信号，所述音频信号与所述终端设备的音频输出器件输出的音频相应；对所述音频信号进行转换，得到待处理信号；确定与所述音频信号相应的基准信号；根据所述基准信号和所述待处理信号确定回声时延值。可以看出，本发明实施例可在回声消除芯片检测到通话接入请求时，获取音频输入器件采集的通过空气传播的音频信号，并基于该所获取的音频信号转换后对应的待处理信号，及该音频信号的基准信号确定回声时延值，实现在检测到通话接入请求的阶段确定回声时延值，即在通话前确定出回声时延值，从而为在通话过程中及时、准确的进行回声消除提供基础。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本发明实施例提供的终端设备的结构框图；

图2为本发明实施例提供的回声时延检测方法的流程图；

图3为本发明实施例提供的回声消除方法的流程图；

图4为本发明实施例提供的确定回声时延值的方法流程图；

图5为本发明实施例提供的确定回声时延值的另一方法流程图；

图6为本发明实施例提供的确定各帧基准信号对应的二值化数组的方法流程图；

图7为本发明实施例提供的确定各帧待处理信号对应的加权系数的方法流程图；

图8为本发明实施例提供的回声消除芯片的结构框图；

图9为本发明实施例提供的回声消除芯片的另一结构框图；

图10为本发明实施例提供的基准信号确定模块的结构框图；

图11为本发明实施例提供的基准信号确定模块的另一结构框图；

图12为本发明实施例提供的回声消除芯片的再一结构框图；

图13为本发明实施例提供的回声时延值确定模块的结构框图；

图14为本发明实施例提供的选取单元的结构框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

图1为本发明实施例提供的终端设备的结构框图，本发明实施例所提供的回声时延检测方法可基于图1所示终端设备实现；终端设备可以如手机、平板电脑、笔记本电脑等具有音频输出及输入能力的用户设备；

参照图1，本发明实施例提供的终端设备可以包括：音频输出器件1，回声消除芯片2，音频输入器件3；

音频输出器件1可以如扬声器、音箱等具有音频输出能力的器件；

回声消除芯片2可以为具有信号处理能力的电路，控制芯片，处理芯片等；

音频输入器件3可以如麦克风等具有音频采集能力的器件；

本发明实施例中，回声消除芯片2可在检测到通话接入请求时，控制音频输入器件3采集音频输出器件1输出的通过空气传播的音频信号，并将所采集的音频信号转换为数学信号形式的待处理信号；从而基于音频输出器件1输出的该音频信号对应的数字信号形式的基准信号，以所述基准信号和待处理信号，在检测到通话接入请求的阶段确定出回声时延值；

回声消除芯片只要在通话过程中，至少首次以该回声时延值进行回声消除，则可在通话过程中及时、准确的进行回声消除，解决现有技术在通话初始阶段由于未确定出回声时延，而无法进行回声消除带来的问题；

可选的，通话接入请求可以是请求通话的终端通过基站或网络设备，传输给终端设备的基带芯片，再由基带芯片传输给终端设备的回声消除芯片，实现回声消除芯片对通话接入请求的检测；

可选的，若用户在设置终端设备接收到通话接入请求时进行提示(如响铃)，则基带芯片可控制音频输出器件1输出音频信号，以便音频输入器件3回采输出后通过空气传播的该音频信号；

另一方面，也可以是在检测到通话接入请求时，由回声消除芯片控制音频输出器件1输出音频信号。

下面以回声消除芯片的角度，对本发明实施例提供的回声时延检测方法进行介绍，下文描述的回声时延检测方法，可与上文描述内容相互对应参照。

图2为本发明实施例提供的回声时延检测方法的流程图，该方法可应用于回声消除芯片，该回声消除芯片可设置在终端设备中，同时该终端设备还可设置音频输出器件和音频输入器件；

参照图2，本发明实施例提供的回声时延检测方法可以包括：

步骤S100、在检测到通话接入请求时，获取终端设备的音频输入器件采集的通过空气传播的音频信号；

通话接入请求可以是其他终端发送给所述终端设备，用于请求与所述终端设备进行通话连接的请求信息；在用户层面，终端设备接收到通话接入请求后，终端设备将展示通话请求界面，同时以响铃、振动等方式(也可能是静音，视用户的设置情况而定)提醒终端用户，并等待终端用户对通话接入请求的应答；

终端设备在获取到通话接入请求后，终端设备可通过用户操作应答所述通话接入请求，应答所述通话接入请求包括：确定接入通话或拒绝接入通话，具体由用户的应答操作而定；即图2所示方法的应用阶段，可以认为是回声消除芯片检测到通话接入请求，至检测到用户应答所述通话接入请求的过程；

可选的，本发明实施例可以是终端设备的基带芯片接收到通话接入请求后，将通话接入请求传输给回声消除芯片，实现回声消除芯片对通话接入请求的检测；用户应答所述通话接入请求的信息也可由基带芯片检测后，传输给回声消除芯片；

音频输入器件采集的通过空气传播的音频信号，可与终端设备的音频输出器件输出的音频相应；即在检测到通话接入请求时，回声消除芯片可控制音频输入器件采集音频输出器件输出的，通过空气传播的音频信号；

在检测到通话接入请求时，可以是基带芯片控制音频输出器件输出音频信号(如传统响铃)，也可以是由回声消除芯片控制音频输出器件输出音频信号；若是由回声消除芯片控制音频输出器件输出音频信号，则本发明实施例还可在检测到通话接入请求时，控制所述音频输出器件输出所述音频信号；

音频输出器件输出的音频信号可基于相应的基准信号实现，即本发明实施例需将数字形式的基准信号转换为模拟信号形式的音频信号，而音频输出器件输出的则是该模拟信号形式的音频信号；

可选的，基准信号可能是终端用户设置或终端设备默认的，在接收到通话接入请求时的响铃文件；显然，基准信号不限于响铃文件，也可以是预置的其他可输出音频的文件。

步骤S110、对所述音频信号进行转换，得到待处理信号；

在获取到音频输入器件采集的通过空气传播的音频信号后，本发明实施例可将模拟信号形式的音频信号，转换为数字信号形式的待处理信号，以便后续处理。

步骤S120、确定与所述音频信号相应的基准信号；

可选的，基准信号是音频输出器件在终端设备获取到通话接入请求时的音频输出基础，基准信号为数字信号形式，音频输出器件输出的音频信号可以是对基准信号进行数模转换后得到的模拟信号；

由于终端设备在获取到通话接入请求时，音频输出器件输出的音频一般基于终端用户设置或终端设备默认的响铃文件等基准信号实现，因此回声消除芯片可预置基准信号，并在需要使用基准信号时，通过调取预置的所述基准信号，实现与所述音频信号相应的基准信号的确定；

可选的，本发明实施例也可设置回声消除芯片与音频输出器件电连接，即回声消除芯片与音频输出器件之间可以传递信号，则回声消除芯片可从相连接的音频输出器件获取该基准信号，实现对基准信号的确定；值得注意的是，音频输出器件在输出音频信号时，需要将基准信号输入音频输出器件，由音频输出器件进行数模转换并输出，实现音频信号的输出，因此回声消除芯片可通过获取输入音频输出器件的基准信号，实现从音频输出器件获取基准信号。

步骤S130、根据所述基准信号和所述待处理信号确定回声时延值。

可选的，所确定的回声时延值可在通话过程中至少首次用于进行回声消除；即在通话过程中，回声消除芯片可以在初始的回声消除中，以在检测到通话接入请求阶段确定的回声时延值进行回声消除，也可以是在通过过程中一直以该回声时延值进行回声消除；但本发明实施例不排除，在通话过程中，至少首次以在检测到通话接入请求阶段确定的回声时延值进行回声消除后，后续以通话过程中确定的回声时延值进行回声消除。

本发明实施例提供的回声时延检测方法包括：在检测到通话接入请求时，获取终端设备的音频输入器件采集的通过空气传播的音频信号，所述音频信号与所述终端设备的音频输出器件输出的音频相应；对所述音频信号进行转换，得到待处理信号；确定与所述音频信号相应的基准信号；根据所述基准信号和所述待处理信号确定回声时延值。可以看出，本发明实施例可在回声消除芯片检测到通话接入请求时，获取音频输入器件采集的通过空气传播的音频信号，并基于该所获取的音频信号转换后对应的待处理信号，及该音频信号的基准信号确定回声时延值，实现在检测到通话接入请求的阶段确定回声时延值，即在通话前确定出回声时延值，从而为在通话过程中及时、准确的进行回声消除提供基础。

可选的，本发明实施例提供的回声时延检测方法可应用于终端设备装载的任一通话应用，实现通话应用在通话过程中用于消除回声的回声时延值的确定。

可选的，在检测到通话语音信号时，本发明实施例可至少首次以所述回声时延值进行回声消除；检测到通话语音信号说明终端设备接入了通话，则在终端设备接入通话至通话结束的过程中(此过程中，终端用户与通话对方的通话语音信号将持续被检测)，本发明实施例可至少首次以所述回声时延值进行回声消除，以对通话过程中产生的回声进行消除，提升通话质量效果；

可选的，通话语音信号可由音频输入器件采集，并由回声消除芯片处理确定。

具体的，在终端设备接入通话至通话结束的过程中，终端设备的音频输出器件将输出通话对方传输的音频信号，同时，终端设备的音频输入器件将采集终端用户的对话音频及，回采音频输出器件输出的音频信号；在这个过程中，本发明实施例可基于所确定的回声时延值，对音频输入器采集的终端用户的对话音频及所回采的音频输出器件输出的音频信号进行回声消除，使得终端设备传输给通话对话的音频与终端用户的对话音频相应，提升通话质量效果；

可选的，由于回声时延可能存在波动的情况，因此本发明实施例也可在在接入通话至通话结束的过程中，根据终端设备的音频输出器件输出的音频信号(与通话对方音频相应)及音频输入器件回采的对应音频信号，确定回声时延值，进而以所确定的新回声时延值进行回声消除；

即，本发明实施例可在终端设备接收到通话接入请求至应答所述通话接入请求的过程中，可通过音频输入器件回采的音频信号相应的待处理信号及基准信号，确定回声时延值，并在终端设备接入通话时，至少首次以该回声时延值进行回声消除；同时本发明实施例也可在接入通话后，根据音频输出器件输出的音频信号及音频输入器件回采的对应音频信号，循环的确定回声时延值以更新回声时延值，保证通话过程中回声信号的有效消除；

具体的，本发明实施例可在检测到通话语音信号时，根据所述音频输出器件输出的音频信号及所述音频输入器件回采的对应音频信号，确定回声时延值；以该回声时延值进行非首次的回声消除。

可选的，图3示出了本发明实施例提供的回声消除方法的流程图，参照图3，该方法可以包括：

步骤S200、在检测到通话接入请求时，获取终端设备的音频输入器件采集的通过空气传播的音频信号；

步骤S210、对所述音频信号进行转换，得到待处理信号；

步骤S220、确定与所述音频信号相应的基准信号；

步骤S230、根据所述基准信号和所述待处理信号确定回声时延值；

步骤S240、在检测到通话语音信号时，至少首次以所述回声时延值进行回声消除；

检测到通话语音信号说明终端设备已处于通话中。

步骤S250、在通话过程中，根据音频输出器件输出的通话语音信号，及音频输入器件回采的相应通话语音信号，确定回声时延值；

步骤S260、在通话过程中，以该回声时延值进行回声消除。

值得注意的是，本发明实施例并不是在接入通话后，才开始检测回声时延值，而是在接入通话前的接收通话接入请求至应答所述通话接入请求的过程中(即检测到通话接入请求时)，确定回声时延值；通过这样的设置可使得终端设备接入通话时，已存在回声时延值，后续通话过程中，则可基于通话前确定的回声时延值进行回声消除，减少通过过程中的回声传输；虽然通话过程中也存在回声时延值的测定，但通话过程中的回声时延值的测定，及基于已通话前确定的回声时延值进行回声消除是相并行的。

另外，在终端设备第一次使用某一通话应用(如该通话应用刚被下载使用)时，一开始的回声时延值可能为0，但本发明实施例可在接收到通话接入请求至应答所述通话接入请求的过程中，确定出回声时延值并进行更新，使得即使是终端设备的某一通话应用第一次使用，也可在通话过程中实现回声的消除，能够有较好的通话质量。

下面对本发明实施例基于音频输出器件输出的信号及音频输入器件回采的相应信号，进行回声时延值确定的过程进行介绍；下面内容可通用于在接收到通话接入请求至应答所述通话接入请求的过程中的回声时延值确定，及在接入通话至通话结束的过程中的回声时延值确定。

为便于说明，以在检测到通话接入请求的阶段(接收到通话接入请求至应答所述通话接入请求的过程)为例，进行回声时延值的确定介绍，接入通话至通话结束的过程的回声时延值确定可相应参照。

可选的，在本发明实施例中，预置的基准信号可以是多帧，相应的音频输出器件可以输出多帧的音频信号；待处理信号也可以是多帧，相应的音频输入器件将回采到相应帧数的音频信号；

图4示出了本发明实施例提供的确定回声时延值的方法流程图，参照图4，该方法可以包括：

步骤S300、确定各帧基准信号对应的二值化数组，及各帧待处理信号对应的二值化数组；

可选的，一帧基准信号对应的二值化数组可以包括该帧基准信号的各频点对应的二值化值，一帧待处理信号对应的二值化数组可以包括该帧待处理信号的各频点对应的二值化值。

步骤S310、将同一帧的基准信号和待处理信号对应的二值化数组进行异或累加处理，得到各帧对应的异或累加处理结果；

步骤S320、根据n帧对应的异或累加处理结果，选取符合设定要求的处理结果，确定所选取的处理结果所对应的帧序数相应的时延值，将所确定的时延值确定为候选时延值；

步骤S330、若所述候选时延值符合设定收敛条件，则确定所述候选时延值为所述回声时延值。

在本发明实施例中，回声时延检测须经过自适应迭代运算过程，该过程需要多次迭代后才可能让算法收敛得到相对准确、可靠的回声时延值；因此本发明实施例确定出各帧对应的异或累加处理结果后，需根据n帧对应的异或累加处理结果，选取符合设定要求的处理结果，同时通过设定收敛条件，判断所选取的处理结果所对应的帧序数相应的时延值是否达到设定收敛条件，进而在达到时，则认为该时延值多次迭代后已收敛，是较为准确的回声时延检测结果。

可选的，为提升所计算回声时延值的准确度，本发明实施例可先对各帧对应的异或累加处理结果进行平滑处理，得到各帧对应的平滑异或累加处理结果，再从n帧对应的平滑异或累加处理结果中，选取符合设定要求的平滑异或累加处理结果；具体的，在对各帧对应的异或累加处理结果进行平滑处理时，本发明实施例可根据各帧待处理信号对应的加权系数实现；

图5示出了本发明实施例提供的确定回声时延值的另一方法流程图，参照图5，该方法可以包括：

步骤S400、确定各帧基准信号对应的二值化数组，及各帧待处理信号对应的二值化数组；

步骤S410、将同一帧的基准信号和待处理信号对应的二值化数组进行异或累加处理，得到各帧对应的异或累加处理结果；

步骤S420、对各帧对应的异或累加处理结果进行平滑处理，得到各帧对应的平滑异或累加处理结果；

可选的，本发明实施例可根据各帧待处理信号对应的加权系数，对相应帧的异或累加处理结果进行平滑处理，得到各帧对应的平滑异或累加处理结果；

各帧待处理信号对应的加权系数，可基于各帧待处理信号的各频点对应的信噪比均值确定；由于本发明实施例可基于各帧待处理信号的各频点对应的信噪比均值，对各帧对应的异或累加处理结果进行平滑处理，使得平滑处理后，各帧对应的异或累加处理结果更为准确，提升了后续回声时延值确定的准确性。

步骤S430、从n帧对应的平滑异或累加处理结果中，选取符合设定要求的平滑异或累加处理结果，确定所选取的平滑异或累加处理结果所对应的帧序数相应的时延值，将所确定的时延值确定为候选时延值；

可选的，本发明实施例记录各帧基准信号对应的输出时间，及各种待处理信号对应的采集时间；则终端设备在回采到某一帧信号后，该帧的时延值可以认为是该帧的待处理信号对应的采集时间，与基准信号对应的输出时间的差值；

即本发明实施例可确定所选取的平滑异或累加处理结果所对应的帧序数，将所述帧序数对应的待处理信号的采集时间，与对应的基准信号的输出时间的差值，确定为所述帧序数相应的时延值。

步骤S440、若所述候选时延值符合设定收敛条件，则确定所述候选时延值为所述回声时延值。

可选的，图5对各帧对应的异或累加处理结果进行平滑处理后，再选取符合设定要求的处理结果的方式，仅为优选方式；本发明实施例并不排除直接从各帧对应的异或累加处理结果中选取符合设定要求的处理结果的方式。

可选的，各帧基准信号对应的二值化数组的确定过程可以如图6所示，包括：

步骤S500、分别对各帧基准信号进行2M频点的fft(快速傅氏变换)处理，得到各帧基准信号的各频点对应的fft处理结果，M为设定值；

步骤S510、设j为频点序数，分别根据各帧基准信号的各频点对应的fft处理结果，计算各帧基准信号的各j频点对应的功率谱Ref(j)；

其中，j属于m1至m2的整数，m1为对(M*a)/(fs*c)的计算结果向下取整得到，m2为对(M*b)/(fs*c)的计算结果向下取整得到，a为第一设定值，b为第二设定值，c为第三设定值，fs为所述音频基准信号的采集频率；

可选的，a可以为500，b可以为1200，c可以为2；相应的，m1可以通过公式INT[(M*500)/(fs*2)]得到，m2可通过公式INT[(M*1200)/(fs*2)]得到，INT表示向下取整；a、b、c的具体值可视实际情况而定，上述取值仅为可选；

在本发明实施例中，j频点对应的功率谱可以Ref(j)表示，j∈(m1，m2)。

步骤S520、分别计算各帧基准信号的各频点功率谱Ref(j)的平滑值；

可选的，本发明实施例可设一帧基准信号的j频点功率谱对应的平滑值为Refsm(j)，则本发明实施例可采用如下代码计算一帧基准信号的j频点功率谱对应的平滑值：

Refsm(j)＝0.98*Refsm(j)+0.02Ref(j)。

步骤S530、对于各帧基准信号，若一频点的功率谱大于平滑值，则为该频点设置第一值，若一频点的功率谱不大于平滑值，则为该频点设置第二值，得到各频点对应的二值化值，以构成各帧基准信号对应的二值化数组。

对于各帧基准信号，本发明实施例可将Ref(j)与Refsm(j)进行比较，如果Ref(j)大于Refsm(j)，则j频点设置第一值(如1)，否则j频点设置第二值(如0)，以此处理，可得到每一帧基准信号的各频点对应的二值化值，构成每一帧基准信号对应的二值化数组。

可选的，确定各帧待处理信号对应的二值化数组的过程与确定各帧基准信号对应的二值化数组的过程类似，即确定各帧基准信号对应的二值化数组的过程可以如下：

对于各帧基准信号，进行2M频点的fft处理，得到各频点对应的fft处理结果；

设j为频点序数，对于各帧基准信号，根据各频点对应的fft处理结果计算各j频点对应的功率谱Ref(j)；

对于各帧基准信号，计算各频点Ref(j)的平滑值；

对于各帧基准信号，若一频点的功率谱大于平滑值，则为该频点设置第一值，若一频点的功率谱不大于平滑值，则为该频点设置第二值，得到各频点对应的二值化值，以构成各帧基准信号对应的二值化数组。

可选的，各帧待处理信号对应的加权系数的确定过程可以如图7所示，包括：

步骤S600、分别确定各帧待处理信号的各频点所对应的噪声电平；

本发明实施例可对于各帧待处理信号，确定各频点对应的噪声电平；可设各帧待处理信号的j频点对应的噪声电平为N(j)；相应的，j属于m1至m2的整数，m1为对(M*a)/(fs*c)的计算结果向下取整得到，m2为对(M*b)/(fs*c)的计算结果向下取整得到，a为第一设定值，b为第二设定值，c为第三设定值，fs为所述音频基准信号的采集频率。

步骤S610、分别根据各帧待处理信号的各频点所对应的噪声电平，确定各频点对应的信噪比均值；

可选的，对于各帧待处理信号，本发明实施例可根据公式

计算各频点所对应的信噪比均值，其中，SNR为一帧待处理信号的各频点对应的信噪比均值，Cap(j)表示一帧待处理信号第j频点的功率谱。

步骤S620、分别根据各帧待处理信号的各频点对应的信噪比均值，确定各帧待处理信号对应的加权系数。

可选的，对于各帧待处理信号，可根据公式s＝log₂(SNR/d)确定各帧待处理信号对应的加权系数，s为一帧待处理信号对应的加权系数，d为第四设定值；d的具体数值可视实际情况而定，如选取8。

可选的，将同一帧的基准信号和待处理信号对应的二值化数组进行异或累加处理的过程可以如下：

基准信号和待处理信号对应的二值化数组进行异或累加处理包括：

设i为帧序数，i属于0至n-1的整数，则可根据公式

将第i帧的基准信号和待处理信号对应的二值化数组进行异或累加处理；

其中，Capb(j)表示第i帧待处理信号的第j频点的二值化值，Refbbur(i)(j)表示第i帧基准信号的第j频点的二值化值，CoxrR(i)表示第i帧对应的异或累加处理结果，Xor表示异或处理。

可选的，本发明实施例可以缓存当前帧以前若干帧的异或累加处理结果，得到n帧的异或累加处理结果，并对各帧对应的异或累加处理结果进行平滑处理；对各帧对应的异或累加处理结果进行平滑处理可根据代码：CxorRsm(i)＝(1-d)*CxorRsm(i)+d*CxorR(i)实现；其中，i为帧序数，CxorRsm(i)为第i帧对应的平滑异或累加处理结果。

在选取符合设定要求的平滑异或累加处理结果时，本发明实施例可以n帧对应的平滑异或累加处理结果为单位，从n帧对应的平滑异或累加处理结果中，选取符合设定要求的平滑异或累加处理结果；

具体过程可以为：从n帧对应的平滑异或累加处理结果中，选取最小值的平滑异或累加处理结果；

相应的，本发明实施例可将n帧对应的平滑异或累加处理结果中，最小值的平滑异或累加处理结果所对应的帧序数相应的时延值，确定为候选时延值；进而在该候选时延值符合设定收敛条件时，以该候选时延值作为回声时延值；

可选的，候选时延值符合设定收敛条件需满足以下3条件：

n帧对应的平滑异或累加处理结果的最大值和最小值的差值，大于设定差值门限；差值门限如5.5

且，n帧对应的平滑异或累加处理结果中的最小值小于设定门限值；设定门限值如17.5

且，所述候选时延值维持K帧不变，K帧包括多个连续n帧，一个n帧对应计算出一个候选时延值。

可选的，在接收到通话接入请求至应答所述通话接入请求的过程中，音频输出器件输出的音频信号可能是多个K帧，因此本发明实施例可在接收到通话接入请求至应答所述通话接入请求的过程中，循环的确定多次回声时延值，并以最新确定的回声时延值进行回声消除。

可选的，在确定所述基准信号和所述待处理信号后，以每一帧的基准信号和待处理信号的处理角度而言，回声时延值的确定过程可以如下：

(1)将当前帧基准信号进行2M频点的fft处理，再求各频点的功率谱Ref(j)，j表示频点序数，j∈(m1，m2)，m1＝INT[(M*500)/(fs*2)]，m2＝INT[(M*1200)/(fs*2)]；

计算各频点的功率谱Ref(j)的平滑值Refsm(j)；具体可通过代码Refsm(j)＝0.98*Refsm(j)+0.02Ref(j)实现；

将各Ref(j)与Refsm(j)进行比较，大于则相应频点设置1，否则相应频点设置0，得到当前帧基准信号的各频点的二值化值构成的二值化数组；

缓存n帧的二值化数组，保存Ref(j)到Refbbuf(i)(j)数组；

(2)将当前帧待处理信号进行2M频点的fft处理，再求各频点的功率谱Cap(j)，j表示频点序数，j∈(m1，m2)，m1＝INT[(M*500)/(fs*2)]，m2＝INT[(M*1200)/(fs*2)]；

计算各频点的功率谱Cap(j)的平滑值Capsm(j)；具体可通过代码Capsm(j)＝0.98*Capsm(j)+0.02Cap(j)实现；

将各Cap(j)与Refsm Capsm(j)进行比较，大于则相应频点设置1，否则相应频点设置0，得到当前帧基准信号的各频点的二值化值构成的二值化数组；

(3)对于当前帧待处理信号，基于MCRA算法(最小统计量控制递归平均算法)计算各频点的噪声电平N(j)；计算各频点的信噪比均值，

计算当前帧的加权系数，a＝log₂(SNR/8)；

(4)进行异或累加处理：对当前帧的异或累加处理结果进行平滑处理：CxorRsm(i)＝(1-a)*CxorRsm(i)+a*CxorR(i)，i为帧序数；

(5)以n个CxorRsm(i)值中的最小值的帧序数对应时延作为候选时延值；

(6)候选时延值满足如下收敛条件，则确定候选时延值为所确定的回声时延值：

n个CxorRsm(i)值的峰谷差距大于5.5；

CxorRsm(i)最小值小于17.5

候选时延值维持K帧不变，K帧由多个连续n帧构成。

可选的，本发明实施例可能存在接收到通话接入请求至接入通话的过程中，未确定出符合设定收敛条件的回声时延值的情况，此时，本发明实施例可在接入通话至通话结束的过程中，以历史回声时延值进行回声消除，保证通话过程中的回声消除得以进行；

具体的，本发明实施例若在检测到通话语音信号时，未确定出符合设定收敛条件的回声时延值，则可以以历史回声时延值进行回声消除；其中，所述历史回声时延值为上次检测到通话接入请求时，所确定的回声时延值，或，上次通话时所确定的回声时延值。

下面对本发明实施例提供的应用例进行介绍：

手机在接收到一个通话接入请求时，手机调取响铃文件(基准信号)，并通过扬声器播放相应响铃以提示用户；

手机的麦克风回采响铃信号；

手机的回声消除芯片将回采的响铃信号转换为待处理信号；

手机的回声消除芯片根据该待处理信号与响铃文件的处理，确定出回声时延值；

当用户确认接听该通话时，响铃结束，手机接入该通话，此时手机的回声消除芯片可至少首次采用该回声时延值，对麦克风采集的回声信号进行消除。

本发明实施例提供的回声时延检测方法，可在通话前确定出回声时延值，从而为在通话过程中及时、准确的进行回声消除提供基础。

下面对本发明实施例提供的回声消除芯片进行介绍，下文描述的回声消除芯片可与上文以回声消除芯片角度描述的回声时延检测方法相互对应参照。

图8为本发明实施例提供的回声消除芯片的结构框图，参照图8，该回声消除芯片可以包括：

音频信号获取模块100，用于在检测到通话接入请求时，获取终端设备的音频输入器件采集的通过空气传播的音频信号，所述音频信号与所述终端设备的音频输出器件输出的音频相应；

音频转换模块200，用于对所述音频信号进行转换，得到待处理信号；

基准信号确定模块300，用于确定与所述音频信号相应的基准信号；

回声时延值确定模块400，用于根据所述基准信号和所述待处理信号确定回声时延值。

可选的，图9示出了本发明实施例提供的回声消除芯片的另一结构框图，结合图8和图9所示，该回声消除芯片还可以包括：

回声消除模块500，用于在检测到通话语音信号时，至少首次以所述回声时延值进行回声消除。

可选的，回声消除方式如自适应滤波回声消除法、非线性回声抑制处理法等。

可选的，图10示出了本发明实施例提供的基准信号确定模块300的可选结构，参照图10，基准信号确定模块300可以包括：

基准信号获取单元310，用于从相连接的所述音频输出器件获取所述基准信号。

可选的，图11示出了本发明实施例提供的基准信号确定模块300的另一种可选结构，参照图11，基准信号确定模块300可以包括：

调取单元320，用于调取预置的所述基准信号。

可选的，若由回声消除芯片控制音频输出器件输出所述音频信号，则图12示出了本发明实施例提供的回声消除芯片的再一可选结构，结合图8和图12所示，该回声消除芯片还可以包括：

音频控制输出模块600，用于在检测到通话接入请求时，控制所述音频输出器件输出所述音频信号。

可选的，也可能是由终端设备的基带芯片，在检测到通话接入请求时，控制所述音频输出器件输出所述音频信号。

可选的，所述基准信号具有多帧，所述待处理信号具有多帧；相应的，图13示出了本发明实施例提供的回声时延值确定模块400的可选结构，参照图13，回声时延值确定模块400可以包括：

第一二值化数组确定单元410，用于确定各帧基准信号对应的二值化数组；其中，一帧基准信号对应的二值化数组包括该帧基准信号的各频点对应的二值化值；

第二二值化数组确定单元420，用于确定各帧待处理信号对应的二值化数组；其中，一帧待处理信号对应的二值化数组包括该帧待处理信号的各频点对应的二值化值；

异或累加处理单元430，用于将同一帧的基准信号和待处理信号对应的二值化数组进行异或累加处理，得到各帧对应的异或累加处理结果；

选取单元440，用于根据n帧对应的异或累加处理结果，选取符合设定要求的处理结果；

候选时延值确定单元450，用于确定所选取的处理结果所对应的帧序数相应的时延值，将所确定的时延值确定为候选时延值；

回声时延值确定单元460，用于若所述候选时延值符合设定收敛条件，则确定所述候选时延值为所述回声时延值。

可选的，图14示出了本发明实施例提供的选取单元440的可选结构，参照图14，选取单元440可以包括：

平滑处理子单元441，用于根据各帧待处理信号对应的加权系数，对相应帧的异或累加处理结果进行平滑处理，得到各帧对应的平滑异或累加处理结果；

选取执行子单元442，用于从n帧对应的平滑异或累加处理结果中，选取符合设定要求的平滑异或累加处理结果。

可选的，本发明实施例提供的回声消除芯片还可以包括：

加权系数确定模块(未图示)，同于分别确定各帧待处理信号的各频点所对应的噪声电平；分别根据各帧待处理信号的各频点所对应的噪声电平，确定各频点对应的信噪比均值；分别根据各帧待处理信号的各频点对应的信噪比均值，确定各帧待处理信号对应的加权系数。

可选的，设各帧待处理信号的j频点对应的噪声电平为N(j)，j属于m1至m2的整数，m1为对(M*a)/(fs*c)的计算结果向下取整得到，m2为对(M*b)/(fs*c)的计算结果向下取整得到，a为第一设定值，b为第二设定值，c为第三设定值，fs为所述音频基准信号的采集频率；

则加权系数确定模块具体可用于：

对于各帧待处理信号，根据公式

计算各频点所对应的信噪比均值，其中，SNR为一帧待处理信号的各频点对应的信噪比均值，Cap(j)表示一帧待处理信号第j频点的功率谱；

对于各帧待处理信号，根据公式s＝log₂(SNR/d)确定各帧待处理信号对应的加权系数，s为一帧待处理信号对应的加权系数，d为第四设定值。

可选的，第一二值化数组确定单元410具体可用于，分别对各帧基准信号进行2M频点的fft处理，得到各帧基准信号的各频点对应的fft处理结果，M为设定值；设j为频点序数，分别根据各帧基准信号的各频点对应的fft处理结果，计算各帧基准信号的各j频点对应的功率谱Ref(j)；j属于m1至m2的整数，m1为对(M*a)/(fs*c)的计算结果向下取整得到，m2为对(M*b)/(fs*c)的计算结果向下取整得到，a为第一设定值，b为第二设定值，c为第三设定值，fs为所述音频基准信号的采集频率；分别计算各帧基准信号的各频点功率谱Ref(j)的平滑值；对于各帧基准信号，若一频点的功率谱大于平滑值，则为该频点设置第一值，若一频点的功率谱不大于平滑值，则为该频点设置第二值，得到各频点对应的二值化值，以构成各帧基准信号对应的二值化数组。

可选的，异或累加处理单元430具体可用于，设i为帧序数，i属于0至n-1的整数，则根据公式

可选的，本发明实施例提供的回声消除芯片还可以包括：

时间记录模块(未图示)，用于记录各帧基准信号对应的输出时间，及各种待处理信号对应的采集时间；

相应的，候选时延值确定单元450具体可用于，确定所选取的处理结果所对应的帧序数；将所述帧序数对应的待处理信号的采集时间，与对应的基准信号的输出时间的差值，确定为所述帧序数相应的时延值，将所确定的时延值确定为候选时延值。

可选的，选取执行子单元442具体可用于，从n帧对应的平滑异或累加处理结果中，选取最小值的平滑异或累加处理结果；

相应的，候选时延值符合设定收敛条件可以包括：

所述n帧对应的平滑异或累加处理结果的最大值和最小值的差值大于设定差值门限；

且，n帧对应的平滑异或累加处理结果中的最小值小于设定门限值；

可选的，回声消除芯片还可以在检测到通话语音信号时，根据所述音频输出器件输出的音频信号及所述音频输入器件回采的对应音频信号，确定回声时延值；以该回声时延值进行非首次的回声消除。

可选的，若在检测到通话语音信号时，未确定出符合设定收敛条件的回声时延值，则回声消除芯片可以历史回声时延值进行回声消除；

其中，所述历史回声时延值为上次检测到通话接入请求时，所确定的回声时延值，或，上次通话时所确定的回声时延值。

本发明实施例提供的回声消除芯片能够确定出回声时延值，实现终端设备的回声时延值测定，为准确的进行回声消除提供基础。

下面对本发明实施例提供的终端设备进行介绍，本发明实施例提供的终端设备的结构可以如图1所示，包括：回声消除芯片，音频输出器件和音频输入器件；

所述音频输出器件，用于输出所述音频信号；

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

专业人员还可以进一步意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块，或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种回声时延检测方法，其特征在于，包括：

对所述音频信号进行模数转换，得到待处理信号；所述待处理信号具有多帧；

确定与所述音频信号相应的预置的基准信号；所述基准信号具有多帧；

确定各帧基准信号对应的二值化数组，及各帧待处理信号对应的二值化数组；其中，一帧基准信号对应的二值化数组包括该帧基准信号的各频点对应的二值化值，一帧待处理信号对应的二值化数组包括该帧待处理信号的各频点对应的二值化值；

将同一帧的基准信号和待处理信号对应的二值化数组进行异或累加处理，得到各帧对应的异或累加处理结果；

根据各帧待处理信号对应的加权系数，对相应帧的异或累加处理结果进行平滑处理，得到各帧对应的平滑异或累加处理结果；

从n帧对应的平滑异或累加处理结果中，选取值最小的平滑异或累加处理结果，确定所选取的处理结果所对应的帧序数相应的时延值，将所确定的时延值确定为候选时延值；

若所述n帧对应的平滑异或累加处理结果的最大值和最小值的差值，大于设定差值门限；且，n帧对应的平滑异或累加处理结果中的最小值小于设定门限值；且，所述候选时延值维持K帧不变，K帧包括多个连续n帧，一个n帧对应计算出一个候选时延值，则确定所述候选时延值为所述回声时延值。

2.根据权利要求1所述的回声时延检测方法，其特征在于，所述方法还包括：

在检测到通话语音信号时，至少首次以所述回声时延值进行回声消除。

3.根据权利要求1所述的回声时延检测方法，其特征在于，所述确定与所述音频信号相应的预置的基准信号包括：

从相连接的所述音频输出器件获取所述基准信号；

或，调取预置的所述基准信号。

4.根据权利要求1所述的回声时延检测方法，其特征在于，若检测到通话接入请求时，所述方法还包括：

控制所述音频输出器件输出所述音频信号。

5.根据权利要求1所述的回声时延检测方法，其特征在于，所述各帧待处理信号对应的加权系数的确定过程包括：

分别确定各帧待处理信号的各频点所对应的噪声电平；

分别根据各帧待处理信号的各频点所对应的噪声电平，确定各频点对应的信噪比均值；

分别根据各帧待处理信号的各频点对应的信噪比均值，确定各帧待处理信号对应的加权系数。

6.根据权利要求5所述的回声时延检测方法，其特征在于，设各帧待处理信号的j频点对应的噪声电平为N(j)，j属于m1至m2的整数，m1为对(M*a)/(fs*c)的计算结果向下取整得到，m2为对(M*b)/(fs*c)的计算结果向下取整得到，a为第一设定值，b为第二设定值，c为第三设定值，fs为所述音频信号的采集频率；

则对于各帧待处理信号，根据公式

7.根据权利要求1所述的回声时延检测方法，其特征在于，所述确定各帧基准信号对应的二值化数组包括：

分别对各帧基准信号进行2M频点的快速傅氏变换fft处理，得到各帧基准信号的各频点对应的fft处理结果，M为设定值；

设j为频点序数，分别根据各帧基准信号的各频点对应的fft处理结果，计算各帧基准信号的各j频点对应的功率谱Ref(j)；j属于m1至m2的整数，m1为对(M*a)/(fs*c)的计算结果向下取整得到，m2为对(M*b)/(fs*c)的计算结果向下取整得到，a为第一设定值，b为第二设定值，c为第三设定值，fs为所述音频信号的采集频率；

分别计算各帧基准信号的各频点功率谱Ref(j)的平滑值；

8.根据权利要求1所述的回声时延检测方法，其特征在于，所述将同一帧的基准信号和待处理信号对应的二值化数组进行异或累加处理包括：

设i为帧序数，i属于0至n-1的整数，则根据公式

9.根据权利要求1所述的回声时延检测方法，其特征在于，所述方法还包括：

记录各帧基准信号对应的输出时间，及各种待处理信号对应的采集时间；

确定所选取的处理结果所对应的帧序数相应的时延值包括：

确定所选取的处理结果所对应的帧序数；

将所述帧序数对应的待处理信号的采集时间，与对应的基准信号的输出时间的差值，确定为所述帧序数相应的时延值。

10.根据权利要求1所述的回声时延检测方法，其特征在于，所述方法还包括：在检测到通话语音信号时，根据所述音频输出器件输出的音频信号及所述音频输入器件回采的对应音频信号，确定回声时延值；以该回声时延值进行非首次的回声消除。

11.根据权利要求1所述的回声时延检测方法，其特征在于，所述方法还包括：

若在检测到通话语音信号时，未确定出符合设定收敛条件的回声时延值，则以历史回声时延值进行回声消除；

12.一种回声消除芯片，其特征在于，包括：

音频转换模块，用于对所述音频信号进行模数转换，得到待处理信号；所述待处理信号具有多帧；

基准信号确定模块，用于确定与所述音频信号相应的预置的基准信号；所述基准信号具有多帧；

回声时延值确定模块，用于根据所述基准信号和所述待处理信号确定回声时延值，包括：

第一二值化数组确定单元，用于确定各帧基准信号对应的二值化数组；其中，一帧基准信号对应的二值化数组包括该帧基准信号的各频点对应的二值化值；

第二二值化数组确定单元，用于确定各帧待处理信号对应的二值化数组；其中，一帧待处理信号对应的二值化数组包括该帧待处理信号的各频点对应的二值化值；

异或累加处理单元，用于将同一帧的基准信号和待处理信号对应的二值化数组进行异或累加处理，得到各帧对应的异或累加处理结果；

选取单元，用于根据各帧待处理信号对应的加权系数，对相应帧的异或累加处理结果进行平滑处理，得到各帧对应的平滑异或累加处理结果；从n帧对应的平滑异或累加处理结果中，选取值最小的平滑异或累加处理结果；

候选时延值确定单元，用于确定所选取的处理结果所对应的帧序数相应的时延值，将所确定的时延值确定为候选时延值；

回声时延值确定单元，用于若所述n帧对应的平滑异或累加处理结果的最大值和最小值的差值，大于设定差值门限；且，n帧对应的平滑异或累加处理结果中的最小值小于设定门限值；且，所述候选时延值维持K帧不变，K帧包括多个连续n帧，一个n帧对应计算出一个候选时延值，则确定所述候选时延值为所述回声时延值。

13.根据权利要求12所述的回声消除芯片，其特征在于，所述基准信号确定模块包括：

基准信号获取单元，用于从相连接的所述音频输出器件获取所述基准信号；

或，调取单元，用于调取预置的所述基准信号。

14.一种终端设备，其特征在于，包括：回声消除芯片，音频输出器件和音频输入器件；

其中，回声消除芯片，用于在检测到通话接入请求时，获取终端设备的音频输入器件采集的通过空气传播的音频信号，所述音频信号与所述终端设备的音频输出器件输出的音频相应；对所述音频信号进行模数转换，得到待处理信号；所述待处理信号具有多帧；确定与所述音频信号相应的预置的基准信号；所述基准信号具有多帧；根据所述基准信号和所述待处理信号确定回声时延值；确定各帧基准信号对应的二值化数组，及各帧待处理信号对应的二值化数组；其中，一帧基准信号对应的二值化数组包括该帧基准信号的各频点对应的二值化值，一帧待处理信号对应的二值化数组包括该帧待处理信号的各频点对应的二值化值；将同一帧的基准信号和待处理信号对应的二值化数组进行异或累加处理，得到各帧对应的异或累加处理结果；根据各帧待处理信号对应的加权系数，对相应帧的异或累加处理结果进行平滑处理，得到各帧对应的平滑异或累加处理结果；从n帧对应的平滑异或累加处理结果中，选取值最小的平滑异或累加处理结果，确定所选取的处理结果所对应的帧序数相应的时延值，将所确定的时延值确定为候选时延值；若所述n帧对应的平滑异或累加处理结果的最大值和最小值的差值，大于设定差值门限；且，n帧对应的平滑异或累加处理结果中的最小值小于设定门限值；且，所述候选时延值维持K帧不变，K帧包括多个连续n帧，一个n帧对应计算出一个候选时延值，则确定所述候选时延值为所述回声时延值；

其中，所述回声消除芯片根据n帧对应的异或累加处理结果，选取符合设定要求的处理结果时，具体用于：根据各帧待处理信号对应的加权系数，对相应帧的异或累加处理结果进行平滑处理，得到各帧对应的平滑异或累加处理结果；

所述音频输出器件，用于输出所述音频信号；

15.一种可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时，实现如权利要求1-11中任一项所述的回声时延检测方法的各个步骤。