CN108922551A

CN108922551A - 用于补偿丢失帧的电路及方法

Info

Publication number: CN108922551A
Application number: CN201710345216.5A
Authority: CN
Inventors: 不公告发明人
Original assignee: Broadcom Integrated Circuit Shanghai Co Ltd
Current assignee: Beken Corp
Priority date: 2017-05-16
Filing date: 2017-05-16
Publication date: 2018-11-30
Anticipated expiration: 2037-05-16
Also published as: CN108922551B; US10032457B1

Abstract

本发明公开了一种用于补偿丢失音频帧的电路，包括：识别器，配置成识别具有第一长度的参考音频段，具有第二长度的丢失音频帧跟在参考音频段之后；搜索器，耦联于所述识别器，并且配置成通过利用互相关搜索在缓存音频段中搜索与参考音频段相似的第一音频段，参考音频段跟在缓存音频段之后；识别器还配置成将第一音频段之后的第二音频段识别为预补偿音频帧；调整器，耦联于识别器并且配置成根据比例因子调整第二音频段的振幅；以及输出器，耦联于所述调整器以将经调整的第二音频段输出为经补偿的音频帧。本发明的优点在于极大地提高了音频传输的质量，避免由于音频丢帧引起的噪音，改善听觉感受。

Description

用于补偿丢失帧的电路及方法

技术领域

本发明涉及一种音频帧，更具体地涉及但不限于一种用于补偿丢失的音频帧的电路及方法。

背景技术

在蓝牙标准协议中，同步面向连接(SCO)/扩展同步面向连接(eSCO)连接可以用于实现实时语音通信。然而，在2.4GHz频带WIFI被广泛使用的复杂电磁环境中，即使存在eSCO的重传机制，音频帧的丢失也是不可避免的。一旦存在丢失的音频帧，在呼叫期间将产生“爆裂”声音，使呼叫者烦躁。因此，可能需要提供一种电路和方法来处理上述问题并消除“爆裂”声音，以便提高声音质量。

发明内容

本发明的一个实施例公开了一种用于补偿丢失的音频帧的电路，该电路包括：识别器，配置成识别具有第一长度的参考音频段，具有第二长度的丢失的音频帧跟在该参考音频段之后；搜索器，耦联于识别器，并且配置成通过利用互相关搜索在缓存音频段中搜索与参考音频段相似的第一音频段，参考音频段跟在缓存音频段之后，其中缓存音频段的长度比述第一长度和第二长度的总长度要长，并且第一音频段具有与参考音频段相同的长度；识别器还配置成将第一音频段之后的第二音频段识别为预补偿音频帧，其中第二音频段具有和丢失的音频帧相同的长度；调整器，耦联于识别器并且配置成根据比例因子调整第二音频段的振幅；以及输出器，耦联于调整器以将经调整的第二音频段输出为经补偿的音频帧。

优选地，调整器还包括：计算器，配置成根据参考音频段与第一音频段的能量比来计算比例因子。

优选地，该电路还包括：加法器，耦联于识别器以进行叠加：

i)参考音频段和第一音频段通过使用窗函数在丢失音频帧之前使得相位连续；以及

ii)在丢失音频帧之后的第一好帧、以及在第二音频段之后的具有第三长度的第三音频段，通过使用窗口函数在丢失音频帧之后使得相位连续，其中第三长度等于第一音频帧的长度。

优选地，该电路还包括：检测器，耦联于识别器，并且配置成检测当前丢失音频帧是第一丢失音频帧还是第一丢失音频帧之后的帧。

优选地，该电路还包括：衰减器，耦联于检测器并且配置成：如果当前丢失音频帧是在第一丢失音频帧之后的帧，则线性地降低当前丢失音频帧的振幅，并且线性地升高最后丢失音频之后的第一好帧的振幅；如果帧在第五丢失音频帧之后，则衰减器将不减低帧的振幅以避免绝对的静音。

本发明的另一实施例公开了一种用于补偿丢失的音频帧的方法，该方法包括：识别具有第一长度的参考音频段，具有第二长度的丢失的音频帧跟在该参考音频段之后；通过利用互相关搜索在缓存音频段中搜索与参考音频段相似的第一音频段，参考音频段跟在缓存音频段之后，其中缓存音频段的长度大于第一长度和第二长度的总长度，并且第一音频段具有与参考音频段相同的长度；将第一音频段之后的第二音频段识别为预补偿的音频帧，其中第二音频段具有与丢失的音频帧相同的长度；根据比例因子调整第二音频段的振幅；以及输出经调整的第二音频段作为经补偿的音频帧。

优选地，调整第二音频段的幅度还包括：根据参考音频段与第一音频段的能量比来计算比例因子。

优选地，该方法还包括叠加：

ii)在丢失音频帧之后的第一好帧、以及在第二音频段之后的具有第三长度的第三音频段，通过使用窗口函数在丢失音频帧之后使得相位连续，其中第三长度等于窗口的长度。

优选地，该方法还包括：检测当前丢失音频帧是第一丢失音频帧还是第一丢失音频帧之后的帧，并且如果当前丢失音频帧是第一丢失音频帧之后的帧，则线性地降低当前丢失音频帧的振幅，以及线性地升高在最后丢失音频帧之后的第一好帧的振幅。

优选地，该方法还包括：如果帧在第五丢失音频帧之后，则将不会降低帧的振幅以避免绝对的静音。

相比较于现有技术，本发明的优点在于：能够保证音频传输的完整性，通过补偿丢失音频帧的方法，避免因丢帧而出现的爆裂音，极大地提高了传输音频的质量，提升听觉感受。

附图说明

本发明以示例性方式通过附图进行说明。因为本发明的范围由权利要求限定，附图应当被理解为示例性的而不是限制性的。在附图中，相同的附图标记表示相同的元件。

图1是本发明的一个实施例中的包括具有长度N的丢失段A的音频段的示意图。

图2是本发明的一个实施例中的图1的音频段的互相关搜索的示意图。

图3是本发明的一个实施例中的图1的音频段的叠加操作的示意图。

图4是本发明的一个实施例中的包括两个或更多个丢失音频帧的音频段的示意图。

图5A-5E是本发明的一个实施例中的包括两个或更多个丢失音频帧的音频段400的振幅(Am)下降/上升的示意图。

图6是本发明的一个实施例中的用于补偿丢失的音频帧的电路的示意图。

图7是本发明的一个实施例中的用于补偿丢失音频帧的方法流程图。

具体实施方式

现在将描述本发明的各方面和实施例。以下描述提供了用于彻底理解和实现这些示例描述的具体细节。然而，本领域技术人员将理解，本发明可以在没有这些细节的情况下实施。另外，一些公知的结构或功能可能没有进行详细的揭示或描述，以避免不必要地模糊相关描述。

图1是本发明的一个实施例中的包括具有长度N的丢失段A的音频段100的示意图。如图1所示，音频段A，B，C和D按时间排列并且在时间上连续。在一个实施例中，丢失段A包含一个长度为N的丢失音频帧。片段B和片段C首先被接收并缓存在缓冲器(未示出)中。在一个实施例中，CRC(循环冗余校验)在蓝牙通信协议的链路层(未示出)上进行，以指示差的(包括丢失和错误的)音频帧和好的帧，也就是说，每一个音频帧都具有帧ID(FID)的指示。由于时间连续性，长度为M的片段B被识别为参考音频片段，该参考音频片段后面是丢失的片段A，长度为L的片段C被识别为缓存音频片段，该缓存音频片段后面是参考音频片段B，并且长度为N的段D被识别为丢失段A之后的第一好帧。请注意，片段C的长度大于片段B和片段A的总长度。在一个实施例中，片段C的长度为大约15ms-30ms。片段B的长度小于片段A的长度。

图2是本发明的一个实施例中的图1的音频段的互相关搜索的示意图。由于音频段的短期相关性，即音频段的准周期性质，可以通过使用互相关搜索搜索段C来找到具有长度M的片段E。搜索的片段E是与参考音频段B最相似的片段，并且片段E之前的片段F被识别为预补偿的音频段以补偿丢失段A。片段F具有与丢失音频帧相同的长度。

互相关搜索包括：计算相关系数以便确定片段E的起始点。相关系数R(k)被定义为：

其中k＝0...L-M-1，Xn是片段B的音频数据，Yn是片段C的音频数据。

最大相关系数R(k)_max用于识别与片段B最相似的片段E，并且将k的值识别为片段E的起始点。

在另一实施例中，当相关系数R(k₁)₁超过预定阈值时，互相关搜索停止，并且不会计算剩余的相关系数。k₁的值被识别为片段E的起点。

再次参考图2，虽然找到片段F作为预补偿音频段以补偿丢失段A，但是片段F的振幅与丢失段A的振幅不匹配。因此，可以计算振幅的比例因子(SF)以修改片段F的音频数据。比例因子可以被定义为：

其中K是片段E的起始点，X_n是片段B的音频数据，Y_n是片段C的音频数据。

片段F的经修改的音频数据表示为Y′(n)，并且被定义为：

Y′(n)＝SF*Y(n)

其中n＝0...N-1，并且Y(n)表示片段F的原始音频数据，并且N是丢失音频帧的长度。经修改的片段F被复制以补偿丢失的音频段A.

图3是本发明的一个实施例中的图1的音频段100的叠加操作的示意图。叠加操作用于使丢失的音频段A之前和之后的相位连续，从而可以实现音频段的平滑过渡，并且观众将听到没有爆裂或咔嗒声噪声的平滑过渡。

首先，根据实际需要选择窗口函数。窗函数可以是汉明窗，布莱克曼窗和三角窗中的任何一个。在一个实施例中，窗函数是三角窗。三角窗的系数定义为：

Wnd[OLA_L]＝{15888,15391,14895,14398,13902,13405,12909,12412,

11916,11419,10923,10426,9930,9433,8937,8440,

7944,7447,6951,6454,5958,5461,4965,4468,

3972,3475,2979,2482,1986,1489,993,496}

其中Wnd[OLA_L]是常数，OLA_L是窗口的长度。

其次，通过使用给定的窗口函数，如图3所示，参考音频段B与片段E叠加，以获得经修改的音频数据S(i)。也就是说，用音频数据S(i)替换长度为OLA_L的丢失段A之前的音频段的音频数据，以便在丢失段A之前使得相位连续，并且丢失段A之前的S(i)被定义为：

S(i)＝X_n(M-OLA_L+i)*Wnd(i)+SF*Y_n(K+M-OLA_L+i)

*Wnd(OLA_L-i-1)

其中i＝0...OLA_L-1，K是片段E的起始点，X_n是片段B的音频数据，Y_n是片段C的音频数据，SF是比例尺因子。

类似地，如图3所示，为了在丢失的音频段A之后使得相位连续，通过使用上述窗口函数，将第一好帧D与片段F之后的具有长度为OLA_L的音频段OLA叠加。使用经计算的音频数据S(i)替换长度为OLA_L的丢失段A之后的音频段的数据，并且丢失段A之后的S(i)被定义为：

S(i)＝Z_n(i)*Wnd(OLA_L-i-1)+SF*Y_n(K+M+N+i)*Wnd(i)

其中i＝0...OLA_L-1，K是片段E的起始点，Z_n是片段D的音频数据，Y_n是片段C的音频数据，SF是比例尺因子。

图4是本发明的一个实施例中的包括两个或更多个丢失音频帧的音频段400的示意图。在通信的过程中，不可避免地连续丢失几个音频帧，这在图3中可以表示为N*丢失。然而，由于相同的音频段F被重复地补偿丢失的音频帧，所以会在通信期间产生金属音。为了消除金属音并进一步增强声音质量，可能希望利用斜坡下降/上升操作来处理在第一丢失音频帧A和第一好帧D之后的帧的振幅。也就是说，如果当前丢失的音频帧是第一丢失音频帧A，则不会启动斜坡下降/上升操作；如果当前丢失的音频帧是在第一丢失的音频帧A之后的帧，则降低当前丢失的音频帧的振幅，并且增大最后丢失的音频帧之后的第一好帧D的振幅；如果帧位于第五个丢失的音频帧之后，则帧的振幅将不会下降，以避免绝对静音。在一个实施例中，振幅加权因子f(n)被定义为：

其中N是丢失的音频帧的数目，即N＝2，3，4或5；如果N>5，则N＝5；n＝0...63。

图5A-5E是本发明的一个实施例中的包括两个或更多个丢失音频帧的音频段400的振幅下降/上升的示意图。

如图5A所示，例如，当存在两个丢失的音频帧时，第一丢失音频帧的振幅保持不变，并且第二丢失音频帧的振幅线性下降到-6dB。在第二丢失音频帧之后的第一好帧D的振幅从-6dB线性上升到0dB。

如图5B所示，例如，当存在三个丢失音频帧时，第一丢失音频帧的振幅保持不变，并且第二和第三丢失音频帧的振幅线性降低到-12dB。在第三丢失音频帧之后的第一好帧D的振幅从-12dB线性上升到0dB。

如图5C所示，例如，当存在四个丢失音频帧时，第一丢失音频帧的振幅保持不变，并且第二、第三和第四丢失音频帧的振幅线性降低到-18dB。在第四丢失音频帧之后的第一好帧D的振幅从-18dB线性上升到0dB。

如图5D所示，例如，当存在五个丢失音频帧时，第一丢失音频帧的振幅保持不变，并且第二、第三、第四和第五丢失音频帧的振幅线性降低到-24dB。在第五丢失音频帧之后的第一好帧D的振幅从-24dB线性上升到0dB。

如图5E所示，例如，当存在多于五个丢失音频帧时，第一丢失音频帧的振幅保持不变，并且第二、第三、第四和第五丢失音频帧的振幅线性降低到-24dB，在第五丢失音频帧之后的帧的振幅保持在-24dB以避免绝对的静音，并且在第五丢失音频帧之后的第一好帧D的振幅从-24dB线性上升到0dB。

图6是本发明的一个实施例中的用于补偿丢失的音频帧的电路600的示意图。请注意，由虚线所指示的组件并非强制性的。

电路600包括识别器610，配置成识别具有第一长度的参考音频段，具有第二长度的丢失音频帧跟在该参考音频之后；搜索器620，耦联于识别器610，并且配置成通过利用互相关搜索在缓存音频段中搜索与参考音频段相似的第一音频段，其中参考音频段跟在缓存音频段之后，其中缓存音频段大于第一长度和第二长度的总长度，并且第一音频段具有与参考音频段相同的长度；识别器610还配置成将在第一音频段之后的第二音频段识别为预补偿音频帧，其中第二音频段具有与丢失的音频帧相同的长度；调整器640，耦联于识别器610并且配置成根据比例因子调整第二音频段的振幅；以及输出670，耦联于调整器640以输出经调整的第二音频段作为经补偿的音频帧。

在另一实施例中，调整器640还包括计算器641，配置成根据参考音频段与第一音频段的能量比来计算比例因子。

在另一实施例中，电路600还包括加法器630，耦联于识别器610以通过使用窗口函数进行叠加：i)参考音频段和第一音频段通过利用窗口函数以在丢失的音频帧之前使相位连续；以及ii)在丢失音频帧之后的第一好帧、以及在第二音频段之后的具有第三长度的第三音频段，通过使用窗函数在丢失音频帧之后使得相位连续，其中第三长度等于窗口的长度。

在另一实施例中，电路600还包括检测器650，耦联于610并配置成检测当前丢失音频帧是第一丢失音频帧A还是第一丢失音频帧A之后的帧。检测器650接收来自蓝牙通信协议的链路层(未示出)的指令以指示第一丢失音频帧。电路600还包括衰减器660，耦联于检测器650，配置成线性地降低当前丢失音频帧的振幅，并且如果当前丢失音频帧是在第一丢失音频帧之后的帧，则线性地升高第一丢失音频帧之后的第一好帧的振幅，并且如果该帧在第五丢失音频帧之后，则衰减器660将不降低该帧的振幅，以避免绝对的静音。

图7是本发明的一个实施例中的由图6所示的电路600执行的用于补偿丢失音频帧的方法700的流程图。

方法700包括：步骤710中，识别具有第一长度的参考音频段，具有第二长度的丢失音频帧跟在该参考音频之后；步骤720中，通过利用互相关搜索在缓存音频段中搜索与参考音频段相似的第一音频段，参考音频段跟在该缓存音频段之后，其中缓存音频段的长度大于第一长度和第二长度的总长度，并且第一音频段具有与参考音频段相同的长度；步骤730中，将在第一音频段之后的第二音频段识别为预补偿音频帧，其中第二音频段具有与丢失音频帧相同的长度；步骤740中，根据比例因子调整第二音频段的振幅；；以及步骤750中，输出经调整的第二音频段作为经补偿的音频帧。

在另一实施例中，方法700还包括：调整第二音频段的振幅，其还包括根据参考音频段与第一音频段的能量比来计算比例因子。

在另一实施例中，方法700还进行叠加：i)参考音频段和第一音频段通过使用窗函数在丢失音频帧之前使得相位连续；以及ii)在丢失音频帧之后的第一好帧、以及在第二音频段之后的具有第三长度的第三音频段，通过使用窗函数在丢失音频帧之后使得相位连续，其中第三长度等于窗口的长度。

在另一实施例中，方法700还包括：检测当前丢失音频帧是第一丢失音频帧还是第一丢失音频帧之后的帧，如果当前丢失音频帧是第一丢失音频帧之后的帧，则线性地降低当前丢失音频帧的振幅，以及线性地增加在最后丢失音频帧之后的第一个好帧的振幅。如果帧在第五个丢失音频帧之后，则将不降低帧的振幅，以避免绝对的静音。

各种实施例的特征和方面可以集成到其他实施例中，并且可以在没有示出或描述的所有特征或方面的情况下实现本文档中所示的实施例。本领域技术人员将理解，尽管为了说明的目的描述了系统和方法的具体示例和实施例，但是在不偏离本发明的精神和范围的情况下可以进行各种修改。此外，一个实施例的特征可以并入其他实施例中，即使在本文档内的单个实施例中没有一起描述那些特征。

Claims

1.一种用于补偿丢失音频帧的电路，其特征在于，包括：

识别器，配置成识别具有第一长度的参考音频段，具有第二长度的丢失音频帧跟在所述参考音频段之后；

搜索器，耦联于所述识别器，并且配置成通过利用互相关搜索在缓存音频段中搜索与所述参考音频段相似的第一音频段，所述参考音频段跟在所述缓存音频段之后，其中所述缓存音频段的长度大于所述第一长度和所述第二长度的总长度，并且所述第一音频段具有与所述参考音频段相同的长度；

所述识别器还配置成将所述第一音频段之后的第二音频段识别为预补偿音频帧，其中所述第二音频段具有与所述丢失音频帧相同的长度；

调整器，耦联于所述识别器并且配置成根据比例因子调整所述第二音频段的振幅；

输出器，耦联于所述调整器以输出经调整的所述第二音频段作为经补偿的音频帧。

2.如权利要求1所述的用于补偿丢失音频帧的电路，其特征在于，所述调整器还包括：计算器，配置成根据所述参考音频段与所述第一音频段的能量比来计算所述比例因子。

3.如权利要求1所述的用于补偿丢失音频帧的电路，其特征在于，所述电路还包括：加法器，耦联于所述识别器以进行叠加：

i)所述参考音频段和所述第一音频段通过使用窗函数在所述丢失音频帧之前使得相位连续；以及

ii)在所述丢失音频帧之后的第一好帧、以及在所述第二音频段之后的具有第三长度的第三音频段，通过使用窗口函数在所述丢失音频帧之后使得相位连续，其中所述第三长度等于所述第一音频帧的长度。

4.如权利要求1所述的用于补偿丢失音频帧的电路，其特征在于，所述电路还包括：检测器，耦联于所述识别器，并且配置成检测当前丢失音频帧是第一丢失音频帧还是所述第一丢失音频帧之后的帧。

5.如权利要求4所述的用于补偿丢失音频帧的电路，其特征在于，所述电路还包括：衰减器，耦联于所述检测器并且配置成：如果所述当前丢失音频帧是在第一丢失音频帧之后的帧，则线性地降低所述当前丢失音频帧的振幅，并且线性地升高所述最后丢失音频之后的第一好帧的振幅；如果帧在第五丢失音频帧之后，则衰减器将不减低所述帧的振幅以避免绝对的静音。

6.一种用于补偿丢失音频帧的方法，其特征在于，包括：

识别具有第一长度的参考音频段，具有第二长度的所述丢失音频帧跟着所述参考音频段之后；

通过利用互相关搜索在缓存音频段中搜索与所述参考音频段相似的第一音频段，所述参考音频段跟在所述缓存音频段之后，其中所述缓存音频段的长度大于所述第一长度和所述第二长度的总长度，并且所述第一音频段具有与所述参考音频段相同的长度；

将所述第一音频段之后的第二音频段识别为预补偿音频帧，其中所述第二音频段具有与所述丢失音频帧相同的长度；

根据比例因子调整所述第二音频段的振幅；以及

输出经调整的所述第二音频段作为经补偿的音频帧。

7.如权利要求6所述的用于补偿丢失音频帧的方法，其特征在于，调整所述第二音频段的幅度还包括：根据所述参考音频段与所述第一音频段的能量比来计算所述比例因子。

8.如权利要求6所述的用于补偿丢失音频帧的方法，其特征在于，所述方法还包括叠加：

ii)在所述丢失音频帧之后的第一好帧、以及在所述第二音频段之后的具有第三长度的第三音频段，通过使用窗口函数在所述丢失音频帧之后使得相位连续，其中所述第三长度等于窗口的长度。

9.如权利要求6所述的用于补偿丢失音频帧的方法，其特征在于，所述方法还包括：检测当前丢失音频帧是第一丢失音频帧还是所述第一丢失音频帧之后的帧，并且如果所述当前丢失音频帧是所述第一丢失音频帧之后的帧，则线性地降低所述当前丢失音频帧的振幅，以及线性地升高在最后丢失音频帧之后的第一好帧的振幅。

10.如权利要求9所述的用于补偿丢失音频帧的方法，其特征在于，所述方法还包括：如果帧在第五丢失音频帧之后，则将不会降低所述帧的振幅以避免绝对的静音。