[go: up one dir, main page]

CN115428069A - 低音后置滤波器的低成本适配 - Google Patents

低音后置滤波器的低成本适配 Download PDF

Info

Publication number
CN115428069A
CN115428069A CN202180030319.7A CN202180030319A CN115428069A CN 115428069 A CN115428069 A CN 115428069A CN 202180030319 A CN202180030319 A CN 202180030319A CN 115428069 A CN115428069 A CN 115428069A
Authority
CN
China
Prior art keywords
signal
decoder
energy
post
primary signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180030319.7A
Other languages
English (en)
Inventor
查姆兰·莫拉迪阿舒尔
艾力克·诺维尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telefonaktiebolaget LM Ericsson AB
Original Assignee
Telefonaktiebolaget LM Ericsson AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Telefonaktiebolaget LM Ericsson AB filed Critical Telefonaktiebolaget LM Ericsson AB
Priority to CN202411528150.XA priority Critical patent/CN119360866A/zh
Publication of CN115428069A publication Critical patent/CN115428069A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

一种用于音频解码的方法和解码器,其中,对经编码的初级信号进行解码以形成经解码的初级信号,然后对经解码的初级信号进行后置滤波以形成经后置滤波的信号,其中,解码器的输出信号是经解码的初级信号和经后置滤波的信号之一。获得对正由解码器重构的初级信号的频谱的至少一部分的能量估计和对由经解码的初级信号的后置滤波引起的时域中的不连续性的分析。基于所获得的能量估计和不连续性的分析来生成决策变量。将决策变量与阈值进行比较,并且基于决策变量与阈值的比较,将输出信号设置为经解码的初级信号或经后置滤波的信号。

Description

低音后置滤波器的低成本适配
技术领域
本公开总体上涉及通信,并且更具体地,涉及用于单声道、立体声或多声道音频编码和解码的方法和装置。
背景技术
尽管电信网络的容量在不断增加,但限制每个通信信道所需的带宽仍然是非常令人感兴趣的。在移动网络中,针对每个呼叫的较小传输带宽会在移动设备和基站二者中产生较低的功耗。这为移动运营商节省了能源和成本,而最终用户将体验到延长的电池寿命和增加的通话时间。此外,每用户消耗更少的带宽,移动网络可以并行服务更大数量的用户。
在语音编码领域,ACELP(代数码激励线性预测)算法已经是以低比特率提供高质量声音的领先技术。简而言之,ACELP模型由线性预测器(LP)滤波器组成,该LP滤波器对声道进行建模并提供重构语音的粗略频谱形状。LP滤波器由两个码本驱动:对语音的周期性分量进行建模的基音码本(或自适应码本)和生成非周期性语音段并构建基音码本的创新码本(或固定码本)。ACELP算法的核心算法已经被进一步增强,包括诸如后置滤波器的后处理工具。两个主要的这种滤波器是共振峰后置滤波器和基音后置滤波器,其都使用作为ACELP语音模型的部分的参数。共振峰后置滤波器使用线性预测器滤波器(LP)增强粗略频谱形状,并且基音后置滤波器通过强调基音周期来减少谐波间失真。基音后置滤波器的针对低频范围的变体是低音后置滤波器(BPF)。该工具出现在最近的语音编解码器标准中,例如ITU-T G.718和3GPP EVS,如3GPP TS 26.445 V16.0.0,用于增强语音服务(EVS)的编解码器中所示;详细算法描述,6.1.4.2低音后置滤波器[1]。
尽管低音后置滤波器通常改进解码的音频的质量,但它可能对一些信号产生负面影响。已经使用若干适配方法来控制后置滤波器强度。在3GPP EVS[1]中,后置滤波器强度适应于后置滤波的信号与输入信号的相关程度。低相关性表明滤波器可能会产生降级影响,并且因此,滤波器输出衰减。后置滤波器强度也适用于LP滤波器稳定性,其中低稳定性导致衰减的滤波器。
US 9,224,403描述了低音后置滤波器的另外的适配方法。这里,US 9,224,403已经考虑到编解码器可以使用多种模式,其中CELP或ACELP算法是这些模式之一。由于低音后置滤波器仅对ACELP模式有效,因此当在存在频繁模式切换的情况下启用和禁用滤波器时,可以适配低音后置滤波器的强度以避免伪音。美国专利9,224,403还考虑输入信号如何由ACELP或CELP编码模型表示。如果存在显著能量损失,有可能是信号没有被很好地建模,并且低音后置滤波器可能是有害的。为了减少因来回切换滤波器打开和关闭导致的伪音,也可以逐步适配后置滤波器强度以提供更平滑的过渡。可以对滤波器差值信号进行滤波器影响的分析,该滤波器差值信号描述经滤波的信号和未经滤波的信号之间的差值。也可以对近似差值信号进行滤波器影响的分析,以降低方法的计算复杂度。
在H.Chiba等人的“Adaptive Post-Filtering Controlled by Pitch Frequencyfor CELP-based Speech Coder”,2014 48th Asilomar Conference on Signals,Systemsand Computers中,应当认识到低音后置滤波器的适用性可以取决于信号的基音或基频。这里,后置滤波器的强度被限制为基音的函数,使得后置滤波器针对较低频率被衰减。滤波器的输出也用截止频率进行低通滤波,该截止频率取决于基频,从而为较低的基频产生较低的工作带宽。
发明内容
后置滤波器旨在减少噪音,但在一些情况下,它们可能引入新的伪音。具体地,参数(例如,基音周期参数或后置滤波器强度)的突然变化可能引入在频谱的低能量区域中变得可听的不连续性。
如US 9224403B2所建议的,逐步激活和去激活未解决由于切换参数的影响而可能在滤波器内部发生不连续性的事实。经验表明,尝试平滑参数切换的转换可以导致滤波器适配变慢,这降低后置滤波器的性能,而伪音仍未完全去除。
在一个方面,提供了一种用于音频解码的方法,其中,对经编码的初级信号进行解码以形成经解码的初级信号,然后对经解码的初级信号进行后置滤波以形成经后置滤波的信号,其中,解码器的输出信号是经解码的初级信号和经后置滤波的信号之一。获得对正由解码器重构的初级信号的频谱的至少一部分的能量估计和对由经解码的初级信号的后置滤波引起的时域中的不连续性的分析。基于所获得的能量估计和不连续性的分析来生成决策变量。将决策变量与阈值进行比较,并且基于决策变量与阈值的比较,将输出信号设置为经解码的初级信号或经后置滤波的信号。
在另一方面,提供了一种用于音频解码的解码器,其中,对经编码的初级信号进行解码以形成经解码的初级信号,然后对经解码的初级信号进行后置滤波以形成经后置滤波的信号,其中,解码器的输出信号是经解码的初级信号和经后置滤波的信号之一。解码器包括处理电路以及与该处理电路耦接的存储器,其中,存储器包括指令,所述指令在由处理电路执行时使解码器执行操作,所述操作包括:获得对正由解码器重构的初级信号的频谱的至少一部分的能量估计和对由经解码的初级信号的后置滤波引起的时域中的不连续性的分析;基于所获得的能量估计和所获得的不连续性的分析来生成决策变量;将决策变量与阈值进行比较,并基于决策变量与阈值的比较将输出信号设置为经解码的初级信号或经后置滤波的信号。
在另一方面,提供了一种适于执行操作的解码器,所述操作包括:获得对初级信号的频谱的至少一部分的能量估计,所述初级信号正由所述解码器重构以形成经解码的初级信号;获得对由所述经解码的初级信号的后置滤波引起的时域中的不连续性的分析;基于所获得的能量估计和所获得的不连续性的分析来生成决策变量;将决策变量与阈值进行比较;以及基于所述决策变量与所述阈值的比较,将所述输出信号设置为所述经解码的初级信号或经后置滤波的信号。
在另一方面,提供了一种计算机程序,所述计算机程序包括要由解码器的处理电路执行的程序代码,由此所述程序代码的执行使所述解码器执行操作,所述操作包括:获得对初级信号的频谱的至少一部分的能量估计,所述初级信号正由所述解码器重构以形成经解码的初级信号;获得对由所述经解码的初级信号的后置滤波引起的时域中的不连续性的分析;基于所获得的能量估计和所获得的不连续性的分析来生成决策变量;将决策变量与阈值进行比较;以及基于所述决策变量与所述阈值的比较,将所述输出信号设置为经解码的初级信号或经后置滤波的信号。
在另一方面,提供了一种包括非暂时性存储介质的计算机程序产品,所述非暂时性存储介质包括要由解码器的处理电路执行的程序代码,由此程序代码的执行使解码器执行操作,所述操作包括:获得对正由所述解码器重构的初级信号的频谱的至少一部分的能量估计;获得对由初级信号的后置滤波引起的时域中的不连续性的分析;基于所获得的能量估计和所获得的不连续性的分析来生成决策变量;将决策变量与阈值进行比较;以及基于所述决策变量与所述阈值的比较,将所述输出信号设置为经解码的初级信号或经后置滤波的信号。
使用本文描述的发明构思可以获得的一个优点是增加后置滤波器的适配,使得保持后置滤波器的益处,同时有问题的情况通过衰减或禁用后置滤波器来减轻。此外,该优点通过对音频解码器的整体计算复杂度具有有限影响的低复杂度方法实现。
附图说明
附图示出了发明构思的某些非限制性实施例,该附图被包括以提供对本公开的进一步理解,且被并入并构成本申请的一部分。在附图中:
图1是示出了根据一些实施例的在网络中操作的解码器系统的示例的图;
图2是示出了根据一些实施例的具有基音后置滤波器的解码器的示例的框图;
图3是基音后置滤波器调整信号中可以出现在子帧边界处的不连续性的图示;
图4是在应用被称为“低音后置滤波器(BPF)”的基音后置滤波器之前和之后的信号功率谱的图示;
图5是示出了根据一些实施例的具有基音后置滤波器的解码器的图,其中该解码器在频域中重构信号;
图6是根据本发明构思的一些实施例的自适应后置滤波器的元件的框图;
图7是示出了根据本发明构思的一些实施例的自适应后置滤波器的元件的框图;
图8是示出了根据本发明构思的一些实施例的由自适应后置滤波器执行的操作的流程图;
图9是示出了根据本发明构思的一些实施例的备选自适应后置滤波器的元件的框图;
图10是示出了根据本发明构思的一些实施例的解码器的框图;
图11是示出了根据本发明构思的一些实施例的解码器的操作的流程图;
图12是示出了根据本发明构思的一些实施例的解码器的操作的流程图;
图13是示出了根据本发明构思的一些实施例的解码器的操作的流程图。
具体实施方式
在下文中,将参考附图更全面地描述本发明构思,在附图中示出了本发明构思的实施例的示例。然而,本发明构思可以用多种不同形式来体现,并且不应当被解释为限于本文中所阐述的实施例。相反,提供这些实施例使得本公开将全面和完整,并且将本发明构思的范围充分传达给本领域技术人员。还应注意,这些实施例并不互相排斥。来自一个实施例的组成部分可以被默认假设为存在于/用于另一实施例中。
以下描述呈现了所公开主题的各种实施例。这些实施例被呈现为教导示例,并且不被解释为限制所公开主题的范围。例如,在不脱离所述主题的范围的情况下,可以修改、省略或扩展所述实施例的某些细节。
图1示出了解码器100的操作环境的示例,该解码器100可以用于对如本文所述的单声道、立体声或多声道比特流进行解码。解码器100可以是媒体播放器、移动设备、机顶设备、台式计算机等的一部分。解码器100接收经编码的比特流。比特流可以经由网络102等从编码器、从存储设备104、从云上的设备发送。在操作期间,解码器100接收并处理如本文所述的比特流的帧。解码器100输出音频信号(例如,单声道、立体声或多声道音频信号)并向具有至少一个扬声器的音频播放器106发送音频信号,以回放单声道、立体声或多声道音频信号。存储设备104可以是单声道、立体声或多声道音频信号的存储库(例如,商店或流媒体音乐服务的存储库)、单独的存储组件、移动设备的组件等的一部分。音频播放器可以是蓝牙扬声器、具有至少一个扬声器的设备、移动设备、流媒体音乐服务等。
图10是示出了根据本发明构思的实施例的被配置为提供无线通信的解码器设备100的元件的框图。解码器100可以是移动终端、移动通信终端、无线通信设备、无线终端、无线通信终端、用户设备UE、用户设备节点/终端/设备等的一部分。如图所示,解码器100可以包括网络接口电路1005(也被称为网络接口),其被配置为提供与其他设备/实体/功能/等的通信。解码器100还可以包括可操作地耦接到网络接口电路1005的处理器电路1001(也被称为处理器)以及可操作地耦接到处理器电路的存储器电路1003(也被称为存储器)。存储器电路1003可以包括计算机可读程序代码,该计算机可读程序代码在由处理器电路1001执行时使处理器电路执行根据本文公开的实施例的操作。
根据其他实施例,处理器电路1001可以被定义为包括存储器,使得不需要分离的存储器电路。如本文所讨论的,解码器100的操作可以由处理器1001和/或网络接口1005执行。例如,处理器1001可以控制网络接口1005向多声道音频播放器发送通信和/或通过网络接口1005从一个或多个其他网络节点/实体/服务器(例如,编码器节点、存储库服务器等)接收通信。此外,模块可以存储在存储器1003中,并且这些模块可以提供指令,使得当模块的指令由处理器1001执行时,处理器1001执行相应的操作。
图2示出了包括基音后置滤波器的音频解码系统。解码器220从例如传输网络或存储介质接收比特流210。解码器生成重构的时域信号
Figure BDA0003902029530000071
其中,n是样本索引,并且m是帧号。重构的时域信号
Figure BDA0003902029530000072
在下面的描述中也可以被称为初级信号或经解码的初级信号。重构的时域信号
Figure BDA0003902029530000073
通过也可以利用基音周期T的基音后置滤波器230进一步增强。
基音周期T通过对经解码的音频进行基音分析来获得,或者它可以来自编码器或解码器中对目标信号或相关音频信号的分析,该目标信号或相关音频信号可以具有与后置滤波器输入信号相同或相似的主基音。
经后置滤波的信号
Figure BDA0003902029530000074
可以使用以下形式的基音后置滤波器导出:
Figure BDA0003902029530000075
其中,T是样本中的基本基音周期,并且α∈[0,0.5]控制后置滤波器强度。经后置滤波的信号的等效表达式是
Figure BDA0003902029530000076
其中,
Figure BDA0003902029530000077
是滤波器的影响,表示为负的差值信号或校正信号或误差信号。参数α和T通常在每个子帧更新,其中子帧可以是4或5ms长。如果完整的音频帧是20ms,这意味着完整的帧分别被划分为5个或4个子帧。在3GPP EVS[1]中,后置滤波器强度α基于信号的频谱稳定性来适配。通过测量经后置滤波的音频与输入信号的相关性,它还具有内置的故障保护机制。如果相关性低,则意味着滤波器可能对质量产生负面影响,并且滤波器会被抑制或关闭。
经后置滤波的信号
Figure BDA0003902029530000081
从解码器系统输出,以由音频播放器回放或者可能以经解码的PCM格式存储或发送。注意,解码器系统可以包括在输出最终信号之前对经后置滤波的信号的进一步处理,例如附加增强或与其他信号或信号分量的组合。重构信号在这种情况下可以对应于差值信号或残差信号,如ITU-T G.718“Frame error robust narrow-band and wideband embedded variable bit-rate coding of speech and audio from8-32kbit/s”,第7.14.1.2节双低音后置滤波器中所概述的。残差信号可以与另一个信号组合以提供增强的输出信号。
低音后置滤波器适配——实施例A
图2的低音后置滤波器的缺点是:在子帧边界处低音后置滤波器参数的突然变化可以导致经滤波的信号中的不期望的不连续性,如图3中的不连续性300所示。这些不连续性可以产生跨越频率范围的失真。取决于输入信号的频谱,这些失真可能是明显的,并变得令人烦恼。考虑例如图4中的频谱400,其中后置滤波器操作生成高于大约1kHz的可听噪声402。注意,滤波器在200Hz以下仍然具有期望的效果,其中谐波间失真减少。
滤波器的故障保护机制未解决子帧转换的问题,该故障保护机制测量滤波器输出与滤波器输入信号的相关性。由于相关性在每个子帧内进行计算,因此没有考虑子帧之间的转换及其潜在影响。
减少不连续性的影响的可能技术是通过对参数进行低通滤波或通过交叉淡化子帧之间的后置滤波器输出来应用平滑。尽管发现这种操作可以减少伪音,但该操作也减慢滤波器的适配,使得滤波器的正面影响被减少。此外,尽管对参数的低通滤波减少了伪音,但发现针对这些临界段关闭后置滤波器更好。因此,似乎期望针对具有正面影响的区域保持后置滤波器不受影响,而当它具有负面影响时应完全关闭它。可以预见失真并在需要时禁用滤波器的后置滤波器的适配可以减少并且在一些实施例中消除不连续性的影响。
图5中概述的解码器提供了这种适配。解码器520接收比特流510并在频域中产生重构信号
Figure BDA0003902029530000091
其中,m是帧号,并且k是频率区间(bin)索引。在音频编码器和解码器系统中经常使用的变换是MDCT(修正的离散余弦变换)。应该注意,本文提出的构思适用于能量计算可能的任何变换域,例如DFT(离散傅里叶变换)、QMF(正交镜像滤波器组)或混合QMF滤波器组。处理块530执行逆MDCT(IMDCT)变换并应用后置滤波器。可以通过用图6的自适应后置滤波器块600代替图5的处理块530来描述根据本发明构思的一些实施例的后置滤波器适配方法。频域中的重构信号
Figure BDA0003902029530000092
被变换到时域。将所得时域信号输入到后置滤波器差值生成块610。将后置滤波器差值sdiff(m,n)630和频域中的重构信号
Figure BDA0003902029530000093
输入到后置滤波器适配器640,其形成是否应该应用后置滤波器的决策650。决策650用于通过激活或去激活从重构的初级信号减去后置滤波器差值来控制自适应后置滤波器块的输出660。
图9示出了备选方法,其中后置滤波器输出经滤波的信号而不是滤波器差值信号。这里,备选的自适应后置滤波器块900的决策机制决定是使用经滤波的信号902还是使用未经滤波的信号904。对经滤波的信号902而不是差值信号执行对经滤波的信号的时域分析,这将获得相似的结果。
图6的后置滤波器适配器640可以由图7的执行图8中概述的步骤的元件进一步描述。基于对图3和图4所示的有问题的项目的分析,后置滤波器适配方法可以基于检测两个条件进行:
1.频谱具有强倾斜或深谷,这可以暴露后置滤波器的潜在失真,如图4所示,其中信号400具有从1000Hz附近开始的谷,其中来自后置滤波器的失真402被暴露,以及
2.子帧边界处的不连续性大,如图3中的不连续性300所示。
检测频谱中的强倾斜或深谷可以通过测量特定临界频带中的频谱的能量来进行。临界频带中的低能量然后可以指示在频谱的感知敏感部分中发现深谷。针对每帧m的能量测量
Figure BDA0003902029530000101
可以对MDCT域中的重构信号
Figure BDA0003902029530000102
进行。MDCT域能量估计器710通过测量临界频带的能量来执行框800。
Figure BDA0003902029530000103
频率区间限制kstart,并且kend可以被设置为与临界频带的频率范围相匹配。例如,如果MDCT帧长NMDCT=160,则采样率为8000Hz,并且临界频率范围为1000Hz至1600Hz,合适的值可以是kstart=39和kend=64。对于严格的高通滤波操作,上限应为4000Hz并且kend=160。在上面的描述中,临界频带可以是自适应的并且例如取决于重构信号。临界频带例如可以集中在感知加权频谱上所测量的已识别的低能量区域周围。感知加权频谱可以基于重构信号的频谱来生成,并在频率和电平维度上进行变换,使得强调感知重要区域。自适应临界频带还可以考虑后置滤波器可能针对哪个频率范围产生失真。
由于
Figure BDA0003902029530000104
的MDCT合成可以涉及重叠相加操作,因此可以期望在能量估计中模拟重叠相加。这可以通过在框810中将低通FIR滤波器720应用于能量估计来进行:
Figure BDA0003902029530000105
这里,γ∈(0,1]是低通滤波系数,其例如取决于MDCT合成窗口的形状和重叠的长度。合适的值可以是γ=0.61。
不连续性的大小通过在框820中使用子帧不连续性分析器730对滤波器差值信号sdiff(m,n)的子帧边界处的步长进行平均来测量:
Figure BDA0003902029530000106
其中,m表示帧号,i是子帧号,Nsf是子帧数,并且n1,n2,…,
Figure BDA0003902029530000107
是标记每个新子帧开始的子帧边界的样本索引。如果子帧数Nsf=5并且帧长度N=160,则子帧边界索引可以是n1=0,n2=32,n3=64,n4=96,n5=128。注意,对于第一个样本n1=0,将引用样本sdiff(m,-1)。然而,这是与前一帧的最后一个样本sdiff(m-1,N-1)相同的样本。在实际实现中,该样本值在帧之间将存储存储器中。
决策变量在框830处在乘法器740处形成为
Figure BDA0003902029530000111
Figure BDA0003902029530000112
之间的比率。
Figure BDA0003902029530000113
备选地,在省略可选低通滤波步骤810的情况下,决策变量形成为
Figure BDA0003902029530000114
Figure BDA0003902029530000115
之间的比率,其中
Figure BDA0003902029530000116
是在框800中计算的能量估计。
为了使决策稳定,
Figure BDA0003902029530000117
可以通过在框840处在帧之间应用低通滤波器760来进行低通滤波,例如
Figure BDA0003902029530000118
其中,β∈(0,1]是低通滤波系数,并且合适的值可以是β=0.68。
在框840中经由限制器750限制经低通滤波的能量比的范围还可以是有益的,在这种情况下,表达式可以写成
Figure BDA0003902029530000119
Figure BDA00039020295300001110
其中,Eratio,lim将设置能量比的上限,并且其中,发现合适的值是Eratio,lim=2。注意,当β为1时,能量比不再进行低通滤波。
通过在框850中在阈值比较器770处将经低通滤波的能量比与阈值进行比较并在框860中确定是否使用(例如,激活)后置滤波器,来做出各种实施例中的后置滤波器激活决策。在本发明构思的一个实施例中,阈值Ethr被设置为1。
Figure BDA00039020295300001111
其中“活动的”指示后置滤波器被激活,而“非活动的”指示后置滤波器被禁用。应当注意,如果省略了可选框840,则将在框830中计算的决策变量
Figure BDA00039020295300001112
与阈值进行比较.。如上所述,当后置滤波器被激活时,后置滤波器的输出从重构的初级信号中减去后置滤波器差值。当后置滤波器为非活动时,后置滤波器的输出是重构的初级信号。
注意,可以对滤波器输出信号sf(m,n)而不是差值信号sdiff(m,n)进行不连续性的类似分析,如图9所示。这将可能导致对例如滤波器常数β、γ、Eratio,lim和Ethr的不同选择,但上述构思的原理将保持不变。
在一些实施例中,如果经低通滤波的能量比在阈值附近徘徊,则针对切换添加一些滞后以减少来回切换可能是有用的。实现滞后的一种方式是具有两个阈值:一个用于激活,并且一个用于去激活。如果激活阈值略高于去激活阈值,这为决策变量创建“死区”,并且当变量在阈值附近徘徊时减少来回切换。实现滞后的另一方式是确定经低通滤波的能量比在一时间段内低于(或备选地,高于)阈值的次数的计数,并且在经低通滤波的能量比在该时间段内低于(或备选地,高于)阈值的预定次数之后激活(或去激活)后置滤波器。
在上述实施例中,使用了临界频带。在本发明构思的各种其他实施例中,可以存在与多于一个频谱谷相对应的多于一个临界频带。在一个实施例中,被选择进行分析的临界频带是最敏感的区域,并且针对所选择的临界频带执行是否使用后置滤波器的决策。在其他实施例中,可以存在噪音刚好低于针对噪音明显的阈值的多个区域,并且组合这些区域中的许多区域可以导致用户听到噪音,而针对每个区域的分析指示噪音不应该是明显的。解决该问题的一种方式可以是:对来自若干个临界频带的贡献求和,并基于上述实施例来决定将输出设置为初级信号还是经后置滤波的信号。备选方法是单独分析频带,然后如果针对正在分析的频带中的任何一个触发阈值,则禁用后置滤波器。
实施例B
用于决定是否将屏蔽噪音的备选方法是比较在后置滤波器之前和之后临界区域中的信号的能量。发现该备选方法给出与在实施例A下描述的发明构思相似的结果,但是以更高的延迟和复杂度为代价。重构信号的临界频带的能量可以在时域中进行测量:
Figure BDA0003902029530000121
Figure BDA0003902029530000122
其中,fcb(·)是与临界频带相匹配的高通滤波器或带通滤波器。类似地,经后置滤波的重构信号的临界频带的能量可以写成
Figure BDA0003902029530000131
sf,cb(m,n)=fcb(sf(m,n))
针对帧m激活或禁用后置滤波器的决策D(m)可以通过将在应用后置滤波器之前和之后信号的临界频带的能量比与下面所示的决策阈值Ethr进行比较来形成,其中,“活动的”指示后置滤波器被激活,并且“非活动的”指示后置滤波器被禁用。在本发明构思的一个实施例中,阈值Ethr被设置为1。换言之,当在应用后置滤波器之后高于特定截止频率的能量更高时,能量增加被认为是由噪音引起的,并且后置滤波器被禁用。
Figure BDA0003902029530000132
针对帧m禁用后置滤波器可以在一些实施例中通过使用经解码的信号
Figure BDA0003902029530000133
而不是经后置滤波的版本sf(m,n)来实现。如果滤波器例程产生滤波器差值信号sdiff(m,n),则滤波器的禁用可以通过跳过从经解码的信号
Figure BDA0003902029530000134
中减去滤波器差值信号来实现。
在一些实施例中,如果能量比在阈值附近徘徊,则针对初级信号和经后置滤波的信号之间的切换添加一些滞后以减少来回切换可以是有用的。实现滞后的一种方式是具有两个阈值:一个用于激活,并且一个用于去激活。如果激活阈值略高于去激活阈值,这为决策变量创建“死区”,并且当变量在阈值附近徘徊时减少来回切换。实现滞后的另一方式是确定经低通滤波的能量比在一时间段内低于(或备选地,高于)阈值的次数的计数,并且在经低通滤波的能量比在该时间段内低于(或备选地,高于)阈值的预定次数之后激活(或去激活)后置滤波器。
现在将参考根据本发明构思的一些实施例的图11的流程图来讨论解码器100(使用图10的框图的结构来实现)的操作。例如,模块可以存储在图3的存储器1003中,并且这些模块可以提供指令,使得当相应通信设备处理电路1001执行模块的指令时,处理电路1001执行流程图的相应操作。
现在转向图11,在框1101中,处理电路1001获得对正由解码器100重构(即,解码)的初级信号的频谱的至少一部分的能量估计。初级信号重构可以在频域中进行。框1101的操作类似于上述框800的操作。在本发明构思的各种实施例中,处理电路1001可以通过在频域中对频谱的至少一部分的能量系数求和来获得能量估计。例如,在一些实施例中,处理电路1001通过根据下式测量重构信号的临界频带的能量来获得能量估计:
Figure BDA0003902029530000141
其中,m是帧号,
Figure BDA0003902029530000142
是重构信号的临界频带的能量,
Figure BDA0003902029530000143
是重构信号,并且频率区间限制kstart和kend被设置为与临界频带的频率范围相匹配。
处理电路1001可以通过根据下式将低通滤波器应用于重构信号的临界频带的能量
Figure BDA0003902029530000144
来进一步处理测量:
Figure BDA0003902029530000145
其中,γ∈(0,1]并且是低通滤波系数,其取决于修正的离散余弦变换MDCT合成窗口的形状和重叠的长度。
在框1103中,处理电路1001获得对由初级信号的后置滤波引起的时域中的不连续性的分析。框1103的操作类似于上述框820的操作。在本发明构思的各种实施例中,处理电路1001可以通过测量不连续性的大小的平均能量来获得对时域中的不连续性的分析。例如,在一些实施例中,处理电路1001通过根据下式对滤波器差值信号sdiff(m,n)的子帧边界处的步长进行平均来测量不连续性的大小的平均能量
Figure BDA0003902029530000146
其中,m是帧号,i是子帧号,
Figure BDA0003902029530000147
是子帧边界处的步长的平均能量,Nsf是子帧数,以及
Figure BDA0003902029530000151
是标记每个子帧的开始的子帧边界的样本索引。
在框1105中,处理电路1001基于所获得的能量估计和所获得的不连续性分析来生成决策变量。框1105的操作类似于上述框830的操作。在本发明构思的各种实施例中,处理电路1001可以根据下式来生成决策变量:
Figure BDA0003902029530000152
其中,
Figure BDA0003902029530000153
Figure BDA0003902029530000154
Figure BDA0003902029530000155
之间的能量比,
Figure BDA0003902029530000156
是子帧边界处的步长的平均能量,
Figure BDA0003902029530000157
是重构信号的临界频带的经低通滤波的能量
Figure BDA0003902029530000158
转向图12,在本发明构思的一些实施例中,处理电路1001可以在框1201中将决策变量限制到最大值,并且在框1203中对决策变量进行低通滤波。框1201和框1203的操作类似于上述框840的操作。在一些实施例中,处理电路1001根据下式来限制决策变量并且对决策变量进行低通滤波:
Figure BDA0003902029530000159
Figure BDA00039020295300001510
Figure BDA00039020295300001511
其中,m是帧数,
Figure BDA00039020295300001512
Figure BDA00039020295300001513
Figure BDA00039020295300001514
之间的能量比,
Figure BDA00039020295300001515
是子帧边界处的步长的平均能量,
Figure BDA00039020295300001516
是重构信号的临界频带的经低通滤波的能量
Figure BDA00039020295300001517
β∈(0,1]是低通滤波系数,以及Eratio,lim是能量比的上限。
返回图11,在框1107中,处理电路1001将决策变量与阈值进行比较。例如,如上所述,当决策变量是
Figure BDA00039020295300001518
Figure BDA00039020295300001519
之间的能量比时,将能量比与阈值Ethr进行比较。
在框1109中,处理电路1001基于决策变量与阈值的比较将解码器100的输出信号设置为经解码的初级信号或经后置滤波的信号(通过后置滤波形成)。例如,如上所述,在一些实施例中,处理电路1001根据下式比较决策变量:
Figure BDA0003902029530000161
在本发明构思的各种实施例中,阈值能量Ethr可以被设置为值1。
图13中示出了设置输出信号的示例。转向图13,在框1301中,处理电路1001将子帧边界处的步长的平均能量和初级信号的频谱的至少一部分的能量估计之间的能量比与阈值进行比较。
在框1303中,响应于子帧边界处的步长的平均能量与初级信号的频谱的至少一部分的能量估计之间的能量比小于阈值,处理电路1001将输出信号设置为经后置滤波的信号。
在框1305中,响应于子帧边界处的步长的平均能量与初级信号的频谱的至少一部分的能量之间的能量比等于阈值或高于阈值,处理电路1001将输出信号设置为经解码的初级信号。
在本发明构思的一些实施例中,如果能量比在阈值附近徘徊,则可以针对设置经解码的初级信号和经后置滤波的信号之间的输出添加滞后以减少来回切换。
下面讨论示例实施例。
实施例1.一种用于音频解码的方法,其中,对经编码的初级信号进行解码以形成经解码的初级信号,然后对经解码的初级信号进行后置滤波以形成经后置滤波的信号,其中,所述解码器的输出信号是经解码的初级信号和经后置滤波的信号之一,所述方法包括:获得(1101、800)对正由所述解码器重构的初级信号的频谱的至少一部分的能量估计;获得(1103、820)对由经解码的初级信号的后置滤波引起的时域中的不连续性的分析;基于所获得的能量估计和所获得的不连续性的分析来生成(1105、830)决策变量;将所述决策变量与阈值进行比较(1107、850);以及基于所述决策变量与所述阈值的比较,将所述输出信号设置(1109)为所述经解码的初级信号或所述经后置滤波的信号。
实施例2.根据实施例1所述的方法,其中,所述初级信号重构是在频域中进行的。
实施例3.根据实施例2所述的方法,其中,获得所述能量估计包括:在所述频域中对所述频谱的所述至少一部分的能量系数求和。
实施例4.根据实施例3所述的方法,其中,获得所述能量估计包括:根据下式来测量重构信号的临界频带的能量
Figure BDA0003902029530000171
其中,m是帧号,
Figure BDA0003902029530000172
是重构信号的临界频带的能量,
Figure BDA0003902029530000173
是重构信号,并且频率区间限制kstart和kend被设置为与临界频带的频率范围相匹配。
实施例5.根据实施例4所述的方法,还包括:根据下式将低通滤波器应用于所述重构信号的临界频带的能量
Figure BDA0003902029530000174
Figure BDA0003902029530000175
其中,γ∈(0,1]并且是低通滤波系数,取决于修正的离散余弦变换MDCT合成窗口的形状和重叠的长度。
实施例6.根据实施例1至5中任一实施例所述的方法,其中,获得对时域中的不连续性的所述分析包括:测量所述不连续性的大小的平均能量。
实施例7.根据实施例6所述的方法,其中,测量所述不连续性的大小的平均能量包括:根据下式对滤波器差值信号sdiff(m,n)的子帧边界处的步长进行平均
Figure BDA0003902029530000176
其中,m是帧号,i是子帧号,
Figure BDA0003902029530000177
是所述子帧边界处的步长的平均能量,Nsf是子帧数,以及
Figure BDA0003902029530000178
是标记每个子帧的开始的子帧边界的样本索引。
实施例8.根据实施例1至7中任一实施例所述的方法,其中,生成所述决策变量包括:将所述决策变量限制(1201、840)到最大值。
实施例9.根据实施例1至8中任一实施例所述的方法,还包括:对所述决策变量进行低通滤波(1203、840)。
实施例10.根据实施例9所述的方法,其中,生成所述决策变量包括:根据下式来生成所述决策变量
Figure BDA0003902029530000181
Figure BDA0003902029530000182
Figure BDA0003902029530000183
Figure BDA0003902029530000184
其中,m是帧号,
Figure BDA0003902029530000185
Figure BDA0003902029530000186
Figure BDA0003902029530000187
之间的能量比,
Figure BDA0003902029530000188
是子帧边界的步长的平均能量,
Figure BDA0003902029530000189
是重构信号的临界频带的经低通滤波的能量
Figure BDA00039020295300001810
β∈(0,1]是低通滤波系数,以及Eratio,lim是能量比的上限。
实施例11.根据实施例1至10中任一实施例所述的方法,其中,基于所述决策变量与所述阈值的比较将所述输出信号设置为所述经解码的初级信号或所述经后置滤波的信号包括:响应于子帧边界处的步长的平均能量与所述初级信号的频谱的至少一部分的能量估计之间的能量比小于阈值(1301),将所述输出信号设置(1303)为所述经后置滤波的信号;以及响应于子帧边界处的步长的平均能量与所述初级信号的频谱的至少一部分的能量之间的能量比等于所述阈值或高于所述阈值(1301),将所述输出信号设置(1305)为所述经解码的初级信号。
实施例12.根据实施例11所述的方法,还包括:针对所述决策变量与所述阈值的比较提供滞后,以防止在所述能量比在指定时间段内高于和低于所述阈值水平时,所述输出信号在所述初级信号和所述经后置滤波的信号之间来回设置。
实施例13.一种用于音频解码的解码器(100),其中,对初级信号进行解码以形成经解码的初级信号,然后对经解码的初级信号进行后置滤波以形成经后置滤波的信号,其中,所述解码器的输出信号是经解码的初级信号和经后置滤波的信号之一,所述解码器包括:处理电路(1001);以及存储器(1003),与所述处理电路耦接,其中,所述存储器包括指令,所述指令在由所述处理电路执行时使所述解码器执行操作,所述操作包括:获得(1101、800)对正由所述解码器重构的初级信号的频谱的至少一部分的能量估计;获得(1103、820)对由经解码的初级信号的后置滤波引起的时域中的不连续性的分析;基于所获得的能量估计和所获得的不连续性的分析来生成(1105、830)决策变量;将所述决策变量与阈值进行比较(1107、850);以及基于所述决策变量与所述阈值的比较,将所述输出信号设置(1109)为所述经解码的初级信号或所述经后置滤波的信号。
实施例14.根据实施例13所述的解码器,其中,初级信号重构是在频域中进行的。
实施例15.根据实施例14所述的解码器,其中,在获得所述能量估计时,所述存储器包括另外的指令,所述另外的指令在由所述处理电路执行时使所述解码器执行操作,所述操作包括在所述频域中对所述频谱的所述至少一部分的能量系数求和。
实施例16.根据实施例15所述的解码器,其中,在获得所述能量估计时,所述存储器包括另外的指令,所述另外的指令在由所述处理电路执行时使所述解码器执行操作,所述操作包括根据下式来测量重构信号的临界频带的能量
Figure BDA0003902029530000191
其中,m是帧号,
Figure BDA0003902029530000192
是所述重构信号的临界频带的能量,
Figure BDA0003902029530000193
是重构信号,并且频率区间限制kstart和kend被设置为与所述临界频带的频率范围相匹配。
实施例17.根据实施例16所述的解码器,其中,所述存储器包括另外的指令,所述另外的指令在由所述处理电路执行时使所述解码器执行另外的操作,所述另外的操作包括根据下式将低通滤波器应用于所述重构信号的临界频带的能量
Figure BDA0003902029530000194
Figure BDA0003902029530000195
其中,γ∈(0,1]并且是低通滤波系数,取决于修正的离散余弦变换MDCT合成窗口的形状和重叠的长度。
实施例18.根据实施例13至17中任一实施例所述的解码器,其中,在获得对时域中的不连续性的所述分析时,所述存储器包括另外的指令,所述另外的指令在由所述处理电路执行时使所述解码器执行操作,所述操作包括测量所述不连续性的大小的平均能量。
实施例19.根据实施例13至18中任一实施例所述的解码器,其中,在测量所述不连续性的大小的平均能量时,所述存储器包括另外的指令,所述另外的指令在由所述处理电路执行时使所述解码器执行操作,所述操作包括根据下式对滤波器差值信号sdiff(m,n)的子帧边界处的步长进行平均
Figure BDA0003902029530000201
其中,m是帧号,i是子帧号,
Figure BDA0003902029530000202
是所述子帧边界处的步长的平均能量,Nsf是子帧数,以及
Figure BDA0003902029530000203
是标记每个子帧的开始的子帧边界的样本索引。
实施例20.根据实施例13至19中任一实施例所述的解码器,其中,在生成所述决策变量时,所述存储器包括另外的指令,所述另外的指令在由所述处理电路执行时使所述解码器执行操作,所述操作包括将所述决策变量限制(1201、840)到最大值。
实施例21.根据实施例13至20中任一实施例所述的解码器,其中,所述存储器包括另外的指令,所述另外的指令在由所述处理电路执行时使所述解码器执行操作,所述操作包括对所述决策变量进行低通滤波(1203、840)。
实施例22.根据实施例21所述的解码器,其中,在生成所述决策变量时,所述存储器包括另外的指令,所述另外的指令在由所述处理电路执行时使所述解码器执行操作,所述操作包括根据下式生成所述决策变量
Figure BDA0003902029530000204
Figure BDA0003902029530000205
Figure BDA0003902029530000206
Figure BDA0003902029530000211
其中,m是帧号,
Figure BDA0003902029530000212
Figure BDA0003902029530000213
Figure BDA0003902029530000214
之间的能量比,
Figure BDA0003902029530000215
是子帧边界处的步长的平均能量,
Figure BDA0003902029530000216
是所述重构信号的临界频带的经低通滤波的能量
Figure BDA0003902029530000217
β∈(0,1]是低通滤波系数,以及Eratio,lim是所述能量比的上限。
实施例23.根据实施例13至22中任一实施例所述的解码器,其中,在基于所述决策变量与所述阈值的比较将所述输出信号设置为所述初级信号或所述经后置滤波的信号时,所述存储器包括另外的指令,所述另外的指令在由所述处理电路执行时使所述解码器执行操作,所述操作包括:响应于子帧边界处的步长的平均能量与所述初级信号的频谱的至少一部分的能量估计之间的能量比小于阈值(1301),将所述输出信号设置(1303)为所述经后置滤波的信号;以及响应于子帧边界处的步长的平均能量与所述初级信号的频谱的至少一部分的能量之间的能量比等于所述阈值或高于所述阈值(1301),将所述输出信号设置(1305)为所述经解码的初级信号。
实施例24.根据实施例23所述的解码器,其中,所述存储器包括另外的指令,所述另外的指令在由所述处理电路执行时使所述解码器执行另外的操作,所述另外的操作包括:针对所述决策变量与所述阈值的比较提供滞后,以防止当所述能量比在指定时间段内高于和低于所述阈值水平时,所述输出信号在所述初级信号和所述经后置滤波的信号之间来回设置。
实施例25.一种解码器(100),适于执行操作,所述操作包括:获得(1101、800)对初级信号的频谱的至少一部分的能量估计,所述初级信号正由解码器重构以形成经解码的初级信号;获得(1103、820)对由经解码的初级信号的后置滤波引起的时域中的不连续性的分析;基于所获得的能量估计和所获得的不连续性的分析来生成(1105、830)决策变量;将所述决策变量与阈值进行比较(1107、850);以及基于所述决策变量与所述阈值的比较,将所述输出信号设置(1109)为所述经解码的初级信号或所述经后置滤波的信号。
实施例26.根据实施例25所述的解码器(100),其中,所述解码器(100)适于执行根据实施例2至12中任一实施例所述的操作。
实施例27.一种计算机程序,包括要由解码器(100)的处理电路(1001)执行的程序代码,由此所述程序代码的执行使所述解码器(100)执行操作,所述操作包括:获得(1101、800)对初级信号的频谱的至少一部分的能量估计,所述初级信号正由解码器重构以形成经解码的初级信号;获得(1103、820)对由经解码的初级信号的后置滤波引起的时域中的不连续性的分析;基于所获得的能量估计和所获得的不连续性的分析来生成(1105、830)决策变量;将所述决策变量与阈值进行比较(1107、850);以及基于所述决策变量与所述阈值的比较,将所述输出信号设置(1109)为经解码的初级信号或经后置滤波的信号。
实施例28.根据实施例27所述的计算机程序,包括另外的程序代码,由此所述程序代码的执行使所述解码器(100)执行根据实施例2至12中任一实施例所述的操作。
实施例29.一种包括非暂时性存储介质的计算机程序产品,所述非暂时性存储介质包括要由解码器(100)的处理电路(1001)执行的程序代码,由此所述程序代码的执行使所述解码器(100)执行操作,所述操作包括:获得(1101、800)对正由所述解码器重构的初级信号的频谱的至少一部分的能量估计;获得(1103、820)对由所述初级信号的后置滤波引起的时域中的不连续性的分析;基于所获得的能量估计和所获得的不连续性的分析来生成(1105、830)决策变量;将所述决策变量与阈值进行比较(1107、850);以及基于所述决策变量与所述阈值的比较,将所述输出信号设置(1109)为经解码的初级信号或经后置滤波的信号。
实施例30.根据实施例29所述的计算机程序产品,其中,所述非暂时性存储介质包括另外的程序代码,由此所述另外的程序代码的执行使所述解码器(100)执行根据实施例2至12中任一实施例所述的操作。
下面提供了对本公开中使用的各种缩略语/首字母缩写的解释。
缩略语 解释
BPF 低音后置滤波器
DFT 离散傅立叶变换
MDCT 修正的离散余弦变换
EVS 增强语音服务
QMF 正交镜像滤波器组
下面提供了附加说明。
通常,除非明确给出和/或从上下文中暗示不同的含义,否则本文中使用的所有术语将根据其在相关技术领域中的普通含义来解释。除非另有明确说明,否则对“一/一个/元件、设备、组件、装置、步骤等”的所有引用应被开放地解释为指代元件、设备、组件、装置、步骤等中的至少一个实例。除非必须明确地将一个步骤描述为在另一步骤之后或之前和/或隐含地一个步骤必须在另一步骤之后或之前,否则本文所公开的任何方法的步骤不必以所公开的确切顺序执行。在适当的情况下,本文公开的任何实施例的任何特征可以应用于任何其他实施例。同样地,任何实施例的任何优点可以适用于任何其他实施例,反之亦然。通过下文的描述,所附实施例的其他目的、特征和优点将显而易见。
下面讨论进一步的定义和实施例。
在对发明构思的各种实施例的以上描述中,要理解的是,本文使用的术语仅用于描述具体的实施例的目的,而不意图限制发明构思。除非另外定义,否则本文使用的所有术语(包括技术和科学术语)具有发明构思所属领域的普通技术人员通常所理解的相同意义。还应理解,诸如在通用词典中定义的那些术语之类的术语应被解释为具有与它们在本说明书的上下文和相关技术中的意义相一致的意义,而不被解释为理想或过于表面的意义,除非本文如此明确地定义。
当元件被称为相对于另一元件进行“连接”、“耦接”、“响应”或其变化时,它可以直接连接、耦接到或者响应于其它元件,或者可以存在中间元件。相反,当元件被称作相对于另一元件进行“直接连接”、“直接耦接”、“直接响应”或其变化时,不存在中间元件。贯穿全文,类似附图标记表示类似的元件。此外,本文使用的“耦接”、“连接”、“响应”或其变型可以包括无线耦接、连接或响应。如本文使用的,单数形式“一”,“一个”和“所述”意在还包括复数形式,除非上下文明确地给出相反的指示。为了简洁和/或清楚,可能没对公知的功能或结构进行详细描述。术语“和/或”(缩写为“/”)包括一个或多个相关所列项目的任何和所有组合。
将理解的是,虽然本文中可以使用术语第一、第二、第三等来描述各个元件/操作,但是这些元件/操作不应被这些术语限制。这些术语仅用于将一个元件/操作与另一个元件/操作相区分。因此,在一些实施例中的第一元件/操作可以在其他实施例中称作第二元件/操作,而不会脱离本发明构思的教导。贯穿说明书,相同的附图标记或相同的参考符号表示相同或类似的元件。
如本文使用的术语“包括(comprise、comprising、comprises、include、including、includes)”、“具有(have、has、having)”或其变形是开放式的,并且包括一个或多个所陈述的特征、整数、元件、步骤、组件、或功能,但是不排除存在或添加一个或多个其它特征、整数、元件、步骤、组件、功能或其组合。此外,如本文的使用,常用缩写“例如(e.g.)”源于拉丁短语“exempli gratia”,其可以用于介绍或指定之前提到的项目的一个或多个一般示例,而不意在作为该项目的限制。常用缩写“即(i.e.)”源于拉丁短语“idest”,可以用于指定更广义的引述的具体项目。
本文参考计算机实现的方法、装置(系统和/或设备)和/或计算机程序产品的框图和/或流程图图示描述了示例实施例。应理解,可以通过由一个或多个计算机电路执行的计算机程序指令来实现框图和/或流程图图示的框以及框图和/或流程图图示中的框的组合。可以将这些计算机程序指令提供给通用计算机电路、专用计算机电路和/或其它可编程数据处理电路的处理器电路来产生机器,使得经由计算机和/或其它可编程数据处理装置的处理器执行的指令转换和控制晶体管、存储器位置中存储的值、以及这种电路内的其它硬件组件,以实现框图和/或流程图框中指定的功能/动作,并由此创建用于实现框图和/或流程图框中指定的功能/动作的装置(功能体)和/或结构。
这些计算机程序指令也可以存储在有形计算机可读介质中,所述有形计算机可读介质能够指导计算机或其它可编程数据处理装置按照具体的方式作用,使得在计算机可读介质中存储的指令产生制品,所述制品包括实现在所述框图和/或流程图的框中指定的功能/动作的指令。因此,本发明构思的实施例可以在硬件和/或在诸如数字信号处理器之类的处理器上运行的软件(包括固件、驻留软件、微代码等)上实现,所述处理器可以统称为"电路"、"模块"或其变体。
还应注意,在一些备选实现中,在框中标记的功能/动作可以不以流程图中标记的顺序发生。例如,依赖于所涉及的功能/动作,连续示出的两个框实际上可以实质上同时执行,或者框有时候可以按照相反的顺序执行。此外,可以将流程图和/或框图的给定框的功能分成多个框和/或流程图和/或框图的两个或更多个框的功能可以至少部分地被集成。最后,在不脱离发明构思的范围的情况下,可以在所示出的框之间添加/插入其他框,和/或可以省略框/操作。此外,尽管一些图包括通信路径上的箭头以示出通信的主要方向,但是应理解,通信可以在与所描绘的箭头相反的方向上发生。
在基本上不脱离本发明构思原理的前提下,可以对实施例做出许多改变和修改。所有这些改变和修改旨在在本文中被包括在发明构思的范围内。因此,上述主题应理解为示例性的而非限制性的,并且实施例的示例旨在覆盖落入本发明构思的精神和范围之内的所有这些修改、改进和其他实施例。因此,在法律允许的最大范围内,本发明构思的范围应由包括实施例的示例及其等同物的本公开的最宽允许解释来确定,并且不应受限于或限制于之前的具体实施方式。

Claims (30)

1.一种用于音频解码的方法,其中,对经编码的初级信号进行解码以形成经解码的初级信号,然后对所述经解码的初级信号进行后置滤波以形成经后置滤波的信号,其中,所述解码器的输出信号是所述经解码的初级信号和所述经后置滤波的信号之一,所述方法包括:
获得(1101、800)对正由所述解码器重构的初级信号的频谱的至少一部分的能量估计;
获得(1103、820)对由所述经解码的初级信号的后置滤波引起的时域中的不连续性的分析;
基于所获得的能量估计和所获得的不连续性的分析来生成(1105、830)决策变量;
将所述决策变量与阈值进行比较(1107、850);以及
基于所述决策变量与所述阈值的比较,将所述输出信号设置(1109)为所述经解码的初级信号或所述经后置滤波的信号。
2.根据权利要求1所述的方法,其中,初级信号重构是在频域中进行的。
3.根据权利要求2所述的方法,其中,获得所述能量估计包括:在所述频域中对所述频谱的所述至少一部分的能量系数求和。
4.根据权利要求3所述的方法,其中,获得所述能量估计包括:根据下式来测量重构信号的临界频带的能量
Figure FDA0003902029520000011
其中,m是帧号,
Figure FDA0003902029520000012
是重构信号的临界频带的能量,
Figure FDA0003902029520000013
是重构信号,并且频率区间限制kstart和kend被设置为与临界频带的频率范围相匹配。
5.根据权利要求4所述的方法,还包括:根据下式来将低通滤波器应用于所述重构信号的临界频带的能量
Figure FDA0003902029520000014
Figure FDA0003902029520000015
其中,γ∈(0,1]并且是低通滤波系数,取决于修正的离散余弦变换MDCT合成窗口的形状和重叠的长度。
6.根据权利要求1至5中任一项所述的方法,其中,获得对时域中的不连续性的所述分析包括:测量所述不连续性的大小的平均能量。
7.根据权利要求6所述的方法,其中,测量所述不连续性的大小的平均能量包括:根据下式来对滤波器差值信号sdiff(m,n)的子帧边界处的步长进行平均
Figure FDA0003902029520000021
其中,m是帧号,i是子帧号,
Figure FDA0003902029520000022
是所述子帧边界处的步长的平均能量,Nsf是子帧数,以及
Figure FDA0003902029520000023
是标记每个子帧的开始的子帧边界的样本索引。
8.根据权利要求1至7中任一项所述的方法,其中,生成所述决策变量包括:将所述决策变量限制(1201、840)到最大值。
9.根据权利要求1至8中任一项所述的方法,还包括:对所述决策变量进行低通滤波(1203、840)。
10.根据权利要求9所述的方法,其中,生成所述决策变量包括:根据下式来生成所述决策变量
Figure FDA0003902029520000024
Figure FDA0003902029520000025
Figure FDA0003902029520000026
Figure FDA0003902029520000027
其中,m是帧号,
Figure FDA0003902029520000028
Figure FDA0003902029520000029
Figure FDA00039020295200000210
之间的能量比,
Figure FDA00039020295200000211
是子帧边界处的步长的平均能量,
Figure FDA00039020295200000212
是重构信号的临界频带的经低通滤波的能量
Figure FDA00039020295200000213
β∈(0,1]是低通滤波系数,以及Eratio,lim是所述能量比的上限。
11.根据权利要求1至10中任一项所述的方法,其中,基于所述决策变量与所述阈值的比较将所述输出信号设置为所述经解码的初级信号或所述经后置滤波的信号包括:响应于子帧边界处的步长的平均能量与所述初级信号的频谱的至少一部分的能量估计之间的能量比小于阈值(1301),将所述输出信号设置(1303)为所述经后置滤波的信号;以及响应于所述子帧边界处的步长的平均能量与所述初级信号的频谱的至少一部分的能量之间的所述能量比等于所述阈值或高于所述阈值(1301),将所述输出信号设置(1305)为所述经解码的初级信号。
12.根据权利要求11所述的方法,还包括:针对所述决策变量与所述阈值的比较提供滞后,以防止当所述能量比在指定时间段内高于和低于所述阈值水平时,所述输出信号在所述初级信号和所述经后置滤波的信号之间来回设置。
13.一种用于音频解码的解码器(100),其中,对经编码的初级信号进行解码以形成经解码的初级信号,然后对所述经解码的初级信号进行后置滤波以形成经后置滤波的信号,其中,所述解码器的输出信号是所述经解码的初级信号和所述经后置滤波的信号之一,所述解码器包括:处理电路(1001);以及存储器(1003),与所述处理电路耦接,其中,所述存储器包括指令,所述指令在由所述处理电路执行时使所述解码器执行操作,所述操作包括:
获得(1101、800)对正由所述解码器重构的初级信号的频谱的至少一部分的能量估计;
获得(1103、820)对由所述经解码的初级信号的后置滤波引起的时域中的不连续性的分析;
基于所获得的能量估计和所获得的不连续性的分析来生成(1105、830)决策变量;
将所述决策变量与阈值进行比较(1107、850);以及
基于所述决策变量与所述阈值的比较,将所述输出信号设置(1109)为所述经解码的初级信号或所述经后置滤波的信号。
14.根据权利要求13所述的解码器,其中,初级信号重构是在频域中进行的。
15.根据权利要求14所述的解码器,其中,在获得所述能量估计时,所述存储器包括另外的指令,所述另外的指令在由所述处理电路执行时使所述解码器执行操作,所述操作包括在所述频域中对所述频谱的所述至少一部分的能量系数求和。
16.根据权利要求15所述的解码器,其中,在获得所述能量估计时,所述存储器包括另外的指令,所述另外的指令在由所述处理电路执行时使所述解码器执行操作,所述操作包括根据下式来测量重构信号的临界频带的能量
Figure FDA0003902029520000041
其中,m是帧号,
Figure FDA0003902029520000042
是所述重构信号的临界频带的能量,
Figure FDA0003902029520000043
是重构信号,并且频率区间限制kstart和kend被设置为与所述临界频带的频率范围相匹配。
17.根据权利要求16所述的解码器,其中,所述存储器包括另外的指令,所述另外的指令在由所述处理电路执行时使所述解码器执行另外的操作,所述另外的操作包括根据下式来将低通滤波器应用于所述重构信号的临界频带的能量
Figure FDA0003902029520000044
Figure FDA0003902029520000045
其中,γ∈(0,1]并且是低通滤波系数,取决于修正的离散余弦变换MDCT合成窗口的形状和重叠的长度。
18.根据权利要求13至17中任一项所述的解码器,其中,在获得对时域中的不连续性的所述分析时,所述存储器包括另外的指令,所述另外的指令在由所述处理电路执行时使所述解码器执行操作,所述操作包括测量所述不连续性的大小的平均能量。
19.根据权利要求13至18中任一项所述的解码器,其中,在测量所述不连续性的大小的平均能量时,所述存储器包括另外的指令,所述另外的指令在由所述处理电路执行时使所述解码器执行操作,所述操作包括根据下式来对滤波器差值信号sdiff(m,n)的子帧边界处的步长进行平均
Figure FDA0003902029520000046
其中,m是帧号,i是子帧号,
Figure FDA0003902029520000047
是所述子帧边界处的步长的平均能量,Nsf是子帧数,以及
Figure FDA0003902029520000048
是标记每个子帧的开始的子帧边界的样本索引。
20.根据权利要求13至19中任一项所述的解码器,其中,在生成所述决策变量时,所述存储器包括另外的指令,所述另外的指令在由所述处理电路执行时使所述解码器执行操作,所述操作包括将所述决策变量限制(1201、840)到最大值。
21.根据权利要求13至20中任一项所述的解码器,其中,所述存储器包括另外的指令,所述另外的指令在由所述处理电路执行时使所述解码器执行操作,所述操作包括对所述决策变量进行低通滤波(1203、840)。
22.根据权利要求21所述的解码器,其中,在生成所述决策变量时,所述存储器包括另外的指令,所述另外的指令在由所述处理电路执行时使所述解码器执行操作,所述操作包括根据下式来生成所述决策变量
Figure FDA0003902029520000051
Figure FDA0003902029520000052
Figure FDA0003902029520000053
Figure FDA0003902029520000054
其中,m是帧号,
Figure FDA0003902029520000055
Figure FDA0003902029520000056
Figure FDA0003902029520000057
之间的能量比,
Figure FDA0003902029520000058
是子帧边界处的步长的平均能量,
Figure FDA0003902029520000059
是所述重构信号的临界频带的经低通滤波的能量
Figure FDA00039020295200000510
∈(0,1]是低通滤波系数,以及Eratio,lim是所述能量比的上限。
23.根据权利要求13至22中任一项所述的解码器,其中,在基于所述决策变量与所述阈值的比较将所述输出信号设置为所述初级信号或所述经后置滤波的信号时,所述存储器包括另外的指令,所述另外的指令在由所述处理电路执行时使所述解码器执行操作,所述操作包括:响应于子帧边界处的步长的平均能量与所述初级信号的频谱的至少一部分的能量估计之间的能量比小于阈值(1301),将所述输出信号设置(1303)为所述经后置滤波的信号;以及响应于所述子帧边界处的步长的平均能量与所述初级信号的频谱的至少一部分的能量之间的所述能量比等于所述阈值或高于所述阈值(1301),将所述输出信号设置(1305)为所述经解码的初级信号。
24.根据权利要求23所述的解码器,其中,所述存储器包括另外的指令,所述另外的指令在由所述处理电路执行时使所述解码器执行另外的操作,所述另外的操作包括:针对所述决策变量与所述阈值的比较提供滞后,以防止当所述能量比在指定时间段内高于和低于所述阈值水平时,所述输出信号在所述初级信号和所述经后置滤波的信号之间来回设置。
25.一种解码器(100),适于执行操作,所述操作包括:获得(1101、800)对初级信号的频谱的至少一部分的能量估计,所述初级信号正由所述解码器重构以形成经解码的初级信号;获得(1103、820)对由所述经解码的初级信号的后置滤波引起的时域中的不连续性的分析;基于所获得的能量估计和所获得的不连续性的分析来生成(1105、830)决策变量;将所述决策变量与阈值进行比较(1107、850);以及基于所述决策变量与所述阈值的比较,将所述输出信号设置(1109)为所述经解码的初级信号或经后置滤波的信号。
26.根据权利要求25所述的解码器(100),其中,所述解码器(100)适于执行根据权利要求2至12中任一项所述的操作。
27.一种计算机程序,包括要由解码器(100)的处理电路(1001)执行的程序代码,由此所述程序代码的执行使所述解码器(100)执行操作,所述操作包括:获得(1101、800)对初级信号的频谱的至少一部分的能量估计,所述初级信号正由所述解码器重构以形成经解码的初级信号;获得(1103、820)对由所述经解码的初级信号的后置滤波引起的时域中的不连续性的分析;基于所获得的能量估计和所获得的不连续性的分析来生成(1105、830)决策变量;将所述决策变量与阈值进行比较(1107、850);以及基于所述决策变量与所述阈值的比较,将所述输出信号设置(1109)为所述经解码的初级信号或经后置滤波的信号。
28.根据权利要求27所述的计算机程序,包括另外的程序代码,由此所述程序代码的执行使所述解码器(100)执行根据权利要求2至12中任一项所述的操作。
29.一种包括非暂时性存储介质的计算机程序产品,所述非暂时性存储介质包括要由解码器(100)的处理电路(1001)执行的程序代码,由此所述程序代码的执行使所述解码器(100)执行操作,所述操作包括:获得(1101、800)对正由所述解码器重构的初级信号的频谱的至少一部分的能量估计;获得(1103、820)对由所述初级信号的后置滤波引起的时域中的不连续性的分析;基于所获得的能量估计和所获得的不连续性的分析来生成(1105、830)决策变量;将所述决策变量与阈值进行比较(1107、850);以及基于所述决策变量与所述阈值的比较,将所述输出信号设置(1109)为经解码的初级信号或经后置滤波的信号。
30.根据权利要求29所述的计算机程序产品,其中,所述非暂时性存储介质包括另外的程序代码,由此所述另外的程序代码的执行使所述解码器(100)执行根据权利要求2至12中任一项所述的操作。
CN202180030319.7A 2020-04-24 2021-04-23 低音后置滤波器的低成本适配 Pending CN115428069A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202411528150.XA CN119360866A (zh) 2020-04-24 2021-04-23 低音后置滤波器的低成本适配

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063014917P 2020-04-24 2020-04-24
US63/014,917 2020-04-24
PCT/EP2021/060643 WO2021214280A1 (en) 2020-04-24 2021-04-23 Low cost adaptation of bass post-filter

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202411528150.XA Division CN119360866A (zh) 2020-04-24 2021-04-23 低音后置滤波器的低成本适配

Publications (1)

Publication Number Publication Date
CN115428069A true CN115428069A (zh) 2022-12-02

Family

ID=75674835

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202180030319.7A Pending CN115428069A (zh) 2020-04-24 2021-04-23 低音后置滤波器的低成本适配
CN202411528150.XA Pending CN119360866A (zh) 2020-04-24 2021-04-23 低音后置滤波器的低成本适配

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202411528150.XA Pending CN119360866A (zh) 2020-04-24 2021-04-23 低音后置滤波器的低成本适配

Country Status (8)

Country Link
US (1) US20230154479A1 (zh)
EP (2) EP4478357A1 (zh)
JP (2) JP7504216B2 (zh)
CN (2) CN115428069A (zh)
BR (1) BR112022018082A2 (zh)
ES (1) ES2995244T3 (zh)
MX (1) MX2022013100A (zh)
WO (1) WO2021214280A1 (zh)

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3270922B2 (ja) * 1996-09-09 2002-04-02 富士通株式会社 符号化,復号化方法及び符号化,復号化装置
TW376611B (en) * 1998-05-26 1999-12-11 Koninkl Philips Electronics Nv Transmission system with improved speech encoder
EP2115742B1 (en) * 2007-03-02 2012-09-12 Telefonaktiebolaget LM Ericsson (publ) Methods and arrangements in a telecommunications network
EP3079152B1 (en) * 2010-07-02 2018-06-06 Dolby International AB Audio decoding with selective post filtering
US8738385B2 (en) * 2010-10-20 2014-05-27 Broadcom Corporation Pitch-based pre-filtering and post-filtering for compression of audio signals
EP2980796A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for processing an audio signal, audio decoder, and audio encoder
EP2980799A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an audio signal using a harmonic post-filter
CN105118520B (zh) * 2015-07-13 2017-11-10 腾讯科技(深圳)有限公司 一种音频开头爆音的消除方法及装置
KR102420175B1 (ko) * 2016-12-30 2022-07-12 하만 베커 오토모티브 시스템즈 게엠베하 음향 반향 제거

Also Published As

Publication number Publication date
EP4139919B1 (en) 2024-10-30
JP7504216B2 (ja) 2024-06-21
BR112022018082A2 (pt) 2022-11-01
MX2022013100A (es) 2022-12-08
EP4139919A1 (en) 2023-03-01
ES2995244T3 (en) 2025-02-07
EP4478357A1 (en) 2024-12-18
EP4139919C0 (en) 2024-10-30
US20230154479A1 (en) 2023-05-18
CN119360866A (zh) 2025-01-24
JP2023522562A (ja) 2023-05-31
JP2024133490A (ja) 2024-10-02
WO2021214280A1 (en) 2021-10-28

Similar Documents

Publication Publication Date Title
JP7568695B2 (ja) ハーモニックフィルタツールのハーモニック依存制御
US8244526B2 (en) Systems, methods, and apparatus for highband burst suppression
US10262662B2 (en) Audio decoder and method for providing a decoded audio information using an error concealment based on a time domain excitation signal
US9646624B2 (en) Audio encoder, audio decoder, method for providing an encoded audio information, method for providing a decoded audio information, computer program and encoded representation using a signal-adaptive bandwidth extension
CN105264597B (zh) 感知转换音频编码中的噪声填充
US20160379646A1 (en) Audio decoder and method for providing a decoded audio information using an error concealment modifying a time domain excitation signal
JP6271531B2 (ja) デジタル音声信号における効果的なプレエコー減衰
KR20090025349A (ko) 이득 계수 제한을 위한 시스템, 방법 및 장치
US20140288925A1 (en) Bandwidth extension of audio signals
JP5291004B2 (ja) 通信ネットワークにおける方法及び装置
US20180033444A1 (en) Audio encoder and method for encoding an audio signal
CN115428069A (zh) 低音后置滤波器的低成本适配

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination