CN111566733A

CN111566733A - 选择音高滞后

Info

Publication number: CN111566733A
Application number: CN201880085502.5A
Authority: CN
Inventors: 伊曼纽尔·拉维利; 马丁·迪茨; 迈克尔·施纳贝尔; 亚瑟·特瑞萨特; 亚历山大·切卡林斯基
Original assignee: Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Current assignee: Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date: 2017-11-10
Filing date: 2018-11-05
Publication date: 2020-08-21
Anticipated expiration: 2038-11-05
Also published as: EP3483886A1; TWI728277B; PT3707718T; US20200273475A1; TW201923755A; AR114388A1; KR102426050B1; KR20200083565A; PL3707718T3; JP7079325B2; ES2900058T3; BR112020009114A2; US11380341B2; EP3707718A1; EP3707718B1; CA3082175A1; MX2020004786A; SG11202004203WA; JP2021502596A; CA3082175C

Abstract

提出用于选择音高滞后的技术(例如，设备、方法、程序)。一种用于对包括多个帧的信息信号进行编码的设备(10，60a，110)。该设备可包含被配置以获得第一估计值(14，T₁)的第一估计器(11)，该第一估计值为当前帧(13)的音高滞后的估计值。该设备可包含被配置以获得第二估计值(16，T₂)的第二估计器(12)，该第二估计值为当前帧(13)的音高滞后的另一估计值。选择器(17)可被配置以通过基于第一相关性测量值及第二相关性测量值(23，25)在第一估计值(14，T₁)与,第二估计值(16，T₂)之间执行,选择而选择所选值(19，T_best)。

Description

选择音高滞后

在此提供能够执行低复杂度音高检测程序，例如以用于长期后滤波LTPF编码的方法及设备的示例。

例如，示例能够为信息信号，例如音频信号选择音高滞后，例如以用于执行LTPF。

1.1.背景

基于变换的音频编解码器在处理谐波音频信号时，特别地以低延迟及低比特率处理谐波音频信号时，通常引入间谐波噪声。此间谐波噪声通常被感知为非常令人烦恼的伪声，显著降低了基于变换的音频编解码器在主观地评估高音调音频材料时的性能。

长期后滤波(Long Term Post Filtering，LTPF)为有助于减小此间谐波噪声的基于变换的音频编码工具。其依赖于在变换解码之后的应用于时域信号的后滤波器。此后滤波器基本上为无限脉冲响应(infinite impulse response，IIR)滤波器，其中梳状频率响应由两个参数控制：音高滞后及增益。

为了更佳的稳健性，在编码器侧估计后滤波器参数(每帧的音高滞后和/或增益)且当增益非零时将后滤波器参数编码在比特流中。零增益状况以一个比特进行发信号且对应于非主动后滤波器，在信号不含有谐波部分时使用。

首先将LTPF引入3GPP EVS标准[1]中且随后整合至MPEG-H 3D音频标准[2]。对应专利为[3]及[4]。

音高检测算法估计每帧的一个音高滞后。通常在低采样率(例如6.4kHz)下执行该操作以便降低复杂度。其应理想地提供准确、稳定且持续性估计。

当用于LTPF编码时，具有连续音高轮廓是最重要的，否则可在经LTPF滤波的输出信号中听到一些不稳定性伪声。不具有真实基本频率F0(例如通过具有基本频率的倍数)不太重要，由于其并不导致严重伪声，但替代地会引起LTPF性能的略微劣化。

音高检测算法的另一重要特性为其计算复杂度。当实施于以低功率装置或甚至超低功率装置为目标的音频编解码器中时，其计算复杂度应尽可能低。

1.2.现有技术

存在可在公共领域中发现的LTPF编码器的示例。其描述于3GPP EVS标准[1]中。此实施方案使用描述于标准规格的5.1.10节中的音高检测算法。此音高检测算法具有良好性能且与LTPF一起很好地起作用，由于它给出极稳定且连续的音高轮廓。然而，它的主要缺陷为复杂度相对高。

即使其从未用于LTPF编码，其他现有音高检测算法理论上也可用于LTPF。一个示例为YIN[6]，音高检测算法常常被认为是最准确之一。然而，YIN极其复杂，甚至明显复杂于[1]中的算法。

值得提到的另一示例为3GPP AMR-WB标准[7]中所使用的音高检测算法，其复杂度显著低于[1]中的算法，并且性能较差，其特别地给出较不稳定且连续的音高轮廓。

先前技术包含以下公开：

[1]3GPP TS 26.445；Codec for Enhanced Voice Services(EVS)；Detailedalgorithmic description.

[2]ISO/IEC 23008-3:2015；Information technology--High efficiencycoding and media delivery in heterogeneous environments--Part 3:3D audio.

[3]Ravelli et al."Apparatus and method for processing an audio signalusing a harmonic post-filter."U.S.Patent Application No.2017/0140769 A1.2017年5月18.

[4]Markovic et al."Harmonicity-dependent controlling of a harmonicfilter tool."U.S.Patent Application No.2017/0133029 A1.2017年5月11.

[5]ITU-T G.718:Frame error robust narrow-band and wideband embeddedvariable bit-rate coding of speech and audio from 8-32kbit/s.

[6]De Cheveigné,Alain,and Hideki Kawahara."YIN,a fundamentalfrequency estimator for speech and music."The Journal of the AcousticalSociety of America 111.4(2002):1917-1930.

[7]3GPP TS 26.190；Speech codec speech processing functions；AdaptiveMulti-Rate-Wideband(AMR-WB)speech codec；Transcoding functions.

然而，存在应改善音高滞后估计的一些状况。

当前低复杂度音高检测算法(如[7]中的算法)具有对于LTPF，特定地对于复杂信号，如复音音乐而言并不令人满意的性能。音高轮廓可极其不稳定，甚至在不变音期间极其不稳定。这归因于加权自相关函数的局部最大值之间的跳变。

因此，需要获得相较于现有技术更适合于复杂信号，具有相同或更低复杂度的音高滞后估计。

2.发明概要

根据示例，提供一种用于对包括多个帧的信息信号进行编码的设备，该设备包含：

第一估计器，被配置以获得第一估计值，该第一估计值为当前帧的音高滞后的估计值；

第二估计器，被配置以获得第二估计值，该第二估计值为当前帧的音高滞后的另一估计值；

选择器，被配置以通过基于第一相关性测量值及第二相关性测量值在第一估计值与第二估计值之间执行选择而选择所选值；

其中通过在先前帧处选择的音高滞后调节第二估计器以便获得当前帧的第二估计值；

其特征在于选择器被配置以：

在以下两者之间执行比较：

与当前帧相关联且在对应于第一估计值的滞后处获得的第一相关性测量值的缩小版本；及

与当前帧相关联且在对应于第二估计值的滞后处获得的第二相关性测量值，

以便在第二相关性测量值小于第一相关性测量值的缩小版本时选择第一估计值，和/或

在第二相关性测量值大于第一相关性测量值的缩小版本时选择第二估计值，

其中第一相关性测量值与第二相关性测量值中的至少一个为自相关测量值和/或归一化自相关测量值。

根据示例，提供一种用于将包括多个帧的信息信号编码成比特流(63)的设备，该设备(60a)包含：

检测单元，包含：

第二估计器，被配置以获得第二估计值，该第二估计值为当前帧的音高滞后的另一估计值，其中通过在先前帧处选择的音高滞后调节第二估计器以便获得当前帧的第二估计值；

选择器，被配置以通过基于至少一个相关性测量值在第一估计值与第二估计值之间执行选择而选择所选值，其中选择器被配置以在以下两者之间执行比较：

与当前帧相关联且在对应于第二估计值的滞后处获得的第二相关性测量值；及

音高滞后选择阈值，

以便在第二相关性测量值大于音高滞后选择阈值时选择第二估计值；和/或

在第二相关性测量值低于音高滞后选择阈值时选择第一估计值；以及

长期后滤波LTPF工具，被配置以对对于在解码器处执行LTPF是有用的数据进行编码，对于执行LTPF是有用的该数据包括所选值。

第二估计器，被配置以获得第二估计值，该第二估计值为当前帧的音高滞后的另一估计值，

选择器，被配置以通过基于至少一个相关性测量值在该第一估计值与该第二估计值之间执行选择而选择所选值，

其中通过在先前帧处选择的音高滞后调节第二估计器以便获得当前帧的第二估计值。

根据示例，选择器被配置以在以下两者之间执行比较：

音高滞后选择阈值，

在第二相关性测量值低于音高滞后选择阈值时选择第一估计值。

根据示例，选择器被配置以在以下两者之间执行比较：

与当前帧相关联且在对应于第一估计值的滞后处获得的第一相关性测量值；及

以便在第一相关性测量值至少大于第二相关性测量值时选择第一估计值，和/或

在第一相关性测量值至少低于第二相关性测量值时选择第二估计值。

根据示例，选择器被配置以：

在以下两者之间执行比较：

在第二相关性测量值大于第一相关性测量值的缩小版本时选择第二估计值。

根据示例，第一相关性测量值与第二相关性测量值中的至少一个为自相关测量值和/或归一化自相关测量值。

可实施用以生成信息信号或其经处理版本的表示的变换编码器。

根据示例，第二估计器被配置以：

通过在包含针对先前帧选择的音高滞后的第二子区间中搜索使第二相关性函数最大化的滞后而获得第二估计值。

根据示例，第二子区间包含在距针对先前帧选择的音高滞后小于预定义滞后数值阈值的距离内的滞后。

根据示例，第二估计器被配置以：

搜索第二相关性函数值中的最大值以使第二估计值与相关联于第二相关性函数值中的最大值的滞后相关联。

根据示例，第一估计器被配置以：

获得第一估计值作为使与当前帧相关联的第一相关性函数最大化的滞后。

根据示例，第一相关性函数限于第一子区间中的滞后。

根据示例，第一子区间包含大于第二子区间的多个滞后，和/或第二子区间中的滞后中的至少一些包含于第一子区间中。

根据示例，第一估计器被配置以：

在搜索使第一相关性函数最大化的滞后之前使用单调递减加权函数对第一相关性函数的相关性测量值进行加权。

根据示例，第二相关性函数与第一相关性函数中的至少一个为自相关函数和/或归一化自相关函数。

根据示例，第一估计器被配置以通过执行以下操作中的至少一些而获得第一估计值T₁：

R_w(k)＝R(k)w(k)对于k＝k_min..k_max

w(k)为加权函数，k_min及k_max与最小滞后及最大滞后相关联，R为基于信息信号或其经处理版本估计的自相关测量值，且N为帧长度。

根据示例，第二估计器被配置以通过执行以下操作而获得第二估计值T₂：

其中k′_min＝max(k_min，T_prev-δ)，k′_max＝min(k_max，T_prev+δ)，T_prev为先前帧中的所选估计值，且δ为距T_prev的距离，k_min以及k_max与最小滞后及最大滞后相关联。

根据示例，选择器被配置以关于以下执行音高滞后估计值T_curr的选择

其中T₁为第一估计值，T₂为第二估计值，x为信息信号或其经处理版本的值，normcorr(x,N,T)为长度为N的信号x在滞后T处的归一化相关性测量值，α为缩小系数。

根据示例，提供在选择器下游的用于在解码器设备处控制长期后滤波器的长期后滤波LTPF工具。

根据示例，信息信号为音频信号。

根据示例，设备被配置以获得第一相关性测量值作为当前帧的调和性的测量值且获得第二相关性测量值作为限于针对先前帧限定的子区间的当前帧的调和性的测量值。

根据示例，设备被配置以使用相同相关性函数获得第一相关性测量值与第二相关性测量值直至加权函数。

根据示例，设备被配置以获得第一相关性测量值作为直至加权函数的第一估计值的归一化版本。

根据示例，设备被配置以获得第二相关性测量值作为第二估计值的归一化版本。

根据示例，提供一种包含编码器侧及解码器侧的系统，编码器侧如上，解码器侧包含基于由选择器选择的音高滞后估计值控制的长期后滤波工具。

根据示例，提供一种用于确定划分成帧的信号的音高滞后的方法，包含：

对当前帧执行第一估计；

对当前帧执行第二估计；以及

基于至少一个相关性测量值在第一估计处获得的第一估计值与第二估计处获得的第二估计值之间进行选择，

其中基于在先前帧处执行的选择步骤的结果而获得执行第二估计。

根据示例，方法可包含使用用于长期后滤波LTPF的所选滞后。

根据示例，方法可包含使用用于封包丢失隐藏PLC的所选滞后。

对当前帧执行第一估计；

对当前帧执行第二估计；以及

基于相关性测量值在第一估计处获得的第一估计值与第二估计处获得的第二估计值之间进行选择，

其中基于在先前帧处执行的选择步骤的结果而获得执行第二估计，

其特征在于，选择包括在以下两者之间执行比较：

与当前帧相关联且在对应于第一估计值的滞后处获得的第一相关性测量值的缩小版本；和

与当前帧相关联且在对应于第二估计值的滞后处获得的第二相关性测量值；以及

在第二相关性测量值小于第一相关性测量值的缩小版本时选择第一估计值，和/或在第二相关性测量值大于第一相关性测量值的缩小版本时选择第二估计值，

根据示例，提供一种用于对划分成帧的信号的比特流进行编码的方法，包含：

对当前帧执行第一估计；

对当前帧执行第二估计；以及

其中选择包括在以下两者之间执行比较：

与当前帧相关联且在对应于第二估计值的滞后处获得的第二相关性测量值；和

音高滞后选择阈值，

在第二相关性测量值大于音高滞后选择阈值时选择第二估计值和/或在第二相关性测量值低于音高滞后选择阈值时选择第一估计值；且

方法进一步包含对对于在解码器处执行LTPF是有用的数据，所选值进行编码。

根据示例，提供一种包含指令的程序，指令在由处理器执行时致使该处理器执行以上或以下方法中的任一个。

3.附图说明

图1a及2展示根据示例的设备。

图1b展示根据示例的方法。

图3及4展示根据示例的方法。

图5及5(1)至5(4)展示相关性函数的图式。

图6展示根据本发明的系统。

图7及8展示根据本发明的设备。

图9展示在解码器处的操作的示例。

5.选择和估计的示例

公开了例如用于LTPF编码和/或解码的低复杂度音高检测程序、系统及设备的示例。

信息信号可在时域TD中描述为在不同离散时刻(n)获取的一连串样本(例如，x(n))。TD表示可包含多个帧，每个与多个样本相关联。帧可一个接一个地顺次可见，使得当前帧暂时在随后帧之前且暂时在先前帧之后。可以迭代地进行操作，使得对当前帧重复进行对先前帧执行的操作。

在与当前帧相关联的迭代期间，可以至少执行一些操作(例如，第二估计值)，其通过在与先前帧相关联的先前迭代处执行的选择而得以调节。因此，考虑先前帧处的信号的历史，例如以用于选择由解码器使用的音高滞后以供执行长期后滤波(LTPF)。

5.1根据示例的通用结构和函数

图1a展示用于编码信息信号的设备10的一部分。设备10可包含第一估计器11，第一估计器11被配置以执行第一估计过程以获得当前帧13的第一估计值14(T₁)。设备10可包含第二估计器12，第二估计器12被配置以执行第二估计过程以获得当前帧13de第二估计值16(T₂)。设备10可包含选择器17，选择器17被配置以基于至少一个相关性测量值在第一估计值14与第二估计值16之间执行选择18(通过元件17控制由开关17a表示的元件)。输出(最终)估计值19(T_best)在第一估计值14与第二估计值16之间进行选择且可被例如提供至解码器，例如以用于执行LTPF。输出(最终)估计值19将用作音高滞后以用于LTPF。

最终估计值(所选值)19也可被输入至寄存器19'且在对随后帧执行迭代时作为第二估计器12的关于先前操作的选择的输入19”(T_prev)。对于每个帧13，第二估计器12基于先前帧的先前最终估计值19”而获得第二估计值16。

图1b展示用于划分成帧的信号的方法100(例如，用于确定待用于LPTF的最终音高滞后)。该方法包含在步骤S101处对当前帧执行第一估计(音高滞后估计)。该方法包含在步骤S102处对当前帧执行第二估计，该第二估计基于在先前帧处操作的选择(例如，在先前帧处选择用于LTPF的最终音高滞后)。该方法包含在步骤S103处基于至少一个相关性测量值在第一估计值14与第二估计值16之间进行选择。

随后，在步骤S104处，更新帧：作为“当前帧”的帧变为“先前帧”，而新(随后)帧变为新“当前帧”。在更新之后，可迭代该方法。

图2展示用于编码信息信号的设备10(其可与图1a的设备相同)的一部分。在选择器17中，第一测量器21可测量与当前帧13相关联的第一相关性(例如，归一化相关性)23(例如，第一估计值T₁的归一化自相关)。第二测量器22可测量与当前帧13相关联的第二相关性(例如，归一化相关性)25(例如，第二估计值T₂的归一化自相关)。第一归一化相关性23可在缩放器26处缩小预定值α，预定值α可例如为0.8与0.9之间的值，更特别地为0.84与0.86之间的值，且其可为0.85。与当前帧13相关联的第二相关性(例如，归一化相关性)25可例如与经缩放的第一相关性24相比较(在示例中，缩放器26为可选的且第一相关性未经缩放)。在第一估计值14(T₁)与第二估计值16(T₂)之间的选择18基于在比较器27处执行的比较。当第二相关性25大于经缩放的第一相关性24时，第二估计值16被选为音高滞后信息作为所选输出估计值19(T_best＝T₂)以提供至解码器(例如，用作用于LTPF的音高滞后)。当第二相关性25低于经缩放的第一相关性24时，第一估计值14(T₁)被选为音高滞后信息19(T_best＝T₁)以提供至解码器。

5.2第一估计

在此论述在示例中可用于基于当前帧13提供第一估计值14的第一估计器11的操作。方法30展示在图3中。

步骤1.重采样第一阶段(步骤S31)

采样率F下的输入信号x(n)经重采样至较低采样率F₁(例如F₁＝12.8kHz)。可使用例如典型升采样+低通+降采样方法来实施重采样。在一些示例中，当前步骤为可选的。

步骤2.高通滤波(步骤S21)

接着使用例如在50Hz下以3dB截止的2阶IIR滤波器对经重采样的信号进行高通滤波。所得信号被标记为x₁(n)。当前步骤在一些示例中为可选的。

步骤3.重采样第2阶段(步骤S33)

使用例如被抽选器跟随的4阶FIR低通滤波器进一步对信号x₁(n)降采样2倍。在采样率F₂＝F₁/2(例如F₂＝6.4kHz)下的所得信号被标记为x₂(n)。当前步骤在一些示例中为可选的。

步骤4.自相关计算(步骤S34)

可执行自相关过程。例如，自相关可通过下式施加于x₂(n)

其中N为帧大小。T_min及T_max为用于取得音高滞后的最小值及最大值(例如T_min＝32及T_max＝228)。T_min及T_max可因此构成其中将发现第一估计值(当前帧的音高滞后)的第一区间的极限值。

步骤5.自相关加权(步骤S35)

可对自相关进行加权以便强调较低音高滞后

R_w(T)＝R(T)w(T)，T＝T_min，...，T_max

其中w(T)为递减函数(例如，单调递减函数)，例如通过下式给定

步骤6.第一估计(步骤S36)

第一估计值T₁为使加权自相关最大化的值：

第一估计值T₁可提供作为第一估计器11的输出14。此可为当前帧的音高滞后的估计值。

R(T)(或其加权版本R_w(T))为第一相关性函数的示例，其最大值与第一音高滞后估计值14(T₁)相关联。

5.3第二估计

在此论述在示例中可用于基于当前帧13及先前选择(输出)的估计值19”(针对先前帧获得的音高滞后)提供第二估计值16的第二估计器12的操作(和/或步骤S102)。方法40展示在图4中。第二估计值16可不同于第一估计值14。另外，所估计音高滞后在一些示例中可不同于如先前估计的音高滞后。

参考图5，根据示例，在步骤S41处，搜索限于滞后的所限群组，滞后的所限群组在特定第二子区间52内。搜索基于对应于(先前)所选值19”的滞后51。搜索限于第二子区间52中的滞后，其在值δ内(可例如选自2、3、4、5、6、7、8、9、10或另一正自然数中；在一些示例中，δ可为帧长度的百分比，使得若帧具有N个样本，则δ为N的1％与30％，特别地15％与25％之间的百分比)。δ可为预定义滞后数值阈值或预定百分比。

根据示例，在步骤S42处，例如通过第二测量器22计算出子区间52内的自相关值。

根据示例，在步骤S42处，取得自相关结果中的最大值。第二估计值T₂为以先前所选值19”居中的第二子区间内的滞后中的使当前帧的音高滞后的邻域中的自相关最大化的值例如：

其中T_prev为如先前(通过选择器17)所选的最终音高滞后51(19”)且δ为限定子区间52的常数(例如δ＝4)。值T₂可提供作为第二估计器12的输出16。

值得注意地，第一估计值14与第二估计值16可明显地彼此不同。

R(T)(其域在此限于T_prev-δ与T_prev+δ之间)为第二相关性函数的示例，其最大值与第二音高滞后估计值16(T₂)相关联。

5.4第一与第二相关性测量值

第一测量器21和/或第二测量器22可执行相关性测量。第一测量器21和/或第二测量器22可执行自相关测量。相关性和/或自相关测量值可被归一化。在此提供示例。

normcorr(T)可为信号x在音高滞后T处的归一化相关性

因此，第一相关性测量值23可为normcorr(T₁)，其中T₁为第一估计值14，且第二相关性测量值25可为normcorr(T₂)，其中T₂为第二估计值16。

值得注意地，第一相关性测量值23为R(T₁)(或R_w(T₁))的归一化值，而第二相关性测量值25为R(T₂)的归一化值。

5.5与阈值的比较

现在可以给出如何比较相关性以用于执行选择的示例。由下式提供示例：

αnormcorr(T₁)可被视为音高滞后选择阈值24：若normcorr(T₂)≤αnormcorr(T₁)，则选择器选择T₁，否则选择器选择T₂。值T_best(或与其相关联的信息)可因此为所选输出值19(如T₁或T₂)且被提供至解码器(例如，用于LTPF)且将由第二估计器12用作19”以用于获得第二估计值16。

5.6方法40

与方法30相关联的方法40相对于仅基于方法30的技术提高性能。

在额外低复杂度情况下，可以通过使音高轮廓更稳定及连续而明显改良性能。

方法40发现自相关函数的第二最大值。其并非如方法30中的全局最大值，而是先前帧的音高滞后的邻域中的局部最大值。若选择此第二音高滞后，则产生平滑且连续的音高轮廓。然而，在所有状况下均未选择此第二音高滞后。若例如存在基本频率的预期改变，则较佳地保持全局最大值。

最终选择为选择以方法30发现的第一音高滞后T₁(14)还是以方法40发现的第二音高滞后T₂(16)。此决策基于周期性的测量。选择归一化相关性作为周期性的测量。若信号完美地为周期性，则其为1，且若信号为非周期性，则其为0。若其对应的归一化相关性高于以参数α缩放的第一音高滞后T₁的归一化相关性，则选择第二音高滞后T₂。甚至在其归一化相关性略微低于第一音高滞后T₁(14)的归一化相关性时，通过选择T₂(16)，此参数α<1使决策甚至更流畅。

5.7对技术的考虑

参考附图5(1)-5(4)。

第一估计的示例展示在图5(1)中：选择对应于自相关函数的最大值的音高滞后。

这基于以下事实：谐波信号(具有某一给定音高)的自相关性包含音高滞后及此音高滞后的所有倍数的位置处的峰值。

为了避免选择对应于音高滞后的倍数的峰值，对自相关性函数进行加权，如在图5(2)中，不太强调较高音高滞后。此例如用于[7]中。

接着假定加权自相关的全局最大值对应于信号的音高滞后。

一般而言，所采取的第一估计令人满意地起作用：其在极大部分帧中给出正确的音高。

若自相关函数(第一子区间)的滞后的数目相对低，则第一估计也具有复杂度相对低得优点。

图5(1)展示输入信号的(未经加权的)自相关。

存在五个峰值：第一峰值53对应于音高滞后，且其他峰值对应于此音高滞后的倍数53'。

采用(未经加权的)自相关的全局最大值在此状况下将给出错误的音高滞后：将选择音高滞后的倍数，在此状况下为正确的音高滞后的4倍。

然而，加权自相关(图5(2))的全局最大值为正确的音高滞后。

第一估计在若干状况下起作用。然而，存在产生不稳定估计值的一些状况。

此等状况中的一个为包含具有不同音高的若干音调的混合的复音音乐信号。在此状况下，难以从多音高信号提取单个音高。第一估计器11可在该状况下在一个帧中估计音调中的一个的音高(或甚至可为其倍数)，且在下一帧中有可能估计另一音调的音高(或其倍数)。因此即使信号稳定(不同音调的音高从一个帧至下一帧并不改变)，通过第一估计检测到的音高也可不稳定(音高从一个帧至下一帧明显地发生改变)。

此不稳定行为为LTPF的主要问题。当音高用于LTPF时，具有连续音高轮廓为最重要的，否则可在LTPF滤波输出信号中听到一些伪声。

图5(3)及5(4)说明此问题。

图5(3)展示加权自相关及其在稳定多音高信号的帧中的最大值。正确地在”20”处取得音高滞后”19”，与峰值54一致。

图5(4)展示加权自相关及其在随后帧中的最大值。

在此状况下，前三个峰值54'、54”及54”'具有非常接近的振幅。因此，两个连续帧之间的极略微改变可明显地改变全局最大值及所估计的音高滞后。

在本发明中所采用的解决方案解决了此等不稳定性问题。

除与帧中的峰值相关联的音高滞后以外，当前解决方案选择接近于先前帧的音高滞后的音高滞后。

例如，图5(3)对应于先前帧且图5(4)对应于当前帧。意欲验证是否较佳地在当前帧中选择约20的音高滞后(即，先前帧的音高滞后19”或T_prev)而非如由第一估计器11给定的40的音高滞后。

为了这样做，通过在先前帧的音高滞后的子区间52(T_prev-δ,T_prev+δ)周围估计使自相关函数最大化的第二音高滞后T₂而执行第二估计(例如，由第二估计器12)。在图5(4)的状况下，此第二音高滞后T₂将为20(第一音高滞后为40)。(即使在此状况下T₂＝T_prev，此并非产生规则。一般而言，T_prev-δ≤T₂≤T_prev+δ)。值得注意地，在示例中，为了估计T₂，自相关未经加权。

然而，并不想要在所有状况下选择此第二音高滞后T₂。想要基于某一准则选择第一音高滞后T₁或第二音高滞后T₂。此准则基于归一化相关性(normalized correlation，NC)，例如如由选择器17所测量，其通常被视为信号在某一特定音高滞后处的周期性如何的良好测量(为0的NC意味着根本不具有周期性，为1的NC意味着完美地具有周期性)。

接着存在以下若干状况：

-若第二估计值T₂的NC高于第一估计值T₁的NC：可确定第二估计值T₂相较于第一估计值T₁较佳，由于第二估计值T₂具有较佳NC且其产生稳定决策(先前帧的音高与当前帧的音高非常接近)，因此可安全地对其进行选择。

-若第二估计值T₂的NC比第一估计值的NC低得多：此指示先前帧的音高19”并不对应于当前帧中的任何周期性，信号不稳定且音高已改变，因此保持先前帧的音高19”且试图产生稳定决策没有意义。在该状况下，忽略第二估计值T₂且选择第一估计值T₁。

-若第二估计值T₂的NC略微低于第一估计值T₁的NC：两个估计值T₁及T₂的NC接近且在该状况下将偏好选择产生稳定决策的估计值(即，第二估计值T₂)，即使它具有略微较差的NC。参数α(α<1)用于以下状况：允许选择第二估计值T₂，即使它具有略微较低的NC。此参数α的调谐允许将选择朝向第一估计值T₁或第二估计值T₂偏置：较低值意味着将更常选择的第二估计值(＝决策将更稳定)。0.85(或0.8与0.9之间的值)为良好平衡点：其足够经常地选择第二估计值T₂，使得决策对于LTPF足够稳定。

除第一估计外提供的额外步骤(第二估计及选择)具有非常低的复杂度。因此，所提出发明具有低复杂度。

6.编码/解码系统的示例

图6展示关于用于编码/解码的操作的区块图。图展示包含编码器60a(其可包含设备10)及解码器60b的系统60。编码器60a获得输入信息信号61(其可为音频信号和/或可在帧，诸如当前帧13及先前帧之间进行划分)且准备比特流63。解码器60b获得比特流63(例如，以无线方式，例如使用蓝芽)以产生输出信号68(例如，音频信号)。

编码器60a可使用变换编码器62产生信息信号61(或其经处理版本)的频域表示63a且在比特流63中提供至解码器60b。解码器60b可包含变换解码器以用于获得输出信号64a。

编码器60a可使用检测单元65产生对于在解码器60b处执行LTPF有用的数据。这些数据可包含音高滞后估计值(例如，19)和/或增益信息。这些数据可在比特流63中经编码作为控制字段中的数据63b。数据63b(其可包含音高滞后的最终估计值19)可由LTPF编码器66(其在一些示例中可决定是否对数据63b进行编码)准备。这些数据可由LTPF解码器67使用，LTPF解码器可将其应用于来自变换解码器64的输出信号64a以获得输出信号68。

7.例如用于LTPF的示例

7.1编码器处的参数(例如，LTPF参数)

在此提供LTPF参数(或其他类型的参数)的计算的示例。

在以下小节中提供准备用于LTPF的信息的示例。

7.2重采样

在此论述(可选的)重采样技术的示例(可使用其他技术)。

采样率f_s下的输入信号可经重采样至12.8kHz的固定采样率。使用可如下公式化的升采样+低通滤波+降采样方法执行重采样

其中

指示交易值(向下舍入为整数)，x(n)为输入信号，x_12.8(n)为12.8kHz下的重采样信号，

为升采样因子且h_6.4为由下式给定的FIR低通滤波器的脉冲回应

在下表中提供tab_resamp_filter的示例：

7.2.2.高通滤波

在此论述(可选的)高通滤波器技术的示例(可使用其他技术)。

可使用2阶IIR滤波器对重采样信号进行高通滤波，2阶IIR滤波器的转移函数可由下式给定

7.2.3.音高检测

在此论述音高检测技术的示例(可使用其他技术)。

可(可选地)使用下式以2倍降采样信号x_12.8(n)

其中h₂＝{0.1236796411180537,0.2353512128364889,0.2819382920909148,0.2353512128364889,0.1236796411180537}。

可通过下式计算出x_6.4(n)的自相关性

其中k_min＝17且k_max＝114为限定第一子区间的最小及最大滞后(可提供k_min及k_max的其他值)。

可使用下式对自相关性进行加权

其中w(k)被限定如下

音高滞后T₁的第一估计值14可为使加权自相关性最大化的滞后

音高滞后T₂的第二估计值16可为先前帧中所估计的音高滞后(19”)的邻域中的使未经加权自相关性最大化的滞后

其中k′_min＝max(k_min,T_prev-4)，k′_max＝min(k_max,T_prev+4)且T_prev为先前帧中估计的最终音高滞后(且其选择因此通过先前选择的音高滞后调节)。

当前帧13中的音高滞后的最终估计值19可接着由下式给定

其中normcorr(x,L,T)为在滞后T处的长度为L的信号x的归一化相关性

每个归一化相关性23或25可为由信号第一测量器21或第二测量器22获得的测量值中的至少一个。

7.2.4.LTPF比特流

在一些示例中，LTPF比特流的第一比特发信号通知音高滞后参数在比特流中的存在。其通过下式获得

(替代0.6，例如可使用不同阈值，例如0.4与0.8之间，或0.5与0.7之间，或0.55与0.65之间的阈值。)

若pitch_present为0，则不再对比特进行编码，从而产生仅一个比特的LTPF比特流。

若pitch_present为1，则对两个更多参数进行编码，一个音高滞后参数以9个比特进行编码，且一个比特用以发信号通知LTPF的激活。在该状况下，LTPF比特流由11个比特构成。

7.2.5.LTPF音高滞后参数

在此论述用于获得LTPF音高滞后参数的示例(可使用其他技术)。

LTPF音高滞后参数的整数部分可由下式给定

其中

以及k″_min＝max(32，2T_curr-4)，k″_max＝min(228，2T_curr+4)。

LTPF音高滞后的分数部分可接着由下式给定

其中

且h₄为FIR低通滤波器的脉冲回应，由下式给定

tab_ltpf_interp_R可例如为：

若pitch_fr＜0，则pitch_int及pitch_fr两者根据下式修改

pitch_int＝pitch_int-1

pitch_fr＝pitch_fr+4

最后，音高滞后参数索引由下式给定

7.2.6.LTPF激活比特

归一化相关性首先计算如下

其中

且h_i为FIR低通滤波器的脉冲回应，由下式给定

其中tab_ltpf_interp_x12k8由以下给定：

LTPF激活比特接着根据以下设定：

其中mem_ltpf_active为先前帧中的ltpf_active的值(若先前帧中的pitch_present＝0，则其为0)，mem_nc为先前帧中的nc的值(若先前帧中的pitch_present＝0，则其为0)，pitch＝pitch_int+pitch_fr/4及mem_pitch为先前帧中的音高的值(若先前帧中的pitch_present＝0，则其为0)。

7.3解码器处的LTPF

例如在修改离散余弦变换(Modified Discrete Cosine Transformation，MDCT)合成、修改离散正弦变换(Modified Discrete Sine Transformation，MDST)合成或基于另一变换的合成之后的频域(FD)中的经解码信号可在时域中使用IIR滤波器而被后滤波，IIR滤波器的参数可取决于LTPF比特流数据“pitch_index”及“ltpf_active”。为了在参数从一个帧到下一帧发生改变时避免不连续性，过渡机制可施加于当前帧的前四分之一。

在示例中，可使用下式实施LTPF IIR滤波器

其中

为滤波器输入信号(即在MDCT合成之后的经解码信号)且

为滤波器输出信号。

LTPF音高滞后的整数部分p_int及分数部分p_fr可计算如下。首先，12.8kHz下的音高滞后使用下式恢复

接着使用下式将音高滞后缩放至输出采样率fs且转化成整数及分数部分

p_fr＝p_up-4*p_int

其中f_s为采样率。

滤波器系数c_num(k)及c_den(k，p_fr)可计算如下

c_num(k)＝0.85*gain_ltpf*tab_ltpf_num_fs[gain_ind][k]对于k＝0..L_num

c_den(k，p_fr)＝gain_ltpf*tab_ltpf_den_fs[p_fr][k]对于k＝0..L_den

其中

L_num＝L_den-2

且gain_ltpf及gain_ind可根据以下获得

且表tab_ltpf_num_fs[gain_ind][k]及tab_ltpf_den_fs[p_fr][k]是预定的。

在此提供tab_ltpf_num_fs[gain_ind][k]的示例(替代”fs”，指示采样率)：

在此提供tab_ltpf_den_fs[p_fr][k]的示例(替代”fs”，指示采样率)：

参看过渡处理，考虑五个不同状况。

第一状况：ltpf_active＝0且mem_ltpf_active＝0

第二状况：ltpf_active＝1且mem_ltpf_active＝0

对于

第三状况：ltpf_active＝0且mem_ltpf_active＝1

对于

其中

以及

为先前帧中计算出的滤波器参数。

第四状况：ltpf_active＝1且mem_ltpf_active＝1且

且

对于

第五状况：ltpf_active＝1且mem_ltpf_active＝1且(

或

)

对于

对于

其中N_f为一个帧中的样本的数目。

7.4其他优点

如可理解，根据上述示例的解决方案对解码器是透明的。不需要发信号通知解码器，例如通知第一估计值或第二估计值已被选择。

因此，比特流63中不存在增大的有效载荷。

另外，不需要修改解码器来适应于在编码器处所执行的新过程。解码器并不需要知晓已经实施本发明。因此，本发明准许提高与传统系统的兼容性。

8.封包丢失隐藏

可在解码器(例如，60b)处使用如由上述设备10、60a或110获得的音高滞后T_best(19)以用于实施封包丢失隐藏(packet loss concealment，PLC)(也被称作错误隐藏)。PLC在音频编解码器中在从编码器至解码器的传输期间用于隐藏丢失或损坏的封包。在现有技术中，PLC可在解码器侧执行且将经解码信号外插于变换域或时域中。

音高滞后可为用于基于音高的PLC中的主要参数。此参数可在编码器侧被估计且被编码成比特流。在此状况下，最后的良好帧的音高滞后用来隐藏当前丢失帧。

损坏的帧并不提供正确的可听输出且应舍弃。

对于解码器处的每个经解码帧，可验证其有效性。例如，每个帧可具有携载循环冗余代码(cyclical redundancy code，CRC)的字段，通过执行由预定算法提供的预定操作而验证循环冗余代码。可重复程序以验证计算出的结果是否对应于CRC字段上的值。若帧尚未被适当地解码(例如，鉴于传输中的干扰)，则假定一些误差已影响了帧。因此，若验证提供不正确解码的结果，则帧保持未被适当地解码(无效、损坏的)。

当帧已被确认为未被适当地解码时，隐藏策略可用于提供可听输出：否则，可听到如令人恼怒的可听孔洞的事物。因此，有必要找到“填充由未被适当地解码的帧保持打开的间隙”的某形式的帧。帧丢失隐藏程序的目的为隐藏任何不可用或损坏的帧对于解码的效应。

8.1隐藏策略

帧丢失隐藏程序可包含用于各种信号类型的隐藏方法。可通过选择最合适的方法而获得在帧丢失的易错情形中的最佳可能的编解码器性能。封包丢失隐藏方法中的一个可例如为TCX时域隐藏。

8.2 TCX时域隐藏

TCX时域隐藏方法为在时域中操作的基于音高的PLC技术。其最适合于具有主谐波结构的信号。程序的示例如下：利用如章节8.2.1中所描述的LP滤波器对最后的经解码帧的合成信号进行反滤波以获得如章节8.2.2中所描述的周期性信号。在章节8.2.3中，随机信号由随机生成器生成，具有大致均匀分布。两个激励信号加总以形成总激励信号，如章节8.2.4中所描述，其自适应地以章节8.2.6中所描述的衰减因子而渐弱且最后利用LP滤波器滤波以获得合成的隐藏时间信号。若LTPF已经用于最后的良好帧中，则LTPF也可施加于合成的隐藏时间信号，如章节8.3中所描述。为了得到与在丢失帧之后的第一良好帧的适当重叠，在章节8.2.5中产生时域混叠消除信号。

8.2.1 LPC参数计算

TCX时域隐藏方法在激励域中操作。可对80个等距频域频带计算自相关函数。利用固定预加重因子μ来预加重能量

f<sub>s</sub>	μ
		8000	0.62
16000	0.72
		24000	0.82
32000	0.92
		48000	0.92

在使用反向均匀堆叠DFT将自相关函数变换至时域之前，使用以下窗口对自相关函数进行滞后加窗

最后，Levinson Durbin操作可用于获得用于隐藏帧的LP滤波器a_c(k)。示例提供如下：

LP滤波器可仅在良好帧之后的第一丢失帧中进行计算且保留在随后的丢失帧中。

8.2.2激励的周期性部分的构造

首先使用滤波器利用来自章节8.2.1的预加重因子对最后的

经解码时间样本进行预加重

H_pre-emph(z)＝1-μz^-1

以获得信号x_pre(k)，其中Tc为音高滞后值pitch_int或若pitch_fr＞0，为pitch_int+1。值pitch_int及pitch_fr为比特流中传输的音高滞后值。

预加重信号x_pre(k)进一步利用计算出的反LP滤波器进行滤波以获得先前的激励信号exc′_p(k)。为了构造激励信号exc_p(k)，对于当前丢失帧，利用Tc反复复制exc′_p(k)如下

exc_p(k)＝exc′_p(E-T_c+k)，对于k＝0..N-1

其中E对应于exc′_p(k)中的最后一个样本。若稳定性因子θ低于1，则exc′_p(k)的第一音高循环首先利用下表中描述的11分接头线性相位有限脉冲响应(finite impulseresponse，FIR)滤波器进行低通滤波。

音高增益g′_p可计算如下

若pitch_fr＝0，则g_p＝g′_p。否则，第二音高增益g″_p可计算如下

且g_p＝max(g′_p,g″_p)。若g″_p＞g′_p，则T_c减小一以供进一步处理。

最后，g_p以0≤g_p≤1为界。

所形成周期性激励exc_p(k)始于一且结束于衰减因子α地在整个帧中逐样本地减弱，以获得

音高增益仅在良好帧之后的第一丢失帧中进行计算且被设定为α以用于进一步连续帧丢失。

8.2.3激励的随机部分的构造

激励的随机部分可利用随机生成器以大致均匀分布生成如下：

exc_n，FB(k)＝extract(exc_n，FB(k-1)·12821+16831)，对于k＝0...N-1

其中对于利用此方法隐藏的第一帧，exc_n,FB(-1)以24607初始化，且extract()提取值的16LSB。对于其他帧，exc_n,FB(N-1)被储存且用作下一个exc_n,FB(-1)。

为了将噪声移位至较高频率，利用下表中描述的11分接头线性相位FIR滤波器对激励信号进行高通滤波，以得到exc_n,HP(k)。

为了确保噪声可以以取决于衰减因子α地衰落速度衰落为全频带噪声，激励的随机部分exc_n(k)经由在全频带exc_n,FB(k)与经高通滤波版本exc_n,HP(k)之间的线性内插构成，如

exc_n(k)＝(1-β)·exc_n，FB(k)+β·exc_n，HP(k)，对于k＝0...N-1

其中对于良好帧之后的第一丢失帧，β＝1，且

β＝β_-1·α

对于第二及进一步连续帧丢失，其中β_-1为先前隐藏帧的β。

为了调整噪声级，噪声增益g′_n经计算为

若在章节8.2.2之后T_c＝pitch_int，则g_n＝g′_n。否则，第二噪声增益g″_n如上述等式中所计算，但T_c为pitch_int。在下文中，g_n＝min(g′_n,g″_n)。

为了进一步处理，g_n首先被归一化且接着乘以(1.1-0.75g_p)以得到

所形成随机激励exc_n(k)以

从第一样本至第五样本均匀衰减，且随后始于

且结束于

在整个帧中逐样本地衰减，以获得

噪声增益g_n仅在良好帧之后的第一丢失帧中进行计算且被设定为g_n·α以用于进一步连续帧丢失。

8.2.4总激励、合成及后处理的构造

将随机激励

添加至周期性激励

以形成总激励信号exc_t(k)。通过利用来自章节8.2.1的LP滤波器对总激励进行滤波而获得隐藏帧的最终合成信号且利用去加重滤波器对其进行后处理。

8.2.5时域混叠消除

为了在下一帧为良好帧状况下得到适当重叠-添加，可产生时域混叠消除部分x_TDAC(k)。为此，形成与上文所描述相同的N-Z额外样本以获得信号x(k)，k＝0…2N-Z。基于此，通过以下步骤形成时域混叠消除部分：

零填充合成时域缓冲区x(k)

利用MDCT窗口w_N(k)对

进行加窗

从2N重整形为N

从N重整形为2N

利用翻转修改离散余弦变换(MDCT)(或修改离散正弦变换MDST，在其他示例中)窗口w_N(k)对

进行加窗

8.2.6多个帧丢失的处理

所构造信号逐渐衰落为零。通过衰减因子α控制衰落速度，该衰减因子取决于先前衰减因子α_-1、基于最后一个正确接收的帧计算出的音高增益g_p、连续被抹除帧的数目nbLostCmpt，以及稳定性θ。以下程序可用于计算衰减因子α

可获得因子θ(最后两个邻近缩放因子向量scf_-2(k)及scf_-1(k)的稳定性)，例如为：

其中scf_-2(k)及scf_-1(k)为最后两个邻近帧的缩放因子向量。因子θ以0≤θ≤1为界，其中θ的较大值对应于更稳定信号。此限制能量及频谱包络波动。若当前不存在两个邻近缩放因子向量，则因子θ被设定为0.8。

为了防止高速能量增大，利用X_s(0)＝X_s(0)·0.2及X_s(1)＝X_s(1)·0.5对频谱进行低通滤波。

9.具有相同音高滞后信息的LTPF及PLC

图9展示可用于操作解码器60b的方法100'的通用示例。在步骤S101'处，信号的经编码版本可被解码。在示例中，可从储存单元接收(例如，经由蓝牙连接)和/或获得帧。音高滞后T_best(选择于如上文所论述的T₁与T₂之间)可用于PLC及LTPF两者。

在步骤S102'处，检查帧的有效性(例如，利用CRC、奇偶性等等)。若已确认帧的无效性，则执行隐藏(见下文)。

否则，若帧保持有效，则在步骤S103'处，检查音高信息是否在帧中被编码。在一些示例中，仅在调和性已被确认为高于特定阈值(其可指示例如调和性对于执行例如LTPF和/或PLC足够高)时，音高信息才被编码。

若在S103'处确认音高信息确实被编码，则在步骤S104'处对音高信息进行解码及储存。否则，循环结束且可在S101'处对新帧进行解码。

随后，在步骤S105'处，检查是否启用LTPF。若验证LTPF经启用，则在步骤S106处执行LTPF。否则，跳过LTPF；循环结束；以及可在S101'处对新帧进行解码。

参照隐藏，后者可再分为各步骤。在步骤S107'处，验证先前帧的音高信息(或先前帧中的一个的音高信息)是否储存于存储器中(即，可自由处理)。

若验证所搜寻音高信息被储存，则可在步骤S108处执行错误隐藏。可执行利用信号加扰的MDCT(或MDST)帧分辨率重复，和/或TCX时域隐藏，和/或相位ECU。

否则，若在S107'处验证未储存新鲜音高信息(因此，例如解码器未传输音高滞后)，则可在步骤S109'处使用本身已知且不意指使用由编码器提供的音高信息的不同隐藏技术。这些技术中的一些可基于在解码器处估计音高信息和/或其他调和性信息。在一些示例中，在此状况下无隐藏技术可执行。

在已执行隐藏之后，循环结束且可在S101'处对新帧进行解码。

应注意，由PLC使用的音高滞后为基于在估计T₁与T₂之间的选择由设备10和/或60b准备的值19(t_best)，如上文所论述。

10.其他示例

图7展示设备110，设备110可实施设备10和/或60a，执行上述方法的至少一些步骤。设备110可包含处理器111及储存指令(例如，程序)的非暂时性存储器单元112，指令在由处理器111执行时可致使处理器111执行第一估计112a(例如，实施第一估计器11)、第二估计112b(例如，实施第二估计器12)，和/或选择112c(例如，实施选择器18)。设备110可包含输入单元116，输入单元可获得输入信息信号(例如，音频信号)。设备可将比特流例如储存在储存空间128中。

图8展示设备120，设备120可实施解码器60b，和/或执行例如LTPF滤波。设备120可包含处理器121及储存指令122a(例如，程序)的非暂时性存储器单元122，指令在由处理器121执行时可致使处理器121例如基于从编码器获得的参数尤其执行LTPF滤波操作。设备120可包含输入单元126，输入单元可获得信息信号(例如，音频信号)的经解码表示。处理器121可因此执行处理以获得信息信号的经解码表示。可使用输出单元127将此经解码表示提供至外部单元。输出单元127可包含例如通信单元以与外部装置(例如，使用无线通信，诸如蓝牙)和/或外部储存空间通信。处理器121可将音频信号的经解码表示保存在本地储存空间128中。

在示例中，系统110与120可为相同装置。

取决于特定实施要求，示例可以以硬件实施。可使用数字储存介质执行该实施，例如软盘、数字多功能光盘(DVD)、蓝光光盘、紧密光盘(CD)、只读存储器(ROM)、可编程只读存储器(PROM)、可擦除及可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)或闪存，上面储存有电子可读控制信号，电子可读控制信号与可编程计算机系统协作(或能够协作)使得执行各个方法。因此，数字储存介质可为计算机可读的。

通常，示例可实施为具有程序指令的计算机程序产品，当计算机程序产品运行于计算机上时，程序指令操作性地用于执行方法中的一个。程序指令可例如储存于机器可读介质上。

其他示例包含用于执行本文所描述的方法中的一个、储存于机器可读载体上的计算机程序。换言之，方法的示例因此为计算机程序，其具有用于在计算机程序于计算机上运行时执行本文中所描述的方法中的一个的程序指令。

方法的另一示例因此为数据载体介质(或数字储存介质，或计算机可读介质)，包含、上面记录有用于执行本文所描述的方法中的一个的计算机程序。数据载体介质、数字储存介质或记录介质为有形和/或非暂时性的，而非无形及暂时性的信号。

另一示例包含处理单元，例如计算机或可编程逻辑装置，其执行本文所描述的方法中之一个。

另一示例包含计算机，其上安装有用于执行本文中所描述的方法中的一个的计算机程序。

另一示例包含将用于执行本文所描述的方法中之一个的计算机程序传送(例如以电子方式或以光学方式)至接收器的设备或系统。举例而言，接收器可为计算机、移动装置、存储器装置等。设备或系统可例如包含用于传送计算机程序至接收器的文件服务器。

在一些示例中，可编程逻辑装置(例如，场可编程门阵列)可用以执行本文中所描述的方法的功能性中的一些或全部。在一些示例中，场可编程门阵列可与微处理器协作，以便执行本文中所描述的方法中的一个。通常，方法可由任何适当的硬设备执行。

上述示例说明上文所论述的原理。应理解，本文中所描述的配置及细节的修改及变化将为显而易见的。因此，希望受到接下来的申请专利权利要求的范畴限制，而不受通过本文中的示例的描述及解释所呈现的特定细节限制。

Claims

1.一种用于对包括多个帧的信息信号进行编码的设备(10，60a，110)，所述设备包含：

第一估计器(11)，被配置以获得第一估计值(14，T₁)，第一估计值为当前帧(13)的音高滞后的估计值；

第二估计器(12)，被配置以获得第二估计值(16，T₂)，第二估计值为当前帧(13)的音高滞后的另一估计值；

选择器(17)，被配置以通过基于第一相关性测量值及第二相关性测量值(23，25)在第一估计值(14，T₁)与第二估计值(16，T₂)之间执行选择(S103)而选择所选值(19，T_best)；

其中通过在先前帧处选择的音高滞后(51，19”)调节第二估计器(12)以便获得当前帧(13)的第二估计值(16，T₂)，

其特征在于，选择器(17)被配置以：

在以下之间执行比较：

与当前帧(13)相关联且在对应于第一估计值(14，T₁)的滞后处获得的第一相关性测量值(23)的缩小版本(24)；和

与当前帧(13)相关联且在对应于第二估计值(16，T₂)的滞后处获得的第二相关性测量值(25)，

以便在第二相关性测量值(25)小于第一相关性测量值(23)的缩小版本(24)时选择第一估计值(14，T₁)，和/或

在第二相关性测量值(25)大于第一相关性测量值(23)的缩小版本(24)时选择第二估计值(16，T₂)，

其中第一相关性测量值与第二相关性测量值(23，25)中的至少一个为自相关测量值和/或归一化自相关测量值。

2.一种用于将包括多个帧的信息信号编码成比特流(63)的设备(60a)，所述设备(60a)包含：

检测单元(10，65)，包含：

第二估计器(12)，被配置以获得第二估计值(16，T₂)，第二估计值为当前帧(13)的音高滞后的另一估计值，其中通过在先前帧处选择的音高滞后(51，19”)调节第二估计器(12)以便获得当前帧(13)的第二估计值(16，T₂)；

选择器(17)，被配置以通过基于至少一个相关性测量值(23，25)在第一估计值(14，T₁)与第二估计值(16，T₂)之间执行选择而选择(S103)所选值(19，T_best)，其中选择器(17)被配置以在以下之间执行比较(27)：

与当前帧(13)相关联且在对应于第二估计值(16，T2)的滞后处获得的第二相关性测量值(25)；及

音高滞后选择阈值(24)，

以便在第二相关性测量值(25)大于音高滞后选择阈值(24)时选择(S103)第二估计值(16，T2)；和/或

在第二相关性测量值(25)低于音高滞后选择阈值(24)时选择(S103)第一估计值(14，T1)；以及

长期后滤波LTPF工具(66)，被配置以对对于在解码器(60b)处执行LTPF是有用的数据进行编码，对于执行LTPF是有用的数据包括所选值(19，T_best)。

3.根据权利要求2所述的设备，其中比较在以下之间进行：

与当前帧(13)相关联且在对应于第一估计值(14，T₁)的滞后处获得的第一相关性测量值(23)，第一相关性测量值表示音高滞后选择阈值(24)；及

第二相关性测量值(25)。

4.根据权利要求2或3所述的设备，其中比较在以下之间进行：

与当前帧(13)相关联且在对应于第一估计值(14，T₁)的滞后处获得的第一相关性测量值(23)的缩小版本(24)，第一相关性测量值的缩小版本表示音高滞后选择阈值(24)；及

第二相关性测量值(25)。

5.根据权利要求2-4中任一项所述的设备，其中：

第一相关性测量值与第二相关性测量值(23，25)中的至少一个为自相关测量值和/或归一化自相关测量值。

6.根据权利要求2-5中任一项所述的设备，被配置以比较所选值(19，T_best)与预定LTPF阈值，以便避免在所选值(19，T_best)低于预定阈值的情况下对所选值(19，T_best)进行编码。

7.根据前述权利要求中任一项所述的设备，其中第二估计器(12)被配置以：

通过在含有针对先前帧选择的音高滞后(51，19”)的第二子区间(52)中搜索使第二相关性函数最大化的滞后而获得第二估计值(16)。

8.根据权利要求7所述的设备，其中：

第二子区间(52)含有在距针对先前帧选择的音高滞后(51，19”)小于预定义滞后数值阈值的距离内的滞后(T)。

9.根据权利要求7或8所述的设备，其中第二估计器(12)被配置以：

搜索第二相关性函数值中的最大值以使第二估计值(16)与相关联于第二相关性函数值中的最大值的滞后(T₂)相关联。

10.根据前述权利要求中任一项所述的设备，其中第一估计器(12)被配置以：

获得第一估计值(14)作为使与当前帧(13)相关联的第一相关性函数最大化的滞后(T₁)。

11.根据权利要求10所述的设备，其中第一相关性函数限于第一子区间中的滞后。

12.根据权利要求11所述的设备，其中第一子区间含有大于第二子区间(52)的多个滞后，和/或第二子区间(52)中的滞后中的至少一些包含于第一子区间中。

13.根据前述权利要求中任一项所述的设备，其中第一估计器(11)被配置以：

在搜索使第一相关性函数最大化的滞后(T₁)之前使用单调递减加权函数对第一相关性函数的相关性测量值进行加权。

14.根据权利要求7-13中任一项所述的设备，其中：

第二相关性函数及第一相关性函数中的至少一个为自相关函数和/或归一化自相关函数。

15.根据前述权利要求中任一项所述的设备，其中第一估计器(11)被配置以通过执行以下操作中的至少一些而获得第一估计值T₁：

R_w(k)＝R(k)w(k)对于k＝k_min..k_max

对于k＝k_min..k_max

对于k＝k_min..k_max

16.根据前述权利要求中任一项所述的设备，其中第二估计器(12)被配置以通过执行以下而获得第二估计值T₂：

其中k′_min＝max(k_min,T_prev-δ)，k′_max＝min(k_max,T_prev+δ)，T_prev为在先帧中的所选估计值，且δ为与T_prev的距离，k_min以及k_max与最小滞后及最大滞后相关联。

17.根据前述权利要求中任一项所述的设备，其中选择器(17)被配置以关于以下执行音高滞后估计值T_curr的选择：

18.根据前述权利要求中任一项所述的设备，进一步包含在选择器(17)下游的长期后滤波LTPF工具(66)，用于控制解码器设备(60b)处的长期后滤波器(67)。

19.根据前述权利要求中任一项所述的设备，其中信息信号为音频信号。

20.根据前述权利要求中任一项所述的设备，被配置以使用相同相关性函数获得第一相关性测量值与第二相关性测量值直至加权函数。

21.根据前述权利要求中任一项所述的设备，被配置以获得第一相关性测量值作为直至加权函数的第一估计值的归一化版本。

22.根据前述权利要求中任一项所述的设备，被配置以获得第二相关性测量值作为第二估计值的归一化版本。

23.根据前述权利要求中任一项所述的设备，进一步包含变换编码器(62)，变换编码器被配置以产生信息信号(61)或其经处理版本的表示(63a)。

24.一种包含编码器侧(10，60a)及解码器侧(60b)的系统，编码器侧包含如前述权利要求中任一项所述的设备，解码器侧包含基于由选择器(17)选择的音高滞后估计值控制的长期后滤波工具(67)。

25.一种用于确定划分成帧的信号的音高滞后的方法(100)，包含：

对当前帧执行第一估计(S101)；

对当前帧执行第二估计(S102)；以及

基于相关性测量值在第一估计处获得的第一估计值(14，T₁)与第二估计处获得的第二估计值(16，T₂)之间进行选择(S103)，

其特征在于，选择包括在以下之间执行比较：

与当前帧(13)相关联且在对应于第一估计值(14，T₁)的滞后处获得的第一相关性测量值(23)的缩小版本(24)；

与当前帧(13)相关联且在对应于第二估计值(16，T₂)的滞后处获得的第二相关性测量值(25)；以及

在第二相关性测量值(25)小于第一相关性测量值(23)的缩小版本时选择第一估计值(14，T₁)，和/或在第二相关性测量值(25)大于第一相关性测量值(23)的缩小版本时选择第二估计值(16，T₂)，

26.根据权利要求25所述的方法，进一步包含使用所选滞后用于长期后滤波LTPF。

27.一种用于对划分成帧的信号的比特流进行编码的方法(100)，包含：

对当前帧执行第一估计(S101)；

对当前帧执行第二估计(S102)；以及

基于至少一个相关性测量值在第一估计处获得的第一估计值(14，T₁)与第二估计处获得的第二估计值(16，T₂)之间进行选择(S103)，

其中选择包括在以下之间执行比较(27)：

音高滞后选择阈值(24)，

在第二相关性测量值(25)大于音高滞后选择阈值(24)时选择(S103)第二估计值(16，T2)和/或在第二相关性测量值(25)低于音高滞后选择阈值(24)时选择(S103)第一估计值(14，T1)；且

方法进一步包含对对于在解码器(60b)处执行LTPF是有用的数据所选值(19，T_best)进行编码。

28.根据权利要求25至27中任一项所述的方法，进一步包含使用所选滞后用于封包丢失隐藏PLC。

29.一种包含指令的程序，指令在由处理器(111)执行时致使处理器执行如权利要求25至28中任一项所述的方法。