CN108293165A

CN108293165A - 增强音场的装置和方法

Info

Publication number: CN108293165A
Application number: CN201580084246.4A
Authority: CN
Inventors: 吴采颐; 培-伦·谢
Original assignee: Incomparable Excellent Sound Technology Co
Current assignee: Incomparable Excellent Sound Technology Co
Priority date: 2015-10-27
Filing date: 2015-10-27
Publication date: 2018-07-17
Also published as: KR20180075610A; TW201727623A; EP3369257A1; AU2015413301B2; EP3369257A4; US10313814B2; WO2017074321A1; JP6620235B2; EP3369257B1; US20180249269A1; US10299057B2; US10412520B2; US20180310110A1; AU2015413301A1; US10313813B2; US20180249268A1; HK1254634A1; JP2018536342A; US20180247633A1

Abstract

在计算设备中执行一种处理音频信号的方法。该方法包括以下步骤：接收数字立体声音频输入信号；从所述数字立体声音频输入信号提取定位线索；至少部分地根据所述定位线索从所述数字立体声音频输入信号生成左侧分量和右侧分量；分别对所述左侧分量和所述右侧分量执行串扰消除，以获得消除了串扰的左侧分量和消除了串扰的右侧分量；以及生成包含所述消除了串扰的左侧分量和所述消除了串扰的右侧分量的数字立体声音频输出信号。

Description

增强音场的装置和方法

技术领域

本申请一般地涉及音频信号处理，更具体地涉及用于增强音场的计算机实现的方法、装置和计算机可用程序代码。

背景技术

双耳聆听可以改善大多数听力任务的效果。双声道立体声在1950年代末期成为标准的消费媒体，即使在其推出的84年后，仍然是最常用的播放系统。从单声道到立体声再到多声道，消费者不断追求更加身临其境的听觉体验。过去和现在对产生沉浸式声音付出的努力都主要集中在，使用多个扬声器或与头相关传递函数(HRTF)有关的方法来仅仅模拟虚拟扬声器。

尽管过去几十年在沉浸式声音领域已经付出了很多努力，但现有系统仍然存在各种限制。例如，用模拟的虚拟扬声器产生真实的360°声音效果是困难的，而且收听者必须待在固定位置才能获得期望的结果。这通常通过将一组定向传递函数(例如，头相关传递函数或双耳房间脉冲响应)应用于声源来完成的。另一种常规解决方案是将越来越多的扬声器(例如，22个声道加2个超低音声道)结合到声音系统中。由于实施起来需要高成本和大空间，这种方法在许多情况下可能不切实际。

发明内容

本申请的目的在于，开发出一种与数据处理系统如台式机或笔记本电脑相结合的强健的音场增强方法，该方法可以从音频输入信号(可以是单声道信号、立体声信号或多声道信号)产生沉浸式声音效果。

根据本申请的第一方面，在计算设备中执行一种用于处理音频信号的方法，该计算设备具有一个或多个处理器、至少两个扬声器、存储器和存储在所述存储器中且由所述一个或多个处理器执行的多个程序模块。该方法包括以下步骤：接收数字立体声音频输入信号；从所述数字立体声音频输入信号提取定位线索；至少部分地根据所述定位线索从所述数字立体声音频输入信号生成左侧分量和右侧分量；分别对所述左侧分量和所述右侧分量执行串扰消除，以获得消除了串扰的左侧分量和消除了串扰的右侧分量；以及生成包含所述消除了串扰的左侧分量和所述消除了串扰的右侧分量的数字立体声音频输出信号。根据本申请的另一方面，一种计算设备包括：一个或多个处理器、存储器、以及存储在存储器中且由一个或多个处理器执行的多个程序模块。所述多个程序模块在由所述一个或多个处理器执行时使所述计算设备执行上述的用于处理音频信号的方法。根据本申请的又一个方面，一种存储在非暂时性计算机可读存储介质中的计算机程序产品，其与具有一个或多个处理器的计算设备相结合，所述计算机程序产品包括多个程序模块，所述程序模块在由所述一个或多个处理器执行时使所述计算设备执行上述的用于处理音频信号的方法。

根据本申请的第二方面，在计算设备中执行一种用于处理音频信号的方法，该计算设备具有一个或多个处理器、至少两个扬声器、存储器和存储在所述存储器中且由所述一个或多个处理器执行的多个程序模块。该方法包括以下步骤：接收数字单声道音频输入信号；将所述数字单声道音频输入信号分别平移到左侧分量和右侧分量中；将所述数字单声道音频输入信号的两个副本分别与所述左侧分量和所述右侧分量上混，其中在所述中部分量的两个副本之间有预先定义的时间间隔；分别对所述左侧分量和所述右侧分量执行串扰消除，以获得消除了串扰的左侧分量和消除了串扰的右侧分量；以及生成包含所述消除了串扰的左侧分量和所述消除了串扰的右侧分量的数字立体声音频输出信号。根据本申请的另一方面，一种计算设备包括：一个或多个处理器、存储器、以及存储在存储器中且由一个或多个处理器执行的多个程序模块。所述多个程序模块在由所述一个或多个处理器执行时使所述计算设备执行上述的用于处理音频信号的方法。根据本申请的又一个方面，一种存储在非暂时性计算机可读存储介质中的计算机程序产品，其与具有一个或多个处理器的计算设备相结合，所述计算机程序产品包括多个程序模块，所述程序模块在由所述一个或多个处理器执行时使所述计算设备执行上述的用于处理音频信号的方法。

根据本申请的第三方面，在计算设备中执行一种用于处理音频信号的方法，该计算设备具有一个或多个处理器、至少两个扬声器、存储器和存储在所述存储器中且由所述一个或多个处理器执行的多个程序模块。该方法包括以下步骤：接收数字立体声音频输入信号；从所述数字立体声音频输入信号中提取中部分量、左侧分量和右侧分量；将所述中部分量分别平移到所述左侧分量和所述右侧分量中；产生所述中部分量的第一和第二副本，其中在所述中部分量的所述第一副本和所述第二副本之间有预先定义的时间间隔；分别将所述中部分量的所述第一副本与所述左侧分量组合成左声道，将所述中部分量的所述第二副本与所述右侧分量组合成右声道；以及生成包含所述左声道和所述右声道的数字立体声音频输出信号。根据本申请的另一方面，一种计算设备包括：一个或多个处理器、存储器、以及存储在存储器中且由一个或多个处理器执行的多个程序模块。所述多个程序模块在由所述一个或多个处理器执行时使所述计算设备执行上述的用于处理音频信号的方法。根据本申请的又一个方面，一种存储在非暂时性计算机可读存储介质中的计算机程序产品，其与具有一个或多个处理器的计算设备相结合，所述计算机程序产品包括多个程序模块，所述程序模块在由所述一个或多个处理器执行时使所述计算设备执行上述的用于处理音频信号的方法。

根据本申请的第四方面，在计算设备中执行一种用于处理音频信号的方法，该计算设备具有一个或多个处理器、存储器和存储在所述存储器中且由所述一个或多个处理器执行的多个程序模块。该方法包括以下步骤：接收数字音频输入信号；通过增强在预先定义的频率范围内的数字音频输入信号来对所述数字音频输入信号执行均衡，并从所述均衡后的音频信号生成残余音频信号；对所述均衡后的音频信号执行动态范围压缩；对所述均衡后的音频信号执行串扰消除，以获得消除了串扰的音频信号；以及将所述消除了串扰的音频信号和所述残余音频信号组合成数字音频输出信号。根据本申请的另一方面，一种计算设备包括：一个或多个处理器、存储器、以及存储在存储器中且由一个或多个处理器执行的多个程序模块。所述多个程序模块在由所述一个或多个处理器执行时使所述计算设备执行上述的用于处理音频信号的方法。根据本申请的又一个方面，一种存储在非暂时性计算机可读存储介质中的计算机程序产品，其与具有一个或多个处理器的计算设备相结合，所述计算机程序产品包括多个程序模块，所述程序模块在由所述一个或多个处理器执行时使所述计算设备执行上述的用于处理音频信号的方法。

附图说明

附图用来提供对实施例的进一步理解，其包含在本文中并构成说明书的一部分，展示被描述的实施例，且与说明书一起用于解释基本原理。相同的附图标记指代相对应的部分。

图1是根据本申请的说明性实施例的计算机系统的框图。

图2A是示出根据说明性实施例的包括不同阶段的立体声或单声道声音输入信号的声音处理流水线的框图。

图2B是示出根据说明性实施例的从立体声音频输入信号产生沉浸式声音效果的过程的流程图。

图3A是根据说明性实施例的从立体声音频输入信号产生沉浸式声音效果的预处理步骤的流程图。

图3B是根据说明性实施例的从立体声音频输入信号产生沉浸式声音效果的预处理步骤的框图。

图4A是根据说明性实施例的将包括左信号和右信号的音频信号转换成三个分量的流程图。

图4B是根据说明性实施例的音频信号的左信号和右信号的框图。

图4C是根据说明性实施例的从音频信号生成的三个分量的框图。

图5A是根据说明性实施例的将音频信号的中部分量平移到两个侧分量中的流程图。

图5B是根据说明性实施例的确定声源的空间线索并将空间线索应用于音频信号的中左分量和中右分量中的一个的流程图。

图5C是示出根据说明性实施例的声源的角度的框图。

图5D是示出根据说明性实施例的耳间时间差(ITD)与声源角之间的关系的框图。

图5E是示出根据说明性实施例的耳间强度差(IID)与声源角度之间的关系的框图。

图6是根据说明性实施例的对音频信号的左侧分量和右侧分量执行串扰消除之前和之后的处理步骤的流程图。

图7A-7C是根据说明性实施例的音频信号的动态范围压缩的流程图。

图8A-8C是示出根据说明性实施例的将立体声/多声道声音信号转换为多声道/立体声声音信号的不同声音处理阶段的框图。

具体实施方式

现在详细参考实施例，附图中示出实施例的示例。在下面的详细描述中，阐述了许多非限制性的具体细节以帮助理解本申请提出的主题。但是对于本领域的普通技术人员来说，很显然，在不脱离权利要求的范围的情况下可以使用各种替代方案，而且没有这些具体细节也可以实施该主题。例如，对于本领域的普通技术人员来说，很显然，本申请提出的主题可以在诸如智能手机、平板电脑的许多类型的无线通信系统上实现。

现在参考附图尤其是图1，提供了其中可以实现说明性实施例的数据处理环境的示例性框图。应该理解的是，图1仅是示例性的，并非用来声明或暗示对可以实施不同实施例的环境的任何限制。所示出的环境可以进行很多修改。

图1示出根据本申请的说明性实施例的数据处理系统100的框图。在该说明性示例中，数据处理系统100包括通信结构102，其提供处理器单元104、存储器106、持久存储器108、通信单元110、输入/输出(I/O)单元112、显示器114和一个或更多扬声器116相互间的通信。请注意，扬声器116可以设置在数据处理系统100内，也可以设置在数据处理系统100的外部。在一些实施例中，数据处理系统100采取以下的形式：笔记本电脑、台式计算机、平板电脑、移动电话(如，智能手机)、多媒体播放器设备、导航设备、教育设备(如，儿童的学习玩具)、游戏系统或控制设备(例如，家庭或工业控制器)。

处理器单元104用于执行可以加载到存储器106中的软件程序的指令。处理器单元104可以是一个或多个处理器的集合，也可以是多处理器核心，这取决于具体实现方式。此外，处理器单元104也可以用一个或多个异构处理器系统来实现，其中主处理器与辅助处理器位于同一个芯片上。作为另一说明性示例，处理器单元104可以是包含相同类型的多个处理器的对称多处理器系统。

在这些示例中，存储器106可以是随机存取存储器或任何其它合适的易失性或非易失性存储设备。取决于具体实现方式，持久存储器108可以采取各种形式。例如，持久存储器108可以包含一个或多个部件或设备如硬盘驱动器、闪存、可改写光盘、可改写磁带或它们的某种组合。持久存储器108使用的媒体也可以是可移除的。例如，可移动硬盘驱动器可以用于持久存储器108。

在这些示例中，通信单元110提供与其它数据处理系统或设备的通信。在这些示例中，通信单元110是网络接口卡。通信单元110可以通过使用物理通信链路和/或无线通信链路提供通信。

输入/输出单元112允许向可连接到数据处理系统100的其它设备输入和输出数据。例如，输入/输出单元112可以提供连接，供用户通过键盘和鼠标输入。此外，输入/输出单元112可以将输出发送到打印机。显示器114提供了向用户显示信息的机制。扬声器116向用户播放声音。

操作系统和应用程序或程序的指令位于持久存储器108上。这些指令可以被加载到存储器106中以供处理器单元104执行。如下所述的不同实施例的过程可以由处理器单元104使用计算机实现指令来执行，这些计算机实现指令可以位于存储器如存储器106中。这些指令指称为程序代码(或模块)、计算机可用程序代码(或模块)或计算机可读程序代码(或模块)，可由处理器单元104中的处理器读取和执行。不同实施例中的程序代码(或模块)可以体现在不同的物理的或有形的计算机可读介质如存储器106或持久存储器108上。

程序代码/模块120以功能形式位于计算机可读存储介质118上，该计算机可读存储介质118可以选择性地移除，程序代码/模块120可以被加载或传送到数据处理系统100以供处理器单元104执行。在这些示例中，程序代码/模块120和计算机可读存储介质118形成计算机程序产品122。在一个示例中，计算机可读存储介质118可以是有形的形式，例如插入或放置到作为持久存储器108的一部分的驱动器或其它设备中，并用于传输到存储设备如作为持久存储器108的一部分的硬盘驱动器的光盘或磁盘。作为有形的形式，计算机可读存储介质118还可以采取连接到数据处理系统100的持久存储器的形式，如硬盘驱动器、拇指驱动器或闪存。计算机可读存储介质118的有形形式也被称为计算机可记录存储介质。在有些情况下，计算机可读存储介质118不能从数据处理系统100移除。

或者，可以通过到通信单元110的通信链路和/或通过到输入/输出单元112的连接，将程序代码/模块120从计算机可读存储介质118传送到数据处理系统100。在说明性示例中，通信链路和/或连接可以是物理的，也可以是无线的。计算机可读介质还可以采取非有形介质的形式，如包含程序代码/模块的通信链路或无线传输。

针对数据处理系统100示出的不同部件不意味着对可以实现不同实施例的方式进行架构上的限制。不同的说明性实施例可以在这样的数据处理系统中实现，该数据处理系统可以除了针对数据处理系统100示出的那些部件之外还包括其它部件，也可以包括替代针对数据处理系统100示出的那些部件的其它部件。图1所示的其它部件可以与所示的示例性示例不同。

作为一个示例，数据处理系统100中的存储设备是可以存储数据的任何硬件装置。存储器106、持久存储器108和计算机可读存储介质118都是有形形式的存储设备的例子。

在另一个示例中，可以使用总线系统来实现通信结构102，总线系统可以包括一个或多个总线，如系统总线或输入/输出总线。总线系统可以使用任何合适类型的架构来实现，该架构提供了连接到总线系统的不同部件或设备之间的数据传输。另外，通信单元可以包括用于发送和接收数据的一个或多个设备，如调制解调器或网络适配器。此外，存储器可以是例如存储器106或高速缓存存储器，如可以在通信结构102中可能存在的接口和内存控制中心中找到的高速缓存存储器。

为了解决在本申请的背景技术部分描述的常规方法的问题，下面描述本申请的不同实施例，这些实施例与基于心理声学原理来迷惑人类听觉系统的一组音频信号处理方法相关联。与常规方法不同，不需要产生模拟的或物理的扬声器。不管输入声道和输出声道的数量多少，这些方法都可以产生类似于3D的沉浸式声音效果，同时保持声音质量不变。

人类听觉系统通过耳间差异来确定所呈现的声音事件的方向，且该声音事件的宽度主要取决于耳间相关性。当声波到达双耳时，不管声源的本质如何，都会产生鼓膜的一维运动。根据一些实施例，空间定位线索作为声道间差异被放回到处理的音频信号中，从而最终以位置相关模式移动收听者的鼓膜。与常规方法不同，这种移动基于收听者自己的传输功能(取决于收听者的头部形状和其它身体部位)以及不同的回放环境，例如房间大小和正在使用的扬声器系统。因此，听觉系统能够分析和比较嵌入在音频信号中的相关物理线索，以提取所呈现的听觉空间并将声音事件合成。

图2A是示出根据说明性实施例的包括不同阶段的立体声或单声道声音输入信号的声音处理流水线的框图。在一些实施例中，输入该流水线的是包括左信号(L)和右信号(L)的立体声音频输入信号210。在一些其它实施例中，输入是单声道音频信号250。流水线包括三个阶段：预处理阶段220、声音增强处理阶段230和后处理阶段240。每个处理阶段包括一个或多个处理块，用于处理输入音频信号并相应地生成输出音频信号。例如，预处理阶段220进一步包括中/侧(M/S)混合器221、音频信号平移工具223和上混器227；声音增强处理阶段230包括均衡器(EQ)231、动态范围压缩器(DRC)233和串扰消除块235；后处理阶段240包括另一个动态范围压缩器(DRC)241。

M/S混合器221是从立体声音频输入信号210产生三个分量(左侧分量side_L、右侧分量side_R和中部分量mid)的混合工具。与仅产生一个侧分量和一个单声道分量的常规M/S混合工具不同，M/S混合器221将输出信号中的对各种后续分析有用的信息分离出来，并把声音质量中的不必要的失真(例如染色)最小化。由此，由M/S混合器221生成的不同分量之间的相关性降低。

如图2A所示，M/S混合器221的输出包括三个分量，其中一个是中部分量(M)，另外两个分量由字母“S”表示。然后，中部分量M输入到平移块225。平移块225负责将中部信号“替换”到音场中的任何位置，并优化整体声音效果或强调音场中的某些声音。在此过程中，中部信号的处理方式与单声道音频信号250相同。用户可以根据自己的意图通过将某些参数应用于平移过程来改变中部信号(或单声道信号)的位置。把平移后的中部信号(中左信号mid_L和中右信号mid_R)添加到由M/S混合器221生成的侧分量(左侧分量side_L和右侧分量side_R)，从而成为新的左侧分量side_L和右侧分量side_R。

预处理阶段220中的上混器227使中部分量(或单声道信号)倍增成两个副本，并将预先定义的时间延迟添加到两个副本中的一个副本上，然后将它们分别添加到新的左侧分量side_L和右侧分量side_R上，如图2A所示。在一些实施例中(如图2A所示)，在将它们组合在一起之前，将放大器分别应用于新的左侧分量side_L和右侧分量side_R以及被上混了的中间/单声道分量。如下所述，认真选择该中部分量(或单声道信号)的两个副本之间的时间延迟，以通过向停留在音场中间的音频图像添加更多立体声宽度来实现所谓的优先效果。

如图2A所示，预处理阶段220的输出包括两个音频信号：左侧分量side_L和右侧分量side_R。它们被输入声音增强处理阶段230，并由其中的不同处理块进行处理。例如，两个侧信号遇到的均衡器(EQ)231包括用于对两个侧信号执行带通滤波的一个或多个多频带均衡器。在一些实施例中，应用于每个侧信号的多频带均衡器是相同的。而在其它一些实施例中，应用于一个侧信号的多频带均衡器与应用于另一个侧信号的多频带均衡器是不同的。尽管如此，它们的功能都是保持声音信号的原始颜色，并避免出现在这两个信号中的模糊的空间线索。在一些实施例中，该EQ 231也可以用于基于两个侧分量的频谱分析来选择目标声源。

如图2A所示，流水线包括两个动态范围压缩器233和241。在一些实施例中，第一动态范围压缩器233包括用于放大在预先定义的频率范围内的两个声音信号的带通滤波特征，以便将由串扰消除块235实现的音场增强效果最大化。第二动态范围压缩器241用于后处理阶段240，将音频母盘制作过程(audio mastering process)中的声音信号的总体输出声级(level)放大。

串扰是立体声扬声器播放中固有的问题。当声音到达与每个扬声器相反一侧的耳朵时就会发生串扰，串扰将不需要的频谱染色(spectral coloration)引入原始信号。这个问题的解决方案是串扰消除(XTC)算法。XTC算法的一种类型是使用广义定向双耳传递函数(如头相关传递函数(HRTF)和/或双耳房间脉冲响应(BRIR))表示两个物理扬声器相对于收听者位置的角度。

由串扰消除块235表示的另一类型的XTC算法系统是不需要头相关传递函数(HRTF)、双耳房间脉冲响应(BRIR)或任何其它双耳传递函数的递归串扰消除方法。基本算法可以表述如下：

left[n]＝left[n]-A_L*right[n-d_L]

right[n]＝right[n]-A_R*left[n-d_R]

其中A_L和A_R是信号的衰减系数，d_L和d_R是从各扬声器到相反侧耳朵的许多数据采样的延迟。串扰消除块235的更详细描述可以参见2014年12月12日提交的名称为“用于增强音场的装置和方法(APPARATUS AND METHOD FOR SOUND STAGE ENHANCEMENT)”的美国专利申请第14/569,490号，其全部内容通过引用合并于此。

图2A描述了有两对输出信号来自EQ 231。一对输出信号(即，带通滤波后的那对音频信号)由DRC 233、XTC 235以及可能还有另一个放大器依次处理；另一对输出信号被定义为带通滤波后的那对音频信号与那对输入侧信号之间的残差。然后，在与已经被执行串扰消除操作的两个音频信号组合之前，这对残余信号被馈送到放大器中。如图2A所示，流水线的输出是包括左声道(L’)和右声道(R’)的立体声音频信号。需要注意的是，相同的流水线能够将单声道音频输入信号250转换成包括左声道(L’)和右声道(R’)的立体声音频信号。

图2B是示出根据说明性实施例的使用图1所示的数据处理系统100从立体声音频输入信号产生沉浸式声音效果的过程的流程图。数据处理系统100接收数字音频输入信号(步骤281)。在一些实施例中，数字音频输入信号包括左信号(也被称为“左声道”)和右信号(也被称为“右声道”)。然后，数据处理系统100从数字音频信号中提取定位线索(步骤283)。在一些实施例中，定位线索包括产生立体声信号的声源相对于收听者位置的角度、以及到达收听者两个耳朵的音频信号之间的耳间时间差和耳间强度差。然后，数据处理系统100从数字音频输入信号生成左侧分量和右侧分量(步骤285)。在一些实施例中，至少部分地基于由前一步骤产生的定位线索，生成两个侧分量。注意，到目前为止的过程大致与上面结合图2A描述的声音增强处理阶段230中的前两个块和预处理阶段220匹配。接着，数据处理系统100分别对左侧分量和右侧分量执行串扰消除，以获得消除了串扰的左侧分量和消除了串扰的右侧分量(步骤287)。在一些实施例中，串扰消除是使用右侧分量消除左侧分量中的串扰噪声，并使用左侧分量消除右侧分量中的串扰噪声的递归过程。在串扰消除之后，数据处理系统100生成包含所述消除了串扰的左侧分量和所述消除了串扰的右侧分量的数字音频输出信号(步骤289)。例如，数据处理系统100可以使用其扬声器116向收听者播放数字音频输出信号。

上面结合图2B描述的过程示出使用本申请中公开的方法对立体声音频信号执行音场增强(sound stage enhancement)的一般工作流程。下面，对图2B所示的用来产生沉浸式声音效果的一些步骤提供更加详细的描述。

具体地，图3A是根据说明性实施例的从立体声音频输入信号产生沉浸式声音效果的预处理步骤的流程图。这些预处理步骤主要对应于图2B的步骤283和285。一旦接收到数字立体声音频信号，数据处理系统100从数字立体声音频信号中提取中部分量、初始左侧分量和初始右侧分量(步骤301)。如以上结合图2A所述的，该步骤由M/S混合器221执行，其将两个输入信号L和R分成三个分量。接着，数据处理系统100根据定位线索分别将中部分量平移到初始左侧分量和初始右侧分量中，以获得中间左侧分量和中间右侧分量(步骤303)。该步骤对应于图2A中所示的平移工具223。最后，数据处理系统100生成中部分量的两个副本，并将中部分量的第一副本与中间左侧分量上混，将中部分量的第二副本与中间右侧分量上混，以获得左侧分量和右侧分量(步骤305)。该步骤对应于上混器227和在预处理阶段220结束时的组合操作。在一些实施例中，使用放大器的增益操作被分别单独地应用于中间侧分量和被上混的中部分量，以确保各组合之前的分量保留立体声输入信号的原始位置线索。在一些实施例中，在组合之前在中部分量的第一和第二副本之间存在预先定义的时间延迟。选择时间延迟以实现立体声音频信号中的优先效果。

图3B是根据说明性实施例的从立体声音频输入信号产生沉浸式声音效果的预处理步骤的框图。如图所示，M/S混合器221产生三个分量，即初始左侧分量S_L 311、中部分量M313和初始右侧分量S_R 315。然后，中部分量M 313被分成初始中左分量M_L 321和初始中右分量M_R 323。初始左侧分量S_L 311和初始中左分量M_L 321被组合器325组合成中间左侧分量S_L331，初始右侧分量S_L 315和初始中右分量M_R 323被组合器327组合成中间右侧分量S_R 335。请注意，图3B中的框图不包括上混操作和之后的组合操作。

如上所述，M/S混合器221负责将音频信号转换成多个分量。图4A是根据说明性实施例的将包括左信号和右信号的立体声音频信号转换成三个分量的流程图。首先，数据处理系统100使用例如离散短时傅立叶变换，如下所示地将左信号和右信号从时域变换到频域(步骤401)：

其中|X(e^jω)|表示每个频率ω的量值，∠X(e^jω)表示相位。

接着，数据处理系统100将频域中的中部分量定义为左信号和右信号中的对于频域中特定频率具有较小量值的那一个信号(步骤403)。假定重叠长度等于短时傅里叶变换的窗口长度的一半，则中部分量的频谱图用以下公式定义：

在确定频域中的中部分量之后，数据处理系统100使用离散短时傅立叶逆变换，如下所示地将中部分量从频域变换变回到时域(步骤405)：

最后，数据处理系统通过分别从左信号和右信号中减去中部分量，生成初始左侧分量和初始右侧分量(步骤407)，如下所示：

side_L[n]＝left[n]-mid[n]

side_R[n]＝right[n]-mid[n]

图4B是根据说明性实施例的音频信号的左信号和右信号的框图。在这个示例中，曲线411代表左信号，曲线413对应于右信号。图4C是根据说明性实施例的从图4B中所示的音频信号产生的三个分量的框图。具体地，图4C中示出的曲线421表示中部分量，曲线423和425分别表示音频信号的左侧分量和右侧分量。

M/S混合被音响工程师广泛用于录音、混音和母盘制作。但是与常规的混合过程不同，M/S混合器221从一个立体声音频信号产生三个分量(左侧分量side_L、右侧分量side_R、和中部分量)。左侧分量side_L表示仅在左声道出现的声源，而右侧分量side_R对应仅出现在右声道的声音。中部分量是仅出现在音场的虚幻中心(phantom center)的声源，例如主音乐元素和对话。由此，该过程把对后续音场增强有用的信息分离出来，并把声音质量中不必要的失真(例如，染色)最小化。而且，该步骤还有助于降低左侧分量和右侧分量之间的相关性。

图5A是根据说明性实施例的将音频信号的中部分量平移到两个侧分量中的流程图。首先，数据处理系统100分别对中部分量应用左幅度平移参数和右幅度平移参数，以获得初始中左分量和初始中右分量(步骤501)，如下所示：

left′[n]＝G_L(φ)*left[n]

right′[n]＝G_R(φ)*right[n]

其中，G_L和G_R分别是左右分量的增益，它们是的函数，表示声源的角度。请注意，在立体声扬声器设置中平移单声道信号可以通过将左侧信号和右侧信号作为单声道输入信号来表示。在一些实施例中，G_L和G_R定义如下：

G_L(φ)＝max(1+φ，1)

G_R(φ)＝max(1-φ，1)

其中，是平移值。

请注意，在许多情况下，左右信号之间的幅度差异不足以成为听觉空间处理所需的有效耳间定位线索。向幅度平移引入额外的耳间差异以便被听觉系统拾取。例如，数据处理系统100确定左信号和右信号之间的耳间时间差和耳间强度差(IID)(步骤503)。这些耳间差异是人类听觉系统解码空间复杂声音事件的主要信息。更具体地说，ITD表示声音到达两耳的时间的差异。而IID对应于到达两耳的声音之间的声级的差异，这是因头部阴影效应和传播中的衰减引起的。空间线索如ITD和IID等提供有关声音环境中声源和物体的相对数量和位置的信息。

然后，数据处理系统100将ITD和IID应用到初始中左分量和初始中右分量中的至少一个，以获得中间中左分量和中间中右分量(步骤505)。这种耳间差异作为声道间时间和强度差异被重新放回到两个分量中。最后，数据处理系统100分别将初始左侧分量与中间中左分量组合，将初始右侧分量分别与中间中右分量组合，以获得中间左侧分量(对应于图3B中的中间左侧分量S_L 331)和中间右侧分量(对应于图3B中的中间右侧分量S_R 335)(步骤507)。

图5B是根据说明性实施例的确定声源的空间线索并将空间线索应用于音频信号的中左分量和中右分量中的一个分量的流程图。数据处理系统100确定与数字音频输入信号相关联的声源相对于收听者的当前位置的角度(步骤511)。

图5C是示出根据说明性实施例的声源的角度的框图。考虑将人的头部放置在原点O，面向y轴的方向，头部半径为r。左耳在E_L，右耳在E_R。假定声源S位于离原点较远的位置，相对于y轴成θ角，并且假定声波在到达头部时是平行传播的平面波，到达E_L的声音来自S_L，到达E_R的声音来自S_R。S_L与E_L之间的距离比S_R与E_R之间的距离长α+β，其中,α＝rsinθ，β＝rθ。

两侧的距离差为：α+β＝rsinθ+rθ＝r(sinθ+θ)。

数据处理系统100根据声源的角度计算ITD和IID(步骤513)。例如，ITD可以定义为距离差除以声速c，如下所示：

ITD＝距离差/声速＝r(sinθ+θ)/c。

换句话说，在头部的左侧(即，远侧)存在小的时间延迟。图5D是说明如上式所定义的耳间时间差(ITD)和声源角之间的关系的框图。

众所周知，声音的强度SI与收听者和声源之间的距离d的平方成反比，如下：

然后，可以将耳间强度差定义为从声源到每只耳朵行进的距离之间的强度比：

假设S_R和E_R之间的距离等于1米，那么

在一些实施例中，考虑到头部会阻挡声波，引入头部阴影常数m如下：

IID＝m20log₁₀(1+r(θ+sinθ))。

图5E是示出由上面的公式定义的根据说明性实施例的耳间强度差(IID)与声源角度之间的关系的框图。

使用图5D和5E所示的ITD曲线和IID曲线，数据处理系统100通过将由ITD定义的时间偏移和由IID定义的幅度倍数应用到例如初始中右分量，更新初始中右分量(步骤515)，如下所示：

right″[n]＝A_IIDright′[n-t_ITD]。

接着，数据处理系统100将更新了的初始中右分量组合到初始中左分量中而成为中间中左分量(步骤517)，如下所示：

left″[n]＝left′[n]+right″[n]。

如以上结合图2A所述的，在串扰消除块235之前，声音增强处理阶段230中存在多个处理块。类似地，在串扰消除块235之后的后处理阶段240中也存在至少一个处理块。图6是根据说明性实施例的对音频信号的左侧分量和右侧分量执行串扰消除之前和之后的处理步骤的流程图。

在对左侧分量和右侧分量执行串扰消除之前(步骤601)，数据处理系统100使用第一带通滤波器对左侧分量和右侧分量执行均衡，以获得带通滤波后的左侧分量和带通滤波后的右侧分量(步骤603)。在一些实施例中，第一带通滤波器使由串扰消除块235造成的梳状滤波引起的不希望的染色最小化，并保持音场宽度不收缩。串扰消除的一个副作用是梳状滤波。当声音信号的两个或更多个副本相同但具有相位差时，会发生梳状滤波。它因滤波器的频率响应形状而得名，由一系列规则间隔的尖峰组成。为了减少梳状滤波的影响，在左右信号进入串扰消除块235之前，将第一带通滤波器引入EQ块231。通过将音频信号抑制在预先定义的频率范围之外，可以更好地控制梳状滤波效应的量，从而减少输出信号的染色。通过在串扰消除之前对音频信号进行带通滤波，听觉系统可以忽略听觉系统通过头部移动无法解决的模糊信息。

已经发现，本申请中公开的发明要产生最佳响应要在预先定义的频率范围内。人类听觉系统检测并比较两个鼓膜的运动的差异。每个神经元都有一个它最敏感的特定频率范围。此外，还有一些其它影响人类听觉系统行为的物理和生理限制。例如，听觉神经元具有触觉阈值，到达该阈值就会触发冲动，在下一次触发之前需要一段时间使冲动冷却。为了使该过程更有效率且更有效果，已经发现对于本文公开的发明的最佳响应频率约为150Hz至6000Hz，优选为150Hz至2300Hz。

如图2A所示，来自第一带通滤波器的残差被加回到串扰消除步骤之后的结果信号中。为此，数据处理系统100通过分别从带通滤波后的左侧分量和带通滤波后的右侧分量中减去左侧分量和右侧分量，生成左侧残余分量和右侧残余分量(步骤605)。在一些实施例中，放大器被应用于残余信号和来自串扰消除步骤的结果信号，以在这两个信号被组合在一起之前调整这两个信号的增益。

图7A-7C是根据说明性实施例的音频信号的动态范围压缩的流程图。在一些实施例中，DRC块233中包括第二带通滤波器。用户(例如，音响工程师)可以在应用串扰消除之前调整第二带通滤波器以遮蔽特定频带。由此，用户可以突出自己选择的某些特定声音事件。例如，在使用第一带通滤波器对左侧分量和右侧分量执行均衡之后(步骤701)，数据处理系统100使用第二带通滤波器从左侧分量和右侧分量中去除预先定义的频带(步骤703)。在EQ块231和DRC块233中使用的代表性带通滤波器包括双二阶滤波器或巴特沃斯(Butterworth)滤波器。

在一些实施例中，在使用第一带通滤波器对左侧分量和右侧分量执行均衡之后(步骤711)，数据处理系统100对左侧分量和右侧分量执行第一动态范围压缩以相对于其它频率突出预先定义的频带(步骤713)。

在一些实施例中，在将左侧残余分量和右侧残余分量分别组合到左侧分量和右侧分量中之后，数据处理系统100对左侧分量和右侧分量执行第二动态范围压缩，以在数字音频输出信号中保留定位线索(步骤723)。

在一些实施例中，当将定位信息放回到声音信号中时，两个声道(左声道和右声道)之间的互相关被最大化。结果，对于某些类型的声音，例如古典音乐或电影的背景音乐，得到的音场宽度可能太宽。这个问题可以通过使用以下公式调整音场的宽度解决：

其中，-5≤β≤0是场宽度参数。当β＝0时，得到的信号具有最大音场宽度，当β＝-5时得到的信号接近单声道信号。

上面的示例假定输入信号是立体声音频信号(两个声道)或单声道音频信号(一个声道)。但是可以很容易地使用该同一处理流水线来处理多声道音频输入信号(包括多于两个声道)或生成多声道音频输出信号。

图8A-8C是示出根据说明性实施例的将立体声/多声道声音信号转换成多声道/立体声声音信号的不同声音处理阶段的框图。

如图8A所示，流水线与图2A中所示的流水线相似。流水线的输入是具有左声道和右声道的立体声音频信号。流水线的输出是具有五个声道的多声道音频信号，即左环绕声道(Ls)801、右环绕声道(R_S)803、左声道(L)805、右声道(R)807和中央声道(C)809。在该示例中，左环绕声道(L_S)801和右环绕声道(R_S)803是平移步骤之后的左侧分量和右侧分量。中央声道(C)809是M/S混合器生成的中部分量。注意，左环绕声道(L_S)801和右环绕声道(R_S)803对应于如上结合图3A所述的中间左侧分量和中间右侧分量。在一些实施例中(图8A未示出)中，在被馈送到多声道音频系统的对应扬声器之前，左环绕声道(L_S)801和右环绕声道(R_S)803被进一步放大。在一些其它实施例中，左环绕声道(L_S)801和右环绕声道(R_S)803是图8A中所示的放大器A1的输出信号。

如图8B所示，流水线与图2A中所示的流水线类似，不同之处在于流水线的输入是具有五个声道的多声道音频信号，即左环绕声道(L_S)811、右环绕声道(R_S)813、左声道(L)815、右声道(R)817以及中央声道(C)819。在该示例中，在平移步骤之后，左环绕声道(L_S)811和右环绕声道(R_S)813被组合到左侧分量和右侧分量中。中央声道(C)819也被合并到由M/S混合器生成的中部分量中。在将五个声道组合成两个声道的预处理阶段之后，剩下的操作与图2A中所示的相同。

最后，图8C示出其输入和输出都是具有五个声道的多声道音频信号的流水线。输入多声道音频信号具有左环绕声道(L_S)821、右环绕声道(R_S)823、左声道(L)825、右声道(R)827和中央声道(C)829。输出多声道音频信号具有左环绕声道(L’_S)831、右环绕声道(R’_S)833、左声道(L’)835、右声道(R’)837和中央声道(C’)839。在该示例中，在平移步骤之后，左环绕声道(L_S)821和右环绕声道(R_S)823被组合到左侧分量和右侧分量中，然后作为左环绕声道(L’_S)831和右环绕声道(R’_S)833输出。中央声道(C)819也被组合到由M/S混音器生成的中部分量中，然后作为中央声道(C’)839输出。生成左声道(L’)835和右声道(R’)837的处理步骤与图2A中所示的相同。

最后，应该注意，本发明的实施例可以采取全部是硬件、全部是软件、或既包含硬件元件也包含软件元件的形式。在优选实施例中，本发明以软件实施，其包括但不限于固件、驻留软件、微码等。

此外，本发明可采用计算机程序产品的形式，其可从计算机可使用的或计算机可读取的介质存取，该介质提供被计算机或任何指令执行系统使用或与其结合使用的程序代码。为了说明起见，计算机可使用的或计算机可读取的介质可以是可包含、储存、通讯、传播或传输程序以供指令执行系统、装置或设备使用或与其结合使用的任何有形装置。

介质可以是电子、磁性、光学、电磁、红外或半导体的系统(或装置、或设备)或传播介质。计算机可读介质的例子包括半导体或固态存储器、磁带、可移动计算机磁盘、随机存取存储器(RAM)、只读存储器(ROM)、硬磁盘和光盘。现在光盘的例子包括CD-ROM(只读致密盘)、CD-R/W(读写致密盘)和DVD。

适合存储和/或执行程序代码的数据处理系统会包括通过系统总线直接或间接连接到存储元件的至少一个处理器。存储元件可以包括在程序代码的实际执行期间使用的本地存储器、大容量存储器和提供至少一些程序代码的临时存储以便减少在执行期间必须从大容量存储器检索代码的次数的高速缓存存储器。在一些实施例中，数据处理系统以半导体芯片(例如，芯片上系统)的形式实现，该半导体芯片将计算机或其它电子系统的所有部件集成到单个芯片衬底中。

输入/输出(I/O)设备(包括但不限于键盘、显示器、指针设备等)可直接或通过中间I/O控制器连接到系统。

还可以在系统上连接网络适配器，以使数据处理系统能够通过中间私人网络或公共网络连接到其它数据处理系统、远程打印机或存储设备。调制解调器、电缆调制解调器和以太网卡不过是当前可用的网络适配器类型中的几种。

本申请的描述是出于说明和描述的目的呈现的，并不旨在穷举或将本发明限制为所公开的形式。对于本领域的普通技术人员来说，许多修改和变化是显而易见的。选择和描述实施例是为了以最佳方式解释本发明的原理和实际应用，并使本领域的其它普通技术人员理解，本发明的带有各种修改的各种实施例是为了适合想到的具体用途。

本文实施例的描述中使用的术语仅用于描述特定实施例的目的，而不旨在限制权利要求的范围。如在实施例和所附权利要求的描述中使用的，单数形式“一个”和“该”也可以包括多个，除非上下文清楚地指出不是这样。还应当理解，本文所使用的术语“和/或”是指并且包含一个或多个相关的所列项目的任何和所有可能的组合。还应当理解，当在本说明书中使用时，术语“包括”和/或“包含”指所陈述的特征、整体、步骤、操作、元件和/或部件的存在，但并不排除还存在或添加一个或多个其它特征、整体、步骤、操作、元件、部件和/或其组合。

还应当理解，尽管在此可以使用术语第一、第二等来描述各种元件，但是这些元件不应该被这些术语限制。这些术语仅用于区分一个元件和另一个元件。例如，第一端口可以被称为第二端口，同样地，第二端口可以被称为第一端口，这并不偏离实施例的范围。第一个端口和第二个端口都是端口，但它们不是同一个端口。

受益于前面的描述和相关附图中呈现的教导，本领域技术人员会想到在此描述的实施例的许多修改和替代实施例。因此，应该理解，权利要求的范围不限于所公开的实施例的具体示例，并且修改和其它实施例都应该被包括在所附权利要求的范围内。尽管在此使用了特定的术语，但它们仅是在一般性和描述性的层面被使用的，而不是出于限制的目的。

选择和描述实施例是为了最佳地解释基本原理及其实际应用，从而使本领域的其它技术人员以适合所想到的具体用途的方式，最佳地利用基本原理和具有各种修改的各种实施例。

Claims

1.一种用于处理音频信号的方法，包括：

在具有一个或多个处理器、至少两个扬声器、存储器和存储在所述存储器中且由所述一个或多个处理器执行的多个程序模块的计算设备中：

接收数字立体声音频输入信号；

从所述数字立体声音频输入信号提取定位线索；

至少部分地根据所述定位线索从所述数字立体声音频输入信号生成左侧分量和右侧分量；

分别对所述左侧分量和所述右侧分量执行串扰消除，以获得消除了串扰的左侧分量和消除了串扰的右侧分量；以及

生成包含所述消除了串扰的左侧分量和所述消除了串扰的右侧分量的数字立体声音频输出信号。

2.根据权利要求1所述的方法，其中，所述从所述数字立体声音频输入信号生成左侧分量和右侧分量的步骤进一步包括：

从所述数字立体声音频输入信号中提取中部分量、初始左侧分量和初始右侧分量；

根据所述定位线索分别将所述中部分量平移到所述初始左侧分量和所述初始右侧分量中，以获得中间左侧分量和中间右侧分量；以及

分别将所述中部分量的第一副本与所述中间左侧分量上混，将所述中部分量的第二副本与所述中间右侧分量上混，以获得所述左侧分量和所述右侧分量，其中在所述中部分量的所述第一副本和所述第二副本之间有预先定义的时间间隔。

3.根据权利要求2所述的方法，其中，所述中部分量、所述中间左侧分量和所述中间右侧分量分别对应于多声道音频系统的中央声道、左环绕信号和右环绕声道。

4.根据权利要求2所述的方法，其中，所述根据所述定位线索分别将所述中部分量平移到所述初始左侧分量和所述初始右侧分量中，以获得中间左侧分量和中间右侧分量的步骤进一步包括：

接收多声道音频系统的中央声道、左环绕声道和右环绕声道；

将所述中央声道与所述中部分量组合；以及

分别将所述左环绕声道和所述右环绕声道与所述中间左侧分量和所述中间右侧分量组合。

5.根据权利要求2所述的方法，其中，所述数字立体声音频输入信号进一步包括左信号和右信号；且所述从所述数字立体声音频输入信号中提取中部分量、初始左侧分量和初始右侧分量的步骤进一步包括：

使用离散短时傅里叶变换将所述左信号和所述右信号从时域变换到频域；

将所述频域中的所述中部分量定义为所述频域中的所述左信号和所述右信号中的对于所述频域中的预先定义的频率具有较小量值的那一个信号；

使用离散短时傅里叶逆变换将所述中部分量从所述频域变换回所述时域；以及

通过分别从所述左信号和所述右信号中减去所述时域中的所述中部分量，来生成所述初始左侧分量和所述初始右侧分量。

6.根据权利要求2所述的方法，其中，所述数字立体声音频输入信号进一步包括左信号和右信号；且所述根据所述定位线索分别将所述中部分量平移到所述初始左侧分量和所述初始右侧分量中，以获得中间左侧分量和中间右侧分量的步骤进一步包括：

分别将左幅度平移参数和右幅度平移参数应用于所述中部分量，以获得初始中左分量和初始中右分量；

确定所述左信号和所述右信号之间的耳间时间差ITD和耳间强度差IID；

将所述ITD和所述IID应用于所述初始中左分量和所述初始中右分量中的至少一个，以获得中间中左分量和中间中右分量；以及

分别将所述初始左侧分量与所述中间中左分量组合，将所述初始右侧分量与所述中间中右分量组合，以获得所述中间左侧分量和所述中间右侧分量。

7.根据权利要求6所述的方法，进一步包括：

确定与所述数字立体声音频输入信号相关联的声源的角度；

根据所述声源的角度计算所述ITD和所述IID；

通过将所述ITD的时间偏移和所述IID的幅度倍数应用于所述初始中右分量来更新所述初始中右分量；以及

将所述更新了的初始中右分量组合到所述初始中左分量中，作为所述中间中左分量。

8.根据权利要求1所述的方法，其中，进一步包括：

在对所述左侧分量和所述右侧分量执行串扰消除之前：

使用第一带通滤波器分别对所述左侧分量和所述右侧分量执行均衡，以获得带通滤波后的左侧分量和带通滤波后的右侧分量；

通过分别从所述带通滤波后的左侧分量和所述带通滤波后的右侧分量中减去所述左侧分量和所述右侧分量，来生成左侧残余分量和右侧残余分量；以及

在对所述左侧分量和所述右侧分量执行串扰消除之后：

分别将所述左侧残余分量和所述右侧残余分量组合到所述消除了串扰的左侧分量和所述消除了串扰的右侧分量中。

9.根据权利要求8所述的方法，进一步包括：

在使用所述第一带通滤波器对所述左侧分量和所述右侧分量执行均衡之后：

使用第二带通滤波器从所述左侧分量和所述右侧分量中去除预先定义的频带。

10.根据权利要求8所述的方法，进一步包括：

对所述左侧分量和所述右侧分量执行第一动态范围压缩，以相对于其它频率突出预先定义的频带。

11.根据权利要求8所述的方法，进一步包括：

在分别将所述左侧残余分量和所述右侧残余分量组合到所述消除了串扰的左侧分量和所述消除了串扰的右侧分量中之后：

对所述消除了串扰的左侧分量和所述消除了串扰的右侧分量执行第二动态范围压缩，以在所述数字立体声音频输出信号中保留所述定位线索。

12.一种用于处理音频信号的计算设备，包括：

一个或多个处理器；

存储器；以及

存储在所述存储器中且由所述一个或多个处理器执行的多个程序模块，其中所述多个程序模块在由所述一个或多个处理器执行时使所述计算设备执行多个步骤，所述多个步骤包括：

接收数字立体声音频输入信号；

从所述数字立体声音频输入信号提取定位线索；

13.根据权利要求12所述的计算设备，其中，所述从所述数字立体声音频输入信号生成左侧分量和右侧分量的步骤进一步包括：

14.根据权利要求13所述的计算设备，其中，所述中部分量、所述中间左侧分量和所述中间右侧分量分别对应于多声道音频系统的中央声道、左环绕信号和右环绕声道。

15.根据权利要求13所述的计算设备，其中，所述根据所述定位线索分别将所述中部分量平移到所述初始左侧分量和所述初始右侧分量中，以获得中间左侧分量和中间右侧分量的步骤进一步包括：

将所述中央声道与所述中部分量组合；以及

16.根据权利要求13所述的计算设备，其中，所述数字立体声音频输入信号进一步包括左信号和右信号，且所述从所述数字立体声音频输入信号中提取中部分量、初始左侧分量和初始右侧分量的步骤进一步包括：

17.根据权利要求13所述的计算设备，其中，所述数字立体声音频输入信号进一步包括左信号和右信号，且所述根据所述定位线索分别将所述中部分量平移到所述初始左侧分量和所述初始右侧分量中，以获得中间左侧分量和中间右侧分量的步骤进一步包括：

18.根据权利要求17所述的计算设备，其中所述多个步骤进一步包括：

确定与所述数字立体声音频输入信号相关联的声源的角度；

根据所述声源的角度计算所述ITD和所述IID；

19.根据权利要求12所述的计算设备，其中，所述多个步骤进一步包括：

在对所述左侧分量和所述右侧分量执行串扰消除之前：

在对所述左侧分量和所述右侧分量执行串扰消除之后：

20.根据权利要求19所述的计算设备，其中，所述多个步骤进一步包括：

21.根据权利要求19所述的计算设备，其中，所述多个步骤进一步包括：

22.根据权利要求19所述的计算设备，其中，所述多个步骤进一步包括：

23.一种存储在非暂时性计算机可读存储介质中的计算机程序产品，其与具有用于处理音频信号的一个或多个处理器的计算设备相结合，所述计算机程序产品包括多个程序模块，所述程序模块在由所述一个或多个处理器执行时使所述计算设备执行多个步骤，所述多个步骤包括：

接收数字立体声音频输入信号；

从所述数字立体声音频输入信号中提取定位线索；

至少部分根据所述定位线索从所述数字立体声音频输入信号生成左侧分量和右侧分量；

24.根据权利要求23所述的计算机程序产品，其中，所述从所述数字立体声音频输入信号生成左侧分量和右侧分量的步骤进一步包括：

分别将所述中部分量的第一副本与所述中间左侧分量上混，将中部分量的第二副本与所述中间右侧分量上混，以获得所述左侧分量和所述右侧分量，其中在所述中部分量的所述第一副本和所述第二副本之间有预先定义的时间间隔。

25.根据权利要求24所述的计算机程序产品，其中，所述中部分量、所述中间左侧分量和所述中间右侧分量分别对应于多声道音频系统的中央声道、左环绕信号和右环绕声道。

26.根据权利要求24所述的计算机程序产品，其中，所述根据所述定位线索分别将所述中部分量平移到所述初始左侧分量和所述初始右侧分量中，以获得中间左侧分量和中间右侧分量的步骤进一步包括：

将所述中央声道与所述中部分量组合；以及

27.根据权利要求24所述的计算机程序产品，其中，所述数字立体声音频输入信号进一步包括左信号和右信号，且所述从所述数字立体声音频输入信号中提取中部分量、初始左侧分量和初始右侧分量的步骤进一步包括：

28.根据权利要求24所述的计算机程序产品，其中，所述数字立体声音频输入信号进一步包括左信号和右信号，且所述根据所述定位线索分别将所述中部分量平移到所述初始左侧分量和所述初始右侧分量中，以获得中间左侧分量和中间右侧分量的步骤进一步包括：

29.根据权利要求28所述的计算机程序产品，其中所述多个步骤进一步包括：

确定与所述数字立体声音频输入信号相关联的声源的角度；

根据所述声源的角度计算所述ITD和所述IID；

30.根据权利要求23所述的计算机程序产品，其中，所述多个步骤进一步包括：

在对所述左侧分量和所述右侧分量执行串扰消除之前：

使用第一带通滤波器对所述左侧分量和所述右侧分量执行均衡，以获得带通滤波后的左侧分量和带通滤波后的右侧分量；

在对所述左侧分量和所述右侧分量执行串扰消除之后：

31.根据权利要求30所述的计算机程序产品，其中，所述多个步骤进一步包括：

32.根据权利要求30所述的计算机程序产品，其中，所述多个步骤进一步包括：

33.根据权利要求30所述的计算机程序产品，其中，所述多个步骤进一步包括：

34.一种用于处理音频信号的方法，包括：

在具有一个或多个处理器、存储器和存储在所述存储器中且由所述一个或多个处理器执行的多个程序模块的计算设备中：

接收包括左声道和右声道的数字音频输入信号；

从所述数字音频输入信号中提取中部分量、左侧分量和右侧分量；

将所述中部分量分别平移到所述左侧分量和所述右侧分量中；

将所述中部分量的两个副本分别与所述左侧分量和所述右侧分量上混，其中在所述中部分量的两个副本之间有预先定义的时间间隔；

生成包含所述消除了串扰的左侧分量和所述消除了串扰的右侧分量的数字音频输出信号。

35.一种用于处理音频信号的方法，包括：

接收数字单声道音频输入信号；

从所述数字单声道音频输入信号中提取定位线索；

至少部分地根据所述定位线索从所述数字单声道音频输入信号生成左侧分量和右侧分量；

36.根据权利要求35所述的方法，其中，所述从所述数字单声道音频输入信号生成左侧分量和右侧分量的步骤进一步包括：

根据所述定位线索分别将所述数字单声道音频输入信号平移到初始左侧分量和初始右侧分量中；以及

分别将所述数字单声道音频输入信号的第一副本与所述初始左侧分量上混，将所述数字单声道音频输入信号的第二副本与所述初始右侧分量上混，以获得所述左侧分量和所述右侧分量，其中在所述数字单声道音频输入信号的所述第一副本和所述第二副本之间有预先定义的时间间隔。

37.根据权利要求36所述的方法，其中，所述数字单声道音频输入信号、所述初始左侧分量和所述初始右侧分量分别对应于多声道音频系统的中央声道、左环绕信号和右环绕声道。

38.根据权利要求36所述的方法，其中，所述根据所述定位线索分别将所述数字单声道音频输入信号平移到初始左侧分量和初始右侧分量中的步骤进一步包括：

分别将左幅度平移参数和右幅度平移参数应用于所述数字单声道音频输入信号，以获得初始中左分量和初始中右分量；

根据所述定位线索确定耳间时间差ITD和耳间强度差IID；以及

将所述ITD和所述IID应用于所述初始中左分量和所述初始中右分量中的至少一个，以获得所述初始左侧分量和所述初始右侧分量。

39.根据权利要求35所述的方法，进一步包括：

在对所述左侧分量和所述右侧分量执行串扰消除之前：

在对所述左侧分量和所述右侧分量执行串扰消除之后：

40.根据权利要求39所述的方法，进一步包括：

使用第二带通滤波器从所述左侧分量和所述右侧分量去除预先定义的频带。

41.根据权利要求39所述的方法，进一步包括：

42.根据权利要求39所述的方法，进一步包括：

在分别将所述左侧残余分量和所述右侧残余分量组合到所述左侧分量和所述右侧分量中之后：

43.一种用于处理音频信号的计算设备，包括：

一个或多个处理器；

存储器；以及

接收数字单声道音频输入信号；

从所述数字单声道音频输入信号中提取定位线索；

44.根据权利要求43所述的计算设备，其中，所述从所述数字单声道音频输入信号生成左侧分量和右侧分量的步骤进一步包括：

45.根据权利要求44所述的计算设备，其中，所述数字单声道音频输入信号、所述初始左侧分量和所述初始右侧分量分别对应于多声道音频系统的中央声道、左环绕信号和右环绕声道。

46.根据权利要求44所述的计算设备，其中，所述根据所述定位线索分别将所述数字单声道音频输入信号平移到初始左侧分量和初始右侧分量中的步骤进一步包括：

分别将左幅度平移参数和右幅度平移参数应用于数字单声道音频输入信号，以获得初始中左分量和初始中右分量；

根据所述定位线索确定耳间时间差ITD和耳间强度差IID；以及

47.根据权利要求43所述的计算设备，其中，所述多个步骤进一步包括：

在对所述左侧分量和所述右侧分量执行串扰消除之前：

在对所述左侧分量和所述右侧分量执行串扰消除之后，

48.根据权利要求47所述的计算设备，其中，所述多个步骤进一步包括：

49.根据权利要求47所述的计算设备，其中，所述多个步骤进一步包括：

50.根据权利要求47所述的计算设备，其中，所述多个步骤进一步包括：

51.一种存储在非暂时性计算机可读存储介质中的计算机程序产品，其与具有用于处理音频信号的一个或多个处理器的计算设备相结合，所述计算机程序产品包括多个程序模块，所述程序模块在由所述一个或多个处理器执行时使所述计算设备执行多个步骤，所述多个步骤包括：

接收数字单声道音频输入信号；

从所述数字单声道音频输入信号中提取定位线索；

52.根据权利要求51所述的计算机程序产品，其中，所述从所述数字单声道音频输入信号生成左侧分量和右侧分量的步骤进一步包括：

53.根据权利要求52所述的计算机程序产品，其中，所述数字单声道音频输入信号、所述初始左侧分量和所述初始右侧分量分别对应于多声道音频系统的中央声道、左环绕信号和右环绕声道。

54.根据权利要求52所述的计算机程序产品，其中，所述根据所述定位线索分别将所述数字单声道音频输入信号平移到初始左侧分量和初始右侧分量中的步骤进一步包括：

根据所述定位线索确定耳间时间差ITD和耳间强度差IID；以及

55.根据权利要求51所述的计算机程序产品，其中，所述多个步骤进一步包括：

在对所述左侧分量和所述右侧分量执行串扰消除之前：

在对所述左侧分量和所述右侧分量执行串扰消除之后：

56.根据权利要求55所述的计算机程序产品，其中，所述多个步骤进一步包括：

57.根据权利要求55所述的计算机程序产品，其中，所述多个步骤进一步包括：

58.根据权利要求55所述的计算机程序产品，其中，所述多个步骤进一步包括：

59.一种用于处理音频信号的方法，包括：

接收数字单声道音频输入信号；

将所述数字单声道音频输入信号分别平移到左侧分量和右侧分量中；

将所述数字单声道音频输入信号的两个副本分别与所述左侧分量和所述右侧分量上混，其中在所述中部分量的所述两个副本之间存在预先定义的时间间隔；

60.一种用于处理音频信号的方法，包括：

接收数字立体声音频输入信号；

从所述数字立体声音频输入信号中提取中部分量、左侧分量和右侧分量；

产生所述中部分量的第一副本和第二副本，其中在所述中部分量的所述第一副本和所述第二副本之间有预先定义的时间间隔；

分别将所述中部分量的所述第一副本与所述左侧分量组合成左声道，将所述中部分量的所述第二副本与所述右侧分量组合成右声道；以及

生成包含所述左声道和所述右声道的数字立体声音频输出信号。

61.根据权利要求60所述的方法，其中，所述数字立体声音频输入信号进一步包括左信号和右信号，且所述从所述数字立体声音频输入信号中提取中部分量、左侧分量和右侧分量的步骤进一步包括：

通过分别从所述左信号和所述右信号中减去所述时域中的所述中部分量，来生成所述左侧分量和所述右侧分量。

62.根据权利要求60所述的方法，其中，所述数字立体声音频输入信号进一步包括左信号和右信号，且

所述将所述中部分量分别平移到所述左侧分量和所述右侧分量中的步骤进一步包括：

分别将所述左侧分量与所述中间中左分量组合，将所述初始右侧分量与所述中间中右分量组合。

63.根据权利要求62所述的方法，进一步包括：

确定与所述数字立体声音频输入信号相关联的声源的角度；

根据所述声源的角度计算所述ITD和所述IID；

64.根据权利要求60所述的方法，进一步包括：

通过分别从所述带通滤波后的左侧分量和所述带通滤波后的右侧分量中减去所述左侧分量和所述右侧分量，来生成左侧残余分量和右侧残余分量；

分别对所述带通滤波后的左侧分量和所述带通滤波后的右侧分量执行串扰消除，得到消除了串扰的左侧分量和消除了串扰的右侧分量；以及

65.根据权利要求64所述的方法，进一步包括：

66.根据权利要求64所述的方法，进一步包括：

对所述左侧分量和所述右侧分量执行第一动态范围压缩以相对于其它频率突出预先定义的频带。

67.根据权利要求64所述的方法，进一步包括：

68.一种用于处理音频信号的计算设备，包括：

一个或多个处理器；

存储器；以及

接收数字立体声音频输入信号；

69.根据权利要求68所述的计算设备，其中，所述数字立体声音频输入信号进一步包括左信号和右信号，且

所述从所述数字立体声音频输入信号中提取中部分量、左侧分量和右侧分量的步骤进一步包括：

70.根据权利要求68所述的计算设备，其中，所述数字立体声音频输入信号进一步包括左信号和右信号，且所述将所述中部分量分别平移到所述左侧分量和所述右侧分量中的步骤进一步包括：

71.根据权利要求70所述的计算设备，其中所述多个步骤进一步包括：

确定与所述数字立体声音频输入信号相关联的声源的角度；

根据所述声源的角度计算所述ITD和所述IID；

72.根据权利要求68所述的计算设备，其中，所述多个步骤进一步包括：

73.根据权利要求72所述的计算设备，其中所述多个步骤进一步包括：

74.根据权利要求72所述的计算设备，其中所述多个步骤进一步包括：

在使用所述第一带通滤波器执行对所述左侧分量和所述右侧分量的均衡之后：

75.根据权利要求72所述的计算设备，其中，所述多个步骤进一步包括：

76.一种存储在非暂时性计算机可读存储介质中的计算机程序产品，其与具有用于处理音频信号的一个或多个处理器的计算设备相结合，所述计算机程序产品包括多个程序模块，所述程序模块在由所述一个或多个处理器执行时使所述计算设备执行多个步骤，所述多个步骤包括：

接收数字立体声音频输入信号；

77.根据权利要求76所述的计算机程序产品，其中，所述数字立体声音频输入信号进一步包括左信号和右信号，且所述从所述数字立体声音频输入信号中提取中部分量、左侧分量和右侧分量的步骤进一步包括：

78.根据权利要求76所述的计算机程序产品，其中，所述数字立体声音频输入信号进一步包括左信号和右信号，且所述将所述中部分量分别平移到所述左侧分量和所述右侧分量中的步骤进一步包括：

79.根据权利要求78所述的计算机程序产品，其中所述多个步骤进一步包括：

确定与所述数字立体声音频输入信号相关联的声源的角度；

根据所述声源的角度计算所述ITD和所述IID；

80.根据权利要求76所述的计算机程序产品，其中，所述多个步骤进一步包括：

通过分别从所述带通滤波后的左侧分量和所述带通滤波后的右侧分量中减去左侧分量和右侧分量，来生成左侧残余分量和右侧残余分量；

81.根据权利要求80所述的计算机程序产品，其中，所述多个步骤进一步包括：

82.根据权利要求80所述的计算机程序产品，其中，所述多个步骤进一步包括：

83.根据权利要求80所述的计算机程序产品，其中，所述多个步骤进一步包括：

84.一种用于处理音频信号的方法，包括：

接收数字音频输入信号；

通过增强在预先定义的频率范围内的数字音频输入信号来对所述数字音频输入信号执行均衡，并从均衡后的音频信号生成残余音频信号；

对所述均衡后的音频信号执行动态范围压缩；

对所述均衡后的音频信号执行串扰消除，以获得消除了串扰的音频信号；以及

将所述消除了串扰的音频信号和所述残余音频信号组合成数字音频输出信号。

85.根据权利要求84所述的方法，其中，所述通过增强在预先定义的频率范围内的数字音频输入信号来对所述数字音频输入信号执行均衡，并从均衡后的音频信号生成残余音频信号的步骤进一步包括：

将第一带通滤波器应用于所述数字音频输入信号以获得带通滤波后的音频信号；以及

通过从所述数字音频输入信号中减去所述带通滤波后的音频信号，来生成所述残余音频信号。

86.根据权利要求85所述的方法，进一步包括：

在使用所述第一带通滤波器对所述数字音频输入信号执行均衡之后：

使用第二带通滤波器从所述带通滤波后的音频信号中去除预先定义的频带。

87.根据权利要求84所述的方法，进一步包括：

对所述带通滤波后的音频信号执行第一动态范围压缩，以相对于其它频率突出预先定义的频带。

88.根据权利要求84所述的方法，其中，所述数字音频输入信号是立体声音频输入信号的左声道，该立体声音频输入信号还包括右声道，且

所述对所述均衡后的音频信号执行串扰消除，以获得消除了串扰的音频信号的步骤进一步包括：

使用被类似处理的右声道对所述左声道执行串扰消除，以获得消除了串扰的左声道音频信号；以及

使用所述均衡后的音频信号对所述右声道执行串扰消除，以获得消除了串扰的右声道音频信号。

89.一种用于处理音频信号的计算设备，包括：

一个或多个处理器；

存储器；以及

接收数字音频输入信号；

对所述均衡后的音频信号执行动态范围压缩；

90.根据权利要求89所述的计算设备，其中，所述通过增强在预先定义的频率范围内的数字音频输入信号来对所述数字音频输入信号执行均衡，并从均衡后的音频信号生成残余音频信号的步骤进一步包括：

91.根据权利要求90所述的计算设备，其中所述多个步骤进一步包括：

使用第二带通滤波器从所述带通滤波后的音频信号中去除预先

定义的频带。

92.根据权利要求90所述的计算设备，其中所述多个步骤进一步包括：

93.根据权利要求92所述的计算设备，其中，所述数字音频输入信号是立体声音频输入信号的左声道，该立体声音频输入信号还包括右声道，且所述对所述均衡后的音频信号执行串扰消除，以获得消除了串扰的音频信号的步骤进一步包括：

94.一种存储在非暂时性计算机可读存储介质中的计算机程序产品，其与具有用于处理音频信号的一个或多个处理器的计算设备相结合，所述计算机程序产品包括多个程序模块，所述程序模块在由所述一个或多个处理器执行时使所述计算设备执行多个步骤，所述多个步骤包括：

接收数字音频输入信号；

对所述均衡后的音频信号执行动态范围压缩；

95.根据权利要求94所述的计算机程序产品，其中，所述通过增强在预先定义的频率范围内的数字音频输入信号来对所述数字音频输入信号执行均衡，并从均衡后的音频信号生成残余音频信号的步骤进一步包括：

96.根据权利要求95所述的计算机程序产品，其中所述多个步骤进一步包括：

定义的频带。

97.根据权利要求95所述的计算机程序产品，其中所述多个步骤进一步包括：

98.根据权利要求97所述的计算机程序产品，其中，所述数字音频输入信号是立体声音频输入信号的左声道，该立体声音频输入信号还包括右声道，且所述对所述均衡后的音频信号执行串扰消除，以获得消除了串扰的音频信号的步骤进一步包括：