CN108600936B

CN108600936B - 多声道音频处理方法、装置、计算机可读存储介质和终端

Info

Publication number: CN108600936B
Application number: CN201810356544.XA
Authority: CN
Inventors: 黄传增
Original assignee: Beijing Microlive Vision Technology Co Ltd
Current assignee: Tiktok Technology Co ltd
Priority date: 2018-04-19
Filing date: 2018-04-19
Publication date: 2020-01-03
Anticipated expiration: 2038-04-19
Also published as: CN108600936A

Abstract

本发明公开一种多声道音频处理方法、多声道音频处理装置、多声道音频处理硬件装置、计算机可读存储介质和多声道音频处理终端。其中，该多声道音频处理方法包括获取待处理多声道音频；获取音频处理参数；基于音频处理参数，对待处理多声道音频进行处理。本发明实施例通过采取该技术方案，可以根据音频处理参数，对待处理多声道音频进行相应的处理，由此可以根据不同的音频处理参数获得相应的音频效果，从而解决了如何提高用户体验效果的技术问题。

Description

多声道音频处理方法、装置、计算机可读存储介质和终端

技术领域

本发明涉及一种音频技术领域，特别是涉及一种多声道音频处理方法、装置、计算机可读存储介质和终端。

背景技术

随着音频互动的流行，音频越来越多地作为这种互动的信息传播载体。为了获得良好的互动体验效果，用户开始越来越多地关注音频的体验效果。

目前，现有技术普遍针对单声道音频进行处理。对于多声道音频而言，由于处理单声道音频的方法并没有考虑多声道音频中各个声道音频的特点。因此，用户无法针对多声道音频进行调整，以获得更好地体验效果。

对此，提供一种可获得良好用户体验效果的多声道音频处理方法是亟需解决的技术问题。

发明内容

本发明解决的技术问题是提供一种多声道音频处理方法，以至少部分地解决如何提高用户体验效果的技术问题。此外，还提供一种多声道音频处理装置、多声道音频处理硬件装置、计算机可读存储介质和多声道音频处理终端。

为了实现上述目的，根据本发明的一个方面，提供以下技术方案：

一种多声道音频处理方法，包括：

获取待处理多声道音频；

获取音频处理参数；

基于所述音频处理参数，对所述待处理多声道音频进行处理。

进一步地，所述获取音频处理参数的步骤，包括：

当接收到音频模式指令时，获取与所述音频模式指令对应的、所述待处理多声道音频的音频处理参数。

进一步地，所述音频模式指令为偏移模式指令；

所述当接收到音频模式指令时，获取与音频模式指令对应的、所述待处理多声道音频的音频处理参数的步骤，包括：

当接收到所述偏移模式指令时，获取与所述偏移模式指令对应的、所述待处理多声道音频的音频包络；

所述基于所述音频处理参数，对所述待处理多声道音频进行处理的步骤，包括：

调整所述待处理多声道音频的音频包络。

进一步地，所述调整所述待处理多声道音频的音频包络的步骤具体包括：

调整所述待处理多声道音频的基频和共振峰。

进一步地，所述音频模式指令为保持模式指令；

当接收到所述保持模式指令时，获取与所述保持模式指令对应的、所述待处理多声道音频的音频包络和基频；

在保持所述音频包络的情况下，调整所述基频。

进一步地，所述音频模式指令为清脆模式指令；

所述当接收到音频模式指令时，获取与所述音频模式指令对应的、所述待处理多声道音频的音频处理参数的步骤，包括：

当接收到清脆模式指令时，获取与所述清脆模式指令对应的、所述待处理多声道音频的瞬态脉冲和音频相位；

在所述待处理多声道音频的全频域内将所述瞬态脉冲的相位设置为零，或者，在所述待处理多声道音频的全频域内将所述瞬态脉冲的相位设置为零，并对所述瞬态脉冲的幅值进行限制；

将所述音频相位设置为预置值。

进一步地，所述音频模式指令为平滑模式指令；

当接收到所述平滑模式指令时，获取与所述平滑模式指令对应的、所述待处理多声道音频的瞬态脉冲；

基于所述瞬态脉冲，在所述待处理多声道音频的频域内，对预定频率范围内瞬态脉冲所对应频域的幅值进行平滑处理。

进一步地，所述音频模式指令为速度模式指令；

当接收到所述速度模式指令时，获取与所述速度模式指令对应的、所述待处理多声道音频的预定的采样率、以及共振峰或基频；

按照预定的采样率对所述待处理多声道音频进行下采样；

对所述待处理多声道音频的所述共振峰进行平滑处理；或者，

调整所述待处理多声道音频的所述基频。

进一步地，所述音频模式指令为音质模式指令；

当接收到所述音质模式指令时，获取与所述音质模式指令对应的、所述待处理多声道音频的瞬态脉冲、基频、共振峰；

实时平滑所述待处理多声道音频的所述瞬态脉冲和所述共振峰；

实时调整所述待处理多声道音频的基频。

进一步地，所述音频模式指令为跨频带平滑模式指令；

当接收到所述跨频带平滑模式指令时，获取与所述跨频带平滑模式指令对应的、所述待处理多声道音频的音频相位；

基于所述音频相位，对所述待处理多声道音频的至少两个频带内的相位进行平滑处理。

进一步地，所述音频模式指令为子带内平滑模式指令；

当接收到所述子带内平滑模式指令时，获取与所述子带内平滑模式指令对应的、所述待处理多声道音频的音频相位；

基于所述音频相位，对所述待处理多声道音频的任一频带的子带内的相位进行平滑处理。

进一步地，所述音频模式指令为变速不变调模式指令；

当接收到所述变速不变调模式指令时，获取与所述变速不变调模式指令对应的、所述待处理多声道音频的音频时长；

对所述待处理多声道音频的所述音频时长进行缩短或延长处理。

进一步地，所述音频模式指令为变调不变速模式指令；

当接收到所述变调不变速模式指令时，获取与所述变调不变速模式指令对应的、所述待处理多声道音频的基频；

调整所述待处理多声道音频的所述基频。

进一步地，所述音频模式指令为变调变速模式指令；

当接收到所述变调变速模式指令时，获取与所述变调变速模式指令对应的、所述待处理多声道音频的音频时长和基频；

对所述音频时长进行缩短或延长处理；

调整所述基频。

为了实现上述目的，根据本发明的另一个方面，还提供以下技术方案：

一种多声道音频处理装置，包括：

第一获取模块，用于获取待处理多声道音频；

第二获取模块，用于获取音频处理参数；

处理模块，用于基于所述音频处理参数，对所述待处理多声道音频进行处理。

进一步地，第二获取模块，还用于当接收到音频模式指令时，获取与所述音频模式指令对应的、所述待处理多声道音频的音频处理参数。

进一步地，所述音频模式指令为偏移模式指令；

所述第二获取模块具体用于当接收到所述偏移模式指令时，获取与所述偏移模式指令对应的、所述待处理多声道音频的音频包络；

所述处理模块具体用于调整所述待处理多声道音频的音频包络。

进一步地，所述所述处理模块具体用于调整所述待处理多声道音频的基频和共振峰。

进一步地，所述音频模式指令为保持模式指令；

所述第二获取模块具体用于当接收到所述保持模式指令时，获取与所述保持模式指令对应的、所述待处理多声道音频的音频包络和基频；

所述处理模块具体用于在保持所述音频包络的情况下，调整所述基频。

进一步地，所述音频模式指令为清脆模式指令；

所述第二获取模块具体用于当接收到清脆模式指令时，获取与所述清脆模式指令对应的、所述待处理多声道音频的瞬态脉冲和音频相位；

所述处理模块具体用于在所述待处理多声道音频的全频域内将所述瞬态脉冲的相位设置为零，或者，在所述待处理多声道音频的全频域内将所述瞬态脉冲的相位设置为零，并对所述瞬态脉冲的幅值进行限制，以及将所述音频相位设置为预置值。

进一步地，所述音频模式指令为平滑模式指令；

所述第二获取模块具体用于当接收到所述平滑模式指令时，获取与所述平滑模式指令对应的、所述待处理多声道音频的瞬态脉冲；

所述处理模块具体用于基于所述瞬态脉冲，在所述待处理多声道音频的频域内，对预定频率范围内瞬态脉冲所对应频域的幅值进行平滑处理。

进一步地，所述音频模式指令为速度模式指令；

所述第二获取模块具体用于当接收到所述速度模式指令时，获取与所述速度模式指令对应的、所述待处理多声道音频的预定的采样率、以及共振峰或基频；

所述处理模块具体用于按照预定的采样率对所述待处理多声道音频进行下采样；并且，对所述待处理多声道音频的所述共振峰进行平滑处理；或者，调整所述待处理多声道音频的所述基频。

进一步地，所述音频模式指令为音质模式指令；

所述第二获取模块具体用于当接收到所述音质模式指令时，获取与所述音质模式指令对应的、所述待处理多声道音频的瞬态脉冲、基频、共振峰；

所述处理模块具体用于实时平滑所述待处理多声道音频的所述瞬态脉冲和所述共振峰，并实时调整所述待处理多声道音频的基频。

进一步地，所述音频模式指令为跨频带平滑模式指令；

所述第二获取模块具体用于当接收到所述跨频带平滑模式指令时，获取与所述跨频带平滑模式指令对应的、所述待处理多声道音频的音频相位；

所述处理模块具体用于基于所述音频相位，对所述待处理多声道音频的至少两个频带内的相位进行平滑处理。

进一步地，所述音频模式指令为子带内平滑模式指令；

所述第二获取模块具体用于当接收到所述子带内平滑模式指令时，获取与所述子带内平滑模式指令对应的、所述待处理多声道音频的音频相位；

所述处理模块具体用于基于所述音频相位，对所述待处理多声道音频的任一频带的子带内的相位进行平滑处理。

进一步地，所述音频模式指令为变速不变调模式指令；

所述第二获取模块具体用于当接收到所述变速不变调模式指令时，获取与所述变速不变调模式指令对应的、所述待处理多声道音频的音频时长；

所述处理模块对所述待处理多声道音频的所述音频时长进行缩短或延长处理。

进一步地，所述音频模式指令为变调不变速模式指令；

所述第二获取模块具体用于当接收到所述变调不变速模式指令时，获取与所述变调不变速模式指令对应的、所述待处理多声道音频的基频；

所述处理模块具体用于调整所述待处理多声道音频的所述基频。

进一步地，所述音频模式指令为变调变速模式指令；

所述第二获取模块具体用于当接收到所述变调变速模式指令时，获取与所述变调变速模式指令对应的、所述待处理多声道音频的音频时长和基频；

所述处理模块具体用于对所述音频时长进行缩短或延长处理，并调整所述基频。

为了实现上述目的，根据本发明的又一个方面，还提供以下技术方案：

一种多声道音频处理硬件装置，包括：

存储器，用于存储非暂时性计算机可读指令；以及

处理器，用于运行所述计算机可读指令，使得所述处理器执行时实现上述任一多声道音频处理方法技术方案中所述的步骤。

一种计算机可读存储介质，用于存储非暂时性计算机可读指令，当所述非暂时性计算机可读指令由计算机执行时，使得所述计算机执行上述任一多声道音频处理方法技术方案中所述的步骤。

一种多声道音频处理终端，包括上述任一多声道音频处理装置。

本发明实施例提供一种多声道音频处理方法、多声道音频处理装置、多声道音频处理硬件装置、计算机可读存储介质和多声道音频处理终端。其中，该多声道音频处理方法包括获取待处理多声道音频；获取音频处理参数；基于音频处理参数，对待处理多声道音频进行处理。。本发明实施例通过采取该技术方案，可以根据音频处理参数，对待处理多声道音频进行相应的处理，由此可以根据不同的音频处理参数获得相应的音频效果，从而提高了用户体验效果。

上述说明仅是本发明技术方案的概述，为了能更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为让本发明的上述和其他目的、特征和优点能够更明显易懂，以下特举较佳实施例,并配合附图，详细说明如下。

附图说明

图1a为根据本发明一个实施例的多声道音频处理方法的流程示意图；

图1b为根据本发明另一个实施例的多声道音频处理方法的流程示意图；

图2为根据本发明一个实施例的、用于选择敲击模式和平滑模式的示意图；

图3为根据本发明另一个实施例的多声道音频处理方法的流程示意图；

图4为根据本发明一个实施例的多声道音频处理装置的结构示意图；

图5为根据本发明一个实施例的多声道音频处理硬件装置的结构示意图；

图6为根据本发明一个实施例的计算机可读存储介质的结构示意图；

图7为根据本发明一个实施例的多声道音频处理终端的结构示意图；

图8为根据本发明另一个实施例的多声道音频处理终端的结构示意图。

具体实施方式

以下通过特定的具体实例说明本发明的实施方式，本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。本发明还可以通过另外不同的具体实施方式加以实施或应用，本说明书中的各项细节也可以基于不同观点与应用，在没有背离本发明的精神下进行各种修饰或改变。需说明的是，在不冲突的情况下，以下实施例及实施例中的特征可以相互组合。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要说明的是，下文描述在所附权利要求书的范围内的实施例的各种方面。应显而易见，本文中所描述的方面可体现于广泛多种形式中，且本文中所描述的任何特定结构及/或功能仅为说明性的。基于本发明，所属领域的技术人员应了解，本文中所描述的一个方面可与任何其它方面独立地实施，且可以各种方式组合这些方面中的两者或两者以上。举例来说，可使用本文中所阐述的任何数目个方面来实施设备及/或实践方法。另外，可使用除了本文中所阐述的方面中的一或多者之外的其它结构及/或功能性实施此设备及/或实践此方法。

还需要说明的是，以下实施例中所提供的图示仅以示意方式说明本发明的基本构想，图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制，其实际实施时各组件的型态、数量及比例可为一种随意的改变，且其组件布局型态也可能更为复杂。

另外，在以下描述中，提供具体细节是为了便于透彻理解实例。然而，所属领域的技术人员将理解，可在没有这些特定细节的情况下实践所述方面。

为了解决如何提高用户体验效果的技术问题，本发明实施例提供一种多声道音频处理方法。如图1a所示，该多声道音频处理方法主要包括如下步骤S1至步骤S3。其中：

步骤S1：获取待处理多声道音频。

其中，待处理多声道音频可以是离线待处理多声道音频，也可以是在线待处理多声道音频，本发明对此不作限定。其中，多声道音频包括但不限于3.1声道音频、5.1声道音频、7.1声道音频等。

步骤S2：获取音频处理参数。

其中，音频处理参数包括但不限于基频、瞬态脉冲、音频相位、音频时长等。

步骤S3：基于该音频处理参数，对待处理多声道音频进行处理。

为了便于理解，下面以具体实施例对处理音频处理参数的过程进行详细说明。

针对联合处理参数，可以将各个声道音频的基频、共振峰、瞬态脉冲、音频包络等音频处理参数进行混合，然后进行处理。

针对分离处理参数，可以分别对各个声道音频的基频、共振峰、瞬态脉冲、音频包络等音频处理参数进行独立的处理。

针对共振峰，可以进行平滑处理(也可称为限幅处理)；举例来说，可以对共振峰的幅度进行门限处理；

针对瞬态脉冲，可以进行平滑处理。

针对音频包络，可以进行平滑处理。

针对采样率，可以按照预定频率从进行上采样或下采样处理。

针对基频，可以通过插零值或抽取的方式增大或减小基频，以增大或减小音高，从而增大或降低音调；

针对音频相位，可以对音频相位进行增大或减小处理；

针对音频时长，可以进行缩短或延长处理；

上述针对不同音频处理参数所进行处理的方式并非穷举，本领域技术人员在上述所列方式的基础上还可以进行简单变换(例如，排列、组合)或等同替换，这些也应包含在本发明的保护范围之内。

本实施例通过采取上述技术方案，可以根据音频处理参数，对待处理多声道音频进行相应的处理，由此可以根据不同的音频处理参数获得相应的音频效果，从而提高了用户体验效果。

在一个可选的实施例中，如图1b所示，步骤S2可以包括：

当接收到音频模式指令时，获取与该音频模式指令对应的、该待处理多声道音频的音频处理参数。

在本实施例中，音频模式指令可以由用户通过终端，以触摸、鼠标点击、键盘敲击等方式进行实施。

其中，终端包括但不限于智能手机、掌上电脑、计算机等。

上述音频模式包括但不限于：联合处理模式、分离处理模式、速度模式、质量模式、平衡模式、偏移模式、保持模式、敲击模式、软门限模式、复合模式、清脆模式、稳定模式、平滑模式、跨频带平滑模式、子带内平滑模式、整体平滑模式等模式。

上述音频模式指令与音频处理参数相对应的方式包括但不限于以下方式：

联合处理模式指令对应的音频处理参数为联合处理参数；其中，该联合处理参数为混合各个声道的音频处理参数后的参数；

分离处理模式指令对应的音频处理参数为分离处理参数；其中，该分离处理参数是各个声道各自独立的音频处理参数；

偏移模式指令对应的音频处理参数为音频包络；

保持模式指令对应的音频处理参数为音频包络和基频；其中，基频是指基音的频率，用于确定音频的音高；

清脆模式指令对应的音频处理参数为瞬态脉冲和音频相位；

平滑模式指令对应的音频处理参数为瞬态脉冲；

稳定模式指令兼顾于清脆模式指令和平滑模式指令；

速度模式指令对应的音频处理参数为采样率以及共振峰或基频等；

质量模式指令对应的音频处理参数为瞬态脉冲、基频、共振峰；

平衡模式指令对应的音频处理参数为音频连贯性和音频一致性；

跨频带平滑模式指令对应的音频处理参数为音频频域内各频带所对应音频的相位；

子带内平滑模式指令对应的音频处理参数为音频频域内预定的频带所对应音频的相位；

变速不变调模式指令对应的音频处理参数为音频时长；

变调不变速模式指令对应的音频处理参数为基频；

变调变速模式指令对应的音频处理参数为音频的时长和音频的基频。

本领域技术人员应清楚，上述对应方式并非穷举，本领域技术人员在上述所列方式的基础上还可以进行简单变换或等同替换，这些简单变换或等同替换也应包含在本发明的保护范围之内。

在本步骤中，可以预先建立音频模式指令与待处理多声道音频的音频处理参数之间对应关系；然后，当接收到音频模式指令的时候，根据该对应关系，获取与音频模式指令对应的、待处理多声道音频的音频处理参数。其中，获取方式包括但不限于本地获取方式、远程获取方式。其中，本地获取方式可以是从预先存储在诸如智能手机、平板电脑等终端的存储器中获取与音频模式指令对应的、待处理多声道音频的音频处理参数；远程获取方式可以是通过诸如3G、4G、WI FI、蓝牙等通信方式从远端设备获取与音频模式指令对应的、待处理多声道音频的音频处理参数。

由此可见，本发明通过采取上述技术方案，根据用户发出的音频模式指令，进行与之相应的处理，由此使得用户可以根据自己的喜好获得相应的音频效果，从而提高了用户体验效果。

在一个可选的实施例中，基于图1b所示实施例，音频模式指令为偏移模式指令；

当接收到音频模式指令时，获取与音频模式指令对应的音频处理参数的步骤具体包括：

当接收到该偏移模式指令时，获取音频包络；

基于音频处理参数，对待处理多声道音频进行处理的步骤具体包括：

调整该待处理多声道音频的音频包络。

进一步地，上述调整待处理多声道音频的音频包络的步骤具体可以包括：调整待处理多声道音频的基频和共振峰。

由于音频包络会随着音高的变化而发生偏移，而音高又是由基频决定；所以，本实施例可以通过调整待处理多声道音频的基频来调整该待处理多声道音频的音频包络，从而可以改变音频的音色，由此提高了用户体验。

又由于音频的谐波由其共振峰确定；所以，本实施例还可以通过调整音频的共振峰来调整音频包络，从而可以实现泛音的变化。

本发明实施例在接收到音频模式指令时，通过调整待处理多声道音频的基频和共振峰，来改变音频包络，实现了音调和音色变化的音频效果，从而提高了用户体验效果。

在一个可选的实施例中，基于图1b所示实施例，音频模式指令为保持模式指令；

当接收到音频模式指令时，获取与音频模式指令对应的、待处理多声道音频的音频处理参数的步骤具体包括：

当接收到保持模式指令时，获取与保持模式指令对应的、待处理多声道音频的音频包络和基频；

在保持音频包络的情况下，调整基频。

其中，基频可以通过自相关法、波形估计法、倒谱法、循环直方图法等获得。

本实施例在接收到音频模式指令时，获取待处理多声道音频的音频包络和基频，并在在保持音频包络的情况下，调整基频；例如，可以增大或减小该基频，以实现该待处理多声道音频的变调，从而提高了用户体验效果。

在一个可选的实施例中，基于图1b所示实施例，音频模式指令为清脆模式指令；

当接收到音频模式指令时，获取与音频模式指令对应的、待处理多声道音频的音频处理参数的步骤，包括：

当接收到清脆模式指令时，获取与清脆模式指令对应的、待处理多声道音频的瞬态脉冲和音频相位；

基于音频处理参数，对待处理多声道音频进行处理的步骤，包括：

在待处理多声道音频的全频域内将瞬态脉冲的相位设置为零，或者，在该待处理多声道音频的全频域内将该瞬态脉冲的相位设置为零，并对该瞬态脉冲的幅值进行限制；

将该音频相位设置为预置值。

其中，可以基于待处理多声道音频的幅频特性，在待处理多声道音频的全频域内将瞬态脉冲的相位设置为零。

本实施例在接收到音频模式指令时，获取待处理多声道音频的瞬态脉冲和音频相位；然后，根据待处理多声道音频的幅频特性和相频特性，通过在待处理多声道音频的全频域内将瞬态脉冲的相位设置为零，或者，在该待处理多声道音频的全频域内将该瞬态脉冲的相位设置为零，并对该瞬态脉冲的幅值进行限制，并将音频相位设置为预置值，削弱了瞬态脉冲造成的尖锐声音，可以在听觉上得到清脆的音频效果，从而提高了用户体验效果。

在一个可选的实施例中，基于图1b所示实施例，音频模式指令为平滑模式指令；

当接收到平滑模式指令时，获取与平滑模式指令对应的、待处理多声道音频的瞬态脉冲；

基于瞬态脉冲，在待处理多声道音频的频域内，对预定频率范围内瞬态脉冲所对应频域的幅值进行平滑处理。

本实施例在接收到音频模式指令时，获取待处理多声道音频的瞬态脉冲；然后，基于待处理多声道音频的幅频特性，在待处理多声道音频的频域内，对预定频率范围内瞬态脉冲所对应频域的幅值进行平滑处理，实现在频域内对瞬态脉冲的限幅，由此在听觉上可以得到平滑的音频效果，从而提高了用户体验效果。

本领域技术人员应能理解，在上述获得清脆音频效果的实施例和平滑音频效果的实施例的基础上，还可以进行明显变型或等同替换，例如，本领域技术人员可以在兼顾上述清脆模式和平滑模式的情况下形成稳定模式。当本发明实施例接收到稳定模式指令时，获取待处理多声道音频的瞬态脉冲和音频相位；然后，在待处理多声道音频的全频域内将瞬态脉冲的相位设置为零，或者，在待处理多声道音频的全频域内将瞬态脉冲的相位设置为零，并对瞬态脉冲的幅值进行限制；将音频相位设置为预置值；并在待处理多声道音频的频域内，对预定频率范围内瞬态脉冲所对应频域的幅值进行平滑处理，实现对瞬态脉冲的限幅，由此在听觉上可以得到介于清脆和平滑之间的音频效果，从而提高了用户体验效果。

本发明实施例在具体实施时，在上述实施例的基础上，还可以增加相应的步骤。例如，还可以包括瞬态脉冲检测模式。该瞬态脉冲检测模式包括但不限于敲击模式、软门限模式和复合模式。其中，敲击模式对应的音频处理参数为多个相间隔的瞬态脉冲；软门限模式对应的音频处理参数为在预定周期内的一个瞬态脉冲；复合模式对应的音频处理参数为多个相间隔的瞬态脉冲，以及在预定周期内的一个瞬态脉冲。通过该检测模式，可以获得待处理多声道音频中瞬态脉冲的情况，从而可以有针对性对瞬态脉冲进行处理。

当本发明实施例接收到敲击模式指令、软门限模式指令或复合模式指令时，针对相应的检测模式，进行相应的瞬态脉冲处理。

举例而言，以用户通过触摸终端的方式选择音频模式为例，其中，音频模式为敲击模式。如图2所示，用户通过终端，点击瞬态脉冲检测模式，然后，选择敲击模式；再点击音频模式，选择平滑模式对待处理多声道音频进行处理。具体如下：

如图3所示，本实施例提供一种多声道音频处理方法，包括：

步骤Sa1：获取待处理多声道音频；

步骤Sa2：获取瞬态脉冲检测模式；其中，该瞬态脉冲检测模式为敲击模式；

步骤Sa3：当接收到敲击模式指令时，确定检测对象为多个相间隔的瞬态脉冲；

步骤Sa4：当接收到平滑模式指令时，获取与该平滑模式指令对应的、待处理多声道音频的多个相间隔的瞬态脉冲；

步骤Sa5：在所述待处理多声道音频的频域内，对预定频率范围内多个相间隔的瞬态脉冲所对应频域的幅值进行平滑处理。

同理，如果接收到软门限模式指令，则对在预定周期内的一个瞬态脉冲进行平滑处理，可以获得平滑的音频效果，由此提高了用户体验。本领域技术人员可以根据本发明实施例进行变型或等同替换，在此不再赘述。这些变型或等同替换的实施例也应包含在本发明的保护范围之内。

在一个可选的实施例中，基于图1b所示实施例，音频模式指令为速度模式指令；

当接收到速度模式指令时，获取与速度模式指令对应的、待处理多声道音频的预定的采样率、以及共振峰或基频；

按照预定的采样率对待处理多声道音频进行下采样；

对待处理多声道音频的共振峰进行平滑处理；或者，调整待处理多声道音频的基频。

其中，对待处理多声道音频进行下采样例如可以将48kHz的音频下采样至4kHz，还可以通过抽取偶数采样点实现下采样，本发明对此不作限定。通过下采样可以实现音频频域的延拓，易造成音频频谱的混叠；所以，优选地，在进行下采样步骤之前还可以进行抗混叠滤波处理。

在本实施例中，上述速度模式可以视为速度处理优先模式，是指在改变音调时，先按照预定的采样率，对待处理多声道音频进行下采样，然后，基于短时频谱特性进行处理。由于所处理的数据量少，从而使得处理时间变短，由此提高了处理速度。

在实际应用中，当用户选择速度模式时，本发明实施例选择预定的部分音频特性进行处理，例如，可以选择对待处理多声道音频的共振峰进行处理，或者，对该待处理多声道音频的共振峰和瞬态脉冲进行处理等，由此来提高处理待处理多声道音频的处理速度，从而提高了用户体验效果。

在一个可选的实施例中，基于图1b所示实施例，音频模式指令为音质模式指令；

当接收到音质模式指令时，获取与音质模式指令对应的、待处理多声道音频的瞬态脉冲、基频、共振峰；

实时平滑待处理多声道音频的瞬态脉冲和共振峰；

实时调整待处理多声道音频的基频。

在实际应用中，当用户选择质量模式时，本发明实施例对该待处理多声道音频的瞬态脉冲、基频、共振峰进行实时处理，以改变音调和音色并削弱了瞬态脉冲造成的刺耳的响度，由此改善了音质，从而提高了用户体验效果。

当然，本领域技术人员也可以在上述速度模式实施例和音质模式实施例的基础形成平衡模式。当接收到平衡模式指令时，进行兼顾速度模式实施例和音质模式实施例的处理，在此不再赘述。这些明显变型或等同替换的实施例也应包含在本发明的保护范围之内。

在一个可选的实施例中，基于图1b所示实施例，音频模式指令为跨频带平滑模式指令；

当接收到跨频带平滑模式指令时，获取与跨频带平滑模式指令对应的、待处理多声道音频的音频相位；

基于音频相位，对待处理多声道音频的至少两个频带内的相位进行平滑处理。

本实施例基于待处理多声道音频的相频特性，针对待处理多声道音频的多个频带内，例如，第一频带、第二频带和第三频带，与瞬态脉冲对应的相位进行平滑处理，由此使得多声道音频在听觉上更加平滑，从而提高了用户体验效果。

在一个可选的实施例中，基于图1b所示实施例，音频模式指令为子带内平滑模式指令；

当接收到子带内平滑模式指令时，获取与子带内平滑模式指令对应的、待处理多声道音频的音频相位；

基于音频相位，对待处理多声道音频的任一频带的子带内的相位进行平滑处理。

本实施例在接收到子带内平滑模式指令时，获取待处理多声道音频的音频相位，并基于该待处理多声道音频的相频特性，对其任一频带的子带内的相位进行平滑处理，以在听觉上使得音频平滑，从而提高了用户体验效果。

当然，在实际应用中，本领域技术人员也可以综合上述跨频带平滑模式实施例和子带内平滑模式实施例，形成整体平滑模式；当接收到整体平滑模式指令时，获取待处理多声道音频的音频相位；然后，对待处理多声道音频的至少两个频带内的相位，以及任一频带的子带内的相位进行平滑处理，以使得在听觉上音频更加平滑，从而提高了用户体验。这些明显变型的实施例也应包含在本发明的保护范围之内。

在一个可选的实施例中，基于图1b所示实施例，音频模式指令为变速不变调模式指令；

当接收到变速不变调模式指令时，获取与变速不变调模式指令对应的、待处理多声道音频的音频时长；

对待处理多声道音频的音频时长进行缩短或延长处理。

本领域技术人员应能理解，本发明实施例还可以在频域对待处理多声道音频进行处理，以实现变速不变调的音频效果。例如，将待处理多声道音频分成若干段；然后，依次在相邻的两段音频之间，进行插值；最后，再进行重采样；以此类推，直至所有分段均被处理完成，由此实现与在时域中调整音频时长相同的技术效果，从而实现对待处理多声道音频的变速不变调处理。

本实施例在确保音色并不改变音调的情况下，通过在时域内对待处理多声道音频进行音频时长的缩短或延长，由此实现了音速的变化，从而提高了用户体验效果。

在一个可选的实施例中，基于图1b所示实施例，音频模式指令为变调不变速模式指令；

当接收到变调不变速模式指令时，获取与变调不变速模式指令对应的、待处理多声道音频的基频；

调整待处理多声道音频的基频。

本实施例通过对待处理多声道音频的基频进行调整，例如，在频域上进行线性内插，实现对该待处理多声道音频的频谱的收缩或扩展(其中各个谐波成分之间的关系不变)，由此实现了变调的音频效果，从而提高了用户体验效果。

在一个可选的实施例中，基于图1b所示实施例，音频模式指令为变调变速模式指令；

当接收到变调变速模式指令时，获取与变调变速模式指令对应的、待处理多声道音频的音频时长和基频；

对音频时长进行缩短或延长处理；

调整基频。

本实施例通过综合前述变速不变调实施例以及变调不变速实施例，可以实现既变速又变调的音频效果，从而提高了用户体验。

本领域技术人员应能理解，在上述各个实施例的基础上，还可以进行明显变型(例如，对所列举的模式进行组合)或等同替换，例如，本领域技术人员可以在上述实施例的基础上，再结合联合处理模式和分离处理模式，对待处理多声道音频进行处理。

在上文中，虽然按照上述的顺序描述了多声道音频处理方法实施例中的各个步骤，本领域技术人员应清楚，本发明实施例中的步骤并不必然按照上述顺序执行，其也可以倒序、并行、交叉等其他顺序执行，而且，在上述步骤的基础上，本领域技术人员也可以再加入其他步骤，这些明显变型或等同替换的方式也应包含在本发明的保护范围之内，在此不再赘述。

下面为本发明装置实施例，本发明装置实施例可用于执行本发明方法实施例实现的步骤，为了便于说明，仅示出了与本发明实施例相关的部分，具体技术细节未揭示的，请参照本发明方法实施例。

为了解决如何提高用户体验效果的技术问题，本发明实施例提供一种多声道音频处理装置。该装置可以执行上述多声道音频处理方法实施例中所述的步骤。如图4所示，该装置主要包括：第一获取模块41、第二获取模块42和处理模块43。其中，第一获取模块41用于获取待处理多声道音频。第二获取模块42用于获取音频处理参数。处理模块43用于基于音频处理参数，对待处理多声道音频进行处理。

本实施例分别通过第一获取模块41和第二获取模块42获得待处理多声道音频和音频处理参数；然后，再通过处理模块43，基于音频处理参数，对待处理多声道音频进行处理；可以根据不同的音频处理参数获得相应的音频效果，从而提高了用户体验效果。

在一个可选的实施例中，如图4所示，第二获取模块42还用于当接收到音频模式指令时，获取与音频模式指令对应的、待处理多声道音频的音频处理参数。

音频模式包括但不限于：联合处理模式、分离处理模式、速度模式、质量模式、平衡模式、偏移模式、保持模式、敲击模式、软门限模式、复合模式、清脆模式、稳定模式、平滑模式、跨频带平滑模式、子带内平滑模式、整体平滑模式等模式。

在本实施例中，音频模式指令可以由用户通过终端，以触摸、鼠标点击和/或键盘敲击等方式进行实施。

上述音频处理参数包括但不限于基频、共振峰、音频相位、瞬态脉冲、音频时长等。

本发明通过采取上述技术方案，第二获取模块42获取到用户发出的音频模式指令，然后处理模块进行与之相应的处理，由此使得用户可以根据自己的喜好获得相应的音频效果，从而提高了用户体验效果。

在一个可选的实施例中，音频模式指令为偏移模式指令；

第二获取模块42具体用于当接收到偏移模式指令时，获取与偏移模式指令对应的、待处理多声道音频的音频包络；

处理模块43具体用于调整待处理多声道音频的音频包络。

在一个优选的实施例中，处理模块43具体用于调整待处理多声道音频的基频和共振峰。

本发明实施例中，第二获取模块42在接收到音频模式指令时，处理模块43通过调整待处理多声道音频的基频和共振峰，来改变音频包络，实现了音调和音色变化的音频效果，从而提高了用户体验效果。

在一个可选的实施例中，音频模式指令为保持模式指令；

第二获取模块42具体用于当接收到保持模式指令时，获取与保持模式指令对应的、待处理多声道音频的音频包络和基频；

处理模块43具体用于在保持音频包络的情况下，调整基频。

本实施例中，第二获取模块42在接收到音频模式指令时，获取待处理多声道音频的音频包络和基频，然后，处理模块43在保持音频包络的情况下，调整基频；例如，可以增大或减小该基频，以实现该待处理多声道音频的变调，从而提高了用户体验效果。

在一个可选的实施例中，音频模式指令为清脆模式指令；

第二获取模块42具体用于当接收到清脆模式指令时，获取与清脆模式指令对应的、待处理多声道音频的瞬态脉冲和音频相位；

处理模块43具体用于在待处理多声道音频的全频域内将瞬态脉冲的相位设置为零，或者，在待处理多声道音频的全频域内将瞬态脉冲的相位设置为零，并对瞬态脉冲的幅值进行限制，以及将音频相位设置为预置值。

本实施例中，第二获取模块42在接收到音频模式指令时，获取待处理多声道音频的瞬态脉冲和音频相位；然后，处理模块43根据待处理多声道音频的幅频特性和相频特性，通过在待处理多声道音频的全频域内将瞬态脉冲的相位设置为零，或者，在待处理多声道音频的全频域内将瞬态脉冲的相位设置为零，并对瞬态脉冲的幅值进行限制，以及将音频相位设置为预置值，削弱了瞬态脉冲造成的尖锐声音，可以在听觉上得到清脆的音频效果，从而提高了用户体验效果。

在一个可选的实施例中，音频模式指令为平滑模式指令；

第二获取模块42具体用于当接收到平滑模式指令时，获取与平滑模式指令对应的、待处理多声道音频的瞬态脉冲；

处理模块43具体用于基于瞬态脉冲，在待处理多声道音频的频域内，对预定频率范围内瞬态脉冲所对应频域的幅值进行平滑处理。

本实施例中，第二获取模块42在接收到音频模式指令时，获取待处理多声道音频的瞬态脉冲；然后，处理模块43基于待处理多声道音频的幅频特性，在待处理多声道音频的频域内，对预定频率范围内瞬态脉冲所对应频域的幅值进行平滑处理，实现在频域内对瞬态脉冲的限幅，由此在听觉上可以得到平滑的音频效果，从而提高了用户体验效果。

在一个可选的实施例中，音频模式指令为速度模式指令；

第二获取模块42具体用于当接收到速度模式指令时，获取与速度模式指令对应的、待处理多声道音频的预定的采样率、以及共振峰或基频；

处理模块43具体用于按照预定的采样率对待处理多声道音频进行下采样；并且，对待处理多声道音频的共振峰进行平滑处理；或者，调整待处理多声道音频的基频。

在一个可选的实施例中，音频模式指令为音质模式指令；

第二获取模块42具体用于当接收到音质模式指令时，获取与音质模式指令对应的、待处理多声道音频的瞬态脉冲、基频、共振峰；

处理模块43具体用于实时平滑待处理多声道音频的瞬态脉冲和共振峰，并实时调整待处理多声道音频的基频。

本实施例在实施时，当用户选择质量模式时，第二获取模块42获取到待处理多声道音频的瞬态脉冲、基频、共振峰；然后，处理模块43对该待处理多声道音频的瞬态脉冲、基频、共振峰进行实时处理，以改变音调和音色并削弱了瞬态脉冲造成的刺耳的响度，由此改善了音质，从而提高了用户体验效果。

在一个可选的实施例中，音频模式指令为跨频带平滑模式指令；

第二获取模块42具体用于当接收到跨频带平滑模式指令时，获取与跨频带平滑模式指令对应的、待处理多声道音频的音频相位；

处理模块43具体用于基于音频相位，对待处理多声道音频的至少两个频带内的相位进行平滑处理。

在一个可选的实施例中，音频模式指令为子带内平滑模式指令；

第二获取模块42具体用于当接收到子带内平滑模式指令时，获取与子带内平滑模式指令对应的、待处理多声道音频的音频相位；

处理模块43具体用于基于音频相位，对待处理多声道音频的任一频带的子带内的相位进行平滑处理。

本实施例中，第二获取模块42在接收到子带内平滑模式指令时，获取待处理多声道音频的音频相位；然后，处理模块43基于该待处理多声道音频的相频特性，对其任一频带的子带内的相位进行平滑处理，以在听觉上使得音频平滑，从而提高了用户体验效果。

在一个可选的实施例中，音频模式指令为变速不变调模式指令；

第二获取模块42具体用于当接收到变速不变调模式指令时，获取与变速不变调模式指令对应的、待处理多声道音频的音频时长；

处理模块43对待处理多声道音频的音频时长进行缩短或延长处理。

本实施例通过采取上述技术方案，利用第二获取模块42获取待处理多声道音频的音频时长；然后，通过处理模块43在时域内对待处理多声道音频进行音频时长的缩短或延长，在确保音色并不改变音调的情况下，实现了音速的变化，从而提高了用户体验效果。

在一个可选的实施例中，音频模式指令为变调不变速模式指令；

第二获取模块42具体用于当接收到变调不变速模式指令时，获取与变调不变速模式指令对应的、待处理多声道音频的基频；

处理模块43具体用于调整待处理多声道音频的基频。

本实施例通过处理模块43对待处理多声道音频的基频进行调整，例如，在频域上进行线性内插，实现对该待处理多声道音频的频谱的收缩或扩展(其中各个谐波成分之间的关系不变)，由此实现了变调的音频效果，从而提高了用户体验效果。

在一个可选的实施例中，音频模式指令为变调变速模式指令；

第二获取模块42具体用于当接收到变调变速模式指令时，获取与变调变速模式指令对应的、待处理多声道音频的音频时长和基频；

处理模块43具体用于对音频时长进行缩短或延长处理，并调整基频。

本实施例通过综合前述变速不变调实施例以及变调不变速实施例，通过上述第二获取模块42和处理模块43，可以实现既变速又变调的音频效果，从而提高了用户体验。

有关多声道音频处理装置实施例的工作原理、实现的技术效果等详细说明可以参考前述多声道音频处理方法实施例中的相关说明，在此不再赘述。

图5是图示根据本公开的实施例的多声道音频处理硬件装置的硬件框图。如图5所示，根据本公开实施例的多声道音频处理硬件装置50包括存储器51和处理器52。

该存储器51用于存储非暂时性计算机可读指令。具体地，存储器51可以包括一个或多个计算机程序产品，该计算机程序产品可以包括各种形式的计算机可读存储介质，例如易失性存储器和/或非易失性存储器。该易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。该非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。

该处理器52可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其它形式的处理单元，并且可以控制多声道音频处理硬件装置50中的其它组件以执行期望的功能。在本公开的一个实施例中，该处理器52用于运行该存储器51中存储的该计算机可读指令，使得该多声道音频处理硬件装置50执行前述的本公开各实施例的多声道音频处理方法的全部或部分步骤。

本领域技术人员应能理解，为了解决如何获得良好用户体验效果的技术问题，本实施例中也可以包括诸如通信总线、接口等公知的结构，这些公知的结构也应包含在本发明的保护范围之内。

有关本实施例的详细说明可以参考前述各实施例中的相应说明，在此不再赘述。

图6是图示根据本公开的实施例的计算机可读存储介质的示意图。如图6所示，根据本公开实施例的计算机可读存储介质60，其上存储有非暂时性计算机可读指令61。当该非暂时性计算机可读指令61由处理器运行时，执行前述的本公开各实施例的视频特征的比对方法的全部或部分步骤。

上述计算机可读存储介质60包括但不限于：光存储介质(例如：CD－ROM和DVD)、磁光存储介质(例如：MO)、磁存储介质(例如：磁带或移动硬盘)、具有内置的可重写非易失性存储器的媒体(例如：存储卡)和具有内置ROM的媒体(例如：ROM盒)。

图7是图示根据本公开实施例的终端设备的硬件结构示意图。如图7所示，该多声道音频处理终端70包括上述多声道音频处理装置实施例71。

该终端设备可以以各种形式来实施，本公开中的终端设备可以包括但不限于诸如移动电话、智能电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、导航装置、车载终端设备、车载显示终端、车载电子后视镜等等的移动终端设备以及诸如数字TV、台式计算机等等的固定终端设备。

作为等同替换的实施方式，该终端还可以包括其他组件。如图8所示，该多声道音频处理终端80可以包括电源单元81、无线通信单元82、A/V(音频/视频)输入单元83、用户输入单元84、感测单元85、接口单元86、控制器87、输出单元88和存储器89等等。图8示出了具有各种组件的终端，但是应理解的是，并不要求实施所有示出的组件，也可以替代地实施更多或更少的组件。

其中，无线通信单元82允许终端80与无线通信系统或网络之间的无线电通信。A/V输入单元83用于接收音频或视频信号。用户输入单元84可以根据用户输入的命令生成键输入数据以控制终端设备的各种操作。感测单元85检测终端80的当前状态、终端80的位置、用户对于终端80的触摸输入的有无、终端80的取向、终端80的加速或减速移动和方向等等，并且生成用于控制终端80的操作的命令或信号。接口单元86用作至少一个外部装置与终端80连接可以通过的接口。输出单元88被构造为以视觉、音频和/或触觉方式提供输出信号。存储器89可以存储由控制器87执行的处理和控制操作的软件程序等等，或者可以暂时地存储己经输出或将要输出的数据。存储器89可以包括至少一种类型的存储介质。而且，终端80可以与通过网络连接执行存储器89的存储功能的网络存储装置协作。控制器87通常控制终端设备的总体操作。另外，控制器87可以包括用于再现或回放多媒体数据的多媒体模块。控制器87可以执行模式识别处理，以将在触摸屏上执行的手写输入或者图片绘制输入识别为字符或图像。电源单元81在控制器87的控制下接收外部电力或内部电力并且提供操作各元件和组件所需的适当的电力。

本公开提出的视频特征的比对方法的各种实施方式可以以使用例如计算机软件、硬件或其任何组合的计算机可读介质来实施。对于硬件实施，本公开提出的视频特征的比对方法的各种实施方式可以通过使用特定用途集成电路(AS I C)、数字信号处理器(DSP)、数字信号处理装置(DSPD)、可编程逻辑装置(PLD)、现场可编程门阵列(FPGA)、处理器、控制器、微控制器、微处理器、被设计为执行这里描述的功能的电子单元中的至少一种来实施，在一些情况下，本公开提出的视频特征的比对方法的各种实施方式可以在控制器87中实施。对于软件实施，本公开提出的视频特征的比对方法的各种实施方式可以与允许执行至少一种功能或操作的单独的软件模块来实施。软件代码可以由以任何适当的编程语言编写的软件应用程序(或程序)来实施，软件代码可以存储在存储器89中并且由控制器87执行。

以上结合具体实施例描述了本公开的基本原理，但是，需要指出的是，在本公开中提及的优点、优势、效果等仅是示例而非限制，不能认为这些优点、优势、效果等是本公开的各个实施例必须具备的。另外，上述公开的具体细节仅是为了示例的作用和便于理解的作用，而非限制，上述细节并不限制本公开为必须采用上述具体的细节来实现。

本公开中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的，可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇，指“包括但不限于”，且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”，且可与其互换使用，除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”，且可与其互换使用。

另外，如在此使用的，在以“至少一个”开始的项的列举中使用的“或”指示分离的列举，以便例如“A、B或C的至少一个”的列举意味着A或B或C，或AB或AC或BC，或ABC(即A和B和C)。此外，措辞“示例的”不意味着描述的例子是优选的或者比其他例子更好。

还需要指出的是，在本公开的系统和方法中，各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本公开的等效方案。

可以不脱离由所附权利要求定义的教导的技术而进行对在此所述的技术的各种改变、替换和更改。此外，本公开的权利要求的范围不限于以上所述的处理、机器、制造、事件的组成、手段、方法和动作的具体方面。可以利用与在此所述的相应方面进行基本相同的功能或者实现基本相同的结果的当前存在的或者稍后要开发的处理、机器、制造、事件的组成、手段、方法或动作。因而，所附权利要求包括在其范围内的这样的处理、机器、制造、事件的组成、手段、方法或动作。

提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本公开。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的，并且在此定义的一般原理可以应用于其他方面而不脱离本公开的范围。因此，本公开不意图被限制到在此示出的方面，而是按照与在此公开的原理和新颖的特征一致的最宽范围。

为了例示和描述的目的已经给出了以上描述。此外，此描述不意图将本公开的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例，但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims

1.一种多声道音频处理方法，其特征在于，包括：

获取待处理多声道音频；

获取音频处理参数；

基于所述音频处理参数，对所述待处理多声道音频进行处理；

所述获取音频处理参数的步骤，包括：

当接收到音频模式指令时，获取与所述音频模式指令对应的、所述待处理多声道音频的音频处理参数；

所述音频模式指令为保持模式指令；

在保持所述音频包络的情况下，调整所述基频；

在保持所述音频包络的情况下，调整所述基频的步骤具体包括：

在保持所述音频包络的情况下，增大或减小所述基频，以实现所述待处理多声道音频的变调。

2.根据权利要求1所述的方法，其特征在于，所述音频模式指令为偏移模式指令；

调整所述待处理多声道音频的音频包络。

3.根据权利要求2所述的方法，其特征在于，所述调整所述待处理多声道音频的音频包络的步骤具体包括：

调整所述待处理多声道音频的基频和共振峰。

4.根据权利要求1所述的方法，其特征在于，所述音频模式指令为清脆模式指令；

将所述音频相位设置为预置值。

5.根据权利要求1所述的方法，其特征在于，所述音频模式指令为平滑模式指令；

6.根据权利要求1所述的方法，其特征在于，所述音频模式指令为速度模式指令；

按照预定的采样率对所述待处理多声道音频进行下采样；

调整所述待处理多声道音频的所述基频；

所述获取音频处理参数的步骤，包括：

在进行下采样步骤之前，对所述待处理多声道音频进行抗混叠滤波处理。

7.根据权利要求1所述的方法，其特征在于，所述音频模式指令为音质模式指令；

实时调整所述待处理多声道音频的基频。

8.根据权利要求1所述的方法，其特征在于，所述音频模式指令为跨频带平滑模式指令；

9.根据权利要求1所述的方法，其特征在于，所述音频模式指令为子带内平滑模式指令；

10.根据权利要求1所述的方法，其特征在于，所述音频模式指令为变速不变调模式指令；

11.根据权利要求1所述的方法，其特征在于，所述音频模式指令为变调不变速模式指令；

调整所述待处理多声道音频的所述基频。

12.根据权利要求1所述的方法，其特征在于，所述音频模式指令为变调变速模式指令；

对所述音频时长进行缩短或延长处理；

调整所述基频。

13.一种多声道音频处理装置，其特征在于，包括：

第一获取模块，用于获取待处理多声道音频；

第二获取模块，用于获取音频处理参数；

处理模块，用于基于所述音频处理参数，对所述待处理多声道音频进行处理；

所述第二获取模块还用于：

所述音频模式指令为保持模式指令；

所述处理模块在保持所述音频包络的情况下，增大或减小所述基频，以实现所述待处理多声道音频的变调。

14.根据权利要求13所述的装置，其特征在于，所述音频模式指令为偏移模式指令；

15.根据权利要求13所述的装置，其特征在于，所述所述处理模块具体用于调整所述待处理多声道音频的基频和共振峰。

16.根据权利要求13所述的装置，其特征在于，所述音频模式指令为清脆模式指令；

所述处理模块具体用于在所述待处理多声道音频的全频域内将所述瞬态脉冲的相位设置为零，或者在所述待处理多声道音频的全频域内将所述瞬态脉冲的相位设置为零，并对所述瞬态脉冲的幅值进行限制，以及将所述音频相位设置为预置值。

17.根据权利要求13所述的装置，其特征在于，所述音频模式指令为平滑模式指令；

18.根据权利要求13所述的装置，其特征在于，所述音频模式指令为速度模式指令；

所述处理模块具体用于按照预定的采样率对所述待处理多声道音频进行下采样；并且，对所述待处理多声道音频的所述共振峰进行平滑处理；或者，调整所述待处理多声道音频的所述基频；

所述第二获取模块还用于：

所述处理模块还用于在进行下采样步骤之前，对待处理多声道音频进行抗混叠滤波处理。

19.根据权利要求13所述的装置，其特征在于，所述音频模式指令为音质模式指令；

20.根据权利要求13所述的装置，其特征在于，所述音频模式指令为跨频带平滑模式指令；

21.根据权利要求13所述的装置，其特征在于，所述音频模式指令为子带内平滑模式指令；

22.根据权利要求13所述的装置，其特征在于，所述音频模式指令为变速不变调模式指令；

23.根据权利要求13所述的装置，其特征在于，所述音频模式指令为变调不变速模式指令；

24.根据权利要求13所述的装置，其特征在于，所述音频模式指令为变调变速模式指令；

25.一种多声道音频处理硬件装置，包括：

存储器，用于存储非暂时性计算机可读指令；以及

处理器，用于运行所述计算机可读指令，使得所述处理器执行时实现根据权利要求1-12中任意一项所述的多声道音频处理方法。

26.一种计算机可读存储介质，用于存储非暂时性计算机可读指令，当所述非暂时性计算机可读指令由计算机执行时，使得所述计算机执行权利要求1-12中任意一项所述的多声道音频处理方法。

27.一种多声道音频处理终端，包括权利要求13-24中任一所述的一种多声道音频处理装置。