CN107925837B - 对压缩hoa信号逐帧组合解码和渲染的方法以及对压缩hoa信号逐帧组合解码和渲染的装置 - Google Patents
对压缩hoa信号逐帧组合解码和渲染的方法以及对压缩hoa信号逐帧组合解码和渲染的装置 Download PDFInfo
- Publication number
- CN107925837B CN107925837B CN201680050113.XA CN201680050113A CN107925837B CN 107925837 B CN107925837 B CN 107925837B CN 201680050113 A CN201680050113 A CN 201680050113A CN 107925837 B CN107925837 B CN 107925837B
- Authority
- CN
- China
- Prior art keywords
- signal
- hoa
- vec
- component
- frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/02—Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/11—Application of ambisonics in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Mathematical Physics (AREA)
- Multimedia (AREA)
- Mathematical Analysis (AREA)
- Algebra (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Stereophonic System (AREA)
Abstract
高阶高保真度立体声响复制(HOA)信号可以通过分解为主导声音分量和残留环境分量来进行压缩。压缩表示包括主导声音信号、环境分量的系数序列和辅助信息。为了高效地组合HOA解压缩和HOA渲染来获得扩音器信号,压缩HOA信号的组合渲染和解码包括对感知编码部分进行感知解码并且对辅助信息进行解码,而不重构HOA系数序列。为了重构第一类型的分量,不需要系数序列的淡化,而对于第二类型的分量,需要淡化。对于每个第二类型的分量,确定不同的线性运算:一个用于在当前帧中不需要淡化的系数序列,一个用于需要淡入的那些系数序列,一个用于需要淡出的那些系数序列。从每个第二类型的分量的感知解码信号,生成淡入版本和淡出版本,相应的线性运算被应用于这些淡入版本和淡出版本。
Description
技术领域
本原理涉及一种对压缩HOA信号进行逐帧(frame-wise)组合解码和渲染的方法以及对压缩HOA信号进行逐帧组合解码和渲染的装置。
背景技术
在其他技术(比如波场合成(WFS)或基于声道的方法(比如22.2)) 之中,高阶高保真度立体声响复制(HOA)提供表示3维声音的一种可能性。与基于声道的方法相反,HOA表示提供独立于特定扩音器设置的优点。然而,该灵活性是以在特定的扩音器设置上回放HOA表示所需要的渲染处理为代价的。与其中所需扩音器的数量通常非常大的WFS方法相比,HOA还可以被渲染到仅由几个扩音器组成的设置。 HOA的另外的优点是,被渲染到扩音器的相同的信号表示也可以在对耳机的双耳渲染没有任何修改的情况下被采用。HOA基于如下构思:通过来自所有可能的入射方向的一般平面波的贡献的复合 (composition)来等同地表示声源自由(free)收听区域中的声压。评估所有的一般平面波对收听区域的中心(即,所使用的系统的坐标原点)中的声压的贡献提供时间和方向相关的函数,该函数然后对于每个时刻被展开为所谓的球谐函数的级数(series)。展开的权重(被认为是随着时间变化的函数)被称为HOA系数序列,这些HOA系数序列构成实际的HOA表示。HOA系数序列是常规的时域信号,这些时域信号具有在它们自己之间具有不同的值范围的特性。一般来说,球谐函数的级数包括无限数量的被加数(summand),得知这些被加数在理论上允许完美地重构所表示的声场。然而,在实践中,为了达成可管理的有限数量的信号,级数被截断,从而得到某个阶次N的表示。这确定了用于展开的被加数的数量O,该数量O由O=(N+1)2给出。截断影响HOA表示的空间分辨率,HOA表示的空间分辨率显然随着阶次N增长而提高。使用阶次N=4的典型HOA表示由O=25个 HOA系数序列组成。
根据这些考虑,给定期望的单声道采样速率fS和每采样位数Nb,用于传输HOA表示的总位速率由O·fS·Nb确定。因此,以fS=48kHz 的采样速率传输阶次N=4的HOA表示并且采用每采样Nb=16位导致 19.2MBits/s的位速率,该位速率对于许多实际的应用(例如流传输) 是非常高的。因此,HOA表示的压缩是高度期望的。
以前,HOA声场表示的压缩在[2,3,4]中被提出,并且最近被 MPEG-H 3D音频标准[1,第12章和附录C.5]采纳。所使用的压缩技术的主要构思是执行声场分析并且将给定的HOA表示分解为主导声音分量和残留环境分量。最后的压缩表示一方面包括数个量化信号,这些量化信号是由环境HOA分量的相关系数序列和主导声音信号的感知编码得到的。另一方面,它包括与量化信号相关的附加辅助信息 (side information),该辅助信息对于从HOA表示的压缩版本重构 HOA表示是必需的。
对于在消费者电子设备内要使用的MPEG-H 3D音频标准的所提及的HOA压缩技术(它为软件或硬件的形式)的一个重要的准则是就计算需求而言该技术的实现的效率。具体地说,为了回放压缩HOA 表示,从HOA表示的压缩版本重构HOA表示的HOA解压缩器和从重构的HOA表示创建扩音器信号的HOA渲染器这二者的效率是高度相关的。为了解决该问题,MPEG-H 3D音频标准包含关于如何组合 HOA解压缩器和HOA渲染器来针对不需要中间重构的HOA表示的情况而降低计算需求的信息附录(参见[1,附录G])。然而,在MPEG-H 3D音频标准的当前版本中,描述非常难以理解,并且看起来不是完全正确。此外,在表示基于矢量的信号的空间分布的矢量已经在特殊模式下被编码(即,CodedVVecLength=1)的情况下,它仅解决某些 HOA编码工具被禁用(即,用于主导声音合成的空间预测[1,第 12.4.2.4.3节]和该基于矢量的信号的HOA表示的计算[1,第12.4.2.4.4 节])的情况。
发明内容
所需的是用于就计算需求而言高效地组合HOA解压缩器和HOA 渲染器、允许使用在MPEG-H 3D音频标准[1]中可用的所有HOA编码工具的解决方案。
本发明解决上述问题中的一个或多个。根据本原理的实施例,一种用于对包括压缩HOA信号的输入信号进行逐帧组合解码和渲染以获得扩音器信号的方法(其中,根据给定的扩音器配置,HOA渲染矩阵被计算并且被使用)包括对于每个帧
将输入信号解复用为感知编码部分和辅助信息部分,并且在感知解码器中对感知编码部分进行感知解码,其中,感知解码信号被获得,这些感知解码信号表示需要用于重构HOA系数序列的线性运算的、至少两种不同类型的两个或更多个分量,其中,没有HOA系数序列被重构,并且其中,对于第一类型的分量,所述重构不需要各个系数序列的淡化(fade),并且对于第二类型的分量,所述重构需要各个系数序列的淡化。该方法进一步包括:在辅助信息解码器中对辅助信息部分进行解码,其中,解码辅助信息被获得;将单独用于每个帧的线性运算应用于第一类型的分量以生成第一扩音器信号;并且根据辅助信息,单独地对于每个帧,对第二类型的每个分量确定三个不同的线性运算。在这些之中,一个线性运算用于根据辅助信息不需要淡化的系数序列,一个线性运算用于根据辅助信息需要淡入的系数序列,一个线性运算用于根据辅助信息需要淡出的系数序列。
该方法进一步包括根据属于第二类型的每个分量的感知解码信号生成三个版本,其中,第一版本包括未被淡化的相应分量的原始信号,信号的第二版本是通过使相应分量的原始信号淡入而获得的,信号的第三版本是通过使相应分量的原始信号淡出而获得的。最后,该方法包括:将相应的线性运算应用于所述感知解码信号的所述第一版本、第二版本和第三版本中的每个并叠加结果以生成第二扩音器信号,并且将第一扩音器信号和第二扩音器信号相加,其中,已解码输入信号的扩音器信号被获得。
利用该方法的装置在权利要求6中被公开。利用该方法的另一装置在权利要求7中被公开。
在一个实施例中,一种用于对包括压缩HOA信号的输入信号进行逐帧组合解码和渲染的装置包括至少一个硬件组件(比如硬件处理器)和有形地实现至少一个软件组件的非暂时性的、有形的计算机可读存储介质(例如,存储器),该至少一个软件组件当在至少一个硬件处理器上被执行时使装置执行本文所公开的方法。
在一个实施例中,本发明涉及一种计算机可读介质,该计算机可读介质具有可执行指令,该可执行指令使计算机执行包括本文所描述的方法的步骤的方法。
本发明的有利的实施例在从属权利要求、以下描述和附图中被公开。
附图说明
参照附图来描述本发明的示例性实施例,在以下附图中示出:
图1a)感知和辅助信息源解码器;
图1b)空间HOA解码器;
图2主导声音合成模块;
图3组合空间HOA解码器和渲染器;以及
图4组合空间HOA解码器和渲染器的细节。
具体实施方式
在下面,简要地概括如[1,第12章]中描述的HOA解压缩和渲染单元这二者,以便解释用于组合两个处理单元来降低计算需求的本原理的修改。
1.记法
对于HOA解压缩和HOA渲染,信号被逐帧地重构。在整个本文件中,例如由O个信号和L个采样组成的多信号帧的符号是具有跟在括号中的帧索引k的大写粗体字母,比如例如然而,具有下标整数索引i的、小写粗体类型的同一个字母(即,)指示多信号帧内的第i信号的帧。因此,多信号帧C(k)就单个信号帧而言可以用以下表达式来表达:
C(k)=[(c1(k))T (c2(k))T … (co(k))T]T (1)
其中,(·)T表示矩阵的转置。单个信号帧ci(k)的第l采样用同一个、不过是非粗体类型的小写字母后面跟着括号中的帧和采样索引(这二者被逗号隔开)来表示,比如例如ci(k,l)。因此,ci(k)就其采样而言可以被写为:
ci(k)=[ci(k,1) ci(k,2) … ci(k,L)] (2)
2.HOA解压缩器
[1,第12章]中提出的HOA解压缩器的总体架构在图1中被示出。它可以被细分为图1a)中描绘的感知和源解码部分后面跟着图1b)中描绘的空间HOA解码部分。感知和源解码部分包括解复用器10、感知解码器20和辅助信息源解码器30。空间HOA解码部分包括多个逆增益控制块41、42(每个声道一个)、声道再分配模块45、主导声音合成模块51、环境合成模块52以及HOA复合模块53。
在感知和辅助信息源解码器中,首先将位流的第k帧解复用 10为I个信号的感知编码表示和编码辅助信息的帧编码辅助信息描述如何创建该感知编码表示的HOA表示。相继地,执行I个信号的感知解码20和辅助信息的解码30。然后,图1b)的空间HOA解码器根据解码的I个信号和解码的辅助信息来创建重构的HOA表示的帧
2.1空间HOA解码器
在空间HOA解码器中,首先将感知解码信号帧i∈{1,...,I}中的每个与相关联的增益校正指数ei(k)和增益校正例外标志βi(k)一起输入到逆增益控制处理块41、42。第i逆增益控制处理提供增益校正的信号帧i∈{1,...,I}。
所有的I个增益校正的信号帧i∈{1,,..,I}与分配矢量vAMB,ASSiGN(k) 以及元组(tuple)集合和一起被传递给声道再分配处理块 45,在声道再分配处理块45中,它们被重新分布以创建所有主导声音信号(即,所有的方向信号和基于矢量的信号)的帧和环境HOA 分量的中间表示的帧CIAMB(k)。输入到声道再分配处理块的输入参数的意义如下。对于每个传输声道,分配矢量vAMB,ASSIGN(k)指示环境HOA分量的可能包含的系数序列的索引。元组集合
由如下元组组成,该元组的第一个元素i表示作用(active)方向的索引,第二个元素ΩQUANT,i(k)表示相应的量化方向。换句话说,该元组的第一个元素指示增益校正的信号帧的索引i,假设表示与由元组的第二个元素给出的量化方向ΩQUANT,i(k)相关的方向信号。方向总是相对于两个连续帧计算的。由于重叠相加处理,发生特殊情况,即,对于方向信号的作用时间段的最后(last)一帧,实际上不存在方向,这通过将相应的量化方向设置为零而标示。
元组集合
由如下元组组成,该元组的第一个元素i指示增益校正的信号帧的索引,该信号帧表示要由矢量v(i)(k)重构的信号,矢量v(i)(k)是由元组的第二个元素给出的。矢量v(i)(k)表示关于重构的HOA帧中的作用信号的空间分布(方向、宽度、形状)的信息。假定v(i)(k)具有N+1的欧几里德范数。
在下面,详细描述声道再分配块45、主导声音合成块45、环境合成块52以及HOA复合处理块51,因为这些块将被与HOA渲染器组合来降低计算需求。
2.1.1声道再分配
声道再分配处理块45具有根据增益校正的信号帧i∈{1,…,I}和分配矢量vAMB,ASSIGN(k)来创建所有主导声音信号的帧和环境HOA分量的中间表示的帧cI,AMB(k)的目的,分配矢量vAMB,ASSIGN(k)指示用于每个传输声道的、环境HOA分量的可能包含的系数序列的索引。另外,使用集合和这两个集合分别包含和的所有元组的第一个元素。重要的是,注意这两个集合是互斥的(disjoint)。
对于实际的分配,执行以下步骤。
其中,J=I-OMIN。
2.如下获得环境HOA分量的中间表示的帧cI,AMB(k)的采样值:
2.1.2环境合成
2.1.3主导声音合成
主导声音合成51具有使用元组集合和预测参数的集合以及集合和来从所有主导声音信号的帧创建主导声音分量的HOA表示的帧的目的。该处理可以被细分为四个处理步骤,即,计算作用的方向信号的HOA表示,计算预测的方向信号的HOA表示,计算作用的基于矢量的信号的HOA表示,并且复合主导声音HOA分量。如图2所示,主导声音合成块51可以被细分为四个处理块,即,用于计算预测的方向信号的HOA表示的块511,用于计算作用的方向信号的HOA表示的块512,用于计算作用的基于矢量的信号的HOA表示的块513,以及用于复合主导声音HOA分量的块514。下面对这些进行描述。
2.1.3.1计算作用的方向信号的HOA表示
为了避免由于连续帧之间的方向改变而导致的伪影,从方向信号计算HOA表示的计算基于重叠相加的概念。
因此,作用的方向信号的HOA表示cDIR(k)被计算为淡出分量和淡入分量的和:
CDIR(k)=CDIR,OUT(k)+CDIR,IN(k) (9)
然后通过以下方程确定淡出的和淡入的方向HOA分量的采样值:
和
用两个不同的淡化窗口来实现用于重叠相加运算的瞬时HOA表示的淡化:
wDIR:=[wDIR(1) wDIR(2) … wDIR(2L)] (13)
wVEC:=[wVEC(1) wVEC(2) … wVEC(2L)] (14)
这两个不同的淡化窗口的元素在[1,第12.4.2.4.2节]中被定义。
2.1.3.2计算预测的方向信号的HOA表示
另外,以下相依量(dependent quantity)
被引入,该相依量指示预测是将对帧k、还是将对帧(k+1)执行。此外,量化的预测因子pQ,F,d,n(k),d=1,...,DPRED,n=1,...,O被去量化(dequantize)以提供实际预测因子:
(注意:BSC在[1]中被定义。原则上,它是用于量化的位数。)
预测的方向信号的计算是基于重叠相加的概念,以便避免由于连续帧之间的预测参数改变而导致的伪影。因此,由XPD(k)表示的预测的方向信号的第k帧被计算为淡出分量和淡入分量的和:
XPD(k)=XPD,OUT(k)+XPD,IN(k) (17)
然后通过以下方程计算淡出的和淡入的预测的方向信号的采样值 xPD,OUT,n(k,l)和xPD,IN,n(k,l),n=1,...,O,l=1,....,L:
在下一步中,通过以下方程将预测的方向信号变换到HOA域:
2.1.3.3计算作用的基于矢量的信号的HOA表示
这里用与[1,第12.4.2.4.4节]中的版本相比不同的记法来描述基于矢量的信号的HOA表示的计算,以便使该记法保持与描述的其余部分一致。尽管如此,这里描述的运算与[1]中的完全相同。
其后,通过以下方程计算作用的基于矢量的信号的最后的HOA 表示的帧cVEC(k):
对于n=1,…,O,l=1,…,L,其中,E=CodedVVecLength在[1,第12.4.1.10.2节]中被定义。
2.1.3.4复合主导声音HOA分量
2.1.4HOA复合
3.HOA渲染器
HOA渲染器(参见[1,第12.4.3节])从由空间HOA解码器(参见上面的第2.1节)提供的重构的HOA表示的帧计算LS个扩音器信号的帧注意,图1没有明确地示出渲染器。一般来说,用于HOA渲染的计算是根据以下方程用与渲染矩阵的乘法来实现的:
其中,如[1,第12.4.3.3节]中所描述的,渲染矩阵是在初始化阶段中根据目标扩音器设置而计算的。
如图3所示,本发明公开了一种用于通过组合空间HOA解码器 (参见上面的第2.1节)和后面的HOA渲染器(参见上面的第3节) 来相当大地降低对于这两个处理模块的计算需求的解决方案。这允许直接输出扩音器信号的帧而不是重构的HOA系数序列。具体地说,原始的声道再分配块45、主导声音合成块51、环境合成块52、 HOA复合块53以及HOA渲染器被用组合HOA合成和渲染处理块 60替换。
这个新引入的处理块需要另外得知渲染矩阵D,像HOA渲染器的原始实现中那样,渲染矩阵D被假定为是根据[1,第12.4.3.3节]预先计算的。
3.1组合HOA合成和渲染的概述
正如从图4可以看出的,处理可以被细分为环境HOA分量61的组合合成和渲染以及主导声音HOA分量62的组合合成和渲染,这些组合合成和渲染的输出最后被相加。下面详细地描述这两个处理块。
3.1.1环境HOA分量的组合合成和渲染
所提出的与环境HOA分量相对应的扩音器信号的帧的计算的一般构思是省略对应的HOA表示CAMB(k)的中间的显式计算,这不同于[1,App.G.3]中所提出的计算。具体地说,对于头OMIN个空间变换的系数序列(这些系数序列总是在最后OMIN个输送信号i=I-OMIN+ 1,…,I内被传输),将逆空间变换与渲染组合。
第二个方面是,类似于[1,App.G.3]中已经建议的那样,仅对已经实际上在输送信号内被传输的那些系数序列执行渲染,从而省略零系数序列的任何无意义的渲染。
AAMB(k)=[AAMB,MIN AAMB,REST(k)] (33)
通过以下方程计算第一个分量AAMB,MIN:
其中,表示由D的头OMIN个列得到的矩阵。它实现了对于环境HOA分量的总是在最后OMIN个输送信号内被传输的头OMIN个空间变换的系数序列的逆空间变换与对应的渲染的实际组合。注意,该矩阵 (AAMB,MIN以及同样地DMIN)是帧独立的,并且可以在初始化处理期间被预先计算。
其余的矩阵AAMB,REST(k)实现了环境HOA分量的除了总是被传输的头OMIN个空间变换的系数序列之外、在输送信号内还被传输的那些 HOA系数序列的渲染。因此,该矩阵由与这些另外传输的HOA系数序列相对应的原始渲染矩阵D的列组成。列的次序原则上是任意的,不过,必须与分配给信号矩阵YAMB(k)的对应的系数序列的次序匹配。具体地说,如果我们采取由下面的双射(bijective)函数限定的任何排序:
对应地,信号矩阵YAMB(k)内的各个信号帧yAMB,i(k),i=1,…,QAMB(k)必须通过以下方程从增益校正的信号的帧Y(k)提取:
3.1.2主导声音HOA分量的组合合成和渲染
如图4所示,主导声音HOA分量本身的组合合成和渲染可以被细分为三个并行处理块621-623,这些处理块的扩音器信号输出帧和最后被相加624、63以获得与主导声音HOA分量相对应的扩音器信号的帧所有三个块的计算的一般构思是通过省略对应的HOA表示的中间的显式计算来降低计算需求。下面详细地描述所有三个处理块。
3.1.2.1预测的方向信号621的HOA表示的组合合成和渲染
预测的方向信号621的HOA表示的组合合成和渲染在[1,App. G.3]中被认为是不可能的,这是从[1]中排除在高效的组合空间HOA 解码和渲染的情况下的空间预测选项的原因。然而,本发明还公开了一种实现空间预测的方向信号的HOA表示的高效的组合合成和渲染的方法。空间预测的原始的已知构思是,创建O个虚拟扩音器信号,每个来自作用的方向信号的加权和,然后通过使用逆空间变换来创建其HOA表示。然而,从不同的角度来看,类似于对于上面第2.1节中使用的基于矢量的信号那样,上述处理可以被看作对参与空间预测的每个作用的方向信号定义限定其方向分布的矢量。对渲染与HOA合成进行组合于是可以借助于将空间预测中所涉及的所有的作用的方向信号的帧乘以描述它们到扩音器信号的平移(panning)的矩阵来表达。该运算使要被处理的信号的数量从O个减少到空间预测中所涉及的作用的方向信号的数量,从而使HOA合成和渲染的大部分计算需求部分独立于HOA阶次N。
要被解决的另一重要的方面是空间预测的信号的HOA表示(参见方程(21))的某些系数序列的最终淡化。所提出的解决组合HOA 合成和渲染的问题的解决方案是引入三种不同类型的作用的方向信号,即,非淡化的作用的方向信号、淡出的作用的方向信号和淡入的作用的方向信号。然后对于每种类型的所有信号,通过在HOA渲染矩阵和HOA表示中仅涉及具有适当的索引的系数序列来计算特殊的平移矩阵,索引即为以下集合中包含的未被传输的环境HOA系数序列的索引:
两个矩阵APD(k)和YPD(k)各由两个分量组成,即,关于来自上一帧的淡出贡献的一个分量以及关于来自当前帧的淡入贡献的一个分量:
APD(k)=[APD,OUT(k) APD,IN(k)] (39)
每个子矩阵本身被假定为由如下三个分量组成,这三个分量与三种先前提及的类型的作用的方向信号(即,非淡化的作用的方向信号、淡出的作用的方向信号和淡入的作用的方向信号)相关:
APD,OUT(k)=[APD,OUT,IA(k) APD,OUT,E(k) APD,OUT,D(k)] (41)
APD,IN(k)=[APD,IN,IA(k) APD,IN,E(k) APD,IN,D(k)] (42)
为了计算各个子矩阵分量,我们首先引入空间预测中所涉及的所有的作用的方向信号的索引的集合:
该集合的元素的数量用以下方程来表示:
VPD(k)=Ψ(N,N)·AWEIGH(k) (49)
最后通过将渲染矩阵D的适当的子矩阵乘以表示作用的方向信号的方向分布的矩阵VPD(k-1)或VPD(k)的适当的子矩阵来获得方程(41)和 (42)中的矩阵APD,OUT(k)和APD,IN(k)的分量,即:
和
如方程(18)和(19)中那样,假设方程(43)和(44)中的信号子矩阵和包含分别根据排序函数 fPD,ORD,k-1和fPD,ORD,k从增益校正的信号的帧提取的、被适当地淡出或淡入的作用的方向信号。
详细地说,通过以下方程计算信号子矩阵YPD,OUT,E(k)和YPD,OUT,D(k)的采样yPD,OUT,E,i(k,l)和yPD,OUT,D,i(k,l),1≤j≤QPD(k-1):
yPD,OUT,E,i(k,l)=yPD,OUT,IA,i(k,l)·wDIR(L+l) (58)
yPD,OUT,D,i(k,l)=yPD,OUT,IA,i(k,l)·wDIR(l) (59)
从而,通过以下方程计算信号子矩阵YPD,IN,E(k)和YPD,IN,D(k)的采样 yPD,IN,E,i(k,l)和yPD,IN,D,i(k,l),1≤j≤QPD(k):
yPD,IN,E,i(k,l)=yPD,IN,IA,i(k,l)·wDIR(L+l) (60)
yPD,IN,D,i(k,l)=yPD,IN,IA,i(k,l)·wDIR(l) (61)
3.1.2.1.1用于对模式矢量进行加权的矩阵的示例性计算
因为矩阵AWEIGH(k)的计算初看起来可能显得复杂并且令人困惑,所以下面提供其计算的例子。为简单起见我们假定N=2的HOA阶次,并且指定空间预测的矩阵PIND(k)和PF(k)由以下方程给出:
在该示例性假定下,空间预测中所涉及的所有的作用的方向信号的索引的集合由以下方程给出:
用于对该集合的元素进行排序的可能的双射函数由以下方程给出:
矩阵AWEIGH(k)在这种情况下由以下方程给出:
其中,第一列包含与具有索引1的方向信号的加权相关的因子,第二列包含与具有索引3的方向信号的加权相关的因子。
3.1.2.2作用的方向信号的HOA表示的组合合成和渲染622
两个矩阵ADIR(k)和YDIR(k)各由两个分量组成,即,关于来自上一帧的淡出贡献的一个分量以及关于来自当前帧的淡入贡献的一个分量。
ADIR(k)=[ADIR,PAN(k-1) ADIR,PAN(k)] (68)
ADIR,PAN(k)=D·ΨDIR(k) (71)
具体地说,如果我们假定任何排序由以下双射函数限定:
ΨDIR(k)的第j列被设置为与由中的其第一个元素等于的那个元组表示的方向相对应的模式矢量。因为总共存在900个可能的方向,这些方向的模式矩阵Ψ(N,29)被假定为在初始化阶段预先计算,所以ΨDIR(k)的第j列也可以用以下方程来表达:
信号矩阵YDIR,OUT(k)和YDIR,OUT(k)包含分别根据排序函数fDIR,ORD,k-1和 fDIR,ORD,k从增益校正的信号的帧提取的、被适当地淡出或淡入的作用的方向信号(如方程(11)和(12)中那样)。
类似地,通过以下方程计算信号矩阵YDIR,IN(k)的采样yDIR,IN,j(k,l), 1≤j≤QDIR(k),1≤l≤L:
3.1.2.3作用的基于矢量的信号的HOA表示的组合合成和渲染 623
作用的基于矢量的信号的HOA表示的组合合成和渲染623非常类似于上面在第4.1.2中描述的预测的方向信号的HOA表示的组合合成和渲染。具体地,限定单耳(monaural)信号(被称为基于矢量的信号)的方向分布的矢量在这里是直接给出的,然而它们必须在中间被计算以用于预测的方向信号的HOA表示的组合合成和渲染。
此外,在表示基于矢量的信号的空间分布的矢量已经在特殊模式 (即,CodedVVecLength=1)下被编码的情况下,对基于矢量的信号的重构的HOA分量的某些系数序列执行淡入或淡出(参见方程(26))。该问题在[1,第12.4.2.4.4节]中未被考虑,即,[1,第12.4.2.4.4节] 中的提议对于所提及的情况无效。
类似于上述用于预测的方向信号的HOA表示的组合合成和渲染的解决方案,提出通过引入三种不同类型的作用的基于矢量的信号(即,非淡化的作用的基于矢量的信号、淡出的作用的基于矢量的信号和淡入的作用的基于矢量的信号)来解决该问题。然后对于每种类型的所有信号,通过在HOA渲染矩阵和HOA表示中仅涉及具有适当的索引 (即,中包含的未被传输的环境HOA系数序列的索引以及分别在和中包含的淡出的或淡入的环境HOA系数序列的索引)的系数序列来计算特殊的平移矩阵。
两个矩阵AVEC(k)和YVEC(k)各由两个分量组成,即,关于来自上一帧的淡出贡献的一个分量以及关于来自当前帧的淡入贡献的一个分量:
AVEC(k)=[AVEC,OUT(k) AVEC,IN(k)] (77)
每个子矩阵本身被假定为由如下三个分量组成,这三个分量与三种先前提及的类型的作用的基于矢量的信号(即,非淡化的作用的基于矢量的信号、淡出的作用的基于矢量的信号和淡入的作用的基于矢量的信号)相关:
AVEC,OUT(k)=[AVEC,OUT,IA(k) AVEC,OUT,E(k) AVEC,OUT,D(k)] (79)
AVEC,IN(k)=[AVEC,IN,IA(k) AVEC,IN,E(k) AVEC,IN,D(k)] (80)
为了计算各个子矩阵分量,我们首先从的元组的第二个元素中所包含的矢量复合矩阵矢量的次序原则上是任意的,不过,必须与分配给信号矩阵YVEC,IN,IA(k)的对应信号的次序匹配。具体地说,如果我们假定任何排序由以下双射函数限定:
最后通过将渲染矩阵D的适当的子矩阵乘以矩阵VVEC(k-1)或VVEC(k) 的适当的子矩阵来获得方程(79)和(80)中的矩阵AVEC,OUT(k)和AVEC,IN(k)的分量,VVEC(k-1)或VVEC(k)的这些适当的子矩阵表示作用的基于矢量的信号的方向分布,即:
和
如方程(24)和(25)中那样,假设方程(81)和(82)中的信号子矩阵和包含分别根据排序函数fVEC,ORD,k-1和fVEC,ORD,k从增益校正的信号的帧Y(k)提取的作用的基于矢量的信号,这些基于矢量的信号被适当地淡出或淡入。
详细地说,通过以下方程计算信号子矩阵YVEC,OUT,E(k)和YVEC,OUT,D(k)的采样yVEC,OUT,E,i(k,l)和yVEC,OUT,D,i(k,l),1≤j≤QVEC(k-1):
yVEC,OUT,E,i(k,l)=yVEC,OUT,IA,i(k,l)·wDIR(L+l) (92)
yVEC,OUT,D,i(k,l)=yVEC,OUT,IA,i(k,l)·wDIR(l) (93)
从而,通过以下方程计算信号子矩阵YVEC,IN,E(k)和YVEC,IN,D(k)的采样
yVEC,IN,E,i(k,l)和yVEC,IN,D,i(k,l),1≤j≤QVEC(k):
yVEC,IN,E,i(k,l)=yVEC,IN,IA,i(k,l)·wDIR(L+l) (94)
yVEC,IN,D,i(k,l)=yVEC,IN,IA,i(k,l)·wDIR(l) (95)
3.1.3示例性实际实现
最后,指出所公开的组合HOA合成和渲染的每个处理块的计算需求最大的部分可以用单个矩阵乘法来表达(参见方程(31)、(38)、 (67)和(76))。因此,对于示例性实际实现,可以使用关于性能被优化的特殊的矩阵乘法函数。在该上下文下还可以如下通过单个矩阵乘法来计算所有处理块的渲染的扩音器信号:
其中,矩阵AALL(k)和YALL(k)由以下方程限定:
AALL(k):=[AAMB(k) APD(k) ADIR(k) AVEC(k)] (97)
此外,还指出,也可以在线性运算之后应用淡化,即,直接将淡化应用于扩音器信号,而不是在信号的线性处理之前应用淡化。因此,在感知解码信号表示需要用于重构HOA系数序列的线性运算的至少两种不同类型的分量(其中对于第一类型的分量,重构不需要各个系数序列cDIR(k)的淡化,对于第二类型的分量,重构需要各个系数序列cPD(k)、cVEC(k)的淡化)的实施例中,通过分别将第一线性运算、第二线性运算和第三线性运算(即,不进行淡化)应用于感知解码信号的第二类型的分量、然后对扩音器信号的第一版本不应用淡化、对扩音器信号的第二版本应用淡入并且对扩音器信号的第三版本应用淡出来创建扩音器信号的三个不同版本。叠加(即,累加)结果以生成第二扩音器信号
在以下效率比较中,我们将对于现有技术的HOA合成与接连的 HOA渲染的计算需求与对于所提出的两个处理块的高效组合的计算需求进行比较。为简单起见,就所需乘法(或组合的乘法和加法)运算来测量计算需求,忽视成本明显较小的纯加法运算。
对于两种种类的处理,每个单独的子处理块的所需乘法数量与表达计算的对应的方程编号一起分别在表1和表2中给出。对于基于矢量的信号的HOA表示的组合合成和渲染,我们已经假定对应的矢量是用选项CodedVVecLength=1编码的(参见[1,第12.4.1.10.2节])。
表1:对于现有技术的HOA合成与接连的HOA渲染的计算需求
表2:对于所提出的组合HOA合成和渲染的计算需求
对于已知的处理(参见表1),可以观察到,需求最大的块是其中乘法数量包含作为因子的与HOA系数序列的数量O组合的帧长度 L的那些块,因为L的可能的值(通常为1024或2048)与其他量的值相比大得多。对于预测的方向信号的合成(第2.1.3.2节),HOA 系数序列的数量O甚至以其平方而被涉及,并且对于HOA渲染器,扩音器的数量LS作为附加因子出现。
相反,对于所提出的计算(表2),需求最大的块并不依赖于HOA 系数序列的数量O,而是依赖于扩音器的数量LS。这意味着对于组合 HOA合成和渲染的总体计算需求仅仅可忽略地依赖于HOA阶次N。
最后,在表3和表4中,我们为两种处理方法提供了如下假定的典型情形的所需每秒百万次(乘法或组合的乘法和加法)运算数量 (MOPS):
·采样速率为fS=48kHz
·OMIN=4
·帧长度为L=1024个采样
·每帧I=9个输送信号,这些输送信号总共包含环境HOA分量的QAMB(k)=5个系数序列(即,)、 QDIR(k)=QDIR(k-1)=2个方向信号以及QVEC(k)=QVEC(k-1)=2个基于矢量的信号
·对于每个帧,所有的方向信号在空间预测QPD(k)=QPD(k-1)= QDIR(k)=2中被涉及
其中我们改变HOA阶次N和扩音器的数量LS
表3:对于现有技术的HOA合成与接连的HOA渲染、对于fs=48kHz、 oMIN=4、QAMB(k)=5、QDIR(k)=QDIR(k-1)=2、QVEC(k)=QVEC(k-1)=2以及不同的HOA阶次N和扩音器的数量LS的示例性计算需求
表4:对于所提出的组合HOA合成和渲染、对于fs=48kHz、oMIN=4、 QAMB(k)=5、QDIR(k)=QDIR(k-1)=2、QVEC(k)=QVEC(k-1)=2以及不同的HOA 阶次N和扩音器的数量LS的示例性计算需求
从表3可以观察到,对于现有技术的HOA合成与接连的HOA渲染的计算需求随着HOA阶次N而明显增长,其中需求最大的处理块是预测的方向信号的合成和HOA渲染器。相反,表4所示的对于所提出的组合HOA合成和渲染的结果确认了其计算需求仅仅可忽略地依赖于HOA阶次N。相反,存在对扩音器的数量LS的近似成比例的依赖性。特别重要的是,对于所有的示例性情况,对于所提出的方法的计算需求显著低于现有技术方法的计算需求。
注意,上述发明可以在各种实施例中实现,包括方法、设备、存储介质、信号及其他。
具体地说,本发明的各种实施例包括以下各项。
在实施例中,一种用于对包括压缩HOA信号的输入信号进行逐帧组合解码和渲染以获得扩音器信号的方法(其中,根据给定的扩音器配置的HOA渲染矩阵D被计算并且被使用)包括对于每个帧
将输入信号解复用10为感知编码部分和辅助信息部分;
在感知解码器中对感知编码部分进行感知解码20,其中,感知解码信号被获得,这些感知解码信号表示需要用于重构HOA 系数序列的线性运算的、至少两种不同类型的两个或更多个分量,其中,没有HOA系数序列被重构,并且其中,对于第一类型的分量,所述重构不需要各个系数序列cDIR(k)的淡化,并且对于第二类型的分量,所述重构需要各个系数序列cPD(k)、cVEC(k)的淡化;
在辅助信息解码器中对辅助信息部分进行解码30,其中,解码辅助信息被获得;
根据辅助信息,单独地对于每帧,对第二类型的每个分量确定三个不同的线性运算,其中,线性运算(APD,OUT,IA(k)、APD,IN,IA(k)或AVEC,OUT,IA(k)、 AVEC,IN,IA(k))用于根据辅助信息不需要淡化的系数序列,线性运算 (APD,OUT,D(k)、APD,IN,D(k)或AVEC,OUT,D(k)、AVEC,IN,D(k))用于根据辅助信息需要淡入的系数序列,线性运算(APD,OUT,E(k)、APD,IN,E(k)或AVEC,OUT,E(k)、AVEC,IN,E(k)) 用于根据辅助信息需要淡出的系数序列;
根据属于第二类型的每个分量(对应于图1、图3中在中间创建 cPD(k),cVEC(k)的、的子集)的感知解码信号生成三个版本,其中,第一版本(YPD,OUT,IA(k)、YPD,IN,IA(k)或YVEC,OUT,IA(k)、YVEC,IN,IA(k))包括未被淡化的相应分量的原始信号,信号的第二版本(YPD,OUT,D(k)、YPD,IN,D(k)或 YVEC,OUT,D(k)、YVEC,IN,D(k))是通过使相应分量的原始信号淡入而获得的,并且信号的第三版本(YPD,OUT,E(k)、YPD,IN,E(k)或YVEC,OUT,E(k)、YVEC,IN,E(k))是通过使相应分量的原始信号淡出而获得的;
在实施例中,对于感知解码信号的第二类型的分量(对应于在中间创建cPD(k)、cVEC(k)的的子集),通过分别将所述第一线性运算、第二线性运算和第三线性运算(即,不进行淡化)应用于感知解码信号的第二类型的分量、然后对扩音器信号的第一版本不应用淡化、对扩音器信号的第二版本应用淡入并且对扩音器信号的第三版本应用淡出来创建扩音器信号的三个不同版本,并且其中,叠加(例如,累加)结果以生成第二扩音器信号
在实施例中,应用于第一类型的分量的线性运算61、622是将第一类型的分量变换为HOA系数序列的第一线性运算和根据渲染矩阵 D将HOA系数序列变换为第一扩音器信号的第二线性运算的组合。
在实施例中,一种用于对包括压缩HOA信号的输入信号进行逐帧组合解码和渲染以获得扩音器信号的装置(其中,根据给定的扩音器配置的HOA渲染矩阵D被计算并且被使用)包括处理器和存储器,存储器存储当在处理器上被执行时使装置对于每个帧执行以下操作的指令:
将输入信号解复用10为感知编码部分和辅助信息部分;
在感知解码器中对感知编码部分进行感知解码20,其中,感知解码信号被获得,这些感知解码信号表示需要用于重构HOA 系数序列的线性运算的、至少两种不同类型的两个或更多个分量,其中,没有HOA系数序列被重构,并且其中,对于第一类型的分量,所述重构不需要各个系数序列cDIR(k)的淡化,并且对于第二类型的分量,所述重构需要各个系数序列cPD(k)、cVEC(k)的淡化,
在辅助信息解码器中对辅助信息部分进行解码30,其中,解码辅助信息被获得,
根据辅助信息,单独地对于每帧,对第二类型的每个分量确定三个不同的线性运算,其中,线性运算APD,OUT,IA(k)、APD,IN,IA(K)或AVEC,OUT,IA(k)、 AVEC,IN,IA(k)用于根据辅助信息不需要淡化的系数序列,线性运算APD,OUT,D(k)、 APD,IN,D(k)或AVEC,OUT,D(k)、AVEC,IN,D(k)用于根据辅助信息需要淡入的系数序列,并且线性运算APD,OUT,E(k)、APD,IN,E(k)或AVEC,OUT,E(k)、AVEC,IN,E(k)用于根据辅助信息需要淡出的系数序列,
根据属于第二类型的每个分量的感知解码信号生成三个版本,其中,第一版本YPD,OUT,IA(k)、YPD,IN,IA(k)或YVEC,OUT,IA(k)、YVEC,IN,IA(k)包括未被淡化的相应分量的原始信号,信号的第二版本YPD,OUT,D(k)、YPD,IN,D(k)或YVEC,OUT,D(k)、 YVEC,IN,D(k)是通过使相应分量的原始信号淡入而获得的,并且信号的第三版本YPD,OUT,E(k)、YPD,IN,E(k)或YVEC,OUT,E(k)、YVEC,IN,E(k)是通过使相应分量的原始信号淡出而获得的,
将相应的线性运算(如例如方程38-44中的PD那样)应用于感知解码信号的所述第一版本、第二版本和第三版本中的每个,并且叠加结果以生成第二扩音器信号并且将第一扩音器信号和第二扩音器信号相加624、63,其中,已解码输入信号的扩音器信号被获得。
动词“包括”及其变型(conjugation)的使用并不排除除了权利要求中陈述的那些要素或步骤之外的要素或步骤的存在。此外,要素前面“一”、“一个”的使用并不排除多个这样的要素的存在。几个“手段”可以用相同的硬件物品来表示。
虽然已经示出、描述并且指出了本发明的如应用于本发明的优选实施例的基本的新颖特征,但是将理解所描述的装置和方法中的、所公开的设备的形式和细节上的以及它们的操作中的各种省略、替换和改变可以被本领域技术人员在本发明的范围内做出。明确的意图是,以基本上相同的方式执行基本上相同的功能来实现相同结果的那些要素的所有组合都在本发明的范围内。
引用的参考文献
[1]ISO/IEC JTC1/SC29/WG11 23008-3:2015(E).Information technology-Highefficiency coding and media delivery in heterogeneous environments-Part 3:3Daudio,2015年2月.
[2]EP 2800401A
[3]EP 2743922A
[4]EP 2665208A
Claims (13)
1.一种用于对包括压缩HOA信号的输入信号进行逐帧组合解码和渲染以获得扩音器信号的方法,其中,根据给定的扩音器配置的HOA渲染矩阵(D)被计算并且被使用,该方法包括对于每个帧
-将输入信号解复用(10)为感知编码部分和辅助信息部分;
-在感知解码器中对感知编码部分进行感知解码(20),其中,感知解码信号被获得,所述感知解码信号表示需要用于重构HOA系数序列的线性运算的、至少两种不同类型的两个或更多个分量,其中,没有HOA系数序列被重构,并且其中,
对于第二类型的分量,所述重构需要各个系数序列(CPD(k)、CVEC(k))的淡化;
-在辅助信息解码器中对辅助信息部分进行解码(30),其中,解码的辅助信息被获得;
-根据辅助信息,单独地对于每个帧,对第二类型的每个分量确定三个不同的线性运算,其中,
第一线性运算(APD,OUT,IA(k)、APD,IN,IA(k)、AVEC,OUT,IA(k)、AVEC,IN,IA(k))用于根据辅助信息不需要淡化的系数序列,
第二线性运算(APD,OUT,D(k)、APD,IN,D(k)、AVEC,OUT,D(k)、AVEC,IN,D(k))用于根据辅助信息需要淡入的系数序列,以及
第三线性运算(APD,OUT,E(k)、APD,IN,E(k)、AVEC,OUT,E(k)、AVEC,IN,E(k))用于根据辅助信息需要淡出的系数序列;
-根据属于第二类型的每个分量的感知解码信号生成三个版本,其中,第一版本(YPD,OUT,IA(k)、YPD,IN,IA(k)、YVEC,OUT,IA(k)、YVEC,IN,IA(k))包括未被淡化的相应分量的原始信号,信号的第二版本(YPD,OUT,D(k)、YPD,IN,D(k)、YVEC,OUT,D(k)、YVEC,IN,D(k))是通过使相应分量的原始信号淡入而获得的,并且信号的第三版本(YPD,OUT,E(k)、YPD,IN,E(k)、YVEC,OUT,E(k)、YVEC,IN,E(k))是通过使相应分量的原始信号淡出而获得的;
2.根据权利要求1所述的方法,进一步包括对感知解码信号执行逆增益控制(41、42),其中,解码的辅助信息的一部分(e1(k),...,eI(k),β1(k),...,βI(k))被使用。
4.根据权利要求1所述的方法,其中,应用于第一类型的分量的线性运算(61、622)是将第一类型的分量变换为HOA系数序列的第一线性运算和根据渲染矩阵D将HOA系数序列变换为第一扩音器信号的第二线性运算的组合。
5.根据权利要求1-4中任一项所述的方法,其中,线性运算是单独地对于每个帧根据辅助信息确定的。
6.一种用于对包括压缩HOA信号的输入信号进行逐帧组合解码和渲染的装置,该装置包括:
处理器;以及
存储器,该存储器存储当被执行时使装置执行根据权利要求1-5中任一项所述的方法步骤的指令。
7.一种用于对包括压缩HOA信号的输入信号进行逐帧组合解码和渲染以获得扩音器信号的装置,其中,根据给定的扩音器配置的HOA渲染矩阵(D)被计算并且被使用,该装置包括:处理器
以及
存储器,该存储器存储当被执行时使装置对每个帧执行以下操作的指令:
-将输入信号解复用(10)为感知编码部分和辅助信息部分;
-在感知解码器中对感知编码部分进行感知解码(20),其中,感知解码信号(z1(k),...,zI(k))被获得,所述感知解码信号表示需要用于重构HOA系数序列的线性运算的、至少两种不同类型的两个或更多个分量,其中,没有HOA系数序列被重构,并且其中
对于第二类型的分量,所述重构需要各个系数序列(cPD(k)、cVEC(k))的淡化;
-在辅助信息解码器中对辅助信息部分进行解码(30),其中,解码的辅助信息被获得;
-根据辅助信息,单独地对于每个帧,对第二类型的每个分量确定三个不同的线性运算,其中,
第一线性运算(APD,OUT,IA(k)、APD,IN,IA(k)、AVEC,OUT,IA(k)、AVEC,IN,IA(k))用于根据辅助信息不需要淡化(即,不作用)的系数序列,
第二线性运算(APD,OUT,D(k)、APD,IN,D(k)、AVEC,OUT,D(k)、AVEC,IN,D(k))用于根据辅助信息需要淡入的系数序列,以及
第三线性运算(APD,OUT,E(k)、APD,IN,E(k)、AVEC,OUT,E(k)、AVEC,IN,E(k))用于根据辅助信息需要淡出的系数序列;
-根据属于第二类型的每个分量的感知解码信号生成三个版本,其中,第一版本(YPD,OUT,IA(k)、YPD,IN,IA(k)、YVEC,OUT,IA(k)、YVEC,IN,IA(k))包括未被淡化的相应分量的原始信号,信号的第二版本(YPD,OUT,D(k)、YPD,IN,D(k)、YVEC,OUT,D(k)、YVEC,IN,D(k))是通过使相应分量的原始信号淡入而获得的,并且信号的第三版本(YPD,OUT,E(k)、YPD,IN,E(k)、YVEC,OUT,E(k)、YVEC,IN,E(k))是通过使相应分量的原始信号淡出而获得的;
8.根据权利要求7所述的装置,进一步包括对感知解码信号执行逆增益控制(41、42),其中,解码的辅助信息的一部分(e1(k),...,eI(k),β1(k),...,βI(k))被使用。
10.根据权利要求7所述的装置,其中,应用于第一类型的分量的线性运算(61、622)是将第一类型的分量变换为HOA系数序列的第一线性运算和根据渲染矩阵(D)将HOA系数序列变换为第一扩音器信号的第二线性运算的组合。
11.根据权利要求7-10中任一项所述的装置,其中,线性运算是单独地对于每个帧根据辅助信息确定的。
12.一种非暂时性计算机可读介质,包括存储在该非暂时性计算机可读介质上的指令,所述指令当被执行时使得执行如权利要求1-5中任一项所述的方法的步骤。
13.一种用于对包括压缩HOA信号的输入信号进行逐帧组合解码和渲染以获得扩音器信号的装置,包括用于执行如权利要求1-5中任一项所述的方法的步骤的部件。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP15306334 | 2015-08-31 | ||
EP15306334.2 | 2015-08-31 | ||
PCT/EP2016/054317 WO2017036609A1 (en) | 2015-08-31 | 2016-03-01 | Method for frame-wise combined decoding and rendering of a compressed hoa signal and apparatus for frame-wise combined decoding and rendering of a compressed hoa signal |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107925837A CN107925837A (zh) | 2018-04-17 |
CN107925837B true CN107925837B (zh) | 2020-09-22 |
Family
ID=54150358
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201680050113.XA Active CN107925837B (zh) | 2015-08-31 | 2016-03-01 | 对压缩hoa信号逐帧组合解码和渲染的方法以及对压缩hoa信号逐帧组合解码和渲染的装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US10257632B2 (zh) |
EP (1) | EP3345409B1 (zh) |
CN (1) | CN107925837B (zh) |
HK (1) | HK1247016A1 (zh) |
WO (1) | WO2017036609A1 (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11277705B2 (en) | 2017-05-15 | 2022-03-15 | Dolby Laboratories Licensing Corporation | Methods, systems and apparatus for conversion of spatial audio format(s) to speaker signals |
US10075802B1 (en) | 2017-08-08 | 2018-09-11 | Qualcomm Incorporated | Bitrate allocation for higher order ambisonic audio data |
BR112021009306A2 (pt) | 2018-11-20 | 2021-08-10 | Sony Group Corporation | dispositivo e método de processamento de informações, e, programa. |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102099856A (zh) * | 2008-07-17 | 2011-06-15 | 弗劳恩霍夫应用研究促进协会 | 具有可切换旁路的音频编码/解码方案 |
WO2014177455A1 (en) * | 2013-04-29 | 2014-11-06 | Thomson Licensing | Method and apparatus for compressing and decompressing a higher order ambisonics representation |
WO2014195190A1 (en) * | 2013-06-05 | 2014-12-11 | Thomson Licensing | Method for encoding audio signals, apparatus for encoding audio signals, method for decoding audio signals and apparatus for decoding audio signals |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2665208A1 (en) | 2012-05-14 | 2013-11-20 | Thomson Licensing | Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation |
EP2743922A1 (en) | 2012-12-12 | 2014-06-18 | Thomson Licensing | Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field |
US9922656B2 (en) * | 2014-01-30 | 2018-03-20 | Qualcomm Incorporated | Transitioning of ambient higher-order ambisonic coefficients |
-
2016
- 2016-03-01 US US15/751,255 patent/US10257632B2/en active Active
- 2016-03-01 WO PCT/EP2016/054317 patent/WO2017036609A1/en active Application Filing
- 2016-03-01 CN CN201680050113.XA patent/CN107925837B/zh active Active
- 2016-03-01 EP EP16710402.5A patent/EP3345409B1/en active Active
-
2018
- 2018-05-18 HK HK18106515.3A patent/HK1247016A1/zh unknown
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102099856A (zh) * | 2008-07-17 | 2011-06-15 | 弗劳恩霍夫应用研究促进协会 | 具有可切换旁路的音频编码/解码方案 |
WO2014177455A1 (en) * | 2013-04-29 | 2014-11-06 | Thomson Licensing | Method and apparatus for compressing and decompressing a higher order ambisonics representation |
WO2014195190A1 (en) * | 2013-06-05 | 2014-12-11 | Thomson Licensing | Method for encoding audio signals, apparatus for encoding audio signals, method for decoding audio signals and apparatus for decoding audio signals |
Also Published As
Publication number | Publication date |
---|---|
HK1247016A1 (zh) | 2018-09-14 |
EP3345409B1 (en) | 2021-11-17 |
CN107925837A (zh) | 2018-04-17 |
EP3345409A1 (en) | 2018-07-11 |
US20180234784A1 (en) | 2018-08-16 |
US10257632B2 (en) | 2019-04-09 |
WO2017036609A1 (en) | 2017-03-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4603037B2 (ja) | マルチチャネルオーディオ信号を表示するための装置と方法 | |
CN106471822B (zh) | 针对hoa数据帧表示的压缩确定表示非差分增益值所需的最小整数比特数的设备 | |
CN107077852B (zh) | 包括与hoa数据帧表示的特定数据帧的通道信号关联的非差分增益值的编码hoa数据帧表示 | |
CN109410962B (zh) | 用于对压缩的hoa信号进行解码的方法、装置和存储介质 | |
WO2006108573A1 (en) | Adaptive residual audio coding | |
KR101970080B1 (ko) | 음장의 고차 앰비소닉스 hoa 신호 표현의 낮은 비트 레이트 압축을 위한 방법 및 장치 | |
CN112908348B (zh) | 针对hoa数据帧表示的压缩确定表示非差分增益值所需的最小整数比特数的方法和设备 | |
JP2017523451A (ja) | 圧縮hoa表現をデコードする方法および装置ならびに圧縮hoa表現をエンコードする方法および装置 | |
KR20170063657A (ko) | 오디오 인코더 및 디코더 | |
CN107925837B (zh) | 对压缩hoa信号逐帧组合解码和渲染的方法以及对压缩hoa信号逐帧组合解码和渲染的装置 | |
US8644526B2 (en) | Audio signal decoding device and balance adjustment method for audio signal decoding device | |
CN106663434B (zh) | 针对hoa数据帧表示的压缩确定表示非差分增益值所需的最小整数比特数的方法 | |
JP2017523453A (ja) | 圧縮hoa表現をデコードする方法および装置ならびに圧縮hoa表現をエンコードする方法および装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1247016 Country of ref document: HK |
|
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |