CN102547549A - 编码解码2或3维声场环绕声表示的连续帧的方法和装置 - Google Patents
编码解码2或3维声场环绕声表示的连续帧的方法和装置 Download PDFInfo
- Publication number
- CN102547549A CN102547549A CN2011104317981A CN201110431798A CN102547549A CN 102547549 A CN102547549 A CN 102547549A CN 2011104317981 A CN2011104317981 A CN 2011104317981A CN 201110431798 A CN201110431798 A CN 201110431798A CN 102547549 A CN102547549 A CN 102547549A
- Authority
- CN
- China
- Prior art keywords
- coding
- decoding
- spatial
- spatial domain
- masking
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 230000005540 biological transmission Effects 0.000 claims abstract description 12
- 230000000873 masking effect Effects 0.000 claims description 48
- 230000006870 function Effects 0.000 claims description 19
- 230000009466 transformation Effects 0.000 claims description 17
- 238000009826 distribution Methods 0.000 claims description 15
- 230000008447 perception Effects 0.000 claims description 9
- 230000008878 coupling Effects 0.000 claims description 3
- 238000010168 coupling process Methods 0.000 claims description 3
- 238000005859 coupling reaction Methods 0.000 claims description 3
- 210000005069 ears Anatomy 0.000 claims 4
- 238000006243 chemical reaction Methods 0.000 claims 2
- 239000007787 solid Substances 0.000 claims 1
- 238000007906 compression Methods 0.000 abstract description 35
- 230000006835 compression Effects 0.000 abstract description 33
- 230000005236 sound signal Effects 0.000 abstract description 6
- 230000000875 corresponding effect Effects 0.000 description 12
- 238000012545 processing Methods 0.000 description 10
- 238000004458 analytical method Methods 0.000 description 8
- 239000013598 vector Substances 0.000 description 7
- 238000013459 approach Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000033458 reproduction Effects 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 3
- 230000004807 localization Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 230000001131 transforming effect Effects 0.000 description 3
- 238000000354 decomposition reaction Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000004091 panning Methods 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 241001499740 Plantago alpina Species 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 235000009508 confectionery Nutrition 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000007907 direct compression Methods 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000003892 spreading Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H20/00—Arrangements for broadcast or for distribution combined with broadcast
- H04H20/86—Arrangements characterised by the broadcast information itself
- H04H20/88—Stereophonic broadcast systems
- H04H20/89—Stereophonic broadcast systems using three or more audio channels, e.g. triphonic or quadraphonic
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
提供了一种编码解码2或3维声场环绕声表示的连续帧的方法和装置。使用更高阶高保真度立体声响复制(HOA)技术表示空间音频场景通常每个时刻都需要大量系数。这个数据速率对于需要实时传输音频信号的大多数实际应用来说太高了。按照本发明,在空间域中而不是在HOA域中进行压缩。将(N+1)2个输入HOA系数变换成空间域中的(N+1)2个等效信号,并且将所得的(N+1)2个时域信号输入一排并行感知编解码器中。在解码器方,解码各个空间域信号,并将空间域系数变换回到HOA域,以便恢复原始HOA表示。
Description
技术领域
本发明涉及编码和解码2维或3维声场的更高阶高保真度立体声响复制或环绕声(Ambisonics)表示的连续帧的方法和装置。
背景技术
高保真度立体声响复制技术将基于球谐波的特定系数用于提供一般独立于任何特定扬声器或扩音器装置的声场描述。这导致了在合成场景的声场记录或生成期间不需要有关扬声器位置的信息的描述。高保真度立体声响复制系统中的再现精度可以通过它的阶数N来修改。通过那种阶数可以为3D系统确定描述声场的所需音频信息声道的数量,因为这取决于球谐波基的数量。系数或声道的数量O是O=(N+1)2。
使用更高阶高保真度立体声响复制(HOA)技术(即,2或更高的阶数)表示复杂空间音频场景通常每个时刻都需要大量系数。每个系数应该具有相当高的分辨率,通常24比特/系数或以上。于是,以原始HOA格式传输音频场景所需的数据速率高。举一个例子来说,利用,例如,EigenMike记录系统记录的3阶HOA信号需要(3+1)2个系数*44100Hz*24比特/系数=16.15Mb/s的带宽。截至今天,这个数据速率对于需要实时传输音频信号的大多数实际应用来说太高了。因此,压缩技术是实际有关的HOA相关音频处理系统所需的。
更高阶高保真度立体声响复制是允许捕获、操纵和存储音频场景的数学范式。在空间中的基准点上和附近通过傅里叶-贝塞尔级数(Fourier-Bessel series)近似表示声场。因为HOA系数具有这种特定数学基础,所以必须应用特定压缩技术,以便达到最佳编码效率。冗余和心理声学这两个方面要予以考虑,并且可以预期,对于复杂空间音频场景和对于传统单声道或多声道信号起不同作用。与已建立音频格式的特别差异是HOA表示中的所有“声道”是在空间中利用相同基准地点计算的。因此,至少对于具有不多但占主导作 用的声音对象的音频场景而言,可以预期HOA系数之间存在相当大的相干性。
对于HOA信号的有损压缩,只存在不多已公布技术。其中大多数不能归到感知编码的类别,因为通常都没有将心理声学模型用于控制压缩。相反,几种现有方案将音频场景分解成基础模型的参数。
1阶到3阶高保真度立体声响复制传输的早期方法
高保真度立体声响复制的理论自1960年代以来已经用在音频制作和消费中,尽管直到现在其应用大多局限于1阶或2阶内容。大量分发格式已在使用之中,尤其:
-B-格式:这种格式是用于在研究人员、制作者和爱好者之间交换内容的标准专业、原始信号格式。通常,它涉及系数被特别归一化的1阶高保真度立体声响复制,但也存在直到3阶的规范。
-在B-格式的最近更高阶变型中,像SN3D那样的修正归一化方案、和特殊加权规则,例如,Furse-Malham又称FuMa或FMH集合,通常导致部分高保真度立体声响复制系数数据的幅度成比例缩小。在接收器方解码之前通过查表进行相反成比例放大操作。
-UHJ-格式(又称C-格式):这是可应用于经由现有单声道或双声道立体声路径将1阶高保真度立体声响复制内容输送给消费者的分层编码信号格式。对于左右两个声道,音频场景的完全水平环绕表示是可行的,虽然不具有完全空间分辨率。可选第3声道提高水平面上的空间分辨率,而可选第4声道增加高度维度。
-G-格式:这种格式是为了使以高保真度立体声响复制格式制作的内容无需在家里使用特定高保真度立体声响复制解码器地适用于任何人而创建的。在制作方已经进行了达到标准5声道环绕设置的解码。因为该解码操作不是标准化的,所以可靠重构原始B-格式高保真度立体声响复制内容是不可能的。
-D-格式:这种格式指的是如任意高保真度立体声响复制解码器产生的解码扬声器信号的集合。解码信号取决于特定扬声器几何形状和解码器设计的细节。G-格式是D-格式定义的子集,因为它指的是特定5声道环绕装置。
上述方法没有一种是已考虑到压缩而设计的。一些格式已经经过剪裁,以便利用现有低容量传输路径(例如,立体声链路),并因此隐性地降低了数 据速率以进行传输。但是,下混频信号缺乏原始输入信号信息的重要部分。因此,丧失了高保真度立体声响复制方法的灵活性和普遍性。
定向音频编码
2005年左右DirAC(定向音频编码)技术已经发展起来,它基于目标是将场景分解成每个时间和频率一个占主导作用声音对象加上环境声音的场景分析。该场景分析基于声场的瞬时强度矢量的评估。场景的两个部分将与直接声音所来自的地点信息一起传输。在接收器上,使用基于矢量的振幅摇摄(VBAP)来重放每个时频窗格的单个占主导作用声源。另外,按照作为辅助信息传输的比例产生去相关环境声音。在图1中描绘了DirAC处理,其中输入信号具有B-格式。可以将DirAC解释成利用单源加环境信号模型的参数编码的特定方式。传输质量很大程度上取决于对于特定压缩(compressed)音频场景而言模型假设是否真实。而且,在声音分析阶段直接声音和/或环境声音的任何错误检测都可能影响解码音频场景的重放质量。迄今为止,只为1阶高保真度立体声响复制内容描述了DirAC。
HOA系数的直接压缩
在2000年代后期,人们已经提出了HOA信号的感知以及无损压缩。
-对于无损编码,如E.Hellerud,A.Solvang,U.P.Svensson,″Spatial Redundancy in Higher Order Ambisonics and Its Use for Low Delay Lossless Compression″,Proc.of IEEE Intl.Conf.on Acoustics,Speech,and Signal Processing(ICASSP),April 2009,Taipei,Taiwan和E.Hellerud,U.P.Svensson,″Lossless Compression of Spherical Microphone Array Recordings″,Proc.of 126th AES Convention,Paper 7668,May 2009,Munich,Germany所描述,将不同高保真度立体声响复制系数之间的互相关用于降低HOA信号的冗余。利用后向自适应预测从直到要编码的系数的阶数的以前系数的加权组合中预测特定阶数的当前系数。已经通过评估真实世界内容的特征找到了预期呈现强互相关的系数组。
这种压缩以分层方式进行。针对系数的潜在互相关分析的相邻关系包含在相同时刻以及在以前时间实例上仅仅达到到相同阶数的系数,从而在比特流级上使压缩是可伸缩的。
-在T.Hirvonen,J.Ahonen,V.Pulkki,″Perceptual Compression Methods for Metadata in Directional Audio Coding Applied to Audiovisual Teleconference″,Proc.of 126th AES Convention,Paper 7706,May 2009,Munich,Germany和上述″Spatial Redundancy in Higher Order Ambisonics and Its Use for Low Delay Lossless Compression″文章中描述了感知编码。现有MPEG AAC压缩技术用于编码HOA B-格式表示的各个声道(即,系数)。通过调整取决于声道阶数的比特分配,已经获得了非均匀空间噪声分布。尤其,通过将更多的比特分配给低阶声道而将更少的比特分配给高阶声道,可以在基准点附近达到更高的精度。反过来,离原点的距离增大使有效量化噪声上升。
图2示出了B-格式音频信号的这样直接编码和解码的原理,其中上部路径示出上述Hellerud等人的压缩,而下部路径示出了到传统D-格式信号的压缩。在这两种情况下,解码接收器输出信号都具有D-格式。
在HOA域中直接探寻冗余性和不相关性带来的问题是任何空间信息在一般情况下都在几个HOA系数上被“污染”(smear)。换句话说,在空间域中良好定位和集中的信息向周围扩散。从而,使进行可靠地坚持心理声学掩蔽约束的一致噪声分配变得极具挑战性。而且,在HOA域中以差分方式捕获重要信息,大规模系数的细微差别在空间域中具有强大影响力。因此,可能需要高数据速率来保护这样的差分细节。
空间挤压
最近,B.Cheng,Ch.Ritz,I.Burnett已经开发了“空间挤压”技术:
B.Cheng,Ch.Ritz,I.Burnett,″Spatial Audio Coding by Squeezing:Analysis and Application to Compressing Multiple Soundfields″,Proc.of European Signal Processing Conf.(EUSIPCO),2009;
B.Cheng,Ch.Ritz,I.Burnett,″A Spatial Squeezing Approach to Ambisonic Audio Compression″,Proc.of IEEE Intl.Conf.on Acoustics,Speech,and Signal Processing(ICASSP),April 2008;以及
B.Cheng,Ch.Ritz,I.Burnett,″Principles and Analysis of the Squeezing Approach to Low Bit Rate Spatial Audio Coding″,Proc.of IEEE Intl.Conf.on Acoustics,Speech,and Signal Processing(ICAS SP),April 2007。
进行将声场分解成为每个时间/频率窗格选择占最主导作用声音对象的 音频场景分析。然后,创建在左右声道的位置之间的新位置上包含这些占主导作用声音对象的2声道立体声下混频。因为可以对立体声信号进行相同分析,所以通过将在2声道立体声下混频中检测的对象重新映射到360°的整个声场,可以进行局部反向操作。
图3描绘了空间挤压的原理。图4示出了相关编码处理。
该构思与DirAC密切相关,因为它取决于相同类型的音频场景分析。但是,与DirAC相反,下混频总是创建两个声道,并且不必传输有关占主导作用声音对象的地点的辅助信息。
尽管未明确利用心理声学原理,但该方案利用了对于时频方格只传输最显著的声音对象就已经可以达到像样质量的假设。关于这方面,与DirAC的假设存在更强烈的可比性。与DirAC类似,音频场景参数化的任何错误都将导致解码音频场景的人为产物。而且,2声道立体声下混频信号的任何感知编码对解码音频场景的质量的影响难以预测。由于这种空间挤压的类属架构,它不能应用于3维音频信号(即,具有高度维度的信号),显然,它适合超过一阶的高保真度立体声响复制阶数。
高保真度立体声响复制格式和混合阶数表示
在F.Zotter,H.Pomberger,M.Noisternig,″Ambisonic Decoding with and without Mode-Matching:A Case Study Using the Hemisphere″,Proc.of 2nd Ambisonics Symposium,May 2010,Paris,France中已经提出了将空间声音信息约束在整个球体的一个子空间上,例如,只覆盖上半球或甚至球体的更小部分。最终,完整的场景可以由球体上旋转用于组装目标音频场景的特定地点的几个这样约束“扇区”组成。这创建了复杂音频场景的一种混合阶数成分。未提及感知编码。
参数编码
描述和传输打算在波场合成(WFS)系统中重放的内容的“经典”途径是经由音频场景的各个声音对象的参数编码。每个声音对象由音频流(单声道、立体声或别的东西)加上有关整个音频场景内的声音对象的作用的元信息,即,最重要的对象的地点组成。这种面向对象的范式在欧洲“CARROUSO”的研究课题中得到细化,有关内容请参阅:S.Brix,Th.Sporer,J.Plogsties, ″CARROUSO-An European Approach to 3D-Audio″,Proc.of 110th AES Convention,Paper 5314,May 2001,Amsterdam,The Netherlands。
压缩相互独立的每个声音对象的一个例子是如Ch.Faller,″Parametric Joint-Coding of Audio Sources″,Proc.of 120th AES Convention,Paper 6752,May 2006,Paris,France中所描述的,在下混频情形下多个对象的联合编码,其中使用简单心理声学线索,以便创建借助于辅助信息,在接收器方可以解码多对象场景的有意义下混频信号。将音频场景内的对象再现到本地扬声器装置也发生在接收器方。
在面向对象格式中,记录特别复杂。理论上,需要各个声音对象的完全“干”记录,即,专门捕获一个声音对象发出的直接声音的记录。这种方法的挑战性是双重的:首先,干捕获在自然“实况”记录中是难以做到的,因为在扩音器信号之间存在相当大的串扰;其次,从干记录中组装的音频场景缺乏自然性和进行记录的房间的“氛围”。
参数编码加上高保真度立体声响复制
一些研究人员提出了将高保真度立体声响复制信号与许多离散声音对象组合。基本原理是捕获环境声音和经由高保真度立体声响复制表示不能适当定域的声音对象,并经由参数方法加入许多离散、适当放置的声音对象。对于场景的面向对象部分,将类似的编码机制用于纯参数表示(见前面的部分)。也就是说,那些各自的声音对象通常伴随着单声道声轨和有关地点和潜在移动的信息,有关内容请参阅:将高保真度立体声响复制重放引入MPEG-4 AudioBIFS标准中的介绍。在那种标准下,如何将原始高保真度立体声响复制和对象流传输到(AudioBIFS)再现引擎是有待音频场景的制作者解决的。这意味着在MPEG-4中定义的任何音频编解码可以用于直接编码高保真度立体声响复制系数。
波场编码
取代使用面向对象方法,波场编码传输WFS(波场合成)系统的已经再现的扬声器信号。编码器进行到一组特定扬声器的所有再现。对扬声器的曲线的加窗、准线性分段进行多维空时到频率变换。频率系数(对于时频和空频两者)利用某种心理声学模型来编码。除了通常的时频掩蔽之外,也可以 应用空频掩蔽,即,假设掩蔽现象是空间频率的函数。在解码器方,解压并重放编码扬声器声道。
图5示出了上部是一组扩音器和下部是一组扬声器的波场编码的原理。图6示出了按照F.Pinto,M.Vetterli,″Wave Field Coding in the Spacetime Frequency Domain″,Proc.of IEEE Intl.Conf.on Acoustics,Speech and Signal Processing(ICASSP),April 2008,Las Vegas,NV,USA的编码处理。有关感知波场编码的已公布实验表明,空时到频率变换与双源信号模型的再现扬声器声道的分立感知压缩相比节省了约15%的数据速率。不过,这种处理没有达到面向对象范式达到的压缩效率,很有可能是由于无法捕捉到扬声器声道之间的复杂互相关特性,这是因为声波将在不同时间到达每个扬声器。另一缺点是与目标系统的特定扬声器布局的紧密耦合。
通用空间线索
人们从经典多声道压缩出发,也考虑了能够解决不同扬声器情形的通用音频编解码的概念。与,例如,存在固定声道指定和相关的mp3环绕或MPEG环绕相反,将空间线索的表示设计成独立于特定输入扬声器配置,有关内容请参阅:M.M.Goodwin,J.-M.Jot,″A Frequency-Domain Framework for Spatial Audio Coding Based on Universal Spatial Cues″,Proc.of 120th AES Convention,Paper 6751,May 2006,Paris,France;M.M.Goodwin,J.-M.Jot,″Analysis and Synthesis for Universal Spatial Audio Coding″,Proc.of 121st AES Convention,Paper 6874,October 2006,San Francisco,CA,USA;以及M.M.Goodwin,J.-M.Jot,″Primary-Ambient Signal Decomposition and Vector-Based Localisation for Spatial Audio Coding and Enhancement″,Proc.of IEEE Intl.Conf.on Acoustics,Speech and Signal Processing(ICASSP),April 2007,Honolulu,HI,USA。
在离散输入声道信号的频域变换之后,对每个时频方格(tile)进行主要成分分析,以便将基本声音与环境成分区分开。其结果是通过将Gerzon矢量用于场景分析,得出方向矢量对圆心在听众所处的单位半径的圆上的地点的导数。图5描绘了下混频和传输空间线索的空间音频编码的相应系统。(立体声)下混频信号由分立信号成分组成,与关于对象地点的元信息一起传输。解码器从下混频信号和辅助信息中恢复原始声音和某些环境成分,从而向本地扬声器配置摇摄(pan)原始声音。可以将此解释为上述DirAC处理的多声 道变型,因为传输的信息非常相似。
发明内容
本发明要解决的问题是提供音频场景的HOA表示的改进有损压缩,从而将像感知掩蔽那样的心理声学现象考虑进来。这个问题是通过公开在权利要求1和5中的方法解决的。利用这些方法的装置公开在权利要求2和6中。
按照本发明,在空间域中而不是在HOA域中进行压缩(而在上述的波场编码中,假设掩蔽现象是空间频率的函数,本发明使用掩蔽现象作为空间地点的函数)。例如,通过平面波分解,将(N+1)2个输入HOA系数变换成空间域中的(N+1)2个等效信号。这些等效信号的每一个代表空间中来自相关方向的一组平面波。以简化方式,可以将所得信号解释为形成扩音器信号的虚拟波束,这些扩音器信号从输入音频场景表示中捕获落在相关波束的区域中的任何平面波。
所得的该组(N+1)2个信号是可以输入一排并行感知编解码器中的传统时域信号。可以应用任何现有感知压缩技术。在解码器方,解码各个空间域信号,并将空间域系数变换回到HOA域,以便恢复原始HOA表示。
这种类型的处理具有显著优点:
-心理声学掩蔽:如果将每个空间域信号与其它空间域信号分开处理,则编码错误将具有与掩蔽者信号相同的空间分布。因此,在将解码空间域系数转换回到HOA域之后,将按照原始信号的功率密度的空间分布定位编码错误的瞬时功率密度的空间分布。有利的是,从而可以保证编码错误永远被掩蔽。即使在复杂重放环境下,编码错误也总是恰好与相应掩蔽者信号一起传播。
但是,应该注意到,对于原来坐落在两个(2D情况)或三个(3D情况)基准地点之间的声音对象,仍然可以发生与“立体声揭露”类似的某种东西(参阅:M.Kahrs,K.H.Brandenburg,″Applications of Digital Signal Processing to Audio and Acoustics″,Kluwer Academic Publishers,1998)。但是,如果HOA输入材料的阶数升高,则这种潜在陷阱的概率和严重性将降低,因为空间域中不同基准位置之间的角距离减小了。通过按照占主导作用声音对象的地点采用HOA到空间变换(参见下面的特定实施例),可以缓解这种潜在问题。
-空间去相关:音频场景在空间域中通常是稀疏的,通常假设它们是基 础环境声场顶部的几个离散声音对象的混合物。通过将这样的音频场景变换到HOA域-基本上是到空间频率的变换,将空间稀疏,即,去相关的场景表示变换成一组高度相关系数。有关离散声音对象的任何信息都或多或少在所有频率系数上被“污染”。一般说来,压缩方法的目的是通过在理想情况下按照Karhunen-Loève变换选择去相关坐标系来降低冗余度。对于时域音频信号,通常频域提供更去相关的信号表示。但是,对于空间音频,情况就不是这样,因为空间域比HOA域更接近KLT坐标系。
-时间相关信号的集中度:将HOA系数变换到空间域的另一个重要方面是有很可能呈现强时间相关性-因为它们从相同物理声源发出-的信号成分集中在单个或几个系数中。这意味着与压缩空间分布时域信号有关的任何随后处理步骤可以利用最大的时域相关性。
-可理解性:对于时域信号来说,音频内容的编码和感知压缩是众所周知。相反,像更高阶高保真度立体声响复制(即,2或更高的阶数)那样的复杂变换域中的冗余和心理声学远没有被人们理解,需要许多数学和调查。因此,当使用工作在空间域中而不是HOA域中的压缩技术时,可以容易得多地应用和适应现有见解和技术。有利的是,将现有压缩编解码器用于部分系统可以迅速地获得合理结果。
换句话说,本发明包括如下优点:
-使心理声学掩蔽效应得到更好利用;
-更好的可理解性和易于实现;
-更好地适用于空间音频场景的典型成分;以及
-比现有手段更好的去相关性质。
原则上,本发明的编码方法适用于编码用HOA系数表示的2维或3维声场的高保真度立体声响复制表示的连续帧,所述方法包括如下步骤:
-将一个帧的O=(N+1)2个输入HOA系数变换成代表球体上的基准点的正则分布的O个空间域信号,其中N是所述HOA系数的阶数,并且所述空间域信号的每一个代表空间中来自相关方向的一组平面波;
-使用感知编码步骤或级编码所述空间域信号的每一个,从而使用选择成使编码错误听不见的编码参数;以及
-将一个帧的所得比特流多路复用成联合比特流。
原则上,本发明的解码方法适用于解码按照权利要求1编码的2维或3 维声场的编码更高阶高保真度立体声响复制表示的连续帧,所述解码方法包括如下步骤:
-将接收的联合比特流多路分解成O=(N+1)2个编码空间域信号;
-使用与所选编码类型相对应的感知解码步骤或级和使用与编码参数匹配的解码参数将所述编码空间域信号的每一个解码成相应解码空间域信号,其中所述解码空间域信号代表球体上的基准点的正则分布;以及
-将所述解码空间域信号变换成一个帧的输出HOA系数,其中N是所述HOA系数的阶数。
原则上,本发明的编码装置适用于编码用HOA系数表示的2维或3维声场的更高阶高保真度立体声响复制表示的连续帧,所述装置包括:
-适用于将一个帧的O=(N+1)2个输入HOA系数变换成代表球体上的基准点的正则分布的O个空间域信号的变换部件,其中N是所述HOA系数的阶数,并且所述空间域信号的每一个代表空间中来自相关方向的一组平面波;
-适用于使用感知编码步骤或级编码所述空间域信号的每一个的部件,从而使用选择成使编码错误听不见的编码参数;以及
-适用于将一个帧的所得比特流多路复用成联合比特流的部件。
原则上,本发明的解码装置适用于解码按照权利要求1编码的2维或3维声场的编码更高阶高保真度立体声响复制表示的连续帧,所述装置包括:
-适用于将接收的联合比特流多路分解成O=(N+1)2个编码空间域信号的部件;
-适用于使用与所选编码类型相对应的感知解码步骤或级并使用与编码参数匹配的解码参数将所述编码空间域信号的每一个解码成相应解码空间域信号的部件,其中所述解码空间域信号代表球体上的基准点的正则分布;
-适用于将所述解码空间域信号变换成一个帧的输出HOA系数的部件,其中N是所述HOA系数的阶数。
本发明的其它有利实施例公开在各自从属权利要求中。
附图说明
本发明的示范性实施例将参考附图来描述,在附图中:
图1示出了B-格式输入的定向音频编码;
图2示出了B-格式信号的直接编码;
图3示出了空间挤压的原理;
图4示出了空间挤压编码处理;
图5示出了波场编码的原理;
图6示出了波场编码处理;
图7示出了下混频和传输空间线索的空间音频编码;
图8示出了本发明编码器和解码器的示范性实施例;
图9示出了作为信号的耳间相差或时差的函数的不同信号的双耳(或立体)掩蔽级差;
图10示出了并入了BMLD建模的联合心理声学模型;
图11示出了示范性最大预期重放情形:有7×5个座位的电影院(为了示例起见任意选择的);
图12示出了对于图11的情形最大相对延迟和衰减的推导;
图13示出了声场HOA成分加上两个声音对象A和B的压缩;以及
图14示出了声场HOA成分加上两个声音对象A和B的联合心理声学模型。
具体实施方式
图8示出了本发明编码器和解码器的方块图。在本发明的这个基本实施例中,在变换步骤或级81中将输入HOA表示或信号IHOA的连续帧变换成基于3维球或2维圆上的基准点的正则分布的空间域信号。
关于从HOA域到空间域的变换,在高保真度立体声响复制理论中,通过截断傅里叶-贝塞尔级数描述空间中特定点上和附近的声场。一般说来,假设基准点在所选坐标系的原点上。对于使用球坐标的3维应用,所有指数定义为n=0,1,...N和m=-n,...,n的具有系数 的傅里叶级数描述在方位角φ、倾角θ和距原点的距离r上的声场的压强 其中k是波数,并且 是通过θ和φ定义的方向的与球面谐波函数密切相关的傅里叶-贝塞尔级数的核函数。为了方便起见,HOA系数 通过定义 来使用。对于特定阶数N,傅里叶-贝塞尔级数中的系数的数量是O=(N+1)2。
对于使用圆坐标的2维应用,核函数只取决于方位角φ。m≠n的所有 系数具有零值并且可以省略。因此,HOA系数的数量减小到O=2N+1。此外,倾角θ=π/2是固定的。对于2D情况和对于圆上的声音对象的完全均匀分布,即,对于 Ψ内的模矢量与众所周知的离散傅里叶变换(DFT)的核函数相同。
通过HOA到空间域变换,导出必须应用以便精确重放如输入HOA系数所描述的所希望声场的虚拟扬声器(在无限距离上发出平面波)的驱动信号。
所有模系数可以在模矩阵Ψ中组合,其中第i列按照第i虚拟扬声器的方向包含模矢量 n=0...N,m=-n...n。空间域中所希望信号的数量等于HOA系数的数量。因此,存在通过模矩阵Ψ的逆矩阵Ψ-1定义的变换/解码问题的唯一解:s=Ψ-1A。
这种变换使用了虚拟扬声器发出平面波的假设。真实世界扬声器具有应该小心重放的解码规则的不同重放特性。
基准点的一个例子是按照J.Fliege,U.Maier,″The Distribution of Points on the Sphere and Corresponding Cubature Formulae″,IMA Journal of Numerical Analysis,vol.19,no.2,pp.317-334,1999的取样点。将通过这种变换获得的空间域信号输入,例如,按照MPEG-1音频层III(又称mp3)标准的独立的、“O”个并行已知感知编码器步骤或级821,822,...,82O中,其中“O”对应于并行声道的数量O。将这些编码器的每一个参数化,使编码错误听不见。在多路复用器步骤或级83中将所得并行比特流多路复用成联合比特流BS,并传输给解码器方。取代mp3,可以使用像AAC或Dolby AC-3那样的任何其它合适音频编解码器类型。在解码器方,多路分解器步骤或级86多路分解接收的联合比特流,以便导出并行感知编解码器的各个比特流,在已知解码器步骤或级871,872,...,87O中解码各个比特流(与所选编码类型相对应并使用与编码参数匹配,即选成使解码错误听不见的解码参数),以便恢复未压缩空间域信号。对于每个时刻,在逆变换步骤或级88中将所得信号矢量变换到HOA域,从而恢复以连续帧输出的解码HOA表示或信号OHOA。
借助于这样的处理或系统,可以使数据速率显著降低。例如,来自EigenMike的3阶记录的输入HOA表示具有(3+1)2个系数*44100Hz*24比特/系数=16.9344Mb/s的数据速率。变换到空间域得出取样速率为44100Hz的(3+1)2个信号。使用mp3编解码器将代表44100*24=1.0584Mb/s数据速率的 这些(单声道)信号的每一个独立压缩成64kbit/s的各自数据速率(这意味着对单声道信号实际上是透明的)。然后,联合比特流的总数据速率是(3+1)2个信号*每个信号64kbit/s≈1Mbit/s。
这种评估是保守的,因为假设了围绕听众的整个球体均匀地充满声音,并且因为完全忽略了不同空间地点上的声音对象之间的任何交叉掩蔽效应:具有,比如说,80dB的掩蔽者信号将掩蔽角度只分开几度的弱音(比如说,在40dB上)。通过如下所述考虑这样的空间掩蔽效应,可以达到更高的压缩因数。再者,上述评估忽略了该组空间域信号中的相邻位置之间的任何相关性。并且,如果更好的压缩处理利用了这样的相关性,则可以达到更高的压缩比。最后一点也很重要,如果可接受时变速率,则预期可以达到还要高的压缩效率,因为声音场景中对象的数量变化很大,特别是电影声音。可以利用任何声音对象的稀疏性进一步降低所得比特率。
变型:心理声学
在图8的实施例中,假设尽量少的比特率控制:预期所有各个感知编解码器以相同的数据速率运行。如上所述,通过取而代之地使用将整个空间音频场景都考虑进来的更复杂比特率控制,可以得到相当大的改善。更具体地说,时频掩蔽和空间掩蔽特性的组合起着关键的作用。对于这种情况的空间维度,掩蔽现象是与听众有关的声音事件的绝对角位置的函数,而不是空间频率的函数(注意,这种认识不同于在波场编码部分中提及的Pinto等人的认识)。针对空间表示观察的掩蔽阈值与掩蔽者和被掩蔽者的单调表示相比的差异称为双耳(或立体)掩蔽级差(BMLD),有关内容请参阅:J.Blauert,″Spatial Hearing:The Psychophysics of Human Sound Localisation″,The MIT Press,1996中的3.2.2节。一般说来,BMLD取决于像信号成分、空间地点、频率范围那样的几个参数。空间表示中的掩蔽阈值可以比单调表示低多达~20dB。因此,掩蔽阈值跨空间域的使用将把这一点考虑进来。
A)本发明的一个实施例使用取决于音频场景的维度产生多维掩蔽阈值曲线的心理声学掩蔽模型,该多维掩蔽阈值曲线分别取决于(时间-)频率,以及,取决于整个圆或球上的声音入射的角度。这个掩蔽阈值可以通过经由操纵为(N+1)2个基准地点获得的各条(时间-)频率掩蔽曲线与把BMLD考虑进来的空间“扩展函数”相结合获得。从而,可以利用掩蔽者对位于附近, 即,处在与掩蔽者相距小角距离的位置上的信号的影响。
图9示出了如上述文章″Spatial Hearing:The Psychophysics of Human Sound Localisation″所公开的,作为信号的耳间相差或时差(即,相角和时延)的函数的不同信号(宽带噪声掩蔽者加上作为所希望信号的正弦波或100μs脉冲序列)的BMLD。
可以将最坏情况特性(即具有最高BMLD值)的倒数用作确定沿着一个方面的掩蔽者对沿着另一个方面的被掩蔽者的影响的保守“污染”函数。如果已知特定情况的BMLD,可以减弱这种最坏情况要求。最感兴趣情况是掩蔽者是在空间上窄但在(时间-)频率上宽的噪声的那些情况。
图10示出了如何可以将BMLD的模型并入联合心理声学建模中,以便导出联合掩蔽阈值MT。每个空间方向的各自MT在心理声学模型步骤或级1011,1012,...,101O中计算,并输入到相应空间扩展函数SSF步骤或级1021,1022,...,102O中,该空间扩展函数是,例如,显示在图9中的BMLD之一的倒数。因此,为来自每个方向的所有信号贡献计算覆盖整个球/圆(3D/2D情况)的MT。在步骤/级103中计算所有各自MT的最大值,并且为整个音频场景提供联合MT。
B)这个实施例的进一步延伸需要在目标收听环境下,例如,在电影院或有大量观众的其它场馆中声音传播的模型,因为声音感知取决于相对于扬声器的收听位置。图11示出了有7×5=35个座位的示例电影院情形。当在电影院中重放空间音频信号时,音频感知和声级取决于观众席的大小和各个听众的地点。“完美”的再现只发生在甜蜜点上,即,通常在观众席的中心或基准地点110上。如果考虑处在,例如,观众的左周界上的座位位置,则很有可能从右侧到达的声音相对于从左侧到达的声音既衰减又延迟,因为到右侧扬声器的直接视线长于到左侧扬声器的直接视线。在最坏情况考虑中应该把这种非最佳收听位置的因声音传播引起的潜在方向相关衰减和延迟考虑进来,以防止从空间不同方向中断屏蔽编码错误,即,空间中断屏蔽效应。为了防止这样的效应,在感知编解码器的心理声学模型中把时间延迟和声级变化考虑进来。
为了推导修改BMLD值建模的数学表达式,针对掩蔽者和被掩蔽者方向的任何组合建模最大预期相对时间延迟和信号衰减。在下文中,对2维示例设置进行这种操作。图11电影院例子的可能简化在图12中示出。预期观众 处在半径rA的圆内,可以参照描绘在图11中的相应圆圈。考虑两个信号方向:掩蔽者S被显示成作为平面波来自左侧(电影院中的前方),而被掩蔽者N是从与电影院中的左后方相对应的图12的右下方到达的平面波。
两个平面波的同时到达时间线用平分虚线描绘。周界上与这条平分线距离最大的两点是观众席内出现最大时间/声级差的地点。在到达图中的带标记右下点120之前,声波在到达收听区的周界之后传播附加距离dS,和dN:
然后,在那点上掩蔽者S与被掩蔽者N之间的相对时差是:
其中c表示声音的速度。
为了确定传播损耗的差异,后面采用每加倍距离损耗K=3...6 dB(精确数取决于扬声器技术)的简单模型。而且,假设实际声源相对于收听区的外围周界具有dLS的距离。然后,最大传播损耗量为:
这种重放情形模型包含两个参数Δt(φ)和ΔL(φ)。通过加入各自BMLD项,即,通过如下替代可以将这些参数积分成联合心理声学模型:
SSFnew(φ)=SSFold(φ)-BMLDt(Δt(φ))-|ΔL(φ)|。
从而保证了即使在大房间中,也可以通过其它空间信号成分掩蔽任何量化错误噪声。
C)可以将与前面部分所介绍相同的考虑应用于将一个或多个离散声音对象与一个或多个HOA成分组合的空间音频格式。对整个音频场景进行心理声学掩蔽阈值的估计,包括如上所述对目标环境的特性的可选考虑。然后,离散声音对象的各自压缩以及HOA成分的压缩把联合心理声学掩蔽阈值考虑进来,以便进行比特分配。
包含HOA部分和一些不同各自声音对象两者的更复杂音频场景的压缩可以与上述联合心理声学模型类似地进行。相关压缩处理在图13中描绘。与上面的考虑并行,联合心理声学模型应该把所有声音对象都考虑进来。可以应用与上面所介绍相同的基本原理和结构。相应心理声学模型的高级方块图 在图14中示出。
Claims (24)
1.一种编码用HOA系数表示的2维或3维声场的更高阶高保真度立体声响复制表示的连续帧的方法,所述方法包括如下步骤:
-将一个帧的O=(N+1)2个输入HOA系数变换(81)成代表球体上的基准点的正则分布的O个空间域信号,其中N是所述HOA系数的阶数,并且所述空间域信号的每一个代表空间中来自相关方向的一组平面波;
-使用感知编码步骤或级(821,822,...,82O)编码所述空间域信号的每一个,从而使用选择成使编码错误听不见的编码参数;以及
-将一个帧的所得比特流多路复用(83)成联合比特流(BS)。
2.按照权利要求1所述的方法,其中用在所述编码中的掩蔽是时频掩蔽和空间掩蔽的组合。
3.按照权利要求1或2所述的方法,其中所述变换(81)是平面波分解。
4.按照权利要求1所述的方法,其中所述感知编码(821,822,...,82O)对应于MPEG-1音频层III或AAC或Dolby AC-3标准。
5.按照权利要求1所述的方法,其中为了防止从空间不同方向揭露编码错误,把非最佳收听位置因声音传播引起的方向相关衰减和延迟考虑进来,以便计算(1011,1012,...,101O)应用在所述编码中的掩蔽阈值。
6.按照权利要求1所述的方法,其中在所述编码步骤或级(821,822,...,82O)中使用的各个掩蔽阈值(1011,1012,...,101O)通过将它们的每一个与把双耳(或立体)掩蔽级差BMLD考虑进来的空间扩展函数(1021,1022,...,102O)相结合来改变,以及其中形成(103)这些各个掩蔽阈值的最大值,以便获得所有声音方向的联合掩蔽阈值。
7.按照权利要求1所述的方法,其中单独编码离散声音对象。
8.一种编码用HOA系数表示的2维或3维声场的更高阶高保真度立体声响复制表示的连续帧的装置,所述装置包括:
-适用于将一个帧的O=(N+1)2个输入HOA系数(IHOA)变换成代表球体上的基准点的正则分布的O个空间域信号的变换部件(81),其中N是所述HOA系数的阶数,并且所述空间域信号的每一个代表空间中来自相关方向的一组平面波;
-适用于使用感知编码步骤或级编码所述空间域信号的每一个的部件(821,822,...,82O),从而使用选择成使编码错误听不见的编码参数;以及
-适用于将一个帧的所得比特流多路复用成联合比特流(BT)的部件(83)。
9.按照权利要求8所述的装置,其中用在所述编码中的掩蔽是时频掩蔽和空间掩蔽的组合。
10.按照权利要求8或9所述的装置,其中所述变换(81)是平面波分解。
11.按照权利要求8所述的装置,其中所述感知编码(821,822,...,82O)对应于MPEG-1音频层III或AAC或Dolby AC-3标准。
12.按照权利要求8所述的装置,其中为了防止从空间不同方向揭露编码错误,把非最佳收听位置因声音传播引起的方向相关衰减和延迟考虑进来,以便计算(1011,1012,...,101O)应用在所述编码中的掩蔽阈值。
13.按照权利要求8所述的装置,其中在所述编码步骤或级(821,822,...,82O)中使用的各个掩蔽阈值(1011,1012,...,101O)通过将它们的每一个与把双耳(或立体)掩蔽级差(BMLD)考虑进来的空间扩展函数(1021,1022,...,102O)相结合来改变,以及其中形成(103)这些各个掩蔽阈值的最大值,以便获得所有声音方向的联合掩蔽阈值。
14.按照权利要求8所述的装置,其中单独编码离散声音对象。
15.一种解码按照权利要求1编码的2维或3维声场的编码更高阶高保真度立体声响复制表示的连续帧的方法,所述解码方法包括如下步骤:
-将接收的联合比特流(BS)多路分解(86)成O=(N+1)2个编码空间域信号;
-使用与所选编码类型相对应的感知解码步骤或级(871,872,...,87O)并使用与编码参数匹配的解码参数将所述编码空间域信号的每一个解码成相应解码空间域信号,其中所述解码空间域信号代表球体上的基准点的正则分布;以及
-将所述解码空间域信号变换(88)成一个帧的O个输出HOA系数(OHOA),其中N是所述HOA系数的阶数。
16.按照权利要求15所述的方法,其中所述感知解码(871,872,...,87O)对应于MPEG-1音频层III或AAC或Dolby AC-3标准。
17.按照权利要求15所述的方法,其中为了防止从空间不同方向揭露编码错误,把非最佳收听位置因声音传播引起的方向相关衰减和延迟考虑进来,以便计算(1011,1012,...,101O)应用在所述解码中的掩蔽阈值。
18.按照权利要求15所述的方法,其中在所述解码步骤或级(871,872,...,87O)中使用的各个掩蔽阈值(1011,1012,...,101O)通过将它们的每一个与把双耳(或立体)掩蔽级差(BMLD)考虑进来的空间扩展函数(1021,1022,...,102O)相结合来改变,以及其中形成(103)这些各个掩蔽阈值的最大值,以便获得所有声音方向的联合掩蔽阈值。
19.按照权利要求15所述的方法,其中单独解码离散声音对象。
20.一种解码按照权利要求1编码的2维或3维声场的编码更高阶高保真度立体声响复制表示的连续帧的装置,所述装置包括:
-适用于将接收的联合比特流(BS)多路分解成O=(N+1)2个编码空间域信号的部件(86);
-适用于使用与所选编码类型相对应的感知解码步骤或级并使用与编码参数匹配的解码参数将所述编码空间域信号的每一个解码成相应解码空间域信号的部件(871,872,...,87O),其中所述解码空间域信号代表球体上的基准点的正则分布;以及
-适用于将所述解码空间域信号变换成一个帧的O个输出HOA系数(OHOA)的变换部件(88),其中N是所述HOA系数的阶数。
21.按照权利要求20所述的装置,其中所述感知解码(871,872,...,87O)对应于MPEG-1音频层III或AAC或Dolby AC-3标准。
22.按照权利要求20所述的装置,其中为了防止从空间不同方向揭露编码错误,把非最佳收听位置因声音传播引起的方向相关衰减和延迟考虑进来,以便计算(1011,1012,...,101O)应用在所述解码中的掩蔽阈值。
23.按照权利要求20所述的装置,其中在所述解码步骤或级(871,872,...,87O)中使用的各个掩蔽阈值(1011,1012,...,101O)通过将它们的每一个与把双耳(或立体)掩蔽级差(BMLD)考虑进来的空间扩展函数(1021,1022,...,102O)相结合来改变,以及其中形成(103)这些各个掩蔽阈值的最大值,以便获得所有声音方向的联合掩蔽阈值。
24.按照权利要求20所述的装置,其中单独解码离散声音对象。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP10306472A EP2469741A1 (en) | 2010-12-21 | 2010-12-21 | Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field |
EP10306472.1 | 2010-12-21 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102547549A true CN102547549A (zh) | 2012-07-04 |
CN102547549B CN102547549B (zh) | 2016-06-22 |
Family
ID=43727681
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201110431798.1A Active CN102547549B (zh) | 2010-12-21 | 2011-12-21 | 编码解码2或3维声场环绕声表示的连续帧的方法和装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US9397771B2 (zh) |
EP (5) | EP2469741A1 (zh) |
JP (6) | JP6022157B2 (zh) |
KR (3) | KR101909573B1 (zh) |
CN (1) | CN102547549B (zh) |
Cited By (47)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104428834A (zh) * | 2012-07-15 | 2015-03-18 | 高通股份有限公司 | 用于使用基函数系数的三维音频译码的系统、方法、设备和计算机可读媒体 |
CN104471960A (zh) * | 2012-07-15 | 2015-03-25 | 高通股份有限公司 | 用于向后兼容音频译码的系统、方法、设备和计算机可读媒体 |
CN105027200A (zh) * | 2013-03-01 | 2015-11-04 | 高通股份有限公司 | 变换球谐系数 |
CN105144752A (zh) * | 2013-04-29 | 2015-12-09 | 汤姆逊许可公司 | 对更高阶高保真度立体声响复制表示进行压缩和解压缩的方法和装置 |
CN105247612A (zh) * | 2013-05-28 | 2016-01-13 | 高通股份有限公司 | 相对于球面谐波系数执行空间掩蔽 |
CN105325015A (zh) * | 2013-05-29 | 2016-02-10 | 高通股份有限公司 | 经旋转高阶立体混响的双耳化 |
CN105378833A (zh) * | 2013-07-11 | 2016-03-02 | 汤姆逊许可公司 | 用于从hoa信号的系数域表示产生所述hoa信号的混合的空间/系数域表示的方法和设备 |
CN105940447A (zh) * | 2014-01-30 | 2016-09-14 | 高通股份有限公司 | 环境高阶立体混响系数的转变 |
US9473870B2 (en) | 2012-07-16 | 2016-10-18 | Qualcomm Incorporated | Loudspeaker position compensation with 3D-audio hierarchical coding |
CN106104681A (zh) * | 2014-03-21 | 2016-11-09 | 杜比国际公司 | 用于压缩高阶高保真立体声(hoa)信号的方法、用于解压缩压缩的hoa信号的方法、用于压缩hoa信号的装置以及用于解压缩压缩的hoa信号的装置 |
CN106233755A (zh) * | 2014-03-21 | 2016-12-14 | 杜比国际公司 | 用于对高阶Ambisonics(HOA)信号进行压缩的方法、用于对经压缩的HOA信号进行解压的方法、用于对HOA信号进行压缩的装置、以及用于对经压缩的HOA信号进行解压的装置 |
CN106463131A (zh) * | 2014-07-02 | 2017-02-22 | 杜比国际公司 | 用于对hoa信号表示的子带内的主导方向信号的方向进行编码/解码的方法和装置 |
CN106463121A (zh) * | 2014-05-16 | 2017-02-22 | 高通股份有限公司 | 较高阶立体混响信号压缩 |
CN106463132A (zh) * | 2014-07-02 | 2017-02-22 | 杜比国际公司 | 对压缩的hoa表示解码的方法和装置以及对压缩的hoa表示编码的方法和装置 |
CN106471579A (zh) * | 2014-07-02 | 2017-03-01 | 杜比国际公司 | 用于对hoa信号表示的子带内的主导方向信号的方向进行编码/解码的方法和装置 |
CN106471577A (zh) * | 2014-05-16 | 2017-03-01 | 高通股份有限公司 | 在高阶立体混响系数中的标量与向量之间进行确定 |
CN106575506A (zh) * | 2014-08-29 | 2017-04-19 | 高通股份有限公司 | 高阶立体混响音频数据的中间压缩 |
CN106663432A (zh) * | 2014-07-02 | 2017-05-10 | 杜比国际公司 | 对压缩的hoa表示解码的方法和装置以及对压缩的hoa表示编码的方法和装置 |
CN106663433A (zh) * | 2014-07-02 | 2017-05-10 | 高通股份有限公司 | 减少高阶立体混响(hoa)背景信道之间的相关性 |
CN106663434A (zh) * | 2014-06-27 | 2017-05-10 | 杜比国际公司 | 针对hoa数据帧表示的压缩确定表示非差分增益值所需的最小整数比特数的方法 |
CN106796795A (zh) * | 2014-10-10 | 2017-05-31 | 高通股份有限公司 | 以信号表示用于高阶立体混响音频数据的可缩放译码的层 |
CN107077852A (zh) * | 2014-06-27 | 2017-08-18 | 杜比国际公司 | 包括与hoa数据帧表示的特定数据帧的通道信号关联的非差分增益值的编码hoa数据帧表示 |
CN107180637A (zh) * | 2012-05-14 | 2017-09-19 | 杜比国际公司 | 压缩和解压缩高阶高保真度立体声响复制信号表示的方法及装置 |
CN107403625A (zh) * | 2012-07-16 | 2017-11-28 | 杜比国际公司 | 用于对hoa音频信号进行解码的方法、设备和计算机可读介质 |
US9883312B2 (en) | 2013-05-29 | 2018-01-30 | Qualcomm Incorporated | Transformed higher order ambisonics audio data |
US9930464B2 (en) | 2014-03-21 | 2018-03-27 | Dolby Laboratories Licensing Corporation | Method for compressing a higher order ambisonics (HOA) signal, method for decompressing a compressed HOA signal, apparatus for compressing a HOA signal, and apparatus for decompressing a compressed HOA signal |
CN107995582A (zh) * | 2013-11-28 | 2018-05-04 | 杜比国际公司 | 使用奇异值分解进行hoa编码和解码的方法和装置 |
CN108140390A (zh) * | 2015-10-08 | 2018-06-08 | 杜比国际公司 | 用于压缩高阶高保真度立体声响复制声音或声场表示的分层编码和数据结构 |
CN108174341A (zh) * | 2013-01-16 | 2018-06-15 | 杜比国际公司 | 测量高阶高保真度立体声响复制响度级的方法及设备 |
CN108337624A (zh) * | 2013-10-23 | 2018-07-27 | 杜比国际公司 | 用于音频信号呈现的方法和装置 |
CN108780647A (zh) * | 2016-01-05 | 2018-11-09 | 高通股份有限公司 | 音频的混合域译码 |
CN109410965A (zh) * | 2012-12-12 | 2019-03-01 | 杜比国际公司 | 对声场的高阶立体混响表示进行压缩和解压缩的方法和设备 |
CN109791768A (zh) * | 2016-09-30 | 2019-05-21 | 冠状编码股份有限公司 | 用于对三维音频信号进行转换、立体声编码、解码和转码的过程 |
CN109964272A (zh) * | 2017-01-27 | 2019-07-02 | 谷歌有限责任公司 | 声场表示的代码化 |
CN110459229A (zh) * | 2014-06-27 | 2019-11-15 | 杜比国际公司 | 用于解码声音或声场的高阶高保真度立体声响复制(hoa)表示的方法 |
CN110827840A (zh) * | 2014-01-30 | 2020-02-21 | 高通股份有限公司 | 译码环境高阶立体混响系数的独立帧 |
CN111028849A (zh) * | 2014-01-08 | 2020-04-17 | 杜比国际公司 | 包括编码hoa表示的位流的解码方法和装置、以及介质 |
US10770087B2 (en) | 2014-05-16 | 2020-09-08 | Qualcomm Incorporated | Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals |
CN112908348A (zh) * | 2014-06-27 | 2021-06-04 | 杜比国际公司 | 针对hoa数据帧表示的压缩确定表示非差分增益值所需的最小整数比特数的方法和设备 |
CN113454715A (zh) * | 2018-12-07 | 2021-09-28 | 弗劳恩霍夫应用研究促进协会 | 用于使用低阶、中阶和高阶分量生成器进行与基于DirAC的空间音频编码有关的编码、解码、场景处理和其他过程的装置、方法和计算机程序 |
CN113574596A (zh) * | 2019-02-19 | 2021-10-29 | 公立大学法人秋田县立大学 | 音频信号编码方法、音频信号解码方法、程序、编码装置、音频系统及解码装置 |
CN113903353A (zh) * | 2021-09-27 | 2022-01-07 | 随锐科技集团股份有限公司 | 一种基于空间区分性检测的定向噪声消除方法及装置 |
CN115335900A (zh) * | 2020-03-24 | 2022-11-11 | 高通股份有限公司 | 使用自适应网络来对全景声系数进行变换 |
CN115376527A (zh) * | 2021-05-17 | 2022-11-22 | 华为技术有限公司 | 三维音频信号编码方法、装置和编码器 |
CN116324980A (zh) * | 2020-09-25 | 2023-06-23 | 苹果公司 | 声道、对象和hoa音频内容的无缝可扩展解码 |
US12020714B2 (en) | 2015-10-08 | 2024-06-25 | Dolby International Ab | Layered coding for compressed sound or sound field represententations |
WO2024244441A1 (zh) * | 2023-05-27 | 2024-12-05 | 华为技术有限公司 | 场景音频解码方法及电子设备 |
Families Citing this family (65)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2469741A1 (en) * | 2010-12-21 | 2012-06-27 | Thomson Licensing | Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field |
EP2600637A1 (en) * | 2011-12-02 | 2013-06-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for microphone positioning based on a spatial power density |
KR101871234B1 (ko) * | 2012-01-02 | 2018-08-02 | 삼성전자주식회사 | 사운드 파노라마 생성 장치 및 방법 |
JP6279569B2 (ja) | 2012-07-19 | 2018-02-14 | ドルビー・インターナショナル・アーベー | マルチチャンネルオーディオ信号のレンダリングを改善する方法及び装置 |
US9761229B2 (en) * | 2012-07-20 | 2017-09-12 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for audio object clustering |
US9516446B2 (en) | 2012-07-20 | 2016-12-06 | Qualcomm Incorporated | Scalable downmix design for object-based surround codec with cluster analysis by synthesis |
EP2898506B1 (en) * | 2012-09-21 | 2018-01-17 | Dolby Laboratories Licensing Corporation | Layered approach to spatial audio coding |
US9565314B2 (en) * | 2012-09-27 | 2017-02-07 | Dolby Laboratories Licensing Corporation | Spatial multiplexing in a soundfield teleconferencing system |
EP2733963A1 (en) | 2012-11-14 | 2014-05-21 | Thomson Licensing | Method and apparatus for facilitating listening to a sound signal for matrixed sound signals |
EP2738962A1 (en) * | 2012-11-29 | 2014-06-04 | Thomson Licensing | Method and apparatus for determining dominant sound source directions in a higher order ambisonics representation of a sound field |
US9609452B2 (en) | 2013-02-08 | 2017-03-28 | Qualcomm Incorporated | Obtaining sparseness information for higher order ambisonic audio renderers |
US9883310B2 (en) * | 2013-02-08 | 2018-01-30 | Qualcomm Incorporated | Obtaining symmetry information for higher order ambisonic audio renderers |
US10178489B2 (en) * | 2013-02-08 | 2019-01-08 | Qualcomm Incorporated | Signaling audio rendering information in a bitstream |
EP2765791A1 (en) * | 2013-02-08 | 2014-08-13 | Thomson Licensing | Method and apparatus for determining directions of uncorrelated sound sources in a higher order ambisonics representation of a sound field |
WO2014125736A1 (ja) * | 2013-02-14 | 2014-08-21 | ソニー株式会社 | 音声認識装置、および音声認識方法、並びにプログラム |
EP2782094A1 (en) * | 2013-03-22 | 2014-09-24 | Thomson Licensing | Method and apparatus for enhancing directivity of a 1st order Ambisonics signal |
US9641834B2 (en) | 2013-03-29 | 2017-05-02 | Qualcomm Incorporated | RTP payload format designs |
US9466305B2 (en) | 2013-05-29 | 2016-10-11 | Qualcomm Incorporated | Performing positional analysis to code spherical harmonic coefficients |
KR102228994B1 (ko) * | 2013-06-05 | 2021-03-17 | 돌비 인터네셔널 에이비 | 오디오 신호를 인코딩하기 위한 방법, 오디오 신호를 인코딩하기 위한 장치, 오디오 신호를 디코딩하기 위한 방법 및 오디오 신호를 디코딩하기 위한 장치 |
CN104244164A (zh) * | 2013-06-18 | 2014-12-24 | 杜比实验室特许公司 | 生成环绕立体声声场 |
US9830918B2 (en) | 2013-07-05 | 2017-11-28 | Dolby International Ab | Enhanced soundfield coding using parametric component generation |
US9466302B2 (en) | 2013-09-10 | 2016-10-11 | Qualcomm Incorporated | Coding of spherical harmonic coefficients |
DE102013218176A1 (de) * | 2013-09-11 | 2015-03-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und verfahren zur dekorrelation von lautsprechersignalen |
US8751832B2 (en) * | 2013-09-27 | 2014-06-10 | James A Cashin | Secure system and method for audio processing |
WO2015102452A1 (en) * | 2014-01-03 | 2015-07-09 | Samsung Electronics Co., Ltd. | Method and apparatus for improved ambisonic decoding |
JP6863359B2 (ja) * | 2014-03-24 | 2021-04-21 | ソニーグループ株式会社 | 復号装置および方法、並びにプログラム |
CN109036441B (zh) | 2014-03-24 | 2023-06-06 | 杜比国际公司 | 对高阶高保真立体声信号应用动态范围压缩的方法和设备 |
JP6374980B2 (ja) | 2014-03-26 | 2018-08-15 | パナソニック株式会社 | サラウンドオーディオ信号処理のための装置及び方法 |
US9852737B2 (en) * | 2014-05-16 | 2017-12-26 | Qualcomm Incorporated | Coding vectors decomposed from higher-order ambisonics audio signals |
US9959876B2 (en) * | 2014-05-16 | 2018-05-01 | Qualcomm Incorporated | Closed loop quantization of higher order ambisonic coefficients |
EP2963948A1 (en) | 2014-07-02 | 2016-01-06 | Thomson Licensing | Method and apparatus for encoding/decoding of directions of dominant directional signals within subbands of a HOA signal representation |
US9747910B2 (en) | 2014-09-26 | 2017-08-29 | Qualcomm Incorporated | Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework |
US9875745B2 (en) * | 2014-10-07 | 2018-01-23 | Qualcomm Incorporated | Normalization of ambient higher order ambisonic audio data |
US9984693B2 (en) * | 2014-10-10 | 2018-05-29 | Qualcomm Incorporated | Signaling channels for scalable coding of higher order ambisonic audio data |
EP3251116A4 (en) | 2015-01-30 | 2018-07-25 | DTS, Inc. | System and method for capturing, encoding, distributing, and decoding immersive audio |
EP3073488A1 (en) | 2015-03-24 | 2016-09-28 | Thomson Licensing | Method and apparatus for embedding and regaining watermarks in an ambisonics representation of a sound field |
US10334387B2 (en) | 2015-06-25 | 2019-06-25 | Dolby Laboratories Licensing Corporation | Audio panning transformation system and method |
US12087311B2 (en) | 2015-07-30 | 2024-09-10 | Dolby Laboratories Licensing Corporation | Method and apparatus for encoding and decoding an HOA representation |
EP3329486B1 (en) | 2015-07-30 | 2020-07-29 | Dolby International AB | Method and apparatus for generating from an hoa signal representation a mezzanine hoa signal representation |
US9959880B2 (en) * | 2015-10-14 | 2018-05-01 | Qualcomm Incorporated | Coding higher-order ambisonic coefficients during multiple transitions |
EP3375208B1 (en) * | 2015-11-13 | 2019-11-06 | Dolby International AB | Method and apparatus for generating from a multi-channel 2d audio input signal a 3d sound representation signal |
US10395664B2 (en) | 2016-01-26 | 2019-08-27 | Dolby Laboratories Licensing Corporation | Adaptive Quantization |
KR102261905B1 (ko) | 2016-03-15 | 2021-06-08 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 음장 기술을 생성하기 위한 장치, 방법, 또는 컴퓨터 프로그램 |
EP3469589B1 (en) * | 2016-06-30 | 2024-06-19 | Huawei Technologies Duesseldorf GmbH | Apparatuses and methods for encoding and decoding a multichannel audio signal |
CN109804645A (zh) * | 2016-10-31 | 2019-05-24 | 谷歌有限责任公司 | 基于投影的音频代码化 |
FR3060830A1 (fr) * | 2016-12-21 | 2018-06-22 | Orange | Traitement en sous-bandes d'un contenu ambisonique reel pour un decodage perfectionne |
US10904992B2 (en) | 2017-04-03 | 2021-01-26 | Express Imaging Systems, Llc | Systems and methods for outdoor luminaire wireless control |
WO2018208560A1 (en) * | 2017-05-09 | 2018-11-15 | Dolby Laboratories Licensing Corporation | Processing of a multi-channel spatial audio format input signal |
CN110800048B (zh) | 2017-05-09 | 2023-07-28 | 杜比实验室特许公司 | 多通道空间音频格式输入信号的处理 |
CN117319917A (zh) | 2017-07-14 | 2023-12-29 | 弗劳恩霍夫应用研究促进协会 | 使用多点声场描述生成经修改的声场描述的装置及方法 |
CN111183479B (zh) * | 2017-07-14 | 2023-11-17 | 弗劳恩霍夫应用研究促进协会 | 使用多层描述生成经增强的声场描述的装置及方法 |
CN107705794B (zh) * | 2017-09-08 | 2023-09-26 | 崔巍 | 增强型多功能数字音频解码器 |
US11032580B2 (en) | 2017-12-18 | 2021-06-08 | Dish Network L.L.C. | Systems and methods for facilitating a personalized viewing experience |
CN118197326A (zh) * | 2018-02-01 | 2024-06-14 | 弗劳恩霍夫应用研究促进协会 | 使用混合编码器/解码器空间分析的音频场景编码器、音频场景解码器及相关方法 |
US10365885B1 (en) | 2018-02-21 | 2019-07-30 | Sling Media Pvt. Ltd. | Systems and methods for composition of audio content from multi-object audio |
US10672405B2 (en) * | 2018-05-07 | 2020-06-02 | Google Llc | Objective quality metrics for ambisonic spatial audio |
JP7384893B2 (ja) * | 2018-07-04 | 2023-11-21 | フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | マルチシグナルエンコーダ、マルチシグナルデコーダ、および信号白色化または信号後処理を使用する関連方法 |
US10728689B2 (en) * | 2018-12-13 | 2020-07-28 | Qualcomm Incorporated | Soundfield modeling for efficient encoding and/or retrieval |
US11317497B2 (en) | 2019-06-20 | 2022-04-26 | Express Imaging Systems, Llc | Photocontroller and/or lamp with photocontrols to control operation of lamp |
US11430451B2 (en) * | 2019-09-26 | 2022-08-30 | Apple Inc. | Layered coding of audio with discrete objects |
US11212887B2 (en) | 2019-11-04 | 2021-12-28 | Express Imaging Systems, Llc | Light having selectively adjustable sets of solid state light sources, circuit and method of operation thereof, to provide variable output characteristics |
CN113593585A (zh) * | 2020-04-30 | 2021-11-02 | 华为技术有限公司 | 音频信号的比特分配方法和装置 |
EP4241464A2 (en) * | 2020-11-03 | 2023-09-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for audio signal transformation |
CN114582356B (zh) * | 2020-11-30 | 2025-06-06 | 华为技术有限公司 | 一种音频编解码方法和装置 |
WO2024024468A1 (ja) * | 2022-07-25 | 2024-02-01 | ソニーグループ株式会社 | 情報処理装置および方法、符号化装置、音声再生装置、並びにプログラム |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6678647B1 (en) * | 2000-06-02 | 2004-01-13 | Agere Systems Inc. | Perceptual coding of audio signals using cascaded filterbanks for performing irrelevancy reduction and redundancy reduction with different spectral/temporal resolution |
WO2006052188A1 (en) * | 2004-11-12 | 2006-05-18 | Catt (Computer Aided Theatre Technique) | Surround sound processing arrangement and method |
US20070269063A1 (en) * | 2006-05-17 | 2007-11-22 | Creative Technology Ltd | Spatial audio coding based on universal spatial cues |
CN101647059A (zh) * | 2007-02-26 | 2010-02-10 | 杜比实验室特许公司 | 娱乐音频中的语音增强 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU5884801A (en) | 2000-05-29 | 2001-12-11 | Ginganet Corp | Communication device |
US6934676B2 (en) * | 2001-05-11 | 2005-08-23 | Nokia Mobile Phones Ltd. | Method and system for inter-channel signal redundancy removal in perceptual audio coding |
TWI498882B (zh) * | 2004-08-25 | 2015-09-01 | Dolby Lab Licensing Corp | 音訊解碼器 |
KR101237413B1 (ko) * | 2005-12-07 | 2013-02-26 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법, 오디오 신호의부호화 및 복호화 장치 |
US8612220B2 (en) * | 2007-07-03 | 2013-12-17 | France Telecom | Quantization after linear transformation combining the audio signals of a sound scene, and related coder |
US8219409B2 (en) | 2008-03-31 | 2012-07-10 | Ecole Polytechnique Federale De Lausanne | Audio wave field encoding |
EP2205007B1 (en) | 2008-12-30 | 2019-01-09 | Dolby International AB | Method and apparatus for three-dimensional acoustic field encoding and optimal reconstruction |
EP2450880A1 (en) * | 2010-11-05 | 2012-05-09 | Thomson Licensing | Data structure for Higher Order Ambisonics audio data |
EP2469741A1 (en) * | 2010-12-21 | 2012-06-27 | Thomson Licensing | Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field |
-
2010
- 2010-12-21 EP EP10306472A patent/EP2469741A1/en not_active Withdrawn
-
2011
- 2011-12-12 EP EP21214984.3A patent/EP4007188B1/en active Active
- 2011-12-12 EP EP18201744.2A patent/EP3468074B1/en active Active
- 2011-12-12 EP EP11192998.0A patent/EP2469742B1/en active Active
- 2011-12-12 EP EP24157076.1A patent/EP4343759A3/en active Pending
- 2011-12-20 KR KR1020110138434A patent/KR101909573B1/ko active Active
- 2011-12-20 JP JP2011278172A patent/JP6022157B2/ja active Active
- 2011-12-21 CN CN201110431798.1A patent/CN102547549B/zh active Active
- 2011-12-21 US US13/333,461 patent/US9397771B2/en active Active
-
2016
- 2016-10-05 JP JP2016196854A patent/JP6335241B2/ja active Active
-
2018
- 2018-04-27 JP JP2018086260A patent/JP6732836B2/ja active Active
- 2018-10-12 KR KR1020180121677A patent/KR102010914B1/ko active Active
-
2019
- 2019-08-08 KR KR1020190096615A patent/KR102131748B1/ko active Active
-
2020
- 2020-02-27 JP JP2020031454A patent/JP6982113B2/ja active Active
-
2021
- 2021-11-18 JP JP2021187879A patent/JP7342091B2/ja active Active
-
2023
- 2023-08-30 JP JP2023139565A patent/JP2023158038A/ja active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6678647B1 (en) * | 2000-06-02 | 2004-01-13 | Agere Systems Inc. | Perceptual coding of audio signals using cascaded filterbanks for performing irrelevancy reduction and redundancy reduction with different spectral/temporal resolution |
WO2006052188A1 (en) * | 2004-11-12 | 2006-05-18 | Catt (Computer Aided Theatre Technique) | Surround sound processing arrangement and method |
US20070269063A1 (en) * | 2006-05-17 | 2007-11-22 | Creative Technology Ltd | Spatial audio coding based on universal spatial cues |
CN101647059A (zh) * | 2007-02-26 | 2010-02-10 | 杜比实验室特许公司 | 娱乐音频中的语音增强 |
Non-Patent Citations (1)
Title |
---|
ARNAUD LABORIE,ET AL: "A New Comprehensive Approach of Surround Sound Recording", 《AUDIO ENGINEERING SOCIETY,CONVENTION PAPER 5717,114TH CONVENTION,AMSTERDAM,THE NETHERLANDS》, 25 March 2003 (2003-03-25), pages 1 - 20 * |
Cited By (174)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US12245012B2 (en) | 2012-05-14 | 2025-03-04 | Dolby Laboratories Licensing Corporation | Method and apparatus for compressing and decompressing a higher order ambisonics signal representation |
US11234091B2 (en) | 2012-05-14 | 2022-01-25 | Dolby Laboratories Licensing Corporation | Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation |
CN107180637A (zh) * | 2012-05-14 | 2017-09-19 | 杜比国际公司 | 压缩和解压缩高阶高保真度立体声响复制信号表示的方法及装置 |
US11792591B2 (en) | 2012-05-14 | 2023-10-17 | Dolby Laboratories Licensing Corporation | Method and apparatus for compressing and decompressing a higher order Ambisonics signal representation |
CN104471960A (zh) * | 2012-07-15 | 2015-03-25 | 高通股份有限公司 | 用于向后兼容音频译码的系统、方法、设备和计算机可读媒体 |
US9788133B2 (en) | 2012-07-15 | 2017-10-10 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for backward-compatible audio coding |
CN104428834B (zh) * | 2012-07-15 | 2017-09-08 | 高通股份有限公司 | 用于使用基函数系数的三维音频译码的系统、方法、设备和计算机可读媒体 |
CN104428834A (zh) * | 2012-07-15 | 2015-03-18 | 高通股份有限公司 | 用于使用基函数系数的三维音频译码的系统、方法、设备和计算机可读媒体 |
CN104471960B (zh) * | 2012-07-15 | 2017-03-08 | 高通股份有限公司 | 用于向后兼容音频译码的系统、方法、设备和计算机可读媒体 |
CN107403626A (zh) * | 2012-07-16 | 2017-11-28 | 杜比国际公司 | 用于对hoa音频信号进行解码的方法、设备和计算机可读介质 |
CN107424618A (zh) * | 2012-07-16 | 2017-12-01 | 杜比国际公司 | 用于对hoa音频信号进行解码的方法、设备和计算机可读介质 |
CN107591159B (zh) * | 2012-07-16 | 2020-12-01 | 杜比国际公司 | 用于对hoa音频信号进行解码的方法、设备和计算机可读介质 |
CN107591160A (zh) * | 2012-07-16 | 2018-01-16 | 杜比国际公司 | 用于对hoa音频信号进行解码的方法、设备和计算机可读介质 |
CN107591159A (zh) * | 2012-07-16 | 2018-01-16 | 杜比国际公司 | 用于对hoa音频信号进行解码的方法、设备和计算机可读介质 |
CN107403625A (zh) * | 2012-07-16 | 2017-11-28 | 杜比国际公司 | 用于对hoa音频信号进行解码的方法、设备和计算机可读介质 |
CN107403625B (zh) * | 2012-07-16 | 2021-06-04 | 杜比国际公司 | 用于对hoa音频信号进行解码的方法、设备和计算机可读介质 |
US9473870B2 (en) | 2012-07-16 | 2016-10-18 | Qualcomm Incorporated | Loudspeaker position compensation with 3D-audio hierarchical coding |
CN107424618B (zh) * | 2012-07-16 | 2021-01-08 | 杜比国际公司 | 用于对hoa音频信号进行解码的方法、设备和计算机可读介质 |
CN107403626B (zh) * | 2012-07-16 | 2021-01-08 | 杜比国际公司 | 用于对hoa音频信号进行解码的方法、设备和计算机可读介质 |
CN109448742B (zh) * | 2012-12-12 | 2023-09-01 | 杜比国际公司 | 对声场的高阶立体混响表示进行压缩和解压缩的方法和设备 |
CN109448742A (zh) * | 2012-12-12 | 2019-03-08 | 杜比国际公司 | 对声场的高阶立体混响表示进行压缩和解压缩的方法和设备 |
CN109410965B (zh) * | 2012-12-12 | 2023-10-31 | 杜比国际公司 | 对声场的高阶立体混响表示进行压缩和解压缩的方法和设备 |
CN109410965A (zh) * | 2012-12-12 | 2019-03-01 | 杜比国际公司 | 对声场的高阶立体混响表示进行压缩和解压缩的方法和设备 |
CN108174341A (zh) * | 2013-01-16 | 2018-06-15 | 杜比国际公司 | 测量高阶高保真度立体声响复制响度级的方法及设备 |
CN108174341B (zh) * | 2013-01-16 | 2021-01-08 | 杜比国际公司 | 测量高阶高保真度立体声响复制响度级的方法及设备 |
CN105027200B (zh) * | 2013-03-01 | 2019-04-09 | 高通股份有限公司 | 变换球谐系数 |
CN105027200A (zh) * | 2013-03-01 | 2015-11-04 | 高通股份有限公司 | 变换球谐系数 |
CN107146627A (zh) * | 2013-04-29 | 2017-09-08 | 杜比国际公司 | 对更高阶高保真度立体声响复制表示进行压缩和解压缩的方法和装置 |
CN107293304A (zh) * | 2013-04-29 | 2017-10-24 | 杜比国际公司 | 对更高阶高保真度立体声响复制表示进行压缩和解压缩的方法和装置 |
CN105144752A (zh) * | 2013-04-29 | 2015-12-09 | 汤姆逊许可公司 | 对更高阶高保真度立体声响复制表示进行压缩和解压缩的方法和装置 |
CN107146627B (zh) * | 2013-04-29 | 2020-10-30 | 杜比国际公司 | 对更高阶高保真度立体声响复制表示进行压缩和解压缩的方法和装置 |
CN107293304B (zh) * | 2013-04-29 | 2021-01-05 | 杜比国际公司 | 对更高阶高保真度立体声响复制表示进行压缩和解压缩的方法和装置 |
CN105247612A (zh) * | 2013-05-28 | 2016-01-13 | 高通股份有限公司 | 相对于球面谐波系数执行空间掩蔽 |
CN105247612B (zh) * | 2013-05-28 | 2018-12-18 | 高通股份有限公司 | 相对于球面谐波系数执行空间掩蔽 |
US9883312B2 (en) | 2013-05-29 | 2018-01-30 | Qualcomm Incorporated | Transformed higher order ambisonics audio data |
US10499176B2 (en) | 2013-05-29 | 2019-12-03 | Qualcomm Incorporated | Identifying codebooks to use when coding spatial components of a sound field |
US11962990B2 (en) | 2013-05-29 | 2024-04-16 | Qualcomm Incorporated | Reordering of foreground audio objects in the ambisonics domain |
US11146903B2 (en) | 2013-05-29 | 2021-10-12 | Qualcomm Incorporated | Compression of decomposed representations of a sound field |
CN105325015B (zh) * | 2013-05-29 | 2018-04-20 | 高通股份有限公司 | 经旋转高阶立体混响的双耳化 |
CN105325015A (zh) * | 2013-05-29 | 2016-02-10 | 高通股份有限公司 | 经旋转高阶立体混响的双耳化 |
US9980074B2 (en) | 2013-05-29 | 2018-05-22 | Qualcomm Incorporated | Quantization step sizes for compression of spatial components of a sound field |
CN110459230B (zh) * | 2013-07-11 | 2023-10-20 | 杜比国际公司 | 产生hoa信号的混合的空间/系数域表示的方法和设备 |
CN110459231A (zh) * | 2013-07-11 | 2019-11-15 | 杜比国际公司 | 产生hoa信号的混合的空间/系数域表示的方法和设备 |
CN110648675A (zh) * | 2013-07-11 | 2020-01-03 | 杜比国际公司 | 产生hoa信号的混合的空间/系数域表示的方法和设备 |
CN105378833A (zh) * | 2013-07-11 | 2016-03-02 | 汤姆逊许可公司 | 用于从hoa信号的系数域表示产生所述hoa信号的混合的空间/系数域表示的方法和设备 |
CN110491397A (zh) * | 2013-07-11 | 2019-11-22 | 杜比国际公司 | 产生hoa信号的混合的空间/系数域表示的方法和设备 |
CN110459230A (zh) * | 2013-07-11 | 2019-11-15 | 杜比国际公司 | 产生hoa信号的混合的空间/系数域表示的方法和设备 |
CN105378833B (zh) * | 2013-07-11 | 2019-10-22 | 杜比国际公司 | 产生hoa信号的混合的空间/系数域表示的方法和设备 |
CN110648675B (zh) * | 2013-07-11 | 2023-06-23 | 杜比国际公司 | 产生hoa信号的混合的空间/系数域表示的方法和设备 |
CN110491397B (zh) * | 2013-07-11 | 2023-10-27 | 杜比国际公司 | 产生hoa信号的混合的空间/系数域表示的方法和设备 |
CN110459231B (zh) * | 2013-07-11 | 2023-07-14 | 杜比国际公司 | 产生hoa信号的混合的空间/系数域表示的方法和设备 |
CN108337624B (zh) * | 2013-10-23 | 2021-08-24 | 杜比国际公司 | 用于音频信号呈现的方法和装置 |
US11750996B2 (en) | 2013-10-23 | 2023-09-05 | Dolby Laboratories Licensing Corporation | Method for and apparatus for decoding/rendering an Ambisonics audio soundfield representation for audio playback using 2D setups |
CN108632736B (zh) * | 2013-10-23 | 2021-06-01 | 杜比国际公司 | 用于音频信号呈现的方法和装置 |
US10986455B2 (en) | 2013-10-23 | 2021-04-20 | Dolby Laboratories Licensing Corporation | Method for and apparatus for decoding/rendering an ambisonics audio soundfield representation for audio playback using 2D setups |
US10694308B2 (en) | 2013-10-23 | 2020-06-23 | Dolby Laboratories Licensing Corporation | Method for and apparatus for decoding/rendering an ambisonics audio soundfield representation for audio playback using 2D setups |
US11770667B2 (en) | 2013-10-23 | 2023-09-26 | Dolby Laboratories Licensing Corporation | Method for and apparatus for decoding/rendering an ambisonics audio soundfield representation for audio playback using 2D setups |
CN108632737A (zh) * | 2013-10-23 | 2018-10-09 | 杜比国际公司 | 用于音频信号解码和呈现的方法和装置 |
CN108337624A (zh) * | 2013-10-23 | 2018-07-27 | 杜比国际公司 | 用于音频信号呈现的方法和装置 |
CN108632736A (zh) * | 2013-10-23 | 2018-10-09 | 杜比国际公司 | 用于音频信号呈现的方法和装置 |
US12245014B2 (en) | 2013-10-23 | 2025-03-04 | Dolby Laboratories Licensing Corporation | Method for and apparatus for decoding/rendering an Ambisonics audio soundfield representation for audio playback using 2D setups |
CN108632737B (zh) * | 2013-10-23 | 2020-11-06 | 杜比国际公司 | 用于音频信号解码和呈现的方法和装置 |
US11451918B2 (en) | 2013-10-23 | 2022-09-20 | Dolby Laboratories Licensing Corporation | Method for and apparatus for decoding/rendering an Ambisonics audio soundfield representation for audio playback using 2D setups |
CN107995582A (zh) * | 2013-11-28 | 2018-05-04 | 杜比国际公司 | 使用奇异值分解进行hoa编码和解码的方法和装置 |
CN111182443A (zh) * | 2014-01-08 | 2020-05-19 | 杜比国际公司 | 包括编码hoa表示的位流的解码方法和装置、以及介质 |
US12277948B2 (en) | 2014-01-08 | 2025-04-15 | Dolby Laboratories Licensing Corporation | Method and apparatus for decoding a bitstream including encoded Higher Order Ambisonics representations |
CN111182443B (zh) * | 2014-01-08 | 2021-10-22 | 杜比国际公司 | 包括编码hoa表示的位流的解码方法和装置 |
CN111028849B (zh) * | 2014-01-08 | 2024-03-01 | 杜比国际公司 | 包括编码hoa表示的位流的解码方法和装置、以及介质 |
CN111179951B (zh) * | 2014-01-08 | 2024-03-01 | 杜比国际公司 | 包括编码hoa表示的位流的解码方法和装置、以及介质 |
CN111179951A (zh) * | 2014-01-08 | 2020-05-19 | 杜比国际公司 | 包括编码hoa表示的位流的解码方法和装置、以及介质 |
CN111028849A (zh) * | 2014-01-08 | 2020-04-17 | 杜比国际公司 | 包括编码hoa表示的位流的解码方法和装置、以及介质 |
CN105940447A (zh) * | 2014-01-30 | 2016-09-14 | 高通股份有限公司 | 环境高阶立体混响系数的转变 |
US9922656B2 (en) | 2014-01-30 | 2018-03-20 | Qualcomm Incorporated | Transitioning of ambient higher-order ambisonic coefficients |
CN110827840B (zh) * | 2014-01-30 | 2023-09-12 | 高通股份有限公司 | 译码环境高阶立体混响系数的独立帧 |
CN110827840A (zh) * | 2014-01-30 | 2020-02-21 | 高通股份有限公司 | 译码环境高阶立体混响系数的独立帧 |
CN105940447B (zh) * | 2014-01-30 | 2020-03-31 | 高通股份有限公司 | 用于译码音频数据的方法、装置及计算机可读存储媒体 |
US10779104B2 (en) | 2014-03-21 | 2020-09-15 | Dolby Laboratories Licensing Corporation | Methods, apparatus and systems for decompressing a higher order ambisonics (HOA) signal |
US11395084B2 (en) | 2014-03-21 | 2022-07-19 | Dolby Laboratories Licensing Corporation | Methods, apparatus and systems for decompressing a higher order ambisonics (HOA) signal |
CN111179950A (zh) * | 2014-03-21 | 2020-05-19 | 杜比国际公司 | 对压缩的高阶高保真立体声(hoa)表示进行解码的方法和装置以及介质 |
US10629212B2 (en) | 2014-03-21 | 2020-04-21 | Dolby Laboratories Licensing Corporation | Methods and apparatus for decompressing a compressed HOA signal |
CN111179948A (zh) * | 2014-03-21 | 2020-05-19 | 杜比国际公司 | 对压缩的高阶高保真立体声(hoa)表示进行解码的方法和装置以及介质 |
CN106104681B (zh) * | 2014-03-21 | 2020-02-11 | 杜比国际公司 | 对压缩的高阶高保真立体声(hoa)表示进行解码的方法及装置 |
CN111182442A (zh) * | 2014-03-21 | 2020-05-19 | 杜比国际公司 | 对压缩的高阶高保真立体声(hoa)表示进行解码的方法和装置以及介质 |
US10679634B2 (en) | 2014-03-21 | 2020-06-09 | Dolby Laboratories Licensing Corporation | Methods and apparatus for decoding a compressed HOA signal |
US10542364B2 (en) | 2014-03-21 | 2020-01-21 | Dolby Laboratories Licensing Corporation | Methods, apparatus and systems for decompressing a higher order ambisonics (HOA) signal |
CN106104681A (zh) * | 2014-03-21 | 2016-11-09 | 杜比国际公司 | 用于压缩高阶高保真立体声(hoa)信号的方法、用于解压缩压缩的hoa信号的方法、用于压缩hoa信号的装置以及用于解压缩压缩的hoa信号的装置 |
CN106233755A (zh) * | 2014-03-21 | 2016-12-14 | 杜比国际公司 | 用于对高阶Ambisonics(HOA)信号进行压缩的方法、用于对经压缩的HOA信号进行解压的方法、用于对HOA信号进行压缩的装置、以及用于对经压缩的HOA信号进行解压的装置 |
US12236962B2 (en) | 2014-03-21 | 2025-02-25 | Dolby Laboratories Licensing Corporation | Methods and apparatus for decoding a compressed HOA signal |
US10388292B2 (en) | 2014-03-21 | 2019-08-20 | Dolby Laboratories Licensing Corporation | Methods and apparatus for decompressing a compressed HOA signal |
CN111179948B (zh) * | 2014-03-21 | 2024-09-27 | 杜比国际公司 | 对压缩的高阶高保真立体声(hoa)表示进行解码的方法和装置以及介质 |
US12069465B2 (en) | 2014-03-21 | 2024-08-20 | Dolby Laboratories Licensing Corporation | Methods, apparatus and systems for decompressing a Higher Order Ambisonics (HOA) signal |
US11830504B2 (en) | 2014-03-21 | 2023-11-28 | Dolby Laboratories Licensing Corporation | Methods and apparatus for decoding a compressed HOA signal |
CN109410963B (zh) * | 2014-03-21 | 2023-10-20 | 杜比国际公司 | 用于对压缩的hoa信号进行解码的方法、装置和存储介质 |
US9818413B2 (en) | 2014-03-21 | 2017-11-14 | Dolby Laboratories Licensing Corporation | Method for compressing a higher order ambisonics signal, method for decompressing (HOA) a compressed HOA signal, apparatus for compressing a HOA signal, and apparatus for decompressing a compressed HOA signal |
CN109410960B (zh) * | 2014-03-21 | 2023-08-29 | 杜比国际公司 | 用于对压缩的hoa信号进行解码的方法、装置和存储介质 |
CN109410961B (zh) * | 2014-03-21 | 2023-08-25 | 杜比国际公司 | 用于对压缩的hoa信号进行解码的方法、装置和存储介质 |
US10334382B2 (en) | 2014-03-21 | 2019-06-25 | Dolby Laboratories Licensing Corporation | Methods, apparatus and systems for decompressing a higher order ambisonics (HOA) signal |
US11722830B2 (en) | 2014-03-21 | 2023-08-08 | Dolby Laboratories Licensing Corporation | Methods, apparatus and systems for decompressing a Higher Order Ambisonics (HOA) signal |
CN109410962A (zh) * | 2014-03-21 | 2019-03-01 | 杜比国际公司 | 用于对压缩的hoa信号进行解码的方法、装置和存储介质 |
US9930464B2 (en) | 2014-03-21 | 2018-03-27 | Dolby Laboratories Licensing Corporation | Method for compressing a higher order ambisonics (HOA) signal, method for decompressing a compressed HOA signal, apparatus for compressing a HOA signal, and apparatus for decompressing a compressed HOA signal |
CN109410962B (zh) * | 2014-03-21 | 2023-06-06 | 杜比国际公司 | 用于对压缩的hoa信号进行解码的方法、装置和存储介质 |
CN109410961A (zh) * | 2014-03-21 | 2019-03-01 | 杜比国际公司 | 用于对压缩的hoa信号进行解码的方法、装置和存储介质 |
CN109410960A (zh) * | 2014-03-21 | 2019-03-01 | 杜比国际公司 | 用于对压缩的hoa信号进行解码的方法、装置和存储介质 |
US11462222B2 (en) | 2014-03-21 | 2022-10-04 | Dolby Laboratories Licensing Corporation | Methods and apparatus for decoding a compressed HOA signal |
CN111145766A (zh) * | 2014-03-21 | 2020-05-12 | 杜比国际公司 | 对压缩的高阶高保真立体声(hoa)表示进行解码的方法和装置以及介质 |
CN109410963A (zh) * | 2014-03-21 | 2019-03-01 | 杜比国际公司 | 用于对压缩的hoa信号进行解码的方法、装置和存储介质 |
CN111145766B (zh) * | 2014-03-21 | 2022-06-24 | 杜比国际公司 | 对压缩的高阶高保真立体声(hoa)表示进行解码的方法和装置以及介质 |
US10192559B2 (en) | 2014-03-21 | 2019-01-29 | Dolby Laboratories Licensing Corporation | Methods and apparatus for decompressing a compressed HOA signal |
CN111182442B (zh) * | 2014-03-21 | 2021-08-27 | 杜比国际公司 | 对压缩的高阶高保真立体声(hoa)表示进行解码的方法和装置以及介质 |
CN111179949B (zh) * | 2014-03-21 | 2022-03-25 | 杜比国际公司 | 对压缩的高阶高保真立体声(hoa)表示进行解码的方法和装置以及介质 |
CN111179950B (zh) * | 2014-03-21 | 2022-02-15 | 杜比国际公司 | 对压缩的高阶高保真立体声(hoa)表示进行解码的方法和装置以及介质 |
US10089992B2 (en) | 2014-03-21 | 2018-10-02 | Dolby Laboratories Licensing Corporation | Methods and apparatus for decompressing a compressed HOA signal |
US10127914B2 (en) | 2014-03-21 | 2018-11-13 | Dolby Laboratories Licensing Corporation | Method for compressing a higher order ambisonics (HOA) signal, method for decompressing a compressed HOA signal, apparatus for compressing a HOA signal, and apparatus for decompressing a compressed HOA signal |
CN106463121B (zh) * | 2014-05-16 | 2019-07-05 | 高通股份有限公司 | 较高阶立体混响信号压缩 |
US10770087B2 (en) | 2014-05-16 | 2020-09-08 | Qualcomm Incorporated | Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals |
CN106471577B (zh) * | 2014-05-16 | 2018-03-06 | 高通股份有限公司 | 在高阶立体混响系数中的标量与向量之间进行确定 |
CN106471577A (zh) * | 2014-05-16 | 2017-03-01 | 高通股份有限公司 | 在高阶立体混响系数中的标量与向量之间进行确定 |
CN106463121A (zh) * | 2014-05-16 | 2017-02-22 | 高通股份有限公司 | 较高阶立体混响信号压缩 |
CN113808599A (zh) * | 2014-06-27 | 2021-12-17 | 杜比国际公司 | 针对hoa数据帧表示的压缩确定表示非差分增益值所需的最小整数比特数的方法 |
CN107077852B (zh) * | 2014-06-27 | 2020-12-04 | 杜比国际公司 | 包括与hoa数据帧表示的特定数据帧的通道信号关联的非差分增益值的编码hoa数据帧表示 |
CN110556120A (zh) * | 2014-06-27 | 2019-12-10 | 杜比国际公司 | 用于解码声音或声场的高阶高保真度立体声响复制(hoa)表示的方法 |
CN110459229A (zh) * | 2014-06-27 | 2019-11-15 | 杜比国际公司 | 用于解码声音或声场的高阶高保真度立体声响复制(hoa)表示的方法 |
TWI860790B (zh) * | 2014-06-27 | 2024-11-01 | 瑞典商杜比國際公司 | 用於解碼聲音或聲場的高階保真立體音響(hoa)表示的方法 |
CN106663434B (zh) * | 2014-06-27 | 2021-09-28 | 杜比国际公司 | 针对hoa数据帧表示的压缩确定表示非差分增益值所需的最小整数比特数的方法 |
CN112951254A (zh) * | 2014-06-27 | 2021-06-11 | 杜比国际公司 | 针对hoa数据帧表示的压缩确定表示非差分增益值所需的最小整数比特数的方法和设备 |
CN112908348B (zh) * | 2014-06-27 | 2022-07-15 | 杜比国际公司 | 针对hoa数据帧表示的压缩确定表示非差分增益值所需的最小整数比特数的方法和设备 |
CN112908349A (zh) * | 2014-06-27 | 2021-06-04 | 杜比国际公司 | 针对hoa数据帧表示的压缩确定表示非差分增益值所需的最小整数比特数的方法和设备 |
CN113808600A (zh) * | 2014-06-27 | 2021-12-17 | 杜比国际公司 | 针对hoa数据帧表示的压缩确定表示非差分增益值所需的最小整数比特数的方法 |
CN112908348A (zh) * | 2014-06-27 | 2021-06-04 | 杜比国际公司 | 针对hoa数据帧表示的压缩确定表示非差分增益值所需的最小整数比特数的方法和设备 |
TWI811864B (zh) * | 2014-06-27 | 2023-08-11 | 瑞典商杜比國際公司 | 用於解碼聲音或聲場的高階保真立體音響(hoa)表示的方法 |
CN113808598A (zh) * | 2014-06-27 | 2021-12-17 | 杜比国际公司 | 针对hoa数据帧表示的压缩确定表示非差分增益值所需的最小整数比特数的方法 |
CN113793617A (zh) * | 2014-06-27 | 2021-12-14 | 杜比国际公司 | 针对hoa数据帧表示的压缩确定表示非差分增益值所需的最小整数比特数的方法 |
CN110459229B (zh) * | 2014-06-27 | 2023-01-10 | 杜比国际公司 | 用于解码声音或声场的高阶高保真度立体声响复制(hoa)表示的方法 |
CN110556120B (zh) * | 2014-06-27 | 2023-02-28 | 杜比国际公司 | 用于解码声音或声场的高阶高保真度立体声响复制(hoa)表示的方法 |
CN106663434A (zh) * | 2014-06-27 | 2017-05-10 | 杜比国际公司 | 针对hoa数据帧表示的压缩确定表示非差分增益值所需的最小整数比特数的方法 |
CN112216291A (zh) * | 2014-06-27 | 2021-01-12 | 杜比国际公司 | 声音或声场的压缩hoa声音表示的解码方法和装置 |
CN107077852A (zh) * | 2014-06-27 | 2017-08-18 | 杜比国际公司 | 包括与hoa数据帧表示的特定数据帧的通道信号关联的非差分增益值的编码hoa数据帧表示 |
CN112216292A (zh) * | 2014-06-27 | 2021-01-12 | 杜比国际公司 | 声音或声场的压缩hoa声音表示的解码方法和装置 |
CN113793618A (zh) * | 2014-06-27 | 2021-12-14 | 杜比国际公司 | 针对hoa数据帧表示的压缩确定表示非差分增益值所需的最小整数比特数的方法 |
CN106463132A (zh) * | 2014-07-02 | 2017-02-22 | 杜比国际公司 | 对压缩的hoa表示解码的方法和装置以及对压缩的hoa表示编码的方法和装置 |
CN106663432A (zh) * | 2014-07-02 | 2017-05-10 | 杜比国际公司 | 对压缩的hoa表示解码的方法和装置以及对压缩的hoa表示编码的方法和装置 |
CN106471579A (zh) * | 2014-07-02 | 2017-03-01 | 杜比国际公司 | 用于对hoa信号表示的子带内的主导方向信号的方向进行编码/解码的方法和装置 |
CN106663433B (zh) * | 2014-07-02 | 2020-12-29 | 高通股份有限公司 | 用于处理音频数据的方法和装置 |
CN106471579B (zh) * | 2014-07-02 | 2020-12-18 | 杜比国际公司 | 用于对hoa信号表示的子带内的主导方向信号的方向进行编码/解码的方法和装置 |
CN106463131A (zh) * | 2014-07-02 | 2017-02-22 | 杜比国际公司 | 用于对hoa信号表示的子带内的主导方向信号的方向进行编码/解码的方法和装置 |
CN106463131B (zh) * | 2014-07-02 | 2020-12-08 | 杜比国际公司 | 用于对hoa信号表示的子带内的主导方向信号的方向进行编码/解码的方法和装置 |
CN106663433A (zh) * | 2014-07-02 | 2017-05-10 | 高通股份有限公司 | 减少高阶立体混响(hoa)背景信道之间的相关性 |
CN106575506A (zh) * | 2014-08-29 | 2017-04-19 | 高通股份有限公司 | 高阶立体混响音频数据的中间压缩 |
CN106796795A (zh) * | 2014-10-10 | 2017-05-31 | 高通股份有限公司 | 以信号表示用于高阶立体混响音频数据的可缩放译码的层 |
US11664035B2 (en) | 2014-10-10 | 2023-05-30 | Qualcomm Incorporated | Spatial transformation of ambisonic audio data |
US11138983B2 (en) | 2014-10-10 | 2021-10-05 | Qualcomm Incorporated | Signaling layers for scalable coding of higher order ambisonic audio data |
US11955130B2 (en) | 2015-10-08 | 2024-04-09 | Dolby International Ab | Layered coding and data structure for compressed higher-order Ambisonics sound or sound field representations |
CN108140390A (zh) * | 2015-10-08 | 2018-06-08 | 杜比国际公司 | 用于压缩高阶高保真度立体声响复制声音或声场表示的分层编码和数据结构 |
US12020714B2 (en) | 2015-10-08 | 2024-06-25 | Dolby International Ab | Layered coding for compressed sound or sound field represententations |
CN108780647B (zh) * | 2016-01-05 | 2020-12-15 | 高通股份有限公司 | 用于音频信号译码的方法和设备 |
CN108780647A (zh) * | 2016-01-05 | 2018-11-09 | 高通股份有限公司 | 音频的混合域译码 |
CN109791768B (zh) * | 2016-09-30 | 2023-11-07 | 冠状编码股份有限公司 | 用于对三维音频信号进行转换、立体声编码、解码和转码的过程 |
CN109791768A (zh) * | 2016-09-30 | 2019-05-21 | 冠状编码股份有限公司 | 用于对三维音频信号进行转换、立体声编码、解码和转码的过程 |
CN109964272B (zh) * | 2017-01-27 | 2023-12-12 | 谷歌有限责任公司 | 声场表示的代码化 |
CN109964272A (zh) * | 2017-01-27 | 2019-07-02 | 谷歌有限责任公司 | 声场表示的代码化 |
US11856389B2 (en) | 2018-12-07 | 2023-12-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for encoding, decoding, scene processing and other procedures related to DirAC based spatial audio coding using direct component compensation |
CN113454715A (zh) * | 2018-12-07 | 2021-09-28 | 弗劳恩霍夫应用研究促进协会 | 用于使用低阶、中阶和高阶分量生成器进行与基于DirAC的空间音频编码有关的编码、解码、场景处理和其他过程的装置、方法和计算机程序 |
US12369008B2 (en) | 2018-12-07 | 2025-07-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for encoding, decoding, scene processing and other procedures related to DirAC based spatial audio coding using low-order, mid-order and high-order components generators |
CN113454715B (zh) * | 2018-12-07 | 2024-03-08 | 弗劳恩霍夫应用研究促进协会 | 使用一个或多个分量生成器产生声场描述的装置、方法 |
US11937075B2 (en) | 2018-12-07 | 2024-03-19 | Fraunhofer-Gesellschaft Zur Förderung Der Angewand Forschung E.V | Apparatus, method and computer program for encoding, decoding, scene processing and other procedures related to DirAC based spatial audio coding using low-order, mid-order and high-order components generators |
US11838743B2 (en) | 2018-12-07 | 2023-12-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for encoding, decoding, scene processing and other procedures related to DirAC based spatial audio coding using diffuse compensation |
CN113574596A (zh) * | 2019-02-19 | 2021-10-29 | 公立大学法人秋田县立大学 | 音频信号编码方法、音频信号解码方法、程序、编码装置、音频系统及解码装置 |
CN115335900A (zh) * | 2020-03-24 | 2022-11-11 | 高通股份有限公司 | 使用自适应网络来对全景声系数进行变换 |
CN116324980A (zh) * | 2020-09-25 | 2023-06-23 | 苹果公司 | 声道、对象和hoa音频内容的无缝可扩展解码 |
WO2022242480A1 (zh) * | 2021-05-17 | 2022-11-24 | 华为技术有限公司 | 三维音频信号编码方法、装置和编码器 |
CN115376527A (zh) * | 2021-05-17 | 2022-11-22 | 华为技术有限公司 | 三维音频信号编码方法、装置和编码器 |
CN113903353A (zh) * | 2021-09-27 | 2022-01-07 | 随锐科技集团股份有限公司 | 一种基于空间区分性检测的定向噪声消除方法及装置 |
CN113903353B (zh) * | 2021-09-27 | 2024-08-27 | 随锐科技集团股份有限公司 | 一种基于空间区分性检测的定向噪声消除方法及装置 |
WO2024244441A1 (zh) * | 2023-05-27 | 2024-12-05 | 华为技术有限公司 | 场景音频解码方法及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
EP2469742A3 (en) | 2012-09-05 |
EP3468074A1 (en) | 2019-04-10 |
JP6982113B2 (ja) | 2021-12-17 |
US9397771B2 (en) | 2016-07-19 |
JP2020079961A (ja) | 2020-05-28 |
KR102131748B1 (ko) | 2020-07-08 |
KR20180115652A (ko) | 2018-10-23 |
JP2018116310A (ja) | 2018-07-26 |
EP2469742A2 (en) | 2012-06-27 |
EP4007188B1 (en) | 2024-02-14 |
EP2469741A1 (en) | 2012-06-27 |
EP4007188A1 (en) | 2022-06-01 |
CN102547549B (zh) | 2016-06-22 |
JP2012133366A (ja) | 2012-07-12 |
KR20190096318A (ko) | 2019-08-19 |
KR102010914B1 (ko) | 2019-08-14 |
JP2016224472A (ja) | 2016-12-28 |
JP2023158038A (ja) | 2023-10-26 |
KR101909573B1 (ko) | 2018-10-19 |
EP4343759A2 (en) | 2024-03-27 |
US20120155653A1 (en) | 2012-06-21 |
JP7342091B2 (ja) | 2023-09-11 |
JP6335241B2 (ja) | 2018-05-30 |
JP2022016544A (ja) | 2022-01-21 |
EP2469742B1 (en) | 2018-12-05 |
EP3468074B1 (en) | 2021-12-22 |
KR20120070521A (ko) | 2012-06-29 |
JP6022157B2 (ja) | 2016-11-09 |
EP4343759A3 (en) | 2024-06-12 |
JP6732836B2 (ja) | 2020-07-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7342091B2 (ja) | 二次元または三次元音場のアンビソニックス表現の一連のフレームをエンコードおよびデコードする方法および装置 | |
RU2759160C2 (ru) | УСТРОЙСТВО, СПОСОБ И КОМПЬЮТЕРНАЯ ПРОГРАММА ДЛЯ КОДИРОВАНИЯ, ДЕКОДИРОВАНИЯ, ОБРАБОТКИ СЦЕНЫ И ДРУГИХ ПРОЦЕДУР, ОТНОСЯЩИХСЯ К ОСНОВАННОМУ НА DirAC ПРОСТРАНСТВЕННОМУ АУДИОКОДИРОВАНИЮ | |
JP6510021B2 (ja) | オーディオ装置及びそのオーディオ提供方法 | |
JP5081838B2 (ja) | オーディオ符号化及び復号 | |
JP6117997B2 (ja) | 符号化表現に基づいて少なくとも4つのオーディオチャネル信号を提供するためのオーディオデコーダ、オーディオエンコーダ、方法、帯域幅拡張を用いた少なくとも4つのオーディオチャネル信号に基づいて符号化表現を提供するための方法およびコンピュータプログラム | |
JP5525527B2 (ja) | 変換された空間オーディオ信号を決定するための装置 | |
JP4838361B2 (ja) | オーディオ信号のデコーディング方法及びその装置 | |
CN101889307B (zh) | 相位-幅度3d立体声编码器和解码器 | |
RU2406166C2 (ru) | Способы и устройства кодирования и декодирования основывающихся на объектах ориентированных аудиосигналов | |
CN105981411A (zh) | 用于高声道计数的多声道音频的基于多元组的矩阵混合 | |
GB2485979A (en) | Spatial audio coding | |
Purnhagen et al. | Immersive audio delivery using joint object coding | |
HK40066015A (zh) | 用於对表徵二维声场或三维声场的立体混响进行编码和解码的方法和装置 | |
HK40066015B (zh) | 用於对表徵二维声场或三维声场的立体混响进行编码和解码的方法和装置 | |
HK40005667A (zh) | 编码解码2或3维声场环绕声表示的连续帧的方法和装置 | |
Väljamäe | A feasibility study regarding implementation of holographic audio rendering techniques over broadcast networks | |
Hirvonen et al. | Object Coding Masking Model Evaluation with Opus Codec for Next Generation Audio Applications |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C41 | Transfer of patent application or patent right or utility model | ||
TR01 | Transfer of patent right |
Effective date of registration: 20160728 Address after: Amsterdam Patentee after: Dolby International AB Address before: I Si Eli Murli Nor, France Patentee before: Thomson Licensing Corp. |