CN102084595A - 用于对规则点网中的矢量进行计数的方法 - Google Patents
用于对规则点网中的矢量进行计数的方法 Download PDFInfo
- Publication number
- CN102084595A CN102084595A CN2009801255857A CN200980125585A CN102084595A CN 102084595 A CN102084595 A CN 102084595A CN 2009801255857 A CN2009801255857 A CN 2009801255857A CN 200980125585 A CN200980125585 A CN 200980125585A CN 102084595 A CN102084595 A CN 102084595A
- Authority
- CN
- China
- Prior art keywords
- vector
- head
- norm
- function
- index
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000013598 vector Substances 0.000 title claims abstract description 128
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000007906 compression Methods 0.000 claims description 7
- 230000006835 compression Effects 0.000 claims description 7
- 238000010790 dilution Methods 0.000 claims description 2
- 239000012895 dilution Substances 0.000 claims description 2
- 230000006870 function Effects 0.000 description 35
- 238000005192 partition Methods 0.000 description 28
- 238000009826 distribution Methods 0.000 description 19
- 239000000243 solution Substances 0.000 description 17
- 238000013139 quantization Methods 0.000 description 16
- 230000008859 change Effects 0.000 description 8
- 238000006073 displacement reaction Methods 0.000 description 6
- 238000013461 design Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000007796 conventional method Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 241000545744 Hirudinea Species 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000000750 progressive effect Effects 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 229910002056 binary alloy Inorganic materials 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000006386 neutralization reaction Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/3082—Vector coding
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Complex Calculations (AREA)
Abstract
Description
技术领域
本发明涉及数字数据处理领域,着眼于诸如数字数据压缩、数字数据搜索、数字数据比较或数字数据解压缩之类的应用。本发明涉及视听数据、更具体为各种类型数字数据的处理。本发明的目的是减少与计算能力和内存需求有关的处理时间以及计算资源需求。
这些应用特别地但不排它地涉及需要超大量数据来对其进行描述的图像的处理。为了减少传输时间和存储所需的大小,通过提取将被单独编码的可视信息来压缩信息。该编码的信息必须在频率和空间方面处于最优形式,以允许最优再现、同时避免任何不利于编码性能的冗余。为此目的,已知使用小波变换技术,其坐标构成随后经受矢量量化(vector quantisation)步骤的矢量网。
矢量量化(VQ)的原理是对形成矢量的样本序列进行编码,而不是对每个样本单独编码。编码是通过用属于通常被称为“码本”(codebook)的目录形式的矢量对要被编码的序列进行近似来完成的。码本的每个矢量都被编以索引。编码期间,将使用最接近要被编码的样本序列的矢量的索引来表示要被编码的样本序列。
已知解决方案需要确定每个矢量、将其记录在内存中,然后对所有矢量进行处理,以对这些矢量进行计数。矢量基(vector base)可能需要数千兆(gigabyte)字节,并且这样大的基所需的计算时间超长。本发明的目的是提出一种避免这些缺陷的计数和索引方法。
背景技术
现有技术中已知国际专利申请WO9933185,其涉及一种编码方法,该方法包括:确定被称为首领(leader)矢量的矢量,该矢量包括与量化矢量相同、但按预定次序排列的分量;然后确定在所述形成的矢量集合中,所述量化矢量的等级或级别,这些矢量具有与首领矢量相同、并按预定方式排列在所述集合中的分量。该方法然后包括一方面根据表示因此确定的所述首领矢量的索引、另一方面根据所述级别来形成编码。
设计用于压缩的代数矢量量化器遇到的主要困难与对规则点网(其构成量化字典)中的矢量进行计数和编索引的问题相关。我们在此呈现在广义高斯分布源的情况下(例如小波系数)我们为解决这些问题而提出的解决方案。
代数矢量量化
迄今为止,对量化的研究已有几十年,完成的工作已经形成了关于速率/失真理论的如今已成为常规的许多成果。特别地,已经证明当需要固定长度编码时,与标量量化(SQ)相比,矢量量化(VQ)具有许多优点。此外,香农(Shannon)的工作已经证明,如果量化矢量的维数n足够大,则VQ的性能接近最优理论性能。
然而,重要的是,应注意到,VQ达到这些最优性能要以高计算复杂度为代价;复杂度随矢量维数呈指数增加。通常,使用根据表示源的统计数据(学习序列)构造的非结构式字典来执行VQ。在这种情况下,由于字典大小导致的复杂度和存储需求是压缩应用所无法承受的。此外,存在这样的字典稳健性(robustness)问题:虽然对于给定的学习序列是优化的,但对于学习序列外面的图像给出很差性能。克服这些问题的一个解决方案是使用n-维结构式VQ,例如代数矢量量化(AVQ)或关于规则点网的矢量量化。当字典的矢量被强迫属于结构式规则网时,AVQ的性能一般比非结构式VQ的性能差。
然而,在大多数应用中,该轻微缺点被以下事实抵消:对于AVQ,不需要生成或存储字典,并且降低了编码复杂度。
可将规则点网的量化看作是均匀标量量化的扩展。如在非结构式VQ的情况中那样,在文档的其余部分,术语AVQ将用于或者表示矢量量化,或者表示矢量量化器。AVQ考虑矢量系数与分割排列的增益之间的空间依赖性。无论源分布为何,AVQ总是比SQ更有效。
Rn表示的规则点网由构成该网的基{y|y=u1a1+u2a2+...+unan}的一组线性无关的矢量ai的所有可能的组合组成,其中系数ui是整数。因而空间的分割是规则的,并仅取决于选择的基矢量。每个基定义不同的规则点网。与通过基于广义Lloyd算法的算法而设计的VQ相比,AVQ提供了相当大地降低计算和存储成本的可能性。这是因为使用规则网矢量作为量化值消除了构造字典的操作:通过选择的网的结构隐式地构造字典。Conway和Sloane发表在IEEE Trans.On Information Theory,vol.28,no2,pp.227-232March 1982上的文章“Fast quantizing and decoding algorithms for quantizers and codes”描述了简单地使用计数操作且仅依赖于矢量的维数n的快速量化算法。1979年,Gersho做出猜想,在渐进情况下(即对于高速率),AVQ的速率/失真性能接近最优。然而,尽管AVQ对于低速率在数学上不是最优的,但这种量化器给予的复杂度的降低使得能够使用大维数的矢量,对于给定速率产生了更好的实验性能。能通过将AVQ与熵编码器组合来得到好的速率/失真性能,这促进了小波领域中关于AVQ的一些工作。已经针对高斯和拉普拉斯源进行了关于VQ的许多理论工作;然而,在衰减参数小于1的广义高斯类型源的情况下,证明了在速率/失真方面,立方网Zn要好于网E8和网Leech。该结果鼓励了我们将AVQ与小波变换相结合的工作。
发明内容
本发明要解决的问题
尽管由于字典的规则几何结构,通过AVQ量化并不是很复杂,然而其实现并不直接。在非渐进模型的情况下,忽略超载噪音(overload noise),因为我们假设使用可变长度编码和无限字典。实际上这提出了一定数量的具体问题,特别是在计算和存储方面的问题。在设计AVQ时可以提出两个基本问题:
a)索引:索引是独立于量化的操作。其包括向每个量化矢量分配索引,一旦被编码,则通过信道发送给解码器。
在压缩链中该操作是基本的。其实际上确定比特率并使得能无歧义地对矢量解码。已知方法在内存方面通常非常廉价,但是具有不容忽视的计算复杂度(递归算法),或仅在特定情况下(特定网或截断(truncation)的类型)起作用。本发明涉及允许关于广义高斯类型分布的索引的更通用方法,导致了内存成本和计算成本之间的良好折衷。第一个专利提出了对此问题的解决方案。
b)计数。索引方法通常基于网的总体(population)的知识。因此我们必须能对依赖于源的分布的n-维面上(或n-维体积内)的网中的矢量进行计数。常规计数方法基于生成级数的使用。在此形式中,已经引入了函数Nu。它们允许在金字塔(pyramid)上,即在拉普拉斯分布的情况下进行计数。
本发明更具体地涉及在广义高斯类型分布上计数的步骤,实现了内存成本和计算成本之间的良好折衷。第二个专利提出了对此问题的解决方案。我们的贡献主要在于计数和索引,以及在图像或视频压缩应用中AVQ的实现。这两种方法以及AVQ的使用对于音频信号(声音、语音、音乐)的压缩也完全有效。
为此,根据其一般承诺,本发明涉及一种用于估计范数lp等于坐标小于或等于k的d维首领矢量的数目的方法,其特征在于,通过函数T(xi)对于在1到d之间变化的i的结果的和确定所述函数T(xi)为所述首领矢量中的至少一些提供坐标xi的p次幂除以精度因子δ的结果,所述除法的结果四舍五入到最接近的整数,所述方法不包括确定首领矢量的步骤。
优选地,对于在d和1之间的n值,对函数的结果进行求和,其中u在最小值umin(r,n)和k之间变化,所述函数提供范数坐标小于或等于k的n维首领矢量的数量,所述函数umin提供满足T(u)大于或等于r/n的最小整数值u。
本发明还涉及估计方法的应用,用于估计数据压缩率以及用于为首领矢量编索引。
附图说明
阅读了参照附图的非限制示例实施方式之后,将更好地理解本发明,附图中:
图2示出了对于p=1、δ=1且B=4来说通常方法和提出的方法的内存需求之间的比较,
附录1和附录2示出用于实现本发明的计数算法的两个示例。
具体实施方式
网矢量的索引是网量化应用中的重要问题。本发明涉及使用网首领矢量以及分拆理论(theory of partitions)语境的对该问题的解决方案。其对广义高斯分布源起作用并允许使用乘积码。还使得能为高维矢量编索引。
如果矢量维数任意高,矢量量化(VQ)可使得获得最优理论性能是可能的。遗憾的是,最优非结构式VQ(例如LBG)的计算复杂度随维数呈指数增长。此外,存储需求可能非常大。对该维数问题的一个解决方案是使用受约束的VQ,例如网矢量量化(LVQ)。
LVQ方法导致了码矢量规则地分布在空间中的结构式字典的设计。因此,可通过根据其分布的形式为网矢量编索引来对源自适应,而不是优化矢量在空间中的位置。对于大多数真实数据源来说,这可以通过使用乘积码来有效地完成,导致了对称单峰源分布的最优速率/失真折衷。
事实上,能将这样的分布解释为一组根据源分布具有相同形式的同心超曲面。然后能通过分配与各个面的范数(半径)相对应的第一索引(前缀)和与属于同一面的矢量的计数相对应的第二单一索引(后缀)来为网码字编索引。
大量重要数据源(例如子带话音和图像系数,特别是通过小波变换得到的那些)能通过广义高斯分布模型化。该分布族通过单变量随机变量的唯一形状因子p(GG(p))而参数化。具有分布(GG(p))的源的一个有趣特性是,范数lp的包络线对应于常概率面。这导致了有效乘积码的发展。
即使前缀的计算较平凡,但后缀需要位于给定超曲面上的网矢量的计数和索引。此外,由于位于包络线上的矢量数随范数而极大地增长,空间维数的增加可能使得索引操作非常复杂,如下表所示,其示出了对于网Zn以及不同维数和范数值,在范数l1的情况下,给定正四面体锥(hyperpyramid)的首领数目以及位于该正四面体锥上的网矢量总数(基数)的比较。
在文献中,一般根据两种不同技术执行后缀的索引。
第一种考虑位于给定超曲面上的矢量总数(基数)来赋予索引。另一种方法利用网的对称,使用首领(leader)概念。范数lp的包络线的首领对应于一些网矢量,根据这些网矢量,能通过其坐标的置换(permutation)和符号变化来得到位于对应包络线上的所有其它网矢量。对于各向同性源来说,这两种方法的趋势是具有类似的速率/失真性能。
然而,关于网索引的大多数著作仅为拉普拉斯或高斯分布提出解决方案,这两种分布是GG(p)的特定情况,形状参数分别为p=1和p=2。少数作者提出了对于特定情况p=0.5的解决方案。然而,该计数方法不能构造乘数码,且在实践中索引方法非常复杂,对于具有高维数和范数的p≠0.5,1或2来说,尤其如此。
本发明提出了对位于0<p≤2的包络线GG(p)上的网矢量Zn计数、首领类型的索引方法的新颖替代方案,并使用分拆理论。分拆理论的使用使得我们能够克服为了生成首领并为其编索引的复杂度和存储需求。我们提出了一种经济的计数算法,对半径为r、维数为d、最强坐标为k的包络线的首领数目进行计数,用于例如对首领进行索引以及对速率进行估计等应用。
在下面的描述中,第一部分展示了LVQ的原理,并描述了索引/计数问题。第二部分提出了对超大规模的LVQ码本进行计数的有效解决方案,而无论形状参数p为何。描述然后说明了提出的方法在内存方面的代价。
2.网矢量索引
2.1网的定义
以Rn表示的网Λ由一组线性无关的矢量ai(网的基)的任意积分组合组成,使得:
Λ={x|x=u1a1+u2a2+...unan}(1)
其中ui是整数。空间分割因此是规则的,并仅取决于选择的基矢量ai∈Rm(m≥n)。必须注意,每组基矢量定义了不同的网。
可以认为网的每个矢量v属于包含具有由下式给出的固定范数lp的矢量的曲面或超曲面:
然后能使用乘积码对给定网矢量编码。很明显,如果源矢量的分布是拉普拉斯分布,则合适的乘积码包含与矢量的范数l1相对应的前缀,以及与其在具有等于讨论中的范数l1的半径的正四面体锥上的位置相对应的后缀。固定范数l1的超曲面称为正四面体锥。能使用计数算法得到矢量在超曲面上的位置。这样的乘积码保证了解码的唯一性。
在广义高斯分布源的形状参数小于或等于1的情况下,D4、E8上的立方网Zn或网Leech的优越性已经被证明[12]。因此,本文剩余部分关注基于立方网Zn的LVQ设计。
2.2基于总计数的索引
现有技术中已知一些为高斯或拉普拉斯分布的情况、以及为基于总计数原理的不同网提出的计数解决方案。特别地,在拉普拉斯源分布的情况下以及对于网Zn,已知一种用于对位于范数l1的正四面体锥上的网矢量的总数进行计数的递归公式。该计数公式已经扩展到形状因子p位于0和2之间的广义高斯源分布。这些解决方案使得确定位于给定截断范数lp内的矢量数是可能的,但是它们没有提出为网Zn的矢量分配实际索引的算法。此外,该解决方案不确定位于给定超曲面上的矢量数,使得很难使用乘积码。
现有技术的著作提出的算法对于0<p≤2根据乘积码方案为矢量编索引。其基于广义θ级数(theta series)[4]并使用网几何。对于p=1或2,该级数的展开相对简单。然而,对于其它p值,因为不产生闭合的形状,并且禁止使用形式数学(formal mathematics),该级数的展开非常复杂。对于提出的解决方案,有必要确定各个维数和高维数的每个可能的范数值,这在有限时间内往往是不可行的。
此外,假定超曲面的基数可迅速达到对于实际实现、特别对于高维数(见下面的表)来说难解(intractable)的值,则基于包络线的基数的索引技术可迅速超过计算精度。
2.3基于首领的索引
基于首领的方法利用了网的对称。这些方法使用关于固定范数包络线的有效索引算法,并且在称为首领的少数矢量的基础上、而不是在网的所有矢量的基础上赋予索引。分别处理网的不同对称,与总计数技术相比,构成了不都存在对称时更有效的为源编索引的方法。此外,由编码算法管理的索引比包络线的基数要小的多,这使得对于给定二进制精度,能为不能由基于总计数的方法进行索引的矢量编索引。
在乘积码体系中,除了网的对称之外,后缀索引包含少量矢量(首领)的索引,根据这些矢量,能分配超曲面的所有其它矢量。对于网Zn,对称对应于两种基本操作:矢量坐标符号的改变以及置换。第一种操作对应于矢量所在卦限(octant)的改变。例如,2维矢量(7,-3)在第四卦限,而矢量(-7,-3)在第三卦限。这些矢量相对于y轴对称。第二种操作对应于卦限内对称,例如,矢量(-7,3)和(-3,7)都在第二卦限且相对于卦限的平分线对称。在这种情况下,可以看出,所有这些矢量都能根据矢量(3,7)的置换和符号变化而产生,矢量(3,7)是所有这些矢量的首领。利用所有的置换和符号变化,首领(3,7)能表示8个矢量。该比例随着超曲面的维数而快速增长(见表1)。
因此,该索引方法为每个矢量分配一组三个索引:一个对应于其首领,另两个对应于首领的置换和首领的符号变化,而不是直接为超曲面上的所有矢量编索引。关于计算置换和符号索引的方法的更多细节见1′[5]。
3.提出的计数方法
本发明提出了对首领进行计数的解决方案。为了更好地理解有关这种计数算法的使用,我们将在下面给出为首领编索引的使用的非限制性示例。首先,我们将谈到范数l1的索引,其次,我们将给出更一般情况范数lp的示例。
接下来,在3.3节,我们将详述本发明。
3.1对于范数l1的首领索引
3.1.1原理
提出的计数算法应用到的用于为首领编索引的方法基于按反字典序(in reverse lexicographical order)将所有首领分类、并根据要被编索引的首领之前的首领数赋予索引。在此情况下,索引不再基于资源消耗高或直接寻址的搜索算法,而是基于低成本计数算法,该算法仅依靠首领数量而非每个首领的具体知识,这使得能避免构造转换表。
半径为r的正四面体锥由所有矢量v=(v1,v2,...,vd)组成,从而||v||1=r。如前所述,首领是超曲面的基本矢量,根据首领进行置换和符号变化操作得到位于该超曲面上的所有其它矢量。事实上,首领是具有以升序(或降序)排序的正坐标的矢量。因此,等于r的范数l1的d维首领是满足以下条件的矢量:
2-对于i<j并且i,j∈[1,d],0≤vi≤vj。
3.1.2与分拆理论的关联
在范数l1的情况下,可以注意到,3.1.1节所列的条件与数论中的分拆理论相关。事实上,在数论中,正整数r的分拆是将r写成d个正整数(也称为部分)的和的方式。分拆函数P(r)给出r的不同分拆的数目(与次序无关),从而
其对应于欧拉函数的倒数,也称为级数q[10,16,17]。附加的数学展开得到了函数P(r)的表示,使得能加速计算。
例如,对于r=5,方程(2)给出了结果P(5)=7。事实上,数字5所有可能的分拆是(5)、(1,4)、(2,3)、(1,1,3)、(1,2,2)、(1,1,1,2)和(1,1,1,1,1)。通过用5维矢量的形式重写这些分拆,例如(0,0,0,0,5)、(0,0,0,1,4)、(0,0,0,2,3)、(0,0,1,1,3)、(0,0,1,2,2)、(0,1,1,1,2)和(1,1,1,1,1),我们看到这些正好对应于范数r=5和维数d=5的正四面体锥的首领,也就是说,这些是范数r=5和维数d=5的正四面体锥中满足3.1.1节的两个条件的仅有的矢量。
然而,我们一般关心d维网中等于r的范数l1的包络线,其中r≠d。在这种情况下,能使用函数q(r,d)[10,18],该函数计算具有不超过d个部分的r的分拆数目(在分拆理论中,这等同于计算r的、包括任意元素的部分数都不大于d的分拆数目)。因此,对于范数r=5和维数d=3的正四面体锥,我们得到q(5,3)=5,也就是说,由(0,0,5)、(0,1,4)、(0,2,3)、(1,1,3)和(1,2,2)给出5个首领。
能根据下述递归方程计算函数q(r,d):
q(r,d)=q(r,d-1)+q(r-d,d) (3)
其中对于d≥r,q(r,d)=P(r),q(1,d)=1且q(r,0)=0。
3.1.3为首领编索引而对函数q(r,d)的使用
如下面所描述的,方程(3)不仅给出位于给定正四面体锥上的首领的总数,还能用于运行时为首领分配唯一索引,而无需转换表。为了说明提出的算法的原理,我们假设给定正四面体锥的首领按反字典序如下分类:
因此,首领l的索引对应于其前面的首领的数目。在上面描述的示例中,首领(0,...,1,1,rn-2)必须被分配给索引3。
数学命题1描述了提出的为首领编索引的算法:
命题1。设v=(v1,v2,...,vn)为位于固定范数l1的包络线上的首领l=(x1,x2,...,xn)的网矢量Zn。其首领索引I1由下式给出:
证明。我们考虑为维数为n和范数l1为的首领l=(x1,x2,...,xn)编索引。由于首领按反字典序排序,置于1之前的第一组首领由第n个分量严格大于xn的所有首领组成,这就是说,由具有满足xn+1≤gn≤rn的最高坐标gn的所有首领组成。
为了对该第一组中的首领数目进行计数,而不列出所有,我们使用分拆函数q(r,d)。事实上,使用下面的推论可以容易地计算出第n个坐标等于gn的首领的数目:
推论:计算最大坐标等于gn的范数为rn维数为n的首领的数目相当于计算具有不超过n-1部分、每部分都不大于gn的数字rn-gn的分拆数目。
在大多数情况下,我们能通过应用q(rn-gn,n-1)对该分拆数进行计数。然而,该方法仅当rn-gn≤gn时有效,在这种情况下隐含地假设rn-gn的所有分拆没有大于gn的部分。然而,在不保证rn-gn≤gn的更一般的情况下(例如,最大部分等于7的范数rn=20和维数n=5的首领数目将得到q(20-7,5-1)=q(13,4),其中20-7>7),由于rn-gn的一些分拆将使其最大部分超过gn,在这种情况下将不能遵守3.1.1节的条件2,因而q(rn-gn,n-1)的计算将得到错误的有效首领数。
在这种情况下,我们必须对分拆数目的计算应用第二约束:最大部分的值。我们因此引入由函数得到的归纳其计算具有不超过d部分且任一部分都不大于k的给定数字r的分拆数目。通过计数算法完成的计算,计数算法例如是作为本发明主题的算法。
1之前的第二组首领由第n个坐标等于Xn、但第(n-1)个坐标严格大于xn-1的所有首领组成。为了对该首领数目进行计数,我们能使用前面提到的相同的推论,但是这次应用到n-1维。然后我们能通过使gn-1从xn-1+1变化到min(xnrn-1)、使用 或来计算最大分量gn=xn且第二大分量gn-1>xn-1的首领的数目。min函数保证了符合范数rn以及gn-1≤gn=xn。
等待附加维数的结果时,能由下式得到l之前的最高坐标等于xn的首领的数目:
方程(5)和(6)的组合产生了用于计算置于l之前的首领的总数、以及因此l的索引I1的通式(方程(4)):
其中对于j=0,xn+1=+∞。
3.2范数lp的情况的归纳
为了计算位于固定范数lp的包络线之上的矢量v=(v1,v2,...,vn)的首领l=(x1,x2,...,xn)的索引,其中0<p≤2,应用与l1的情况相同的原理。按反字典序列出首领,并使用同样的计数方法赋予索引。因此方程(4)的结构再次适用,其中关于i的总和利用函数根据给定坐标计算首领数目,关于j的总和允许对维数递归。
然而,的使用暗含地表示范数r的和项是整数,并且可以是区间[0,r]内的任意整数。很明显这对于p=1有效,其中和项是正整数网坐标自身。另一方面,对于p≠1,和项不必是整数,或可不必是区间[0,r]内的任意整数(例如,对于p=2,和项是整数,但仅是平方数)。
则得知矢量的范数lp具有精度δ,且由下式得到:
其中精度δ限定了固定范数的包络线宽度,随着其值增加,包括更多矢量(见图2)。
图1:对于网Z2的p=0.4且δ=0.3的包络线的示例。
命题2。设v=(v1,v2,...,vn)为位于固定范数lp的包络线上的首领l=(x1,x2,m,xn)的网矢量Zn。其首领索引I1由下式给出:
将四舍五入到精度δ的最接近整数使得能根据正整数值的总和得到整数范数如方程(7)中所定义的。因此,能通过对将写成的和的不同方式的数目进行计数,来计算精度为δ位于p≠1的包络线上的首领l的索引,其中是t:定义的函数t的整个图像,匹配其中
重要的是,这里注意,鉴于Z*的不同值能与中的相同值匹配,取决于p和δ的值,函数t可表示非内射函数。因此,不同首领在中能具有相同表示,并且用于对中的分拆数目计数的任意朴素法(naive procedure)将不仅导致错误首领索引,还导致将相同的错误索引被赋予不同首领。
我们定义解决方案,函数为对具有不超过d部分的的分拆数目计数,其中给定每部分,对于i,k∈Z*,不存在i大于k。应该注意,间接使用Z*的值k的对中最大部分的值的约束使得能计数导致中产生相同分拆的不同首领的数目。
通过使方程(9)中的j从0变化到n-2,对于坐标xn到x2正确地对l之前的首领数目进行计数。在范数l1的情况下,鉴于存在的单个值x1∈Z*,计算以前的首领的总数是充分条件。然而,对于范数lp,由于函数t的非内射,一些值x1∈Z*导致是可能的。因此,为了保证索引的唯一性,计算和x1之间的差,并添加到方程(9)的结果中,以便得到由方程(8)给出的唯一可解码首领索引:
3.3计数算法
对于维数d=1,初始化其中不同正整数的数目i≤k,从而t(i)=r。例如,对于p=0.5和δ=0.1,鉴于使用函数t仅当i=32和时在中匹配r=57,我们如此定义如果k≤31为0,如果k=32为1,如果k≥32为2。
附录中呈现的算法1和算法2初始化并计算
3.4内存成本
然而,对于给定最大范数以及维数d,有效编码和解码步骤的限制更低。这是因为,根据方程(8)和(10),可以看出当j=0且i=imin(r,d)时,得到的前两个输入变量的最大值。在这种情况下,我们计算 因此,使用区间上的第一输入变量(与范数相关)以及区间[1,d-1]上的第二输入变量(与维数相关)就足够了。
应该注意,内存需求主要取决于包络线的范数和维数。首领数目决定B的选择。
图3示出了使用索引算法的节省内存,其中表离线计算。内存需求根据p=1、δ=1且B=4(即整数型数据)时的半径r由方程(13)表示,并与如[5]中描述的基于首领的常规方法的内存上限进行比较。应该注意,即使维数和半径分别低到16和20,常规方法也需要不超过10千兆字节(gigabyte)的内存,而提出的方法需要少于100千字节(kilobyte)。
极小的内存需求以及不必知道所有首领的事实使得能为高达64、128、256、512等维数的网矢量编索引。在现有工作中,实际应用限制在16维。
附录
计数算法
算法1
rbckp=r;
k=f[floor((double)r/2.)];
r=r-ceil((double)r/(double)d);
d--;
for(j=1;j<d;R++)
{
for(R=1;R<=r;R++)
{
Np=0;
for(i=imin(R,j+1);i<=f[R];i++)
{
rmd=R-t[i];
if(t[i]>rmd)//没有第二约束
else
if(i<=k)
}
}
}
/*算法2详细说明了函数init(rbckp,r,d,k)。
算法2
f=0rbckp+1;//rbckp+1维零矢量
t=0f(rbckp)+2;//f(rbckp)+2维零矢量
f[rbckp]=f(rbckp);
for(i=0;i<=f [rbckp];i++)
{
do{
if(t[i]<=r)
{
if(i<=k)
}
i++;
t[i]=t(i);
}while(t[i]==t[i-1]);
i--;
f[t[i]]=f(t[i]);
for(j=t[i]+1;j<min(t[i+1],rbckp);j++)
f[j]=f[t[i]];
}
for(j=1;j<d;j++)//c
Claims (5)
4.根据权利要求1-3中的至少一项所述的估计方法的应用,用于估计数据压缩率。
5.根据权利要求1-3中的至少一项所述的估计方法的应用,用于为首领矢量编索引。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR0803020A FR2931964A1 (fr) | 2008-06-02 | 2008-06-02 | Procede de denombrement des vecteurs dans les reseaux reguliers de points. |
FR08/03020 | 2008-06-02 | ||
PCT/FR2009/000618 WO2009156606A2 (fr) | 2008-06-02 | 2009-05-27 | Procédé de dénombrement des vecteurs dans les réseaux réguliers de points |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102084595A true CN102084595A (zh) | 2011-06-01 |
CN102084595B CN102084595B (zh) | 2014-11-12 |
Family
ID=40086719
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200980125585.7A Expired - Fee Related CN102084595B (zh) | 2008-06-02 | 2009-05-27 | 用于对规则点网中的矢量进行计数的方法 |
Country Status (8)
Country | Link |
---|---|
US (1) | US8745110B2 (zh) |
EP (1) | EP2289172B1 (zh) |
JP (1) | JP5580295B2 (zh) |
KR (1) | KR101577848B1 (zh) |
CN (1) | CN102084595B (zh) |
CA (1) | CA2725809A1 (zh) |
FR (1) | FR2931964A1 (zh) |
WO (1) | WO2009156606A2 (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2931964A1 (fr) * | 2008-06-02 | 2009-12-04 | Centre Nat Rech Scient | Procede de denombrement des vecteurs dans les reseaux reguliers de points. |
FR2931963A1 (fr) | 2008-06-02 | 2009-12-04 | Centre Nat Rech Scient | Procede de traitement de donnees numeriques |
US11709270B1 (en) | 2018-06-01 | 2023-07-25 | Cintoo SAS, France | Method of processing azimuth, elevation and range data from laser scanning an object |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1188957A (zh) * | 1996-09-24 | 1998-07-29 | 索尼公司 | 矢量量化方法和语音编码方法及其装置 |
WO1999033185A1 (fr) * | 1997-12-22 | 1999-07-01 | France Telecom S.A. | Procede de codage d'un vecteur d'un reseau representatif d'un signal quantifie et procede de decodage correspondant |
CN1659785A (zh) * | 2002-05-31 | 2005-08-24 | 沃伊斯亚吉公司 | 信号多速率点阵矢量量化的方法和系统 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02215230A (ja) * | 1989-02-15 | 1990-08-28 | Matsushita Electric Ind Co Ltd | ベクトル量子化装置 |
FR2795589B1 (fr) | 1999-06-11 | 2001-10-05 | Centre Nat Rech Scient | Decodeur video optimal base sur les standards de type mpeg |
JP4590747B2 (ja) * | 2001-02-06 | 2010-12-01 | ソニー株式会社 | ベクトル量子化のコードブック生成方法及びコードブック生成装置 |
KR101190875B1 (ko) * | 2004-01-30 | 2012-10-15 | 프랑스 뗄레콤 | 차원 벡터 및 가변 분해능 양자화 |
WO2008104725A1 (fr) | 2007-02-21 | 2008-09-04 | France Telecom | Procede de codage et decodage algebrique optimise, modules et programmes d'ordinateur associes |
WO2009127097A1 (en) * | 2008-04-16 | 2009-10-22 | Huawei Technologies Co., Ltd. | Method and apparatus of communication |
FR2931964A1 (fr) * | 2008-06-02 | 2009-12-04 | Centre Nat Rech Scient | Procede de denombrement des vecteurs dans les reseaux reguliers de points. |
FR2931963A1 (fr) | 2008-06-02 | 2009-12-04 | Centre Nat Rech Scient | Procede de traitement de donnees numeriques |
WO2010001020A2 (fr) | 2008-06-06 | 2010-01-07 | France Telecom | Codage/decodage par plans de bits, perfectionne |
GB2464447B (en) * | 2008-07-01 | 2011-02-23 | Toshiba Res Europ Ltd | Wireless communications apparatus |
CN101430881B (zh) * | 2008-11-10 | 2013-04-17 | 华为技术有限公司 | 一种编码、解码、编解码方法、编解码系统以及相关装置 |
-
2008
- 2008-06-02 FR FR0803020A patent/FR2931964A1/fr not_active Withdrawn
-
2009
- 2009-05-27 CN CN200980125585.7A patent/CN102084595B/zh not_active Expired - Fee Related
- 2009-05-27 EP EP09769447.5A patent/EP2289172B1/fr not_active Not-in-force
- 2009-05-27 US US12/995,542 patent/US8745110B2/en not_active Expired - Fee Related
- 2009-05-27 WO PCT/FR2009/000618 patent/WO2009156606A2/fr active Application Filing
- 2009-05-27 JP JP2011512165A patent/JP5580295B2/ja not_active Expired - Fee Related
- 2009-05-27 CA CA2725809A patent/CA2725809A1/fr not_active Abandoned
- 2009-05-27 KR KR1020107029941A patent/KR101577848B1/ko not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1188957A (zh) * | 1996-09-24 | 1998-07-29 | 索尼公司 | 矢量量化方法和语音编码方法及其装置 |
WO1999033185A1 (fr) * | 1997-12-22 | 1999-07-01 | France Telecom S.A. | Procede de codage d'un vecteur d'un reseau representatif d'un signal quantifie et procede de decodage correspondant |
CN1659785A (zh) * | 2002-05-31 | 2005-08-24 | 沃伊斯亚吉公司 | 信号多速率点阵矢量量化的方法和系统 |
Non-Patent Citations (1)
Title |
---|
FONTELES, L.H.ETC.: "《Indexing Zn Lattice Vectors for Generalized Gaussian Distributions》", 《INFORMATION THEORY》 * |
Also Published As
Publication number | Publication date |
---|---|
WO2009156606A8 (fr) | 2010-11-04 |
EP2289172B1 (fr) | 2018-07-04 |
KR101577848B1 (ko) | 2015-12-15 |
JP2011522497A (ja) | 2011-07-28 |
US20110131433A1 (en) | 2011-06-02 |
US8745110B2 (en) | 2014-06-03 |
WO2009156606A3 (fr) | 2010-10-07 |
KR20110033154A (ko) | 2011-03-30 |
WO2009156606A2 (fr) | 2009-12-30 |
CN102084595B (zh) | 2014-11-12 |
FR2931964A1 (fr) | 2009-12-04 |
EP2289172A2 (fr) | 2011-03-02 |
JP5580295B2 (ja) | 2014-08-27 |
CA2725809A1 (fr) | 2009-12-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100518325C (zh) | 用于视频压缩的组合的游程长度编码和可变长度编码 | |
JP6909265B2 (ja) | オーディオ/ビデオサンプルベクトルのピラミッドベクトル量子化インデクシング及びデインデクシングの方法及び装置 | |
CN100553152C (zh) | 基于cabac的编码方法和设备及解码方法和设备 | |
US20130018889A1 (en) | Lossless compression of high nominal-range data | |
CN102084594A (zh) | 用于处理数字数据的方法 | |
KR101271473B1 (ko) | 폴라 코드 시퀀스를 이용한 디코딩 방법 | |
JP7640578B2 (ja) | 最近傍検索方法、エンコーダ、デコーダ、及び記憶媒体 | |
CN101842988A (zh) | 基于概率表动态计算的符号平面编码/解码 | |
CN101430881A (zh) | 一种编码、解码、编解码方法、编解码系统以及相关装置 | |
CN114424568A (zh) | 预测方法、编码器、解码器及计算机存储介质 | |
CN101848311A (zh) | 基于Avalon总线JPEG2000的EBCOT编码器 | |
CN102084595B (zh) | 用于对规则点网中的矢量进行计数的方法 | |
CN114697672B (zh) | 基于游程全零编码的神经网络量化压缩方法及系统 | |
CN102905137A (zh) | 超光谱信号的快速差值矢量量化压缩编码方法 | |
WO2011097963A1 (zh) | 编码方法、解码方法、编码器和解码器 | |
US20130082850A1 (en) | Data encoding apparatus, data decoding apparatus and methods thereof | |
CN106537914B (zh) | 通过限制的进位运算来执行算术编译的方法和设备 | |
CN102132342A (zh) | 一种通过内插滤波器更新编码器的方法 | |
KR20210119907A (ko) | 가중치 값의 압축 및 압축 해제 | |
Lorandel et al. | Efficient compression technique for noc-based deep neural network accelerators | |
Sano et al. | Segment-parallel predictor for FPGA-based hardware compressor and decompressor of floating-point data streams to enhance memory I/O bandwidth | |
WO2016004629A1 (zh) | 一种计算数据的预期压缩率的方法及装置 | |
Imai et al. | A Floating Point Data Compression Using Inter-Extrapolative Predictor | |
US20240235575A1 (en) | Method and apparatus data with data compression and/or decompression | |
Chen et al. | Lossless Geometry Compression for Steady-State and Time-Varying Irregular Grids. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20141112 Termination date: 20190527 |
|
CF01 | Termination of patent right due to non-payment of annual fee |