CN104683806B

CN104683806B - 基于深度流水的mq算术编码器高速fpga实现方法

Info

Publication number: CN104683806B
Application number: CN201510091224.2A
Authority: CN
Inventors: 陶宏江; 张柯; 金龙旭; 张然峰; 郝贤鹏
Original assignee: Changchun Institute of Optics Fine Mechanics and Physics of CAS
Current assignee: Changchun Institute of Optics Fine Mechanics and Physics of CAS
Priority date: 2015-02-28
Filing date: 2015-02-28
Publication date: 2017-12-26
Anticipated expiration: 2035-02-28
Also published as: CN104683806A

Abstract

基于深度流水的MQ算术编码器高速FPGA实现方法，属于计算机、数字图像处理领域，为了提高MQ编码算法执行速度，在原有四级流水线结构的基础上，通过更合理的分配工作负荷和拓展流水线，提出了一种新的基于六级流水线的块速MQ算数编码实现方式，通过合理的分配工作负荷，减少同一级流水线中必须的串行工作量；通过增加流水线级数，减少每一级流水线中的最大转型工作负荷；通过对CX表更新和算术编码间隔A更新之间的相关环的控制信号的分析，得出了通过超前预测取数技术和多索引值分析选择技术的新的三级分解的实现方式，即前三级流水线；以新的寄存器分配方式同时提高了加法速度和多路选择的速度，从而提高了MQ编码器的整体执行速度。

Description

基于深度流水的MQ算术编码器高速FPGA实现方法

技术领域

本发明提出了一种基于多级深度流水线的应用于FPGA系统的MQ算术编码器的高速实现方法，可以有效的提高使用FPGA实现JPEG2000中MQ编码算法时的编码速度，属于计算机、数字图像处理领域。

背景技术

JPEG2000图像压缩算法是新一代的静态图像压缩标准，它不仅有优良的压缩性能，同时支持有损压缩、无损压缩、指定区域压缩等可选择方式和很强的抗误码特性。由于具有这些优良的特性，JPEG2000算法已经应用在越来越多的领域。

虽然JPEG200O拥有上述众多的优越性,但由于JPEG2O00具有较高的算法复杂性,尤其是JPEG2000算法专用的MQ算术编码算法的控制结构和运算单元都比较复杂，且具有很强的串行性和前后相关性，从而导致JPEG2000编码算法速度很慢。

为了提高MQ算术编码的执行速度，进而提高JPEG2000编码算法的整体工作速度，现有的使用FPGA或VLSI实现MQ编码器的方案中都使用了流水线的工作形式。现在常用的流水线实现方式为四级流水线结构，该结构在论文Michael Dyer,David Taubman,SaeidNooshabadi,and Amit Kumar Gupta.Concurrency Techniques for Arithmetic Codingin JPEG2000.IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS[J].2006,53(6)中进行了详细的阐述。但是该结构对制约MQ编码器执行速度的两个前后强相关环(CX表更新和算术编码间隔A更新之间的相关环，如图1所示；编码数据输出相关环，如图2所示)的分解深度不够，导致第一级流水线中存在两级查表操作、第四级中存在18位加法和21:1多路选择器实现的移位操作，这些操作耗时较长，从而降低了MQ编码器的工作速度。

发明内容

为了提高MQ编码算法执行速度，本发明基于深度流水的MQ算术编码器高速FPGA实现方法，其包括以下步骤：

步骤1，第一级流水线中，对输入的(CX,D)数据对查表找到对应的MQ编码器概率表索引和MPS值，实现工作过程中对CX数据对查找表的更新和维护，实现多个同一CX值输入时的初步更新—查表冲突的处理；

步骤2，第二级流水线中，实现概率表索引值到概率值的查表，首先由是否连续两个或三个输入同一CX值判断概率值的索引值是选择来自第一级流水线的输入、第三级流水线的输入、上一次查表结果的NMPS或上一次查表结果的NLPS；

步骤3，第三级流水线中，根据第二级流水线输出的概率值，对当前的算术编码区间A进行重新划分，由输入数据D与MPS是否相同选择A等于A-Qe或是Qe，并执行归一化操作；

步骤4，第四级流水线中，由第三级流水线的输出结果决定输出寄存器C的值，如果是MPS状态，A<Qe则C不更新，否则C等于C+Qe；如果是LPS状态，A<Qe则C等于C+Qe，否则C不更新；

步骤5，第五级流水线中，实现对寄存器C的高位管理，依据JPEG2000协议，CH在数据的输出过程中是长度可变的，由CT对CH中的数据位数进行计数，同时由CT和来自第四级流水线的位移数确定CH的更新值和B0、B1的输出值；

步骤6，第六级流水线中，实现对JPEG2000协议中的最后输出字节B的管理，如果B等于0xff，则直接输出BOut0为B，否则BOut0为B加上来自第五级流水线的进位，同时依据第五级流水线输出的字节数，更新BOut1和B。

本发明的发明构思可以总结为：

1、通过合理的分配工作负荷，减少同一级流水线中必须的串行工作量；

2、通过增加流水线级数，减少每一级流水线中的最大转型工作负荷；

3、通过对CX表更新和算术编码间隔A更新之间的相关环的控制信号的分析，得出了通过超前预测取数技术和多索引值分析选择技术的新的三级分解的实现方式，即前三级流水线；

4、针对现有的四级流水线算法数据输出级由于具有18位加法和21:1多路选择器而导致编码速度低的问题，提出了新的寄存器分配方式同时提高了加法速度和多路选择的速度，从而提高了MQ编码器的整体执行速度。

本发明的有益效果是：本方案通过对现有MQ编码器瓶颈的分析，使用超前预测取数技术、多索引值分析选择技术和新的字节数据输出方案，增加了流水线级数，减少了每级流水线的最大执行时间，提高了MQ编码器的整体执行速度。本方案在提高执行速度的同时，保证了资源利用率没有改变，适于对性能、资源占用要求严格的FPGA实现的编码系统。

附图说明

图1CX表更新和算术编码间隔A更新之间的相关环节流程图。

图2编码数据输出相关环节流程。

图3六级流水线实现方法结构框图。

图4流水线第一级工作流程图。

图5流水线第二级工作流程图。

图6流水线第三级工作流程图。

图7流水线第四级工作流程图。

图8流水线第五级工作流程图。

图9流水线第六级工作流程图。

具体实施方式

下面结合附图对本发明做进一步详细说明。

如图3所示，本发明基于深度流水的MQ算术编码器高速FPGA实现方法，采用六级流水线MQ编码器实现方式，包括以下步骤：

步骤1，第一级流水线中，负责通过输入的(CX,D)数据对在CX表中找到对应的MQ编码器概率表索引和MPS值，并生成连续输入2次或3次同一CX值时的数据冲突控制信号。

在该级流水线中，使用分布式RAM实现CX到MQ编码器概率表索引值和MPS值的查找表；使用寄存器Cx1保存上一时钟周期时的输入CX值；使用寄存器Cx2保存一个时钟周期之前的输入CX值；使用寄存器Cx3保存两个时钟周期之前的输入CX值；使用寄存器D1保存输入数据D；使用寄存器Ni1保存查表输出的概率表索引值；使用寄存器Mps保存查表输出的MPS值；使用寄存器MpsEq保存输入数据值D与当前查表输出MPS的比较结果；使用Cx12E保存当前输入CX与Cx1中保存值的比较结果；使用Cx13E保存当前输入CX与Cx2中保存值的比较结果。

第一级流水线中，对每个输入的CX都通过查表得到对应的概率表索引值和MPS值，并把CX数据保存到Cx1、Cx2、Cx3中；当CX值等于Cx3时选择来自第三级流水线的CX表更新值作为输出保存在Ni和Mps中，CX值不等于Cx3时选择查表输出的CX表更新值作为输出保存在Ni和Mps中；把输入数据D和Mps进行逻辑与操作，结果保存在MpsEq中；保存CX与Cx1的比较结果到Cx12E；保存CX与Cx2的比较结果到Cx13E；该级流水线具体实现流程，如图4所示。

步骤2，第二级流水线实现概率表索引值到概率值的查表。

在该级流水线中，使用ROM实现概率表PET，其中保存JPEG2000标准概率值信息；使用寄存器Pb保存输出概率值；使用寄存器Ni2保存查表使用的索引值；使用寄存器Ni保存预测索引值；使用寄存器Lz保存左移位数；使用寄存器Mps2保存预测的Mps值；使用寄存器MpsMatch2保存Mps比较结果的更新值；使用寄存器MpsSelect2保存Mps值选择控制信息；使用寄存器MED保存上一时钟周期时的MpsEq值；使用寄存器MED2保存一个时钟周期之前的MpsEq值。

第二级流水线的主要工作是预测概率表查表索引值，并通过查表输出概率值和索引表的下一索引值；首先依据Cx12E和Cx13E的内容选择相应的信号值作为ME结果，再依据Cx12E、Cx13E和ME等到概率表查表索引值的选择值，并通过多路选择器选择相应的索引值进行查表得到概率值；该级流水线具体实现流程，如图5所示。

步骤3，第三级流水线实现编码区间A的计算。

在该级流水线中，使用寄存器ARN保存编码区间A归一化信号；使用寄存器CxUpdate保存用于更新第一级流水线中CX表的更新信息；使用寄存器MpsUpdate保存用于更新第一级和第二级流水线中mps信号的更新信息；使用寄存器Lz3保存左移位数；使用寄存器Pb3保存输出概率值；使用寄存器CAS保存输出选择。

首先根据当前的流水线状态，判断是使用第二级流水线的输出概率值还是使用上一次的概率值，然后使用编码区间A减去概率值来实现对当前的算术编码区间A进行重新划分，最后由输入数据D与MPS是否相同选择A等于A-Qe或是Qe，并执行归一化操作，该级流水线实现流程，如图6所示。

步骤4，第四级流水线中，由第三级流水线的输出结果决定输出寄存器C的值。

使用寄存器C输出暂存结果；使用寄存器BPC保存输出进位位；使用寄存器BPO0保存进位输出高位字节；使用寄存器BPO1保存进位输出低位字节；使用寄存器CCRA保存右对齐的输出数据；使用Lz4保存左移位数。

与MQ算法的4级流水线结构使用16位寄存器C不同，本专利结构使用19位寄存器C，因为在MQ算法中使用的是28位寄存器C，它的低16位是用来与概率值Pb相加操作长度固定，它的高9位是用来输出操作的长度可变，这样中间还有3位数据，实际上这三位数据表示的是如果处于MPS状态，算法中A<Pb时则C不更新，否则C等于C+Pb；如果是处于LPS状态，算法中A<Pb时则C等于C+Pb，否则C不更新，该级流水线实现流程，如图7所示。

步骤5，第五级流水线中，实现对寄存器C的高位CH[7:0]的管理。

使用寄存器Bc保存输出结果；使用寄存器Len保存输出长度；使用寄存器CH保存C的高位数据；使用寄存器CT保存CH中有效位的位数。

依据JPEG2000协议，CH在数据的输出过程中是长度在0～7之间可变的，由CT对CH中的数据位数进行计数，同时由CT和来自第四级流水线的位移数确定CH的更新值和Bc的输出值，使用CH中保留的位数值更新CT计数器，该级流水线实现流程，如图8所示。

步骤6，第六级流水线中，实现对JPEG2000协议中的最后输出字节B的管理。

使用寄存器B保存暂存数据；使用寄存器BOut0保存高位输出；使用寄存器BOut1保存低位输出。

如果B等于0xff，则直接输出BOut0为B，否则BOut0为B加上来自第五级流水线的进位位，同时依据第五级流水线输出的字节数，更新BOut1和B，该级流水线实现流程，如图9所示。

本发明和基于四级流水线技术的同型号FPGA实现的速率、资源比较见表1。

表1：

Claims

1.基于深度流水的MQ算术编码器高速FPGA实现方法，其特征是，其包括以下步骤：

步骤5，第五级流水线中，实现对寄存器C的高位CH的管理，依据JPEG2000协议，CH在数据的输出过程中是长度可变的，由寄存器CT对寄存器C的高位CH中的数据位数进行计数，同时由寄存器CT和来自第四级流水线的位移数确定CH的更新值和寄存器Bc的输出值；

步骤6，第六级流水线中，实现对JPEG2000协议中的最后输出字节B的管理，使用寄存器B保存暂存数据；使用寄存器BOut0保存高位输出；使用寄存器BOut1保存低位输出；如果B等于0xff，则直接输出BOut0为B，否则BOut0为B加上来自第五级流水线的进位，同时依据第五级流水线输出的字节数，更新BOut1和B。