[go: up one dir, main page]

CN1595454A - 一种高压缩比人像编解码方法 - Google Patents

一种高压缩比人像编解码方法 Download PDF

Info

Publication number
CN1595454A
CN1595454A CN 200410049713 CN200410049713A CN1595454A CN 1595454 A CN1595454 A CN 1595454A CN 200410049713 CN200410049713 CN 200410049713 CN 200410049713 A CN200410049713 A CN 200410049713A CN 1595454 A CN1595454 A CN 1595454A
Authority
CN
China
Prior art keywords
body shoulder
wavelet
wavelet coefficient
shape information
shoulder object
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 200410049713
Other languages
English (en)
Other versions
CN1265323C (zh
Inventor
闫宇松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN 200410049713 priority Critical patent/CN1265323C/zh
Publication of CN1595454A publication Critical patent/CN1595454A/zh
Application granted granted Critical
Publication of CN1265323C publication Critical patent/CN1265323C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明涉及一种高压缩比人像编码方法,属图像压缩技术领域。首先从图像中获取人肩对象的形状和纹理信息;分别对形状信息进行链编码以及对背景区域进行插值编码所得符号流进行算术编码;将人脸图像进行颜色空间变换;对人肩对象的形状信息和纹理信息进行适形小波变换,对变换结果进行基于对象的嵌入式编码,将所得嵌入式编码符号流进行算术编码,完成彩色人脸图像的压缩。上述过程的逆过程即为解码方法。本发明的方法,对人肩对象的边缘进行全自动或交互式的精确分割,降低了边缘在小波变换后所需的信息量,既保持了高视觉质量,又提高了压缩比,可广泛应用于网络传输、档案管理、电子证件、嵌入式系统等对电子人像数据进行高压缩比编码的领域。

Description

一种高压缩比人像编解码方法
技术领域
本发明涉及一种高压缩比人像编解码方法,更确切地说,涉及一种全自动或者交互式人肩对象提取技术,属于图像压缩技术领域。
背景技术
目前国际上有很多高性能的图像压缩方法,比如联合图像专家组制定的国际标准JPEG2000、矢量量化等。但是用于网络传输、档案管理、电子证件、嵌入式系统等领域专门针对人像的高压缩比编解码方法并不多。
上个世纪90年代初期开始,随着小波理论的发展与完善,针对小波变换的各种图像压缩算法逐渐发展起来。这些方法结合小波变换和嵌入式量化与熵编码,获得了更高的编码效率以及图像恢复质量。其中,利用小波零树的嵌入式编码方法(EZW)、层次树的集分割算法(SPIHT)、最优截断的嵌入式块编码(EBCOT)等方法是其典型代表,并最终于本世纪初形成了新一代的静止图像压缩国际标准JPEG2000。这些压缩方法的原理是相同的,压缩流程包括三个步骤,小波变换,嵌入式量化,熵编码。JPEG2000主要通过小波变换、EBCOT量化方法、QM算术编码器对静止的彩色或者灰度图像进行高效的压缩。其中小波变换的作用是将时域的数据变换成变换域的数据,使能量更加集中,利于压缩。量化的作用在于降低数据的有效位数,并利用数据之间的相关性进行处理,以便降低数据的信息量,获得更大的压缩潜力,熵编码的作用是对量化后的信息做最有效的比特位表示,最终形成输出码流。SPIHT,EZW等和JPEG2000差不多,只不过是在量化方法上有所不同。
JPEG2000等算法,虽然具有很高的压缩比,但都是通用的图像压缩方法,并不能针对具体的应用问题,比如人像等,获得更高的压缩比和压缩质量。
矢量量化等方法,虽然能够针对一些具体应用进行编码,但是在编码过程中需要通过大量的训练获得训练码书,解码的时候还需要从训练得到的码书中提取码字恢复图像。因此,它通常要预存大量的训练码本,应用很不方便,实用性也比较差。
发明内容
本发明的目的是提出高压缩比人像编解码方法,针对具体的应用需求,对图像进行压缩,以获得更高的压缩比,同时保持编解码过程的方便性,灵活性和实用性。
本发明提出的高压缩比人像编码方法,包括以下各步骤:
(1)从待压缩彩色人脸图像中获取人肩对象的形状信息和纹理信息;
(2)对上述人肩对象的形状信息进行链编码,得到人肩对象形状信息符号流,并进行算术编码;
(3)对上述待压缩彩色人脸图像中除人肩对象以外的背景区域进行插值编码,得到背景图像区域符号流,并进行算术编码;
(4)将上述待压缩彩色人脸图像从红绿兰即RGB空间变换到亮度色度色度即YUV空间,得到YUV空间上的人脸图像;
(5)根据上述第(1)步的人肩对象,分别对YUV三个分量上的人肩对象的形状信息和纹理信息进行适形小波变换,获得小波域上的人肩对象的纹理信息即小波系数以及小波域上的人肩对象的形状信息;
(6)对上述人肩对象小波系数和小波域上的人肩对象形状信息进行基于对象的嵌入式编码,得到小波系数的嵌入式编码符号流,并进行算术编码,完成彩色人脸图像的压缩。
本发明提出的高压缩比人像解码方法,包括以下各步骤:
(1)对输入的彩色人脸图像的压缩码流进行算术解码,得到人肩对象形状信息符号流和背景图像区域符号流,并依次分别进行链解码和插值解码,得到人肩对象的形状信息和背景图像区域;
(2)对上述人肩对象的形状信息进行适形小波变换,得到小波域上的人肩对象形状信息;
(3)根据上述小波域上的人肩对象形状信息,对输入的彩色人脸图像的压缩码流进行算术解码,得到小波系数的嵌入式编码符号流,并进行基于对象的嵌入式解码,得到小波系数即小波域上的人肩对象纹理信息;
(4)分别对上述小波域上的人肩对象形状信息和纹理信息进行适形小波逆变换,依次得到YUV空间三个分量上的彩色人肩对象的图像;
(5)对上述YUV空间的彩色人肩对象的图像进行颜色空间的反变换,获得RGB空间上的人肩对象重构图像;
(6)将上述人肩对象重构图像与背景图像区域叠加,获得重构的彩色人脸图像。
上述编码方法中,从人脸图像中获取人肩对象的形状信息的方法,包括如下步骤:
(1)计算人脸图像中各点的边缘梯度向量
Figure A20041004971300071
l → ( x , y ) = { I ( x , y ) * ∂ G ( x , y ) ∂ x , I ( x , y ) * ∂ G ( x , y ) ∂ y }
并由此得到边缘振幅:
| l → ( x , y ) | = ( I ( x , y ) * ∂ G ( x , y ) ∂ x ) 2 + ( I ( x , y ) * ∂ G ( x , y ) ∂ x ) 2 ;
和边缘梯度方向:
∠ l → ( x , y ) = arctg ( I ( x , y ) * ∂ G ( x , y ) ∂ y / I ( x , y ) * ∂ G ( x , y ) ∂ x ) ;
其中,I(x,y)为图像函数, G ( x , y ) = 1 2 π σ e x 2 + y 2 2 σ 2 , 其中的σ值为1~5,符号*为卷积;
(2)根据图像灰度,设定边缘振幅的门限值,将上述各点的边缘振幅与设定门限值进行比较,使边缘振幅二值化,得到边界为1,背景为0的图像;
(3)在上述图像的左上角和右上角选取门限值为0的种子点,进行区域增长,获得连通的背景区域,其余区域则为人肩对象区域;
(4)在上述边缘振幅图中,根据上述人肩对象区域的边界,沿边缘梯度方向寻找边缘振幅的局部最大点,作为人肩对象的边界。
上述编码方法中,对人肩对象的形状信息进行编码的方法,包括如下步骤:
(1)对人肩对象的形状信息进行链码跟踪,得到表示人肩区域的链码,该链码为:D[0]、D[1]…….D[i-1]、D[i]……D[n],其中的n为链码长度,D为链码方向,分别为0、1、2……7,共8个方向;
(2)对链码中每个D[i],依次进行差分运算,得到人肩对象形状信息的编码符号流;
(3)对上述人肩对象形状信息的编码符号流进行算术编码。
上述编码方法中,对背景图像区域进行编码的方法为:在背景区域中取多个图像点,计算每个图像点附近区域的背景图像颜色的平均值,对平均值进行算术编码,得到背景图像区域码流。
上述编码方法中的嵌入式编码的方法包括如下步骤:
(1)将人肩对象分成YUV三个分量,进行编码,并根据图像压缩要求分配给每个颜色分量一个固定码长;
(2)将上述每个分量所对应的小波系数,按照其振幅高低分成多个比特位面,从高位的比特位面至低位的比特位面依次进行编码,具体过程为:
(a)设小波系数的域值为T,T=2V,其中V为当前比特面,建立小波系数重要性点列;
(b)按照小波变换中的小波域子带的顺序LLn、HLn、LHn、HHn、HLn-1、LHn-1、HHn-1……、HL1、LH1、HH1,依次搜索小波变换域上与每个位置(r,c)相对应的小波系数C(r,c)以及相应的小波域的形状信息掩码M(r,c),其中(r,c)为小波域上各点的坐标,判断小波系数C(r,c)是否属于当前对象,若是,进一步判断该坐标(r,c)是否已处于重要性点列中,若处于重要性点列中,则结束该点的编码,若不处于重要性点列中,则分别对属于最高层LLn子带和最底层HL1、LH1、HH1子带的小波系数进行三符号上下文算术编码,对属于其它各层子带HLn-1、LHn-1、HHn-1、……、HL2、LH2、HH2的小波系数,进行四符号上下文算术编码;同时更新重要性点列,若小波系数C(r,c)不属于当前对象,则最高层LLn子带和最底层HL1、LH1、HH1子带的小波系数不用编码,对其它各层子带HLn-1、LHn-1、HHn-1、……、HL2、LH2、HH2的小波系数,进行二符号上下文算术编码;
(c)对于重要性点列的所有小波系数的当前比特位进行二符号上下文算术编码,并对重要性点列中的小波系数进行重排。
(3)输出码流,当码流长度达到上述固定码长时,终止该对象的编码。
上述解码方法中,对人肩对象信息进行解码的方法,包括如下步骤:
(1)对人肩对象的形状信息的压缩码流进行算术解码,得到人肩对象形状信息的编码符号流;
(2)对上述人肩对象形状信息的编码符号流进行差分解码,得到链码D[i];
(3)用轮廓填充法对链码进行轮廓填充,得到人肩对象的形状信息。
上述解码方法中,对背景图像区域进行解码的方法为:对背景图像区域码流进行算术解码,得到多个图像点附近区域的背景图像颜色的平均值,对多个平均值进行双线性插值,获得整个背景图像区域。
上述解码方法中的嵌入式解码的方法包括如下步骤:
(1)根据编码过程中所分配的固定码长,对所有人肩对象YUV三个分量依次进行解码;
(2)将上述每个分量所对应的小波系数,从高位的比特位面至低位的比特位面依次进行解码,具体过程为:
(a)设定小波系数域值T,T=2V,其中V为当前比特面,建立小波系数重要性点列;
(b)按照小波变换中的小波域子带的顺序LLn、HLn、LHn、HHn、HLn-1、LHn-1、HHn-1……、HL1、LH1、HH1,依次搜索小波变换域上与每个位置(r,c)相对应的小波系数C(r,c),以及相应的小波域的轮廓信息掩码M(r,c),其中(r,c)为小波域上各点的坐标,判断小波系数C(r,c)是否属于当前对象,若是,进一步判断该坐标(r,c)是否已处于重要性点列中,若处于重要性点列中,则结束该点的解码,若不处于重要性点列中,则分别对属于最高层LLn子带和最底层HL1、LH1、HH1子带的小波系数进行三符号上下文算术解码,对属于其它各层子带HLn-1、LHn-1、HHn-1、……、HL2、LH2、HH2的小波系数,进行四符号上下文算术解码;同时更新重要性点列,若小波系数C(r,c)不属于当前对象,则属于最高层LLn子带和最底层HL1、LH1、HH1子带的小波系数不用解码,对属于其它各层子带HLn-1、LHn-1、HHn-1、……、HL2、LH2、HH2的小波系数,进行二符号上下文算术解码;
(c)对于重要性点列的所有小波系数的当前比特位进行二符号上下文算术解码,并对重要性点列中的小波系数进行重排;
(3)当解码的码流长度达到上述固定码长时,终止该对象的解码。
本发明提出的高压缩比人像编解码方法,采用形状信息的链码表示,背景区域的双线性插值,适形小波变换以及基于对象的嵌入式编码等技术,可以对人肩对象的边缘进行精确的提取和有效的分割,大大降低了边缘在小波变换后所需要的信息表示量,从而在保持高视觉质量的前提下提高了压缩比,并且编解码方便实用。该方法可以广泛应用于网络传输,档案管理,电子证件,嵌入式系统等需要对电子人像数据进行高压缩比编码的领域。
附图说明
图1为本发明方法中编码的流程框图。
图2为本发明方法中解码的流程框图。
图3(a)和图3(b)分别为人脸图像及其人肩对象的描述方式。
图4(a)为人肩对象形状信息的链码表示方式,图4(b)为链码的8个方向示意图。
图5显示了小波系数的不同子带构成以及编码扫描顺序;此时使用了3层小波变换,LLi、HLi、LH1、HHi分别表示第i层的四个不同子带。箭头表明小波系数在基于对象的嵌入式编码中的搜索顺序。
图6为单对象和双对象时,M(r,c)时域取值以及经过适形小波变换后频域取值的形象示意图。
图7(a)基于对象的嵌入式编码的第一轮编码过程示意图,图7(b)基于对象的嵌入式编码的第二轮编码过程示意图。
图8是利用双线性插值恢复背景区域。其中图8(a)是所求背景点与多边形不相交的情形,图8(b)是所求背景点位于已知多边形内部的情形,图8(c)是所求背景点位于已知多边形外部,且与多边形相交于两点的情形。
图9显示了对一幅人脸彩色图像的人肩提取过程和解码效果,其中图9(a)和图9(b)给出了交互式人肩提取的过程,其中人肩提取的优劣由下面的游标调整,将所提取出的背景用黑色标志,图9(c)中左图为一幅初始人脸图像,右图利用本发明的编解码过程恢复的图像。
图1~图9中,1是人肩对象,2是背景区域,3和4分别表示将一个对象拆分成两个对象a和b,5是人肩对象形状信息的链码表示。
图7中,code是算术编码。其中code(0,m4),code(1,m4)code(2,m4)表示对正符号,负符号和零符号的算术编码,m4是该三符号符号流的上下文标志。code(0,m3),code(1,m3),code(2,m3)和code(3,m3)表示对正符号,负符号,孤立零符号和零树符号的算术编码,m3是该四符号符号流的上下文标志。code(0,m2)和code(1,m2)表示非对象孤立零符号和非对象零树符号的算术编码,m2是该二符号符号流的上下文标志。code(0,m5),code(1,m5)表示对小波系数当前比特位的算术编码,m5是该二符号符号流的上下文标志。
具体实施方式
本发明提出的高压缩比人像编码方法,其流程如图l所示,首先从待压缩彩色人脸图像中获取人肩对象的形状信息和纹理信息;对人肩对象的形状信息进行链编码,得到人肩对象形状信息符号流,并进行算术编码;对待压缩彩色人脸图像中除人肩对象以外的背景区域进行插值编码,得到背景图像区域符号流,并进行算术编码;将待压缩彩色人脸图像从红绿兰即RGB空间变换到亮度色度色度即YUV空间,得到YUV空间上的人脸图像:根据人肩对象,分别对YUV三个分量上的人肩对象的形状信息和纹理信息进行适形小波变换,获得三个分量上的人肩对象的纹理信息即小波系数以及小波域上的人肩对象的形状信息;对人肩对象小波系数和小波域上的人肩对象形状信息进行基于对象的嵌入式编码,得到小波系数的嵌入式编码符号流,并进行算术编码,完成彩色人脸图像的压缩编码。
本发明提出的高压缩比人像解码方法,其流程如图2所示,对输入的彩色人脸图像的压缩码流进行算术解码,得到人肩对象形状信息符号流和背景图像区域符号流,并依次分别进行链解码和插值解码,得到人肩对象的形状信息和背景图像区域;对人肩对象的形状信息进行适形小波变换,得到小波域上的人肩对象形状信息;根据小波域上的人肩对象形状信息,对输入的彩色人脸图像的压缩码流进行算术解码,得到小波系数的嵌入式编码符号流,并进行基于对象的嵌入式解码,得到人肩对象小波系数即纹理信息;分别对小波域上的人肩对象形状信息和纹理信息进行适形小波逆变换,依次得到YUV空间三个分量上的彩色人肩对象的图像;对YUM空间的彩色人肩对象的图像进行颜色空间的反变换,获得RGB空间上的人肩对象重构图像;将人肩对象重构图像与背景图像区域叠加,获得重构的彩色人脸图像。
上述编码方法中,从人脸图像中获取人肩对象的形状信息的方法,包括如下步骤:
获取人肩对象的形状信息(如图3(五)所示)需要计算人脸图像中各点的边缘梯度向量 并由此得到边缘振幅图
Figure A20041004971300112
和边缘梯度方向图
l → ( x , y ) = { I ( x , y ) * ∂ G ( x , y ) ∂ x , I ( x , y ) * ∂ G ( x , y ) ∂ y }
| l → ( x , y ) | = ( I ( x , y ) * ∂ G ( x , y ) ∂ x ) 2 + ( I ( x , y ) * ∂ G ( x , y ) ∂ x ) 2
∠ l → ( x , y ) = arctg ( I ( x , y ) * ∂ G ( x , y ) ∂ y / I ( x , y ) * ∂ G ( x , y ) ∂ x )
上式中,I(x,y)为图像函数, G ( x , y ) = 1 2 π σ e x 2 + y 2 2 σ 2 , 其中的σ值为l~5,符号*为卷积;具体计算的时候,先用 ∂ G ( x , y ) ∂ x , ∂ G ( x , y ) ∂ y 生成两个图像模板,然后用模板和图像函数I(x,y)做卷积得到边缘梯度向量 取边缘梯度向量的振幅获得边缘振幅图
Figure A20041004971300122
根据上述图像函数I(x,y)的最大值,设定边缘振幅的门限值,将上述各点的计算边缘振幅与设定门限值进行比较,使边缘振幅二值化,得到边界为1,背景为0的二值图像。在该二值图像的左上角和右上角选取门限值为0的种子点,进行区域增长,获得连通的背景区域,其余区域则为人肩对象区域;最后在上述边缘振幅图中,根据上述人肩对象区域的边界,寻找边缘振幅的局部最大点,作为人肩对象的边界。边缘振幅的门限值通常缺省设为边缘振幅图 的最大值的1/10,这时所完成的人肩对象提取不需要人为干预,因此是全自动的人肩对象提取方法,该方法对于一般的人脸图像都能保证比较完全准确地提取人肩对象。在某些特殊情况下,对有些特殊的人像,缺省门限值并不能保证我们能够完全准确地提取人肩对象,这个时候,可以在程序中加入控件,使用者可以通过对控件的操作,协助计算机在缺省门限值附近的一个区间选择不同的门限值,计算机根据这个门限值进行人肩对象提取,并将提取结果动态的反馈给使用者。使用者通过计算机反馈的信息进行判断,如果分割准确,使用者就接受目前的提取结果,如果不准确,就操作控件选择下一个分割参数,继续提取。这种人肩对象提取方式,叫做交互式的人肩对象提取方法。如图9(a)所示,使用者可以通过移动游标到不同的位置,来选择不同的门限参数,达到对人肩对象进行交互式提取的目的。由于该提取方法中控制只在一维方向上变化,因此交互工作非常简单,分割提取准确。
一般地,整个人肩对象可以看成一个单一的对象;但是,有时为更好地利用小波变换进行有效编码,也可以根据不同部位的特点及其重要性差异,将其分成若干对象,如图3(b)给出了两个对象的情形。
上述编码方法中,对人肩对象的形状信息进行编码的方法,包括如下步骤:
首先对人肩对象的形状信息进行链码跟踪,得到如图4(a)所示的人肩区域的链码:D[0]、D[1]、…….D[i-1]、D[i]……D[n];其中n为链码长度,D为链码方向,分别可以在0、1、2……7共8个方向中的取值,如图4(b)所示。然后对于链码中的每个D[i],依次进行差分运算,得到人肩对象形状信息的编码符号流。最后对上述人肩对象形状信息的编码符号流进行算术编码,
形状信息的编解码主要利用了链码中相邻链码方向的相关性,通过差分预测,有效地降低信息量,提高压缩比。
上述编码方法中,对背景图像区域进行编码的方法有以下两种:
第一种为:直接计算背景区域的每一个图像点颜色平均值,对平均值进行算术编码,得到背景图像区域码流;
第二种为:在背景区域中取多个图像点(通常取为四个),计算每个图像点附近区域的背景图像颜色的平均值,对平均值进行算术编码,得到背景图像区域码流。
上述编码方法中的嵌入式编码的方法包括如下步骤:
如前所述,人脸图像经过人肩提取后所产生的对象可以是单对象(人肩对象),也可以多对象(由人肩对象分成的若干不同对象)。本发明的目的是对这些对象依次实现嵌入式编码。不同对象的编码方法完全相同;但是每个对象,可以根据需要分配不同的码长:具有重要视觉信息的对象分配更多的码长,反之分配较少的码长。
同一对象通过颜色空间转换具有YUV三个颜色分量,不同分量的编码方法相同,但是所分配的码长不同。通常,Y分量比较重要,分配码长较多,U、V分量相对次要,分配较少。一般U、V分量所分配的码长为Y分量的1/10。
一个对象的一个分量在经过适形小波变换以后,形成了小波域上的纹理信息和形状信息。纹理信息即小波系数,用C(r,c)表示,形状信息用M(r,c)表示;基于对象的嵌入式编码就是利用M(r,c)对小波系数C(r,c)进行嵌入式编码。所谓嵌入式编码,就是将信息按照重要性的顺序,依次编码。重要性的信息在前,不重要的信息在后。对于小波系数而言,重要性的判定原则是:1)高比特位比低比特位重要;2)振幅高的小波系数,比振幅低的小波系数重要;3)高层子带的小波系数比低层子带的小波系数重要。
本发明方法中的嵌入式编码过程如下:
1)按比特面由高到低依次编码,所谓比特面就是:所有系数所对应的相同比特位的值形成一个比特位面,
2)对同一个比特面,按照小波系数振幅大小的顺序,对相同比特位依次编码。小波系数按照振幅顺序由大到小排列就形成了重要性点列。反映在具体的编码过程中就是将每一个比特面编码分成两轮过程,第一轮过程是不断形成、更新重要性点列,并对点列中小波系数的位置进行编码,第二轮过程是进一步按顺序对重要性点列中小波系数的当前比特位进行编码。
3)在第一轮编码过程中,也就是重要性点列的形成过程中,按照高层子带到低层子带的顺序依次搜索所有小波系数,对小波系数的位置进行编码,并产生重要性点列。具体如图5所示,左上角为最高层子带,沿着箭头方向,即LL3,HL3,LH3,HH3,HL2,LH2,HH2,HL1,LH1,HH1的顺序,子带层数依次降低。
4)在对小波系数进行嵌入式编码时,充分利用了小波变换有大量零树的特点,达到最佳的编码效果,其中M(r,c)表示当前小波系数C(r,c)属于哪一个对象。图6给出了单对象和双对象时,M(r,c)时域取值以及经过适形小波变换后频域取值的形象表示。其中(a)是单对象形状信息的掩码表示,(b)是单对象形状信息在小波域上的掩码表示,(c)是多对象形状信息的掩码表示,(d)是多对象形状信息在小波域上的掩码表示,各图中黑色点的掩码为0,代表背景区域。不同的灰度掩码代表不同的对象。
利用小波系数的特点进行编码,需要引进下述概念:对于当前比特位面V,设定阈值T=2V
重要性点:若|C(r,c)|>=T,则该小波系数所对应的点(r,c)是重要性点;
非重要性点:若|C(r,c)|<T,则该小波系数所对应的点(r,c)是非重要性点;
子节点:(r,c)的子节点为(2r,2c),(2r+1,2c),(2r,2c+1),(2r+1,2c+1);
父节点:(2r,2c),(2r+1,2c),(2r,2c+1),(2r+1,2c+1)的父节点是(r,c);
后代节点:(r,c)的所有后代节点为:
            {(x,y),其中x∈[2nr,2nr+2n-1],y∈[2nc,2nc+2n-1],
                     n>0,并且(x,y)属于当前的对象}当(r,c)属于当前对象,可以将其分成下列几类符号:
正符号:若(r,c)是重要性点且C(r,c)>0;
负符号:若(r,c)是重要性点且C(r,c)<0;
零符号:若(r,c)是非重要性点,并且该点没有后代节点;
零树符号:若(r,c)是非重要性点,并且该点所有的后代节点都是非重要性点;
孤立零符号:如果该点所有的后代节点中存在节点为重要性点;当(r,c)不属于当前对象,可以将其分成下列几类符号:
非对象零树符号:若(r,c)不是当前对象,并且该点所有的属于当前对象的后
                代节点都是非重要性点;
非对象孤立零符号:若(r,c)不是当前对象,如果该点所有的属于当前对象的
                后代节点中存在节点为重要性点;
具体的编码过程如下:
(1)根据编码过程中所分配的固定码长,对所有人肩对象YUV三个分量依次进行解码;
(2)将上述每个分量所对应的小波系数,从高位的比特位面至低位的比特位面依次进行解码,具体过程为:
(a)设定小波系数域值T,T=2V,其中V为当前比特面,建立小波系数重要性点列;
(b)按照小波变换中的小波域子带的顺序LLn、HLn、LHn、HHn、HLn-1、LHn-1、HHn-1……、HL1、LH1、HH1,依次搜索小波变换域上与每个位置(r,c)相对应的小波系数C(r,c),以及相应的小波域的轮廓信息掩码M(r,c),其中(r,c)为小波域上各点的坐标,判断小波系数C(r,c)是否属于当前对象,若是,进一步判断该坐标(r,c)是否已处于重要性点列中,若处于重要性点列中,则结束该点的解码,若不处于重要性点列中,则分别对属于最高层LLn子带和最底层HL1、LH1、HH1子带的小波系数进行三符号上下文算术解码,对属于其它各层子带HLn-1、LHn-1、HHn-1、……、HL2、LH2、HH2的小波系数,进行四符号上下文算术解码;同时更新重要性点列,若小波系数C(r,c)不属于当前对象,则属于最高层LLn子带和最底层HL1、LH1、HH1子带的小波系数不用解码,对属于其它各层子带HLn-1、LHn-1、HHn-1、……、HL2、LH2、HH2的小波系数,进行二符号上下文算术解码;
(c)对于重要性点列的所有小波系数的当前比特位进行二符号上下文算术解码,并对重要性点列中的小波系数进行重排;
关于基于对象的嵌入式编码所涉及的两轮编码,更详细的流程图如图7所示。
上述解码方法中,对人肩对象信息进行解码的方法,包括如下步骤:
(1)对人肩对象的形状信息的压缩码流进行算术解码,得到人肩对象形状信息的编码符号流;
(2)对上述人肩对象形状信息的编码符号流进行差分解码,得到链码D[i];
(3)用轮廓填充法对链码进行轮廓填充,得到人肩对象的形状信息。
上述解码方法中,对背景图像区域进行解码的方法有两种:
针对第一种编码,直接算术解码得到一个颜色平均值,将该值直接赋给背景区域所有点上;
针对第二种编码,直接算术解码得到若干个颜色平均值,分别赋给背景区域的相同数量的点上,然后对于背景区域的其它点的象素值,利用双线性插值计算相应的颜色值(值得注意的是,每个点上的颜色值有三个颜色分量)。如图8中,背景区域中A,B,C,D点的颜色矢量已知,分别为IA,IB,IC和ID。对于背景区域中的任意点E,沿水平方向作一扫描线。针对下列情形分别对点E赋值:
1)如该扫描线与多边形的边不相交或者交于一点(图8(a)),则将距离该扫描线最短的点A的颜色矢量赋给E。
2)该水平线与多边形的边交于两点F,G.。如果所要求的背景区域中的任意点E位于多边形ABCD的内部(图8(b)),其颜色矢量IE可以按下列式子计算得到:
I F = l FC l BC I B + l BF l BC I C
I G = l GD l CD I C + l CG l CD I D
I E = l EG l FG I F + l FE l FG I G
其中lFC表示F、C两点之间的距离,其它类似。
如果所要求的背景区域中的任意点E位于多边形ABCD的外部(图8(c)),则其颜色矢量IE取为距离该点最近的相交点F的颜色矢量的值,其中F的颜色矢量同上面的计算公式。
上述解码方法中的嵌入式解码的方法包括如下步骤:
(1)根据编码过程中所分配的固定码长,对所有人肩对象YUV三个分量依次进行解码;
(2)将上述每个分量所对应的小波系数,从高位的比特位面至低位的比特位面依次进行解码,具体过程为:
(a)设定小波系数域值T,T=2v,其中V为当前比特面,建立小波系数重要性点列;
(b)按照小波变换中的小波域子带的顺序LLn、HLn、LHn、HHn、HLn-1、LHn-1、HHn-1……、HL1、LH1、HH1,依次搜索小波变换域上与每个位置(r,c)相对应的小波系数C(r,c),以及相应的小波域的轮廓信息掩码M(r,c),其中(r,c)为小波域上各点的坐标,判断小波系数C(r,c)是否属于当前对象,若是,进一步判断该坐标(r,c)是否已处于重要性点列中,若处于重要性点列中,则结束该点的解码,若不处于重要性点列中,则分别对属于最高层LLn子带和最底层HL1、LH1、HH1子带的小波系数进行三符号上下文算术解码,对属于其它各层子带HLn-1、LHn-1、HHN-1、……、HL2、LH2、HH2的小波系数,进行四符号上下文算术解码;同时更新重要性点列,若小波系数C(r,c)不属于当前对象,则属于最高层LLn子带和最底层HL1、LH1、HH1子带的小波系数不用解码,对属于其它各层子带HLn-1、LHn-1、HHn-1、……、HL2、LH2、HH2的小波系数,进行二符号上下文算术解码;
(c)对于重要性点列的所有小波系数的当前比特位进行二符号上下文算术解码,并对重要性点列中的小波系数进行重排;
(3)当解码的码流长度达到上述固定码长时,终止该对象的解码。
为了对本发明的实用效果有更形象的理解,图9中的(a)和(b)给出了交互式人肩对象提取过程,其中黑色标注了提取出的背景;而(c)则显示了对具体人脸图像的处理结果。其中图9(c)左图初始人脸彩色图像大小为644*788,占用的存储空间为644*788*3比特;利用本发明所描述的编码技术,将其压缩为存储空间为1000比特的文件;对于此压缩文件,利用本发明的解码过程进行恢复,其效果如图9(c)中右边图像。

Claims (11)

1、一种高压缩比人像编码方法,其特征在于该方法包括以下各步骤:
(1)从待压缩彩色人脸图像中获取人肩对象的形状信息和纹理信息;
(2)对上述人肩对象的形状信息进行链编码,得到人肩对象形状信息符号流,并进行算术编码;
(3)对上述待压缩彩色人脸图像中除人肩对象以外的背景区域进行插值编码,得到背景图像区域符号流,并进行算术编码;
(4)将上述待压缩彩色人脸图像从红绿兰即RGB空间变换到亮度色度色度即YUV空间,得到YUV空间上的人脸图像;
(5)根据上述第(1)步的人肩对象,分别对YUV三个分量上的人肩对象的形状信息和纹理信息进行适形小波变换,获得小波域上的人肩对象的纹理信息即小波系数以及小波域上的人肩对象的形状信息;
(6)对上述人肩对象小波系数和小波域上的人肩对象形状信息进行基于对象的嵌入式编码,得到小波系数的嵌入式编码符号流,并进行算术编码,完成彩色人脸图像的压缩。
2、一种高压缩比人像解码方法,其特征在于该方法包括以下各步骤:
(1)对输入的彩色人脸图像的压缩码流进行算术解码,得到人肩对象形状信息符号流和背景图像区域符号流,并依次分别进行链解码和插值解码,得到人肩对象的形状信息和背景图像区域;
(2)对上述人肩对象的形状信息进行适形小波变换,得到小波域上的人肩对象形状信息;
(3)根据上述小波域上的人肩对象形状信息,对输入的彩色人脸图像的压缩码流进行算术解码,得到小波系数的嵌入式编码符号流,并进行基于对象的嵌入式解码,得到小波系数,即小波域上的人肩对象纹理信息;
(4)分别对上述小波域上的人肩对象形状信息和纹理信息进行适形小波逆变换,依次得到YUV空间三个分量上的彩色人肩对象的图像;
(5)对上述YUV空间的彩色人肩对象的图像进行颜色空间的反变换,获得RGB空间上的人肩对象重构图像;
(6)将上述人肩对象重构图像与背景图像区域叠加,获得重构的彩色人脸图像。
3、如权利要求1所述的方法,其特征在于其中从人脸图像中获取人肩对象的形状信息的方法,包括如下步骤:
(1)计算人脸图像中各点的边缘梯度向量
Figure A2004100497130002C1
l → ( x , y ) = { I ( x , y ) * ∂ G ( x , y ) ∂ x , I ( x , y ) * ∂ G ( x , y ) ∂ y }
并由此得到边缘振幅:
| l → ( x , y ) | = ( I ( x , y ) * ∂ G ( x , y ) ∂ x ) 2 + ( I ( x , y ) * ∂ G ( x , y ) ∂ x ) 2 ;
和边缘梯度方向:
∠ l → ( x , y ) = arctg ( I ( x , y ) * ∂ G ( x , y ) ∂ y / I ( x , y ) * ∂ G ( x , y ) ∂ x ) ;
其中,I(x,y)为图像函数, G ( x , y ) = 1 2 π σ e x 2 + y 2 2 σ 2 , 其中的σ值为1~5,符号*为卷积;
(2)根据图像灰度,设定边缘振幅的门限值,将上述各点的边缘振幅与设定门限值进行比较,使边缘振幅二值化,得到边界为1,背景为0的图像;
(3)在上述图像的左上角和右上角选取门限值为0的种子点,进行区域增长,获得连通的背景区域,其余区域则为人肩对象区域;
(4)在上述边缘振幅图中,根据上述人肩对象区域的边界,沿边缘梯度方向寻找边缘振幅的局部最大点,作为人肩对象的边界。
4、如权利要求1所述的方法,其特征在于其中对人肩对象的形状信息进行编码的方法,包括如下步骤:
(1)对人肩对象的形状信息进行链码跟踪,得到表示人肩区域的链码,该链码为:D[0]、D[1]、…….D[i-1]、D[i]……D[n],其中的n为链码长度,D为链码方向,分别为0、1、2……7,共8个方向;
(2)对链码中每个D[i],依次进行差分运算,得到人肩对象形状信息的编码符号流:
(3)对上述人肩对象形状信息的编码符号流进行算术编码。
5、如权利要求1所述的方法,其特征在于其中对背景图像区域进行编码的方法为:在背景区域中取多个图像点,计算每个图像点附近区域的背景图像颜色的平均值,对平均值进行算术编码,得到背景图像区域码流。
6、如权利要求1所述的方法,其特征在于,所述的嵌入式编码的方法包括如下步骤:
(1)将人肩对象分成YUV三个分量,进行编码,并根据图像压缩要求分配给每个颜色分量一个固定码长;
(2)将上述每个分量所对应的小波系数,按照其振幅高低分成多个比特位面,从高位的比特位面至低位的比特位面依次进行编码;
(3)输出码流,当码流长度达到上述固定码长时,终止该对象的编码。
7、如权利要求6所述的方法,其特征在于其中对每个分量所对应的小波系数进行编码的方法,包括如下步骤:
(1)设小波系数的域值为T,T=2V,其中V为当前比特面,建立小波系数重要性点列;
(2)按照小波变换中的小波域子带的顺序LLn、HLn、LHn、HHn、HLn-1、LHn-1、HHn-1……、HL1、LH1、HH1,依次搜索小波变换域上与每个位置(r,c)相对应的小波系数C(r,c)以及相应的小波域的形状信息掩码M(r,c),(r,c)为小波域上各点的坐标,判断小波系数C(r,c)是否属于当前对象,若是,进一步判断该坐标(r,c)是否已处于重要性点列中,若处于重要性点列中,则结束该点的编码,若不处于重要性点列中,则分别对属于最高层LLn子带和最底层HL1、LH1、HH1子带的小波系数进行三符号上下文算术编码,对属于其它各层子带HLn-1、LHn-1、HHn-1、……、HL2、LH2、HH2的小波系数,进行四符号上下文算术编码;同时更新重要性点列,若小波系数C(r,c)不属于当前对象,则最高层LLn子带和最底层HL1、LH1、HH1子带的小波系数不用编码,对其它各层子带HLn-1、LHn-1、HHn-1、……、HL2、LH2、HH2的小波系数,进行二符号上下文算术编码;
(3)对于重要性点列的所有小波系数的当前比特位进行二符号上下文算术编码,并对重要性点列中的小波系数进行重排。
8、如权利要求2所述的方法,其特征在于其中对人肩对象信息进行解码的方法,包括如下步骤:
(1)对人肩对象的形状信息的压缩码流进行算术解码,得到人肩对象形状信息的编码符号流;
(2)对上述人肩对象形状信息的编码符号流进行差分解码,得到链码D[i];
(3)用轮廓填充法对链码进行轮廓填充,得到人肩对象的形状信息。
9、如权利要求2所述的方法,其特征在于其中对背景图像区域进行解码的方法为:对背景图像区域码流进行算术解码,得到多个图像点附近区域的背景图像颜色的平均值,对多个平均值进行双线性插值,获得整个背景图像区域。
10、如权利要求2所述的方法,其特征在于所述的嵌入式解码的方法包括如下步骤:
(1)根据编码过程中所分配的固定码长,对所有人肩对象YUV三个分量依次进行解码;
(2)将上述每个分量所对应的小波系数,从高位的比特位面至低位的比特位面依次进行解码;
(3)当解码的码流长度达到上述固定码长时,终止该对象的解码。
11、如权利要求10所述的方法,其特征在于其中对对象的每个分量所对应的小波系数进行解码的方法,包括如下步骤:
(1)设定小波系数域值T,T=2V,其中V为当前比特面,建立小波系数重要性点列;
(2)按照小波变换中的小波域子带的顺序LLn、HLn、LHn、HHn、HLn-1、LHn-1、HHn-1……、HL1、LH1、HH1,依次搜索小波变换域上与每个位置(r,c)相对应的小波系数C(r,c),以及相应的小波域的轮廓信息掩码M(r,c),其中(r,c)为小波域上各点的坐标,判断小波系数C(r,c)是否属于当前对象,若是,进一步判断该坐标(r,c)是否已处于重要性点列中,若处于重要性点列中,则结束该点的解码,若不处于重要性点列中,则分别对属于最高层LLn子带和最底层HL1、LH1、HH1子带的小波系数进行三符号上下文算术解码,对属于其它各层子带HLn-1、LHn-1、HHn-1、……、HL2、LH2、HH2的小波系数,进行四符号上下文算术解码;同时更新重要性点列,若小波系数C(r,c)不属于当前对象,则属于最高层LLn子带和最底层HL1、LH1、HH1子带的小波系数不用解码,对属于其它各层子带HLn-1、LHn-1、HHn-1、……、HL2、LH2、HH2的小波系数,进行二符号上下文算术解码;
(3)对于重要性点列的所有小波系数的当前比特位进行二符号上下文算术解码,并对重要性点列中的小波系数进行重排。
CN 200410049713 2004-06-25 2004-06-25 一种高压缩比人像编解码方法 Expired - Fee Related CN1265323C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 200410049713 CN1265323C (zh) 2004-06-25 2004-06-25 一种高压缩比人像编解码方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 200410049713 CN1265323C (zh) 2004-06-25 2004-06-25 一种高压缩比人像编解码方法

Publications (2)

Publication Number Publication Date
CN1595454A true CN1595454A (zh) 2005-03-16
CN1265323C CN1265323C (zh) 2006-07-19

Family

ID=34665809

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200410049713 Expired - Fee Related CN1265323C (zh) 2004-06-25 2004-06-25 一种高压缩比人像编解码方法

Country Status (1)

Country Link
CN (1) CN1265323C (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008141581A1 (fr) * 2007-05-17 2008-11-27 Spreadtrum Communications (Shanghai) Co., Ltd. Procédé pour détecter et corriger automatiquement des yeux rouges lors de la prise de photos
CN101505430B (zh) * 2008-09-18 2011-05-11 西南交通大学 一种用于头肩视频序列的帧内更新方法
CN102438134A (zh) * 2011-11-22 2012-05-02 苏州科雷芯电子科技有限公司 一种基于视觉中心原理的视频传输装置及其传输方法
CN102457722A (zh) * 2010-10-26 2012-05-16 珠海全志科技股份有限公司 Bayer图像的处理方法及装置
CN102014285B (zh) * 2009-11-10 2012-10-03 钰创科技股份有限公司 多次dpcm讯号编码装置及方法
CN107396126A (zh) * 2011-11-07 2017-11-24 杜比国际公司 用于编码和解码图像的方法、编码和解码设备、以及相应的计算机程序
US10681389B2 (en) 2011-11-07 2020-06-09 Dolby International Ab Method of coding and decoding images, coding and decoding device and computer programs corresponding thereto

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008141581A1 (fr) * 2007-05-17 2008-11-27 Spreadtrum Communications (Shanghai) Co., Ltd. Procédé pour détecter et corriger automatiquement des yeux rouges lors de la prise de photos
US8311325B2 (en) 2007-05-17 2012-11-13 Spreadtrum Communications (Shanghai) Co., Ltd. Method of detecting and rectifying red-eyes automatically when taking photos
CN101505430B (zh) * 2008-09-18 2011-05-11 西南交通大学 一种用于头肩视频序列的帧内更新方法
CN102014285B (zh) * 2009-11-10 2012-10-03 钰创科技股份有限公司 多次dpcm讯号编码装置及方法
CN102457722B (zh) * 2010-10-26 2014-01-22 珠海全志科技股份有限公司 Bayer图像的处理方法及装置
CN102457722A (zh) * 2010-10-26 2012-05-16 珠海全志科技股份有限公司 Bayer图像的处理方法及装置
CN107396126A (zh) * 2011-11-07 2017-11-24 杜比国际公司 用于编码和解码图像的方法、编码和解码设备、以及相应的计算机程序
CN107396126B (zh) * 2011-11-07 2020-01-07 杜比国际公司 用于编码和解码图像的方法、编码和解码设备、以及相应的计算机程序
US10681389B2 (en) 2011-11-07 2020-06-09 Dolby International Ab Method of coding and decoding images, coding and decoding device and computer programs corresponding thereto
US10701386B2 (en) 2011-11-07 2020-06-30 Dolby International Ab Method of coding and decoding images, coding and decoding device and computer programs corresponding thereto
US11109072B2 (en) 2011-11-07 2021-08-31 Dolby International Ab Method of coding and decoding images, coding and decoding device and computer programs corresponding thereto
US11277630B2 (en) 2011-11-07 2022-03-15 Dolby International Ab Method of coding and decoding images, coding and decoding device and computer programs corresponding thereto
US11889098B2 (en) 2011-11-07 2024-01-30 Dolby International Ab Method of coding and decoding images, coding and decoding device and computer programs corresponding thereto
US11943485B2 (en) 2011-11-07 2024-03-26 Dolby International Ab Method of coding and decoding images, coding and decoding device and computer programs corresponding thereto
CN102438134B (zh) * 2011-11-22 2013-10-23 苏州科雷芯电子科技有限公司 一种基于视觉中心原理的视频传输装置及其传输方法
CN102438134A (zh) * 2011-11-22 2012-05-02 苏州科雷芯电子科技有限公司 一种基于视觉中心原理的视频传输装置及其传输方法

Also Published As

Publication number Publication date
CN1265323C (zh) 2006-07-19

Similar Documents

Publication Publication Date Title
CN1620804A (zh) 用于压缩复合文档的编码器匹配层分离
CN104796707B (zh) 对残差块解码的设备
CN1303820C (zh) 基于质量的图像压缩
CN1148969C (zh) 图像编码装置和图像解码装置
CN1437408A (zh) 考虑人类视觉特征的图像编码和解码方法及装置
CN1383684A (zh) 彩色视频编码与解码方法
CN1329440A (zh) 静画和动画编码的量化矩阵
CN1219079A (zh) 用于数字数据压缩的方法
CN1265323C (zh) 一种高压缩比人像编解码方法
CN1764231A (zh) 对输入图像进行色彩校正的设备和方法
CN1246242A (zh) 用于从压缩图像数据恢复高频成分的改进的估算器
CN1381142A (zh) 用于视频序列压缩的编码方法
CN101969567A (zh) 基于全变分的图像编码方法
CN1921627A (zh) 视频数据压缩编码方法
CN1155258C (zh) 二进制图象的内插方法
CN103856776B (zh) 边界和曲率驱动修复的图像编码和解码方法
CN1930890A (zh) 用于可缩放视频编码和解码的方法和设备
CN1784008A (zh) 高清晰视频超强压缩编码方法及解码方法
CN1914926A (zh) 运动图像编码方法和设备以及运动图像解码方法和设备
CN100341331C (zh) 基于区域的规模可变的图像编码
CN1777038A (zh) 一种二维矢量数据的压缩方法
CN1247002A (zh) 一个数字化图象编码和解码的方法和装置
CN1294522C (zh) 用于多标度零树熵编码的设备和方法
CN1957596A (zh) 可扩缩编码方法和装置、可扩缩解码方法和装置
CN1809166A (zh) 图像编码和解码装置及其方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C56 Change in the name or address of the patentee
CP02 Change in the address of a patent holder

Address after: 100081 Beijing Institute of Technology, unit 5, No. 100

Patentee after: Yan Yusong

Address before: 100871 Beijing city Haidian District Peking University Yan Dong Yuan 7 a room 412

Patentee before: Yan Yusong

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20060719

Termination date: 20140625

EXPY Termination of patent right or utility model