CN102637302B - 一种图像编码方法 - Google Patents
一种图像编码方法 Download PDFInfo
- Publication number
- CN102637302B CN102637302B CN 201110326343 CN201110326343A CN102637302B CN 102637302 B CN102637302 B CN 102637302B CN 201110326343 CN201110326343 CN 201110326343 CN 201110326343 A CN201110326343 A CN 201110326343A CN 102637302 B CN102637302 B CN 102637302B
- Authority
- CN
- China
- Prior art keywords
- interest
- area
- snout
- list item
- coefficient
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 98
- 239000011159 matrix material Substances 0.000 claims abstract description 18
- 230000009466 transformation Effects 0.000 claims abstract description 16
- 238000012545 processing Methods 0.000 claims abstract description 6
- 210000004894 snout Anatomy 0.000 claims description 29
- 238000006243 chemical reaction Methods 0.000 claims description 11
- 238000000354 decomposition reaction Methods 0.000 claims description 11
- 238000013519 translation Methods 0.000 claims description 9
- 230000006835 compression Effects 0.000 abstract description 32
- 238000007906 compression Methods 0.000 abstract description 32
- 238000013139 quantization Methods 0.000 abstract description 6
- 230000015572 biosynthetic process Effects 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 238000002474 experimental method Methods 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 230000014616 translation Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 230000000007 visual effect Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000000750 progressive effect Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000001788 irregular Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 230000009975 flexible effect Effects 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 238000005184 irreversible process Methods 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
Abstract
本发明提出一种图像编码方法,应用于计算机图像处理领域。该方法首先通过标定图片中的感兴趣区域,对原图像进行小波变换,在小波系数矩阵中找到感兴趣区域像素在变换后对应的小波系数,然后对背景区域和感兴趣区域采用不同的量化标准进行量化,使感兴趣区域的系数处于更高的位平面上,最近对小波系数矩阵进行阈值量化,采用基于SPIHT方法进行编码。本发明方法既保证了高压缩率,又可以保证用户感兴趣区域的显示质量,在速率比较低的无线网传输或浏览图片时,能够是用户很快得知图像中最重要的信息。
Description
技术领域
本发明属于计算机图像处理领域,提出了一种图像编码方法。
背景技术
数字图像处理过程中经常要产生包含图像数据的大型文件,而这些文件经常需要在用户和系统之间相互交换,这就要有一种有效的方法来存储和传递这些数字图像文件。因此,图像编解码的主要目的是在保证图像质量的同时,尽可能的减少图像占用的空间,从而方便存储或网络传输。
具体来说,图像压缩(编码)可以分为无损压缩和有损压缩。无损压缩一般采用基于统计的方法,如哈夫曼编码等,它可以完整的重构原始图像,但是压缩率较低,往往不能达到人们的要求。有损压缩不能完整的重构原始图像,但它可以提供很高的压缩比率,而且能很好的保证图像的主观质量。它主要是利用了人的心理视觉冗余特性。研究表明,人眼感觉到的区域亮度不仅仅取决于该区域的反射光,还取决于其他一些因素。例如,在亮度不变的区域中同样可以感觉到亮度的变化(马赫带)。产生这种现象的原因是出于眼睛所有视觉信息感受到的灵敏度不同。在正常的视觉处理过程中各种信息的相对重要程度不同。那些不十分重要的信息称作心理视觉冗余。这些心理视觉冗余在不会削弱图像感知质量的情况下可以消除。变换编码是一种比较常见的有损编码方式,其中最重要也应用最广的是小波变换。所述的小波变换不直接在图像的空间域对图像进行处理,而是首先将该图像变换到频率域,利用高频系数和原始图像细节信息的对应关系,可以对不太重要的系数进行量化,这也是实现高压缩比的基本原理。
有损压缩方法都会导致一定数量的视觉信息的丢失,可能会因此失去重要的信息,所以迫切需要一种可重复或可再生的对于丢失信息的性质和范围定量的方法。作为这种评估基础的两类准则分别是客观准则和主观准则,客观准则用恢复图像与原始图像的均方根误差来表示,而主观准则则是靠人主观判定恢复图像与原始图像的差别大小。传统的有损压缩方法没有考虑图像内容,如JPEG2000是一种通用的压缩方法,对图像的内容不进行分析,在实现高压缩比的情况下可能会丢失重要的视觉信息。
在压缩率较高的情况下,图像的内容失真会很严重,这样用户就无法分辨图像的内容究竟是什么,这也是传统通用压缩方法都有的一个缺点。但如果把一部分相对不重要的背景系数所占的空间用来更好的记录感兴趣区域的系数,用户在整体压缩率很高的情况下依然能分辨出图像中最重要的区域,这也是本发明的出发点。
发明内容
本发明针对传统SPIHT方法没有考虑图像内容的局限性,对其进行了改进,提出了一种支持感兴趣区域编码的图像编码方法。
本发明的图像编码方法,具体包括以下步骤:
步骤1:标定图片中的感兴趣区域,可以人工标记,也可以通过一些自动检测方法,如人脸识别Adaboost算法。
步骤2:对原图像进行小波变换,得到小波系数矩阵。
步骤3:计算感兴趣区域掩码,即找到感兴趣区域像素在变换后对应的小波系数。
步骤4:对背景区域和感兴趣区域采用不同的量化标准进行量化,具体是通过对背景区域的系数进行右移位操作实现,使的感兴趣区域的系数处于更高的位平面上。
步骤5:采用阈值法对小波系数矩阵进行量化。
步骤6:对量化后的小波系数矩阵用改进的SPIHT方法进行编码。
本发明的优点和积极效果在于:
(1)在本发明方法中加入了图像内容分析的步骤,具体是计算感兴趣区域掩码、设置不同的量化机制,使得对用户感兴趣的区域和背景区域达到不一样的压缩效果,既保证了高压缩率,又可以保证用户感兴趣区域的显示质量。
(2)本发明方法中最终产生的编码位流自动按重要性进行排列,从区域性的角度看,感兴趣区域的码流在前面,背景区域的码流相对靠后。从整体位流来看,由于本发明方法是按照位平面进行编码,前面的码流代表较高的系数平面,后面的代表相对较低的系数平面,这样,码流按照系数的重要程度进行排序。此外,由于本发明方法从SPIHT继承来的渐进传输型,用户可以在任意点截断编码位流,在速率比较低的无线网传输或浏览图片时,这种方法会有很大的优势,因为最先解码的是图像中最重要的信息,这样用户可以很快得知整幅图像的内容,以决定是否需要继续图片的传输过程。
(3)可以灵活控制感兴趣区域和背景区域的质量比,使显示质量和压缩比都能达到一种比较好的平衡,满足各种用户的需求。
附图说明
图1为本发明的图像编码方法的整体步骤流程图;
图2为本发明步骤六的流程图;
图3为SPIHT方法中的空间树结构;
图4为示例图片一及其采用Adaboost方法进行自动人脸识别检测的结果;
图5为示例图片二及其采用Adaboost方法进行自动人脸识别检测的结果;
图6为示例图片三及其采用Adaboost方法进行自动人脸识别检测的结果;
图7为示例图片四及其采用Adaboost方法进行自动人脸识别检测的结果;
图8为示例图片一在压缩率分别为0.4bpp和0.6bpp下的SPIHT和MSP重构结果;
图9为示例图片二在压缩率分别为0.4bpp和0.6bpp下的SPIHT和MSP重构结果;
图10为示例图片三在压缩率分别为0.4bpp和0.6bpp下的SPIHT和MSP重构结果;
图11为示例图片四在压缩率分别为0.4bpp和0.6bpp下的SPIHT和MSP重构结果;
图12为示例图片一在不同压缩比下本发明方法与传统SPIHT的PSNR值对比图;
图13为示例图片二在不同压缩比下本发明方法与传统SPIHT的PSNR值对比图;
图14为示例图片三在不同压缩比下本发明方法与传统SPIHT的PSNR值对比图;
图15为示例图片四在不同压缩比下本发明方法与传统SPIHT的PSNR值对比图;
图16为像素坐标(r,c)存在的9种状态的示意图。
具体实施方式
下面将结合附图和实例对本发明作进一步的详细说明。
本发明提出的图像编码方法考虑了图像内容,并具有高压缩比,较好地显示质量以及渐进传输特性,这使得本发明方法能够适用于多种场合,尤其是随着智能手机的普及和移动互联网的不断发展,越来越多的家庭照片在不同的人之间分享和传递,而由于无线网络速度的限制,又必须要求图像具有高压缩比,但这样可能会影响图片的显示质量,给用户造成不好影响。如果采用本发明的方法,在保证高压缩比的同时,也能兼顾用户感兴趣区域的显示质量,可以比较好地解决这个问题。
本发明中的图像编码方法基于小波变换,对变换后的系数进行编码,并在其中加入了人脸识别的技术手段,达到用户感兴趣区域和背景区域区别对待的效果,如图1所示,本发明图像编码方法具体实现步骤如下:
步骤1:标定图片中的感兴趣区域,可以人工标记,也可以通过一些自动检测方法,如以人脸区域作为感兴趣区域的图片可以用成熟的人脸识别方法进行自动检测,省去了人工标记的低效率操作。本发明实施例中采用现有技术中的Adaboost方法进行自动人脸识别,输入一张包含人脸的图片,输出人脸区域坐标,如图4-图7所示,为采用Adaboost方法进行自动人脸识别检测的结果,实验表明,采用的Adaboost方法识别率非常高,并且识别速度很快。
步骤2:对原图像进行小波变换,得到小波系数矩阵。小波变换是继傅立叶(Fourier)变换后又一有效的视频分析方法,与Fourier变换相比,小波变换是一个时间和频域的局域变换,因而能有效地从信号中提取信息,通过伸缩和平移等运算功能对函数或信号进行多尺度细化分析(Multiscale Analysis),解决了Fourier变换不能解决的许多困难问题(参考文献:IngridDaubechies,Ten Lectures on Wavelets,Society for industrial and Applied Mathematics,1992,ISBN 0-89871-274-2)。对图像进行小波变换,可以将图像的高频系数信息和低频系数信息分离开来,由于低频系数代表图像中的大部分内容信息,相对比较重要,而高频系数代表的是一些细节信息,相对不太重要,这样就可以用很少的码流来记录高频系数信息,从而实现图像的压缩。
步骤3:确定感兴趣区域掩码,即找到感兴趣区域像素在变换后对应的小波系数。
原则上,感兴趣区域可以是任意形状,根据原图像中的感兴趣区域轮廓,每一层小波变换后都能对应计算出原始感兴趣区域轮廓在经过小波变换得到的子图中对应的区域轮廓。但对于不规则的区域,需要记录感兴趣区域的完整轮廓信息,影响整体的压缩效率。所以,本发明采用规则的矩形区域作为感兴趣区域,如果感兴趣区域形状不是标准矩形,则将该区域扩大,选取包含该区域的一个外接矩形作为感兴趣区域。如图4-图7所示,实验部分以人脸作为感兴趣区域,虽然人脸的形状是不规则的,但可以选取一个矩形区域,使人脸区域包含在其中。
小波变换将图像分为四个频带的子图,分别包括低频信息、水平细节信息、垂直细节信息和对角线细节信息,虽然每一个子图都包含原图不同频域的信息,但从空间域看来,每一个子图都是原图的一个缩略图,这也为感兴趣区域掩码的计算提供了可能性。如图3所示,一幅图像经过n级小波分解后形成了3n+1个子带,小波系数的分布特点是越往低频子带系数值越大,包含的图像信息越多,而越往高频子带系数值越小,包含的信息也越少。用LL(n)代表n层小波分解的低频子图,HL(1),HL(2),…HL(n)代表水平方向子图,LH(1),LH(2),…LH(n)代表垂直方向子图,HH(1),HH(2),…HH(n)代表对角方向子图。为了计算感兴趣区域掩码,需要找到感兴趣区域在各层子图中对应的区域,本发明实施例以矩形区域为例说明感兴趣区域掩码的确定,也可以将其扩展为圆形,椭圆,多边形等规则形状,根据图形结构对应计算其对应坐标即可。
为记录矩形感兴趣区域,需要首先确定其在原图中的左上角点坐标(x,y)以及宽width和高height,只需记录4个值,相对于图像的大小可以忽略不计,因此不会影响到图像的压缩率。图像经过小波分解后,被分成很多不同分辨率的子图像,利用矩形的性质可以计算出感兴趣区域对应的小波系数区域,下面分别讨论在各级子图中确立感兴趣区域的计算公式。
在n层小波分解的低频子图LL(n)中,子图相当于原始图像n次抽样后的结果,其对应感兴趣区域的左上角点坐标及宽和高分别记为nLLx,nLLy,nLLWidth,nLLHeight,其他区域类似,由小波变换次数n可得:
HL(n)子图代表水平方向的子图,在HL(n)子图中对应感兴趣区域的左上角点坐标为nHLx,nHLy,宽为nHLWidth,高为nHLHeight,HL(n)子图相对于LL(n)向右平移了nLLWidth个像素,因此HL(n)中感兴趣区域的计算公式如下:
再根据HL(n),HL(n-1)……HL(1)之间的相似性,可以求得其他各层HL子图的感兴趣区域。公式中,n代表小波变换的层数,将当前子图的层次数代替n即可求得其他各层的感兴趣区域。
同理,LH(n)子图相对于LL(n)向下平移了nLLHeight个像素,可求得LH(n)子图中感兴趣区域所对应的左上角点坐标nLHx,nLHy,宽nLHWidth和高nLHHeight,计算公式如下:
HH(n)子图相对于LL(n)向右平移了nLLWidth个像素,向下平移了nLLHeight个像素,可得到HH(n)子图中感兴趣区域所对应的左上角点坐标nHHx,nHHy,宽nHHWidth和高nHHHeight,计算公式如下:
根据以上公式计算感兴趣区域在变换后的小波系数子区域中对应的系数区域,进一步可求得图像整体的感兴趣区域掩码,为后面的感兴趣区域编码提前提条件。
步骤4:由于本发明方法按照位平面进行编码,为保证感兴趣区域的显示质量,对背景区域和感兴趣区域采用不同的量化标准进行量化,使感兴趣区域的系数处于更高的位平面上。为达到这个目的,本发明既可以对感兴趣区域的系数进行左移位操作,也可以对背景区域的系数进行右移位操作,但考虑到感兴趣区域的系数更为重要,本发明采用的量化机制是后者,因为对感兴趣区域系数进行左移位造成溢出的情况下,对应小波系数的变化非常大,严重影响解码后图像的显示质量;而对背景区域进行右移位造成溢出的情况下,对应小波系数的变化非常小,再加上该系数对应的是不太重要的背景区域,对解码后的图片显示质量影响非常小。
步骤5:对小波系数矩阵进行量化。量化采用简单的阈值法,即选定阈值,把绝对值小于阈值的系数量化为0。由于量化是一个不可逆的过程,阈值的选择直接影响最后图像的显示效果,本发明优选采用的阈值为20。
步骤6:用改进的SPIHT方法进行编码。
SPIHT方法是一种十分有效率的图像编码方法,它采用一种空间方向树的数据结构来表示图像的小波分解系数,如图3所示,(r,c)表示图像中第r行第c列的单个像素的位置,在小波系数矩阵中的坐标位置(r,c)上对应得到该像素的小波系数值,空间方向树中的节点用其在原图中的坐标位置(r,c)表示。定义了四种集合,O(r,c)代表节点(r,c)所有的孩子集合,O(r,c)={(2*r-1,2*c-1),(2*r-1,2*c),(2*r,2*c-1),(2*r,2*c)},D(r,c)代表节点(r,c)所有的子孙的集合,包括孩子,而L(r,c)代表所有非直系子孙的集合,即不包括孩子,显然,L(r,c)=D(r,c)-O(r,c),H代表所有树根的坐标集。对于n级小波分解,H就是LL(n)、HL(n)、LH(n)和HH(n)中所有系数的坐标构成的集合。另外,定义了一个函数Sn(X),X代表包含一些元素的集合,定义如下,若Max{|Cr,c|}>=2n,则函数Sn(X)的输出SnOut(X)=1,否则,SnOut(X)=0。这个函数用来计算某个集合中是否有元素的值大于2n,若有则函数值为1,否则为0。其中,Cr,c代表小波系数矩阵中坐标位置为(r,c)的小波系数值,|Cr,c|代表对Cr,c求绝对值,n代表当前的位平面,2n就是当前阈值,若某系数集X存在元素大于这个阈值,就称该集合相对于当前阈值是重要的,否则称其相对于当前阈值是不重要的。
SPIHT方法引入了三个有序链表来存放重要信息,第一个是重要系数表LSP,第二个是不重要系数表LIP,第三个是不重要子集表LIS,这三个表中,每个表项都使用坐标(r,c)来表示。在LIP和LSP中,坐标(r,c)表示单个小波系数;而LIS中,坐标(r,c)代表两种系数集,即D(r,c)和L(r,c)。
针对链表存储元素时需要浪费额外的空间来存储指针,且不支持随机访问的缺点,本发明提出了一种顺序的存储结构来代替链表进行存储。针对原SPIHT方法中的LIS,LIP和LSP三个链表,本发明对应的给出了一种顺序二维表结构,大小与原图像的大小相同。本发明步骤六中同原SPIHT方法中对集合的划分法,O(r,c)表示(r,c)所有孩子的集合,D(r,c)表示所有子孙集合,L(r,c)表示所有非直系子孙集合(即D(r,c)-O(r,c))。在编码运行过程中,只有L(r,c)和D(r,c)两种集合出现。分析原SPIHT方法,若(r,c)表示单个元素,则它或者在表LSP中,或者在表LIP中,或者两者均不在,若(r,c)表示不重要系数集合,则它或者代表O(r,c),或者代表D(r,c),也可能是空集。因此针对当前阈值,每个像素坐标(r,c)最多存在以下3*3=9种可能的状态,用不同的值来表示,如图16所示,每一行代表一种可能的状态,四列表项代表可能满足的条件,若对应的表格中数字为1,表示该行状态满足该列的条件,若表格中数字为0,代表不满足该条件。例如,状态3代表(r,c)在表LIP中,且D(r,c)和L(r,c)均不在表LIS中。
本步骤具体编码过程如下:
步骤6.1:初始化过程。初始化表LSP为空,将集合H中的所有元素添加到表LIP中,并将属于H集合且有后代的元素添加到表LIS中,且均为D类型。然后,按下述公式(9)确定n,初始阈值为2n:
步骤6.2:排序扫描:
步骤6.2.1:扫描表LIP的队列,对LIP队列中的每个表项(r,c),得到一个Sn(r,c)的输出SnOut(r,c),如果SnOut(r,c)=1,说明当前元素值相对于当前阈值是重要的,则向排序位流Sn输出1和小波系数矩阵中位置坐标为(r,c)的系数的符号位,0表示正,1表示负;如果SnOut(r,c)=0,则向排序位流Sn输出0。
步骤6.2.2:扫描表LIS的队列,对于LIS队列中的每个表项(r,c),进行下面判断:
A、如果(r,c)是D型表项,输出SnOut(D(r,c)),如果SnOut(D(r,c))=1,则向排序位流Sn输出1,并对(r,c)的每个孩子(rO,cO),计算SnOut(rO,cO),如果SnOut(rO,cO)=1,则向排序位流Sn输出1和小波系数矩阵坐标为(rO,cO)的系数的符号位,并将(rO,cO)添加到LSP队列的尾部,如果SnOut(rO,cO)=0,则向排序位流Sn输出0,将(rO,cO)添加到LIP队列的尾部;
然后判断L(r,c)是否为空集,如L(r,c)为非空集,则将(r,c)作为L型表项添加到表LIS队列的尾部,如果L(r,c)为空集,则将D型表项(r,c)从表LIS的队列中删除。
如果SnOut(D(r,c))=0,则向排序位流Sn输出0。
B、如果(r,c)是L型表项,输出SnOut(L(r,c)):
如果SnOut(L(r,c))=1,则向排序位流Sn输出1,然后将(r,c)的4个孩子(rO,cO)作为D型表项依次添加到LIS的尾部,将L型表项(r,c)从表LIS中删除;
如果SnOut(L(r,c))=0,则向排序位流Sn输出0。
步骤6.3:精细扫描:将上一级扫描后的表LSP记为LSP_Old,对于LSP_Old中的每一个元素(r,c),将系数Cr,c的绝对值转换为二进制表示Br,c;输出Br,c中第N个最重要的位,即对应于2n权位处的符号1或0,到精细位流Rn。
步骤6.4更新阈值系数:将阈值指数n减去1,判断得到的阈值指数n是否等于要求的精度值,若是,结束本方法,若否,返回步骤6.2继续下一级编码扫描。
通过上述步骤图片编码成功,解码方法即是上述过程的一个逆过程。
发明图像编码方法又称为MSP(Modifed-SPIHT)方法。该方法既保持了SPIHT的高压缩率,又能对图像中的感兴趣区域和背景区域区别对待,优先保证感兴趣区域的编码质量,在图像的压缩率和图像质量之间达到了一种较好的权衡。下面将结合附图说明本发明的实际执行效果,将本发明方法在matlab下实现。实验中,感兴趣的人脸区域系数保持不变,背景区域系数则进行右移两位处理,感兴趣区域的量化系数定为10,背景区域的量化系数定为120,实验分别用本发明方法对图4-图7所示的四幅图像进行了编解码处理,并和传统的SPIHT编码方法进行了比较。
图3为本发明SPIHT方法中的空间树结构,如图所示,除了最内层的低频系数节点和最外层的高频系数节点,其他每个节点都有四个孩子,这样形成了一种空间扩展到树形结构。
图4,图5,图6和图7为实验的四个实验图片,每一个图都有两部分组成,左边为本发明的验证实验所采用的原始图片,右边为采用Adaboost算法进行人脸识别的图片,右边图片的白色矩形区域代表人脸检测的结果。
图8,图9,图10和图11为图4-图7中四张图片在压缩率(Compression rate)分别为0.4bpp和0.6bpp下采用本发明方法重构图片的结果和采用传统SPIHT重构图片的结果的比较图,左边代表采用传统SPIHT方法的压缩效果,右边代表本发明方法的压缩效果,可以看出在压缩率为0.4bpp的情况下,两种压缩方法的整体显示质量都还可以,但本发明方法的人脸区域比SPIHT要更清楚。
图12,图13,图14和图15分别为上述四张实验图片在不同压缩率下的采用传统SPIHT方法和本发明方法的比较图,由于本发明方法优先保证感兴趣区域的图像质量,因此整体的PSNR值没有传统SPIHT的好,但如果仅考虑人脸区域的话,本发明方法的PSNR值要优于SPIHT压缩方法。如图所示,四条曲线分别代表两种方法在不同压缩率下的PSNR分布情况。
由试验结果看出,本发明提出的图像编码方法考虑了图像内容,并具有高压缩比,较好地显示质量以及渐进传输特性,能兼顾用户感兴趣区域的显示质量,尤其适用于通过智能手机和移动互联网进行照片传递的应用场景下。
Claims (8)
1.一种图像编码方法,其特征在于,具体包括如下步骤:
步骤一、标定图片中的感兴趣区域;
步骤二、对原图像进行小波变换,得到小波系数矩阵;
步骤三、找到感兴趣区域像素在变换后对应的小波系数;
步骤四、对背景区域的系数进行右移位操作,并对背景区域和感兴趣区域采用不同的量化标准进行量化,使感兴趣区域的系数处于更高的位平面上;
步骤五、采用阈值法对小波系数矩阵进行量化;
步骤六、对量化后的小波系数矩阵进行基于SPIHT方法的编码;
所述的步骤六具体包括如下步骤:
步骤6.1:初始化:首先初始化重要系数表LSP为空,将集合H中的所有元素添加到不重要系数表LIP中,并将属于H集合且有后代的元素添加到不重要子集表LIS中、且所添加的元素均为D类型,然后确定初始阈值2n,n根据下式确定:
其中,r,c分别表示小波系数矩阵中的行号和列号,cr,c代表小波系数矩阵中坐标位置为(r,c)的小波系数值,|cr,c|代表对cr,c求绝对值;所述H集合是n层小波分解的低频子图LL(n)、水平方向子图HL(n)、垂直方向子图LH(n)和对角方向子图HH(n)中所有系数的坐标构成的集合,表LSP、表LIP和表LIS的每个表项都使用坐标(r,c)来表示,所述的D类型是指表项(r,c)的所有子孙的集合D(r,c);
步骤6.2:排序扫描,具体是:
步骤6.2.1:扫描表LIP,对表LIP中的每个表项(r,c),得到一个Sn(r,c)的输出SnOut(r,c),如果SnOut(r,c)=1,则向排序位流Sn输出1和小波系数矩阵中位置坐标为(r,c)的系数的符号位,0表示正,1表示负;如果SnOut(r,c)=0,则向排序位流Sn输出0;所述的Sn(r,c)根据函数Sn(X)的定义确定输出值,X代表节点元素的集合,函数Sn(X)定义如下:若Max{|Cr,c|}>=2n,则函数Sn(X)的输出SnOut(X)=1,否则,SnOut(X)=0;
步骤6.2.2:扫描表LIS,判断表LIS中的每个表项(r,c)是D型表项还是L型表项,所述的L型表项是指表项(r,c)的所有非直系子孙的集合L(r,c),设表项(r,c)的直接后代集合为O(r,c),则O(r,c)={(2*r-1,2*c-1),(2*r,2*c-1),(2*r-1,2*c),(2*r,2*c)},L(r,c)=D(r,c)-O(r,c);
A、若表项(r,c)是D型表项,输出SnOut(D(r,c)),根据SnOut(D(r,c))的值进行如下操作:
a、如果SnOut(D(r,c))=1,则向排序位流Sn输出1,并对(r,c)的每个孩子(rO,cO),根据SnOut(rO,cO)的值来进行如下操作:如果SnOut(rO,cO)=1,则向排序位流Sn输出1和小波系数矩阵坐标为(rO,cO)的系数的符号位,并将(rO,cO)添加到表LSP的队尾,如果SnOut(rO,cO)=0,则向排序位流Sn输出0,将(rO,cO)添加到表LIP的队尾;
然后判断L(r,c)是否为空集,如L(r,c)为非空集,则将(r,c)作为L型表项添加到表LIS的尾部,如果L(r,c)为空集,则将D型表项(r,c)从表LIS中删除;
b、如果SnOut(D(r,c))=0,则向排序位流Sn输出0;
B、若表项(r,c)是L型表项,输出SnOut(L(r,c)):如果SnOut(L(r,c))=1,则向排序位流Sn输出1,然后将(r,c)的4个孩子(rO,cO)作为D型表项依次添加到表LIS的队尾,并将L型表项(r,c)从表LIS中删除;如果SnOut(L(r,c))=0,则向排序位流Sn输出0;
步骤6.3:精细扫描,具体是:将上一级扫描后的表LSP记为LSP_Old,对于LSP_Old中的每一个元素(r,c),将系数Cr,c的绝对值转换为二进制表示Br,c,输出Br,c中对应于2n权位处的符号1或0到精细位流Rn;
步骤6.4更新阈值指数:将阈值指数n减去1,判断得到的阈值指数n是否等于要求的精度值,若是,结束本方法,若否,返回步骤6.2继续下一级编码扫描。
2.根据权利要求1所述的一种图像编码方法,其特征在于,所述的步骤一具体通过人工标定图片中感兴趣区域,或者采用Adaboost算法进行自动人脸识别标定图片中感兴趣区域。
3.根据权利要求2所述的一种图像编码方法,其特征在于,所述感兴趣区域为规则的图形区域,如果标定的感兴趣区域的形状不是规则的图形区域,则将该标定的区域扩大,选取包含该标定的区域的一个外接规则图形区域作为感兴趣区域。
4.根据权利要求2所述的一种图像编码方法,其特征在于,所述感兴趣区域为矩形区域。
5.根据权利要求1所述的一种图像编码方法,其特征在于,所述的步骤三具体是:
(1)首先确定感兴趣区域在原图中的左上角点坐标(x,y)以及宽width和高height;所述感兴趣区域为矩形区域;
(2)然后确定在n层小波分解的低频子图LL(n)中对应感兴趣区域的左上角点坐标(nLLx,nLLy)、宽nLLWidth和高nLLHeight:
n层小波分解的水平方向子图HL(n)相对于LL(n)向右平移了nLLWidth个像素,则在HL(n)中对应感兴趣区域的左上角点坐标(nHLx,nHLy)、宽nHLWidth和高nHLHeight为:
n层小波分解的垂直方向子图LH(n)相对于LL(n)向下平移了nLLHeight个像素,则在LH(n)中对应感兴趣区域的左上角点坐标(nLHx,nLHy)、宽nLHWidth和高nLHHeight为:
n层小波分解的对角方向子图HH(n)相对于LL(n)向右平移了nLLWidth个像素,向下平移了nLLHeight个像素,则得到HH(n)子图中对应感兴趣区域的左上角点坐标(nHHx,nHHy)、宽nHHWidth和高nHHHeight为:
在得到感兴趣区域在变换后的小波系数子区域中对应的系数区域后,进一步可求得图像整体的感兴趣区域掩码。
6.根据权利要求1所述的一种图像编码方法,其特征在于,所述的步骤四中,对背景区域的系数进行右移两位处理。
7.根据权利要求1所述的一种图像编码方法,其特征在于,步骤五中所述的阈值法中,阈值设置为20。
8.根据权利要求1所述的一种图像编码方法,其特征在于,步骤6.1中所述的表LSP、表LIP和表LIS采用顺序二维表结构进行存储,表的大小与存储原图像的数据大小相同。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201110326343 CN102637302B (zh) | 2011-10-24 | 2011-10-24 | 一种图像编码方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201110326343 CN102637302B (zh) | 2011-10-24 | 2011-10-24 | 一种图像编码方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102637302A CN102637302A (zh) | 2012-08-15 |
CN102637302B true CN102637302B (zh) | 2013-06-19 |
Family
ID=46621688
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 201110326343 Expired - Fee Related CN102637302B (zh) | 2011-10-24 | 2011-10-24 | 一种图像编码方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102637302B (zh) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9984504B2 (en) | 2012-10-01 | 2018-05-29 | Nvidia Corporation | System and method for improving video encoding using content information |
US10237563B2 (en) | 2012-12-11 | 2019-03-19 | Nvidia Corporation | System and method for controlling video encoding using content information |
CN103065336B (zh) * | 2013-01-23 | 2015-05-27 | 中国矿业大学(北京) | 图像方向金字塔的编码方法 |
US10242462B2 (en) | 2013-04-02 | 2019-03-26 | Nvidia Corporation | Rate control bit allocation for video streaming based on an attention area of a gamer |
CN105389313A (zh) * | 2014-09-04 | 2016-03-09 | 华为技术有限公司 | 图片预览方法及其装置 |
CN104754340B (zh) * | 2015-03-09 | 2020-02-21 | 南京航空航天大学 | 一种无人机侦察图像压缩方法 |
CN107257473B (zh) * | 2017-07-18 | 2020-01-10 | 西安电子科技大学 | 一种高效的图像压缩算法 |
CN107784625B (zh) * | 2017-10-09 | 2019-03-08 | 平安科技(深圳)有限公司 | 电子装置、虚拟样本生成方法及存储介质 |
CN108429916B (zh) * | 2018-02-26 | 2020-07-31 | 西安万像电子科技有限公司 | 图像编码方法及装置 |
CN108932468B (zh) * | 2018-04-27 | 2021-10-12 | 衡阳师范学院 | 一种适用于心理学的面部识别方法 |
CN110827399A (zh) * | 2019-11-11 | 2020-02-21 | 四川航天神坤科技有限公司 | 一种三维模型数据压缩方法及系统 |
CN111311698A (zh) * | 2020-01-17 | 2020-06-19 | 济南浪潮高新科技投资发展有限公司 | 一种用于多尺度目标的图像压缩方法及系统 |
CN114860986B (zh) * | 2022-07-06 | 2022-10-11 | 西安工业大学 | 一种计算机非结构化数据存储方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1655620A (zh) * | 2004-02-09 | 2005-08-17 | 三洋电机株式会社 | 图像编码装置、图像译码装置、图像显示装置 |
CN1926883A (zh) * | 2004-01-13 | 2007-03-07 | 三星电子株式会社 | 使用感兴趣区域的视频/图像编码方法和系统 |
-
2011
- 2011-10-24 CN CN 201110326343 patent/CN102637302B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1926883A (zh) * | 2004-01-13 | 2007-03-07 | 三星电子株式会社 | 使用感兴趣区域的视频/图像编码方法和系统 |
CN1655620A (zh) * | 2004-02-09 | 2005-08-17 | 三洋电机株式会社 | 图像编码装置、图像译码装置、图像显示装置 |
Non-Patent Citations (2)
Title |
---|
罗明凤,滕奇志,何小海.基于SPIHT算法的改进ROI图像编码.《计算机应用》.2006,第26卷(第3期),第624~626页. * |
郭武,梅丽,罗建书.一种基于SPIHT的ROI图像编码.《中国空间科学技术》.2003,(第2003年1期),第61~65页. * |
Also Published As
Publication number | Publication date |
---|---|
CN102637302A (zh) | 2012-08-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102637302B (zh) | 一种图像编码方法 | |
Walker et al. | Wavelet-based image compression | |
KR100821847B1 (ko) | 비주얼 어텐션 시스템 | |
JP2020508010A (ja) | 画像処理およびビデオ圧縮方法 | |
Mitchell et al. | Multilevel graphics representation using block truncation coding | |
Cheng et al. | Document compression using rate-distortion optimized segmentation | |
CN105979265A (zh) | 图片压缩方法和装置 | |
JP2023543520A (ja) | 機械学習を基にしたピクチャコーディングにおけるクロマサブサンプリングフォーマット取り扱いのための方法 | |
CN110996127B (zh) | 图像编解码方法、设备及系统 | |
Garg et al. | Analysis of different image compression techniques: a review | |
Thakker et al. | Lossy image compression-A comparison between wavelet transform, principal component analysis, K-means and Autoencoders | |
JP2004523178A (ja) | 映像を符号化ビットストリームに処理する方法 | |
Deshlahra | Analysis of Image Compression Methods Based On Transform and Fractal Coding | |
CN117750014B (zh) | 视频编码方法、装置及存储介质 | |
KR100381204B1 (ko) | 칼라 정지영상의 부호화 및 복호화 방법 | |
Zhang et al. | Local binary pattern statistics feature for reduced reference image quality assessment | |
Kumari et al. | Image quality estimation by entropy and redundancy calculation for various wavelet families | |
KR100349518B1 (ko) | 인간 시각 시스템의 특성을 반영한 퍼지 논리를 적용한이산 웨이브렛 변환을 이용한 영상 압축 방법 및 장치 | |
US20250061609A1 (en) | Progressive image compression and syncing | |
Garg et al. | Various Image Compression Techniques: A Review. | |
Talukder et al. | Discrete Wavelet Transform for Image Compression and A Model of Parallel Image Compression Scheme for Formal Verification. | |
TWI533236B (zh) | 小波壓縮感測影像編碼之方法 | |
Al-Sammaraie | Medical Images Compression Using Modified SPIHT Algorithm and Multiwavelets Transformation | |
Gertsiy | Research on graphic data formats for compact representation and comparison of images | |
Abd-Elhafiez et al. | New efficient method for coding color images |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20130619 Termination date: 20151024 |
|
EXPY | Termination of patent right or utility model |