CN105141954A - 一种hevc帧间编码快速模式选择方法 - Google Patents
一种hevc帧间编码快速模式选择方法 Download PDFInfo
- Publication number
- CN105141954A CN105141954A CN201510509889.0A CN201510509889A CN105141954A CN 105141954 A CN105141954 A CN 105141954A CN 201510509889 A CN201510509889 A CN 201510509889A CN 105141954 A CN105141954 A CN 105141954A
- Authority
- CN
- China
- Prior art keywords
- mode
- frame
- current
- ctu
- inter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000010187 selection method Methods 0.000 title claims abstract description 19
- 238000000034 method Methods 0.000 claims description 16
- 238000005192 partition Methods 0.000 abstract description 5
- 238000005516 engineering process Methods 0.000 description 8
- 230000006835 compression Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000000638 solvent extraction Methods 0.000 description 3
- 238000007619 statistical method Methods 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明涉及一种HEVC帧间编码快速模式选择方法,包括以下步骤:(1)输入一帧视频数据;(2)选取一个待估计CTU;(3)计算当前CTU的深度预测范围;(4)选取当前CTU中一个待估计CU;(5)大尺寸帧间PU模式的估计;(6)小尺寸帧间PU模式估计的选择;(7)对称帧间PU模式的估计;(8)非对称帧间PU模式估计的选择;(9)帧内PU模式的估计;(10)选取当前CU的最佳PU模式;(11)终止CU划分的判断;(12)重复步骤(4)~(11),完成所有CU的估计;(13)重复步骤(2)~(12),完成当前帧中所有CTU的估计。本发明能够有效减少HEVC的编码时间,同时保持良好的率失真性能。
Description
技术领域
本发明涉及数字视频编码领域,具体涉及一种HEVC帧间编码快速模式选择方法。
背景技术
随着视频会议、视频监控和数字电视等视频多媒体应用逐渐走进人们的生活,高清视频(720P和1080P)和超高清视频(4K和8K)相继出现,人们对更高分辨率和更高帧率的视频不断提出新的要求。目前广泛应用的视频编码标准H.264已很难满足高清和超高清视频存储及传输的发展需求。为进一步获得更高效的视频编码效率,国际组织ITU-T的视频编码专家组(VideoCodingExpertsGroup,VCEG)和ISO/IEC的运动图像专家组(MovingPictureExpertsGroup,MPEG)成立视频编码联合专家组(JointCollaborativeTeamonVideoCoding,JCT-VC),于2013年制定新一代高效率视频编码(HighEfficiencyVideoCoding,HEVC)标准。与H.264相比,HEVC在相同视频质量的条件下可以节约50%左右的视频码流(见G.J.Sullivan,J.R.Ohm,W.J.Han,andT.Wiegand,Overviewofthehighefficiencyvideocoding(HEVC)standard,即“高效率视频编码(HEVC)标准概述”,IEEETransactionsonCircuitsandSystemsforVideoTechnology,vol.22,no.12,pp.1649-1668,Dec.2012),但其编码计算复杂度也成倍增加,这严重阻碍了它在工业领域和民用领域的快速应用。HEVC采用许多编码技术,包括编码树单元(CodingTreeUnit,CTU)四叉树划分(见I.-K.Kim,J.Min,T.Lee,W.J.Han,andJ.Park,BlockpartitionstructureintheHEVCstandard,即“HEVC标准中的块划分结构”,IEEETransactionsonCircuitsandSystemsforVideoTechnology,vol.22,no.12,pp.1697-1706,Dec.2012)、非对称帧间预测单元(PredictionUnit,PU)模式和多方向帧内PU模式等。在HEVC编码过程中,一帧图像先被划分成多个CTU,每个CTU可采用四叉树划分技术再被逐层划分为一个或多个CU,其中每个CU可以被划分为4个子CU或者不进行划分,如果当前CU被划分为4个子CU,则当前CU是其子CU的父CU。与H.264中的尺寸固定为16×16的编码宏块相比,CTU的四叉树划分技术使CU的划分尺寸种类增加,这使得帧间和帧内编码更具适应性和多样性,显著地提升了视频压缩效率。HEVC参考模型HM中,CTU的默认尺寸为64×64,最大深度值默认为3,深度范围为[0,3],CU的尺寸可以为64×64、32×32、16×16和8×8,对应深度值分别为0、1、2和3。HEVC以PU为单位依次进行帧间和帧内PU模式估计,组成每个CU的PU个数可以是1、2或4个。CU的候选PU模式分两大类:帧间PU模式和帧内PU模式,其中帧间PU模式包括Skip、Merge、Inter2N×2N、InterN×N、InterN×2N、Inter2N×N、Inter2N×nU、Inter2N×nD、InternL×2N和InternR×2N,帧内PU模式包括Intra2N×2N和IntraN×N。Skip模式是一种特殊的帧间PU模式,它采用HEVC标准默认的预测矢量进行帧间预测,其量化预测残差全为零,因此无需将预测矢量和量化预测残差编入码流;Merge模式是另一种特殊的帧间PU模式,它同样采用HEVC标准默认的预测矢量进行帧间预测,但存在非零量化预测残差,因此只需将量化预测残差编入码流;其它帧间PU模式则都需要将预测矢量和量化预测残差编入码流。为了提高编码压缩效率,每个CU需要先对各种模式进行估计,再从中选取率失真代价最小的模式作为最佳编码模式(见T.Wiegand,H.Schwarz,A.Joch,F.Kossentini,andG.J.Sullivan,Rate-constrainedcodercontrolandcomparisonofvideocodingstandards,即“视频编码标准的率失真编码器控制与比较”,IEEETransactionsonCircuitsandSystemsforVideoTechnology,vol.13,no.7,pp.688-703,July2003)。由于CTU采用四叉树划分技术,HM采用全搜索的模式选择方法,在每个CTU的编码过程中采用四叉树先序遍历的方式处理所有深度和CU,并且每次遍历都需计算出对应深度CU的各个候选PU模式的率失真代价,以获得最佳CTU划分和最佳PU模式。这种模式选择方法可以获得很好的编码率失真性能,但消耗了HEVC编码大部分的处理时间。
目前已经有一些研究人员对HEVC快速模式选择方法展开研究。申请号为201410041255.2的专利利用前一帧中两个相邻CU的深度关系,缩小当前CU的深度搜索范围。申请号为201310470508.3的专利不仅分析相邻CTU的深度特点来获取当前CTU深度遍历区间类型,而且采用贝叶斯决策原理对CU进行早期裁剪。除了以上方法通过预测当前CU深度来减少HEVC编码复杂度,还可以根据时域相邻CU的最佳PU模式来减少当前CU的模式估计,以降低编码计算复杂度。申请号为201410662687.5的专利首先将视频的运动强度分为三种状态,其次统计分析运动缓慢、运动适中状态的CU的最佳PU模式与其时域相邻CU的最佳PU模式的关系,然后构建候选PU模式列表,最后根据该模式列表,对当前CU模式估计,得到最佳PU模式。HEVC编码模式选择需要的处理时间与视频本身特征有关,纹理越简单且运动量越小,选择Skip模式为最佳PU模式的可能性就大,整体编码时间就可以降低。因此基于视频的纹理或运动信息,利用Skip模式特征能有效地降低编码计算复杂度(见S.Ahn,B.Lee,andM.Kim,AnovelfastCUencodingschemebasedonspatiotemporalencodingparametersforHEVCintercoding,即“一种新的基于时空编码参数HEVC的CU帧间编码快速方案”,IEEETransactionsonCircuitsandSystemsforVideoTechnology,vol.25,no.3,pp.422-435,Mar.2015;以及见L.Shen,Z.Liu,X.Zhang,W.Zhao,andZ.Zhang,AneffectiveCUsizedecisionmethodforHEVCencoders,即“一种高效的HEVC编码器CU尺寸决策方法”,IEEETransactionsonMultimedia,vol.15,no.2,pp.465-470,Feb.2013)。
以上这些方法中虽然已使用视频的时间和空间相关性来提高处理性能,但CTU编码信息的时空相关性还未充分挖掘。为了进一步降低HEVC的编码时间,我们可以利用相邻CTU的最小深度值和最大深度值,来预测当前CTU的深度范围,以减少CTU的整体划分次数;利用当前CU已估计PU模式的率失真代价和父CU的最佳PU模式,跳过当前CU的部分冗余帧间PU模式。
发明内容
为了在保持编码率失真性能的条件下显著地降低HEVC编码计算复杂度,本发明提供了一种HEVC帧间编码快速模式选择方法。
为了解决上述技术问题采用的技术方案为:
一种HEVC帧间编码快速模式选择方法,所述方法包括以下步骤:
(1)输入一帧视频数据;
(2)选取一个待估计CTU:
按从上到下、从左到右的顺序,从当前帧中选取一个待估计CTU。所述的CTU的尺寸为64×64或32×32;根据HEVC编码标准要求,一帧视频数据中所有CTU的尺寸都相同,其中CTU尺寸为64×64具有更好的压缩效率,CTU尺寸为32×32具有更少的计算复杂度。
(3)计算当前CTU的深度预测范围:
当前CTU与时空相邻CTU具有编码信息相关性,所述的时空相邻CTU包括当前CTU空间相邻的左方CTU(标记为L-CTU)、上方CTU(标记为U-CTU)和时间相邻的参考帧中相同位置CTU(标记为Col-CTU),在对当前CTU进行估计之前,这三个时空相邻的CTU都已经完成估计。当Col-CTU存在,且L-CTU和U-CTU中至少有1个存在的情况下,利用时空相邻CTU的深度信息来计算当前CTU的深度预测范围R,如式(I)所示:
式(I)中,DMIN和DMAX分别为所有存在的时空相邻CTU中的最小深度值和最大深度值;dMAX为当前帧CTU允许的最大深度值,如果当前帧CTU尺寸为64×64,则dMAX值为3,如果当前帧CTU尺寸为32×32,则dMAX值为2。当Col-CTU不存在、或L-CTU和U-CTU都不存在的情况下,当前CTU的深度预测范围R为[0,dMAX]。
(4)选择当前CTU中一个待估计CU:
按四叉树先序遍历的方式,为当前CTU选择一个深度值在R内的待估计CU。
(5)大尺寸帧间PU模式的估计:
对当前待估计CU进行Skip、Merge和Inter2N×2N这三种大尺寸帧间PU模式的估计,分别计算它们的率失真代价RDSkip、RDMerge和RDInter2N×2N,并从中选取最小值作为大尺寸帧间PU模式的率失真代价RDSquare。
(6)小尺寸帧间PU模式估计的选择:
所述的小尺寸帧间PU模式包括InterN×N、InterN×2N、Inter2N×N、Inter2N×nU、Inter2N×nD、InternL×2N和InternR×2N这七种帧间PU模式。对当前待估计CU进行小尺寸帧间PU模式估计的选择按如下顺序执行:
首先利用步骤(5)得到的RDSkip、RDMerge和RDInter2N×2N计算小尺寸帧间PU模式估计的选择标志Flag1和Flag2,如式(II)和式(III)所示:
式(II)和(III)中,参数α和β都是用来调整选择精度和计算复杂度,通常根据统计分析来选取,设为0.7~1.2;式(III)中,RDParent为父CU的率失真代价,所述的父CU为包含当前CU的上一层CU,系数四分之一代表当前CU与其父CU之间的像素点个数比值;式(III)中,如果当前CU的父CU不存在,则Flag2为0。
然后根据父CU的最佳PU模式、Flag1和Flag2来判断是否进行小尺寸帧间PU模式的估计:如果父CU的最佳PU模式为Skip模式,那么当前CU选取大尺寸帧间PU模式为最佳PU模式的可能性较大,则不进行小尺寸帧间PU模式的估计,跳到步骤(9);如果当前CU符合Skip模式条件且Flag1等于1,那么当前CU选取大尺寸帧间PU模式为最佳PU模式的可能性较大,则不进行小尺寸帧间PU模式的估计,跳到步骤(9);如果当前CU不符合Skip模式条件且Flag2等于1,那么当前CU所覆盖的区域大都运动量小且纹理简单,则不进行小尺寸帧间PU模式的估计,跳到步骤(9);其他情况则执行步骤(7)。
(7)对称帧间PU模式的估计:
所述的对称帧间PU模式包括InterN×N、InterN×2N和Inter2N×N这三种帧间PU模式。本步骤对当前待估计CU进行对称帧间PU模式的估计,分别计算它们的率失真代价,并从中选取率失真代价最小值作为对称帧间PU模式的率失真代价RDSymmetry。
(8)非对称帧间PU模式估计的选择:
所述的非对称帧间PU模式包括Inter2N×nU、Inter2N×nD、InternL×2N和InternR×2N这四种帧间PU模式。对当前待估计CU进行非对称帧间PU模式估计的选择按如下顺序执行:
首先利用由步骤(5)得到的RDSquare和步骤(7)得到的RDSymmetry来计算非对称帧间PU模式的选择标志Flag3,如式(IV)所示:
式(IV)中,参数γ是用于调整选择精度和计算复杂度,通常根据统计分析来选取,设为0.7~1.2。
然后根据父CU的最佳PU模式和Flag3来选择是否进行非对称帧间PU模式的估计:如果父CU的最佳PU模式为Merge或Inter2N×2N模式,那么当前CU所覆盖的区域大都运动量规则且较小,纹理较简单,则不进行非对称帧间PU模式的估计;如果Flag3等于1,表明大尺寸帧间PU模式的估计效果已经较好,那么当前CU选择非对称帧间PU模式为最佳模式的可能性较小,则不进行非对称帧间PU模式的估计;其他情况,则进行非对称帧间PU模式的估计,并计算它们的率失真代价。
(9)帧内PU模式的估计:
对当前待估计CU进行Intra2N×2N和IntraN×N这两种帧内PU模式的估计,并计算它们的率失真代价。
(10)选取当前CU的最佳PU模式:
从已估计的帧间PU模式和帧内PU模式中选取率失真代价最小的PU模式作为当前CU的最佳PU模式,并将最小的率失真代价作为当前CU的率失真代价。
(11)终止CU划分的判断:
首先根据当前CU空间相邻的左方CU和上方CU、时间相邻的参考帧中相同位置CU、以及父CU的率失真代价来计算终止CU划分的率失真代价阈值Th,其中,左方CU记为L-CU,上方CU记为U-CU,时间相邻的参考帧中相同位置CU记为Col-CU,如式(V)所示:
式(V)中,参数η是用来调整终止CU划分的率失真代价阈值,通常根据统计分析来选取,设为0.5~1.1;L-CU、U-CU和Col-CU都与当前CU具有相同的CU尺寸;当L-CU、U-CU和Col-CU都存在时,Th由L-CU、U-CU和Col-CU的平均率失真代价RDavg-LUC计算得到,RDavg-LUC等于L-CU、U-CU和Col-CU的率失真代价相加除以3;当只有L-CU和Col-CU存在时,Th由L-CU和Col-CU的平均率失真代价RDavg-LC计算得到,RDavg-LC等于L-CU和Col-CU的率失真代价相加除以2;当只有U-CU和Col-CU存在时,Th由U-CU和Col-CU的平均率失真代价RDavg-UC计算得到,RDavg-UC等于U-CU和Col-CU的率失真代价相加除以2。
然后根据Th判断是否终止当前CU划分:如果当前CU的率失真代价小于Th,则终止当前CU的四叉树划分,即在步骤(4)中将不再遍历当前CU的四个子CU。
(12)重复执行步骤(4)~(11),完成所有CU的估计:
完成所有待估计CU的最佳PU模式和率失真代价的选取;根据所有已估计CU的率失真代价,选择率失真代价总和最小的CU划分方式作为当前CTU的最佳四叉树划分。
(13)重复步骤(2)~(12),完成当前帧中所有CTU的估计。
本发明的技术构思为:首先根据已估计的时空相邻CTU的最大深度值和最小深度值计算当前CTU的深度预测范围,由该深度预测范围判断是否进行当前深度所有PU模式的估计;然后根据当前CU三种大尺寸帧间PU模式的率失真代价和父CU的最佳PU模式判断是否进行三种对称帧间PU模式的估计;接着根据当前CU三种大尺寸帧间PU模式和三种对称帧间PU模式的率失真代价以及父CU的最佳PU模式来判断是否进行四种非对称帧间PU模式的估计;最后根据已估计的时空相邻CU和父CU的率失真代价计算终止CU划分的阈值,由该阈值判断是否终止当前CU划分。
与现有技术相比,本发明具有以下有益效果:
本发明提供了一种HEVC帧间编码快速模式选择方法。该方法适用于HEVC帧间编码的模式选择,与现有技术相比,具有如下特点和优点:利用已估计的相邻CTU的深度统计信息计算深度预测范围;利用大尺寸帧间PU模式的率失真代价、对称帧间PU模式的率失真代价和父CU的最佳模式,减少候选帧间PU模式的估计;利用已估计时空相邻CU和父CU的率失真代价,判断是否终止当前CU划分。在保持良好的编码率失真性能的条件下,本发明能显著地降低HEVC帧间编码模式选择的计算复杂度,与HM中全搜索的模式选择方法相比,可以降低50%以上的编码时间。另外,本发明不仅对不同纹理复杂度和运动复杂度的视频编码效果都较好,而且对高清高分辨率视频的优化效果更加显著。
附图说明
图1为本发明方法的基本流程图。
具体实施方式
下面结合实施例和附图来详细描述本发明,但本发明并不仅限于此。
如图1所示,一种HEVC帧间编码快速模式选择方法,包括以下步骤:
(1)输入一帧视频数据;
(2)选取一个待估计CTU;
(3)计算当前CTU的深度预测范围;
(4)选择当前CTU中一个待估计CU;
(5)大尺寸帧间PU模式的估计;
(6)小尺寸帧间PU模式估计的选择:
(7)对称帧间PU模式的估计;
(8)非对称帧间PU模式估计的选择;
(9)帧内PU模式的估计;
(10)选取当前CU的最佳PU模式;
(11)终止CU划分的判断;
(12)完成所有CU的估计;
(13)完成当前帧中所有CTU的估计。
本实施例中,所述的大尺寸帧间PU模式包括Skip、Merge和Inter2N×2N这三种帧间PU模式;所述的小尺寸帧间PU模式包括InterN×N、InterN×2N、Inter2N×N、Inter2N×nU、Inter2N×nD、InternL×2N和InternR×2N这七种帧间PU模式;所述的对称帧间PU模式包括InterN×N、InterN×2N和Inter2N×N这三种帧间PU模式;所述的非对称帧间PU模式包括Inter2N×nU、Inter2N×nD、InternL×2N和InternR×2N这四种帧间PU模式;所述的父CU为包含当前CU的上一层CU。
步骤(2)具体包括:
按从上到下、从左到右的顺序,从当前帧中选取一个待估计CTU;本实施例为了保证压缩效率,将CTU尺寸设为64×64。
步骤(3)具体包括:
当前CTU与时空相邻CTU具有相关性,所述的时空相邻CTU包括当前CTU空间相邻的左方CTU(标记为L-CTU)和上方CTU(标记为U-CTU),时间相邻的参考帧中相同位置CTU(标记为Col-CTU)。当Col-CTU存在,且L-CTU和U-CTU中至少有1个存在的情况下,利用时空相邻CTU的深度信息来计算当前CTU的深度预测范围R,如式(I)所示:
式(I)中,DMIN和DMAX分别为所有存在的时空相邻CTU中的最小深度值和最大深度值;dMAX为当前帧CTU允许的最大深度值,本实施例中CTU尺寸为64×64,对应的dMAX值为3。当Col-CTU不存在、或L-CTU和U-CTU都不存在的情况下,当前CTU的深度预测范围R为[0,3]。
步骤(4)具体包括:
按四叉树先序遍历的方式,为当前CTU选择一个深度值在R内的待估计CU。
步骤(5)具体包括:
进行大尺寸帧间PU模式的估计,分别计算它们的率失真代价RDSkip、RDMerge和RDInter2N×2N,并从中选取最小值作为大尺寸PU模式的率失真代价RDSquare。
步骤(6)具体包括:
首先利用步骤(5)得到的RDSkip、RDMerge和RDInter2N×2N计算小尺寸帧间PU模式估计的选择标志Flag1和Flag2,如式(II)和式(III)所示:
式(II)和(III)中,参数α和β都是用来调整选择精度和计算复杂度,设为0.7~1.2,此处α和β设为1.0;式(III)中,RDParent为父CU的率失真代价;系数四分之一代表当前CU与其父CU之间的像素点个数比值;式(III)中,如果当前CU的父CU不存在,则Flag2为0。
然后根据父CU的最佳PU模式、Flag1和Flag2来判断是否进行小尺寸帧间PU模式的估计:如果父CU的最佳PU模式为Skip模式,则不进行小尺寸帧间PU模式的估计,跳到步骤(9);如果当前CU符合Skip模式条件且Flag1等于1,则不进行小尺寸帧间PU模式的估计,跳到步骤(9);如果当前CU不符合Skip模式条件且Flag2等于1,则不进行小尺寸帧间PU模式的估计,跳到步骤(9);其他情况则执行步骤(7)。
步骤(7)具体包括:
进行对称帧间PU模式的估计,分别计算它们的率失真代价,并从中选取率失真代价最小值作为对称帧间PU模式的率失真代价RDSymmetry。
步骤(8)具体包括:
首先利用由步骤(5)得到的RDSquare和步骤(7)得到的RDSymmetry来计算非对称帧间PU模式的选择标志Flag3,如式(IV)所示:
式(IV)中,参数γ是用于调整选择精度和计算复杂度,设为0.7~1.2,此处γ设为1.0。
然后根据父CU的最佳PU模式和Flag3来选择是否进行非对称帧间PU模式的估计:如果父CU的最佳PU模式为Merge或Inter2N×2N模式,则不进行非对称帧间PU模式的估计;如果Flag3等于1,则不进行非对称帧间PU模式的估计;其他情况,则进行非对称帧间PU模式的估计,并计算它们的率失真代价。
步骤(9)具体包括:
进行Intra2N×2N和IntraN×N这两种帧内PU模式的估计,并计算这两种模式的率失真代价。
步骤(10)具体包括:
从已估计的帧间PU模式和帧内PU模式中选取率失真代价最小的PU模式作为当前CU的最佳PU模式,并将最小的率失真代价作为当前CU的率失真代价。
步骤(11)具体包括:
首先根据当前CU空间相邻的左方CU和上方CU、时间相邻的参考帧中相同位置CU、以及父CU的率失真代价来计算终止CU划分的率失真代价阈值Th,其中,左方CU记为L-CU,上方CU记为U-CU,时间相邻的参考帧中相同位置CU记为Col-CU,如式(V)所示:
式(V)中,参数η是用来调整终止CU划分的率失真代价阈值,通常根据经验来选取,设为0.5~1.1,此处η设为0.7;L-CU、U-CU和Col-CU都与当前CU具有相同的CU尺寸。当L-CU、U-CU和Col-CU都存在时,Th由L-CU、U-CU和Col-CU的平均率失真代价RDavg-LUC计算得到,RDavg-LUC等于L-CU、U-CU和Col-CU的率失真代价相加除以3;当只有L-CU和Col-CU存在时,Th由L-CU和Col-CU的平均率失真代价RDavg-LC计算得到,RDavg-LC等于L-CU和Col-CU的率失真代价相加除以2;当只有U-CU和Col-CU存在时,Th由U-CU和Col-CU的平均率失真代价RDavg-UC计算得到,RDavg-UC等于U-CU和Col-CU的率失真代价相加除以2。
然后根据Th判断是否终止当前CU划分:如果当前CU的率失真代价小于Th,则终止当前CU的四叉树划分,即在步骤(4)不再遍历当前CU的四个子CU。
步骤(12)具体包括:
重复执行步骤(4)~(11),完成所有CU的估计。完成所有待估计CU的最佳PU模式和率失真代价的选取。根据所有已估计CU的率失真代价,选择率失真代价总和最小的CU划分方式作为当前CTU的最佳四叉树划分。
步骤(13)具体包括:
重复执行步骤(2)~(12),完成当前帧中所有CTU的估计。
Claims (5)
1.一种HEVC帧间编码快速模式选择方法,其特征在于,所述的选择方法包括以下步骤:
(1)输入一帧视频数据;
(2)选取一个待估计CTU:
按从上到下、从左到右的顺序,从当前帧中选取一个待估计CTU;所述的CTU的尺寸为64×64或32×32;
(3)计算当前CTU的深度预测范围;
(4)选择当前CTU中一个待估计CU:
按四叉树先序遍历的方式,为当前CTU选择一个深度值在深度预测范围内的待估计CU;
(5)大尺寸帧间PU模式的估计:
对当前待估计CU进行Skip、Merge和Inter2N×2N这三种大尺寸帧间PU模式的估计,分别计算它们的率失真代价RDSkip、RDMerge和RDInter2N×2N,并从中选取最小值作为大尺寸帧间PU模式的率失真代价RDSquare;
(6)小尺寸帧间PU模式估计的选择:
根据当前待估计CU的RDSkip、RDMerge、RDInter2N×2N、父CU的率失真代价RDParent和父CU的最佳PU模式判断当前待估计CU是否进行InterN×N、InterN×2N、Inter2N×N、Inter2N×nU、Inter2N×nD、InternL×2N和InternR×2N这七种小尺寸帧间PU模式的估计;
(7)对称帧间PU模式的估计:
对当前待估计CU进行InterN×N、InterN×2N和Inter2N×N这三种对称帧间PU模式的估计,分别计算它们的率失真代价,并从中选取率失真代价最小值作为对称帧间PU模式的率失真代价RDSymmetry;
(8)非对称帧间PU模式估计的选择:
根据当前待估计CU的RDSquare、RDSymmetry和父CU的最佳PU模式判断当前待估计CU是否进行Inter2N×nU、Inter2N×nD、InternL×2N和InternR×2N这四种非对称帧间PU模式的估计;
(9)帧内PU模式的估计:
对当前待估计CU进行Intra2N×2N和IntraN×N这两种帧内PU模式的估计,并计算它们的率失真代价;
(10)选取当前CU的最佳PU模式:
从已估计的帧间PU模式和帧内PU模式中选取率失真代价最小的PU模式作为当前CU的最佳PU模式,并将最小的率失真代价作为当前CU的率失真代价;
(11)终止CU划分的判断;
(12)重复执行步骤(4)~(11),完成所有CU的估计:
完成所有待估计CU的最佳PU模式和率失真代价的选取;根据所有已估计CU的率失真代价,选择率失真代价总和最小的CU划分方式作为当前CTU的最佳四叉树划分;
(13)重复步骤(2)~(12),完成当前帧中所有CTU的估计。
2.如权利要求1所述的一种HEVC帧间编码快速模式选择方法,其特征在于,所述的步骤(3)采用当前CTU空间相邻的左方CTU、上方CTU和时间相邻的参考帧中相同位置CTU的深度统计信息来计算当前CTU的深度预测范围,其中,左方CTU记为L-CTU,上方CTU记为U-CTU,时间相邻的参考帧中相同位置CTU记为Col-CTU:当Col-CTU存在,且L-CTU和U-CTU中至少有1个存在的情况下,计算当前CTU的深度预测范围R,如式(I)所示:
式(I)中,DMIN和DMAX分别为所有存在的时空相邻CTU中的最小深度值和最大深度值;dMAX为当前帧CTU允许的最大深度值,如果当前帧CTU尺寸为64×64,则dMAX值为3,如果当前帧CTU尺寸为32×32,则dMAX值为2;
当Col-CTU不存在、或L-CTU和U-CTU都不存在的情况下,当前CTU的深度预测范围R为[0,dMAX]。
3.如权利要求1所述的一种HEVC帧间编码快速模式选择方法,其特征在于步骤(6)所述的小尺寸帧间PU模式估计的选择方法:
首先利用步骤(5)得到的RDSkip、RDMerge和RDInter2N×2N计算小尺寸帧间PU模式估计的选择标志Flag1和Flag2,如式(II)和式(III)所示:
式(II)和(III)中,参数α和β用于调整选择精度和计算复杂度,设为0.7~1.2;式(III)中,RDParent为父CU的率失真代价;式(III)中,如果当前CU的父CU不存在,则Flag2为0;
然后根据父CU的最佳PU模式、Flag1和Flag2来判断是否进行小尺寸帧间PU模式的估计:如果父CU的最佳PU模式为Skip模式,则不进行小尺寸帧间PU模式的估计;如果当前CU符合Skip模式条件且Flag1等于1,则不进行小尺寸帧间PU模式的估计;如果当前CU不符合Skip模式条件且Flag2等于1,则不进行小尺寸帧间PU模式的估计。
4.如权利要求1所述的一种HEVC帧间编码快速模式选择方法,其特征在于步骤(8)所述的非对称帧间PU模式估计的选择方法:
首先利用步骤(5)得到的RDSquare和步骤(7)得到的RDSymmetry计算非对称帧间PU模式的选择标志Flag3,如式(IV)所示:
式(IV)中,参数γ用于调整选择精度和计算复杂度,设为0.7~1.2;
然后根据父CU的最佳PU模式和Flag3来选择是否进行非对称帧间PU模式的估计:如果父CU的最佳PU模式为Merge或Inter2N×2N模式,则不进行非对称帧间PU模式的估计;如果Flag3等于1,则不进行非对称帧间PU模式的估计;其他情况,则进行非对称帧间PU模式的估计,并计算它们的率失真代价。
5.如权利要求1所述的一种HEVC帧间编码快速模式选择方法,其特征在于步骤(11)所述的终止CU划分的判断方法:
首先根据当前CU空间相邻的左方CU和上方CU、时间相邻的参考帧中相同位置CU、以及父CU的率失真代价来计算终止CU划分的率失真代价阈值Th,其中,左方CU记为L-CU,上方CU记为U-CU,时间相邻的参考帧中相同位置CU记为Col-CU,如式(V)所示:
式(V)中,参数η是用来调整终止CU划分的率失真代价阈值,设为0.5~1.1;L-CU、U-CU和Col-CU都与当前CU具有相同的CU尺寸;当L-CU、U-CU和Col-CU都存在时,Th由L-CU、U-CU和Col-CU的平均率失真代价RDavg-LUC计算得到,RDavg-LUC等于L-CU、U-CU和Col-CU的率失真代价相加除以3;当只有L-CU和Col-CU存在时,Th由L-CU和Col-CU的平均率失真代价RDavg-LC计算得到,RDavg-LC等于L-CU和Col-CU的率失真代价相加除以2;当只有U-CU和Col-CU存在时,Th由U-CU和Col-CU的平均率失真代价RDavg-UC计算得到,RDavg-UC等于L-CU和Col-CU的率失真代价相加除以2;
然后根据Th判断是否终止当前CU划分:如果当前CU的率失真代价小于Th,则终止当前CU的四叉树划分,步骤(4)不再遍历当前CU的四个子CU。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510509889.0A CN105141954B (zh) | 2015-08-19 | 2015-08-19 | 一种hevc帧间编码快速模式选择方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510509889.0A CN105141954B (zh) | 2015-08-19 | 2015-08-19 | 一种hevc帧间编码快速模式选择方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105141954A true CN105141954A (zh) | 2015-12-09 |
CN105141954B CN105141954B (zh) | 2018-03-13 |
Family
ID=54727144
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510509889.0A Active CN105141954B (zh) | 2015-08-19 | 2015-08-19 | 一种hevc帧间编码快速模式选择方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105141954B (zh) |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105721865A (zh) * | 2016-02-01 | 2016-06-29 | 同济大学 | 一种hevc帧间编码单元划分的快速决策算法 |
CN106454342A (zh) * | 2016-09-07 | 2017-02-22 | 中山大学 | 一种视频压缩编码的帧间模式快速选择方法及系统 |
CN106534849A (zh) * | 2016-12-30 | 2017-03-22 | 杭州当虹科技有限公司 | 一种快速的hevc帧间编码方法 |
CN107343198A (zh) * | 2017-05-08 | 2017-11-10 | 上海大学 | 一种avs2帧间预测模式快速判决方法 |
CN108012150A (zh) * | 2017-12-14 | 2018-05-08 | 湖南兴天电子科技有限公司 | 视频帧间编码方法及装置 |
CN108124154A (zh) * | 2017-12-28 | 2018-06-05 | 北京数码视讯科技股份有限公司 | 帧间预测模式的快速选择方法、装置及电子设备 |
CN108965873A (zh) * | 2018-07-24 | 2018-12-07 | 北京大学 | 一种脉冲阵列编码的自适应划分方法 |
CN109302610A (zh) * | 2018-10-26 | 2019-02-01 | 重庆邮电大学 | 一种基于率失真代价的屏幕内容编码帧间快速算法 |
CN109756719A (zh) * | 2019-01-28 | 2019-05-14 | 华侨大学 | 基于cu划分贝叶斯决策的3d-hevc帧间快速方法 |
CN110022477A (zh) * | 2019-03-29 | 2019-07-16 | 中南大学 | 一种基于CUTree的帧间预测模式快速选择方法 |
CN110139106A (zh) * | 2019-04-04 | 2019-08-16 | 中南大学 | 一种视频编码单元分割方法及其系统、装置、存储介质 |
CN110430427A (zh) * | 2019-08-07 | 2019-11-08 | 杭州微帧信息科技有限公司 | 一种基于skip模式编码结果的快速视频编码决策方法与系统 |
CN110446040A (zh) * | 2019-07-30 | 2019-11-12 | 暨南大学 | 一种适用于hevc标准的帧间编码方法与系统 |
CN111031303A (zh) * | 2019-11-21 | 2020-04-17 | 郑州轻工业大学 | 基于贝叶斯决策定理的3d-hevc快速深度编码方法 |
WO2021164323A1 (zh) * | 2020-02-17 | 2021-08-26 | 腾讯科技(深圳)有限公司 | 编码模式选择方法、装置、电子设备及计算机可读介质 |
CN113852811A (zh) * | 2021-03-03 | 2021-12-28 | 天翼智慧家庭科技有限公司 | 基于cu相关性的帧间预测快速方法、系统及存储介质 |
CN115695797A (zh) * | 2022-10-17 | 2023-02-03 | 厦门亿联网络技术股份有限公司 | 一种用于h.265编码的快速帧内尺寸判决方法及装置 |
CN116437091A (zh) * | 2023-03-16 | 2023-07-14 | 厦门亿联网络技术股份有限公司 | 一种视频编码的编码尺寸判决方法、装置、设备及介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103533355A (zh) * | 2013-10-10 | 2014-01-22 | 宁波大学 | 一种hevc快速编码方法 |
CN103813166A (zh) * | 2014-01-28 | 2014-05-21 | 浙江大学 | 一种低复杂度的hevc编码多参考帧的选择方法 |
CN104702958A (zh) * | 2013-12-05 | 2015-06-10 | 中国科学院深圳先进技术研究院 | 一种基于空间相关性的hevc帧内编码方法及系统 |
-
2015
- 2015-08-19 CN CN201510509889.0A patent/CN105141954B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103533355A (zh) * | 2013-10-10 | 2014-01-22 | 宁波大学 | 一种hevc快速编码方法 |
CN104702958A (zh) * | 2013-12-05 | 2015-06-10 | 中国科学院深圳先进技术研究院 | 一种基于空间相关性的hevc帧内编码方法及系统 |
CN103813166A (zh) * | 2014-01-28 | 2014-05-21 | 浙江大学 | 一种低复杂度的hevc编码多参考帧的选择方法 |
Non-Patent Citations (3)
Title |
---|
GARY J. SULLIVAN等: "Overview of the High Efficiency Video Coding (HEVC) Standard", 《IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY》 * |
IL-KOO KIM等: "Block Partitioning Structure in the HEVC Standard", 《IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY》 * |
姚晓敏等: "一种面向HEVC的编码单元深度决策算法", 《计算机工程》 * |
Cited By (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105721865A (zh) * | 2016-02-01 | 2016-06-29 | 同济大学 | 一种hevc帧间编码单元划分的快速决策算法 |
CN106454342A (zh) * | 2016-09-07 | 2017-02-22 | 中山大学 | 一种视频压缩编码的帧间模式快速选择方法及系统 |
CN106454342B (zh) * | 2016-09-07 | 2019-06-25 | 中山大学 | 一种视频压缩编码的帧间模式快速选择方法及系统 |
CN106534849A (zh) * | 2016-12-30 | 2017-03-22 | 杭州当虹科技有限公司 | 一种快速的hevc帧间编码方法 |
CN106534849B (zh) * | 2016-12-30 | 2019-07-16 | 杭州当虹科技股份有限公司 | 一种快速的hevc帧间编码方法 |
CN107343198A (zh) * | 2017-05-08 | 2017-11-10 | 上海大学 | 一种avs2帧间预测模式快速判决方法 |
CN108012150A (zh) * | 2017-12-14 | 2018-05-08 | 湖南兴天电子科技有限公司 | 视频帧间编码方法及装置 |
CN108012150B (zh) * | 2017-12-14 | 2020-05-05 | 湖南兴天电子科技有限公司 | 视频帧间编码方法及装置 |
CN108124154A (zh) * | 2017-12-28 | 2018-06-05 | 北京数码视讯科技股份有限公司 | 帧间预测模式的快速选择方法、装置及电子设备 |
CN108965873B (zh) * | 2018-07-24 | 2020-02-14 | 北京大学 | 一种脉冲阵列编码的自适应划分方法 |
CN108965873A (zh) * | 2018-07-24 | 2018-12-07 | 北京大学 | 一种脉冲阵列编码的自适应划分方法 |
CN109302610B (zh) * | 2018-10-26 | 2021-09-28 | 重庆邮电大学 | 一种基于率失真代价的屏幕内容编码帧间快速编码方法 |
CN109302610A (zh) * | 2018-10-26 | 2019-02-01 | 重庆邮电大学 | 一种基于率失真代价的屏幕内容编码帧间快速算法 |
CN109756719A (zh) * | 2019-01-28 | 2019-05-14 | 华侨大学 | 基于cu划分贝叶斯决策的3d-hevc帧间快速方法 |
CN110022477A (zh) * | 2019-03-29 | 2019-07-16 | 中南大学 | 一种基于CUTree的帧间预测模式快速选择方法 |
CN110022477B (zh) * | 2019-03-29 | 2021-02-19 | 中南大学 | 一种基于CUTree的帧间预测模式快速选择方法 |
CN110139106B (zh) * | 2019-04-04 | 2023-01-17 | 中南大学 | 一种视频编码单元分割方法及其系统、装置、存储介质 |
CN110139106A (zh) * | 2019-04-04 | 2019-08-16 | 中南大学 | 一种视频编码单元分割方法及其系统、装置、存储介质 |
CN110446040A (zh) * | 2019-07-30 | 2019-11-12 | 暨南大学 | 一种适用于hevc标准的帧间编码方法与系统 |
CN110430427A (zh) * | 2019-08-07 | 2019-11-08 | 杭州微帧信息科技有限公司 | 一种基于skip模式编码结果的快速视频编码决策方法与系统 |
CN111031303A (zh) * | 2019-11-21 | 2020-04-17 | 郑州轻工业大学 | 基于贝叶斯决策定理的3d-hevc快速深度编码方法 |
CN111031303B (zh) * | 2019-11-21 | 2021-01-26 | 郑州轻工业大学 | 基于贝叶斯决策定理的3d-hevc快速深度编码方法 |
WO2021164323A1 (zh) * | 2020-02-17 | 2021-08-26 | 腾讯科技(深圳)有限公司 | 编码模式选择方法、装置、电子设备及计算机可读介质 |
US12069249B2 (en) | 2020-02-17 | 2024-08-20 | Tencent Technology (Shenzhen) Company Limited | Coding mode selection method and apparatus, and electronic device and computer-readable medium |
CN113852811A (zh) * | 2021-03-03 | 2021-12-28 | 天翼智慧家庭科技有限公司 | 基于cu相关性的帧间预测快速方法、系统及存储介质 |
CN115695797A (zh) * | 2022-10-17 | 2023-02-03 | 厦门亿联网络技术股份有限公司 | 一种用于h.265编码的快速帧内尺寸判决方法及装置 |
CN115695797B (zh) * | 2022-10-17 | 2025-02-11 | 厦门亿联网络技术股份有限公司 | 一种用于h.265编码的快速帧内尺寸判决方法及装置 |
CN116437091A (zh) * | 2023-03-16 | 2023-07-14 | 厦门亿联网络技术股份有限公司 | 一种视频编码的编码尺寸判决方法、装置、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN105141954B (zh) | 2018-03-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105141954A (zh) | 一种hevc帧间编码快速模式选择方法 | |
TWI714117B (zh) | 擴展四叉樹、不等四劃分的主要概念以及信令 | |
CN103338371B (zh) | 一种快速高效率视频编码帧内模式判决方法 | |
TWI791252B (zh) | 在高級運動向量預測模式中的圖像解碼方法 | |
CN107623850B (zh) | 一种基于时空相关性的快速屏幕内容编码方法 | |
WO2016115968A1 (zh) | 一种融合视觉感知特征的可分层视频编码方法 | |
CN103546749B (zh) | 利用残差系数分布特征和贝叶斯定理优化hevc残差编码的方法 | |
CN103491334B (zh) | 一种基于区域特征分析的由h264到hevc的视频转码方法 | |
CN104023234B (zh) | 一种适用于hevc的快速帧间预测方法 | |
CN105657433B (zh) | 一种基于图像复杂度的信源实时编码方法及系统 | |
CN104853191B (zh) | 一种hevc的快速编码方法 | |
CN107749988B (zh) | 编码装置和编码方法、解码装置和解码方法 | |
Pan et al. | Low complexity versatile video coding for traffic surveillance system | |
CN106210721B (zh) | 一种hevc快速码率转码方法 | |
CN104333754B (zh) | 基于预测模式快速选择的shvc增强层视频编码方法 | |
WO2022121786A1 (zh) | 视频预测编码的方法及装置 | |
CN104125469A (zh) | 一种用于hevc的快速编码方法 | |
CN101304529A (zh) | 宏块模式的选择方法和装置 | |
JP2024501929A (ja) | 動画予測符号化の方法および装置 | |
CN101867818B (zh) | 宏块模式的选择方法和装置 | |
CN110139099B (zh) | 基于预编码和编码satd值加权的帧间预测模式选择方法 | |
Zhang et al. | Edge-detection based fast intra-mode selection for depth map coding in 3D-HEVC | |
CN103475883B (zh) | 一种基于运动区域划分的hevc运动估计提前终止方法 | |
Liu et al. | A novel fast mode decision algorithm for AVS2 intra coding | |
CN113055670B (zh) | 一种基于hevc/h.265的视频编码的方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |