CN101783951B - 基于人类视觉系统的视频编码帧间预测模式快速确定方法 - Google Patents
基于人类视觉系统的视频编码帧间预测模式快速确定方法 Download PDFInfo
- Publication number
- CN101783951B CN101783951B CN 201010116127 CN201010116127A CN101783951B CN 101783951 B CN101783951 B CN 101783951B CN 201010116127 CN201010116127 CN 201010116127 CN 201010116127 A CN201010116127 A CN 201010116127A CN 101783951 B CN101783951 B CN 101783951B
- Authority
- CN
- China
- Prior art keywords
- mode
- inter
- pattern
- block
- frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 28
- 230000000007 visual effect Effects 0.000 claims abstract description 13
- 238000001914 filtration Methods 0.000 claims abstract description 6
- 238000013507 mapping Methods 0.000 claims description 5
- 238000013139 quantization Methods 0.000 claims description 2
- 238000005192 partition Methods 0.000 claims 1
- 238000004364 calculation method Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明公开了一种基于人类视觉系统的视频编码帧间预测模式快速确定方法,其特征在于,包括如下执行步骤:首先对输入的参考帧图像和当前帧图像进行HVS滤波,然后对滤波后的图像划分成宏块并按照HVS滤波后图像中每个MB的均值和方差确定该MB的划分方式是SKIP,16x16,16x8,8x16,8x8五种模式中的一种,如果所确定的类型为8x8,则再计算其中8x8,4x8,8x4,4x4中的均值和方差,并最终确定8x8,4x8,8x4,4x4中的具体对应模式。在帧间预测模式确定基础上进行有针对性的运动估计与运动补偿。
Description
技术领域
本发明涉及视频编码标准中的帧间预测模式划分或确定方法,具体涉及一种按照人类视觉系统(HVS)特性进行H.264/AVC视频编码帧间预测模式的确定方法。
背景技术
视频编码中的帧间预测模式由于涉及运动估计,所以计算的复杂度非常高,尤其是在H.264/AVC视频编码中,帧间预测模式在确定前需要从大量候选的帧间预测模式中确定一种最优的模式。这种编码方式需要大量的运算,
发明内容
本发明的目的是提供一种按照HVS滤波的方法进行最优的H.264/AVC视频编码帧间预测模式选择,在确定最优模式之后进行运动估计,这样的运动估计和运动补偿方法仅仅针对所选择的模式进行,而对其它非选择的模式不进行运动估计,因此能够有效地提高编码器的执行效率,尤其是在实时编码的场合中更能体现其优越性。
为达到以上目的,本发明是采取如下技术方案予以实现的:
一种基于人类视觉系统的视频编码帧间预测模式快速确定方法,其特征在于,包括下述步骤:
首先执行步骤01,对参考帧图像和当前帧图像进行基于人类视觉系统特性相关的滤波,得到滤波后的残差图像PRD;同时执行步骤06,对当前帧图像进行帧内预测模式选择,以确定一种最佳的帧内预测模式及其相应的编码代价RDC;
然后执行步骤02,对残差图像PRD划分成16x16的宏块MB并计算每个宏块MB的均值和方差;
接下来执行步骤03,对每个宏块MB进行帧间预测模式划分,将MB划分成SKIP模式、一个16x16块模式、两个16x8块模式、两个8x16块模式或四个8x8块模式;当所述宏块MB的模式划分为SKIP模式时,则自动跳至步骤08;当所述宏块MB的模式划分为16x16,16x8,或者8x16三种模式中的一种,则自动跳过步骤04,执行步骤05、步骤07至08;当所述宏块MB的模式划分为8x8模式,则执行步骤04;
步骤04对8x8块模式再划分成:一个8x8块、两个8x4块、两个4x8块或四个4x4块;
接下来执行步骤05,对步骤03和步骤04中所确定的划分模式来进行运动估计和运动补偿,以确定最终划分块的运动矢量MV,并计算在上述模式划分下宏块MB的编码代价RDC;
然后执行步骤07,根据步骤05所确定的帧间预测模式的编码代价RDC以及步骤06所确定的帧内预测模式的编码代价RDC选择当前宏块MB是采用帧内还是帧间预测模式;
最后执行步骤08,进行H.264/AVC熵编码器并形成最终的编码比特输出。
上述方法中,步骤02所述对每个宏块的均值和方差计算按照以下公式进行,对一个大小为MxN的块f(m,n)的均值μ(M,N)和方差δ(M,N)为:
式中:M,N的取值为4、8、16,(m,n)表示横纵坐标位置。
步骤03所述将一个16x16的MB划分成SKIP模式,16x16模式,16x8模式,8x16模式和8x8模式的计算依据如下式:
式中Mode16x16表示最终所确定的MB划分的类型,JNDth表示对应16x16宏块MB所设定的阈值;δ*(16,8),δ*(8,16)和δ*(8,8)分别表示两个16x8,两个8x16和四个8x8模式中方差最大值。
步骤04所述将一个8x8块再划分成8x8模式,8x4模式,4x8模式和8x8模式的计算依据如下式:
与现有技术相比,本发明的方法可以嵌入H.264/AVC编解码器中,因此不会破坏H.264/AVC的码流结构,具有良好的通用性。可以和目前H.264/AVC编解码器相兼容。另外,本发明中给出了QP和JNDth之间的映射关系,这样可以在不改变编码配置的情况下,实现编码,因此具有易用性。
附图说明
以下结合附图及具体实施方式对本发明作进一步的详细说明。
图1为本发明的基于HVS的视频编码帧间预测模式快速确定方法的步骤流程框图。
具体实施方式
如图1所示,本发明基于HVS进行H.264/AVC视频编码快速确定帧间预测模式的方法包括如下执行步骤:
首先执行步骤01,对参考帧和当前编码帧(P帧或者B帧)进行基于人类视觉系统特性相关的滤波(简称HVS滤波),得到滤波后的残差图像(简称PRD);同时执行步骤06,对当前帧图像进行帧内预测模式选择,以确定一种最佳的帧内预测模式及其相应的编码代价RDC;
然后执行步骤02,对HVS滤波后的残差图像PRD划分成16x16的宏块(简称MB)并计算每个MB的均值和方差;
接下来执行步骤03,对每个MB进行帧间预测模式选择,将MB划分成:单元030所对应的SKIP(即对当前MB的运动矢量和残差不进行编码)模式,或单元031所对应的一个16x16块;或单元032所对应的两个16x8块;或单元033所对应的两个8x16块;或单元034所对应的四个8x8块中的一种。
在步骤03中如果一个MB的模式划分为030单元所对应的SKIP模式,则自动跳至步骤08进行熵编码该模式进行码流输出;若一个MB划分的模式为16x16,16x8,或者8x16三种模式中的一种,则自动跳过步骤04,执行步骤05至步骤08;若一个MB划分的模式为单元034中所对应的8x8模式,则需对这4个8x8块的模式执行步骤04以再次确定其更为精细的模式。步骤04对034单元中所划分的四个8x8块再划分成:单元041所对应的一个8x8块;或单元042所对应的两个8x4块;或单元043所对应的两个4x8块;或单元044所对应的四个4x4块中的一种;
接下来执行步骤05,对当前MB按照步骤03和04中所确定的划分模式来进行运动估计和运动补偿,以确定最终划分块的运动矢量MV,并计算在上述模式划分下当前MB的编码的码率与失真度优化关系函数RDC;
然后执行步骤07,帧内和帧间预测模式选择,根据步骤05中所确定的帧间预测模式以及06步骤中所确定的帧内预测模式的RDC选择当前MB是采用帧内还是帧间预测模式。
最后执行步骤08,进行熵编码器并形成最终的编码比特输出。
在上述步骤01中,对预测参考帧和当前参考帧作HVS滤波的方法采用公知的方法。该部分内容在文献(X.Zhang,W.Lin,and P.Xue,“Improvedestimation for just-noticeable visual distortion,”Signal Process,vol.85,pp.795-808,2005.)中有详细的报道。经过HVS滤波之后得到一个基于视觉率的残差图像PRD。
在上述步骤02中残差图像PRD中每个宏块的均值和方差按照公式(1)和公式(2)进行计算。对一个大小为MxN的块f(m,n)的均值μ(M,N)和方差δ(M,N)
式中:M,N的取值为4、8、16,对应一个MB可能划分的尺寸范围,如16x16,16x8,8x16,8x8,8x4,4x8,4x4。在上述步骤03中根据上述公式中的均值和方差将一个MB的具体模式划分为单元030,单元031,单元032,单元033,和单元034所对应的5种模式中的一种。本发明中将一个16x16的MB划分成SKIP,16x16,16x8,8x16和8x8模式的计算依据是公式(3)
在公式(3)中Mode16x16表示最终所确定的MB划分的类型。如果当一个宏块同时满足均值为0和方差为0的约束条件(也即μ(16,16)=0&δ(16,16)=0)则该MB的类型确定为030单元中所对应的SKIP模式。如果一个MB的均值为0但是方差小于或等于一个设定的阈值JNDth(也即μ(16,16)=0&δ(16,16)≤JNDth),则确定该MB的类型为031单元中所对应的16x16模式。如果当一个宏块同时满足均值不为0和方差大于JNDth的约束条件(也即μ(16,16)≠0&δ(16,16)>JNDth),此时需要对该MB作细致的类型划分,划分的类型包括如下三种模式:单元032两个16x8,单元033两个8x16和单元034四个8x8模式。设δ*(16,8),δ*(8,16)和δ*(8,8)分别表示两个16x8,两个8x16和四个8x8模式中方差最大值。如果δ*(16,8)上述三种细致划分的最大值(也即δ*(16,8)=max{δ*(16,8),δ*(8,16),δ*(8,8)}),则将该MB划分成单元032中所对应的两个16x8块模式。如果δ*(8,16)上述三种细致划分中的最大值(也即δ*(8,16)=max{δ*(16,8),δ*(8,16),δ*(8,8)}),则将该MB划分成单元033中所对应的两个8x16块模式。如果δ*(8,8)上述三种细致划分中的最大值(也即δ*(8,8)=max{δ*(16,8),δ*(8,16),δ*(8,8)}),则将该MB划分成单元034中所对应的四个8x8块模式。
在步骤04中将该每个8x8块划分成如下四个模式:单元041中的一个8x8块模式,单元042中的两个8x4块模式,单元043中的两个4x8块模式和单元043中的四个4x4块模式中的一种模式。本发明中将一个8x8块划分成8x8,8x4,4x8和8x8模式的计算依据是公式(4)
在公式(4)中Mode8x8表示最终所确定的MB划分的类型。如果一个8x8块的均值为0但是方差小于或等于一个设定的阈值(也即)则确定该8x8块的类型为8x8。如果当一个8x8块同时满足均值不为0和方差大于的约束条件(也即),此时需要对该8x8块作细致的类型划分,划分的类型包括如下几种模式:两个4x8,两个8x4和四个4x4模式。设δ*(4,8),δ*(8,4)和δ*(4,4)分别表示两个4x8,两个8x4和四个4x4模式中方差最大值。如果δ*(8,4)上述三种细致划分中的最大值(也即δ*(8,4)=max{δ*(4,8),δ*(8,4),δ*(4,4)}),则将该8x8块划分成两个8x4块模式。如果δ*(4,8)上述三种细致划分中的最大值(也即δ*(4,8)=max{δ(4,8),δ(8,4),δ*(4,4)}),则将该8x8块划分成两个4x8块模式。如果δ*(4,4)上述三种细致划分中的最大值(也即δ*(4,4)=max{δ*(4,8),δ*(8,4),δ*(4,4)}),则将该8x8块划分成4个4x4块模式。
经过步骤03和04将模式进行了划分,在划分模式之后执行运动估计步骤05,对每个划分的子块分别作运动估计并得出其相应的运动矢量。在获得一个MB的模式划分和相应的运动矢量之后,可以得到运动补偿之后的残差信息。计算在上述划分下的帧间预测模式下所得出的编码代价RDC。
其中步骤05、07、08和H.264/AVC标准中的处理方式完全一致,在本发明中不作改动。
在上述步骤03和04中JNDth和的作用与H.264/AVC编码标准中的QP(量化参数值)的相同。本发明中设定通过调整值JNDth就可以达到实现视频质量可控的目的。为了和原始的H.264/AVC视频编码标准中的视频质量设置方法相一致,本发明中给出了JNDth和QP值之间对应的映射关系对照表。
表1.JNDth和QP值之间对应的映射关系对照表
QP | 40 | 36 | 32 | 28 | 24 | 20 | 16 | 12 |
JNDth | 2 | 1.5 | 1.2 | 1.0 | 0.7 | 0.2 | 0.08 | 0.03 |
我们对football,foreman,mobile,bus和soccer五个视频测试序列在同样参数配置的情况下所得出的性能对比如表2所示。其中ΔYPSNR是本发明中的方法相对于H.264/AVC中的方法的PSNR增益。而Speedup是本发明方法相对于H.264/AVC中的时间节省情况。
ΔYPSNR=HVSPSNR-JMPSNR
从表2的对比实验可以看出本发明中的方法在编码参数设置相同的时候,不仅具有编码质量的提升同时还能够有效地提升编码的速度。
表2.本发明中的方法与H.264/AVC编码器(JM16.0)的性能对比
Sequence | football | foreman | mobile | bus | soccer |
ΔYPSNR(dB) | 0.691 | 0.302 | 0.363 | 0.214 | 0.167 |
Speedup(%) | 71.54 | 78.34 | 88.15 | 89.34 | 80.63 |
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的硬件平台的方式来实现,当然也可以全部通过硬件来实施。
以上仅为本发明较佳的具体实施方式:如改变HVS滤波器,改用模式选择中的阈值确定方法,QP和JNDth之间映射关系等,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,可轻易想到的变化或替换,都可能落入本发明的保护范围之内。
Claims (5)
1.一种基于人类视觉系统的视频编码帧间预测模式快速确定方法,其特征在于,包括下述步骤:
首先执行步骤01,对参考帧图像和当前帧图像进行基于人类视觉系统特性相关的滤波,得到滤波后的残差图像PRD;同时执行步骤06,对当前帧图像进行帧内预测模式选择,以确定一种最佳的帧内预测模式及其相应的编码代价RDC;
然后执行步骤02,对残差图像PRD划分成16x16的宏块MB并计算每个宏块MB的均值和方差;
接下来执行步骤03,对每个宏块MB进行帧间预测模式划分,将MB划分成SKIP模式、一个16x16块模式、两个16x8块模式、两个8x16块模式或四个8x8块模式;当所述宏块MB的模式划分为SKIP模式时,则自动跳至步骤08;当所述宏块MB的模式划分为16x16,16x8,或者8x16三种模式中的一种,则自动跳过步骤04,执行步骤05、步骤07至08;当所述宏块MB的模式划分为8x8模式,则执行步骤04;
步骤04对8x8块模式再划分成:一个8x8块、两个8x4块、两个4x8块或四个4x4块;
接下来执行步骤05,对步骤03和步骤04中所确定的划分模式来进行运动估计和运动补偿,以确定最终划分块的运动矢量MV,并计算在上述模式划分下宏块MB的编码代价RDC;
然后执行步骤07,根据步骤05所确定的帧间预测模式的编码代价RDC以及步骤06所确定的帧内预测模式的编码代价RDC选择当前宏块MB是采用帧内还是帧间预测模式;
最后执行步骤08,进行H.264/AVC熵编码器并形成最终的编码比特输出。
5.如权利要求3所述的基于人类视觉系统的视频编码帧间预测模式快速确定方法,其特征在于,步骤03所述的JNDth与H.264/AVC编码标准中的量化参数值QP之间为对应的映射关系。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201010116127 CN101783951B (zh) | 2010-03-02 | 2010-03-02 | 基于人类视觉系统的视频编码帧间预测模式快速确定方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201010116127 CN101783951B (zh) | 2010-03-02 | 2010-03-02 | 基于人类视觉系统的视频编码帧间预测模式快速确定方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101783951A CN101783951A (zh) | 2010-07-21 |
CN101783951B true CN101783951B (zh) | 2012-01-04 |
Family
ID=42523737
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 201010116127 Expired - Fee Related CN101783951B (zh) | 2010-03-02 | 2010-03-02 | 基于人类视觉系统的视频编码帧间预测模式快速确定方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101783951B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2011296954B2 (en) * | 2010-09-03 | 2016-02-11 | Sony Corporation | Encoding device and encoding method, as well as decoding device and decoding method |
US8526495B2 (en) * | 2010-11-22 | 2013-09-03 | Mediatek Singapore Pte. Ltd. | Apparatus and method of constrained partition size for high efficiency video coding |
CN102647587B (zh) * | 2011-02-16 | 2015-01-21 | 富士通株式会社 | 运动估计方法和装置 |
JP5875236B2 (ja) | 2011-03-09 | 2016-03-02 | キヤノン株式会社 | 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム |
CN102404570B (zh) * | 2011-11-16 | 2014-06-04 | 浙江工业大学 | 基于率失真敏感度的多视点视频编码快速模式选择方法 |
CN102647598B (zh) * | 2012-05-10 | 2014-01-15 | 重庆大学 | 基于极大极小mv差值的h.264帧间模式优化方法 |
US20140029670A1 (en) * | 2012-07-27 | 2014-01-30 | Motorola Mobility Llc | Devices and methods for processing of partition mode in high efficiency video coding |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1976476A (zh) * | 2006-12-22 | 2007-06-06 | 上海广电(集团)有限公司中央研究院 | 融合多参考帧选择和运动估计的快速帧间模式判决方法 |
CN101340593A (zh) * | 2008-08-13 | 2009-01-07 | 武汉大学 | 一种容错性视频转码中的率失真优化方法 |
CN101516028A (zh) * | 2008-02-18 | 2009-08-26 | 昊迪移通(北京)技术有限公司 | 一种针对移动网视频通话应用的高效视频编码技术 |
CN101527854A (zh) * | 2009-01-20 | 2009-09-09 | 源见科技(苏州)有限公司 | 帧间模式选择方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4197695B2 (ja) * | 2005-08-11 | 2008-12-17 | 株式会社東芝 | 動画像符号化方法、装置及びプログラム |
US8155189B2 (en) * | 2005-10-19 | 2012-04-10 | Freescale Semiconductor, Inc. | System and method of coding mode decision for video encoding |
US9014280B2 (en) * | 2006-10-13 | 2015-04-21 | Qualcomm Incorporated | Video coding with adaptive filtering for motion compensated prediction |
CN100571390C (zh) * | 2006-12-21 | 2009-12-16 | 联想(北京)有限公司 | 一种h264视频编码快速模式选择方法和装置 |
CN101562750B (zh) * | 2009-05-25 | 2011-02-09 | 腾讯科技(深圳)有限公司 | 视频编码快速模式选择装置及方法 |
-
2010
- 2010-03-02 CN CN 201010116127 patent/CN101783951B/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1976476A (zh) * | 2006-12-22 | 2007-06-06 | 上海广电(集团)有限公司中央研究院 | 融合多参考帧选择和运动估计的快速帧间模式判决方法 |
CN101516028A (zh) * | 2008-02-18 | 2009-08-26 | 昊迪移通(北京)技术有限公司 | 一种针对移动网视频通话应用的高效视频编码技术 |
CN101340593A (zh) * | 2008-08-13 | 2009-01-07 | 武汉大学 | 一种容错性视频转码中的率失真优化方法 |
CN101527854A (zh) * | 2009-01-20 | 2009-09-09 | 源见科技(苏州)有限公司 | 帧间模式选择方法 |
Also Published As
Publication number | Publication date |
---|---|
CN101783951A (zh) | 2010-07-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101783951B (zh) | 基于人类视觉系统的视频编码帧间预测模式快速确定方法 | |
CN105430407B (zh) | 应用于h.264到hevc转码的快速帧间模式决策方法 | |
CN107147911B (zh) | 基于局部亮度补偿lic的快速帧间编码模式选择方法及装置 | |
CN101964906B (zh) | 基于纹理特性的快速帧内预测方法和装置 | |
Lee et al. | A frame-level rate control scheme based on texture and nontexture rate models for high efficiency video coding | |
CN101572817A (zh) | 一种用于空间可分级视频编码的编码模式选择方法 | |
CN101317458A (zh) | 在编码过程中实现自适应量化的方法及装置 | |
CN103945220B (zh) | 一种用于高效视频编码hevc的量化优化方法 | |
CN104796693A (zh) | 一种hevc快速cu深度划分编码方法 | |
CN105491385A (zh) | 一种hevc帧内编码单元划分的快速决策方法 | |
CN103118262B (zh) | 率失真优化方法及装置、视频编码方法及系统 | |
CN102186081B (zh) | 一种基于梯度向量的h.264帧内模式选择方法 | |
CN102025995A (zh) | 一种可伸缩视频编码的空间增强层快速模式选择方法 | |
CN103888763B (zh) | 一种基于hevc的帧内编码方法 | |
CN103796033B (zh) | 一种高效视频编码零系数提前检测方法 | |
CN103634600A (zh) | 一种基于ssim评价的视频编码模式选择方法、系统 | |
CN102685497B (zh) | 一种avs编码器快速帧间模式选择方法及装置 | |
CN108063945B (zh) | 一种基于元素类别的线性码率估计方法 | |
CN100558169C (zh) | 视频转码中帧间模式的快速选择方法 | |
CN101984669A (zh) | 一种帧层次自适应维纳插值滤波器的迭代方法 | |
CN105812796B (zh) | 一种scc帧间编码单元备选预测模式缩减方法 | |
CN103442235B (zh) | 一种图像处理方法以及装置 | |
CN106231303A (zh) | 一种hevc编码中使用预测模式进行复杂度控制的方法 | |
CN100397906C (zh) | 一种视频信息的快速帧间模式选择方法 | |
CN102148974A (zh) | 一种时域帧编码中的快速空域预测算法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20120104 Termination date: 20140302 |