CN109361921B

CN109361921B - 一种帧内预测编码加速方法

Info

Publication number: CN109361921B
Application number: CN201811354344.7A
Authority: CN
Inventors: 胡金艳; 龚玉梅
Original assignee: Shanghai Polytechnic University
Current assignee: Shanghai Polytechnic University
Priority date: 2018-11-14
Filing date: 2018-11-14
Publication date: 2021-03-26
Anticipated expiration: 2038-11-14
Also published as: CN109361921A

Abstract

本发明公开了一种帧内预测编码加速方法，通过对图像亮度子块进行最邻近子块判断、子块重构和率失真比较，形成最终预测模式的三级加速，确定最终预测模式对子块进行预测编码。第一级加速先确定当前子块的初始最佳预测模式，根据子块重构的率失真判断最终预测模式；第二级加速计算当前子块在各种预测模式下的率失真，根据率失真阈值比较的结果确定最终预测模式；第三级加速取率失真最小的预测模式作为最终预测模式，同时减少对应初始最佳预测模式的子块重构运算。本发明方法使子块重构无需遍历全部预测模式，降低子块重构运算量，从而大幅度提升图像和视频的编码速度。

Description

一种帧内预测编码加速方法

技术领域

本发明涉及图像和视频编码中的帧内预测编码技术，特别涉及一种帧内预测编码加速方法。

背景技术

目前主流的视频编码标准中，关键帧均采用帧内预测编码去除图像的空间冗余，其过程中对亮度分量的每个宏块和宏块中的每个子块进行多种模式的预测和重构，选取最佳预测模式进行帧内编码。

谷歌公司的WebP图像压缩算法就是采用了视频编码中的帧内预测编码技术，从而得到优于JPEG格式的压缩比。在WebP图像压缩中，首先将亮度分量划分为16x16的宏块，每个宏块有4种可选预测模式；再将每个宏块划分为4x4的子块，每个子块有10种可选预测模式。

现有WebP的帧内预测编码中，对于每个4x4子块采取遍历预测模式的方式选取最佳预测模式。需要对10种预测模式进行重构，重构的过程包括离散余弦变换、量化、反量化、反离散余弦变换。现有方式运算量大，不利于实时处理。

发明内容

本发明的目的是提供一种帧内预测编码加速方法，大幅度提升图像和视频编码速度。

为了实现以上目的，本发明是通过以下技术方案实现的：

一种帧内预测编码加速方法，其特点是，包括如下步骤：

S1、获取图像YUV格式，将图像亮度分量Y划分为N个宏块，每个宏块划分为i×i子块；

S2、对每个子块进行最邻近子块判断，确定当前子块的初始最佳预测模式；

S3、按初始最佳预测模式进行当前子块重构，根据率失真判断最终预测模式；

S4、比较当前子块率失真RD_k，确定最终预测模式；

S5、用最终预测模式对当前子块进行编码，直到所有子块编码完成。

所述的步骤S2包括：

S21、确定当前子块在宏块中的位置；

S22、当已知最邻近子块为横向时，将左侧邻近子块作为最邻近子块；

S23、当已知最邻近子块为纵向时，将上方邻近子块作为最邻近子块；

S24、当已知最邻近子块为横向/纵向/对角其中之一时，对左侧、上方和对角子块的率失真进行比较，取率失真最小的子块作为最邻近子块；

S25、取该最邻近子块的最佳预测模式M_prev作为当前子块的初始最佳预测模式M₀。

所述的步骤S3包括：

S31、当前子块的重构过程首先利用初始最佳预测模式M₀对当前子块S_k进行预测，再对预测残差进行离散余弦变换、量化、反量化和反离散余弦变换，进而得到重构子块S’_k；

S32、通过当前子块S_k和重构子块S’_k计算率失真RD_k，同时保存预测模式M₀对应的率失真RD_k。

所述的步骤S4包括如下步骤：

S41、比较当前子块率失真RD_k与先前保存的最邻近子块率失真RD_prev，

当RD_k≤RD_prev时，确定将初始最佳预测模式M₀作为最终预测模式，同时保存该子块的预测模式和率失真为后续子块使用；否则执行步骤42；

S42、用j种预测模式对当前子块进行重构，根据率失真阈值判断最终预测模式：

遍历预测模式对当前子块进行预测，再对预测残差进行离散余弦变换、量化、反量化和反离散余弦变换，进而得到重构子块S’_k；

对每次重构，计算当前子块S_k和重构子块S’_k的率失真RD_k；

遍历过程中，当预测模式与最邻近子块初始最佳预测模式M₀相等时，则不进行重构，采用步骤S32中保存的率失真结果；

S43、比较当前子块率失真RD_k与预先设置的率失真阈值TH；

当RD_k≤TH时，确定将当前所采用的预测模式M_n作为最终预测模式，停止预测模式遍历，同时保存该子块的预测模式和率失真为后续子块使用；否则执行步骤S44；

S44、取预测模式中率失真最小的预测模式作为最终预测模式，在遍历过程中，重构得到的率失真均大于阈值TH，则选对应率失真最小的预测模式作为最终预测模式，同时保存该子块的预测模式和率失真为后续子块使用。

所述的步骤S5后还包含：S6，再对下一个宏块执行同样的步骤S2～S5，直到完成整个图像的编码。

本发明与现有技术相比，具有以下优点：

减小了编码的运算量，同时大幅度提升图像和视频编码速度。

第一级加速：根据当前子块最邻近子块的最佳预测模式及相应率失真，确定当前子块的最终预测模式，减少对预测模式的遍历。

第二级加速：根据率失真阈值判断，确定当前子块的最终预测模式，提前结束对预测模式的遍历。

第三级加速：对预测模式进行遍历时，判断预测模式为初始最佳预测模式时，减少对该模块进行一次重构的运算量。

附图说明

图1为本发明一种帧内预测编码加速方法的流程图；

图2为本发明最邻近子块判断流程图；

图3a～3c为三种最邻近子块示意图；

图4是WebP编码速度比较结果。

具体实施方式

以下结合附图，通过详细说明一个较佳的具体实施例，对本发明做进一步阐述。

一种帧内预测编码加速方法，包括如下步骤：

获取图像YUV格式，将图像亮度分量Y划分为N个宏块，每个宏块划分为4×4子块；

对每个子块进行最邻近子块判断，确定当前子块的初始最佳预测模式；

按初始最佳预测模式进行当前子块重构，根据率失真判断最终预测模式；

比较当前子块率失真RD_k，确定最终预测模式；

用最终预测模式对当前子块进行编码，直到所有子块编码完成。

图1示出了一种帧内预测编码加速方法的流程图，该方法包括：

S11：获取图像YUV格式，将图像亮度Y划分为N个宏块，每个宏块划分为4x4子块。

对图像的YUV数据按4:2:0采样分割，对亮度分量Y按16x16进行宏块划分，再对每个宏块按4x4进行子块划分。

S12：对每个子块进行最邻近子块判断，确定当前子块的初始最佳预测模式。

将当前子块定义为S_k(k＝0,1,…15)。对子块S₁～S₁₅，根据其在宏块中的位置，判断相应的最邻近子块，如图2所示。

当S_k为S₁、S₂、S₃时，S_k的已知最邻近子块为横向，将左侧邻近子块作为最邻近子块，如图3a所示。

当S_k为S₄、S₈、S₁₂时，S_k的已知最邻近子块为纵向，将上方邻近子块作为最邻近子块，如图3b所示。

当S_k为其它情况时(S₀除外)，S_k的已知最邻近子块为横向/纵向/对角其中之一。对S_k左侧、上方和对角子块的率失真RD_k-1、RD_k-4和RD_k-5进行比较，取率失真最小的子块作为最邻近子块，如图3c所示。

根据上述步骤确定当前子块的最邻近子块，取该最邻近子块的最佳预测模式M_prev作为当前子块的初始最佳预测模式M₀。

S13：按初始最佳预测模式进行当前子块重构，根据率失真判断最终预测模式。

当前子块的重构过程首先利用初始最佳预测模式M₀对当前子块S_k进行预测，再对预测残差进行离散余弦变换、量化、反量化和反离散余弦变换，进而得到重构子块S’_k。

通过当前子块S_k和重构子块S’_k计算率失真RD_k。同时保存预测模式M₀对应的率失真RD_k。

S14：确定最终预测模式。

比较当前子块率失真RD_k与先前保存的最邻近子块率失真RD_prev。

当RD_k≤RD_prev时，确定将初始最佳预测模式M₀作为最终预测模式，同时保存该子块的预测模式和率失真为后续子块使用；否则执行步骤S15。

S15：用10种预测模式对当前子块进行重构，根据率失真阈值判断最终预测模式。

遍历模式0～9对当前子块进行预测，再对预测残差进行离散余弦变换、量化、反量化和反离散余弦变换，进而得到重构子块S’_k。

对每次重构，计算当前子块S_k和重构子块S’_k的率失真RD_k。

遍历过程中，当预测模式与最邻近子块初始最佳预测模式M₀相等时，则不进行重构，采用步骤S13中保存的率失真结果。

S16：确定最终预测模式。

比较当前子块率失真RD_k与预先设置的率失真阈值TH。

当RD_k≤TH时，确定将当前所采用的预测模式M_n(0～9其中之一)作为最终预测模式，停止预测模式遍历，同时保存该子块的预测模式和率失真为后续子块使用；否则执行步骤S17。

S17：取预测模式中率失真最小的预测模式作为最终预测模式。

上述遍历过程中，重构得到的率失真均大于阈值TH，则选10种预测模式中对应率失真最小的预测模式作为最终预测模式。

同时保存该子块的预测模式和率失真为后续子块使用。

S18：用最终预测模式对当前子块进行编码，直到所有子块编码完成。

采用确定的最终预测模式，对当前子块S_k进行编码，直到当前宏块中的所有子块编码完成。

再对下一个宏块执行同样的步骤S12～S18，直到完成整个图像的编码。

为了说明本发明的性能，对不同图像分别采用帧内预测编码加速方法和原始方法进行WebP图像编码，具体为：Monarch[768x 512]，Boy[768x 512]，Balloon[1136x 818]，Horses[1136x 818]，Market[2048x 1536]，Building[3888x 2592]，图4为WebP编码速度比较结果。

尽管本发明的内容已经通过上述优选实施例作了详细介绍，但应当认识到上述的描述不应被认为是对本发明的限制。在本领域技术人员阅读了上述内容后，对于本发明的多种修改和替代都将是显而易见的。因此，本发明的保护范围应由所附的权利要求来限定。

Claims

1.一种帧内预测编码加速方法，其特征在于，包括如下步骤：

S4、比较当前子块率失真RD_k，确定最终预测模式；

S5、用最终预测模式对当前子块进行编码，直到所有子块编码完成；所述的步骤S2包括：

S21、确定当前子块在宏块中的位置；

S25、取该最邻近子块的最佳预测模式M_prev作为当前子块的初始最佳预测模式M₀；

所述的步骤S3包括：

S32、通过当前子块S_k和重构子块S’_k计算率失真RD_k，同时保存预测模式M₀对应的率失真RD_k；

所述的步骤S4包括如下步骤：

对每次重构，计算当前子块S_k和重构子块S’_k的率失真RD_k；

S43、比较当前子块率失真RD_k与预先设置的率失真阈值TH；

2.如权利要求1所述的帧内预测编码加速方法，其特征在于，所述的步骤S5后还包含：

S6，再对下一个宏块执行同样的步骤S2～S5，直到完成整个图像的编码。