[go: up one dir, main page]

CN116567254A - 一种适用于多种视频编码标准的分像素运动估计快速算法 - Google Patents

一种适用于多种视频编码标准的分像素运动估计快速算法 Download PDF

Info

Publication number
CN116567254A
CN116567254A CN202310556278.6A CN202310556278A CN116567254A CN 116567254 A CN116567254 A CN 116567254A CN 202310556278 A CN202310556278 A CN 202310556278A CN 116567254 A CN116567254 A CN 116567254A
Authority
CN
China
Prior art keywords
imv
sub
motion estimation
pixel
fmv
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310556278.6A
Other languages
English (en)
Inventor
范益波
陈数士
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Xinkai Technology Co ltd
Original Assignee
Shanghai Xinkai Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Xinkai Technology Co ltd filed Critical Shanghai Xinkai Technology Co ltd
Priority to CN202310556278.6A priority Critical patent/CN116567254A/zh
Publication of CN116567254A publication Critical patent/CN116567254A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/567Motion estimation based on rate distortion criteria

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明涉及数字高清视频编解码技术领域,公开了一种适用于多种视频编码标准的分像素运动估计快速算法,包括以下步骤:S1、计算IMV及其附近八个整数像素点对应CU大小的参考像素与原始像素残差的SATD值,得到失真代价;S2、计算IMV及其附近八个整数像素点对应整数运动矢量的无符号指数哥伦布编码值,得到码率代价;S3、计算IMV及其附近八个整数像素点对应的九个率失真代价;S4、建立误差曲面方程,求解误差曲面的最低点的位置,再将该位置舍入到1/4像素精度获得FMV。本发明可以避免插值计算,加速分像素运动估计过程;对视频编码引起的峰值信噪比下降较小,且比特传输速率升高较小;可以很好地去除时间域的冗余度,减少计算的复杂度,降低编码时间,提高编码效率。

Description

一种适用于多种视频编码标准的分像素运动估计快速算法
技术领域
本发明涉及数字高清视频编解码技术领域,具体是一种适用于多种视频编码标准的分像素运动估计快速算法。
背景技术
随着通讯技术的不断进步,网络直播,短视频,视频通话等应用蓬勃发展。为了降低视频的存储,传输等代价,涌现了各种视频编解码标准。由于在视频序列中的物体,其运动一般是连续的;因此在不同帧中图像块的运动偏移一般也不会是整数像素精度;为了提高运动补偿的准确性,各种视频编解码标准中,如VVC,HEVC,AVC,AV1,AVS3等多种编码标准中都引入了分像素精度的运动补偿;在分像素运动补偿过程中,一般需要在编码端进行分像素运动估计,包括插值、计算代价和选取最优分像素点等过程,计算复杂度较高。
如《计算机工程与应用》(向东,骆正华,武汉理工大学计算机科学与技术学院,武汉430063;中南财经政法大学信息学院,武汉430073)公开了基于分组误差的快速分数像素运动估计算法,其根据匹配准则的目标函数在最优运动矢量的附近都是单调递增这一假设,提出一种基于分组误差的快速分数像素运动估计算法;该算法不但能够有效降低分数像素运动估计的计算量,而且还能保持较小的率失真性能损失,但是其不能有效地降低编码时间,提高编码效率。
发明内容
本发明的目的在于提供一种适用于多种视频编码标准的分像素运动估计快速算法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种适用于多种视频编码标准的分像素运动估计快速算法,包括以下步骤:
S1、以整数像素运动估计过程的结果作为搜索起点,计算IMV及其附近八个整数像素点对应CU大小的参考像素与原始像素残差的SATD值,得到失真代价;其中,IMV即整像素运动矢量,CU即编码单元,SATD值即将残差经哈德曼变换的系数绝对值总和;
S2、计算IMV及其附近八个整数像素点对应整数运动矢量的无符号指数哥伦布编码值,得到码率代价;
S3、根据S1步骤得到的失真代价以及S2步骤得到的码率代价,计算IMV及其附近八个整数像素点对应的九个率失真代价;
S4、在九个率失真代价的基础上,以建立误差曲面方程,求解误差曲面的最低点的位置,再将该位置舍入到1/4像素精度获得FMV,根据FMV确定最优的运动矢量,以实现加速分像素运动估计过程,其中,FMV即分像素运动矢量。
作为本发明再进一步的方案:在所述S1步骤中,分像素运动估计支持多种编解码标准中所有允许的帧间CU的搜索;
作为本发明再进一步的方案:在所述S4步骤中,误差曲面方程的公式如下:
上式(1)中,xi,yi代表IMV及其附近八个整数像素点对应整数运动矢量;C(xi,yi)代表IMV及其附近八个整数像素点对应的率失真代价;P1、P2、P3、P4、P5、P6分别代表误差曲面的六个参数。
作为本发明再进一步的方案:将IMV及附近八个整数像素点对应的九个率失真代价代入误差曲面方程公式(1)中,建立线性方程,线性方程的公式如下:
解出误差曲面方程的五个参数后,便可得完整的误差曲面方程。
作为本发明再进一步的方案:在所述S4步骤中,曲面的最低点位置的公式如下:
其中,FMVx和FMVy分别是分像素运动矢量的水平以及垂直分量;
再将计算出的FMVx和FMVy值舍入到1/4像素精度,即可获得FMV。
与现有技术相比,本发明的有益效果:
本发明先根据整像素运动矢量计算失真代价和码率代价;再根据失真代价和码率代价计算九个率失真代价,并建立误差曲面方程,计算出误差曲面的最低点的位置,确定最优的分像素运动矢量,以实现加速分像素运动估计过程,该算法可以避免插值计算,加速分像素运动估计过程;对视频编码引起的峰值信噪比下降较小,且比特传输速率升高较小;可以很好地去除时间域的冗余度,减少计算的复杂度,降低编码时间,提高编码效率。
附图说明
图1为一种适用于多种视频编码标准的分像素运动估计快速算法中最优运动矢量获取的示意图。
具体实施方式
请参阅图1,本发明实施例中,一种适用于多种视频编码标准的分像素运动估计快速算法,包括以下步骤:
S1、以整数像素运动估计过程的结果作为搜索起点,计算IMV及其附近八个整数像素点对应CU大小的参考像素与原始像素残差的SATD值,得到失真代价;其中,IMV即整像素运动矢量,CU即编码单元,SATD值即将残差经哈德曼变换的系数绝对值总和;
S2、计算IMV及其附近八个整数像素点对应整数运动矢量的无符号指数哥伦布编码值,得到码率代价;
S3、根据S1步骤得到的失真代价以及S2步骤得到的码率代价,计算IMV及其附近八个整数像素点对应的九个率失真代价,如计算出的九个率失真代价分别为C1(0,0),C2(-1,-1),C3(0,-1),C4(1,-1),C5(-1,0),C6(1,0),C7(-1,1),C8(0,1),C9(1,1);
S4、在九个率失真代价的基础上,以建立误差曲面方程,求解误差曲面的最低点的位置,再将该位置舍入到1/4像素精度获得FMV,根据FMV确定最优的运动矢量,以实现加速分像素运动估计过程,其中,FMV即分像素运动矢量。
优选的,在S1步骤中,分像素运动估计支持多种编解码标准中所有允许的帧间CU的搜索;
优选的,在S4步骤中,误差曲面方程的公式如下:
上式(1)中,xi,yi代表IMV及其附近八个整数像素点对应整数运动矢量;C(xi,yi)代表IMV及其附近八个整数像素点对应的率失真代价;P1、P2、P3、P4、P5、P6分别代表误差曲面的六个参数。
优选的,将IMV及附近八个整数像素点对应的九个率失真代价代入误差曲面方程公式(1)中,建立线性方程,线性方程的公式如下:
将C1(0,0),C2(-1,-1),C3(0,-1),C4(1,-1),C5(-1,0),C6(1,0),C7(-1,1),C8(0,1),C9(1,1)带入到公式(2)中得到:
为表述方便,将公式(2)表示为如下矩阵形式:
P=(XTX)-1XTC (3)
上式(3)中,P表示六个参数,X为IMV及附近八个整数像素点对应的坐标,C为相应的率失真代价,T表示转置操作;
由于参数P6对最低点预测没有影响,因此将其删除,得到:
计算得到:P1=-0.0142,P2=-0.0059,P3=-0.0176,P4=-0.0218,P5=-0.0069,解出误差曲面方程的五个参数后,便可得完整的误差曲面方程。
优选的,在S4步骤中,曲面的最低点位置的公式如下:
其中,FMVx和FMVy分别是分像素运动矢量的水平以及垂直分量,将P1、P2、P3、P4和P5的参数值带入到公式(4)中,得到:
再将计算出的FMVx和FMVy值舍入到1/4像素精度,即可获得FMV。
为了更好地说明本发明的技术效果,通过下述试验进行阐述:
采用本发明的方法测试本文算法,并与分数像素分级搜索算法(HS)和分数像素运动估计算法(FPME)的性能,采用的分辨率分别为1080p,帧数为240;量化参数QP值分别取22、27、32;编码条件是随机访问配置模式;测量编码时的比特传输速率(b)、峰值信噪比(PSNR)以及编码时间(t);对比结果见表1所示。
表1比特传输速率、峰值信噪比以及编码时间分析对比表
从上表1可以得出:与分数像素分级搜索算法(HS)和分数像素运动估计算法(FPME)相比,本发明中的编码时间显著小于分数像素分级搜索算法(HS)和分数像素运动估计算法的编码时间;本发明中的编码时间变化值显著大于分数像素分级搜索算法(HS)和分数像素运动估计算法的的编码时间变化值。
进而可以得出:本发明采用的算法可以避免插值计算,加速分像素运动估计过程;对视频编码引起的峰值信噪比下降较小,且比特传输速率升高较小;编码时间有较大的降低,编码效率有较大的提高,降低了编码计算的复杂度。
以上的,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (5)

1.一种适用于多种视频编码标准的分像素运动估计快速算法,其特征在于,包括以下步骤:
S1、以整数像素运动估计过程的结果作为搜索起点,计算IMV及其附近八个整数像素点对应CU大小的参考像素与原始像素残差的SATD值,得到失真代价;其中,IMV即整像素运动矢量,CU即编码单元,SATD值即将残差经哈德曼变换的系数绝对值总和;
S2、计算IMV及其附近八个整数像素点对应整数运动矢量的无符号指数哥伦布编码值,得到码率代价;
S3、根据S1步骤得到的失真代价以及S2步骤得到的码率代价,计算IMV及其附近八个整数像素点对应的九个率失真代价;
S4、在九个率失真代价的基础上,以建立误差曲面方程,求解误差曲面的最低点的位置,再将该位置舍入到1/4像素精度获得FMV,根据FMV确定最优的运动矢量,以实现加速分像素运动估计过程,其中,FMV即分像素运动矢量。
2.根据权利要求1所述的一种适用于多种视频编码标准的分像素运动估计快速算法,其特征在于,在所述S1步骤中,分像素运动估计支持多种编解码标准中所有允许的帧间CU的搜索。
3.根据权利要求1所述的一种适用于多种视频编码标准的分像素运动估计快速算法,其特征在于,在所述S4步骤中,误差曲面方程的公式如下:
上式(1)中,xi,yi代表IMV及其附近八个整数像素点对应整数运动矢量;C(xi,yi)代表IMV及其附近八个整数像素点对应的率失真代价;P1、P2、P3、P4、P5、P6分别代表误差曲面的六个参数。
4.根据权利要求3所述的一种适用于多种视频编码标准的分像素运动估计快速算法,其特征在于,将IMV及附近八个整数像素点对应的九个率失真代价代入误差曲面方程公式(1)中,建立线性方程,线性方程的公式如下:
解出误差曲面方程的五个参数后,便可得完整的误差曲面方程。
5.根据权利要求1所述的一种适用于多种视频编码标准的分像素运动估计快速算法,其特征在于,在所述S4步骤中,曲面的最低点位置的公式如下:
其中,FMVx和FMVy分别是分像素运动矢量的水平以及垂直分量;
再将计算出的FMVx和FMVy值舍入到1/4像素精度,即可获得FMV。
CN202310556278.6A 2023-05-17 2023-05-17 一种适用于多种视频编码标准的分像素运动估计快速算法 Pending CN116567254A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310556278.6A CN116567254A (zh) 2023-05-17 2023-05-17 一种适用于多种视频编码标准的分像素运动估计快速算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310556278.6A CN116567254A (zh) 2023-05-17 2023-05-17 一种适用于多种视频编码标准的分像素运动估计快速算法

Publications (1)

Publication Number Publication Date
CN116567254A true CN116567254A (zh) 2023-08-08

Family

ID=87497897

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310556278.6A Pending CN116567254A (zh) 2023-05-17 2023-05-17 一种适用于多种视频编码标准的分像素运动估计快速算法

Country Status (1)

Country Link
CN (1) CN116567254A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN119535418A (zh) * 2025-01-20 2025-02-28 云南师范大学 一种山地林区卫星激光足印定位误差校正方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN119535418A (zh) * 2025-01-20 2025-02-28 云南师范大学 一种山地林区卫星激光足印定位误差校正方法

Similar Documents

Publication Publication Date Title
CN111866512B (zh) 视频解码方法、视频编码方法、装置、设备及存储介质
US7720148B2 (en) Efficient multi-frame motion estimation for video compression
US8086052B2 (en) Hybrid video compression method
US20110103480A1 (en) Global motion parameter estimation using block-based motion vectors
CN108012157A (zh) 用于视频编码分数像素插值的卷积神经网络的构建方法
JP2021516016A (ja) 変換領域における残差符号予測のための方法および装置
JP4739651B2 (ja) ビデオ符号化における中間画素高精度高速探索を実現する装置及び方法
CN102804779A (zh) 图像处理装置和方法
KR20130105904A (ko) 적응적 탭 사이즈를 갖는 저 복잡도 보간 필터링
CN104811728B (zh) 一种视频内容自适应的运动搜索方法
CN104125466A (zh) 一种基于gpu的hevc并行解码方法
US20060088104A1 (en) Non-integer pixel sharing for video encoding
CN116567254A (zh) 一种适用于多种视频编码标准的分像素运动估计快速算法
CN112911286A (zh) 一种分像素插值滤波器的设计方法
CN116320443A (zh) 视频图像处理方法、装置、计算机设备和存储介质
Zhang et al. Textural and directional information based offset in-loop filtering in AVS3
CN104902256B (zh) 一种基于运动补偿的双目立体图像编解码方法
WO2022058293A1 (en) Deep prediction refinement
CN1159919C (zh) 运动估计方法
Xia et al. Switch mode based deep fractional interpolation in video coding
Zhang et al. Interweaved prediction for affine motion compensation
KR20160105127A (ko) 시프팅 매트릭스를 이용한 dct 기반의 부화소 단위 움직임 예측 방법
Kwon Half-pixel accuracy fast search in video coding
CN109510985B (zh) 视频编码方法及其装置
Khairy et al. Low complexity for scalable video coding extension of H. 264 based on the complexity of video

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination