CN101765011B - 缩放运动估计的方法和装置 - Google Patents
缩放运动估计的方法和装置 Download PDFInfo
- Publication number
- CN101765011B CN101765011B CN2009102614967A CN200910261496A CN101765011B CN 101765011 B CN101765011 B CN 101765011B CN 2009102614967 A CN2009102614967 A CN 2009102614967A CN 200910261496 A CN200910261496 A CN 200910261496A CN 101765011 B CN101765011 B CN 101765011B
- Authority
- CN
- China
- Prior art keywords
- frame
- motion
- interpolation
- reference frame
- convergent
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000033001 locomotion Effects 0.000 title claims abstract description 97
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000005070 sampling Methods 0.000 claims abstract description 39
- 238000004590 computer program Methods 0.000 claims description 4
- 238000004891 communication Methods 0.000 claims description 3
- 238000001914 filtration Methods 0.000 claims description 3
- 230000000386 athletic effect Effects 0.000 claims 2
- 238000004422 calculation algorithm Methods 0.000 description 8
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 7
- 230000008878 coupling Effects 0.000 description 7
- 238000010168 coupling process Methods 0.000 description 7
- 238000005859 coupling reaction Methods 0.000 description 7
- FEPMHVLSLDOMQC-UHFFFAOYSA-N virginiamycin-S1 Natural products CC1OC(=O)C(C=2C=CC=CC=2)NC(=O)C2CC(=O)CCN2C(=O)C(CC=2C=CC=CC=2)N(C)C(=O)C2CCCN2C(=O)C(CC)NC(=O)C1NC(=O)C1=NC=CC=C1O FEPMHVLSLDOMQC-UHFFFAOYSA-N 0.000 description 7
- 230000000694 effects Effects 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 4
- 238000006073 displacement reaction Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 241001269238 Data Species 0.000 description 3
- 238000003199 nucleic acid amplification method Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000011002 quantification Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000003321 amplification Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 230000013011 mating Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 244000188472 Ilex paraguariensis Species 0.000 description 1
- 241000406668 Loxodonta cyclotis Species 0.000 description 1
- 101100070541 Podospora anserina (strain S / ATCC MYA-4624 / DSM 980 / FGSC 10383) het-S gene Proteins 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/59—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/523—Motion estimation or motion compensation with sub-pixel accuracy
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/567—Motion estimation based on rate distortion criteria
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
依照本发明的一个示范实施例,本发明提供运动补偿预测的方法和装置。除了平移运动,还考虑缩放运动,通过以一个或多个选择的抽样率抽样一个内插帧来产生一个或多个缩放基准帧;将一个帧与缩放基准帧进行匹配;并确定一个或多个运动数据。
Description
技术领域
本发明通常涉及数字视频处理,特别涉及数字视频编码和解码的运动估计。
发明背景
数字视频是由帧构成。每个帧就是一个瞬时快照。为了传送视频,如果视频是一帧接一帧地进行传输,将涉及大量的数据,并花费较长的时间。
由于每个相邻帧可能是一个移动物体的画面快照,它们有很多相似性。在解码端,如果一个帧可以由其相邻帧而重建,而不需要传输其本身,那么就只需要较少的数据。
为了能够从其相邻帧而重建一个帧,通常需要的是该帧及其相邻帧之间的差异。换言之,需要的是帧内快照的运动。可能的运动包括平移、缩放、旋转、和变换。这种差异或这种运动由运动矢量来表示。这种差异或这种运动的确定过程即是运动估计。基于运动估计的重建即是运动补偿预测。
帧的基本元素是像素。运动是以像素级而进行估计的。例如,画面里的物体向左移动一个像素。但是,也有可能运动是子像素级的,从而有子像素运动估计,其将运动估计的精度提高到子像素级。
发明概述
本发明由此提出技术方案如下:
一种运动估计的方法,包括:
以一个或多个选择的抽样率抽样一个内插帧以产生一个或多个缩放基准帧,其中内插帧是由一个子像素运动估计提供;
将一个帧与缩放基准帧进行匹配;和
确定一个或多个运动数据。
一个运动估计的装置,包括:
至少一个处理器;和
至少一个包括计算机程序代码的存储器;
所述至少一个包括计算机程序代码的存储器和至少一个处理器被设置使装置能够执行至少以下:
以一个或多个选择的抽样率抽样一个内插帧以产生一个或多个缩放基准帧,其中内插帧是由一个子像素运动估计提供;
将一个帧与缩放基准帧进行匹配;和
确定一个或多个运动数据。
大多数现有的和实用的运动补偿预测技术都假设在视频内容里是纯粹的平移运动以便进行有效运算。缩放运动,即缩小和放大,总是被忽略。
即使有可能在进行运动估计时考虑缩放运动,例如,使用高阶运动模型,其包括平移、旋转和缩放运动,但由于复杂程度较高而不太实用。高阶运动模型包括诸如仿射、透视、多项式和弹性模型。所有这些高阶运动模型都需要进行仿射参数估计,但在实际应用里,其高复杂性限制了这些高阶运动模型的使用。
除了计算的复杂程度较高,如果这些高阶运动模型被用来产生多个基准帧作为运动补偿预测候选帧,其仿真平移运动和缩放运动,将会出现另一个问题,即需要大型存储器或缓冲器来存储这些基准帧。结果,这种对大型存储器的要求使得使用高阶运动模型来产生多个基准帧的方法在实际应用中不太可行。
至于本发明,除其它运动类型之外,运动估计考虑了缩放运动。通过在抽样内插帧上进行匹配,实施运动估计,抽样内插帧是在传统混合视频编码结构上进行子像素运动估计而产生的。在区块匹配里专门设计的抽样模式被用来实现平移和缩放运动估计和补偿。因此,在编码器实施里不需要缩放参数估计和额外的帧缓冲器。解码器的复杂性类似于支持子像素运动补偿的传统混合视频编解码器。对存储器的要求和计算复杂性较低,使得本发明能够提供一个实用的解决方案。
通过合并平移和缩放运动分量,结果运动补偿能够有效地处理更多的实际运动。此外,基于子像素运动估计的内插帧,进行区块匹配,更普通的运动模型可以被轻易且有效地应用在现有的视频编码架构内。
本应用提供一个不需要仿射参数估计和不需要存储其他基准帧的额外存储器的发明。使用子像素运动估计内插值,预设缩放参数。从而辅助信息达到最小。
利用高级视频编码标准如MPEG-4和H.264/AVC,采用子像素运动估计。因此,在许多商用视频编码标准里,内插帧是容易获得的,其提供如下的优势:第一,不需要额外存储器来存储缩放基准帧;第二,容易将本应用里的发明整合到商用视频编码标准里。
依照本发明的典型实施例,提供一个方法和一个装置,其以一个或多个选择的抽样率抽样一个内插帧来产生一个或多个缩放基准帧;将一个帧与缩放基准帧进行匹配;和确定一个或多个运动数据。
附图说明
将参照以下附图,详细描述本发明的其它目的、方面和实施例,其中:
图1是显示本发明典型实施例的一个方法的流程图;
图2A描述一个典型实施例的一个内插帧的一部分;
图2B描述依照一个典型实施例如何进行匹配;
图3A到3C描述依照本发明的非限制性实施例以图1的不同的所选抽样率进行抽样的一个典型应用。
图4A到4C描述依照本发明的非限制性实施例的基准帧的一个典型应用。
图5是适合使用本发明典型实施例的一个装置的简化模块图;
图6是描述本发明的一个典型实施例可以用于一个典型编码器系统里的模块图。
图7是描述本发明的一个典型实施例可以用于一个典型解码器系统里的模块图。
发明详述
通过参照附图1到3,将会理解本发明的典型实施例及其潜在优势。
图1是显示本发明典型实施例的一个方法的流程图。以下步骤/过程/运算将被执行:(模块110)以一个或多个选择的抽样率抽样一个内插帧以产生一个或多个缩放基准帧;(模块120)将一个帧与缩放基准帧进行匹配;和(模块130)确定运动数据。
依照一个典型实施例,内插帧可以由但不限于任何插补帧技术来生成,插补的帧将被至少一个其它帧引用。另外,内插因子(interpolationfactor)不限于任何数目。内插是基于一个帧内相邻像素上的数值而近似估计像素的颜色和强度。如果内插因子是S,则帧的尺寸在水平和垂直方向上将被放大S倍,例如,一个2×2的帧将变成一个2S×2S的帧。通常,有两类算法来执行插值法,即自适应和非自适应。自适应算法(adaptivealgorithm)让插值随着它们插补边缘或平滑纹理而变化。自适应算法包括使用概率神经网络、非线性四阶方法等。非自适应算法(non-adaptivealgorithm)平等对待所有的像素,不管是边缘锐利或纹理平滑。非自适应算法包括近邻法(nearest neighbor)、双线性法(bilinear)、双三次法(bicubic)、样条法(spline)、sinc法、lanczos法等。其中一些是高阶插值,如spline和sinc,由此保留大部分的图像信息,因为考虑了较多的相邻像素。但是,考虑相邻像素越多,插值的计算强度就越大。在一个优选实施例里,例如在H.264的例子里,通过使用维纳(Wiener)而设计了内插滤波器(interpolation filter),使得最有效的滤波器核心是基于统计结果来确定的。
依照一个典型实施例,内插帧是由子像素运动估计提供,子像素运动估计已经用于高级视频编码标准如MPEG-4和H.264/AVC。对于子像素运动估计,具有子像素精度的运动估计是通过插值法得以实现的。因此,内插帧是通过子像素运动估计提供,不需要其他过程。
图2A描述一个典型实施例的一个内插帧的一部分。在图2A内,圆点,如点210,表示基准帧的原始像素。在另一个实施例里,点210表示缘由基准帧的像素,其已经通过图像处理技术如低通滤波进行处理过,这些像素也被看作是处理过的像素。在插值之后,内插像素就从原始像素或处理像素而产生了,三角点如点220表示内插像素。在此例子里,内插因子是4,从而原始基准帧的尺寸被放大4倍,意味着每个1×1的像素被内插像素填补而变成一个4×4的区块。
在子像素运动估计的例子里,子像素运动估计的子像素精度和内插因子之间的关系是:1/S-像素的精度需要一个内插因子S。因此,对1/S-像素精度的运动估计,具有内插因子S的内插帧是容易获得的。
图2B描述一个典型实施例的如何进行匹配。匹配是为当前帧找到基准帧内最匹配区块。当前帧是一个将由一个或多个基准帧和运动数据来表示的帧。当前帧被分成任意尺寸的区块,如4×4,8×8,16×16,32×32,64×64,4×8,8×4,16×8,或8×16。区块尺寸在整个帧内可以是固定的,也可以根据在帧内的移动区域是可变的。在此例子里,区块尺寸是4×4,匹配的完成是通过比较当前帧的每个区块(图中未显示),如区块230,和基准帧的每个区块(图中未显示),如区块240。如果区块尺寸是可变的,例如在具有可变区块尺寸特征的H.264的例子里,选择区块尺寸(模式选择)是通过率失真优化(rate-distortion optimization)来确定的。本发明的一个方面是对每个模式提供一个更准确的运动补偿预测。
匹配是在不同区块内逐个像素地比较像素值,如强度值。区块230内的每个黑圆点将与区块240内的每个黑三角点进行比较。通常,比较可以通过任何算法完成,不限于平方差值和(SSD)、绝对差值和(SAD)、或变换绝对差值和(SATD)。在此例子里,计算区块230内的每个像素的强度值和区块240内的每个像素的强度值之间的绝对差,然后加总而获得一个绝对差的和。最佳匹配是通过在基准帧内进行搜索而确定,当与当前帧内的区块230进行比较时,沿着水平和垂直轴移位子像素位置来找出一个具有最小绝对差值和的区块。
设定ft(sc),是时间和空间上初始连续的动态画面,视频序列fn(s)是在时间和空间上依照Nyquist准则进行抽样之后的画面。则意味着对整数格点位置,Fn(s)=fn(s),s∈Z2。在进行子像素匹配时,运动数据的一个例子,运动矢量被确定如下:
假设区块240是最佳匹配的区块,那么运动矢量是(13/4,21/4),其是指最佳匹配区块240和当前区块230之间的水平轴位移等于13/4,而最佳匹配区块240和当前区块230之间的垂直轴位移等于21/4。
图3A到3C描述本发明非限制性实施例的以图1的选择的不同抽样率进行内插帧抽样的典型应用。为了产生缩放基准帧用于仿真缩小和放大运动,匹配是以选择的抽样率进行内插帧抽样的方式来实施。缩放因子是指内插因子S除以抽样率,并且缩放因子确定缩放基准帧是表示一个缩小运动还是表示一个放大运动。如果缩放因子小于1,缩放基准帧是一个有放大运动的基准帧。如果缩放因子大于1,缩放基准帧是一个有缩小运动的基准帧。如果缩放因子等于1,缩放基准帧是一个没有任何缩放运动的基准帧。
图3A显示一个典型实施例的区块尺寸等于4×4和抽样率等于1。换言之,在水平和垂直方向上以每1个子像素的速率进行抽样。在4×4个像素被抽样之后,产生4×4基准区块。按照位置标识,在(x,y),(x+1n,y),(x,y+1n),(x+1n,y+1n)上的像素被抽样,其中n是一个从1到3的整数。在基准区块315里,被抽样的像素是由黑点表示。基准区块315与当前区块310内的黑点进行比较。在此例子里,缩放因子等于4,从而通过抽样内插帧而产生的缩放基准帧就表示一个缩小运动。
图3B显示一个典型实施例的区块尺寸等于4×4和抽样率等于3。换言之,在水平和垂直方向上以每3个子像素的速率进行抽样。在4×4个像素被抽样之后,产生4×4的基准区块。按照位置标识,在(x,y),(x+3n,y),(x,y+3n),(x+3n,y+3n)上的像素被抽样,其中n是一个从1到3的整数。在基准区块325里,被抽样的像素是由黑点表示。基准区块325与当前区块320里的黑点进行比较。在此例子里,缩放因子等于4/3,从而通过抽样内插帧而产生的缩放基准帧就表示一个缩小运动。
图3C显示一个典型实施例的区块尺寸等于4×4和抽样率等于5。换言之,在水平和垂直方向上以每5个子像素的速率进行抽样。在4×4个像素被抽样之后,产生4×4的基准区块。按照位置指址,在(x,y),(x+5n,y),(x,y+5n),(x+5n,y+5n)上的像素被抽样,其中n是一个从1到3的整数。在基准区块335里,被抽样的像素是由黑点表示。基准区块335与当前区块330里的黑点进行比较。在此例子里,缩放因子等于4/5,从而通过抽样内插帧而产生的缩放基准帧就表示一个放大运动。
通常,一个临时基准帧可以通过一个内插因子S进行插值,其不需要是子像素运动估计精度。但是,假如内插因子S等于子像素运动估计精度,并且已经通过子像素运动估计进行插值,那么不需要重复进行插值,随时都有内插帧。此外,对子像素运动估计,内插帧有最大的分辨率,其在水平和垂直尺寸上比原始的临时基准帧大S倍。此内插帧可以被看作是一个具有缩放因子S的缩小帧。然后,一组更低分辨率的帧能够以不同抽样率从最大分辨率的帧而获得。对缩放应用,相同的抽样率被施加到水平和垂直尺寸。因此,得出的一组缩放基准帧的相应水平或垂直分辨率的范围是从S到S/M,可能的缩放因子由以下提供:
{S/1,S/2,S/3,...,S/j,...,S/M} (2)
其中j是抽样率,而M是最大抽样率。对j<S,缩放基准帧是缩小帧。对j>S,缩放基准帧是放大帧。在一个优选实施例里,不需要使用等式(2)提供的所有缩放因子,因为这将产生沉重的负担给运动估计。期望有一个更小范围的缩放因子而获得更好的预测效果,特别是由于对一个具有连续运动的视频序列在一个短时间周期内缩放因子将不会有很大变化。对一个给定数字N1缩小因子和N2放大因子,我们应该选择以下组的缩放因子:
如果子像素运动估计精度是1/s-像素,设置S=s,最大分辨率的缩小帧将是在水平和垂直方向上具有s倍的分辨率。对1/4-像素运动估计里的例子,可以选择S=s=4。如果缩小和放大因子的数字被选择是2(N1=N2=2),基于等式(3),缩放因子的推荐组合是:
{2,4/3,1,4/5,2/3} (4)
通常,一个临时基准帧可以通过一个因子S进行插值,其可能与子像素运动估计精度相同,也可能不同。其中选择的抽样率大约是非缩放抽样率以及额外两个缩小和两个放大级别。
图4A到4C描述本发明非限制性实施例的基准帧的典型使用。图4A显示仅使用临时基准帧415来编码当前帧410。产生临时基准帧415就是用来逼近视频里其它瞬时上的帧,用于进行运动预测。图4B显示仅使用缩放基准帧425来编码当前帧420。该缩放基准帧425就是用来逼近缩放运动用于进行运动预测而产生的帧。各种缩放因子被用来产生表示缩小和放大运动的缩放基准帧425。图4C显示使用缩放基准帧432和临时基准帧431来编码当前帧430。对一个或多个临时基准帧431,产生缩放基准帧432。产生的缩放基准帧越多,计算复杂性将会越高。
在本发明的另一个实施例里,为了与H.264/AVC集成在一起,由空间位移、基准帧和缩放因子组成的运动矢量需要进行编码,然后被传输到解码器。作为一个典型实施例,缩放因子被编码为一个独立参数,类似于在H.264里的基准帧数目。
由于缩放因子被看作是缩放帧的选择,缩放因子与基准帧数目可以嵌在一起,使得比特流句法与H.264相同,但是有不同含义的基准帧参数。例如,通过将基准帧数目偏移16,如以下表1所示,缩放参数与基准帧数目集成在一起,以获得一个新的基准帧参数。编码器和解码器从这个新的基准帧参数提取出基准帧数目和缩放参数。在这个例子里,通过将基准帧数目偏移16,将缩放参数与基准帧数目集成在一起,当然也不限于16,也可以使用任何其它数值作为一个偏移。偏移值的确定取决于各种视频编码标准之间不同的非缩放基准帧的范围。
表1:利用集成的缩放因子信息而产生新基准帧参数
在H.264/AVC里,率失真优化运动搜索是通过最小化Lagrangian成本函数来实施:
其中λmotion是在H.264/AVC里使用的运动搜索的Lagrangian乘子,而R(a,m,v)是与一个特别选用的运动矢量有关的比特率。每个区块模式(各个子区块尺寸的帧间模式、帧内模式等)的运动矢量(a,m,v)是具有最低Lagrangian成本的那个模式。
另外,在诸如H.264/AVC的混和视频编码系统里,内插帧是以这样的方式产生,即内插帧的半样本位置是通过水平和垂直地施加一个一维6抽头的FIR滤波器获得。在1/4-样本、1/8-样本等上的像素值是通过整数-和半-样本位置的双线性插值而产生。
同样注意到,当增加时间基准帧的时间窗口时考虑增加缩放基准帧,缩放帧指数与H.264/AVC比特流的帧数目参数嵌在一起,并且有必要确保临时基准帧和缩放基准帧的和不应该超出H.264/AVC支持的基准帧的最大数目。
例如,通过将原始帧数目偏移{0,16,32,48,64},基准帧的缩放因子可以被嵌入到帧数目,以分别表示基准帧的缩放参数{0,1,2,3,4}符合H.264/AVC,其通常支持高达16个基准帧,并允许添加新的参数,而不会改变比特流的句法。例如,如果实施本发明到H.264/AVC的1/8-子像素运动估计精度(S=s=8),有两个缩放帧,每个缩小和放大因子N1=N2=2,然后基于等式(3),将使用以下组合的缩放因子:
{4/3,8/7,1,8/9,4/5} (6)
为了利用偏移基准帧的缩放参数来表示这些缩放因子,这些实际的缩放因子在编解码器里很难被编码,如表2所示:
表2:在一个典型实施例里的缩放参数的设定及其相关数值
注意到,在进行抽样之前,也可以施加低通滤波到内插帧以降低混叠效应(aliasing effect)。是否进行低通滤波由以下因素来确定,诸如计算成本、产生的预测候选帧数目、和包括将在残差编码阶段被吸收的混叠的预测误差。
还要注意到,与现有的编解码器相比,如果内插帧的分辨率高于H.264/AVC编解码器里常用的1/4或1/8像素帧的分辨率,可以采用额外的存储器。在此情况下,对每个基准帧,对一个内插帧,需要额外存储器。
图5是适合使用本发明典型实施例的一个装置的简化模块示意图。存储器510可以是适合本地技术环境的任何类型,可以使用任何合适的数据存储技术,如半导体存储器设备、磁存储器设备和系统、光学存储器设备和系统、固定存储器和可移动存储器。为了便于描述本发明,存储器可以被看作是一个计算机可读媒质。
数据处理器520可以是适合本地技术环境的任何类型,可能包括一个或多个通用计算机、微处理器、数字信号处理器(DSP)和基于单核处理器架构或多核处理器架构的处理器。
数据处理器520能够接收来自任何装置(图中未显示)的输入视频信号,如任何无线和有线通信信道或任何存储设备如磁驱动器、光盘、固态设备等。数据处理器520处理本发明各个非限制性实施例描述的数据。通过以一个或多个选择的抽样率抽样一个内插帧来产生一个或多个缩放基准帧、将一个帧与缩放基准帧进行匹配,数据处理器确定运动数据。该处理过程是利用预设参数或使用存储在存储器510内的程序自动执行,以控制和输入所涉及的参数,从而程序发送控制信号或数据531到数据处理器520。虽然数据处理器520也使用存储器510来保留中间数据或输出532,如内插帧或多个基准帧。此外,存储在存储器510内的程序可以访问任何输出532,以便数据处理器510需要进行进一步的处理,也可以通过任何装置(图中未显示)如通信信道或存储器设备发送输出532到其它设备或处理器。
图6是描述本发明一个典型实施例可以用于一个典型编码器系统的模块图。输入视频信号610由运动估计模块670进行处理,其考虑缩放运动和平移运动。运动估计模块670使用来自子像素运动估计的内插帧以产生缩放基准帧。运动估计模块670使用来自缓冲器635的多个临时基准帧。插值被施加到存储在缓冲器635内的帧以产生内插帧。在缓冲器635内的这些临时基准帧也充当输出视频信号,因为它们表示视频里不同瞬时的帧。在被存储到缓冲器635内之前,这些临时基准帧是通过模块620进行处理,如变换、缩放比例和量化以便获得参数615,如量化系数和转换系数,并需要随后通过模块630进行处理,如缩放、逆变换或去量化以及通过去块滤波器640进行去块。
从运动估计模块670获得的运动数据625和参数615如量化系数是通过熵编码模块680进行处理。帧内预测模块650和运动补偿模块660分别被用来进行帧内预测和帧间预测。运动补偿模块接收来自运动估计模块670的运动数据625以及来自缓冲器635的多个临时基准帧。在帧内预测和帧间预测之后,提供输出以便在模块620和630内进行处理,如缩放、量化和去量化、变换和逆变换。
图7是描述本发明一个典型实施例可以用于一个典型解码器系统的模块图。在解码器端,解码器接收到的输入信号是通过熵解码710进行解码。在熵解码710进行处理之后,被解码的信号是通过去量化和逆变焕720进行处理。为了获得被解码的帧770,使用解码帧770作为基准帧740进行平移和缩放运动补偿730。由去量化和逆变换720得出的信号与来自平移和缩放运动补偿730或帧内预测750的输出一起被处理以产生一个处理信号。处理信号还通过滤波器760进行处理,并用于进行帧内预测750。在通过滤波器760进行滤波之后,产生一个被解码的帧770。
没有以任何方式限制范围,以下权利要求的阐述和应用,在此披露的一个或多个典型实施例的技术效果是使具有缩放运动和平移运动的运动补偿预测在实际应用中更合理可行。在此披露的一个或多个典型实施例的另一个技术效果是通过由子像素精度运动估计抽样内插帧来获得缩放基准帧以降低存储器要求和计算复杂性。在此披露的一个或多个典型实施例的另一个技术效果是降低了比特率。本发明提供一种技术来执行更精确的运动补偿预测。当运动补偿预测更精确时,预测的区块将更加类似于原始区块,并且它们之间的差异将会更小。由于剩余编码通过变换编码对预测区块和原始区块之间的差异进行编码,越小差异需要越少的比特来进行编码,从而可以节省比特,并降低比特率。
此外,通过在运动补偿预测时使用交替子抽样策略,本发明披露的运动补偿预测技术还可应用到高阶运动模型如仿射、透视、多项式和弹性模型。
通常,本装置的各个实施例可以包括但不限于蜂窝电话和其它无线通信设备、个人数字助理(PDA)、便携式和台式计算机、图像摄取设备如数码相机、音频视频(AV)设备如视频播放器、游戏设备、允许访问和浏览的互联网和局域网(LAN)设备、以及集成这种功能组合的便携式单元或设备。
本发明实施例可以以软件、硬件、应用逻辑或软件、硬件和应用逻辑的组合来实施。软件、应用逻辑和/或硬件可以位于集成电路芯片、模块或存储器上。如果期望的话,软件、应用逻辑和/或硬件的部分可以位于集成电路芯片上,软件、应用逻辑和/或硬件的部分可以位于模块上,软件、应用逻辑和/或硬件的部分可以位于存储器上。在一个典型实施例里,应用逻辑、软件或指令组保留在任何一个各种传统的计算机可读媒质上。在本发明的上下文里,“计算机可读媒质”可以是任何媒质或装置,其能够保留、存储、传送、传播或传输指令给一个指令执行系统、装置或设备如计算机进行使用或与其联系,如图5内所述的计算机的例子。计算机可读媒质可以包含一个计算机可读存储媒质,其可以是任何媒质或装置,其能够保留或存储指令给一个指令执行系统、装置或设备如计算机进行使用或与其进行联系。
如果期望的话,在此所述的不同函数可以以不同阶和/或互相并行的方式运行。此外,如果期望的话,一个或多个上述函数可以是选择性的或可以被合并。
尽管在所附权利要求里阐述了本发明的各个方面,但本发明的其它方面包含所述实施例和/或具有独立权利要求特征的从属权利要求的特征的其它组合,而不仅仅限于在权利要求里明确阐述的组合。
在此也将注意到,尽管以上已经描述了本发明的典型实施例,但这些描述不应该以一个限制性的方式进行理解。相反,可以对其作出一些改变和修改,而不会脱离在所附权利要求里所定义的本发明范围。
Claims (13)
1.一种运动估计的方法,包括:
以一个或多个选择的抽样率抽样一个内插帧以产生一个或多个缩放基准帧,其中内插帧是由一个子像素运动估计提供;
将一个帧与缩放基准帧进行匹配;和
确定一个或多个运动数据。
2.根据权利要求1所述的方法,其中内插帧是通过插值而获得。
3.根据权利要求1所述的方法,其中选择的抽样率是由 确定,其中S等于内插因子,N1等于缩小级数目,而N2等于放大级数目。
4.根据权利要求1所述的方法,还包括:低通滤波内插帧。
5.根据权利要求1所述的方法,还包括:通过一个内插因子进行插值产生临时基准帧,将所述一个帧与一个或多个临时基准帧匹配。
6.根据权利要求1所述的方法,在编码器上执行。
7.根据权利要求1所述的方法,在解码器上执行。
8.根据权利要求1所述的方法,在一个无线通信设备上执行。
9.一个运动估计的装置,包括:
至少一个处理器;和
至少一个包括计算机程序代码的存储器;
所述至少一个包括计算机程序代码的存储器和至少一个处理器被设置使装置能够执行至少以下:
以一个或多个选择的抽样率抽样一个内插帧以产生一个或多个缩放基准帧,其中内插帧是由一个子像素运动估计提供;
将一个帧与缩放基准帧进行匹配;和
确定一个或多个运动数据。
10.根据权利要求9所述的装置,其中内插帧是通过内插法获得。
11.根据权利要求9所述的装置,其中选择的抽样率是由 确定,其中S等于内插因子,N1等于缩小级数目,而N2等于放大级数目。
12.根据权利要求9所述的装置,还包括:低通滤波内插帧。
13.根据权利要求9所述的装置,还包括:通过一个内插因子进行插值产生临时基准帧,将一个帧与一个或多个临时基准帧匹配。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/580,429 | 2009-10-16 | ||
US12/580,429 US8170110B2 (en) | 2009-10-16 | 2009-10-16 | Method and apparatus for zoom motion estimation |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101765011A CN101765011A (zh) | 2010-06-30 |
CN101765011B true CN101765011B (zh) | 2012-01-04 |
Family
ID=42495981
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2009102614967A Expired - Fee Related CN101765011B (zh) | 2009-10-16 | 2009-12-08 | 缩放运动估计的方法和装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8170110B2 (zh) |
CN (1) | CN101765011B (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8228991B2 (en) * | 2007-09-20 | 2012-07-24 | Harmonic Inc. | System and method for adaptive video compression motion compensation |
JP2011151431A (ja) | 2009-12-25 | 2011-08-04 | Sony Corp | 画像処理装置および方法 |
US10051281B2 (en) * | 2014-05-22 | 2018-08-14 | Apple Inc. | Video coding system with efficient processing of zooming transitions in video |
US11830225B2 (en) * | 2018-05-30 | 2023-11-28 | Ati Technologies Ulc | Graphics rendering with encoder feedback |
CN108833916B (zh) * | 2018-06-20 | 2021-09-24 | 腾讯科技(深圳)有限公司 | 视频编码、解码方法、装置、存储介质和计算机设备 |
CN109640097B (zh) * | 2018-12-07 | 2021-08-03 | 辽宁师范大学 | 自适应因子的视频仿射运动估计方法 |
CN109889682B (zh) * | 2019-03-20 | 2020-06-26 | 北京天耀宏图科技有限公司 | 任务需求云端处理评估系统及方法 |
KR20220030940A (ko) | 2019-07-09 | 2022-03-11 | 알리바바 그룹 홀딩 리미티드 | 해상도 적응형 비디오 코딩 |
US11589037B2 (en) * | 2019-12-20 | 2023-02-21 | Qualcomm Incorporated | Motion compensation using size of reference picture |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6757330B1 (en) * | 2000-06-01 | 2004-06-29 | Hewlett-Packard Development Company, L.P. | Efficient implementation of half-pixel motion prediction |
JP3898606B2 (ja) * | 2002-09-12 | 2007-03-28 | 株式会社東芝 | 動きベクトル検出方法及び装置並びにフレーム補間画像作成方法及び装置 |
AU2003279015A1 (en) * | 2002-09-27 | 2004-04-19 | Videosoft, Inc. | Real-time video coding/decoding |
EP1422928A3 (en) * | 2002-11-22 | 2009-03-11 | Panasonic Corporation | Motion compensated interpolation of digital video signals |
JP5200788B2 (ja) * | 2008-09-09 | 2013-06-05 | 富士通株式会社 | 映像信号処理装置、映像信号処理方法および映像信号処理プログラム |
US20100092101A1 (en) * | 2008-10-09 | 2010-04-15 | Chin-Chuan Liang | Methods and apparatus for enhancing image quality of motion compensated interpolation |
-
2009
- 2009-10-16 US US12/580,429 patent/US8170110B2/en not_active Expired - Fee Related
- 2009-12-08 CN CN2009102614967A patent/CN101765011B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN101765011A (zh) | 2010-06-30 |
US8170110B2 (en) | 2012-05-01 |
US20110090963A1 (en) | 2011-04-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101765011B (zh) | 缩放运动估计的方法和装置 | |
JP5021712B2 (ja) | 並列補間及びサーチ・ハードウェアを備えた運動評価エンジン | |
CN100553321C (zh) | 编码动态滤波器 | |
CN110741640B (zh) | 用于视频代码化中的运动补偿预测的光流估计 | |
US11902563B2 (en) | Encoding and decoding method and device, encoder side apparatus and decoder side apparatus | |
CN1179302C (zh) | 使用正交变换域中的块匹配进行运动估测的方法和装置 | |
JP2021022936A (ja) | 画像予測方法および関連装置 | |
CN103563370B (zh) | 用于图像运动预测的方法、装置及计算机程序产品 | |
CN101895751B (zh) | 帧内预测的方法及装置、基于帧内预测的编/解码方法及系统 | |
RU2509439C2 (ru) | Способ и устройство кодирования и декодирования, сигнал, носитель данных и продукты компьютерной программы | |
JP5833757B2 (ja) | 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、画像符号化プログラム、画像復号プログラム及び記録媒体 | |
US9118927B2 (en) | Sub-pixel interpolation and its application in motion compensated encoding of a video signal | |
CN107318026A (zh) | 视频编码器以及视频编码方法 | |
KR20130099242A (ko) | 비디오 코딩의 움직임 예측 | |
CN102804779A (zh) | 图像处理装置和方法 | |
CN103069803B (zh) | 视频编码方法、视频解码方法、视频编码装置、视频解码装置 | |
CN103650490A (zh) | 用于运动补偿预测的方法和设备 | |
KR20180037042A (ko) | 모션 벡터 필드 코딩 방법 및 디코딩 방법, 및 코딩 및 디코딩 장치들 | |
JP2019118101A (ja) | ビデオコーディング方法及びその画像処理装置 | |
CN101360238A (zh) | 图像处理设备、图像处理方法和程序 | |
TW202002638A (zh) | 子塊的邊界增強 | |
CN112601095B (zh) | 一种视频亮度和色度分数插值模型的创建方法及系统 | |
CN102396232A (zh) | 图像处理装置和方法 | |
CN100568920C (zh) | 串行输入并行输出的视频图像亮度插值的方法和装置 | |
US20210144390A1 (en) | Methods and systems for adaptive cropping |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20120104 |
|
CF01 | Termination of patent right due to non-payment of annual fee |