CN100556146C - 改良式钻石搜寻动态估计方法 - Google Patents
改良式钻石搜寻动态估计方法 Download PDFInfo
- Publication number
- CN100556146C CN100556146C CN 200510115480 CN200510115480A CN100556146C CN 100556146 C CN100556146 C CN 100556146C CN 200510115480 CN200510115480 CN 200510115480 CN 200510115480 A CN200510115480 A CN 200510115480A CN 100556146 C CN100556146 C CN 100556146C
- Authority
- CN
- China
- Prior art keywords
- search
- diamond
- image block
- picture
- dynamic estimation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明公开了一种改良式钻石搜寻动态估计方法,是从一第一画面所具有的一预定像块,搜寻邻近的一第二画面中对应预定像块相匹配的像块以估算预定像块的移动向量,其特征在于:所述的方法是设定第二画面中依一预定原则选择的一像块为一起始点,并以起始点为中心的一实心菱形区域为起始搜寻范围,由内往外逐渐扩展搜寻相匹配的像块以估算预定像块的移动向量,由于一般移动向量常是以放射状分布的方式出现,而本发明所述的方法是先自出现机率大的实心区域内开始搜寻,因此相较于以前的搜寻技术可节省不必要的搜寻时间。
Description
技术领域
本发明是有关于一种视讯影像处理(Video image processing)技术的移动估计(Motion estimation)方法,特别是涉及一种改良式钻石搜寻移动估计方法。
背景技术
如图1所示,目前在MPEG视讯编码影像的数据流(Data stream)中,其数据结构皆是由一个或一个以上的序列(Sequence)所构成,而在每个序列之中则包含了复数个图像群组(Group of Pictures,GOP),而所谓的图像群组指的是由许多画面(Frame)或称为图像(Picture)所构成的群组,画面依其属性可区分幅内编码画面(I Frame)、预测编码画面(P Frame),以及双向编码画面(B Frame)影像三种型态。
上述每一种画面均可加以编码,一般是以幅内编码(I)画面作为起始影像压缩的切入点,藉由移动向量(Motion Vector)的估算,预测编码(P)画面可以幅内编码(I)画面或预测编码(P)画面作为参考画面来进行预测,而双向编码(B)画面则是以幅内编码(I)画面与预测编码(P)画面二者或两预测编码(P)画面作为参考画面所产生的移动向量推估,如此将画面连续播放后,呈现在使用者面前即为动态的MPEG视讯影像。
而在MPEG的压缩标准中,是将每个画面细分为数个像条(Slice),像条中又可再分为数个巨集像块(Macro Block),而巨集像块可由四个亮度(Luminance)像块及数个彩度(Chrominance)像块所组成,最后,将每一像块(Block)定义为MPEG的数据结构中的最小编码单位。对应移动向量的估算(Motion Estimation),即所谓的移动补偿(Motion Compensation)。一般移动向量估算最直接的作法,便是纪录巨集像块或像块中每一画素的亮度,并以全找搜寻(Full Search)方式纪录两者变化向量,但是此举将耗费大量资源。
配合移动向量的估算,目前画面便可藉由具有的各像块以及从先前画面找出最佳匹配像块,以计算出的移动向量与差值资料将先前画面的像块加以调整而成为目前画面,依据移动向量可将像块转移至适当位置,由于无须纪录大部分的重复资料,因此可节省储存的资料量达到数据压缩的目的。目前估算移动向量的方法,有全找搜寻(Full Search;FS)、三步搜寻(Three Step Search;TSS)、四步搜寻(Four Step Search;FSS)及钻石搜寻(Diamond Shape Search;DSS)等动态估计方式。
其中,目前的钻石搜寻判断方式,是以一菱形(Rhombus)外框作为搜寻区域,其步骤说明如下:
步骤1:找寻一搜寻起始点及以起始点为中心的空心菱形外框共九点,若最相似点在菱形中心则进行步骤4,若最相似点在菱形外框则进行步骤2。
步骤2:以最相似点为中心点,重复以一菱形外框作为搜寻区域。
步骤3:若最相似点仍在中心点,则进行步骤4,若最相似点在菱形外框上,则重复步骤2。
步骤4:缩小搜寻区域的搜寻范围为小实心菱形,最后找到最相似点后,即结束搜寻。
如图2所示,说明步骤1中,发现最相似点在菱形中心1’,因此进行步骤4,缩小搜寻区域的搜寻范围为小实心菱形,最后找到最相似点2’后结束搜寻。
如图3所示,说明步骤1中,最相似点在菱形外框1”,因此进行步骤2,以最相似点1”为中心点,重复以一菱形外框作为搜寻区域,接着进行步骤3,因为最相似点2”在菱形外框上,故重复步骤2,重复以一菱形外框作为搜寻区域,发现最相似点仍在菱形中心2”,因此进行步骤4,缩小搜寻区域的搜寻范围为小实心菱形,最后找到最相似点4”后结束搜寻。
然而,现有的钻石搜寻动态估计方法由于是以起始点为中心的空心菱形外框为搜寻范围,大范围搜寻后再缩小搜寻范围,往往错失了落在起始点附近的画素才是出现机率最大的搜寻范围。
发明内容
因此,本发明的一目的,即在提供一种提高搜寻效率的改良式钻石搜寻动态估计方法。
于是,本发明改良式钻石搜寻动态估计方法是从一第一画面所具有的一预定像块,搜寻邻近的一第二画面中对应预定像块相匹配的像块以估算预定像块的移动向量,其特征在于:所述的方法是设定第二画面中依一预定原则选择的一像块为一起始点,并以起始点为中心的一实心菱形区域为起始搜寻范围,由内往外逐渐扩展搜寻相匹配的像块以估算预定像块的移动向量;其中,该实心菱形区域为具有13个点的区域,且该实心菱形区域分为一小菱形区域包括该起始点及与该起始点邻近的四个点,以及一外围区域包括小菱形区域周围的八个点。
由于一般移动向量常是以放射状分布的方式出现,本发明改良式钻石搜寻动态估计方法以实心菱形区域为起始搜寻范围,由于是先自出现机率大的实心区域内开始搜寻,因此可节省不必要的搜寻时间,并进一步提升了搜寻的效率。
附图说明
下面结合附图及实施例对本发明进行详细说明:
图1是一示意图,说明目前在MPEG视讯编码影像的数据数据结构;
图2是一示意图,说明现有的一种钻石搜寻判断方式;
图3是一示意图,说明现有的一种钻石搜寻判断方式;
图4是一电路方块图,说明使用本发明方法的系统是一用以执行MPEG视讯编码功能的视讯编码装置;
图5是一示意图,说明本发明改良式钻石搜寻动态估计方法的移动向量估算方式;
图6是一流程图,说明本发明改良式钻石搜寻动态估计方法的各步骤;
图7是一示意图,说明本发明改良式钻石搜寻动态估计方法的较佳实施例;
图8是一示意图,说明本发明改良式钻石搜寻动态估计方法的较佳实施例;
图9说明本发明改良式钻石搜寻动态估计方法的较佳实施例的变形一,先由内部的小实心菱形五点找起,若最相似点在菱形边上,再往其外部的菱形框的八点寻找;
图10说明本发明改良式钻石搜寻动态估计方法的较佳实施例的变形二,先由内部的小实心菱形五点找起,若最相似点在菱形边上,再往其外部的半菱形框的五点寻找;
图11是一示意图,说明本发明改良式钻石搜寻动态估计方法的较佳实施例的变形三,先由内部的小实心菱形五点找起,若最相似点在菱形边上,再往其外部的半菱形框的三点寻找。
具体实施方式
有关本发明之前述及其它技术内容、特点与功效,在以下配合参考图式的一较佳实施例的详细说明中,将可清楚的呈现。在本发明被详细描述之前,要注意的是,在以下的说明内容中,类似的元件是以相同的编号来表示。
如图4所示,使用本发明方法的系统是一用以执行MPEG视讯压缩功能的视讯编码装置1,然而,其它实施例中,或可应用在执行类似的视讯压缩功能的处理系统。
视讯编码装置1具有一前处理单元(Preprocessor Unit)10、一移动估算单元(MotionEstimation Unit)11、一移动补偿单元12、一移动向量编码单元(Motion Vector EncodingUnit)13、一纹理编码模组(Texture Encoding Unit)14、一比特流组合单元(Bit-StreamComposer Unit)15及一记忆体16。
欲将一原始的输入影像100输入至视讯编码装置1时,是由视讯编码装置1的一前处理单元10先将一给定画面中的每一个巨块资料定义出来,并暂存至记忆体16;接着由移动估算单元11对于输入影像100中画面所具有的巨块资料进行计算,例如运算前、后画面中对应的像块资料后,可求得全画面的各像块资料的移动向量资料102;接着将其输入至移动补偿单元12,由移动补偿单元12利用所述的移动向量撷取先前或后一画面中的影像巨块资料以得到一参考资料104;再将前处理单元10得到输入影像100具有的影像巨块资料减去移动补偿单元12得到的参考数据104后,便得到一差值数据103,由纹理编码模组14对差值数据103进行运算以获得压缩的纹理及重建的参考资料。
其中,纹理编码模组14的一离散余弦转换单元141是是对每一像块的画素资料施以离散余弦转换(DCT),接着以频域转换单元142把画素数据由时域转换为频域,接着由量化单元143施以量化(Quantize)步骤,使得许多经过离散余弦转换的DCT系数量化为零,并去除掉高频部分;并需再经反量化单元144、反离散余弦转换单元145进行反量化以及反离散余弦转换运算,如此再反馈至移动估算单元11。并可由移动向量编码单元13将各移动向量加以编码输出至比特流组合单元15具有的一可变长度编码器151。
同时,需以交流/直流预测单元146(AC/DC Prediction Unit)依照同一画面中各像块(Block)重复的累赘信息去除,再由交错扫描单元147进行交错扫描(Zig-zag scan)来将量化后的DCT系数重新排列,将低频系数排列在前而高频系数排列在后,最后在经交错扫描过后的DCT系数进行动态长度编码(Run Length Encoding;RLE),最后再由比特流组合单元15具有的另一可变长度编码器152对二者进行可变长度编码(Variable Length Coding;VLC),由比特流组合单元15加以组合,便可完成MPEG压缩格式的输出。
配合图4、5所示,本发明改良式钻石搜寻动态估计方法的较佳实施例,是在视讯编码装置1中的移动估算单元11进行,所述的方法是从一第一画面501(又称为目前画面;Current Frame)所具有的一预定像块51,并搜寻邻近的一第二画面502(又称为参考画面;Reference Frame)对应预定像块51所相匹配的画素以估算预定像块51的移动向量53,所述的方法是以第二画面502中的一预定点520为起始点,并以起始位置为中心的一实心菱形区域(图未示)为搜寻范围,由内往外逐渐扩展搜寻相匹配的像块以估算移动向量53。
本实施例中,所欲搜寻邻近的第二画面502的位置,可以是位在第一画面501前、后时序多数画面其中任一画面,此外,所述的方法由内往外逐渐扩展搜寻的方式,是顺时针、逆时针其中任一种螺旋搜寻方式。
如图6所示,说明本发明改良式钻石搜寻动态估计方法,首先,搜寻最接近起始点的实心菱形十三个点(步骤601)接着进行最相似点判定(步骤602),若最相似点为内部五点之一(步骤603),则结束搜寻(步骤610),若搜寻到的最相似点为外部八点之一(步骤604),则以该点为新的搜寻中心,找寻菱形边上尚未搜寻的三点或五点(步骤605)。
接着进行最相似点判定(步骤606),若最相似点在菱形边上(步骤607),则以该点为新的搜寻中心,找寻菱形边上尚未搜寻的三点或五点(步骤605),若最相似点为中心点(步骤608),则搜寻最接近中心点的小实心菱形四点(步骤609),如获得最相似点则结束搜寻,并传回最相似点的移动向量(步骤610)。
配合图6及图7~8所示,说明本发明改良式钻石搜寻动态估计方法的较佳实施例的各种搜寻状况:
图7:说明第一次搜寻时,先自接近原点的实心菱形十三个点开始找寻(步骤601),并进行最相似点判定(步骤602),由于相似点1’为实心菱形内部五点之一(步骤603),因此第一次搜寻即可找出并结束搜寻(步骤610)。
图8:说明第一次搜寻时,先自接近原点的实心菱形十三个点开始找寻(步骤601),并进行最相似点判定(步骤602),由于搜寻到的相似点1’为外部八点之一(步骤604),因此第二次搜寻时,以该点1’为新的搜寻中心,找寻菱形边上尚未搜寻的三点或五点(步骤605)。
接着进行最相似点判定(步骤606),若最相似点2’在菱形边上(步骤607),第三次搜寻时,则以该点2’为新的搜寻中心,找寻菱形边上尚未搜寻的三点(步骤605),若最相似点仍为中心点2’(步骤608),第四次搜寻时,则搜寻最接近中心点的小实心菱形四点(步骤609),如获得最相似点4’则结束搜寻,并传回最相似点的移动向量(步骤610)。
如图9~11所示,说明本发明改良式钻石搜寻动态估计方法的较佳实施例的变形,其搜寻范围的概念,均是由内往外搜寻,并且为部分实心菱形的集合。
如图9所示,此方法是是先由内部的小实心菱形五点找起,若最相似点1’在菱形边上,则再往未搜寻的外部的菱形框81的八点寻找,并以步骤602~610的方式逐步由内往外扩展搜寻,直至搜寻到最相似点为止。
如图10所示,此方法也是先由内部的小实心菱形五点找起,若最相似点1’在菱形边上,则以该相似点1’为搜寻起始点中心,再往其外部的半菱形框82的五点寻找,并以步骤602~610的方式逐步由内往外扩展搜寻,直至搜寻到最相似点为止。
如图11所示,类似于图10的半菱形框搜寻法,此方法也是先由内部的小实心菱形五点找起,若最相似点1’在菱形边上,则以该相似点1’为搜寻起始点中心,再往其外部的半菱形框83的三点寻找,并以步骤602~610的方式逐步由内往外扩展搜寻,直至搜寻到最相似点为止。
归纳上述,由于一般移动向量常是以放射状分布的方式出现,本发明改良式钻石搜寻动态估计方法以实心菱形区域为起始搜寻范围,接着进一步扩大至最近似点为中心的空心菱形外框为搜寻区域范围,最后再缩小为四点的搜寻区域范围,由于是先自出现机率大的实心区域内开始搜寻,因此可节省不必要的搜寻时间,并进一步提升了搜寻的效率。
Claims (7)
1.一种改良式钻石搜寻动态估计方法,是从一第一画面所具有的一预定像块,搜寻邻近的一第二画面中对应预定像块相匹配的像块以估算预定像块的移动向量,其特征在于:
所述的方法是设定第二画面中依一预定原则选择的一像块为一起始点,并以起始点为中心的一实心菱形区域为起始搜寻范围,由内往外逐渐扩展搜寻相匹配的像块以估算预定像块的移动向量;
其中,该实心菱形区域为具有13个点的区域,且该实心菱形区域分为一小菱形区域包括该起始点及与该起始点邻近的四个点,以及一外围区域包括小菱形区域周围的八个点。
2.如权利要求1所述的改良式钻石搜寻动态估计方法,其特征在于:
若搜寻到相匹配的像块在实心菱形区域的边上任一点,则搜寻范围更扩展至与该点外缘平行的三点。
3.如权利要求2所述的改良式钻石搜寻动态估计方法,其特征在于:
若搜寻到相匹配的像块在搜寻范围的中心点上,则搜寻范围以相匹配的像块为中心,搜寻与该像块邻近的四点。
4.如权利要求1所述的改良式钻石搜寻动态估计方法,其特征在于:
若搜寻到相匹配的像块在该实心菱形区域的任一端点,则搜寻范围更扩展至该端点外缘呈一三角形外框的五点。
5.如权利要求4所述的改良式钻石搜寻动态估计方法,其特征在于:
若搜寻到相匹配的像块在搜寻范围的中心点上,则搜寻范围以相匹配的像块为中心,搜寻与该像块邻近的四点。
6.如权利要求1所述的改良式钻石搜寻动态估计方法,其特征在于:
所欲搜寻邻近的该第二画面的位置,是位在第一画面前、后时序的多数画面中的任一画面。
7.如权利要求1所述的改良式钻石搜寻动态估计方法,其特征在于:
所述的由内往外逐渐扩展搜寻的方式是顺时针或逆时针的螺旋搜寻方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200510115480 CN100556146C (zh) | 2005-11-04 | 2005-11-04 | 改良式钻石搜寻动态估计方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200510115480 CN100556146C (zh) | 2005-11-04 | 2005-11-04 | 改良式钻石搜寻动态估计方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1960494A CN1960494A (zh) | 2007-05-09 |
CN100556146C true CN100556146C (zh) | 2009-10-28 |
Family
ID=38071952
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 200510115480 Expired - Fee Related CN100556146C (zh) | 2005-11-04 | 2005-11-04 | 改良式钻石搜寻动态估计方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN100556146C (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1333634A (zh) * | 2001-01-12 | 2002-01-30 | 北京航空航天大学 | 快速视频运动估计方法 |
US20040258154A1 (en) * | 2003-06-19 | 2004-12-23 | Microsoft Corporation | System and method for multi-stage predictive motion estimation |
CN1558683A (zh) * | 2004-02-13 | 2004-12-29 | 南京邮电学院 | 可变形状搜索(vss)的快速运动估计算法 |
-
2005
- 2005-11-04 CN CN 200510115480 patent/CN100556146C/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1333634A (zh) * | 2001-01-12 | 2002-01-30 | 北京航空航天大学 | 快速视频运动估计方法 |
US20040258154A1 (en) * | 2003-06-19 | 2004-12-23 | Microsoft Corporation | System and method for multi-stage predictive motion estimation |
CN1558683A (zh) * | 2004-02-13 | 2004-12-29 | 南京邮电学院 | 可变形状搜索(vss)的快速运动估计算法 |
Non-Patent Citations (1)
Title |
---|
一种改进的有效运动估计方法-准菱形搜索法. 龚涛,丁润涛.中国图象图形学报,第Vol 7(A)卷第Nov.2002期. 2002 * |
Also Published As
Publication number | Publication date |
---|---|
CN1960494A (zh) | 2007-05-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6732152B1 (ja) | 点群エンコーダ | |
KR101599875B1 (ko) | 멀티미디어의 컨텐트 특성에 기반한 멀티미디어 부호화 방법 및 장치, 멀티미디어의 컨텐트 특성에 기반한 멀티미디어 복호화 방법 및 장치 | |
Wu et al. | Lossless compression of JPEG coded photo collections | |
JP5606591B2 (ja) | ビデオ圧縮方法 | |
US7469011B2 (en) | Escape mode code resizing for fields and slices | |
CN105191309B (zh) | 用于下一代视频编码的内容自适应预测距离分析器和分层运动估计系统 | |
US7953153B2 (en) | Motion estimation method utilizing modified rhombus pattern search for a succession of frames in digital coding system | |
US10645410B2 (en) | Video decoding apparatus | |
CN101682778A (zh) | 使用基于对象边缘的分区进行编码和解码的方法和设备 | |
CN103797803A (zh) | 用于熵编码/解码的方法和设备 | |
JP2008061133A (ja) | 画像符号化装置及び画像符号化方法 | |
CN103020138A (zh) | 一种视频检索的方法和装置 | |
CN101389032A (zh) | 一种基于图像插值的帧内预测编码方法 | |
Sha et al. | Novel image set compression algorithm using rate-distortion optimized multiple reference image selection | |
CN100556146C (zh) | 改良式钻石搜寻动态估计方法 | |
JP2002010260A (ja) | 動きベクトル検出方法及び動画像符号化装置 | |
Andrey et al. | Research of block-based motion estimation methods for video compression | |
Sudhakar et al. | ASABSA: adaptive shape assisted block search algorithm and fuzzy holoentropy-enabled cost function for motion vector computation | |
JP2023112564A (ja) | 画像処理装置および方法、プログラム | |
Bhalod et al. | Region-based indexing in the JPEG2000 framework | |
Jiang et al. | Video extraction for fast content access to MPEG compressed videos | |
JP2008072608A (ja) | 画像符号化装置及び画像符号化方法 | |
CN1960487B (zh) | 基于距离加权搜寻顺序以估算移动向量的方法 | |
JP2004260251A (ja) | 動きベクトル検出装置及び動きベクトル検出プログラム | |
US20230245425A1 (en) | Image processing apparatus, image processing method and storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20091028 Termination date: 20161104 |
|
CF01 | Termination of patent right due to non-payment of annual fee |