CN101167367A - 视频信号的dpcm编码方法 - Google Patents
视频信号的dpcm编码方法 Download PDFInfo
- Publication number
- CN101167367A CN101167367A CNA2006800143259A CN200680014325A CN101167367A CN 101167367 A CN101167367 A CN 101167367A CN A2006800143259 A CNA2006800143259 A CN A2006800143259A CN 200680014325 A CN200680014325 A CN 200680014325A CN 101167367 A CN101167367 A CN 101167367A
- Authority
- CN
- China
- Prior art keywords
- value
- difference
- data
- discrimination standard
- hival
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 92
- 238000004590 computer program Methods 0.000 claims description 8
- 238000003780 insertion Methods 0.000 claims description 4
- 230000037431 insertion Effects 0.000 claims description 4
- 150000001875 compounds Chemical class 0.000 abstract description 4
- 230000003534 oscillatory effect Effects 0.000 abstract 1
- 230000006835 compression Effects 0.000 description 17
- 238000007906 compression Methods 0.000 description 17
- 206010019133 Hangover Diseases 0.000 description 9
- 230000000694 effects Effects 0.000 description 6
- 238000013461 design Methods 0.000 description 4
- 230000008092 positive effect Effects 0.000 description 4
- 230000006399 behavior Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 208000003164 Diplopia Diseases 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000010355 oscillation Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- GOLXNESZZPUPJE-UHFFFAOYSA-N spiromesifen Chemical compound CC1=CC(C)=CC(C)=C1C(C(O1)=O)=C(OC(=O)CC(C)(C)C)C11CCCC1 GOLXNESZZPUPJE-UHFFFAOYSA-N 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/41—Bandwidth or redundancy reduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/3002—Conversion to or from differential modulation
- H03M7/3044—Conversion to or from differential modulation with several bits only, i.e. the difference between successive samples being coded by more than one bit, e.g. differential pulse code modulation [DPCM]
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/3002—Conversion to or from differential modulation
- H03M7/3044—Conversion to or from differential modulation with several bits only, i.e. the difference between successive samples being coded by more than one bit, e.g. differential pulse code modulation [DPCM]
- H03M7/3046—Conversion to or from differential modulation with several bits only, i.e. the difference between successive samples being coded by more than one bit, e.g. differential pulse code modulation [DPCM] adaptive, e.g. adaptive differential pulse code modulation [ADPCM]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/182—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Image Processing (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
Abstract
在用于编码和解码的方法中,将指示数据(d(x,y),S)与判别标准(T)进行比较。如果指示数据满足该判别标准,则代替基于差分编码的预测值插入绝对值(Hival/Loval)。这相当于绕过差分编码循环,这样会减少或消除这种循环中的振荡行为,从而减少复合图像文本部分的拖尾。所述绝对值优选地根据在先预测值动态地确定。
Description
本发明涉及用于使用预测编码方法对数据进行编码的方法,在这种预测编码方法中,生成表示预测值和实际值之间的差的差值,其中使用该差值和预测值来生成重构值,使用该重构值来预测新的预测值。
本发明还涉及对由预测编码方法生成的数据进行解码的方法,所述数据包括差值,其中使用该差值基于预测值来生成重构值,该重构值用于预测新的预测值。
本发明还涉及一种包括用于使用预测编码方法对数据进行编码的编码器的系统和一种包括用于使用预测编码方法对数据进行解码的解码器的系统。
本发明还涉及一种用于使用预测编码方法对数据进行编码的编码器和一种用于使用预测编码方法对数据进行解码的解码器。
从欧洲专利申请EP0599124中可以获知本文开篇段落中介绍的方法、系统、编码器和解码器。
在预测编码(也称为差分编码,比如DPCM编码方法)中,发送器和接收器按照某种固定顺序(例如光栅顺序,一行一行地并且在行内从左到右)来处理数据。当前数据是由已被重构的在前数据预测出来的。DPCM是用来压缩数据的编码方法。在DPCM(差分脉冲编码调制)方法中,对实际值与预测值之间的差值进行编码,所述预测值通常是由一个或多个前面的值得出的。通常要对这些差值进行量化。使用这些差值基于预测值来生成重构值。使用预测器来给出基于重构值的预测值。预测编码/解码方法在编码和解码过程中都包括计算循环。
DPCM对于自然图像的压缩通常是最佳的,即,用于视频信号,在这种情况下,所述的值例如是像素值。
当连续的实际像素值之间出现很大的差值时,比如当图像中存在边缘时,DPCM方法可能会造成振荡,就是所谓的过冲(overshot)。这会导致编码位流中的边缘拖尾,并且随后会造成解码图像中的边缘拖尾。在所介绍的现有技术文献EP0599124中,进行了以下尝试来减少这种振荡的出现:由不止一个在先预测值得出预测值或者在遇到边缘的情况下仅由一个在先预测值得出预测值。这样会至少部分地减少振荡的出现。
虽然公知的方法确实取得了一定的成效,但是过冲并没有消除。
边缘的拖尾在复合图像中尤为明显并且令人厌烦。对于在图像(或视频)压缩中的应用,DPCM通常对“自然”图像(比如典型的假日照片和电影)的压缩是最佳的。不过,随着数字技术的进步和CE与PC领域之间发生的关联交汇,出现了越来越多的“合成”图像(例如在游戏中)。这样的图像由自然图像内容和图形或文本(比如字幕)的混合体构成。复合图像的文本或图形部分中的边缘拖尾尤其让人厌烦,因为文本部分的边缘非常突兀,从而过冲相对较大并且清晰可见,而且在这个边缘收拢之前,下一个边缘又会出现。
本发明的目的是提供一种减少了过冲问题的本文开篇段落中介绍的方法、系统、编码器和解码器。
为此,编码和解码方法的特征在于,在编码和解码的方法中,分别将指示数据与判别标准进行比较,并且如果指示数据满足该判别标准,则为由差值和预测值重构的值插入固定值。
解码器和编码器的特征在于,它们包括控制器和开关,其中控制器控制开关在为由差值和预测值重构的值插入和不插入固定值之间进行切换。
按照本发明的系统具有按照本发明的解码器和/或编码器。
本发明基于这样的见解:例如在遇到突兀边缘的时候由固定值替换重构值(即,从差分编码方法切换到绝对编码方法)是很有益处的,并且反之亦然。对于字幕来说,固定值可以例如是白色255或240值。如果指示数据满足判别标准,本发明放弃差分编码和解码而进行绝对编码和解码(即,采用固定值取代重构值)。下文中给出数据和判别标准的数个例子。指示数据是位流中与判别标准进行比较的那些数据。在编码器和解码器中,指示数据是控制器的输入数据。指示数据可以是专门为此产生的数据,或者可以是存在于位流中或由位流中的数据生成的数据。
标准DPCM方法包括反馈循环结构。当图像中出现较大的突兀边缘时,即,例如从黑色到白色的跳变,会出现较大的差值,这个差值可以引发反馈循环中的振荡行为。通过由固定值代替使用重构值,使该值暂时锁定为固定值,从而消除振荡行为。从某种意义上讲,于是绕过了DPCM循环。如果判别标准得到满足,则使开关跳转,由此绕过DPCM循环并且对固定值编码。
本发明的见解之一是,虽然绕过DPCM循环和取而代之插入固定值可能会在某种程度上造成复合图像的“自然图像”部分发生一定的图像质量降低,但是在这些自然图像部分中,突兀边缘很少出现并且在清晰可辨的图案中会更少出现,因此复合图像的‘自然图像部分’几乎不会受到影响或者仅仅受到很小的影响。按照本发明的方法对复合图像的文本部分的正面效果要比对复合图像的自然图像部分可能有的任何负面效果突出得多。
用于指示数据的判别标准优选地与图像中边缘的出现有关。
发现一种简单的、但是在实践中非常有效的判别标准是,何时差值超过阈值。该判别标准仅仅是差值(在这些实施方式中构成与判别标准进行比较的数据)超过阈值。可以在本发明的构思之内使用与更加复杂的数据集相关的更加复杂的判别标准,比如一对或数量更多的相继差值满足一定判别标准,在这种情况下,要加以比较的数据是由一对或数量更多的差值形成的。在解码器端,“切换数据”也可以是由编码器生成的单独的“切换信号”,在这种情况下,要加以比较的数据是由切换信号形成的并且判别标准是存在(或不存在)“切换信号”。本发明的基本构思在于,当数据满足判别标准时,例如,差值(或多个差值)满足一个或多个判别标准或者独立的切换信号满足存在的判别标准时,绕过反馈循环并且为重构值插入固定值,或者换句话说,使开关跳转。
在非常简单的实施方式中,仅仅在特定符号的差值满足判别标准时,才插入固定绝对值,所述符号或正或负。差值的较大跳变可能出现在从较大的实际值变为较小的实际值的时候,或者反过来。在这种仅仅针对一种类型的较大差值的简单实施方式中,取代重构值对固定绝对值进行编码。在一些实施方式中,可以使用单独一个固定高或低重构值,例如,仅仅使用白色255或240值或黑色值。在这些实施方式中,消除了一种类型的突兀边缘所对应的问题。在这些简单实施方式中,优选地在差超过阈值时采用高固定重构值。
本发明的正面效果(即,减小拖尾效应)对任何突兀边缘都是存在的,但是并不总是同样明显。“拖尾”效应在白色背景上可能比在黑色背景上更加明显。这样,在某些情况下,本发明的正面效果或者至少其主要部分可以通过非常简单的实施方式来获得,在该实施方式中,仅仅一种类型的(正的或负的)较大差值触发DPCM循环的绕过。
在另一种更为优选的实施方式中,在任何符号的差值满足判别标准时插入固定绝对值。取决于差值的符号插入固定高或低绝对值。使用高(例如,“白色”)和低(例如,“黑色”)固定值。于是消除或至少减小了从低到高或相反的任何突兀边缘处的过冲。判别标准对正和负号的差值可以是基本相同的。这是一种简单的实施方式。在本发明的框架内,可以为不同符号的差值设定不同的判别标准。
在第一种简单的实施方式中,绝对值是不能调整的简单的固定值,例如白色对应的高值和/或黑色对应的低值。这种实施方式例如在已知使用黑色和白色文本的时候(例如,在字幕中),即在事先很清楚什么是对固定值的良好选择时,是有益处的。
在本发明的更为复杂的实施方式中,所述方法包括更新绝对值的步骤,优选地根据之前重构的值来进行更新。使用初始固定值,例如白色255或240,但是优选地使用之前重构的值来更新这些固定值。这种优选实施方式基于这样的见解:所述方法在遇到一系列的突兀边缘的时候效果最好,比如典型地在文本和图形的情况下。文本典型地具有背景颜色和差别明显的文本部分。通常背景是白色的并且本文是黑色的,但是也可以使用不同的背景和文本颜色,比如在白色背景上使用红色。于是提供固定值的更新是有益处的。用于更新的值可以由之前重构的值获得,下文中将对此加以解释说明。在本发明最宽泛的构思内,(多个)固定值的更新可以借助独立于重构值的更新信号来完成。不过优选地,(多个)固定值由之前重构的值来更新。
本发明在其所有的实施方式中可以用于使用预测编码方法的任何数据。这样,可以用于例如单色图像或者用于彩色图像。
众所周知,用于彩色图像的数据是由不同颜色的数据构成的。本发明可以用于构成图像数据的任何数据,但是优选地用于构成彩色图像数据的所有数据。
本发明也在任何计算机程序、任何计算机程序产品以及任何程序产品中实现,所述计算机程序包括用于当所述程序在计算机上运行时执行按照本发明的方法的程序代码装置,所述计算机程序产品包括存储在计算机可读介质上的、用于当所述程序在计算机上运行时执行按照本发明的方法的程序代码装置,所述程序产品包括用在按照本发明的系统中的、用来执行专用于本发明的功能的程序代码装置。
将以举例的方式并且参照附图更加详细地解释说明本发明的这些和其它方面,其中
附图1和2图解说明传统的DPCM编码方法,分别图解说明编码(附图1)和解码(附图2);
附图3和4图解说明复合图像;
附图5图解说明复合图像的文本部分;
附图6和7图解说明本发明的一种实施方式;
附图8和9图解说明本发明的另一种实施方式。
附图不是按比例画出的。总地来说,在附图中,一样的组成部分由相同的附图标记来指代。
附图1和2借助框图图解说明传统的DPCM编码方法。附图1图解说明该方法的编码器部分,附图2图解说明该方法的解码器部分。这些附图还示意性地图解说明了用于系统的编码器和解码器。在预测编码(也称为差分编码)中,发送器和接收器按照某种固定的顺序(例如,光栅顺序,一行一行地并且在行内从左到右)对数据(例如,图像数据)进行处理。当前数据(例如,当前像素)由已经重构的在前数据进行预测。当前数据P(x,y)与其预测值之间的差异是预测误差d(x,y),这个预测误差是在减法器1中计算出来的。然后在量化器Q中对该预测误差进行量化,给出量化预测误差,对该量化预测误差进行编码并且将其发送到接收器。量化预测误差因此是一个差值。将量化预测误差馈送给加法器2,在加法器2中将量化预测误差与预测值相加,给出重构值
将这个重构值馈送给预测器PRED,在该预测器中,使用延迟来预测下一个预测值在解码器侧,进行相反的处理。预测编码的基本思想是,通过对差值(即,预测误差)进行编码来消除连续数据之间的相互冗余,例如,消除图像行上的连续像素之间的相互冗余。如果适当地设计了预测,则预测误差的分布会聚拢在零附近并且会具有比原始图像的熵低得多的熵。
解码信号的最终结果,如附图2所示,不是P(x,y),而是即,是重构数据,因此会在原始图像与经过DPCM编码而后再解码出来的图像之间出现差异。当像素之间出现较大的差值(较大的d(x,y)值)时,比如当图像中存在边缘时,DPCM方法可能会造成振荡(过冲)。这会导致边缘拖尾。这在DPCM方法使用不止一个在前预测值来计算当前预测值时(就像EP0599124中介绍的方法中那样)尤为明显。在所介绍的现有技术文献EP0599124中,进行了这样的尝试:通过由不止一个在前预测值得出预测值或者在遇到边缘的情况下仅仅由一个在前预测值得出预测值,来为这种方法减少这种振荡的出现。不过,问题仍然存在。
本发明人发现,在复合图像中,边缘的拖尾尤其让人厌烦。对于在图像(或视频)压缩中的应用,DPCM通常对“自然”图像(比如典型的假日照片和电影)的压缩是最佳的。不过,随着数字技术的进步和CE与PC领域之间发生的关联交汇,出现了越来越多的“复合”图像(例如在游戏中)。这样的图像由自然图像内容和图形或文本(比如字幕)的混合体构成。复合图像的文本或图形部分中的边缘拖尾尤其让人厌烦,因为文本部分的边缘非常突兀,从而过冲相对较大,而且在这个边缘收拢之前,下一个边缘又会出现。这是一个根本性问题,无法由已知的方法解决,已知的方法仅仅是在遇到边缘时将一种类型的DPCM方法更换为另一种DPCM方法。附图3和4图解说明包括自然图像31以及文本部分32的复合图像。自然图像通常具有所有种类的灰色色调,而文本部分通常是黑色和白色,或者至少具有两个截然不同的值,高值和低值。本发明人已经认识到,可以借助简单的方法显著增高文本部分的图像质量,而不会显著降低复合图像的自然图像内容的图像质量。
附图5的上半部分图解说明标准DPCM方法对于文本部分所存在的问题。文本表现为‘虚影’文本。因DPCM方法造成的振荡会引生紧跟在黑白色与各个字母末尾之间的过渡之后的灰度值。
本发明致力于给出一种以比较根本的方式减小这一问题的方法。
为此,该方法的特征在于,该方法包括步骤:将差值与阈值进行比较,并且如果差值超过了阈值,则采用固定的重构值。
本发明基于这样的认识:例如如果出现高的差值,则将的值固定下来可能是有利的。对于字幕来说,这个值可以例如是白色255或240的值。因此,取代差分编码,按照本发明的方法对绝对值进行编码,即,的值是绝对固定值。绕过DPCM循环消除了振荡。附图5的下半部分显示了该方法的结果。‘虚影’文本消失了。从左到右,会在各个字母的开头和末尾遇到边缘。字母末尾处的从黑色到白色,会得到大的差值d(x,y),并且在量化之后得到大的量化误差这个大的差值超过了阈值,因此按照本发明,启动开关并且插入一个固定的绝对值,即,在这个例子中是插入纯白色255或240。如果该数据部分确实与文本部分有关,则下一个实际值将会是纯白色255或240,等于编码值。
文本和图形的压缩在按照本发明的方法中是通过在信号满足判别标准(在实例中,是在预测信号值与实际信号值之间出现大的差异,即,检测到了高于阈值的差值)的情况下将DPCM解码器的正常输出替换为固定值来得到改善的。这样的大差异或者预测误差,典型地出现在图像信号中的间断点或边缘上。尤其是,文本是由很多这样的突兀边缘表征的,这些突兀边缘出现在从文本字符样本到背景样本的任何变化以及反过来的变化上。这样该算法的中心思想是在文本压缩的情况下由代表正确的文本或背景颜色的固定值(Hival或Loval)代替正常的DPCM输出,或者更加一般地讲,是在图形或自然图像内容压缩的情况下由正确的前景或背景颜色代替正常的DPCM输出。在文本中,固定值通常代表黑色和白色。
附图6和7图解说明按照本发明的方法的一种简单实施方式。发生器61生成差值d(x,y)。编码器中的发生器62和解码器中的发生器71生成重构值存储器63、73存储着固定值Hival、Loval并且编码器开关Swe由控制器64控制。在这个例子中,开关在差值超过阈值T的时候得到触发。编码器和解码器包括用于控制分别处于编码器和解码器中的开关Swe和Swd的控制器64、74。这些实施方式中的控制器将控制器的输入端上给出的指示数据(在附图中,对于编码器来说是差值,对于解码器来说是差值或切换信号S)与一个或多个判别标准进行比较。在附图中,示意性地表示为将差值与阈值T进行比较。
编码和解码所对应的框图部分和附图1和2中的框图部分是一样的。区别是在编码器和解码器中分别设置了由控制器64和74控制的开关Swe和Swd。控制器64和74具有用于指示数据的输入。该输入决定是否触发开关Swe和Swd。控制器64具有用于数据的输入,在这种情况下,输入数据是差值开关Swe在输入数据满足判别标准时得到触发,例如,如果差值大于阈值T。“大于阈值”可以理解为,正值大于正阈值或者负值小于负阈值。如果开关得到触发,则依据的符号将重构值取作固定高值(Hival)或固定低值(Loval)。这个方法步骤是在解码以及编码过程中进行的。编码器可以具有用于生成单独的切换信号S的装置。如果是这样,则控制器74具有用于所述切换信号S的输入。提供单独的切换信号S具有需要更多数据传递和引入新数据的缺点,因为必须要将单独的信号包含在数据中。不过,这样作的优点在于开关Swd的控制更加强健。优点还在于,编码器不需要知道编码器中用来控制开关Swe的算法,因此能够例如改变编码器中使用的开关算法,而不需要改变解码器,或者能够实现对应于使用不同算法或不同输入数据的多种类型的编码器的标准解码器。
在这种简单实施方式中,高值和低值Hival和Loval是固定值。需要注意的是,尤其是在本发明的解码器部分中,判别标准按照其最一般的形式是,为解码器提供指示要启动开关的信号。简单的方案是,送入的差值满足判别标准,并且如果确实满足,则启动开关Swe、Swd。如前面所解释的,还有可能的是,在编码器部分中,当启动开关Swe时,生成“开关”信号S,该信号S与差值没有直接的关系或者具有不同的类型,在位流中发出“开关信号”S,并且该“开关”信号可以由解码器识别为用于解码器的“开关”信号。所需要的只是控制器7 4的输入端上的数据满足判别标准(在这种情况下是有“开关”信号S)。一旦满足这一判别标准,则启动开关Swd。在利用可单独识别的“开关信号”时,它们不必位于位流中与切换时刻相应的位置上,只要为解码器给出了认定切换时刻的信息即可。
当然,在一些情况下,任何优点都有可能带来缺点。本发明的方法提高了文本或图形的质量,但是有可能明显降低自然图像的图像质量。
不过,应当认识到,上面提到的大预测误差在正常情况下仅仅偶尔出现在自然图像中,所以自然图像的压缩/质量几乎不会受到这种情况的特殊处理的影响,试验已经证明了这一点。
在一些实施方式中,编码器安排成用来与数据流一起发出一个指示信号,指示编码器包括可操作控制器和开关。
这种优选实施方式能够使下列方案付诸实现:
可以为解码器配备用来识别是否使用了按照本发明的方法的装置。通过启用和禁用控制器和开关,解码器可以按照常规的方式(当不存在这种指示信号时)或者按照本发明(当存在指示信号时)进行操作。于是解码器能够解码由常规方法和编码器生成的数据以及由按照本发明的方法和编码器生成的数据。这样的解码器可以解码常规数据流以及由按照本发明的方法或编码器生成的数据流,而不会带来可感觉到的质量损失。
“操作控制器和开关”覆盖了编码器仅仅具有一种操作模式(即,总是按照本发明进行编码)的实施方式,而且还覆盖了能够按照两种操作模式操作的编码器,一种操作模式是开关发挥了作用,另一种操作模式是使用常规方法。如前面和后面所解释的,按照本发明的方法在对复合图像进行编码/解码的时候尤其有益。可以为要编码的数据(P(x,y))配备图像类型(例如,复合或自然图像)的类型指示,或者更加一般地讲,配备要编码的数据类型的类型指示。取决于这一类型指示,可以使控制器和开关操作或不操作。
在附图6和7的简单实施方式中,用于重构值的固定值是不能修改的。在本发明的优选实施方式中,这些固定值是可修改的。附图8和9图解说明编码(附图8)和解码(附图9)方法所对应的这种优选实施方式。所述附图还示意性地图解说明了用于系统的编码器和解码器。
这种优选实施方式的方法和算法在文本压缩的情况下通过适应性地改变/选择来由等价于或者至少非常接近于正确文本或背景颜色的值替代正常DPCM输出,或者更加一般地讲,在图形或自然图像内容压缩的情况下,由正确的前景或背景颜色替代正常的DPCM输出。这些替代颜色是按照替代规则来确定的,这些替代规则优选地根据之前确定的重构值确定新的固定值。在附图8和9中,借助箭头表示了如何确定新的固定值。
进行了下面的测试:
针对适用于复合图像压缩的一维DPCM压缩模块,由这一模块自身或者将这一模块作为较大的压缩系统中的众多模块/方法之一,进行了本发明的具体实现。使用紧接在前的样本作为当前样本的预测结果;以未压缩的形式直接发出一行的第一样本。
使用了具有16个输出电平的对称量化器,如果没有进一步采用熵编码,该对称量化器每符号需要log2(16)=4位,这样就给出了8位输入信号的2倍压缩倍率。首先对量化器的表达电平和判决区间进行设计,以在不使用本发明的情况下给出良好的复合图像视觉质量。结果得到的预测误差区间是±[0-5,6-19,20-35,36-57,58-85,86-119,120-159,160-255],同时各个区间所对应的(预测误差所对应的)相应表达值为±[2,12,27,46,71,102,139,207]。当预测误差刚好为0时,选择正的表达值。
为了应用本发明,不管何时发现最高的预测误差区间/值,都不将解码器的输出(重构值)取作前一样本±207,而是取而代之取决于预测误差为正(选择高值)还是负(选择低值)将其选择为“高值”Hival或“低值”Loval。
高和低固定(但仍可修改)值Hival和Loval在优选实施方式中是按照修改规则来加以修改的。为了检测到可靠的或稳定的输出值,可以例如仅当当前预测误差落在最低区间(即,±[0-5])之内或者当当前预测误差落在比前一预测误差区间更接近0的区间之内(即,预测误差正在变小)时,更新高和低值。如果应用了前面的更新条件,则在输出值小于96的情况下将低值设定为当前输出值,并且在输出值大于159的情况下将高值设定为当前输出值(所以低值必须处于最低的96个输出值0-95的范围之内,并且高值必须处于最高的96个输出值160-255的范围之内)。选择这些范围的原因是,在高值和低值不在前面提到的范围之内(即,高值确实不小于160并且低值也确实不超过95)的情况下,预测误差可能永远不会落在±[160-255]的最高区间之内。这些规则给出了值Hival和Loval可根据重构值修改的方法的例子。基于重构数据使用检测规则检测可靠的或稳定的输出值。一旦使用这些规则建立了这样的输出电平,就使用这些值作为值Hival和Loval。值Hival和Loval可以在编码器以及解码器中使用同样的算法来建立。
不过,也可以这样:编码器使用建立值Hival和Loval以及数据流中所述值发生改变的位置的算法,并且将值Hival和Loval作为单独的数据Sh1在数据流中发出。在这些实施方式中,解码器不必知道编码器建立值Hival和Loval所使用的算法,使得解码器能够处理由按照本发明的编码器生成的位流,即使编码器自身使用不同的算法来计算Hival、Loval也是可以的。
下面的表格给出了标准方法与本发明的方法进行比较的某些结果。计算了用于压缩图像的所谓PSNR(峰值信号噪声比)来作为图像质量的衡量标准。PSNR的值给出了质量的粗略衡量标准。
表1正常DPCM和所提出的方法的PSNR[dB]
画面31的PSNR值没有变化,但是对于字体32,PSNR值得到了大大提高。复合附图3的PSNR值也得到了大大提高。利用各种不同颜色的文本部分和图像进行的各种试验表明,本方法大幅提高了文本部分的质量,其中对黑白文本获得了最大的质量提高,而黑白文本是最常使用的文本类型,同时对复合图像的图像部分没有或者仅有非常小的负面影响。对文本部分造成的正面效果对人眼是清晰可见的,而对图像部分造成的任何负面效果对肉眼来说是不可见的。
简而言之,可以将本发明描述为:
在编码和解码方法中,将指示数据(,S)与判别标准(T)进行比较。如果指示数据满足该判别标准,则插入绝对值(Hival/Loval)取代基于差分编码的预测值。这相当于绕过差分编码循环,这样就减小或消除了这种循环中的振荡行为,从而减小了复合图像文本部分的拖尾。这些绝对值优选地基于在前预测值动态地确定。
本发明可以用来改善非自然图像内容尤其是文本信息的DPCM压缩。应用范围一般地讲是用于减小视频带宽或(内嵌)存储器要求的内嵌压缩,并且尤其是一维DPCM,应用于例如:
-用于减小带宽的(图像数据的)存储器转存的压缩,
-用于减小发送给LCoS显示器的图像数据的接口总线带宽的压缩,
-移动显示驱动器中图像存储器的压缩。
可以使用按照本发明的方法、系统、编码器和解码器。在本发明的概念中,“加法器”、“量化器”、“开关”、“预测器”等应该广义地加以理解,并且不管从方法还是系统的角度来说,都包括例如设计用于前面介绍的相加、量化、预测等的任何一个硬件(比如加法器、开关)、任何电路或子电路以及设计或编程用来作为一个整体或者本发明的一个特征按照本发明执行这些任务的任何一段软件(计算机程序或子程序或者计算机程序组或(多个)程序代码),以及单独或组合起来起到本身作用的这些硬件和软件的任意组合,而不局限于给定的示范性实施方式。
本领域技术人员将会意识到,本发明并不局限于上文中具体给出和介绍的那些具体方案。本发明存在于各种和每种新颖的特征以及特征的各种和每种组合。权利要求中的附图标记并不限定它们的保护范围。动词“包括”及其变体的使用并不排除还存在权利要求中列出的元素之外的元素的情况。在元素之前使用量词“一”或“一个”并不排除存在多个这种元素的情况。举例来说,在一个实施例中使用一量化器,其仅是优选实施方式。在例子中给出了量化器的具体类型。本发明并不受到特定类型量化器的使用的约束,从最广义的角度来说,也不受量化器的使用的约束。本发明可应用于编码的DPCM方法,包括任何混合DPCM/DCT类型的编码。在实例中,使用量化差值来触发开关。在本发明的范围之内,开关可以由与差值高于阈值的条件相关的任何信号触发。例如,在编码器部分中,开关S可以由差值d(x,y)来触发。所需要的是在差值超过阈值的时候触发开关S。本发明概念中的“指示数据”是数据流中构成控制器64(编码器部分中)或74(解码器部分中)的输入的任何数据。
在实例中,针对确定固定值Hival/Loval的方式给出了两种不同的实施方式。在这些实施方式之一中,固定值是不可修改的,例如纯白色和纯黑色,在另一种实施方式中,值是可以修改的,即,它们是根据预测值得到修改的。也可以,尤其是在按照可区分的单元(比如行或帧)来组织数据时,对指示特定行所对应的Loval值和Hival值的独立数据进行编码和解码。在本方法的编码部分中,可以确定Hival和Loval的“最佳”值并且与位流一起发出与所述值对应的信号。在解码端,对这些值进行解码并且实施相应的Hival和Loval值。
Claims (21)
3.按照权利要求1所述的对数据进行编码的方法,其中生成指示从固定值到重构值和/或相反的切换的切换信号(S)。
6.按照权利要求2或5所述的方法,其中仅仅在特定符号的差值满足所述判别标准时,才插入固定绝对值(Hival,Loval),所述符号或正或负。
7.按照权利要求2或5所述的方法,其中在任意符号的差值满足所述判别标准时,插入固定绝对值(Hival,Loval)。
9.按照权利要求1或4所述的方法,其中所述方法包括更新(81,82)固定值(Hival,Loval)的步骤。
13.按照权利要求12所述的编码器,其中所述判别标准是阈值(T)。
14.按照权利要求11所述的编码器,其中所述控制器设置为用来生成指示开关(Swe)的操作的切换信号(S)。
17.按照权利要求15所述的解码器,其中所述控制器设置为用来检测切换信号(S)的存在。
18.按照权利要求15所述的解码器,其中所述解码器具有禁用所述控制器(74)和开关(Swd)的装置。
19.一种对数据进行编码或解码的系统,该系统包括权利要求11或15中所述的编码器或解码器。
20.一种计算机程序产品,包括使得处理器能够执行权利要求1中所述的编码方法的程序代码装置。
21.一种计算机可读介质,包括权利要求20所述的计算机程序产品。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP05103441.1 | 2005-04-27 | ||
EP05103441 | 2005-04-27 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101167367A true CN101167367A (zh) | 2008-04-23 |
Family
ID=36764335
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2006800143259A Pending CN101167367A (zh) | 2005-04-27 | 2006-04-12 | 视频信号的dpcm编码方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20080205521A1 (zh) |
EP (1) | EP1878262A1 (zh) |
JP (1) | JP2008539635A (zh) |
KR (1) | KR20080012908A (zh) |
CN (1) | CN101167367A (zh) |
WO (1) | WO2006114718A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8509553B2 (en) | 2009-01-07 | 2013-08-13 | Industrial Technology Research Institute | DPCM-based encoder, decoder, encoding method and decoding method |
CN103379334A (zh) * | 2012-04-19 | 2013-10-30 | 富士施乐株式会社 | 图像编码装置和方法以及图像解码装置和方法 |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014143655A (ja) * | 2013-01-25 | 2014-08-07 | Fuji Xerox Co Ltd | 画像符号化装置及び画像復号化装置並びにプログラム |
US10473790B2 (en) | 2017-11-17 | 2019-11-12 | Swift Navigation, Inc. | Systems and methods for distributed dense network processing of satellite positioning data |
US10809388B1 (en) | 2019-05-01 | 2020-10-20 | Swift Navigation, Inc. | Systems and methods for high-integrity satellite positioning |
CN116261676A (zh) | 2020-07-13 | 2023-06-13 | 斯威夫特导航股份有限公司 | 用于确定gnss定位校正的系统和方法 |
US11624838B2 (en) | 2020-07-17 | 2023-04-11 | Swift Navigation, Inc. | System and method for providing GNSS corrections |
EP4222609A4 (en) | 2020-12-17 | 2025-02-05 | Swift Navigation Inc | SYSTEM AND METHOD FOR FUSING DEPOSIT NAVIGATION AND GNSS DATA STREAMS |
US11733397B2 (en) | 2021-07-24 | 2023-08-22 | Swift Navigation, Inc. | System and method for computing positioning protection levels |
WO2023018716A1 (en) | 2021-08-09 | 2023-02-16 | Swift Navigation, Inc. | System and method for providing gnss corrections |
EP4445182A1 (en) | 2021-12-10 | 2024-10-16 | Swift Navigation, Inc. | System and method for correcting satellite observations |
WO2023167899A1 (en) | 2022-03-01 | 2023-09-07 | Swift Navigation, Inc. | System and method for fusing sensor and satellite measurements for positioning determination |
WO2023167916A1 (en) | 2022-03-01 | 2023-09-07 | Swift Navigation, Inc. | System and method for detecting outliers in gnss observations |
US12013468B2 (en) | 2022-09-01 | 2024-06-18 | Swift Navigation, Inc. | System and method for determining GNSS corrections |
WO2024052959A1 (ja) * | 2022-09-05 | 2024-03-14 | 株式会社Fuji | 画像符号化装置および画像処理システム並びに部品実装機 |
US12019163B2 (en) | 2022-09-12 | 2024-06-25 | Swift Navigation, Inc. | System and method for GNSS correction transmission |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CH522330A (de) * | 1971-06-03 | 1972-06-15 | Ibm | Verfahren und Einrichtung zur Codierung und Decodierung von Videosignalen |
DE2740945C3 (de) * | 1977-09-10 | 1982-02-11 | Licentia Patent-Verwaltungs-Gmbh, 6000 Frankfurt | Verfahren zum Übertragen von Bildsignalen mit Hilfe der Differenz-Puls-Code-Modulation (DPCM) und geste uertem Quantisierer |
DE3331426A1 (de) * | 1983-08-31 | 1985-03-14 | Siemens AG, 1000 Berlin und 8000 München | Anordnung zur zweidimensionalen dpcm-codierung |
DE3405184C2 (de) * | 1984-02-14 | 1986-04-10 | Siemens AG, 1000 Berlin und 8000 München | Übertragungssystem |
US4847866A (en) * | 1988-02-01 | 1989-07-11 | Eastman Kodak Company | Differential pulse code modulation scheme incorporating a reconstructed value constrainer |
US5107519A (en) * | 1988-11-17 | 1992-04-21 | Canon Kabushiki Kaisha | Coding device and a decoding device |
JP2797411B2 (ja) * | 1989-04-26 | 1998-09-17 | キヤノン株式会社 | 符号化装置 |
US6295379B1 (en) * | 1997-09-29 | 2001-09-25 | Intel Corporation | DPCM image compression with plural quantization table levels |
US6826776B1 (en) * | 1999-04-09 | 2004-11-30 | Sony Corporation | Method and apparatus for determining signal path |
WO2003090444A2 (en) * | 2002-04-15 | 2003-10-30 | The Trustees Of Columbia University In The City Of New York | Methods for selecting a subsequence of video frames from a sequence of video frames |
-
2006
- 2006-04-12 CN CNA2006800143259A patent/CN101167367A/zh active Pending
- 2006-04-12 US US11/912,333 patent/US20080205521A1/en not_active Abandoned
- 2006-04-12 JP JP2008508355A patent/JP2008539635A/ja not_active Withdrawn
- 2006-04-12 WO PCT/IB2006/051125 patent/WO2006114718A1/en not_active Application Discontinuation
- 2006-04-12 EP EP06727896A patent/EP1878262A1/en not_active Withdrawn
- 2006-04-12 KR KR1020077027654A patent/KR20080012908A/ko not_active Application Discontinuation
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8509553B2 (en) | 2009-01-07 | 2013-08-13 | Industrial Technology Research Institute | DPCM-based encoder, decoder, encoding method and decoding method |
CN103379334A (zh) * | 2012-04-19 | 2013-10-30 | 富士施乐株式会社 | 图像编码装置和方法以及图像解码装置和方法 |
CN103379334B (zh) * | 2012-04-19 | 2018-09-28 | 富士施乐株式会社 | 图像编码装置和方法以及图像解码装置和方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2008539635A (ja) | 2008-11-13 |
KR20080012908A (ko) | 2008-02-12 |
US20080205521A1 (en) | 2008-08-28 |
EP1878262A1 (en) | 2008-01-16 |
WO2006114718A1 (en) | 2006-11-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101167367A (zh) | 视频信号的dpcm编码方法 | |
CN101889449B (zh) | 图像编码装置以及图像解码装置 | |
US9521433B2 (en) | Video encoding device, video decoding device, video encoding method, video decoding method, video encoding or decoding program | |
CN101218830A (zh) | 图像编码装置、图像解码装置、图像编码方法、图像解码方法、图像编码程序、图像解码程序、以及记录了图像编码程序的计算机可读记录介质、记录了图像解码程序的计算机可读记录介质 | |
US20100027655A1 (en) | Video encoding method and decoding method, apparatuses therefor, programs therefor, and storage media which store the programs | |
EP1689190A2 (en) | Image encoder and image decoder | |
CN112218092B (zh) | 串编码技术的编码方法、设备及存储介质 | |
US11197021B2 (en) | Coding resolution control method and terminal | |
WO2010040013A1 (en) | Quality metrics for coded video using just noticeable difference models | |
JP2006517069A (ja) | モーションベクトルの予測方法及びシステム | |
US9356620B2 (en) | Method for producing video coding and programme-product | |
US7206345B2 (en) | Method of decoding coded video signals | |
CA2376720C (en) | Coding method, coding apparatus, decoding method and decoding apparatus using subsampling | |
JP2001251627A (ja) | 符号化装置、符号化方法及びプログラムを記録した記録媒体 | |
US8483493B2 (en) | Method for the variable-complexity decoding of an image signal, corresponding decoding terminal, encoding method, encoding device, computer signal and programs | |
CN113422983B (zh) | 数据处理方法、计算机设备和存储介质 | |
CN112449186B (zh) | 编码方法、解码方法、相应的装置、电子设备及存储介质 | |
CN112673630B (zh) | 比特流解码器 | |
KR100413868B1 (ko) | 저장된비트스트림을사용하여온-스크린디스플레이메시지를발생시키는장치및방법 | |
JP4784814B2 (ja) | 符号化装置、符号化方法、及びプログラム | |
KR20010088880A (ko) | 영상 정보 코딩시 부호화 표시 방법 | |
JP4613771B2 (ja) | 符号化装置、符号化方法及びそのプログラム | |
CN112532974A (zh) | 串编码技术的编码方法、设备及存储介质 | |
CN113973206A (zh) | 编码方法和装置、及虚拟化应用系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Open date: 20080423 |