CN1860795A - 用于将基于第一变换核的输入视频代码转换为基于第二变换核的输出视频的方法和装置 - Google Patents
用于将基于第一变换核的输入视频代码转换为基于第二变换核的输出视频的方法和装置 Download PDFInfo
- Publication number
- CN1860795A CN1860795A CN200580001040.7A CN200580001040A CN1860795A CN 1860795 A CN1860795 A CN 1860795A CN 200580001040 A CN200580001040 A CN 200580001040A CN 1860795 A CN1860795 A CN 1860795A
- Authority
- CN
- China
- Prior art keywords
- coefficients
- video
- output
- transform
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 230000009466 transformation Effects 0.000 title claims abstract description 28
- 239000011159 matrix material Substances 0.000 claims abstract description 42
- 238000013507 mapping Methods 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 description 36
- 238000010586 diagram Methods 0.000 description 21
- 238000007792 addition Methods 0.000 description 6
- 238000009795 derivation Methods 0.000 description 5
- 238000000844 transformation Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/40—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Complex Calculations (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
一种方法和系统将基于第一变换核的输入视频代码转换为基于第二变换核的输出视频。第一和第二变换核是不同的,并且代码转换完全在变换域中执行。单个变换核矩阵的系数被确定,然后仅通过使用单个变换核矩阵,输入视频的输入系数被转换为输出视频的输出系数。输入视频可以是基于DCT系数的,而输出视频可以是基于HT系数的。可替换地,输入视频可以是基于HT系数的,而输出视频可以是基于DCT系数的。另外,输出视频可以具有比输入视频低的空间分辨率。
Description
技术领域
本发明一般地涉及压缩视频的代码转换,更具体地说,涉及基于不同变换核的压缩视频的代码转换。
背景技术
MPEG-2是由ISO/IEC的运动图像专家组(MPEG)提出的视频编码标准。它是目前应用最广泛的视频编码标准。其应用包括数字电视广播,直接卫星广播,DVD,视频监控等等。在MPEG-2和多种其它视频编码标准中所用的变换是离散余弦变换(DCT)。因此,MPEG编码的视频使用DCT系数。
依据H.264/AVC标准的先进的视频编码力图在包括MPEG-2的早期标准之上显著提高压缩效率。这个标准预计拥有广泛的应用,包括有效的视频存储,视频会议,以及通过数字用户线路(DSL)的视频广播。AVC标准采用低复杂度的整数变换,在下文中被称为HT。因此,编码的AVC视频使用HT系数。
随着H.264/AVC的发展,例如,对于移动广播,需要将MPEG-2格式下的视频转换成H.264/AVC格式下的视频。这将使更加有效的网络传输和存储成为可能。另外,也需要从H.264/AVC的视频转化成MPEG-2的视频以使得遗留的MPEG-2设备能够处理根据后来的H.264/AVC格式编码的视频。
代码转换器简单地解码一个输入格式下编码的输入视频,用以重建原始视频的图像像素,然后在输出格式下重新编码解码后的视频。这被称为像素域的代码转换。对于像素域的代码转换,变换系数必须从源格式映射到目标格式。
图1示出了从MPEG-2格式到H.264/AVC格式的变换系数的现有技术像素域转换,即,DCT至HT的转换。输入是DCT系数的一个8×8的块(X)101。反DCT(IDCT)110被应用于块101以恢复原始图像像素的8×8的块(x)102。
像素的8×8的块102被均匀地分割成四个4×4的块(x1,x2,x3,x4)103。四块103中的每一块被传递给对应的HT120,用以产生变换系数的四个4×4的块(Y1,Y2,Y3和Y4)104。变换系数的四个块被组合形成一个8×8的块(Y)105。该操作对视频中的所有块重复。
图2示出从AVC格式到MPEG格式的变换系数的像素域转换,即,HT至DOC的转换。HT系数210的四个4×4块中的每一块YY1,YY2,YY3和YY4经过反HT210产生四个4×4的像素块xx1,xx2,xx3,和xx4,它们被组合形成一个8×8的像素块202。然后,像素块xx被定标220,并经过DCT230产生8×8的DCT系数块(XX)203。该操作对视频中的所有块重复。
完全在压缩或变换域执行代码转换从而避免重构图像像素是所期望的。由于不需要完整的解码和重新编码,变换域的代码转换比现有技术的像素域代码转换更加有效。
变换域的代码转换需要在输入和输出视频格式的输入和输出变换系数之间进行转换。当输入和输出格式因为两种格式均基于同一种变换核而相同时,该转换是普通的。
然而,到目前为止,因为不存在直接转换基于不同变换核的变换系数的方法,具有不同变换核的不同输入和输出格式之间的变换域代码转换是不可能的。
因此,需要提供在具有不同变换核的视频变换系数之间的直接转换。
发明内容
本发明将基于第一变换核的输入视频代码转换为基于第二变换核的输出视频。第一和第二变换核是不同的,并且代码转换完全在变换域执行。单个变换核矩阵的系数被确定。然后,仅通过使用单个变换核矩阵,输入视频的输入系数被转换成输出视频的输出系数。
输入视频可以是基于DCT系数的,而输出视频可以是基于HT系数的。可替换地,输入视频可以是基于HT系数的,而输出视频可以是基于DCT系数的。另外,输出视频可以具有比输入视频低的空间分辨率。
附图说明
图1是现有技术的像素域的DCT至HT转换的框图;
图2是现有技术的像素域的HT至DCT转换的框图;
图3是根据本发明的变换域的DCT至HT转换的框图;
图4是根据本发明的变换域的HT至DCT转换的框图;
图5是根据本发明的1D变换域的DCT至HT转换的实施例的流向图;
图6是根据本发明的1D变换域的HT至DCT转换的实施例的流向图;
图7是具有降采样的现有技术像素域DCT至HT转换的框图;
图8是根据本发明的具有降采样的变换域DCT至HT转换的框图;
图9是根据本发明的具有降采样的1D转换域DCT至HT变换的
实施例的流向图;
图10A是根据本发明使用DCT至HT转换从输入MPEG-2格式到输出H.264/AVC格式的代码转换的框图;
图10B是根据本发明使用HT至DCT转换从输入H.264/AVC格式到输出MPEG-2格式的代码转换的框图;以及
图10C是根据本发明使用DCT至HT转换在降低空间分辨率的情况下从输入MPEG-2格式到输出H.264/AVC格式的代码转换的框图。
具体实施方式
我们的发明提供用于将基于第一变换核的输入视频格式代码转换为基于第二变换核的输出视频格式的方法和系统,其中第一和第二变换核是不同的,并且代码转换完全在变换域执行。这种代码转换可被用于MPEG-2和H.264/AVC格式之间的代码转换。
我们描述直接DCT至HT转换的方法,直接HT至DCT转换的方法,以及具有降采样到较低分辨率的直接DCT至HT转换的方法。另外,用于计算各种转换的快速算法和整数近似被描述。
我们描述几个使用每种转换的代码转换系统。
DCT至HT的转换
图3示出了在变换域中从DCT到HT的变换系数的转换。S-变换310被应用于MPEG格式下的输入视频的输入DCT系数(X)301,用以产生AVC格式下的输出视频的输出HT系数(Y)302。
S-变换可以用变换核矩阵S表示,它是一个8×8的矩阵:
Y=S×X×ST, (1)
其中,ST是S的转置。该变换被称为S-变换,将在下面进一步详细描述。
推导过程中所用的符号表示如下:
X -具有8×8矩阵形式的输入DCT系数
Y -具有8×8矩阵形式的输出HT系数
Y1,Y2,Y3,Y4 -Y的四个4×4的子块
x -X的IDCT
x1,x2,x3,x4 -x的四个4×4的子块
× -乘法
(·)T -矩阵转置
H -H.264/AVC变换核矩阵
T8 -8×8的DCT变换核矩阵
其中,
S-变换的推导过程在下面描述。
x1,x2,x3和x4的HT变换是Y1,Y2,Y3和Y4,即,
Y1=H×x1×HT (3.1)
Y2=H×x2×HT (3.2)
Y3=H×x3×HT (3.3)
Y4=H×x4×HT. (3.4)
如果
那么我们可以将公式(3.1)~(3.4)重写为
单个公式
Y=HH×x×HHT, (4)
其中,x是X的IDCT,即,
x=T8 T×X×T8. (5)
由此可以得到
Y=HH×T8 T×X×T8×HHT. (6)
将公式(6)与公式(1)比较,我们可以得到
S=HH×T8 T (7)
直接DCT至HT的变换由公式(1)给出,而它的变换核矩阵S当舍入成四位小数时是:
S=
{
1.4142 1.2815 0 -0.4500 0 0.3007 0 -0.2549
0 0.9236 2.2304 1.7799 0 -0.8638 -0.1585 0.4824
0 -0.1056 0 0.7259 1.4142 1.0864 0 -0.5308
0 0.1169 0.1585 -0.0922 0 1.0379 2.2304 1.9750
1.4142 -1.2815 0 0.4500 0 -0.3007 0 0.2549
0 0.9236 -2.2304 1.7799 0 -0.8638 0.1585 0.4824
0 0.1056 0 -0.7259 1.4142 -1.0864 0 0.5308
0 0.1169 -0.1585 -0.0922 0 1.0379 -2.2304 1.9750
}
HT至DCT的转换
图4示出了通过直接将HT系数(YY)302映射到DCT系数(XX)301,在变换域中从HT到DCT的系数映射。这个映射被表示为从YY到XX的变换410:
XX=R×YY×RT (8)
在本发明中,该变换被称为R-变换。
R-变换不是S-变换的逆变换,即,矩阵R不等于S的逆矩阵S-1。原因是为了便于整数实现,反HT的变换核矩阵不是HT变换核矩阵H的逆矩阵,而是H-1的一个被定标的型式。因此我们使用R-变换代替反S-变换来保持这种区别。
下面是一些附加的符号表示:
YY -具有8×8矩阵形式的输入HT系数
XX -具有8×8矩阵形式的输出DCT系数
YY1,YY2,YY3,YY4 -YY的四个4×4的子块
xx1,xx2,xx3,xx4 -YY1,YY2,YY3,YY4的反HT,4×4的矩阵
xx -xx1,xx2,xx3,xx4的组合
R-变换的推导过程在下面描述。
,并且
那么可以得到
xx=HHinv×YY×HHinv T. (11)
在反HT和DCT之间的“定标”运算可用除法运算近似。因此,我们得到
XX=T8×(xx/64)×T8 T
=(T8×HHinv×YY×HHinv T×T8 T)/64. (12)
将公式(12)与公式(8)比较,我们可以得到
R=(T8×HHinv)/8. (13)
直接HT至DCT的变换由公式(8)给出,而它的变换核矩阵R当舍入成四位小数时是:
R=
{
0.1768 0 0 0 0.1768 0 0 0
0.1602 0.0577 -0.0132 0.0073 -0.1602 0.0577 0.0132 0.0073
0 0.1394 0 0.0099 0 -0.1394 0 -0.0099
-0.0562 0.1112 0.0907 -0.0058 0.0562 0.1112 -0.0907 -0.0058
0 0 0.1768 0 0 0 0.1768 0
0.0376 -0.0540 0.1358 0.0649 -0.0376 -0.0540 -0.1358 0.0649
0 -0.0099 0 0.1394 0 0.0099 0 -0.1394
-0.0319 0.0301 -0.0663 0.1234 0.0319 0.0301 0.0663 0.1234
}
快速DCT至HT的转换
S中的稀疏性和对称性可被用来执行S-变换的快速计算。令值a,...,s为
a=1.4142,b=1.2815,c=0.45, d=0.3007,e=0.2549,
f=0.9236,g=2.2304,h=1.7799,i=0.8638,j=0.1585,
k=0.4824,l=0.1056,m=0.7259,n=1.0864,o=0.5308,
p=0.1169,q=0.0922,r=1.0379,s=1.975.
我们有S=
{
a b 0 -c 0 d 0 -e
0 f g h 0 -i -j k
0 -l 0 m a n 0 -o
0 p j -q 0 r g s
a -b 0 c 0 -d 0 e
0 f -g h 0 -i j k
0 l 0 -m a -n 0 o
0 p -j -q 0 r -g s
}
就像公式(1)所提示的一样,2D S-变换是可分的变换。因此,它可以通过1D变换即列变换然后行变换而实现。所以,我们只描述1D变换的计算。
令z为一个8点的列向量,矩阵Z是z的1D S-变换。下面的步骤提供了从z有效地确定Z的方法。
m1=a×z[1]
m2=b×z[2]-c×z[4]+d×z[6]-e×z[8]
m3=g×z[3]-j×z[7]
m4=f×z[2]+h×z[4]-i×z[6]+k×z[8]
m5=a×z[5]
m6=-l×z[2]+m×z[4]+n×z[6]-o×z[8]
m7=j×z[3]+g×z[7]
m8=p×z[2]-q×z[4]+r×z[6]+s×z[8]
Z[1]=m1+m2
Z[2]=m3+m4
Z[3]=m5+m6
Z[4]=m7+m8
Z[5]=m1-m2
Z[6]=m4-m3
Z[7]=m5-m6
Z[8]=m8-m7
图5示出了如上所述的使用了值a,...,s的该方法的步骤。
该方法需要22次乘法和22次加法。由此可得2D S-变换需要352(16×22)次乘法和352(16×22)次加法,总共704次运算。
如图1所示的像素域的实现包括一个IDCT和四个HT变换,参见W.H.Chen、C.H.Smith和S.C.Fralick,“A Fast ComputationalAlgorithm for the Discrete Cosine Transform”,IEEE Trans.onCommunications,Vol.COM-25,pp.1004-1009,1977.通常被称为参考IDCT的该实现需要256(16×16)次乘法和416(16×26)次加法。每个HT变换需要16(2×8)次移位和64(4×4)次加法。四个HT变换需要64次移位和256次加法。由此可得像素域处理的所有计算需求是256次乘法,64次移位和672次加法,总共992次运算。
这样,与现有技术像素域实现相比,根据本发明的快速S-变换节省了约30%的运算。另外,S-变换只需用两个阶段实现,而使用参考IDCT的现有技术像素域处理需要六个阶段。
快速HT至DCT的转换
类似S-变换的情况,令
aa=0.1768, bb=0.1602, cc=0.0562, dd=0.0376, ee=0.0319
ff=0.0577, gg=0.1394, hh=0.1112, ii=0.0540, jj=-0.0099,
kk=0.0301, ll=0.0132, mm=0.0907, nn=0.1358, oo=0.0663,
pp=0.0073, qq=0.0058, rr=0.0649, ss=0.1234.
我们有R=
{
aa 0 0 0 aa 0 0 0
bb ff -ll pp -bb ff ll pp
0 gg 0 jj 0 -gg 0 -jj
-cc hh mm -qq cc hh -mm -qq
0 0 aa 0 0 0 aa 0
dd -ii nn rr -dd -ii -nn rr
0 -jj 0 gg 0 jj 0 -gg
-ee kk -oo ss ee kk oo ss
}
从公式(8)可知,2D R-变换也是可分的。它可以通过1D变换即列变换然后行变换来计算。因此,我们只示出了1D变换的计算。令ZZ为一个8点的列向量,zz是ZZ的1DR-变换。下面的步骤是用于从ZZ确定zz的方法。
m1=ZZ[1]+ZZ[5]
m2=ZZ[1]-ZZ[5]
m3=ZZ[2]-ZZ[6]
m4=ZZ[2]+ZZ[6]
m5=ZZ[3]+ZZ[7]
m6=ZZ[3]-ZZ[7]
m7=ZZ[4]-ZZ[8]
m8=ZZ[4]+ZZ[8]
zz[1]=aa×m1
zz[2]=bb×m2+ff×m4-ll×m6+pp×m8
zz[3]=gg×m3+jj×m7
zz[4]=-cc×m2+hh×m4+mm×m6-qq×m8
zz[5]=aa×m5
zz[6]=dd×m2-ii×m4+nn×m6+rr×m8
zz[7]=jj×m3+gg×m7
zz[8]=-ee×m2+kk×m4-oo×m6+ss×m8
图6示出了该方法的流向图表示。它实际上具有和图5同样的节点和连接,但具有相反的流向和不同的增益。因此,R-变换的复杂度和S-变换相同。
快速DCT至HT转换的整数近似
通常浮点运算实现起来比整数运算代价高。因此,我们也提供了针对S-变换的整数近似。
我们用一个为2的幂的整数乘S,并利用整数变换核矩阵来采用整数运算执行运算。然后,作为结果的系数被通过移位按比例减小。在视频代码转换的应用中,移位运算可在量化过程中并入。因此,使用整数运算不需要额外的计算。
选择越大的整数,我们可以得到越高的准确度。在许多应用中,该数字被在其上执行代码转换的微处理器所限制。我们描述如何选择该数字以使得可使用在大多数微处理器的能力之内的32比特运算来执行计算。
对于DCT至HT转换的情况,DCT系数位于[-2048~2047]的范围内。这是一个4096的动态范围,需要12比特来表示。2D S-变换的增益最多是42,需要log2(42)=5.4比特。因此,需要17.4比特来表示最终的S-变换的结果。为了能够使用32比特运算,比例因子要小于(2(32-17.4))的平方根。满足该条件且为2的幂的最大整数是128。
因此,整数变换核矩阵是
SI=round(S×128)
={
181 164 0 -58 0 38 0 -33
0 118 285 228 0 -111 -20 62
0 -14 0 93 181 139 0 -68
0 15 20 -12 0 133 285 253
181 -164 0 58 0 -38 0 33
0 118 -285 228 0 -111 20 62
0 14 0 -93 181 -139 0 68
0 15 -20 -12 0 133 -285 253
}
比较SI和S,我们注意到零元素的个数和对称性保持不变。因此,只要用矩阵SI而不是S的对应元素代替值a~s,针对S-变换推导出的方法和流向图同样适用于整数近似。
快速HT至DCT转换的整数近似
我们也为R-变换方法提供整数近似。我们周一个为2的幂的整数乘R,并利用整数变换核矩阵来采用整数运算执行运算。然后,作为结果的系数被通过移位按比例减小。
对于HT至DCT转换的情况,HT系数具有12比特的动态范围。2D R-变换的增益最多是0.3416,它实际上将动态范围减小到11比特。为了能够使用32比特运算,比例因子必须小于(2(32-11))的平方根。满足该条件且为2的幂的最大整数是1024。
因此,整数变换核矩阵是
RI=round(R×1024)
={
181 0 0 0 181 0 0 0
164 59 -14 7 -164 59 14 7
0 143 0 10 0 -143 0 -10
-58 114 93 -6 58 114 -93 -6
0 0 181 0 0 0 181 0
38 -55 139 66 -38 -55 -139 66
0 -10 0 143 0 10 0 -143
-33 31 -68 126 33 31 68 126
}
比较RI和R,我们注意到零元素的个数和对称性保持不变。因此,只要用矩阵RI而不是R的对应元素代替值aa~ss,针对R-变换推导出的方法和流向图同样适用于整数近似。
DCT至HT的降采样转换
对于具有空间分辨率降低的MPEG-2到H.264/AVC的代码转换,具有降采样的DCT至HT系数转换是有效的。
图7示出了从DCT到HT的具有降采样的现有技术像素域系数转换的框图。左上方的4×4的块701,即输入DCT系数702的低频系数X1,经过反DCT变换710产生一个4×4的像素块(x1)703,然后经过HT变换720产生HT系数块(Yd)704。
图8示出了具有降采样的变换域中的DCT至HT的转换,以及8×8块的DCT系数X到4×4块的HT系数Yd的转换。与在像素域中一样,只有X802的左上方的4×4的块(X1)801被使用,其余三块均被丢弃。DCT至HT的降采样转换可被表示为使用4×4的变换核矩阵Sd从X1到Yd803的变换810:
Yd=Sd×X1×Sd T (14)
该变换被称为Sd-变换,将在下面进一步详细描述。
推导过程中所用的一些符号表示如下:
X -输入DCT系数,一个8×8的矩阵
Yd -目标HT系数,一个4×4的矩阵
X1,X2,X3,X4-X的四个4×4的子块
x1 -X1的IDCT
T4 -4×4的DCT变换核矩阵
其中,
Sd-变换的推导过程在下面提供。
X1的反DCT是x1,即,
x1=T4 T×X1×T4. (15)
x1的HT变换是Yd,即,
Yd=H×x1×HT
=H×T4 T×X1×X4×HT.
将公式(15)与公式(14)比较,我们得到
Sd=H×T4 T. (16)
降采样的DCT至HT转换由公式(14)给出,而它的变换核矩阵Sd当舍入成四位小数时是:
Sd={
2 0 0 0
0 3.1543 0 -0.2242
0 0 2 0
0 0.2242 0 3.1543
},
其中α=2,β=3.1543,以及γ=0.2242。
遵循S-变换同样的原理,我们根据变换核矩阵Sd的稀疏性和对称性来推导方法。
图9示出了针对1D Sd变换的方法的流向图。2D变换也是可分的,并且可用1D变换实现。
DCT系数具有12比特的动态范围。2D Sd-变换的增益最多是11.42,它将动态范围增加到15.52比特。为了能够使用32比特运算,比例因子必须小于(2(32-15.52))的平方根。满足该条件并且为2的幂的最大整数是256。
因此,考虑了32比特运算的整数变换核矩阵给出如下:
SId=round(Sd×256)
={
512 0 0 0
0 808 0 -57
0 0 512 0
0 57 0 808
}
只要用矩阵SId而不是Sd的对应元素代替值α~γ,针对Sd-变换的方法也适用于整数近似。
代码转换
图10A-C示出了在本发明中描述的变换如何被用于代码转换内帧。
图10A示出了从输入的MPEG-2格式1001到输出的H.264/AVC格式1002的内帧代码转换的框图。输入被熵解码1003,并被反量化1004,以重构DCT系数,该系数通过使用S-变换310被转换为HT系数。HT系数随后经过量化1005和熵编码1006,产生输出的H.264/AVC比特流1002。
图10B示出了从输入的H.264/AVC格式1011到输出的MPEG-2格式1012的内帧代码转换的框图。输入被熵解码1013,并被反量化1014,以重构HT系数,该系数通过使用R-变换410被转换为DCT系数。DCT系数随后经过量化1015和熵编码1016,产生输出的MPEG-2比特流1012。
图10C示出了从输入的MPEG-2格式1021到输出的具有较低空间分辨率的H.264/AVC格式1022的内帧代码转换的框图。输入被熵解码1023,并被反量化1024,以重构DCT系数,该系数随后通过使用Sd-变换810被转换为较低空间分辨率的HT系数。HT系数经过量化1025和熵编码1026,产生输出的H.264/AVC比特流1022。
尽管本发明通过优选实施例的例子被描述,可以理解许多其它适配和修改可在本发明的精神和范围内进行。因此,覆盖所有这种在本发明的真实精神和范围内的变化和修改是所附的权利要求的目标。
Claims (10)
1.一种用于将基于第一变换核的输入视频代码转换为基于第二变换核的输出视频的方法,其中,第一和第二变换核是不同的,该方法包括:
确定单个变换核矩阵的系数;以及
仅使用该单个变换核矩阵,完全在变换域将所述输入视频的输入系数转换为所述输出视频的输出系数。
2.权利要求1的方法,在其中输入视频基于DCT系数,而输出视频基于HT系数。
3.权利要求1的方法,在其中输入视频基于HT系数,而输出视频基于DCT系数。
4.权利要求1的方法,在其中输入视频具有MPEG-2编码格式,而输出视频具有AVC编码格式。
5.权利要求1的方法,在其中输入视频具有AVC编码格式,而输出视频具有MPEG-2编码格式。
6.权利要求1的方法,进一步包括在转换时降低空间分辨率。
7.权利要求1的方法,进一步包括:
用整数值近似所述单个变换核矩阵的系数。
8.权利要求7的方法,进一步包括:
定标所述单个变换核矩阵的系数;以及
舍入所述被定标的系数。
9.权利要求1的方法,在其中输入视频包括内帧,该方法进一步包括:
熵解码所述输入视频的内帧;
反量化解码后的内帧以重构所述输入系数;
量化所述输出系数;以及
熵编码量化后的输出系数以产生所述输出视频的内帧。
10.一种用于将具有输入格式的输入视频转换为具有输出格式的输出视频的代码转换器,所述输入和输出格式不同,该代码转换器包括:
单个变换核矩阵;以及
用于完全在变换域仅使用该单个变换核矩阵来将所述输入视频的输入系数映射到所述输出视频的输出系数的装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/858,109 US20050265445A1 (en) | 2004-06-01 | 2004-06-01 | Transcoding videos based on different transformation kernels |
US10/858,109 | 2004-06-01 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1860795A true CN1860795A (zh) | 2006-11-08 |
Family
ID=34968839
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200580001040.7A Pending CN1860795A (zh) | 2004-06-01 | 2005-05-30 | 用于将基于第一变换核的输入视频代码转换为基于第二变换核的输出视频的方法和装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20050265445A1 (zh) |
EP (1) | EP1769641A1 (zh) |
JP (1) | JP2008501250A (zh) |
CN (1) | CN1860795A (zh) |
WO (1) | WO2005120076A1 (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009056006A1 (en) * | 2007-10-30 | 2009-05-07 | The Chinese University Of Hong Kong | Processes and apparatus for deriving order-16 integer transforms |
CN101990763A (zh) * | 2008-04-15 | 2011-03-23 | 香港中文大学 | 从n阶变换矩阵生成2n阶变换矩阵 |
US8175165B2 (en) | 2008-04-15 | 2012-05-08 | The Chinese University Of Hong Kong | Methods and apparatus for deriving an order-16 integer transform |
CN104244010A (zh) * | 2013-06-14 | 2014-12-24 | 浙江大学 | 提高数字信号变换性能的方法及数字信号变换方法和装置 |
CN104469388A (zh) * | 2014-12-11 | 2015-03-25 | 上海兆芯集成电路有限公司 | 高阶视频编解码芯片以及高阶视频编解码方法 |
CN111669579A (zh) * | 2019-03-09 | 2020-09-15 | 杭州海康威视数字技术股份有限公司 | 进行编码和解码的方法、编码端、解码端和系统 |
US20210211726A1 (en) * | 2009-06-07 | 2021-07-08 | Lg Electronics Inc. | Method and apparatus for decoding a video signal |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060109900A1 (en) * | 2004-11-23 | 2006-05-25 | Bo Shen | Image data transcoding |
US20060245491A1 (en) * | 2005-04-28 | 2006-11-02 | Mehrban Jam | Method and circuit for transcoding transform data |
JP2007096431A (ja) * | 2005-09-27 | 2007-04-12 | Matsushita Electric Ind Co Ltd | 任意の変換比率を有するデジタル・ビデオ・フォーマット下方変換装置及び方法 |
CN100539704C (zh) * | 2005-12-08 | 2009-09-09 | 香港中文大学 | 视频信号的编码系数的转换装置及其方法 |
US20070147496A1 (en) * | 2005-12-23 | 2007-06-28 | Bhaskar Sherigar | Hardware implementation of programmable controls for inverse quantizing with a plurality of standards |
US8320450B2 (en) | 2006-03-29 | 2012-11-27 | Vidyo, Inc. | System and method for transcoding between scalable and non-scalable video codecs |
EP2198618A2 (en) * | 2007-10-08 | 2010-06-23 | Nxp B.V. | Video decoding |
KR20100083271A (ko) * | 2009-01-13 | 2010-07-22 | 삼성전자주식회사 | 휴대 방송 서비스 공유 방법 및 장치 |
US20130041828A1 (en) * | 2011-08-10 | 2013-02-14 | Cox Communications, Inc. | Systems, Methods, and Apparatus for Managing Digital Content and Rights Tokens |
EP3067889A1 (en) | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and apparatus for signal-adaptive transform kernel switching in audio coding |
JP6632638B2 (ja) * | 2015-06-23 | 2020-01-22 | テレフオンアクチーボラゲット エルエム エリクソン(パブル) | トランスコーディングのための方法および構成 |
TWI761551B (zh) * | 2017-07-13 | 2022-04-21 | 美商松下電器(美國)知識產權公司 | 編碼裝置、編碼方法、解碼裝置及解碼方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7330509B2 (en) * | 2003-09-12 | 2008-02-12 | International Business Machines Corporation | Method for video transcoding with adaptive frame rate control |
US7379500B2 (en) * | 2003-09-30 | 2008-05-27 | Microsoft Corporation | Low-complexity 2-power transform for image/video compression |
-
2004
- 2004-06-01 US US10/858,109 patent/US20050265445A1/en not_active Abandoned
-
2005
- 2005-05-30 WO PCT/JP2005/010284 patent/WO2005120076A1/en not_active Application Discontinuation
- 2005-05-30 CN CN200580001040.7A patent/CN1860795A/zh active Pending
- 2005-05-30 JP JP2006519584A patent/JP2008501250A/ja active Pending
- 2005-05-30 EP EP05745826A patent/EP1769641A1/en not_active Withdrawn
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8255445B2 (en) | 2007-10-30 | 2012-08-28 | The Chinese University Of Hong Kong | Processes and apparatus for deriving order-16 integer transforms |
WO2009056006A1 (en) * | 2007-10-30 | 2009-05-07 | The Chinese University Of Hong Kong | Processes and apparatus for deriving order-16 integer transforms |
CN101990763A (zh) * | 2008-04-15 | 2011-03-23 | 香港中文大学 | 从n阶变换矩阵生成2n阶变换矩阵 |
US8175165B2 (en) | 2008-04-15 | 2012-05-08 | The Chinese University Of Hong Kong | Methods and apparatus for deriving an order-16 integer transform |
CN101990763B (zh) * | 2008-04-15 | 2013-01-02 | 香港中文大学 | 从n阶变换矩阵生成2n阶变换矩阵的系统和方法 |
US8483281B2 (en) | 2008-04-15 | 2013-07-09 | The Chinese University Of Hong Kong | Generation of an order-2N transform from an order-N transform |
US20210211726A1 (en) * | 2009-06-07 | 2021-07-08 | Lg Electronics Inc. | Method and apparatus for decoding a video signal |
US12120352B2 (en) * | 2009-06-07 | 2024-10-15 | Lg Electronics Inc. | Method and apparatus for decoding a video signal |
CN104244010A (zh) * | 2013-06-14 | 2014-12-24 | 浙江大学 | 提高数字信号变换性能的方法及数字信号变换方法和装置 |
CN108200439A (zh) * | 2013-06-14 | 2018-06-22 | 浙江大学 | 提高数字信号变换性能的方法及数字信号变换方法和装置 |
US10511860B2 (en) | 2013-06-14 | 2019-12-17 | Samsung Electronics Co., Ltd. | Signal transforming method and device |
CN108200439B (zh) * | 2013-06-14 | 2020-08-21 | 浙江大学 | 提高数字信号变换性能的方法及数字信号变换方法和装置 |
CN104469388B (zh) * | 2014-12-11 | 2017-12-08 | 上海兆芯集成电路有限公司 | 高阶视频编解码芯片以及高阶视频编解码方法 |
CN104469388A (zh) * | 2014-12-11 | 2015-03-25 | 上海兆芯集成电路有限公司 | 高阶视频编解码芯片以及高阶视频编解码方法 |
CN111669579A (zh) * | 2019-03-09 | 2020-09-15 | 杭州海康威视数字技术股份有限公司 | 进行编码和解码的方法、编码端、解码端和系统 |
Also Published As
Publication number | Publication date |
---|---|
EP1769641A1 (en) | 2007-04-04 |
JP2008501250A (ja) | 2008-01-17 |
WO2005120076A1 (en) | 2005-12-15 |
US20050265445A1 (en) | 2005-12-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1860795A (zh) | 用于将基于第一变换核的输入视频代码转换为基于第二变换核的输出视频的方法和装置 | |
CN1251518C (zh) | 数字信号转换方法和数字信号转换装置 | |
CN1149496C (zh) | 自适应视频信号运算处理装置 | |
CN1187716C (zh) | 用于编码和解码关键字数据的装置和方法 | |
CN1222153C (zh) | 数字图象压缩方法 | |
CN1685369A (zh) | 视频编码的低复杂性和统一标准的变换 | |
CN1585490A (zh) | 信号处理装置及使用它的电子设备 | |
CN1135850C (zh) | 运动图象编码装置及运动图象译码装置 | |
CN1575546A (zh) | 变换及后续量化的实现 | |
CN1543223A (zh) | 图像编码装置及图像译码装置 | |
CN1630202A (zh) | 编码设备、程序和数据处理方法 | |
CN1703096A (zh) | 预测编码/解码器、预测编码/解码方法和记录介质 | |
CN101039421A (zh) | 在编解码中的实现量化的方法和装置 | |
CN1076933C (zh) | 图像编码装置及方法 | |
CN1968417A (zh) | 解码装置、逆量化方法及计算机可读介质 | |
CN1270541C (zh) | 编码设备和方法 | |
CN1705375A (zh) | 预测编码器/解码器以及预测编码/解码方法 | |
CN1213612C (zh) | 用于采用离散变换进行数字视频数据去压缩的方法和系统 | |
CN1856997A (zh) | 8×8变换及量化 | |
CN1679340A (zh) | 不可伸缩到可伸缩视频转换方法,可伸缩到不可伸缩视频转换方法 | |
CN1969559A (zh) | 移动图像编码装置和移动图像译码装置、其方法和程序 | |
CN1835548A (zh) | 解码装置、解码方法及其程序产品 | |
CN1662069A (zh) | 图像、视频信号的编码/解码方法 | |
CN1210960C (zh) | 运用于图像编码和视频编码的8×8整数变换方法和装置 | |
CN101044687A (zh) | 用于数据压缩优化的方法、系统和计算机程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |