CN1926576A - 用于数字编码3d立体视频图像的方法和系统 - Google Patents
用于数字编码3d立体视频图像的方法和系统 Download PDFInfo
- Publication number
- CN1926576A CN1926576A CNA2004800425881A CN200480042588A CN1926576A CN 1926576 A CN1926576 A CN 1926576A CN A2004800425881 A CNA2004800425881 A CN A2004800425881A CN 200480042588 A CN200480042588 A CN 200480042588A CN 1926576 A CN1926576 A CN 1926576A
- Authority
- CN
- China
- Prior art keywords
- extension
- video
- sequence
- picture
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/10—Processing, recording or transmission of stereoscopic or multi-view image signals
- H04N13/106—Processing image signals
- H04N13/161—Encoding, multiplexing or demultiplexing different image signal components
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/593—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/597—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/65—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using error resilience
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
Abstract
为了从数字视频流中获取三维图像,对现有的MPEG2编码器进行了某些修改;在编码处理的不同部分对软件和硬件进行了改变。实际上,视频数据流的结构和video_sequence被修改以包括在比特级识别TDVision技术的图像类型所必需的标记。关于软件,将在以下处理中进行修改:video_sequence头、识别标记修改、数据字段修改、和图像字段修改。关于硬件,在左和右信道的图像之间进行电比较,将差别作为B类型图像进行处理,即,执行错误校正,将结果与TDVision技术识别符一起存储在临时缓冲器中。当编码信息时,DSP被用于执行预测、比较、量化、和DCT函数应用处理,以形成MPEG2可兼容的压缩视频流。
Description
技术领域
本发明涉及3DVisorTM装置中的立体视频图像显示,特别涉及借助于数字数据压缩系统的视频图像编码方法,该数字数据压缩系统允许使用标准化的压缩技术进行三维信息存储。
背景技术
目前,使用数据压缩技术以减小图像或者图像序列显示中的比特消耗。标准化工作由国际标准化组织的专家组执行。目前,这些方法通常称为为JPEG(联合图像专家组),和MPEG(运动图像专家组)。
这些技术的公共特性在于,图像块是借助于应用适用于块的变换来处理的,该变换通常通称为离散余弦变换(DCT)。形成的块被送往量化处理,随后用变长码来进行编码。
变长码是可逆过程,其允许对已经用变长码进行编码的块进行精确重建。
数字视频显示包括以30至75HZ频率连续显示或表示的一定数量的图像帧(30至96fps)。每一个图像帧仍然是由像素阵列根据特定系统的显示分辨率形成的图像。例如,VHS系统的显示分辨率为320列480行,NTSC系统的显示分辨率为720列486行,并且,高清晰电视系统(HDTV)的显示分辨率为1360列1020行。关于低分辨率的数字化形式,320列乘480行的VHS格式,两小时长度的电影可等于100GB的数字视频信息。为了比较,传统压缩光盘的容量约为0.6GB,磁盘的容量为1-2GB,并且目前的压缩光盘的容量为8GB或者更大。
由于存储和传输这种大信息量的限制,已经建立了几种标准的压缩处理。这些视频压缩技术使用连续图像帧之间的相似特性,称为时间空间相关性,以提供逐帧压缩,逐帧压缩是根据从帧到帧的像素表示进行的。
我们在电影院和电视屏幕上看到的所有图像都是根据以很高的速率显示完整图像(静态图像,如照片)的原理。当它们以每秒30帧的速度(30fps)以快速并且连续的方式被显示出来时,由于人眼的视觉暂留(retention),我们把它们看成动画图像。
为了将图像编码成以连续方式显示并形成视频信号,每一个图像都需要被分成行,其中每行依次被分为图像元素或像素,每一个像素具有两个相关联的值,即,亮度和色度。亮度表示每个点上的光强,而色度表示颜色,该颜色为定义的可以用三个字节来表示的颜色空间(RGB)的函数。
图像被显示在水平-垂直网格(raster)上,从上到下,从左到右循环地显示。显示的线数和频率可以由于格式不同而改变,例如,NTSC、PAL、或者SECAM。
理论上,可以为每一个亮度、色度U和色度V像素赋值,但是这表示四个字节(一个用于色度,三个用于颜色),在NTSC的480行乘720列格式每秒约30帧下,结果为4×480×720×30,大约每秒40MB的存储量,由于可用带宽的限制这是很难存储和传输的。当前,已经能够将色度数据减小为1:4像素;即,每四个像素取一个颜色采样,并且复制相同的信息用于缺失的三个像素,人眼并不能感知到差别;这些格式为,即:
4:4:4(在4×4=16像素组中,四个亮度采样和四个色度采样)。
4:2:2(在4×2=8像素组中,四个亮度采样和两个色度采样)。
4:1:1(在4×1=4像素组中,四个亮度采样和一个色度采样)。
MPEG1中的4:2:0(在4×2=8像素组中,八个亮度采样,水平像素之间的两个色度采样)。
MPEG1中的4:2:0(在4×2=8像素组中,八个亮度采样,垂直像素之间的两个色度采样)。
即使当以这种方式减少信息时,用NTSC格式以4:2:0的质量存储一秒钟的信息所必需的数字信息量是15MB,或者,对于两小时长的文件是108GB。
现有几种用于从二维视频序列进行三维场景重建的方法。考虑到近来技术发展以及考虑到将来的发展,MPEG4标准试图提供时空相关的图形编码媒介,它将是立体图像、工程应用的设计和制造中的重要工具。在重建场景的几何模型处创建虚拟空间。例如,2003年12月9日提交的授予Cecile Dufour的第6,661,914号USP,其中描述了新的三维重建方法,场景连续性用简单的照相机取得,图像的轮廓被重建,每个场景中隐藏部分深度稍后被投影并经过提取处理。
在图像处理的领域中,许多人做出了有价值的贡献,例如:2003年10月21日授予Itokawa的第6,636,644号USP,其涉及使用MPEG4的图像处理,其中跨越图像边界延伸的图像色度值被提取出来,由此实现了编码的更高效率,并且能够实现图像轮廓的自然色重现。
现有几种用于对视频信号进行编码的方法和方案,例如,2003年10月14日授予Kleihorst et al.的第6,633,676号USP,该方法被应用于照相机系统中的编码器检测器,用运动补偿(I.B.P.)对视频信号进行编码,并生成高分辨率图像,该图像是先前图像的插值结果,总之,确定视频信号中更感兴趣的区域,其总共占用较少的存储空间。
图像压缩编码主要用于以高效方式存储或传输数字图像,一种压缩数字图像编码的方法使用DCT,因为这是例如JPEG和MPEG的公共标准中的一种主要技术。2002年2月5日授予Boon的第6,345,123号USP描述了一种通过普通的DCT方法变换系数来进行数字图像编码的方法,对上述系数进行量化处理,以便于将它们变换成预先写入的量化级数,最后,变长编码处理被应用到量化和转换后的系数,将它们与变长编码表进行比较。
图像被分为多个小区域,以进行编码,小区域互相邻接,从一个区域采样,就可预测下一个图像区域的情况。在2000年11月14日授予Boon等人的第6,148,109号USP中使用的该预测编码方法,其中对所生成的小区域之间的差别的图像数据进行编码并将该生成的图像数据提取出来。
2000年8月1日授予Murakami et al.的第6,097,759号USP描述了用于场编码图像的邻近的块编码系统。块的图案包括一个单独的多块区域和一个非交织的块;而且,编码系统查询奇数和偶数场运动,以产生运动补偿预测信号,从而提供高效率编码。
授予Katata等的第5,978,515、5,963,257、5,815,601号USP专利,涉及用于以这样的方式编码图像数据的图像编码器:它们增强所选区域相对于其它区域的图像质量,而不增加用于描述该所选区域的数据量。
1996年11月26日授予Gisle的第5,579,413号USP描述了用于将数据信号变换成量化的图像块、并将其转换成变长编码数据信号的方法,其中每个事件都用三维向量来表示。需要使用允许在较小空间中存储相同内容的数据压缩系统,专家组致力于提出压缩信息和显示图像的方法;但在实现细节与MPEG相符合时,在所有软件和硬件开发者可创建执行处理的新方式的目标下,并不提及实现的细节。当前,MPEG2是世界范围的标准,被电视和视频以及音频相关的公司广泛使用。
音频和视频被打包到基本包(PES)中,所述音频和视频包交织在一起,以创建MPEG2数据流。每个包具有用于音频和视频在播放时间同步的时间标识(时间标签),例如,对于每三个视频帧,结合一个音频帧。
MPEG有两种在系统的数据流中交织视频和音频的不同方法:
传输流被用在错误概率较高的系统中,例如卫星系统,其易于受到干扰。每个包的长度是188字节,以标识头开始,这使得可以识别间隙和修复错误。不同的音频和视频程序能够同时在单一传输流上通过传输流传输;由于信息头,它们可为独立的并且可单独解码并且集成到许多程序中。
程序流被用在错误概率较低的系统中,如在DVD播放系统中。在这种情况下,包具有可变长度和实际上比传输流中所使用的包大的尺寸。作为主要特性,程序流仅允许单一的程序内容。
MPEG2标准下的视频系统允许隔行类型的和逐行类型的视频图像的编码。
即,逐行视频格式被存储在整帧(帧图片,fp)中,并且在隔行的视频格式中,它可以两种方法被存储,通过整帧图像(帧图片)或者通过场图像(场图片)。
在压缩格式中,存在三种MPEG2格式的图像:
帧内编码(I),它们的信息被编码为图像自身内部数据的函数。
预测编码(P),其信息单独地取决于其它将来时间点处的数据。
双向预测编码(B),其信息取决于过去和将来时间点处的数据。
按顺序,有三种应用到上面的包的压缩类型,例如,时间预测、压缩和空间压缩。
时间上的预测压缩涉及两个时间上不同的帧,但是它们具有相互运动,该时间上的预测压缩利用帧之间的图像差别很小的事实。
空间压缩将位于一个相同帧(帧内编码的)内的信息压缩,例如,在100×100像素图像中,3个字节用于颜色,1个字节用于亮度,如果需要存储该信息,则每帧需要40KB;相反,如果该图像是全白的,可以表示为一个颜色:255R,255G,255B,Xstart=0,Ystart=0,Xend=99,Yend=99,这将指示该整个区域是白色的;仅使用7KB或8KB,而没有使用40KB。这样,就实现了MPEG压缩;该处理步骤比较复杂,在本发明的范围之外。
类型(I)图像是仅包含自身图像的,它们不涉及任何先前的或后续的图像,因此不使用时间预测压缩,而只作为它自身空间的函数。
类型(P)图像是根据参考图像,以对它们本身进行编码的,因此它们使用时间预测压缩,也使用空间压缩。这些图像可涉及(I)类型图像或者其它(P)类型图像,但是仅使用一种图像参考图像。
(B)类型图像需要先前的和后续的两个参考图像,以进行重建,该类型的图像具有最佳压缩指标。用于获得(B)类型图像的参考图像可为(P)或者(I)类型,而不能是(B)类型。
编码和解码序列不同。
为了降低信息量,完整图像被分为称为宏块的单元的整帧;每个宏块包括16像素×16像素,从上到下从左到右排列和命名,在屏幕上创建宏块矩阵阵列,宏块以顺序的形式在信息流中被发送,即,0,1,2,3,...,n。
具有(I)类型图像的宏块仅包含自身的空间压缩;(P)类型图像可包含(P)类型的宏块,以便于参考先前的图像,有包含内部编码的宏块(交织的宏块)的可能性,并不受到限制。
(B)类型的图像也可由内部编码(交织)类型的宏块形成,其涉及先前的图像、后续的图像,或者二者均涉及。
按顺序,宏块被分成多块,一个块是8×8数据或采样矩阵;由于色度格式被分为4:4:4格式的形式需要一个亮度采样Y,一个色度采样Cr,一个色度采样Cb,因此,4:4:4格式的每个宏块需要12个块,在4:2:0格式中,每个宏块需要6个块。
一组连续宏块表示一片;一片中可以有任意数目的宏块,它们必须属于单一的行,以与各宏块相同的方式,这些片从左到右从上到下命名。各片不必须覆盖所有的图像,因为编码后的图像不需要对每个像素采样。
一些MPEG标准需要图像必须完全符合的固定的片结构。使用适当的硬件和软件算法的组合允许MPEG图像压缩。
编码后的数据是具有特定块信息的字节、宏块、场、帧、图像和MPEG2格式视频。
信息必须被分成块组,并且从信息编码例如(VLC)获得的结果是线性比特-字节流。
其中VLC(变长解码器)是用较短码代替最频繁使用的符号并用较长码代替较少发生的那些符号的压缩算法。压缩后的该信息占用较少的空间,并能够较快地通过网络传输。然而,它不是容易编辑的格式,并且需要使用查阅表进行解压缩。
反向扫描,信息必须被分成块组,并且当借助VLC对信息进行编码时,所得到的是线性流。块是8×8数据矩阵,因此有必要将线性信息转换成8×8的方形矩阵。根据其是逐行图像还是隔行图像,这是以向下之字形方式进行的,在两种序列类型中都是从上到下从左到右的。
反向量化,在于简单地将每个数据值乘以一个因子。当编码的时候,块中的多数数据被量化以去除人眼所不能够感知到的信息,量化允许获得较大的MPEG2流的转换,并且还需要执行在解码处理中的反向处理(反向量化)。
MPEG视频序列结构:这是MPEG2格式中使用的最大结构,并具有以下格式:
视频序列(Video_Sequence)
序列头(Sequence_header)
序列扩展(Sequence_Extension)
用户数据(0)和扩展(Extension_and_User_Data(0))
图像组头(Group_of_Picture_Header)
用户数据(1)和扩展(Extension_and_User_Data(1))
图像头(Picture_Header)
编码图像扩展(Picture_Coding_Extension)
用户数据(2)和扩展(Extension_and_User_Data(2))
图像数据(Picture_Data)
片(Slice)
宏块(Macroblock)
动作矢量(Motion_Vectors)
编码块图案(Coded_Block_Pattern)
块(Block)
最终序列编码(Sequence_end_Code)
视频序列包括三种结构,视频序列被应用于MPEG1和MPEG2格式,以便于区分各版本,必须验证在序列头后面存在序列扩展;如果序列头后面不接有序列扩展,则该流是MPEG1格式的视频流。
发明内容
本发明的一个目的是提供一种立体3D图像数字编码方法和系统,其提供用于在3Dvisors中传输、接收和显示的编码的数据。
本发明的另一个目的是提供一种编码方案,其中,视频数据流video_sequence的结构被修改,并且在比特级包括识别标记。
本发明的又一个目的是提供一种3D图像数字编码软件处理,以video_sequence、识别标记、数据字段,和图像字段被修改的方式。
本发明的又一个目的是提供一种3D图像数字编码硬件处理,其方式是,在左和右通道之间进行电比较,对图像之间的差别进行错误校正,将处理后的图像存储在具有TDVision技术识别符的video_sequence中。
本发明的又一个目的是提供一种3D图像数字编码硬件处理,其方式是,DSP的输入缓冲器的存储器被增为双倍的,两个独立的视频信号可同时输入,并且DSP能够对二个视频信号的输入缓冲器进行比较。
附图说明
图1表示立体3D视频图像编码的硬件和软件改变;
图2表示MPEG2-4可兼容的立体3D视频图像的编译处理;
图3表示用于编译MPEG2-4可兼容的立体3D视频图像的软件格式;
图4表示用于编译MPEG2-4可兼容的立体3D视频图像的硬件格式;
图5表示本发明的编码器所属的技术分支图:即,立体3D图像处理,其编码、解码、经由电缆的传输、卫星和DVD、HDTV和3DVisors显示。
具体实施方式
为了实现从数字视频流中获取三维图像的目的,已经通过在编码处理的不同部分中对硬件和软件进行改变而对现有的MPEG2编码器进行修改。如图1中所示,MPEG2-4可兼容的TDVision编码器(1)具有其自身的编码处理(2),是通过软件(3)和硬件(4)的改变而实现的。
在图2中,显示出本发明的编码器实体的编译处理,实际上,图像(10)被拍摄并被提交到动作补偿和错误检测处理(11);应用离散余弦变换函数来改变频率参数(12),随后应用量化矩阵(13),以执行归一化处理,应用用于行转换处理的矩阵(14),在此处有执行变长编码(15)的可能性,并且,最后,得到具有编码数据(16)的视频序列。为了执行该编译处理,必须遵照格式(30,图3)或者MPEG2兼容的3D图像编译方法,实际上,如图3所示,必须对video_sequence(31)在sequence_header(32)、user_data(33)、sequence_scalable_extension(34)、picture_header(35)、picture_coding_extension(36)和picture_temporal_scalable_extension(37)结构中进行修改,从而获得适于用TDVision立体照相机拍摄的立体3D数字图像的编译格式。
视频数据流的结构和video_sequence必须被修改以包括在比特级上识别TDVision技术编码图像类型所必要的标记。
在以下编码阶段进行的修改,即,当以MPEG2(软件)编码双图像时;当用硬件编码图像时。
软件:
修改video_sequence头。
识别识别标记。
修改数据字段。
修改图像字段。
硬件:
在左和右通道之间进行电比较。
将差别作为B类型图像进行处理(错误校正)。
随后,将其与TDVision识别符一起存储。
对附加缓冲器进行改变。
其结果被保存并存储到辅助缓冲器中。
实际上,DSP缓冲器的输入存储器被增为双倍;允许同时输入对应于来自立体TDVision照相机的立体左-右现有信号的两个独立视频信号;DSP能够比较两个视频信号的输入缓冲器。
硬件编码处理是作为单一视频输入通道的函数,以标准MPEG2方式执行的,获得两个信号(左和右)并进行电比较,得到左和右信号之间的比较的差别,上述差别被存储到临时缓冲器中,计算关于左信号的亮度和色度的错误校正;应用DCT(离散余弦变换)函数,并将信息存储到B类型块中:
a)在USER_DATA()(SW)识别结构中
b)在PICTURE_DATA3D()结构中在下一帧中继续。
在图4中的框图中显示出硬件,实际上,获得左信号(41)和右信号(42),两个信号都存储在临时缓冲器(43)中,比较左和右信号之间的差别,计算错误差别并存储信息(45),对正确图像进行编码(46),作为“I”、“B”或者“P”类型图像执行编码(47),并最后存储到video_sequence中(48)。
复制将由DSP处理的存储是重要的,并且可能设置高达8个输出缓冲器,这允许立体图像在例如TDVision的3DVisor的装置上的先前的和同时的显示。
实际上,两个信道必须在调用Texas Instruments TMS320C62X DSP的编程API的时候被初始化。
MPEG2VDEC_create(const IMPEG2VDEC_fxns*fxns,constMPEG2VDEC_Params*params)。
其中IMPEG2VDEC_fxns y MPEG2VDEC_Params是为每个视频通道定义操作参数的指针结构,例如:
3DLhandle=MPEG2VDEC_create(fxns3DLEFT,Params3DLEFT)。
3DRhandle=MPEG2VDEC_create(fxns3DRIGHT,Params3DRIGHT)。
从而使得两个视频通道能够被解码,并能够获得两个视频处理器,一个用于左-右立体通道。
需要两个显示输出缓冲器,借助于软件,将定义两个缓冲器中的哪一个必须通过调用AP函数显示输出:
即,MPEG2VDEC_APPLY(3DRhandle,inputR1,inputR2,inputR3,3doutright_pb,3doutright_fb)。
MPEG2VDEC_APPLY(3DLhandle,inputL1,inputL2,inputL3,3doutleft_pb,3doutleft_fb)。
其中3DLhandle是指向由DSP的创建函数返回的句柄的指针,input1参数是FUNC_DECODE_FRAME或FUNC_START_PARA地址,input2是指向外部输入缓冲器地址的指针,并且,input3是外部输入缓冲器的大小。
3doutleft_pb是参数缓冲器的地址,并且,3doutleft_fb是将要存储解码图像的输出缓冲器的开始部分。
时间码和时间标签将被用于以顺序和同步的方式输出到最后的装置。
软件和硬件处理的集成是通过被称为DSP的装置执行的,DSP执行多数硬件处理。这些DSP通过由制造商所提供的C和汇编语言混合进行编程。每个DSP有其自己的API,包括位于DSP中并被软件调用的函数列表或过程调用。
通过该参考信息,作出用于MPEG2格式可兼容的3D图像编码的本申请。
实际上,在视频序列的开始,总出现序列头和序列扩展。序列扩展的重复必须与第一个相同。相反,与第一次发生相比,序列头重复变化很少,仅有定义量化矩阵的部分应该改变。因为序列重复允许对视频流的随机访问,即,解码器可在视频流的中间开始播放,这是可以实现的,仅需要搜索先前的序列头和序列扩展,以便能够解码视频流中的后续图像。这也会发生在不能从开头开始的视频流上,例如在程序已经开始时开启卫星解码器。
即,序列头提供视频流上的较高信息级,为了明确说明,还指出对应于每一个信息级的比特数,最高有效比特位于序列扩展(Sequence_Extension)结构内,它是通过以下结构形成的:
Sequence_Header
字段 #bits 描述
Sequence_Header_Code 32 Sequence_Header开始
0x00001B3
Horizontal_Size_Value 12 12个较低有效比特用于宽度
Vertical_Size_Value 12 12个较低有效比特用于高度
4 图像方面
0000 禁用
Aspect Ratio Information(纵横比 0001 n/a TDVision
信息) 0010 4:3 TDVision
0011 16:9 TDVision
0100 2.21:1 TDVision
0111 将执行逻辑“与”以获
得与2D系统的向后兼容性。
0101…1111 保留
4 0000 禁用
Frame rate code(帧速率码) 0001 TDVision格式中的
24,000/1001(23.976)
0010 TDVision格式中的24
0011 25“
0100 30,000/1001(29,97)“
0101 30“
0110 50“
0111 60,000/1001(59,94)“(将
执行逻辑“与”以获得与2D
系统的向后兼容性。)
1000 60
1111 保留
Bit_rate_value 18 Video_stream比特率的18个
较低有效比特(bit_rata=
400×bit_rate_value+
bit_rate_extension<<18)
最高有效比特位于
sequence_extension结构中。
Marker_bit 1 总为1(防止start_code_失
效)。
Vbv_buffer_size_value 10 vbv_buffer_size的10个较低
有效比特,其确定视频缓冲
检验器(VBV)的大小,VBV
为一种结构,其用于确保数
据流可被用于解码有限大小
的缓冲数据而不超过或在缓
冲器中保留过多自由空间。
Constrained_parameters_flag 1 总为0,不用在MPEG2中。
Load_intra_quantizer_matrix 1 指示intra-coded的量化矩阵
是否可用。
If load_intra_quantizer_matrix 8×64 如果指示量化矩阵,则这里
Non_intra_quantizer_matrix(64) 必须指出,它是8×64的矩阵。
Load_non_intra_quantizer_matrix 1 如果non-intra-quantized矩阵
可用,则该标记必须被激活。
If load_non_intra_quantizer_matrix 8×64 如果先前的标记被激活,形
Non_intra_quantizer_matrix(64) 成量化矩阵的8×64数据被存
储在这里。
Sequence_extension
字段 #bits 描述
Extension_Start_Code 32 开始,sequence_extension,总为
0x000001B5
Extension_Start_code_Identifier 4 用扩展类型0×1标识
Profile_and_level_indication 8 定义类(profile)和视频流级
progressive_sequence 1 1=帧,0=帧和场
Chrome_format 2 00 保留
01 4:2:0
10 4:2:2
11 4:4:4
Horizontal_size_extension 2 sequence_header扩展
Vertical_size_extension 2 sequence_header扩展
Bit_rate_extension 12 sequence_header扩展
Marker_bit 1 总为1
Vbv_buffer_size_extension 8 sequence_header扩展
Low_delay 1 1=不具有B类型图像,还可能引
起正常播放期间的VBV缓冲器
的利用不足(称为BIG图像)
0=可包含B类型图像;但是不可
具有BIG图像,它不会引起VBV
缓冲器的利用不足。
Frame_rate_extension_n 2
Frame_rate_extension_d 5
Next_start_code()
扩展和用户数据(i)
它是一种用于存储其它结构的容器,并且不具有其自身的数据,基本上它是一系列extension_data(1)和user_data()结构,在一些情况下,结构可以完全为空。
Extension_data(i)
该结构包含简单的结构扩展。所包含的扩展结构类型取决于(i)的值,(i)的值可以是1或2的值。如果它等于“0”,则data_extension跟随sequence_extension并且extension_data(i)可包含以下二者:一个sequence_display_extension或者一个sequence_scalable_extension。
如果i=2,则该结构跟随picture_coding_extension,其可包含quant_matrix_extension()、copyright_extension()、picture_display_extension()、picture_spatial_scalable_extension(),或者一个picture_temporal_scalable_extension。该结构总是以0x000001B5开始。
User_data
user_data结构允许应用程序的特定数据被存储在视频序列(video_sequence)内。MPEG2规范没有定义该函数的格式,也没有定义用户数据的格式。结构以user_data_start_code=0x000001B5开始,并包含任意数量的数据(user_data),其持续到数据流(stream)中的下一个开始码为止。唯一的条件是,不能有多于23个连续的零,因为它会被认为是开始码。
Sequence_display_extension()
该结构提供了不在解码处理中使用的信息,涉及编码内容的对正确显示解码视频有帮助的信息。
Sequence_display_extension()
字段 bits# 描述
Extension_start_code_identifier 4 必须为2,标识开始
Video_format 3 000 组件
001 PAL
010 NTSC
011 SECAM
100 MAC
101 未指定
110 保留,TDVision
111 保留,TDVision
Color_description 1 0=不指定颜色参数。
1=包含下面的3个颜色参数。
Color_rprimaries 8 0 禁用
1 ITU-R-BT.709
推荐
2 未指定的视频
3 保留
4 ITU-R-BT.470-2
系统M
推荐
5 ITU-R-BT.470-2
推荐
系统B,G
6 SMPTE 170M
7 SMPTE 240M
8-255保留
Transfer_characteristics 8 0 禁用
1 ITU-RBT.709
推荐
2 未指定的视频
3 保留
4 ITU-R-BT.470-2
系统M
推荐
5 ITU-R-BT.470-2
系统B,G
推荐
6 SMPTE 170M
7 SMPTE 240M
8 真实转移特性
255 保留
Matrix_coefficients 8 0禁用
1 ITU-RBT8709
推荐
2 未指定的视频
3 保留
4 FCC
5 ITU-R-BT.470-2
系统B,G
推荐
6 SMPTE 170M
7 SMPTE 240M
8-255保留
Display_horizontal_style 14 未在MPEG2中指定
Marker_bit 1 总为1
Display_vertical_size 14 未在MPEG2中指定
Next_start_code
Sequence_scalable_extension
该结构必须存在于每个可扩展的视频流中,其包含基层和一个或多个增强层。存在不同类型的MPEG2可扩展性,主层的可扩展性的一个实例是,它包含视频内容的标准定义,而扩展层具有增加定义的附加的数据。
Sequence_scalable_extension
描述 bits# 描述
Extension_start_code_identifier 4 总为5
Scalable_mode 2 00 分区数据
01 空间可扩展
10 SNR可扩展
11 时间可扩展
Layer_id 4 层数(0)
Lower_layer_prediction_horizontal_size 14
Marker_bit 1
Lower_layer_prediction_vertical_size 14
Horizontal_subsampling_factor_m 5
Horizontal_subsampling_factor_n 5
Vertical_subsampling_factor_m 5
Vertial_subsampling_factor_n 5
Picture_mux_enable 1
Mux_to_progressive_sequence 1
Picture_mux_order 3
Picture_mux_factor 3
Group_of_picture_header()
该结构标记图像组的开始。
Group_of_picture_header()
字段 bits# 描述
Group_start_code 32 0x000001B8
Time_code 25 group_of_picture_header之前第一图
像的时间标签
Dromp_frame_flag-1
Time_code_hours-5
Time_code_minutes-6
Marker_bit-1
Time_code_seconds-6
Time_code_pictures-6
Closed_gop 1 如果1=B图像,不参照先前的图像
Broken_link 1 1=指示不再存在的丢失的I类型帧
0=链接不被断开
Next_start_code()
Picture_header
字段 bits#|描述
Picture_start_code 32 0x00000100
Temporal_reference 10 图像显示顺序
Picture_coding_type 3 0000 禁用
001 内部编码(I)
010 预测编码(P)
011 (B)双向预测编码
100 为MPEG1保留
101 保留
110 保留
111 保留
Vbv_delay 16 视频缓冲器检验机制(临时存储器)
Full_pel_forward_vector 1 在MPEG1中使用
MPEG2=0
Forward-f_code 3 在MPEG1中使用
MPEG2=111
Full_pel_backward_vector 1 在MPEG1中使用
MPEG2=0
Backward_f_code 3 在MPEG1中使用
MPEG2=111
Extra_bit_picture 1 可忽略
Extra_information_picture 8 可忽略
Extra_bit_picture 1 可忽略
Extra_start_code
Picture_coding_extension
字段 Bits# 描述
Extension_start_code 32 总为0x000001B5
Extension 4 总为1000
_start_code_identifier
F_code(0)(0) 4 用于解码运动矢量;当它为I类型
图像时,该数据充满1111。
F_code(0)(1) 4
F_code(1)(0) 4 解码运动矢量(B)信息,当它是(P)
类型图像时,它必须被设置成
1111,因为没有向后运动。
F_code(1)(1) 4 解码运动矢量信息,当它是P类
型图像时,它必须被设置成1111,
因为没有向后运动。
Intra_dc_precision 2 反向量化DC离散余弦变换系数
的精度。
00 8比特精度
01 9比特精度
10 10比特精度
11 11比特精度
Picture_structure 2 指示图像被分成多场还是整帧。
00 保留(TDVision格式的图像)
01 顶场
10 底场
11 逐帧图像
Top_field_first 1 0=先解码底场
1=先解码顶场
Frame_pred_frame_dct 1
Concealment_motion_vectors 1
Q_scale_type 1
Intra_vic_format 1
Alternate_scan 1
Repeat_first_field 1 0=显示逐行帧
1=显示两个相同的逐行帧
Chrome_420_type 1 如果色度格式为4:2:0,则它必须
等于progressive_frame,否则它必
须等于零。
Progressive_frame 1 0=隔行的
1=逐行的
Composite_display_flag 1 警告初始编码的信息
V_axis 1
Field_sequence 3
Sub_carrier 1
Burst_amplitude 7
Sub_carrier_phase 8
Next_start_code()
Picture_temporal_scalable_extension()
在具有时间可扩展性的情况下,存在两个空间分辨率流,底层提供视频帧的较少索引版本,而顶层可以被用于获取相同视频的较多帧版本。低质量、低成本或免费解码器可使用时间可扩展性,而相同付费下每秒可传输更多帧。
Picture_temporal_scalable extension()
字段 bits# 描述
Extension 4 总为1010
_start_code_identifier
Reference_select_code 2 用于指示参考图像将被用于解码
intra_coded图像
对于O类型图像
00 增强最近的图像
01 按显示顺序的较低和最近的
帧层
10 按显示顺序的帧下的一层
11 禁用
对于B类型图像
00 禁用
01 增强模式下的最近解码的图
像
10 增强模式下的最近解码的图
像
11 按显示顺序的底层中的最近
图像
Forward_temporal_reference 10 时间参考
Marker_bit 1
Backward_temporal_reference 10 时间参考
Next_star_code()
Picture_spatial_acalable_extension()
在图像空间可扩展的情况下,增强层包含数据,其允许基层的更好的分辨率,以便于它能够被重建。当增强层作为运动补偿的参考被用作基层的函数时,底层必须被增强和补偿,以便于获得增强层的更大分辨率。
Picture_spatial_scalable_extension()
字段 bits# 描述
Extension_start_code_identifier 4 总是1001
Lower_layer_temporal_reference 10 参考较低层的时间图
像
Marker_bit 1 1
Lower_layer_horizontal_offset 15 水平补偿(补偿)
Marker_bit 1 1
Lower_layer_veretical_offset 15 垂直补偿(补偿)
Spatial_temporal_weightcode_table_index 2 预测细节
Lower_layer_progressive_frame 1 1=逐行的
0=隔行的
Lower_layer_desinterlaced_field_select 1 0=使用顶场
1=使用底场
Next_start_code()
Copyright_extension()
Extension 4 总为010
_start_code_identifier
Copyright_flag 1 如果它等于1则它使用版权
如果它是零(0),不需要附加的版权
信息
Copyright_identifier 8 1=初始
0=复制
Original_or_copy 1
Reserved 7
Marker_bit 1
Copyright_number_1 20 授予的版权号
Marker_bit 1
Copyright_number2 22 授予的版权号
Marker_bit 1
Copyright_number_3 22 授予的版权号
Next_start_code()
Picture_data()
这是简单结构,它本身中不具有字段。
Slice()
包含相同的垂直位置处的一个或多个宏块的信息。
Slice_start_code 32
Slice_vertical_position_extension 3
Priority_breakpoint 7
Quantizer_scale_code 5
Intra_slice_flag 1
Intra_slice 1
Reserved_bits 7
Extra_bit_slice 1
Extra_information_slice 8
Extra_bit_slice 1
Macroblock()
Macroblock_modes()
Motion_vectors()
Motion_vector()
Coded_block_pattern()
Block()
EXTENSION_AND_USER_DATA(2)
该MPEG2可兼容的编码处理当前被用于编码图5的立体照相机(52)拍摄的3D数字图像,随后经过编译器(51)传送,随后可获得在PC(50)和DVD(53)中显示的信号;当解码器(54)中的信号被编码时,其可被发送到解码器(55)中,用于经由电缆(56)、卫星(57)、高清晰电视(59)(HDTV)、或在3DVisor装置(59)等中显示。这样,图像可显示在以下装置上:
DVD(数字多用盘)
DTV(数字电视)
HDTV(高清晰电视)
CABLE(DVB数字视频广播)
SATELLITE(DSS数字卫星系统);并且它是软件和硬件处理的集成。
关于硬件,大多数处理是由被称为DSP(数字信号处理器)的装置执行的。即,一个Motorola模型和一个Texas Instruments(TMS320C62X)模型。
这些DSP通过由所讨论的制造商提供的C和汇编语言的混合语言编程。每一个DSP具有其自己的API,包括位于DSP中被软件调用的函数列表或过程调用。从该参考信息,3D图像被编码,其可与MPEG2格式兼容,并可与它们自身的编码算法兼容。当信息被编码时,DSP负责执行预测、比较、量化和DCT函数应用程序处理,以便形成MPEG2压缩的视频流。
以上示例说明并描述了本发明的具体实施例,对于本领域的技术人员来说显而易见的是,可以进行一些修改或变化,而不会脱离本发明的范围。所有这种修改和变化意在由所附权利要求覆盖,使得所有变化和修改落在本发明的范围内。
Claims (12)
1.立体3D视频图像数字编码方法和系统,其由包括软件算法和相关硬件的改变的MPEG类型编码处理组成,其特征在于,修改所述编码处理中的所述软件,即:
修改视频结构;
修改视频数据流的video_sequence头;
修改比特级识别标记;
修改数据字段;
修改图像字段。
2.如权利要求1所述的立体3D视频图像数字编码方法和系统,其特征进一步在于,所述video_sequence视频数据流由以下结构组成:
sequence_header;sequence_extension;extension_and_user_data(0);group_of_pictures_header;extension_and_user_data(1);picture header(图片头);pictures_coding_extension;extension_and_user_data(2);picture_data;slice(片);macroblock(宏块);motion_vectors;coded_block_pattern;block(块);sequence_end_code,其应用于MPEG1和MPEG2。
3.如权利要求1所述的立体3D视频图像数字编码方法和系统,其特征进一步在于,所述sequence_header结构在以下字段中提供关于所述视频流的较高信息级:aspect_ratio_information字段,其中由0111执行逻辑“与”以获得与2D系统的向后兼容性;和frame_rate_code,其中由0111执行逻辑“与”以获得与2D系统的向后兼容性。
4.如权利要求1所述的立体3D视频图像数字编码方法和系统,其特征进一步在于,所述extension_and_user_data(i)结构为用于存储其它结构的容器并且一些情况下为空结构;i的值可以是0或2,如果它等于0则extension_data跟随sequence_extension,并且extension_data(i)包含sequence_display_extension或sequence_scalable_extension;当i=2时,则跟随的结构是picture_coding_extension,其包含:quant_matrix_extension()、copyright_extension()、picture_spatial_scalable_extension()、或picture_temporal_scalable_extension。
5.如权利要求1所述的立体3D视频图像数字编码方法和系统,其特征进一步在于,sequence_display_extension()结构提供关于有助于正确显示所述视频的编码内容的信息;在video_format字段中,用111来标识。
6.如权利要求1所述的立体3D视频图像数字编码方法和系统,其特征进一步在于,sequence_scalable_extension结构具有增加定义的附加数据,如它包含:基层和增强层,空间可扩展模式01和时间可扩展模式11;layer_id;lower_layer_prediction_vertical_size;marker_bit;lower_layer_prediction_vertical_size;horizontal_subsampling_factor_m;horizontal_subsampling_factor_n;vertical_subsampling_factor_m;vertial_subsampling_factor_n;picture_mux_enable;mux_to_progressive_sequence;picture_mux_order;picture_mux_factor。
7.如权利要求1所述的立体3D视频图像数字编码方法和系统,其特征进一步在于,picture_header结构用以下字段定义:图像编码类型字段(picture_coding_type),010表示预测编码(P),011表示双向预测编码(B);视频临时存储器(视频缓冲器)检验机制。
8.如权利要求1所述的立体3D视频图像数字编码方法和系统,其特征进一步在于,picture_structure字段指示图像被分为场还是为整帧;00保留形式,TDVision格式的图像,01顶场,10底场,11逐帧图像;它还定义了以下字段:composite_display_flag;V_axis;field_sequence;sub_carrier;burst_amplitude;sub_carrier_phase。
9.立体3D视频图像数字编码方法和系统,由包括软件算法和相关硬件中的改变的MPEG类型编码处理组成,其特征在于,修改在所述编码处理中的所述硬件,即:
当电比较左和右通道时,使能两个独立的视频输入通道;处理左和右通道之间的比较差别;使存储器被增为双倍,以提供立体图像的以前的和同时的显示;使能DSP,以比较用于左-右视频信号二者的同时输入缓冲器。
10.如权利要求9所述的立体3D视频图像数字编码方法和系统,其特征进一步在于,所述使能两个独立的视频通道允许对应于TDVision照相机的现有立体左-右信号的两个独立视频信号的同时输入。
11.如权利要求9所述的立体3D视频图像数字编码方法和系统,其特征进一步在于,所述DSP缓冲器的输入存储器被增为双倍。
12.如权利要求9所述的立体3D视频图像数字编码方法和系统,其特征进一步在于,所述硬件修改在于以下步骤:
常规格式(MPEG2)的帧编码,作为单一视频输入通道的函数;
取两个信号;
电比较所述左和右信号;
获取所述右和左信号之间的错误差别;
在临时缓冲器中存储所述差别;
计算关于所述左信号的亮度和色度的错误校正;
应用DCT;
将B类型块中的信息存储在picture_data3D()结构中。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/MX2004/000011 WO2005083636A1 (es) | 2004-02-27 | 2004-02-27 | Método y sistema de codificación digital de imágenes de video 3d estereoscópicas |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201010221966XA Division CN101917616A (zh) | 2004-02-27 | 2004-02-27 | 用于数字编码3d立体视频图像的方法和系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1926576A true CN1926576A (zh) | 2007-03-07 |
Family
ID=34910115
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2004800425881A Pending CN1926576A (zh) | 2004-02-27 | 2004-02-27 | 用于数字编码3d立体视频图像的方法和系统 |
Country Status (7)
Country | Link |
---|---|
US (4) | US20070041442A1 (zh) |
EP (2) | EP1727091A1 (zh) |
JP (1) | JP2007525906A (zh) |
KR (1) | KR101187550B1 (zh) |
CN (1) | CN1926576A (zh) |
CA (1) | CA2557533A1 (zh) |
WO (1) | WO2005083636A1 (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102378030A (zh) * | 2010-08-24 | 2012-03-14 | 索尼公司 | 图像处理装置和图像处理方法 |
CN102415100A (zh) * | 2009-04-27 | 2012-04-11 | Lg电子株式会社 | 广播接收机及其3d视频数据处理方法 |
WO2013007171A1 (en) * | 2011-07-08 | 2013-01-17 | Technicolor (China) Technology Co., Ltd. | System and method for encoding and decoding a bitstream for a 3d model having repetitive structure |
CN108734626A (zh) * | 2017-04-17 | 2018-11-02 | 英特尔公司 | 通过标记对象来编码3d渲染图像 |
CN109600601A (zh) * | 2018-11-23 | 2019-04-09 | 维沃移动通信有限公司 | 一种存储3d图像的方法及终端设备 |
CN110889884A (zh) * | 2018-09-07 | 2020-03-17 | 康耐视公司 | 对物体三维重建初始对应分配有效数据处理的方法和设备 |
CN108734626B (zh) * | 2017-04-17 | 2025-02-18 | 英特尔公司 | 通过标记对象来编码3d渲染图像 |
Families Citing this family (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101177663B1 (ko) | 2004-02-27 | 2012-09-07 | 티디비전 코포레이션 에스.에이. 데 씨.브이. | 입체적 3d-비디오 이미지 디지털 디코딩 시스템 및 방법 |
WO2007047736A2 (en) * | 2005-10-19 | 2007-04-26 | Thomson Licensing | Multi-view video coding using scalable video coding |
EP1999966A2 (en) | 2006-03-29 | 2008-12-10 | Thomson Licensing | Multi-view video coding method and device |
EP2039169A2 (en) * | 2006-07-06 | 2009-03-25 | Thomson Licensing | Method and apparatus for decoupling frame number and/or picture order count (poc) for multi-view video encoding and decoding |
EP2001235B1 (en) * | 2007-06-08 | 2013-05-22 | Samsung Electronics Co., Ltd. | MPEG-4 format extension for recording stereoscopic or synthetic 3D video data with related metadata |
MY162861A (en) | 2007-09-24 | 2017-07-31 | Koninl Philips Electronics Nv | Method and system for encoding a video data signal, encoded video data signal, method and system for decoding a video data signal |
KR101591085B1 (ko) * | 2008-05-19 | 2016-02-02 | 삼성전자주식회사 | 영상 파일 생성 및 재생 장치 및 방법 |
CN106101682B (zh) | 2008-07-24 | 2019-02-22 | 皇家飞利浦电子股份有限公司 | 通用3-d画面格式 |
US8050533B2 (en) * | 2008-09-30 | 2011-11-01 | Panasonic Corporation | Recording medium on which 3D video is recorded, playback apparatus for playing back 3D video, and system LSI |
EP2197217A1 (en) | 2008-12-15 | 2010-06-16 | Koninklijke Philips Electronics N.V. | Image based 3D video format |
EP2425625A2 (en) | 2009-05-01 | 2012-03-07 | Thomson Licensing | Reference picture lists for 3dv |
US8539535B2 (en) * | 2009-11-30 | 2013-09-17 | Time Warner Cable Enterprises Llc | Methods and apparatus for supporting VOD requests in a system with hierarchical content stores |
JP5515729B2 (ja) * | 2009-12-24 | 2014-06-11 | ソニー株式会社 | カメラアダプタ装置及びカメラ制御方法 |
JP5413184B2 (ja) * | 2009-12-24 | 2014-02-12 | ソニー株式会社 | カメラシステム及びカメラ制御方法 |
US8542241B2 (en) * | 2010-04-29 | 2013-09-24 | Acer Incorporated | Stereoscopic content auto-judging mechanism |
TWI419547B (zh) * | 2010-04-30 | 2013-12-11 | Acer Inc | 立體內容自動判別機構 |
US20130162774A1 (en) | 2010-09-14 | 2013-06-27 | Dong Tian | Compression methods and apparatus for occlusion data |
TWI438759B (zh) * | 2010-10-29 | 2014-05-21 | Au Optronics Corp | 立體影像之顯示方法及相關顯示系統 |
CN102196291A (zh) * | 2011-05-20 | 2011-09-21 | 四川长虹电器股份有限公司 | 一种双目立体视频编码方法 |
US9615126B2 (en) * | 2011-06-24 | 2017-04-04 | Google Technology Holdings LLC | Intelligent buffering of media streams delivered over internet |
US10178400B2 (en) * | 2012-11-21 | 2019-01-08 | Dolby International Ab | Signaling scalability information in a parameter set |
PT2923488T (pt) * | 2012-11-21 | 2021-07-09 | Dolby Int Ab | Sinalização de informação de escalabilidade num conjunto de parâmetros |
US10349069B2 (en) * | 2012-12-11 | 2019-07-09 | Sony Interactive Entertainment Inc. | Software hardware hybrid video encoder |
CN111083493B (zh) * | 2014-01-02 | 2023-08-18 | Vid拓展公司 | 视频解码器设备及视频编码器设备 |
US10204274B2 (en) * | 2016-06-29 | 2019-02-12 | Cellular South, Inc. | Video to data |
Family Cites Families (43)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US2279413A (en) * | 1938-02-24 | 1942-04-14 | Read Balfour | Internal combustion engine |
US5821989A (en) * | 1990-06-11 | 1998-10-13 | Vrex, Inc. | Stereoscopic 3-D viewing system and glasses having electrooptical shutters controlled by control signals produced using horizontal pulse detection within the vertical synchronization pulse period of computer generated video signals |
JP2586260B2 (ja) | 1991-10-22 | 1997-02-26 | 三菱電機株式会社 | 適応的ブロッキング画像符号化装置 |
NO175080B (no) | 1992-03-11 | 1994-05-16 | Teledirektoratets Forskningsav | Fremgangsmåte for koding av bildedata |
JP3086396B2 (ja) | 1995-03-10 | 2000-09-11 | シャープ株式会社 | 画像符号化装置及び画像復号装置 |
US5619256A (en) * | 1995-05-26 | 1997-04-08 | Lucent Technologies Inc. | Digital 3D/stereoscopic video compression technique utilizing disparity and motion compensated predictions |
US5612735A (en) * | 1995-05-26 | 1997-03-18 | Luncent Technologies Inc. | Digital 3D/stereoscopic video compression technique utilizing two disparity estimates |
US6023301A (en) | 1995-07-14 | 2000-02-08 | Sharp Kabushiki Kaisha | Video coding device and video decoding device |
US6055012A (en) * | 1995-12-29 | 2000-04-25 | Lucent Technologies Inc. | Digital multi-view video compression with complexity and compatibility constraints |
DE69709189T2 (de) * | 1996-05-28 | 2002-08-22 | Matsushita Electric Industrial Co., Ltd. | Vorrichtung zur Bildvorhersage und -decodierung |
CA2208950A1 (en) * | 1996-07-03 | 1998-01-03 | Xuemin Chen | Rate control for stereoscopic digital video encoding |
US5652616A (en) * | 1996-08-06 | 1997-07-29 | General Instrument Corporation Of Delaware | Optimal disparity estimation for stereoscopic video coding |
JP2001502504A (ja) * | 1996-10-11 | 2001-02-20 | サーノフ コーポレイション | 立体視ビデオを符号化及び複号する装置及び方法 |
US5886736A (en) * | 1996-10-24 | 1999-03-23 | General Instrument Corporation | Synchronization of a stereoscopic video sequence |
CN100393138C (zh) | 1996-11-06 | 2008-06-04 | 松下电器产业株式会社 | 图象解码方法 |
KR100273110B1 (ko) * | 1997-02-26 | 2000-12-01 | 윤종용 | 엠펙 시스템 디코더 및 이 디코더의 데이터 처리 방법 |
SG65064A1 (en) * | 1997-04-09 | 1999-05-25 | Matsushita Electric Ind Co Ltd | Image predictive decoding method image predictive decoding apparatus image predictive coding method image predictive coding apparatus and data storage media |
JP3191922B2 (ja) * | 1997-07-10 | 2001-07-23 | 松下電器産業株式会社 | 画像復号化方法 |
KR20000068660A (ko) | 1997-07-29 | 2000-11-25 | 요트.게.아. 롤페즈 | 3차원 장면 재구성 방법과 재구성 장치 및 디코딩 시스템 |
JPH1169346A (ja) * | 1997-08-18 | 1999-03-09 | Sony Corp | 送信装置、受信装置、伝送装置、並びに送信方法、受信方法、伝送方法 |
US6043838A (en) * | 1997-11-07 | 2000-03-28 | General Instrument Corporation | View offset estimation for stereoscopic video coding |
US6151362A (en) * | 1998-10-30 | 2000-11-21 | Motorola, Inc. | Joint rate control for stereoscopic video coding |
EP1006482A3 (en) | 1998-12-01 | 2005-08-10 | Canon Kabushiki Kaisha | Encoding separately image object and its boundary |
US6658056B1 (en) * | 1999-03-30 | 2003-12-02 | Sony Corporation | Digital video decoding, buffering and frame-rate converting method and apparatus |
EP1101358B1 (en) | 1999-05-27 | 2009-07-01 | IPG Electronics 503 Limited | Encoding a video signal with high resolution encoding for regions of interest |
KR100334722B1 (ko) * | 1999-06-05 | 2002-05-04 | 강호석 | Mpeg 데이터를 이용한 입체영상생성방법 및 그 장치 |
FR2800551B1 (fr) * | 1999-11-03 | 2002-01-04 | St Microelectronics Sa | Decodeur mpeg utilisant une memoire partagee |
US6678424B1 (en) * | 1999-11-11 | 2004-01-13 | Tektronix, Inc. | Real time human vision system behavioral modeling |
US20020009137A1 (en) * | 2000-02-01 | 2002-01-24 | Nelson John E. | Three-dimensional video broadcasting system |
US6833676B2 (en) * | 2000-03-09 | 2004-12-21 | Advanced Lighting Technologies, Inc. | Solid lamp fill material and method of dosing HID lamps |
CN1201598C (zh) * | 2000-03-31 | 2005-05-11 | 皇家菲利浦电子有限公司 | 两种相关数据序列的编码 |
US7277121B2 (en) * | 2001-08-29 | 2007-10-02 | Sanyo Electric Co., Ltd. | Stereoscopic image processing and display system |
KR100397511B1 (ko) * | 2001-11-21 | 2003-09-13 | 한국전자통신연구원 | 양안식/다시점 3차원 동영상 처리 시스템 및 그 방법 |
KR100481732B1 (ko) * | 2002-04-20 | 2005-04-11 | 전자부품연구원 | 다 시점 동영상 부호화 장치 |
EP2262273A3 (en) * | 2002-04-25 | 2013-12-04 | Sharp Kabushiki Kaisha | Image data creation device, image data reproduction device, and image data recording medium |
JP4154569B2 (ja) * | 2002-07-10 | 2008-09-24 | 日本電気株式会社 | 画像圧縮伸長装置 |
KR100475060B1 (ko) * | 2002-08-07 | 2005-03-10 | 한국전자통신연구원 | 다시점 3차원 동영상에 대한 사용자 요구가 반영된 다중화장치 및 방법 |
AU2002952873A0 (en) * | 2002-11-25 | 2002-12-12 | Dynamic Digital Depth Research Pty Ltd | Image encoding system |
KR100751422B1 (ko) * | 2002-12-27 | 2007-08-23 | 한국전자통신연구원 | 스테레오스코픽 비디오 부호화 및 복호화 방법, 부호화 및복호화 장치 |
JP2004287857A (ja) * | 2003-03-20 | 2004-10-14 | Sanyo Electric Co Ltd | プログラム、記録媒体、サーバ装置および画像フィルタ |
US7636088B2 (en) * | 2003-04-17 | 2009-12-22 | Sharp Kabushiki Kaisha | 3-Dimensional image creation device, 3-dimensional image reproduction device, 3-dimensional image processing device, 3-dimensional image processing program, and recording medium containing the program |
KR101177663B1 (ko) * | 2004-02-27 | 2012-09-07 | 티디비전 코포레이션 에스.에이. 데 씨.브이. | 입체적 3d-비디오 이미지 디지털 디코딩 시스템 및 방법 |
US20080017360A1 (en) * | 2006-07-20 | 2008-01-24 | International Business Machines Corporation | Heat exchanger with angled secondary fins extending from primary fins |
-
2004
- 2004-02-27 WO PCT/MX2004/000011 patent/WO2005083636A1/es active Application Filing
- 2004-02-27 JP JP2007500700A patent/JP2007525906A/ja active Pending
- 2004-02-27 EP EP04715595A patent/EP1727091A1/en not_active Withdrawn
- 2004-02-27 KR KR1020117022011A patent/KR101187550B1/ko active IP Right Grant
- 2004-02-27 EP EP12169157.0A patent/EP2538676A3/en not_active Withdrawn
- 2004-02-27 CA CA002557533A patent/CA2557533A1/en not_active Abandoned
- 2004-02-27 CN CNA2004800425881A patent/CN1926576A/zh active Pending
-
2006
- 2006-08-25 US US11/510,273 patent/US20070041442A1/en not_active Abandoned
-
2010
- 2010-07-15 US US12/837,435 patent/US20100271463A1/en not_active Abandoned
-
2016
- 2016-04-08 US US15/094,766 patent/US20170070723A1/en not_active Abandoned
-
2017
- 2017-06-30 US US15/639,797 patent/US20190058865A1/en not_active Abandoned
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102415100A (zh) * | 2009-04-27 | 2012-04-11 | Lg电子株式会社 | 广播接收机及其3d视频数据处理方法 |
US8773505B2 (en) | 2009-04-27 | 2014-07-08 | Lg Electronics Inc. | Broadcast receiver and 3D video data processing method thereof |
CN102415100B (zh) * | 2009-04-27 | 2015-02-04 | Lg电子株式会社 | 广播接收机及其3d视频数据处理方法 |
CN104486612A (zh) * | 2009-04-27 | 2015-04-01 | Lg电子株式会社 | 用于广播发射机的3d视频数据处理方法及广播接收机 |
CN102378030A (zh) * | 2010-08-24 | 2012-03-14 | 索尼公司 | 图像处理装置和图像处理方法 |
WO2013007171A1 (en) * | 2011-07-08 | 2013-01-17 | Technicolor (China) Technology Co., Ltd. | System and method for encoding and decoding a bitstream for a 3d model having repetitive structure |
AU2012283580B2 (en) * | 2011-07-08 | 2017-05-04 | Interdigital Vc Holdings, Inc. | System and method for encoding and decoding a bitstream for a 3D model having repetitive structure |
CN108734626A (zh) * | 2017-04-17 | 2018-11-02 | 英特尔公司 | 通过标记对象来编码3d渲染图像 |
CN108734626B (zh) * | 2017-04-17 | 2025-02-18 | 英特尔公司 | 通过标记对象来编码3d渲染图像 |
CN110889884A (zh) * | 2018-09-07 | 2020-03-17 | 康耐视公司 | 对物体三维重建初始对应分配有效数据处理的方法和设备 |
CN110889884B (zh) * | 2018-09-07 | 2023-11-28 | 康耐视公司 | 对物体三维重建初始对应分配有效数据处理的方法和设备 |
CN109600601A (zh) * | 2018-11-23 | 2019-04-09 | 维沃移动通信有限公司 | 一种存储3d图像的方法及终端设备 |
Also Published As
Publication number | Publication date |
---|---|
US20170070723A1 (en) | 2017-03-09 |
EP2538676A2 (en) | 2012-12-26 |
US20190058865A1 (en) | 2019-02-21 |
WO2005083636A1 (es) | 2005-09-09 |
US20070041442A1 (en) | 2007-02-22 |
EP1727091A1 (en) | 2006-11-29 |
JP2007525906A (ja) | 2007-09-06 |
KR20110111544A (ko) | 2011-10-11 |
EP2538676A3 (en) | 2014-01-08 |
CA2557533A1 (en) | 2005-09-09 |
US20100271463A1 (en) | 2010-10-28 |
KR101187550B1 (ko) | 2012-10-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1926576A (zh) | 用于数字编码3d立体视频图像的方法和系统 | |
CN1175670C (zh) | 图像信号转换方法和设备以及图像提供系统 | |
CN1143551C (zh) | 图像预测解码装置 | |
CN1272967C (zh) | 视频编码方法和装置 | |
CN1251518C (zh) | 数字信号转换方法和数字信号转换装置 | |
CN1270536C (zh) | 修改比特流 | |
CN1339922A (zh) | 编码信号的分离和合并装置、方法及计算机程序产品 | |
CN1207229A (zh) | 图像编码装置及图像解码装置 | |
CN1090455A (zh) | 动态图象的编码/解码方法、装置及其存储介质 | |
CN1778110A (zh) | 图像解码设备和图像解码方法 | |
CN1213935A (zh) | 分层图像编码解码、数字广播信号记录及图像音频的解码 | |
CN1549603A (zh) | 利用编码历史信息的编码转换系统 | |
CN1725844A (zh) | 数字媒体流的反向表示 | |
CN1545813A (zh) | 图象编码装置、图象译码装置、图象编码方法、图象译码方法、图象编码程序和图象译码程序 | |
CN1110963C (zh) | 图象解码装置 | |
CN1674675A (zh) | 视频编码方法 | |
CN1182518A (zh) | 编码装置、译码装置和编码、译码方法以及图象处理装置 | |
CN1620147A (zh) | 编码信号分离装置、合成装置、分离合成系统及其方法 | |
CN1170437C (zh) | 图像信号混洗装置和方法 | |
CN1882093A (zh) | 利用编码历史信息的编码转换系统 | |
CN1265647C (zh) | 块组编码结构及基于块组结构的自适应分阶段预测编码方法 | |
CN1722846A (zh) | 数字信号转换方法和数字信号转换装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1100715 Country of ref document: HK |
|
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Open date: 20070307 |
|
REG | Reference to a national code |
Ref country code: HK Ref legal event code: WD Ref document number: 1100715 Country of ref document: HK |