[go: up one dir, main page]

CN102055982B - 三维视频编解码方法及装置 - Google Patents

三维视频编解码方法及装置 Download PDF

Info

Publication number
CN102055982B
CN102055982B CN 201110006090 CN201110006090A CN102055982B CN 102055982 B CN102055982 B CN 102055982B CN 201110006090 CN201110006090 CN 201110006090 CN 201110006090 A CN201110006090 A CN 201110006090A CN 102055982 B CN102055982 B CN 102055982B
Authority
CN
China
Prior art keywords
image
pixel
layer
depth
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN 201110006090
Other languages
English (en)
Other versions
CN102055982A (zh
Inventor
唐慧明
林圣辉
虞露
陈珊莎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Hua Yanyun State Information Technology Co Ltd
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN 201110006090 priority Critical patent/CN102055982B/zh
Publication of CN102055982A publication Critical patent/CN102055982A/zh
Application granted granted Critical
Publication of CN102055982B publication Critical patent/CN102055982B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

一种三维视频的编码方法,包括:输入一帧图像,该一帧图像包括同一时刻多个不同视点的图像纹理信息和深度信息,构成多个视点的深度像素图;选择最靠近中心的视点为主视点,将各个视点的深度像素图映射到主视点上;通过运动目标检测方法从所述纹理信息中得到运动信息,利用深度信息和/或运动信息将映射后的深度像素图中所有深度像素点重建为一个背景图层图像及一个或一个以上前景图层图像;将所述背景图层图像及前景图层图像分别进行编码,其中深度信息和纹理信息分别编码。本发明还公开了一种三维视频的解码方法,以及编码器和解码器。本发明尤其适用于背景静止的多视点视频序列的编码,可提高预测补偿精度,并在保证主观质量的前提下降低码率。

Description

三维视频编解码方法及装置
技术领域
本发明属于数字视频压缩编码技术领域,特别涉及一种针对有静态背景场景的三维视频的高效的编解码方法及装置。
背景技术
近年来,随着各种多媒体服务的出现,对虚拟现实体验的需求正不断增长,各种三维视频技术也在不断地开发和推广应用之中。三维视频的核心在于能依据不同视点位置提供不同的图像信息,从而实现身临其境的体验。因此,多视点视频的编码成为了三维视频服务的一个关键技术。
最早的多视点视频编码采用的是两路或多路视频预测编码的形式,通过视间参考和帧间参考实现码流的压缩。这种形式的两路图像分别提供给用户的左右两眼,只能提供一个固定视角的三维视觉体验。要想用同样方式实现自由视角体验,就需要对来自各个视点的大量视频序列分别编码,这将产生非常大的视频数据,无论对存贮还是对传输,都有非常高的要求,很难走向实用。
为解决自由视角问题,随后出现了编码一路视频加一路深度的形式,利用深度信息将主视点图像映射到其它视点(旁视)上,实现各个视角视频内容的动态生成。但是,对于实际视频,不可避免地存在主视图像上被遮挡,而在旁视中因视角不同而显露出来的区域,即视频内容遮挡问题,生成的旁视图像将出现严重的空洞,即无内容区域,无法真正满足自由视角的需求。
现阶段国际上主要采用多路视频加多路深度(MVD),特别是两路视频加两路深度的形式,进行多视点视频编码。由于在一路视频中被遮挡的部分,一般在另一路中能够显露出来,这种形式在一定程度上解决了遮挡问题。多路视频压缩的一个很重要的工具就是视间参考,通过视间的预测补偿去除冗余,实现数据压缩。但由于视间的参考矢量与帧间运动矢量不能相互预测,且视差矢量往往较大,影响了编码效率;同时,由于实际场景的光线问题,不同视的成像差异,以及非整宏块的物体偏移,视间预测的效率并不会很高。
在MVD的基础上,飞利浦公司又提出了分层深度视频的表达方式,将多路视频均映射到一个视点上,生成一个完整的前景图层和一个含有补充信息的背景图层,再进行编码。与MVD相比,这种方法放弃了主视外其它视的客观质量,在保证不错的主观质量的同时,大幅减少了码率,并在虚拟生成视上有不输于MVD的质量。但是,受视角范围限制,生成的视图边沿处一般有成片的空洞需要填充;同时,即使场景的背景并没有变化,由于前景运动造成深度图变化,会使得作为补充的背景图层在范围和内容上均有不小的帧间变化,这就影响了背景图层的预测编码,降低了压缩效率。
本申请人在中国专利申请201010039620.8中公开了一种基于图层分解的视频编码、解码方法及装置,有效地提高了普通视频信号的编码效率。但该专利没有考虑三维视频的编码特点,不能很好地适用于三维视频编码。
目前,多视点视频编码技术还在不断地研究和应用之中,并且,多视点视频编码还进入了监控领域。针对监控视频的特殊性,如背景一般为长期静止的场景等等,多视点视频编码的压缩效率还能有较大的提升空间。
发明内容
有鉴于此,本发明的目的在于提供一种三维视频编解码方法及装置,用于提高三维视频的编码和压缩效率,特别是用于提升三维监控视频的编码压缩效率。
本发明的实施例提供了一种三维视频的编码方法,包括:
输入一帧图像,所述一帧图像包括同一时刻多个不同视点的图像纹理信息和深度信息,构成多个视点的深度像素图;
将各个视点的深度像素图映射到主视点上,并对主视点视图的图像大小进行扩展,所述主视点的选择按照预先约定;
通过运动目标检测方法从所述纹理信息中得到运动信息,利用深度信息和/或运动信息将映射后的深度像素图中所有深度像素点重建为一个背景图层图像及一个或一个以上前景图层图像,并对背景图层图像进行时域累积操作;
将所述背景图层图像及前景图层图像分别进行编码,其中深度信息和纹理信息分别编码,并在编码中实现图层间的相互参考。
本发明的实施例还提供了一种三维视频解码方法,包括:
获取待解码的输入码流;
对所述输入码流解析并熵解码,获取编码信息;
依次对背景图层图像及前景图层图像进行解码,得到各图层的重建图像,并生成各图层的参考图像;
根据所述各图层的重建图像和摄像机参数,生成指定视点的输出图像。
本发明的实施例还提供了一种三维视频的编码装置,包括:
视频输入单元,用于实现视频信号的采集或读入;
图层分解单元,用于将输入视频中的图像分解成前景图层图像和背景图层图像;
图层编码单元,用于基于各图层的重建图像对所述前景图层图像和背景图层图像进行编码;
图层重建图像生成单元,用于生成对应图层的一整幅的重建图像;
码流形成单元,用于将图层编码单元生成的数据组合成一个符合语法规则的码流;
码流输出单元,用于实现对所述码流的输出。
本发明的实施例还提供了一种三维视频解码装置,包括:
码流输入单元,用于从硬盘读入视频流;
码流解析单元,用于对输入的视频码流进行解析,分离出背景图层码流和前景图层码流;
图层解码单元,用于基于各图层的重建图像对背景图层图像和前景图层图像进行解码;
图层重建图像生成单元,用于生成对应图层的重建图像;
视点图像生成单元,用于根据各图层的重建图像和摄像机参数,生成指定视点的输出图像;
图像输出单元,用于将重建图像传送至输出接口输出。
由于实际场景中的某个点可能被多个视角观测到,因此不同视点序列间存在大量重复信息。将多视点的图像映射到同一个主视点上,可以找出这些重复信息,并能够在图层重建操作中通过像素合并操作除去这种视间冗余,提高三维视频编码和压缩的效率。同时,对主视点图像范围的扩展,能够解决传统图层编码中生成视图边沿处的成片空洞问题,提高了解码输出图像的质量。
其次,适当的图层分割,特别是利用了运动信息的图层分割,能够保证同一深度层次及同一对象上的像素点在同一个图像组中被编码,从而提高预测效率,有利于压缩编码。
进一步地,本发明还对背景图层进行了时域累积操作。通过时域累积操作合成得到的背景图像,将随着输入图像而不断更新,既利用了时域上的信息累积,又利用了多视点的视角信息,从而将背景模型建立得较为准确。使用这样一种合成背景做为参考图像,在使用较少参考缓存的情况下,能更好地减少时域上的信息冗余,特别是在前景运动目标往复运动时,能达到相当大的编码增益。对三维监控视频,其场景一般长期静止,这种背景图层的时域累积方法将尤为有效。
在理想的图层分解状况下,不同图层的信息是完全独立的。但是,在具体实现中,很难做到精确的图层分割,特别是在目标边沿部分,可能会有本应该属于其它图层的像素。深度图边沿的不准确就会导致这种问题,这种情况十分常见。为解决这一问题,本发明使用了图层间的相互参考。层间参考包括层间帧内预测参考和层间帧间预测参考,能够降低对图层分割精度的要求,减小压缩性能对图层分割精度的依赖性,从而提高预测精度和压缩效率,并有助于提升重建图像的质量。
附图说明
图1为本发明实施例提供的一种三维视频编码方法的流程图;
图2为本发明实施例中重建背景图层图像及前景图层图像的方法流程图;
图3为本发明实施例提供的一种三维视频解码方法的流程图;
图4为本发明实施例提供的一种编码器的实现原理图;
图5为本发明实施例提供的一种三维视频编码装置的结构图;
图6为本发明实施例提供的一种解码器的实现原理图;
图7为本发明实施例提供的一种三维视频解码装置的结构图。
具体实施方式
本发明实施例利用图像映射和图层综合,在不影响图像主观质量的前提下,实现图像数据量的大幅度减少。同时,利用图层间的参考和背景图层的时域合成实现码流的进一步压缩,特别适合于摄像机固定的视频片断、视频会议、三维监控这种存在背景静止的应用场景。
为使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明作进一步的详细描述。
图1所示为本发明实施例提供的一种三维视频编码方法的流程图,该方法包括:
步骤101、通过视频采集、通信或读磁盘(或其它存贮介质)的方式输入一帧图像。这里所述的一帧图像包括同一时刻多个不同视点的图像纹理信息和深度信息,表现为多个视点的深度像素图,后文所述像素点均为深度像素点,每个深度像素点包括其深度信息和纹理信息。若输入多视点视频不含深度信息,则采用深度提取算法计算深度信息,构造出深度像素图。
步骤102、选择最靠近中心的视点为主视点,利用摄像机参数视间映射算法将各个视点的深度像素图映射到主视点上。主视点的大小扩大为能包含所有像素。所述的视间映射算法可以使用立体空间映射矩阵的方法。约定最靠近中心的视点为主视点,有益于映射操作。
步骤103、利用深度信息和/或运动信息将映射后的所有深度像素重建为一个背景图层深度像素图像(简称为背景图层图像)及一个或多个前景图层深度像素图像(简称为前景图层图像)。深度信息由深度像素携带。运动信息由运动目标检测方法从纹理信息中得到。重建的方法为:将映射到主视点的所有深度像素作为一个待分配像素集,然后按如图3所示操作将像素分配到各图层:
步骤1031、合并像素点。针对每个像素位置,将深度值差异在设定阈值TH1内且纹理值差异在设定阈值TH2内的像素点合并为一个像素点,新的像素点的像素值为原像素值的平均,或者取中值。两种阈值可以设为相应最大值的1%~5%。由于实际应用场景中的某个点可能被多个视角观测到,因此不同视点序列间存在大量重复信息。这种像素合并操作可以除去这种视间冗余。
步骤1032、背景图层图像建立。针对每个像素位置,取出待分配像素集中深度最深的像素点P,若有多个,则取他们的平均像素值构成像素点P,与原背景图层图像的像素进行比较:若像素点P的深度更深(大),则以像素点P的像素值替换该背景图层图像像素值;若深度相同,则将像素点P的像素值与原背景图层图像像素值加权平均后替换背景图层图像像素值;若深度更浅(小),则将像素点P放回待分配像素集。这个操作实际上就是背景图层的生成、更新操作,通过深度信息更新背景图层,在图层图像生成上实现了时域累积操作。这里深度相同是指深度值或其等效的视差值的差小于一指定的阈值,这里取TH1。
步骤1033、前景图层图像建立。针对每个像素位置,取出待分配像素集中深度最小的像素的像素值,若该像素位置已无像素值,则置空或置为该位置背景图层像素值,构成第一前景图层图像。
步骤1034、若待分配像素集中还有像素点,则重复执行步骤1033,生成第二、第三等前景图层图像,直至分配完所有像素。将剩余像素点作为一个待分配像素点集合,图层重组操作实际上就是一个像素分配或像素映射的过程。
在步骤1033和1034中,可以利用运动信息对像素进行对象分割,再以对象为单位从待分配像素集中取出像素值,以保证同一对象的像素在同一图层中,提高预测补偿精度。所述对象的分割,可以使用各种传统的图像检测算法检测运动目标,如混合高斯模型法、帧差法、光流法等,再通过深度信息进行目标范围修正。考虑到同一目标的深度往往具有连续性,这种修正操作是指,对目标边沿附近的像素点,除去与相邻像点深度差异超过阈值TH1的点,添加与相邻像点深度差异小于阈值TH1的点,使利用各图层像素值及其深度值重建各视点图像时不出现空洞。同时,深度连续但是不运动的成片区域也作为前景目标。
步骤104、将各图层图像分别送入相应的图层图像组进行编码,其中深度信息和纹理信息分别编码。背景图层作为时域累积图层,前景图层作为非时域累积图层。各图层图像按与解码器约定的编码顺序进行编码,这种顺序将影响帧内层间参考,即先编码的图层无法参考后编码的图层。本实施例先编码时域累积图层,再编码非时域累积图层,对同一性质的图层,按由深到浅(深度由大到小)的顺序进行编码。编码器采用传统的基于块的预测编码器,本实施例采用AVS,并根据本发明的需要添加部分语法元素,对编码流程略作改动,实现多视点视频序列的编码。
语法元素的添加包括:
1、在原序列参数集中,添加摄像机参数;
2、在原图像参数集中,添加图层数量、背景图像宽高等元素;
3、在原宏块数据中,添加参考图层编号。
编码流程的修改包括:
1、对每一帧图像,从背景图层图像开始,对每个图层图像都做相当于原编码器的编码操作,生成片级和宏块级的码流,并对每个图层的重建图像(参考帧)做去块滤波和层间滤波操作。
2、由于背景图层图像帧间的相关性较强,选择一个较长的图像组(包含较多帧),从而降低码率。一般地,背景图层图像组预先设定图像组结构和长度,但在摄像机切换等背景图层内容改变时,可以立即形成新的图像组。针对背景长期静止的三维监控应用场景,背景图层可以只在立即刷新图像帧处编码传输,这样能在保证主观质量的前提下,大幅降低码率。
3、编码宏块时,参考帧除了从本图层参考队列中选择(实现层内帧内预测和层内帧间预测),还可以从其它图层的参考队列中选择,以实现层间参考(包括层间帧内预测和层间帧间预测)。当背景图层图像只在立即刷新图像帧处编码时,背景图层生成的参考图像只用于前景图层的层间参考。此时,背景图层参考图像是一个时域累积参考图像,它由立即刷新图像帧背景图像的重建图像初始化,并被前景图层图像不断更新。这里的更新是指,在一像素位置上,若前景图层图像的深度与背景图层图像的差在一定阈值范围内,则用前景像素值对背景像素值进行加权平均更新。这里阈值采用TH1。
4、在对各图层进行编码时,对不属于该图层的区域不做编码或采用跳过模式编码。例如,以起始位置、长和宽定义的图层矩形区域,以像素或宏块为单位,在对图层编码时,对不属于本图层的图像块可不做编码,重建像素值从其它图层得到,或直接采用跳过模式编码,重建像素值可选择从其它图层得到或通过跳过模式解码得到。
5、在生成背景图层的参考帧时,对每个像素位置,若在本图层重建图像对应位置存在重建像素时,取值为该重建像素值与前一参考帧对应位置像素值的加权平均值;否则取值为前一参考帧对应位置的像素值。加权平均操作实现了参考帧的递归滤波,权重参数由预先设定,在参考帧的生成上实现了时域累积操作。
6、生成各个前景图层的参考帧时,对每个像素位置,若在本图层重建图像对应位置存在重建像素时,取值为该重建像素值;否则取值为背景图层对应位置的像素值。
7、图层深度信息模型化编码。同一物体的表面深度一般具有规律性,可以进行深度建模,很多情况下可以使用平面模型近似,从而实现更有效率的深度编码。使用这种模式时,码流元素里需添加模型化参数。
编码完成后,输出所形成的码流。如:存贮到磁盘、通过网络发送等,或用于与音频等码流复接,形成系统流。
以上编码方法通过立体空间映射的方法,利用深度信息将三维视频的多个序列映射到一个视点上,在深度比较和图像检测之后将所有数据重组为几个图层,最后,对各个图层序列分别进行编码。
这种编码方法与背景技术中其它编码方法的区别,也是其压缩效率的关键在于:将多视点视频序列重组为一个视点上的多个图层,减少数据量;各图层间可相互参考;图层在时域上可以累积信息;同时,各图层可动态扩大视角范围,以提高虚视生成质量。
使用时域累积操作的图层,称之为时域累积图层;不使用时域累积操作的图层,称之为非时域累积图层。对于参考帧的生成,时域累积操作是指该编码图层有一个时域累积参考帧,这个参考帧长期存在于参考队列中,并由解码得到的重建图像进行更新。图层信息在时域上的累积,主要用于背景图像构成的背景图层。对背景图层来说,时域累积操作,具体是指编解码器保存一幅背景图像,这个图像随着输入图像不断更新,实现时域累积。使用这样一种合成背景做为参考图像,在使用较少参考缓存的情况下,能更好地减少时域上的信息冗余。特别是在前景运动目标往复运动时,能达到相当大的编码增益。另外,合成背景既利用了时域上的信息累积,又利用了多视点的视角信息,能够将背景模型建立得较为准确,从而能够更好地生成其它视点的图像,甚至有可能生成源视点范围之外的视点图像。
基于本发明实施例提供的三维视频编码方法,其相应的解码方法如图3所示,包括以下步骤:
步骤301、通过读取磁盘或通信接收获取输入码流。
步骤302、对输入码流解析并熵解码,获取必要的编码信息,如图层数量、背景图像宽高、当前待解码图像块采用了哪种预测方式等。
步骤303、依次对所有图层进行解码,得到各图层的重建图像,并生成各图层的参考图像。各图层的解码方法类同于传统的基于块的预测解码器,如H.264、AVS。本实施例使用AVS进行解码,并根据本发明的需要对解码流程略作改动,实现多视点视频序列的解码。
除了能够解析对应编码流程中添加的语法元素,解码流程的修改还包括:
1、解码宏块时,参考帧除了从本图层参考队列中选择,还可以从其它图层的参考队列中选择,由语法元素中的参考图层决定。与编码器对应,预测模式包括层内帧内预测、层内帧间预测、层间帧内预测和层间帧间预测。
2、背景图层作为时域累积图层,其参考图像生成规则为:对每一个像素位置,在本图层重建图像对应位置存在重建像素时,取值为该重建像素值与前一参考帧对应位置像素值的加权平均,否则取值为前一参考帧对应位置的像素值。
3、前景图层作为非时域累积图层,其参考图像生成规则为:对每个像素位置,若在本图层重建图像对应位置存在重建像素时,取值为该重建像素值;否则取值为背景图层对应位置的像素值。
步骤304、根据各图层的重建图像和摄像机参数,生成指定视点的输出图像。所述生成指定视点输出图像的方法为:利用摄像机参数,采用视间映射算法,将各图层图像映射到指定视点,然后在各像素位置上选择深度最小的像素值。
图4是本发明实施例提供的一种编码器的实现原理图。整个编码器结构的实现和传统编码器相比,主要的不同在于增加了图像映射与图层分解,其中,图层分解是利用深度信息和背景参考帧,将待编码图像分解成前景图层和背景图层,合理分解图层能提高编码效率,在本实施例中采用如前所述的图层分解算法;此外,还将单序列的编码单元扩展为了多图层编码单元(如图中的前景图层编码单元和背景图层编码单元),并在前景图层编码中采用了层间参考模式,在背景图层参考帧生成时采用了时域累积操作。
背景图层编码采用的方法和传统编码器基本一致,包括帧内预测、帧间预测、残差计算、变换量化、反量化反变换、去块滤波等,只是另外增加了一个时域累积操作,利用背景图层重建图像和原背景图层参考图像,生成新的背景图层参考图像。更新原则为,若深度不同,则取深度值大的像素值;若深度相同,则取加权平均值。
前景图层编码相比传统编码器,增加了层间帧内预测和层间帧间预测,即可以采用背景图层重建图像作参考图像。同时,由于前景图层图像不一定在所有像素位置都有信息(即有可能有空洞),在无重建像素值的像素位置,由背景图层图像对应像素位置的像素值填充。
图4中所示的参考图像,下标n表示当前新生成的参考图像,下标n-1表示前一个参考图像。
背景图层编码变换量化后的数据与前景图层编码变换量化后的数据将分别被熵编码,并按语法规则形成输出码流,用于传输或存贮。
基于上述实现原理,图5为本发明实施例提供的三维视频编码装置的结构图,具有视频输入单元、图层分解单元、图层编码单元、图层重建图像生成单元、码流形成单元和码流输出单元。
视频输入单元实现视频信号的采集或读入,如模拟视频信号的采集、CCD或CMOS传感器输出信号的采集、从存贮设备中读取图像、将已压缩的码流进行解码而获得数字视频信号、从网络或其它接口获得数字视频信号等。多视点视频输入单元包含至少两个视点的纹理信号采集设备,以及相应的深度计算单元或深度信息采集硬件设备。深度计算单元采用三维匹配的方法计算各像素点的深度,既可用硬件实现,也可用软件实现。深度信息采集硬件设备可以采用TOF(飞行时间)方法,可以获得比计算出的深度更准确的深度结果。
图层分解单元将输入视频中的图像分解成前景图层图像和背景图层图像,背景图层图像为时域累积图层,前景图层图像为非时域累积图层,分解方法如前所述。
图层编码单元用于对前景图层图像和背景图层图像进行编码,包括前景图层编码单元和背景图层编码单元,二者均包括帧内预测、帧间预测、模式选择、用于预测残差计算的减法器、变换量化、熵编码、反变换反量化、用于重建图像的加法器、参考图像合成与去块滤波、参考帧存等基本单元。其中背景图层编码单元中的参考帧存用于存放背景图层重建图像,包括时域累积参考图像,前景图层编码单元中的参考帧存用于存放前景图层重建图像。背景图层编码单元在做帧间预测时只使用背景图层参考帧存中的图像,而前景图层编码单元可以使用背景图层参考帧存和前景图层参考帧存中的图像,实现了层间参考预测。各图层编码单元的视频编码与一般视频编码器,如H.264、AVS等一致。
图层重建图像生成单元,用于生成对应图层的一整幅的重建图像,经过去块滤波后存入各自帧存,用于以后编码帧的帧间预测参考,生成方法在前面已有介绍,这里不再赘述。
码流形成单元用于将来自背景图层编码单元和前景图层编码单元的数据组合成一个符合语法规则的码流。
码流输出单元实现对码流的输出,可以通过通信接口进行输出。
图6是本发明实施例提供的一种解码器的实现原理图。与传统解码器相比,主要的不同在于增加了图层码流分解,并将单序列解码扩展为了多图层解码(如图中的前景图层解码与背景图层解码),并在前景图层解码中添加了层间预测模式,在背景图层参考帧生成时采用了时域累积。
背景图层解码和传统解码器一致,将熵解码后的残差数据通过反变换反量化恢复出来,并根据预测模式选择和运动矢量信息,选择与编码时相同的预测方式得到其运动补偿预测值,将预测值与残差相加便得到背景图层的重建图像。另外增加了时域累积操作,利用背景图层重建图像和原背景图层参考图像,生成新的背景图层参考图像。更新原则为,若深度不同,则取深度值大的像素值;若深度相同,则取加权平均值。
前景图层解码增加了多种预测,是和编码器相对应的。具体每个单元的预测细节与编码器部分是一致的,数据解码流程与传统解码器也是一致的。
视点图像生成是根据各图层的重建图像和摄像机参数,生成指定视点的输出图像。生成指定视点输出图像的方法如前文所述。
基于上述实现原理,图7为本发明实施例提供的三维视频解码装置的结构图,具有码流输入单元、码流解析单元、图层解码单元、图层重建图像生成单元、视点图像生成单元和解码图像输出单元。
码流输入单元是从硬盘读入视频流的输入接口,或接收视频流的以太网接口,或其它视频输入通信接口。如果输入为包括音频、系统的多媒体数据流,则码流输入单元通过解复接分离出其中的视频流。
码流解析单元用于根据语法规则对输入的视频码流进行解析,包括熵解码和去复接等,分离出背景图层码流和前景图层码流,分别输入背景图层解码单元和前景图层解码单元。
图层解码单元用于对背景图层图像和前景图层图像进行解码,包括背景图层解码单元和前景图层解码单元,二者均包括帧内预测、帧间预测、反变换反量化、参考图像合成与去块滤波、参考帧存、模式选择等基本单元,这与常规的视频解码器是一致的。其中背景图层解码单元的参考帧在背景图层的参考帧存中选取,前景图层解码单元的参考帧在前景图层的参考帧存和背景图层的参考帧存中选取,由语法元素中的参考图层决定。这些帧存分别存放对应图层经去块滤波后的前一帧或几帧解码重建图像,用于帧间预测解码。
图层重建图像生成单元,用于生成对应图层的重建图像,经过去块滤波后存入各自帧存,用于以后编码帧的帧间预测参考,生成方法在前面已有介绍,这里不再赘述。
视点图像生成单元用于根据各图层的重建图像和摄像机参数,生成指定视点的输出图像。生成指定视点输出图像的方法如前文所述。
图像输出单元通过将重建图像传送至输出接口实现,如写入文件、发送到各种通信网络或通过各种显示输出接口输出。
在AVS编解码器rm09.02版本上实现上述实施例,采用测试序列BookArrival_man,主视点选择位置10,编码配置如下:编码结构为IPPP…,I帧间隔为20帧,测试序列长度为100帧,开启RDO,固定QP。另外,用AVS编解码器rm09.02版本上实现分层深度视频编码,编码配置不变,将编码结果与本发明比较。
得到的测试结果表明,相比使用分层深度视频编码实现多视点编码,本发明的编码输出码率降低了35%以上,同时在视点10上的重建图像的客观质量(PSNR)及主观质量与分层深度视频编码基本相同,在视点8上的生成图像的客观质量(PSNR)及主观质量略好于分层深度视频编码。
总之,以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。

Claims (7)

1.一种三维视频的编码方法,其特征在于,包括:
输入一帧图像,所述一帧图像包括同一时刻多个不同视点的图像纹理信息和深度信息,构成多个视点的深度像素图;
将各个视点的深度像素图映射到主视点上,并对主视点视图的图像大小进行扩展,所述主视点的选择按照预先约定;
通过运动目标检测方法从所述纹理信息中得到运动信息,利用深度信息和/或运动信息将映射后的深度像素图中所有深度像素点重建为一个背景图层图像及一个或一个以上前景图层图像,并对背景图层图像进行时域累积操作;
将所述背景图层图像及前景图层图像分别进行编码,其中深度信息和纹理信息分别编码,并在编码中实现图层间的相互参考;
其中,
所述时域累积操作为:在图层图像生成及参考图像生成时,利用到以前帧的信息;
所述重建背景图层图像及前景图层图像的方法包括:将映射到主视点的所有深度像素点作为一个待分配像素集,并
合并像素点,将深度值差异和纹理值差异在预设阈值内的像素点合并为一个像素点,新的像素点的像素值为原像素值的平均;
建立背景图层图像;
建立前景图层图像;
若所述待分配像素集中还有像素点,则重复执行前一步骤,直至分配完所有像素;
所述建立背景图层图像的方法包括:
针对每个像素点,取出所述待分配像素集中深度最深的像素点,与原背景图层图像的像素进行比较;
若所述深度最深像素点的深度更深,则以该像素点的像素值替换该背景图层图像像素值;若深度相同,则将所述深度最深像素点的像素值与原背景图层图像像素值加权平均后替换背景图层图像像素值;若所述深度最深像素点的深度更浅,则将所述深度最深像素点放回待分配像素集;
所述建立前景图层图像的方法包括:
针对每个像素点,取出所述待分配像素集中深度最小的像素点的像素值,若该像素点已无像素值,则置空或置为该位置背景图层像素值,构成前景图层图像。
2.根据权利要求1所述的编码方法,其特征在于,所述建立前景图层图像的方法进一步包括:
利用所述运动信息对待分配像素集中的所有像素点进行对象分割,并利用深度信息进行对象范围修正,再以对象为单位从待分配像素集中取出像素值。
3.根据权利要求1所述的编码方法,其特征在于,所述编码方法在对各图层进行编码时,对不属于该图层的区域不做编码或采用跳过模式编码;且
在生成背景图层的参考帧时,对每个像素位置,若在本图层重建图像对应位置存在重建像素时,取值为该重建像素值与前一参考帧对应位置像素值的加权平均值;否则取值为前一参考帧对应位置的像素值;
在生成各个前景图层的参考帧时,对每个像素位置,若在本图层重建图像对应位置存在重建像素时,取值为该重建像素值;否则取值为背景图层参考帧对应位置的像素值。
4.一种基于权利要求1所述编码方法的三维视频解码方法,其特征在于,包括:
获取待解码的输入码流;
对所述输入码流解析并熵解码,获取编码信息;
依次对背景图层图像及前景图层图像进行解码,得到各图层的重建图像,并生成各图层的参考图像;
根据所述各图层的重建图像和摄像机参数,生成指定视点的输出图像。
5.一种三维视频的编码装置,其特征在于,包括:
视频输入单元,用于实现视频信号的采集或读入,所述输入的一帧图像包括同一时刻多个不同视点的图像纹理信息和深度信息,构成多个视点的深度像素图;
图层分解单元,用于将各个视点的深度像素图映射到主视点上,并对主视点视图的图像大小进行扩展,所述主视点的选择按照预先约定;将映射到主视点的所有深度像素点作为一个待分配像素集,并合并像素点,将深度值差异和纹理值差异在预设阈值内的像素点合并为一个像素点,新的像素点的像素值为原像素值的平均;建立背景图层图像和前景图层图像,若所述待分配像素集中还有像素点,则重复执行建立背景图层图像和前景图层图像操作,直至分配完所有像素;
所述建立背景图层图像包括针对每个像素点,取出所述待分配像素集中深度最深的像素点,与原背景图层图像的像素进行比较;若所述深度最深像素点的深度更深,则以该像素点的像素值替换该背景图层图像像素值;若深度相同,则将所述深度最深像素点的像素值与原背景图层图像像素值加权平均后替换背景图层图像像素值;若所述深度最深像素点的深度更浅,则将所述深度最深像素点放回待分配像素集;
所述建立前景图层图像包括针对每个像素点,取出所述待分配像素集中深度最小的像素点的像素值,若该像素点已无像素值,则置空或置为该位置背景图层像素值,构成前景图层图像;
图层编码单元,用于基于各图层的重建图像对所述前景图层图像和背景图层图像进行编码;
图层重建图像生成单元,用于生成对应图层的一整幅的重建图像;
码流形成单元,用于将图层编码单元生成的数据组合成一个符合语法规则的码流;
码流输出单元,用于实现对所述码流的输出。
6.根据权利要求5所述的编码装置,其特征在于,所述图层编码单元包括:
前景图层编码单元,用于实现帧内预测、帧间预测、模式选择、用于预测残差计算的减法器、变换量化、熵编码、反变换反量化、用于重建图像的加法器、参考图像合成与去块滤波、参考帧存,所述参考帧存用于存放前景图层重建图像;
背景图层编码单元,用于实现帧内预测、帧间预测、模式选择、用于预测残差计算的减法器、变换量化、熵编码、反变换反量化、用于重建图像的加法器、参考图像合成与去块滤波、参考帧存,所述参考帧存用于存放背景图层重建图像。
7.一种基于权利要求5所述编码装置的三维视频解码装置,其特征在于,包括:
码流输入单元,用于从硬盘读入视频流;
码流解析单元,用于对输入的视频码流进行解析,分离出背景图层码流和前景图层码流;
图层解码单元,用于基于各图层的重建图像对背景图层图像和前景图层图像进行解码;
图层重建图像生成单元,用于生成对应图层的重建图像;
视点图像生成单元,用于根据各图层的重建图像和摄像机参数,生成指定视点的输出图像;
图像输出单元,用于将重建图像传送至输出接口输出。
CN 201110006090 2011-01-13 2011-01-13 三维视频编解码方法及装置 Active CN102055982B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201110006090 CN102055982B (zh) 2011-01-13 2011-01-13 三维视频编解码方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201110006090 CN102055982B (zh) 2011-01-13 2011-01-13 三维视频编解码方法及装置

Publications (2)

Publication Number Publication Date
CN102055982A CN102055982A (zh) 2011-05-11
CN102055982B true CN102055982B (zh) 2012-06-27

Family

ID=43959846

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201110006090 Active CN102055982B (zh) 2011-01-13 2011-01-13 三维视频编解码方法及装置

Country Status (1)

Country Link
CN (1) CN102055982B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9578224B2 (en) 2012-09-10 2017-02-21 Nvidia Corporation System and method for enhanced monoimaging
US12100162B2 (en) 2018-12-03 2024-09-24 Zhejiang Dahua Technology Co., Ltd. Method and system for obtaining and processing foreground image and background image

Families Citing this family (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102256137B (zh) * 2011-07-13 2013-07-17 西安电子科技大学 基于上下文预测的极光图像无损编码方法
US20130188013A1 (en) * 2011-07-22 2013-07-25 Qualcomm Incorporated Mvc based 3dvc codec supporting inside view motion prediction (ivmp) mode
CN103108197A (zh) * 2011-11-14 2013-05-15 辉达公司 一种用于3d视频无线显示的优先级压缩方法和系统
US9829715B2 (en) 2012-01-23 2017-11-28 Nvidia Corporation Eyewear device for transmitting signal and communication method thereof
WO2013113997A1 (en) * 2012-02-01 2013-08-08 Nokia Corporation Method and apparatus for video coding
CN103379348B (zh) * 2012-04-20 2016-11-16 乐金电子(中国)研究开发中心有限公司 一种编码深度信息时的视点合成方法、装置及编码器
US20130287093A1 (en) * 2012-04-25 2013-10-31 Nokia Corporation Method and apparatus for video coding
KR101653319B1 (ko) * 2012-08-10 2016-09-01 엘지전자 주식회사 3d 영상을 위한 영상 컴포넌트 송수신 처리 방법 및 장치
WO2014053095A1 (en) * 2012-10-03 2014-04-10 Mediatek Inc. Method and apparatus for inter-component motion prediction in three-dimensional video coding
US9357214B2 (en) * 2012-12-07 2016-05-31 Qualcomm Incorporated Advanced merge/skip mode and advanced motion vector prediction (AMVP) mode for 3D video
CN104053008B (zh) * 2013-03-15 2018-10-30 乐金电子(中国)研究开发中心有限公司 基于合成图像预测的视频编解码方法及视频编解码器
US9516306B2 (en) * 2013-03-27 2016-12-06 Qualcomm Incorporated Depth coding modes signaling of depth data for 3D-HEVC
KR102290420B1 (ko) 2013-04-05 2021-08-17 삼성전자주식회사 비디오 부호화 방법 및 그 장치, 비디오 복호화 방법 및 그 장치
CN105247862A (zh) * 2013-04-09 2016-01-13 联发科技股份有限公司 三维视频编码中的视点合成预测的方法及装置
WO2014166068A1 (en) * 2013-04-09 2014-10-16 Mediatek Inc. Refinement of view synthesis prediction for 3-d video coding
EP2985996B1 (en) 2013-04-10 2018-11-21 ZTE Corporation Depth information encoding and decoding method and device
CN105103543B (zh) * 2013-04-12 2017-10-27 寰发股份有限公司 兼容的深度依赖编码方法
WO2015000108A1 (en) 2013-07-01 2015-01-08 Mediatek Singapore Pte. Ltd. An improved texture merging candidate in 3dvc
CN105230014B (zh) * 2013-07-01 2018-02-02 寰发股份有限公司 用于三维视频编码系统的深度图编码的方法及其装置
WO2015007159A1 (en) * 2013-07-15 2015-01-22 Mediatek Singapore Pte. Ltd. Method of disparity derived depth coding in 3d video coding
CN105359520B (zh) * 2013-07-15 2017-12-12 联发科技(新加坡)私人有限公司 在三维视频编码中的深度编码方法和装置
KR101891637B1 (ko) 2013-07-19 2018-08-24 후아웨이 테크놀러지 컴퍼니 리미티드 깊이 기반 블록 파티셔닝을 사용하여 텍스처 블록을 인코딩 및 디코딩하는 방법 및 장치
CN103428499B (zh) * 2013-08-23 2016-08-17 清华大学深圳研究生院 编码单元的划分方法及使用该方法的多视点视频编码方法
US9906813B2 (en) 2013-10-08 2018-02-27 Hfi Innovation Inc. Method of view synthesis prediction in 3D video coding
CN104284194B (zh) * 2013-10-08 2018-11-23 寰发股份有限公司 利用视图合成预测编码或解码三维或多视图视频的方法以及装置
US10935788B2 (en) 2014-01-24 2021-03-02 Nvidia Corporation Hybrid virtual 3D rendering approach to stereovision
CN104010196B (zh) * 2014-03-14 2017-02-15 北方工业大学 基于hevc的3d质量可伸缩视频编码
CN105519106B (zh) * 2014-06-20 2017-08-04 寰发股份有限公司 用于三维或多视图视频编码中基于深度的块分区模式的编码方法
CN104780383B (zh) * 2015-02-02 2017-09-19 杭州电子科技大学 一种3d‑hevc多分辨率视频编码方法
US9530215B2 (en) * 2015-03-20 2016-12-27 Qualcomm Incorporated Systems and methods for enhanced depth map retrieval for moving objects using active sensing technology
CN105049866B (zh) * 2015-07-10 2018-02-27 郑州轻工业学院 基于绘制失真模型的多视点加深度编码的码率分配方法
US10636121B2 (en) 2016-01-12 2020-04-28 Shanghaitech University Calibration method and apparatus for panoramic stereo video system
US9906981B2 (en) 2016-02-25 2018-02-27 Nvidia Corporation Method and system for dynamic regulation and control of Wi-Fi scans
US11069120B2 (en) * 2016-08-10 2021-07-20 Sony Corporation Image processing apparatus and image processing method
US10878583B2 (en) * 2016-12-02 2020-12-29 Google Llc Determining structure and motion in images using neural networks
CN109308173B (zh) * 2017-07-26 2021-10-15 腾讯科技(深圳)有限公司 显示方法及装置、显示终端及计算机存储介质
EP3467782A1 (en) * 2017-10-06 2019-04-10 Thomson Licensing Method and device for generating points of a 3d scene
US11653023B2 (en) * 2017-12-01 2023-05-16 Sony Corporation Encoding device, encoding method, decoding device, and decoding method
CN112672132B (zh) * 2018-09-30 2023-12-26 Oppo广东移动通信有限公司 数据处理方法及装置、电子设备及存储介质
CN109600600B (zh) * 2018-10-31 2020-11-03 万维科研有限公司 涉及深度图转换的编码器、编码方法以及三层表达式的存储方法和格式
JP2022051967A (ja) * 2019-01-08 2022-04-04 ソニーグループ株式会社 情報処理装置および情報処理方法
FR3093884A1 (fr) * 2019-03-15 2020-09-18 Orange Procédés et dispositifs de codage et de décodage d'une séquence vidéo multi-vues
EP3973710A4 (en) * 2019-05-22 2023-05-03 Nokia Technologies Oy METHOD, DEVICE AND COMPUTER PROGRAM PRODUCT FOR ENCODING AND DECODING VOLUMETRIC VIDEO
CN110460855B (zh) * 2019-07-22 2023-04-18 西安万像电子科技有限公司 图像处理方法及系统
CN114071116B (zh) * 2020-07-31 2024-12-24 阿里巴巴集团控股有限公司 视频处理方法、装置、电子设备及存储介质
CN111953985B (zh) * 2020-08-14 2024-04-05 上海数迹智能科技有限公司 一种基于tof深度相机的图像处理方法及可存储介质
CN111988597B (zh) * 2020-08-23 2022-06-14 咪咕视讯科技有限公司 虚拟视点合成方法、装置、电子设备及可读存储介质
US11677979B2 (en) * 2020-08-24 2023-06-13 Tencent America LLC Freeview video coding
CN112929705B (zh) * 2021-02-02 2022-04-22 腾讯科技(深圳)有限公司 纹理压缩和解压方法、装置、计算机设备和存储介质
CN113179396B (zh) * 2021-03-19 2022-11-11 杭州电子科技大学 基于K-means模型的双视点立体视频融合方法
CN113837978B (zh) * 2021-09-28 2024-04-05 北京奇艺世纪科技有限公司 图像合成方法、装置、终端设备以及可读存储介质
CN114760455B (zh) * 2022-03-30 2023-10-13 广东博华超高清创新中心有限公司 一种基于avs3编码框架下的多路视频多视角场景编解码方法
CN119342247A (zh) * 2023-07-19 2025-01-21 华为云计算技术有限公司 视频处理方法及相关装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0675462A2 (en) * 1994-04-01 1995-10-04 AT&T Corp. System and method of generating compressed video graphics images
US6501796B1 (en) * 1996-11-28 2002-12-31 Thomson Licensing S.A. Method and device for video compression
CN1888814A (zh) * 2006-07-25 2007-01-03 深圳大学 三维主动视觉传感器的多视点姿态估计和自标定方法
CN101198061A (zh) * 2008-01-08 2008-06-11 吉林大学 基于视点图像映射的立体视频流编码方法
CN101312542A (zh) * 2008-07-07 2008-11-26 浙江大学 一种自然三维电视系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0675462A2 (en) * 1994-04-01 1995-10-04 AT&T Corp. System and method of generating compressed video graphics images
US6501796B1 (en) * 1996-11-28 2002-12-31 Thomson Licensing S.A. Method and device for video compression
CN1888814A (zh) * 2006-07-25 2007-01-03 深圳大学 三维主动视觉传感器的多视点姿态估计和自标定方法
CN101198061A (zh) * 2008-01-08 2008-06-11 吉林大学 基于视点图像映射的立体视频流编码方法
CN101312542A (zh) * 2008-07-07 2008-11-26 浙江大学 一种自然三维电视系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9578224B2 (en) 2012-09-10 2017-02-21 Nvidia Corporation System and method for enhanced monoimaging
US12100162B2 (en) 2018-12-03 2024-09-24 Zhejiang Dahua Technology Co., Ltd. Method and system for obtaining and processing foreground image and background image

Also Published As

Publication number Publication date
CN102055982A (zh) 2011-05-11

Similar Documents

Publication Publication Date Title
CN102055982B (zh) 三维视频编解码方法及装置
CN112771850B (zh) 使用3d辅助数据的运动补偿方法、系统以及存储介质
JP6178017B2 (ja) ステレオビデオのための深度認識向上
JP2021168479A (ja) デプスマップの推定および更新を用いる効率的なマルチビュー符号化
TWI558178B (zh) 用於寫碼視訊資料之方法及器件及電腦可讀儲存媒體
JP5575908B2 (ja) 2dビデオデータの3dビデオデータへの変換のための深度マップ生成技法
TWI520573B (zh) 用於寫碼視訊資料之方法、器件及電腦可讀儲存媒體
KR101712110B1 (ko) 변이 벡터 유도를 사용하는 비디오 부호화 방법 및 그 장치, 비디오 복호화 방법 및 그 장치
KR102250092B1 (ko) 다시점 비디오 부호화 방법 및 장치, 다시점 비디오 복호화 방법 및 장치
WO2019184639A1 (zh) 一种双向帧间预测方法及装置
JP6446488B2 (ja) ビデオデータデコーディング方法及びビデオデータデコーディング装置
TWI566589B (zh) 三維視訊之視圖合成
CN101729891B (zh) 一种多视点深度视频的编码方法
KR20140122196A (ko) 비디오 부호화 방법 및 그 장치, 비디오 복호화 방법 및 그 장치
CN104704835A (zh) 视频编码中运动信息管理的装置与方法
CN113196767B (zh) 光栅扫描分块组与矩形分块组的协调方法、设备和介质
KR20150073132A (ko) 휘도 보상을 이용한 인터 레이어 비디오 부호화 방법 및 그 장치, 비디오 복호화 방법 및 그 장치
CN101404766A (zh) 一种多视点视频信号的编码方法
CN109327703A (zh) 一种基于不同采样块的深度图编解码方法
KR20150033194A (ko) 병렬 부호화/복호화 방법 및 장치
KR20140124919A (ko) 객체 기반 적응적 밝기 보상 방법 및 장치
KR20130119381A (ko) 다시점 비디오 부호화 방법 및 장치, 다시점 비디오 복호화 방법 및 장치
CN105472367A (zh) 基于gop片划分的支持空域随机访问的自适应多视点视频编码方法
WO2019110560A1 (en) Devices and methods for video reconstruction from multiple source videos
Hanca et al. Segmentation-based intra coding of depth maps using texture information

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20170301

Address after: Hangzhou City, Zhejiang province 310005 Moganshan Road No. 1418-8 Building 1 room 315 (Shangcheng science and technology industrial base)

Patentee after: Hangzhou Hua Yanyun state information technology Co. Ltd.

Address before: 310027 Hangzhou, Zhejiang Province, Xihu District, Zhejiang Road, No. 38, No.

Patentee before: Zhejiang University

CP03 Change of name, title or address

Address after: 310014 10 / F, building 4, No. 1418-50, Moganshan Road, Hangzhou City, Zhejiang Province (Shangcheng science and technology industrial base)

Patentee after: Huayan Zhike (Hangzhou) Information Technology Co., Ltd

Address before: Hangzhou City, Zhejiang province 310005 Moganshan Road No. 1418-8 Building 1 room 315 (Shangcheng science and technology industrial base)

Patentee before: HANGZHOU WHAYER YUNTAI INFORMATION TECHNOLOGY Co.,Ltd.

CP03 Change of name, title or address