[go: up one dir, main page]

CN104412599B - 对视频译码发信长期参考图片 - Google Patents

对视频译码发信长期参考图片 Download PDF

Info

Publication number
CN104412599B
CN104412599B CN201380034109.0A CN201380034109A CN104412599B CN 104412599 B CN104412599 B CN 104412599B CN 201380034109 A CN201380034109 A CN 201380034109A CN 104412599 B CN104412599 B CN 104412599B
Authority
CN
China
Prior art keywords
value
msb
reference picture
long
term reference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201380034109.0A
Other languages
English (en)
Other versions
CN104412599A (zh
Inventor
阿达许·克里许纳·瑞玛苏布雷蒙尼安
王益魁
瑞珍·雷克斯曼·乔许
陈颖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN104412599A publication Critical patent/CN104412599A/zh
Application granted granted Critical
Publication of CN104412599B publication Critical patent/CN104412599B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/436Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using parallelised computational arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/58Motion compensation with long-term prediction, i.e. the reference frame for a current frame not being the temporally closest one
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/573Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种视频解码器可经配置以:解码第一值,所述第一值表示视频数据的当前图片的图片次序计数POC值的基本最高有效位MSB值与所述视频数据的第一长期参考图片的第一POC值的第一MSB值之间的差;解码第二值,所述第二值表示所述视频数据的第二长期参考图片的第二POC值的第二MSB值与所述第一MSB值之间的差,其中所述第一POC值与所述第二POC值具有不同的最低有效位值;以及解码所述视频数据的当前图片中的与所述第一长期参考图片和所述第二长期参考图片中的至少一者有关的至少一部分。

Description

对视频译码发信长期参考图片
本申请案主张2012年6月28日申请的美国临时申请案第61/665,784号的权益,所述临时申请案的全部内容以引用的方式并入本文中。
技术领域
本发明涉及视频译码。
背景技术
数字视频能力可并入到广泛范围的装置中,所述装置包含数字电视、数字直播系统、无线广播系统、个人数字助理(PDA)、膝上型或桌上型计算机、平板计算机、电子书阅读器、数字摄影机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话、所谓的“智能型手机”、视频电传会议装置、视频流式传输装置,和类似者。数字视频装置实施视频译码技术,例如,在由MPEG-2、MPEG-4、ITU-T H.263、ITU-TH.264/MPEG-4第10部分先进视频译码(AVC)所定义的标准、目前正在开发中的高效率视频译码(HEVC)标准和这些标准的扩展中所描述的视频译码技术。ITU-T SG16 WP3和ISO/IECJTC1/SC29/WG11的视频译码联合协作小组(JCT-VC)于2012年4月27日到5月7日在美国加州圣何塞市(San Jose)召开的第9次会议上布罗斯(Bross)等人的“高效率视频译码(HEVC)文本规范草案7”的文件LCTVC-I1003中描述即将到来的HEVC标准的最新草案(被称作“HEVC工作草案7”或“WD7”),从2013年5月13日起,其可从http://phenix.int-evry.fr/jct/doc_end_user/documents/8_San%20Jose/wg11/JCTVC-H1003-v22.zip下载而得。视频译码装置可通过实施这些视频译码技术来更有效率地发射、接收、编码、解码和/或存储数字视频信息。
视频译码技术包含空间(图片内)预测和/或时间(图片间)预测以减少或去除视频序列中固有的冗余。对于基于块的视频译码,可将视频切片(例如,视频帧或视频帧的一部分)分割成视频块,其也可被称作树型块、译码单元(CU)和/或译码节点。可使用相对于图片中的相邻块中的参考样本的空间预测来编码同一图片的帧内译码(I)切片中的视频块。图片的帧间译码(P或B)切片中的视频块可使用相对于同一图片中的相邻块中的参考样本的空间预测,或相对于其它参考图片中的参考样本的时间预测。图片可被称作帧,且参考图片可被称作参考帧。
空间或时间预测导致用于待译码的块的预测性块。残余数据表示待译码的原始块与预测性块之间的像素差。根据指向形成预测性块的参考样本的块的运动向量和指示经译码块与预测性块之间的差的残余数据来编码帧间译码块。根据帧内译码模式和残余数据来编码经帧内译码块。为了进一步压缩,可将残余数据从像素域变换到变换域,从而产生残余变换系数,可接着量化残余变换系数。可扫描一开始布置成二维阵列的经量化变换系数以便产生变换系数的一维向量,且可应用熵译码以达成甚至更多压缩。
发明内容
一般来说,本发明描述用于对视频译码发信长期参考图片的技术。参考图片大体上对应于可用于其它图片的数据的时间预测性译码的参考的图片。一般来说,长期参考图片存储于经解码图片缓冲器中,比其它参考图片(例如,短期参考图片)长。本发明描述与涉及长期参考图片的发信有关的各种技术,例如在图片的切片的切片标头中发信长期参考图片。本发明的技术可提供切片标头中的长期参考图片的发信方法(例如)在效率和/或适用性方面的改善。
在一个实例中,一种方法包含:解码第一值,所述第一值表示视频数据的当前图片的图片次序计数(POC)值的基本最高有效位(MSB)值与所述视频数据的第一长期参考图片的第一POC值的第一MSB值之间的差;解码第二值,所述第二值表示所述视频数据的第二长期参考图片的第二POC值的第二MSB值与所述第一MSB值之间的差,其中所述第一POC值与所述第二POC值具有不同的最低有效位(LSB)值;以及解码所述视频数据的当前图片中的与使用所述第一值的所述第一长期参考图片和使用所述第一值与所述第二值的所述第二长期参考图片中的至少一者有关的至少一部分。
在另一实例中,一种用于解码视频数据的装置包含视频解码器,其经配置以:解码第一值,所述第一值表示视频数据的当前图片的图片次序计数(POC)值的基本最高有效位(MSB)值与所述视频数据的第一长期参考图片的第一POC值的第一MSB值之间的差;解码第二值,所述第二值表示所述视频数据的第二长期参考图片的第二POC值的第二MSB值与所述第一MSB值之间的差,其中所述第一POC值与所述第二POC值具有不同的最低有效位(LSB)值;以及解码所述视频数据的当前图片中与使用所述第一值的所述第一长期参考图片和使用所述第一值与所述第二值的所述第二长期参考图片中的至少一者有关的至少一部分。
在另一实例中,一种装置包含:用于解码第一值的装置,所述第一值表示视频数据的当前图片的图片次序计数(POC)值的基本最高有效位(MSB)值与所述视频数据的第一长期参考图片的第一POC值的第一MSB值之间的差;用于解码第二值的装置,所述第二值表示所述视频数据的第二长期参考图片的第二POC值的第二MSB值与所述第一MSB值之间的差,其中所述第一POC值与所述第二POC值具有不同的最低有效位(LSB)值;以及用于解码所述视频数据的当前图片中与使用所述第一值的所述第一长期参考图片和使用所述第一值与所述第二值的所述第二长期参考图片中的至少一者有关的至少一部分的装置。
在另一实例中,一种计算机可读存储媒体于其上存储有指令,所述指令在被执行时使处理器:解码第一值,所述第一值表示视频数据的当前图片的图片次序计数(POC)值的基本最高有效位(MSB)值与所述视频数据的第一长期参考图片的第一POC值的第一MSB值之间的差;解码第二值,所述第二值表示所述视频数据的第二长期参考图片的第二POC值的第二MSB值与所述第一MSB值之间的差,其中所述第一POC值与所述第二POC值具有不同的最低有效位(LSB)值;以及解码所述视频数据的当前图片中与使用所述第一值的所述第一长期参考图片和使用所述第一值与所述第二值的所述第二长期参考图片中的至少一者有关的至少一部分。
在另一实例中,一种编码视频数据的方法包含:编码视频数据的当前图片中与第一长期参考图片有关的至少第一部分和所述当前图片中与第二长期参考图片有关的至少第二部分;编码第一值,所述第一值表示所述视频数据的当前图片的图片次序计数(POC)值的基本最高有效位(MSB)值与所述视频数据的所述第一长期参考图片的第一POC值的第一MSB值之间的差;以及编码第二值,所述第二值表示所述视频数据的所述第二长期参考图片的第二POC值的第二MSB值与所述第一MSB值之间的差,其中所述第一POC值与所述第二POC值具有不同的最低有效位(LSB)值。
在另一实例中,一种用于编码视频数据的装置包含视频编码器,其经配置以:编码视频数据的当前图片中与第一长期参考图片有关的至少第一部分和所述当前图片中与第二长期参考图片有关的至少第二部分;编码第一值,所述第一值表示所述视频数据的当前图片的图片次序计数(POC)值的基本最高有效位(MSB)值与所述视频数据的所述第一长期参考图片的第一POC值的第一MSB值之间的差;以及编码第二值,所述第二值表示所述视频数据的所述第二长期参考图片的第二POC值的第二MSB值与所述第一MSB值之间的差,其中所述第一POC值与所述第二POC值具有不同的最低有效位(LSB)值。
在另一实例中,一种用于编码视频数据的装置包含:用于编码视频数据的当前图片中与第一长期参考图片有关的至少一第一部分和所述当前图片中与第二长期参考图片有关的至少一第二部分的装置;用于编码第一值的装置,所述第一值表示所述视频数据的当前图片的图片次序计数(POC)值的基本最高有效位(MSB)值与所述视频数据的所述第一长期参考图片的第一POC值的第一MSB值之间的差;以及用于编码第二值的装置,所述第二值表示所述视频数据的所述第二长期参考图片的第二POC值的第二MSB值与所述第一MSB值之间的差,其中所述第一POC值与所述第二POC值具有不同的最低有效位(LSB)值。
在另一实例中,一种计算机可读存储媒体于其上存储有指令,所述指令使处理器:编码视频数据的当前图片中与第一长期参考图片有关的至少第一部分和所述当前图片中与第二长期参考图片有关的至少第二部分;编码第一值,所述第一值表示所述视频数据的当前图片的图片次序计数(POC)值的基本最高有效位(MSB)值与所述视频数据的所述第一长期参考图片的第一POC值的第一MSB值之间的差;以及编码第二值,所述第二值表示所述视频数据的所述第二长期参考图片的第二POC值的第二MSB值与所述第一MSB值之间的差,其中所述第一POC值与所述第二POC值具有不同的最低有效位(LSB)值。
一或多个实例的细节陈述于随附图式和以下描述中。其它特征、目标和优势将从所述描述和所述图式以及从权利要求书显而易见。
附图说明
图1为说明实例视频编码与解码系统的框图,所述视频编码与解码系统可利用用于切片标头中的长期参考图片的改善式发信的技术。
图2为说明视频编码器的实例的框图,所述视频编码器可实施用于切片标头中的长期参考图片的改善式发信的技术。
图3为说明视频解码器的实例的框图,所述视频解码器可实施用于切片标头中的长期参考图片的改善式发信的技术。
图4为说明经译码视频图片的序列的概念图。
图5为根据本发明技术的说明用于编码长期参考图片的图片次序计数(POC)值的实例方法的流程图。
图6为根据本发明技术的说明用于解码长期参考图片的POC值的实例方法的流程图。
具体实施方式
一般来说,视频数据由经快速连续俘获或显示的一连串图片来表示。应理解,在一些实例中,图片或图片的部分可(例如)使用计算机图形来产生,而非被俘获(或除被俘获外)。图片将经显示的次序(其可大体上与图片经俘获或产生的次序相同)可与图片经译码的次序不同。图片的显示次序大体上由图片次序计数(POC)值表示,而图片的译码次序大体上由帧数目(frame_num)值表示。
图片的译码一般涉及利用图片中出现的冗余数据。例如,空间译码(也被称作帧内预测性译码)利用共同图片的像素值的空间相邻块之间所出现的冗余。作为另一实例,时间译码(也被称作帧间预测性译码)利用在不同时间执行个体俘获、产生或显示的不同图片之间出现的冗余。更明确地说,可将图片划分为切片,其可指定用于帧内预测或帧间预测。此外,可将每一切片划分为块(例如,最大译码单元(LCU)),且可基于对应切片是否已经指定用于帧内预测或帧间预测而进一步分割或译码所述块中的每一者。
关于帧间预测性译码的实例,可从参考图片预测当前正经译码的图片(也被称作“当前图片”)的块。WD7将“参考图片”定义为具有等于1的nal_ref_flag的图片。nal_ref_flag为网络提取层(NAL)单元中指示包含在NAL单元中的数据是否作为参考图片的语法元素对待。WD7也提供,参考图片含有在后续图片按解码次序的解码过程中可用于帧间预测的样本(即,像素值)。
此外,WD7区分长期参考图片与短期参考图片。例如,WD7将长期参考图片定义为标记成“用于长期参考”的参考图片。WD7提供,序列参数集(SPS)中指示是否向经译码视频序列发信全部的长期参考图片的旗标。根据WD7,视频译码器在切片的切片标头中发信长期参考图片的POC值的最低有效位(LSB)。相对于发信完整POC值,发信LSB可能达成位节省。根据WD7,如果解码图片缓冲器(DPB)中存在具有与长期参考图片相同LSB位的一个以上参考图片,那么视频译码器可发信长期参考图片的POC值的最高有效位(MSB)。此外,根据WD7,视频译码器可使用旗标以指示经发信的长期参考图片是否可由当前图片用于参考。
视频译码器可维持当前图片的MSB(本文中被称作“基本MSB值”),且使用与基本MSB值有关的偏移值(例如,使用图片i的语法元素delta_poc_msb_cycle_lt[i])来发信长期参考图片i的MSB。此语法元素在下文中被称作“MSB循环”值。换句话说,为计算特定图片的POC值,视频译码器可计算:(基本MSB+图片的MSB循环)串接(图片的LSB)。
在WD7中,MSB循环值经译码为基本MSB值与经发信的MSB循环的图片(即,图片i)的MSB之间的差。仅当发信具有相同LSB值的两个或两个以上长期参考图片时,会同样发信第一个此类长期参考图片的MSB循环,且将剩余长期参考图片的MSB循环值作为彼此的相对偏移而发信。然而,根据WD7,此长期参考图片的发信可能经历一或多个缺点。例如,如果存在具有不同LSB值但均发信delta_poc_msb_cycle_lt[i]的两个长期参考图片,那么当前语法将如上文所述(即,将delta_poc_msb_cycle_lt[i]作为相对于基本MSB值的偏移)而发信。然而,本发明认识到发信图片的MSB循环值之间的差可更有效率。
根据WD7,在切片标头中发信长期参考图片的识别数据可能经历一或多个缺点。例如,如果当前图片的POC值等于MaxPicOrderCntLsb*N-1,且POC值等于MaxPicOrderCntLsb*N的图片为经发信delta_poc_msb_cycle_lt[i]的第一个长期参考图片,那么WD7不提供用于发信delta_poc_msb_cycle_lt[i]的技术。在此状况下,delta_poc_msb_cycle_lt[i]的值应为-1(负一),但不可能为-1(负一)。
作为另一实例,如果存在具有不同LSB值但均发信delta_poc_msb_cycle_lt[i]的两个长期参考图片,那么当前语法将同样发信delta_poc_msb_cycle_lt[i]。然而,本发明认识到对图片中的一者发信差可更有效率。
作为另一实例,当DPB中存在具有与所发信的长期参考图片相同的LSB的一个以上参考图片时,WD7委托也使用delta_poc_msb_cycle_lt[i]语法元素来发信LTRP的MSB循环。然而,本发明认识到,如果DPB中存在将由当前图片标记为短期参考图片的图片,那么于长期参考图片的候选集中包含所述短期参考图片可能以相比所需要的而发信更多MSB位而结束。
作为另一实例,当DPB中存在POC LSB等于poc_lsb_lt[i]的n个参考图片时,且在LSB等于poc_lsb_lt[i]的当前图片中发信k个长期参考图片(其中k小于或等于n)的情况下,WD7中所定义的语法委托所有k个图片将使delta_poc_msb_present_flag[i]设定为1。然而,如果k=n,那么本发明认识到,视频译码器无需将所有k个长期参考图片的delta_poc_msb_present_flag[i]设定为1,而是将n-1个图片的delta_poc_msb_present_flag[i]设定为1便足够。如下文关于图式更详细描述,本发明的技术可克服这些缺点中的任一者或全部。一般来说,本发明描述可改善切片标头中的长期参考图片的发信的各种技术。
图1为说明实例视频编码与解码系统10的框图,所述视频编码与解码系统10可利用用于切片标头中的长期参考图片的改善式发信的技术。如图1所示,系统10包含源装置12,所述源装置12提供稍后由目的地装置14解码的经编码视频数据。明确地说,源装置12经由计算机可读媒体16向目的地装置14提供视频数据。源装置12与目的地装置14可包括广泛范围的装置中的任一者,所述装置包含桌上型计算机、笔记型(即,膝上型)计算机、平板计算机、机顶盒、例如所谓的“智能型”手机的电话手机、所谓的“智能型”板、电视、摄影机、显示装置、数字媒体播放器、视频游戏控制台、视频流式传输装置或类似者。在一些状况下,源装置12和目的地装置14可经装备用于无线通信。
目的地装置14可经由计算机可读媒体16接收待解码的经编码视频数据。计算机可读媒体16可包括能够将经编码视频数据从源装置12移动到目的地装置14的任何类型的媒体或装置。在一个实例中,计算机可读媒体16可包括通信媒体,从而使源装置12能够实时地将经编码视频数据直接传输到目的地装置14。可根据通信标准(例如,无线通信协议)调制经编码视频数据,且将经编码视频数据传输到目的地装置14。通信媒体可包括任何无线或有线通信媒体,例如,射频(RF)频谱或一或多个物理传输线。通信媒体可形成基于封包的网络(例如,局域网、广域网或例如因特网的全球网络)的部分。通信媒体可包含路由器、交换器、基站或可用以促进从源装置12到目的地装置14的通信的任何其它装备。
在一些实例中,可将经编码数据从输出接口22输出到存储装置。类似地,可由输入接口从存储装置存取经编码数据。存储装置可包含多种分散式或本地存取式数据存储媒体中的任一者,例如,硬盘机、蓝光光盘、DVD、CD-ROM、快闪存储器、易失性或非易失性存储器或用于存储经编码视频数据的任何其它合适的数字存储媒体。在另一实例中,存储装置可对应于文件服务器或可存储源装置12所产生的经编码视频的另一中间存储装置。
目的地装置14可经由流式传输或下载而从存储装置存取所存储的视频数据。文件服务器可为能够存储经编码视频数据且将那个经编码视频数据传输到目的地装置14的任何类型的服务器。实例文件服务器包含网络服务器(例如,用于网站)、FTP服务器、网络附接式存储(NAS)装置或本地磁盘机。目的地装置14可经由任何标准数据连接(包含因特网连接)而存取经编码视频数据。此数据连接可包含适合于存取存储于文件服务器上的经编码视频数据的无线信道(例如,Wi-Fi连接)、有线连接(例如,DSL、缆线调制解调器,等等)或两者的组合。经编码视频数据从存储装置的传输可为流式传输、下载传输,或其组合。
本发明的技术并不限于无线应用或设定。所述技术可应用于支持例如以下应用的多种多媒体应用中的任一者的视频译码:空中电视广播、有线电视传输、卫星电视传输、例如HTTP动态自适应流式传输(DASH)的因特网流式传输视频传输、经编码到数据存储媒体上的数字视频、存储于数据存储媒体上的数字视频的解码或其它应用。在一些实例中,系统10可经配置以支持单向或双向视频传输以支持例如视频流式传输、视频播放、视频广播和/或视频电话的应用。
在图1的实例中,源装置12包含视频源18、视频编码器20和输出接口22。目的地装置14包含输入接口28、视频解码器30和显示装置32。根据本发明,源装置12的视频编码器20可经配置以应用用于切片标头中的长期参考图片的改善式发信的技术。在其它实例中,源装置和目的地装置可包含其它组件或布置。例如,源装置12可从外部视频源18(例如,外部摄影机)接收视频数据。类似地,目的地装置14可与外部显示装置介接,而非包含集成式显示装置。
图1的所说明系统10仅为一个实例。用于切片标头中的长期参考图片的改善式发信的技术可由任一数字视频编码和/或解码装置执行。虽然一般由视频编码装置执行本发明的技术,但也可由视频编码器/解码器(通常被称作“CODEC”)执行所述技术。此外,也可由视频预处理器来执行本发明的技术。源装置12和目的地装置14仅仅为这些译码装置的实例,在所述译码装置中,源装置12产生用于传输到目的地装置14的经译码视频数据。在一些实例中,装置12、14可按实质上对称的方式进行操作,使得装置12、14中的每一者包含视频编码和解码组件。因此,系统10可支持视频装置12、14之间的单向或双向视频传输,例如,用于视频流式传输、视频播放、视频广播或视频电话。
源装置12的视频源18可包含例如视频摄影机的视频俘获装置、含有先前俘获的视频的视频存档和/或用以从视频内容提供者接收视频的视频馈入接口。作为另一替代,视频源18可产生基于计算机图形的数据作为源视频、或产生实况视频、存档视频和计算机产生的视频的组合。在一些状况下,如果视频源18为视频摄影机,那么源装置12和目的地装置14可形成所谓的摄影机电话或视频电话。然而,如上文所提及,本发明中所描述的技术大体上可适用于视频译码,且可适用于无线和/或有线应用。在每一状况下,所俘获的、预先俘获的或计算机产生的视频可由视频编码器20编码。经编码视频信息接着可由输出接口22输出到计算机可读媒体16上。
计算机可读媒体16可包含:暂时性媒体,例如,无线广播或有线网络传输;或存储媒体(即,非暂时性存储媒体),例如,硬盘、随身碟、压缩光盘、数字视频光盘、蓝光光盘或其它计算机可读媒体。在一些实例中,网络服务器(图中未展示)可从源装置12接收经编码视频数据,且(例如,经由网络传输)将经编码视频数据提供到目的地装置14。类似地,媒体生产设施(例如,光盘压印设施)的计算装置可从源装置12接收经编码视频数据且产生含有经编码视频数据的光盘。因此,在各种实例中,可将计算机可读媒体16理解成包含各种形式的一或多个计算机可读媒体。
目的地装置14的输入接口28从计算机可读媒体16接收信息。计算机可读媒体16的信息可包含由视频编码器20定义、也由视频解码器30使用的语法信息,所述语法信息包含描述块和其它经译码单元(例如,GOP)的特性和/或处理的语法元素。显示装置32向用户显示经解码视频数据,且可包括多种显示装置中的任一者,例如,阴极射线管(CRT)、液晶显示器(LCD)、等离子显示器、有机发光二极管(OLED)显示器或另一类型的显示装置。
视频编码器20和视频解码器30可根据例如目前在开发中的高效率视频译码(HEVC)标准的视频译码标准而操作,且可遵照HEVC测试模型(HM)。替代地,视频编码器20和视频解码器30可根据例如ITU-T H.264标准替代地被称作MPEG-4第10部分先进视频译码(AVC)的其它专有或行业标准或这些标准的扩展而操作。然而,本发明的技术不限于任何特定译码标准。视频译码标准的其它实例包含MPEG-2和ITU-T H.263。虽然图1中未展示,但在一些方面中,视频编码器20和视频解码器30可各自与音频编码器和解码器集成,且可包含适当MUX-DEMUX单元或其它硬件和软件以处置共同数据流或单独数据流中的音频和视频两者的编码。如果适用,那么MUX-DEMUX单元可遵照ITU H.223多路复用器协议或例如用户数据报协议(UDP)的其它协议。
ITU-T H.264/MPEG-4(AVC)标准由ITU-T视频译码专家群(VCEG)连同ISO/IEC动画专家群(MPEG)一起制定为被称作联合视频小组(JVT)的集体合作的产物。在一些方面中,本发明中所描述的技术可应用于大体上遵照H.264标准的装置。H.264标准由ITU-T研究小组且在日期为2005年3月描述于ITU-T推荐H.264(用于一般视听服务的先进视频译码)中,其在本文中可被称作H.264标准或H.264规范,或H.264/AVC标准或规范。联合视频小组(JVT)继续致力于对H.264/MPEG-4 AVC的扩展。
视频编码器20和视频解码器30可各自实施为多种合适的编码器电路中的任一者,例如,一或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任何组合。当所述技术部分地以软件实施时,装置可将用于软件的指令存储于合适的非暂时性计算机可读媒体中,且在硬件中使用一或多个处理器来执行所述指令以执行本发明的技术。视频编码器20和视频解码器30中的每一者可包含于一或多个编码器或解码器中,其中的任一者可集成为相应装置中的组合编码器/解码器(CODEC)的部分。
JCT-VC正致力于HEVC标准的开发。HEVC标准化努力是基于视频译码装置的演进模型,其被称作HEVC测试模型(HM)。HM假设视频译码装置相对于根据(例如)ITU-TH.264/AVC的现有装置的若干额外能力。例如,H.264提供九个帧内预测编码模式,而HM可提供多达三十三个帧内预测编码模式。
一般来说,HM的工作模型描述视频帧或图片可划分成包含亮度样本和色度样本两者的树型块或最大译码单元(LCU)的序列。位流内的语法数据可定义LCU的大小,LCU就像素的数目来说为最大译码单元。切片包含按译码次序的许多连续树型块。可将视频帧或图片分割成一或多个切片。每一树型块可根据四分树而分裂成译码单元(CU)。一般来说,四分树数据结构中针对每一CU包含一个节点,其中根节点对应于树型块。如果将CU分裂成四个子CU,那么对应于所述CU的节点包含四个叶节点,所述叶节点中的每一者对应于所述子CU中的一者。
所述四分树数据结构中的每一节点可提供针对对应CU的语法数据。例如,在四分树中的节点可包含分裂旗标,其指示是否将对应于所述节点的CU分裂成子CU。可递归地定义用于CU的语法元素,且用于CU的语法元素可取决于CU是否分裂成子CU。如果CU未经进一步分裂,那么其被称作叶CU。在本发明中,即使不存在原始叶CU的明显分裂,叶CU的四个子CU也将被称作叶CU。例如,如果16×16大小的CU未经进一步分裂,那么四个8×8子CU也会被称作叶CU,尽管所述16×16 CU从未经分裂。
除了CU不具有大小区别之外,CU具有与H.264标准的宏块类似的用途。例如,树型块可分裂成四个子节点(也被称作子CU),且每一子节点可又为母节点并分裂成另外四个子节点。被称作四分树的叶节点的最终的未分裂子节点包括译码节点,所述译码节点也被称作叶CU。与经译码位流相关联的语法数据可定义可分裂树型块的最大次数(其被称作最大CU深度),且也可定义所述译码节点的最小大小。因此,位流也可定义最小译码单元(SCU)。本发明使用术语“块”指在HEVC的上下文中的CU、PU或TU中的任一者,或在其它标准的上下文中的类似数据结构(例如,在H.264/AVC中的宏块和其子块)。
CU包含译码节点和与所述译码节点相关联的若干预测单元(PU)和变换单元(TU)。CU的大小对应于译码节点的大小,且形状必须为正方形。CU的大小的范围可从8×8像素直到具有最大64×64像素或大于64×64像素的树型块的大小。每一CU可含有一或多个PU和一或多个TU。与CU相关联的语法数据可描述(例如)CU到一或多个PU的分割。分割模式可视CU经跳过或直接模式编码、经帧内预测模式编码抑或帧间预测模式编码而不同。PU可分割成非正方形形状。与CU相关联的语法数据也可描述(例如)CU根据四分树而分割成一或多个TU。TU的形状可为正方形或非正方形(例如,矩形)。
HEVC标准允许根据TU的变换,所述变换对于不同CU可不同。通常基于针对经分割LCU所定义的给定CU内的PU的大小而设定TU大小,但可能并非总是如此状况。TU通常具有与PU相同的大小,或小于PU。在一些实例中,可使用已知为“残余四分树”(RQT)的四分树结构而将对应于CU的残余样本再分成较小单元。RQT的叶节点可被称作变换单元(TU)。可变换与TU相关联的像素差值以产生变换系数,变换系数可被量化。
叶CU可包含一或多个预测单元(PU)。一般来说,PU表示对应于对应CU的全部或一部分的空间区域,且可包含用于检索PU的参考样本的数据。此外,PU包含与预测有关的数据。例如,当PU经帧内模式编码时,用于PU的数据可包含于残余四分树(RQT)中,残余四分树可包含描述对应于PU的TU的帧内预测模式的数据。作为另一实例,当PU经帧间模式编码时,PU可包含定义所述PU的一或多个运动向量的数据。定义PU的运动向量的数据可描述(例如)运动向量的水平分量、运动向量的垂直分量、运动向量的分辨率(例如,四分之一像素精度或八分之一像素精度)、运动向量所指向的参考图片和/或用于运动向量的参考图片列表(例如,列表0、列表1或列表C)。
具有一或多个PU的叶CU也可包含一或多个变换单元(TU)。可使用RQT(也被称作TU四分树结构)指定变换单元,如上文所论述。例如,分裂旗标可指示叶CU是否分裂成四个变换单元。接着,每一变换单元可进一步分裂成其它子TU。当TU未进一步分裂时,其可被称作叶TU。一般来说,对于帧内译码,属于叶CU的所有叶TU共享相同帧内预测模式。即,大体上应用相同帧内预测模式来计算叶CU的所有TU的预测值。对于帧内译码,视频编码器可使用帧内预测模式将每一叶TU的残余值计算为在CU的对应于所述TU的部分与原始块之间的差。TU未必限于PU的大小。因此,TU可能大于或小于PU。对于帧内译码,PU可与用于同一CU的对应叶TU共置。在一些实例中,叶TU的最大大小可对应于对应叶CU的大小。
此外,叶CU的TU也可与被称作残余四分树(RQT)的相应四分树数据结构相关联。即,叶CU可包含指示如何将叶CU分割成TU的四分树。TU四分树的根节点大体上对应于叶CU,而CU四分树的根节点大体上对应于树型块(或LCU)。RQT的不分裂的TU被称作叶TU。一般来说,除非另有指示,否则本发明分别使用术语CU和TU来指叶CU和叶TU。
视频序列通常包含一系列视频帧或图片。图片群组(GOP)大体包括一系列一或多个视频图片。GOP可在GOP的标头、图片中的一或多者的标头中或在别处包含描述包含于GOP中的图片数目的语法数据。图片的每一切片可包含描述所述相应切片的编码模式的切片语法数据。视频编码器20通常对个别视频切片内的视频块进行操作,以便编码视频数据。视频块可对应于CU内的译码节点。视频块可具有固定或变化的大小,且可根据指定译码标准而在大小方面不同。
作为实例,HM支持以各种PU大小进行预测。假定特定CU的大小为2N×2N,那么HM支持以2N×2N或N×N的PU大小进行帧内预测,和以2N×2N、2N×N、N×2N或N×N的对称PU大小进行帧间预测。HM也支持以2N×nU、2N×nD、nL×2N和nR×2N的PU大小针对帧间预测进行不对称分割。在不对称分割中,CU的一个方向未分割,而另一方向被分割成25%和75%。CU的对应于25%分割区的部分由“n”继之以“上(Up)”、“下(Down)”、“左(Left)”或“右(Right)”的指示来指示。因此,例如,“2N×nU”指被水平分割而在顶部具有2N×0.5N PU和在底部具有2N×1.5N PU的2N×2N CU。
在本发明中,“N×N”与“N乘N”可互换地使用以指视频块在垂直维度与水平维度方面的像素尺寸,例如,16×16像素或16乘16像素。一般来说,16×16块在垂直方向中将具有16个像素(y=16)且在水平方向中将具有16个像素(x=16)。类似地,N×N块通常在垂直方向上具有N个像素,且在水平方向上具有N个像素,其中N表示非负整数值。可按行和列来布置块中的像素。另外,块未必需要在水平方向中具有与在垂直方向中相同数目个像素。例如,块可包括N×M个像素,其中M未必等于N。
在使用CU的PU进行帧内预测性或帧间预测性译码之后,视频编码器20可计算CU的TU的残余数据。PU可包括描述于空间域(也被称作像素域)中产生预测性像素数据的方法或模式的语法数据,且TU可在将变换(例如,离散余弦变换(DCT)、整数变换、小波变换或概念上类似的变换)应用于残余视频数据之后包括变换域中的系数。残余数据可对应于未经编码图片的像素与对应于PU的预测值之间的像素差。视频编码器20可形成包含CU的残余数据的TU,且接着变换所述TU以产生CU的变换系数。
在用以产生变换系数的任何变换之后,视频编码器20可执行变换系数的量化。量化大体上指如下过程:将变换系数量化以可能地减少用以表示所述系数的数据量,从而提供进一步压缩。所述量化过程可减少与所述系数中的一些或所有系数相关联的位深度。例如,可在量化期间将n位值向下舍位到m位值,其中n大于m。
在量化之后,视频编码器可扫描变换系数,从而从包含经量化变换系数的二维矩阵产生一维向量。扫描可经设计成将较高能量(且因此较低频率)系数置于阵列前部,且将较低能量(且因此较高频率)系数置于阵列后部。在一些实例中,视频编码器20可利用预定义扫描次序来扫描经量化变换系数,以产生可经熵编码的序列化向量。在其它实例中,视频编码器20可执行自适应扫描。在扫描经量化变换系数以形成一维向量之后,视频编码器20可(例如)根据上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)、基于语法的上下文自适应二进制算术译码(SBAC)、概率区间分割熵(PIPE)译码或另一熵编码方法而熵编码所述一维向量。视频编码器20也可熵编码与经编码视频数据相关联的语法元素以供视频解码器30用于解码视频数据。
为了执行CABAC,视频编码器20可将上下文模型内的上下文指派给待传输的符号。所述上下文可能涉及(例如)符号的相邻值是否为非零。为了执行CAVLC,视频编码器20可针对待传输的符号选择可变长度码。可构建VLC中的码字使得相对较短码对应于更有可能的符号,而较长码对应于较不可能的符号。以此方式,使用VLC可达成位节省(与(例如)针对待传输的每一符号使用等长度码字相比较)。概率确定可基于指派给符号的上下文而进行。
根据本发明的技术,视频编码器20与视频解码器30可经配置以利用用于发信数据以供(例如)在切片标头、参数集(包含图片参数集(PPS)和序列参数集(SPS))或类似者中识别长期参考图片的改善式技术。一般来说,视频编码器20与视频解码器30可经配置以单独地或以任何组合来执行本发明技术中的任一者或全部。在一些实例中,视频编码器20与视频解码器30可经配置以执行用于对长期参考图片发信ΔPOC MSB循环的负值的方法。在一些实例中,视频编码器20与视频解码器30可经配置以使用差分译码来执行用于更有效地对具有不同LSB值的长期参考图片发信ΔPOC MSB循环值的方法。
在一些实例中,可将作为当前图片的短期参考图片而发信(或包含在当前图片的短期参考图片集中)的参考图片排除在决定是否对长期参考图片发送ΔPOC MSB循环值所利用的参考图片之外,以避免发送不必要的ΔPOC MSB循环值。在一些实例中,当DPB中存在POC LSB等于poc_lsb_lt[i]的n个参考图片(包含或排除短期参考图片)时,且当在LSB值等于poc_lsb_lt[i]的当前图片中发信n个长期参考图片时,视频编码器20可仅对n-1个长期参考图片发送ΔPOC MSB循环值,且视频解码器30可仅对n-1个长期参考图片接收此数据,但对所有n个长期参考图片发送此数据是可能的。
上文各种技术中的任一者或全部可根据以下实例实施方案来实施。如下文所示,可修改WD7中描述长期参考图片的MSB循环的语法元素。本发明也描述用于导出阵列DeltaPocMSBCycleLt[]的实例方法。本发明进一步描述用于参考图片集的实例解码过程。此外,本发明描述语法元素delta_poc_msb_present_flag[i]和poc_lsb_lt[i]的语义。WD7的其它语法元素的语法和语义可保持不变。
表1表示切片标头的语法的实例集合。加底线文字表示相对于WD7的切片标头语法的改变。在下文论述改变的语法元素的语义以及其它语法元素的改变的语义。
表1
在表1的实例中,切片标头语法包含额外元素delta_poc_msb_cycle_lt_plus1[i]。在下文描述此语法元素的语义。在一些实例中,poc_lsb_lt[i]可指定包含在当前图片的长期参考图片集中的第i个长期参考图片的图片次序计数值的最低有效位的值。poc_lsb_lt[i]语法元素的长度可为log2_max_pic_order_cnt_lsb_minus4+4位。
在一些实例中,delta_poc_msb_present_flag[i]等于1可指定存在delta_poc_msb_cycle_lt_plus1[i]。delta_poc_msb_present_flag[i]等于0可指定不存在delta_poc_msb_cycle_lt_plus1[i]。当解码图片缓冲器在排除由当前图片标记为“用于短期参考”的那些图片之外存在图片次序计数值的最低有效位等于poc_lsb_lt[i]的j个参考图片(其中j为大于1的整数值)时,且当第i个长期参考图片并非图片次序计数值的最低有效位等于由当前图片发信的poc_lsb_lt[i]的第j个长期参考图片时,delta_poc_msb_present_flag[i]可设定为等于1。
在一些实例中,delta_poc_msb_cycle_lt_plus1[i]可用以确定包含在当前图片的长期参考图片集中的第i个长期参考图片的图片次序计数值的最高有效位的值。当未被发信时,delta_poc_msb_cycle_lt_plus1[i]可取值为1。
变量DeltaPocMSBCycleLt[i]可根据以下算法导出,其中(7-37)指代HEVC的章节,即,相对于WD7的所改变章节。应注意,下文的实例导出意味着MSB循环是以其值的递增次序发送。
DeltaPocMSBCycleLt[i]*MaxPicOrderCntLsb+pic_order_cnt_lsb-poc_lsb_lt[i]的值可处于1到224-1的范围中,1与224-1包含在内。替代地,可通过将delta_poc_msb_cycle_lt_plusN[i](而非delta_poc_msb_cycle_lt_plus1[i])作为ue(v)(即,作为以左边位为先的经无正负号的整数指数哥伦布译码(Exp-Golomb-coded)的语法元素)发信来发送MSB循环,其中N为大于1的值。替代地,可通过将delta_poc_msb_cycle_lt[i](而非delta_poc_msb_cycle_lt_plus1[i])作为se(v)(即,作为以左边位为先的经带正负号的整数指数哥伦布译码的语法元素)发信来发送MSB循环。
换句话说,根据本发明的技术,表示图片i的MSB循环(例如,实际上在位流中发信的delta_poc_msb_cycle_lt_plus1[i])的值可关于先前译码的长期参考图片(例如,图片i-1)的MSB循环,而非关于基本MSB值进行计算。此在数学上等效于将表示图片i的MSB循环的值作为图片i的POC值的MSB与图片i-1的POC值的MSB之间的差来计算,假设此值最终与图片i-1的MSB循环值相加以表示图片i的真正的MSB循环值(其为图片i的MSB与基本MSB之间的差)。此可达成位流的位节省,这是因为表示连续MSB循环值之间的差的值可小于长期参考图片的MSB与基本MSB之间的差。
在一些实例中,视频编码器20与视频解码器30可根据以下有序步骤执行参考图片集的导出过程和图片标记,其中DPB指如WD7的附录C中所描述的解码图片缓冲器。应注意,下文实例中,短期参考图片与长期参考图片子集导出的次序相对于WD7中的次序而交换。右边界(right margin)附近的附带参考希望指代WD7的章节。与WD7的算法有关的此变化与其它变化在下文实例中使用加底线文字指出:
1.以下适用:
2.包含在RefPicSetStCurrBefore、RefPicSetStCurrAfter和RefPicSetStFoll中的所有参考图片标记为“用于短期参考”。
3.以下适用:
4.包含在RefPicSetLtCurr和RefPicSetStFoll中的所有参考图片标记为“用于长期参考”。
5.解码图片缓冲器中的并不包含在RefPicSetLtCurr、RefPicSetLtFoll、RefPicSetStCurrBefore、RefPicSetStCurrAfter或RefPicSetStFoll中的所有参考图片标记为“未用于参考”。
可能有包含在参考图片集中,但不存在于解码图片缓冲器中的一或多个参考图片。应忽略RefPicSetStFoll或RefPicSetLtFoll中等于“无参考图片”的条目。除非以下两条件中的任一者为真,否则应针对RefPicSetStCurrBefore、RefPicSetStCurrAfter与RefPicSetLtCurr中等于“无参考图片”的每一条目推断无意的图片损耗:a)位流中的第一经译码图片为CRA图片,且当前经译码图片为与位流中的所述第一经译码图片相关联的TFD图片;以及b)在解码次序中位于当前经译码图片之前的先前RAP图片为BLA图片,且所述当前经译码图片为与所述BLA图片相关联的TFD图片。
因此,根据本发明的技术,视频译码器(例如,视频编码器20和/或视频解码器30)可使用差分译码来计算具有不同LSB值的图片的MSB循环值。另外,视频译码器可使用表示MSB循环的值来译码与长期参考图片中的一者(例如,图片i-1或图片i)有关的当前图片。例如,视频译码器可使用上文所描述的公式(公式7-37)和/或上文所描述的算法来确定参考图片的POC值。
因此,视频编码器20与视频解码器30表示视频译码器的实例,所述视频译码器经配置以:译码第一值,所述第一值表示视频数据的当前图片的图片次序计数(POC)值的基本最高有效位(MSB)值与所述视频数据的第一长期参考图片的第一POC值的第一MSB值之间的差;译码第二值,所述第二值表示所述视频数据的第二长期参考图片的第二POC值的第二MSB值与所述第一MSB值之间的差,其中所述第一POC值与所述第二POC值具有不同的最低有效位(LSB)值;以及译码所述视频数据的当前图片中的与使用所述第一值的所述第一长期参考图片和使用所述第一值与所述第二值的所述第二长期参考图片中的至少一者有关的至少一部分。
例如,视频编码器20可针对当前图片确定是否存在待发信MSB循环值(也被称作MSB值)的两个或两个以上长期参考图片,甚至当所述长期参考图片具有不同LSB值时。在存在具有不同LSB值但待发信MSB循环值的两个(或两个以上)长期参考图片的情况下,视频编码器20可将表示第二长期参考图片的MSB循环值的数据编码为相对于第一长期参考图片的MSB循环值的差(或Δ)。类似地,视频编码器20可将表示第一长期参考图片的MSB循环值的数据编码为相对于当前图片的POC值的基本MSB值的差。视频编码器20可进一步编码当前图片(例如,一或多个块)中与第一长期参考图片与第二长期参考图片中的至少一者有关的至少一部分。
因此,当视频解码器30接收指示长期参考图片的MSB循环值的数据时,视频解码器30可解码表示第一长期参考图片的POC值的基本MSB之间的差的值,且通过将所述值与所述基本MSB相加来计算第一长期参考图片的POC值的MSB。视频解码器30也可解码表示第二长期参考图片的POC值的MSB与第一长期参考图片的POC值的MSB之间的差的值,且通过将所述值与第一长期参考图片的POC值的所述MSB相加来计算第二长期参考图片的所述POC值的MSB。类似地,视频解码器30可使用长期参考图片的POC值的MSB来解码当前图片中与第一长期参考图片与第二长期参考图片中的至少一者有关的至少一部分。
视频编码器20和视频解码器30可各自实施为多种合适编码器或解码器电路中的任一者(在适用时),例如,一或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑电路、软件、硬件、固件或其任何组合。视频编码器20和视频解码器30中的每一者可包含于一或多个编码器或解码器中,其中的任一者可集成为组合式视频编码器/解码器(CODEC)的部分。包含视频编码器20和/或视频解码器30的装置可包括集成电路、微处理器和/或无线通信装置(例如,蜂窝式电话)。
图2为说明视频编码器20的实例的框图,所述视频编码器20可实施用于切片标头中的长期参考图片的改善式发信的技术。视频编码器20可执行视频切片内的视频块的帧内译码和帧间译码。帧内译码依赖于空间预测以减小或去除给定视频帧或图片内的视频的空间冗余。帧间译码依赖于时间预测以减小或去除视频序列的邻近帧或图片内的视频的时间冗余。帧内模式(I模式)可指若干基于空间的译码模式中的任一者。帧间模式(例如,单向预测(P模式)或双向预测(B模式))可指若干基于时间的译码模式中的任一者。
如图2中所示,视频编码器20接收待编码的视频帧内的当前视频块。在图2的实例中,视频编码器20包含模式选择单元40、参考图片存储器64、求和器50、变换处理单元52、量化单元54和熵编码单元56。模式选择单元40又包含运动补偿单元44、运动估计单元42、帧内预测单元46和分割单元48。为了视频块重构建,视频编码器20也包含反量化单元58、反变换单元60和求和器62。也可包含解块滤波器(图2中未展示)以滤波块边界,从而从重构建的视频中去除方块效应伪影。如果需要,解块滤波器通常将滤波求和器62的输出。除解块滤波器之外,也可使用额外滤波器(回路内或回路后)。为简洁起见,未展示这些滤波器,但这些滤波器必要时可滤波求和器50的输出(作为回路内滤波器)。
在编码过程期间,视频编码器20接收待译码的视频帧或切片。可将所述帧或切片划分成多个视频块。运动估计单元42和运动补偿单元44执行所接收的视频块相对于一或多个参考帧中的一或多个块的帧间预测性译码,以提供时间预测。帧内预测单元46可替代地执行所接收的视频块相对于在与待译码的块相同的帧或切片中的一或多个相邻块的帧内预测性译码,以提供空间预测。视频编码器20可执行多个译码遍次,(例如)以选择用于视频数据的每一块的适当译码模式。
此外,分割单元48可基于先前译码遍次中的先前分割方案的评估而将视频数据的块分割成子块。例如,分割单元48可一开始将帧或切片分割成LCU,且基于位率-失真分析(例如,位率-失真优化)来将所述LCU中的每一者分割成子CU。模式选择单元40可进一步产生指示LCU到子CU的分割的四分树数据结构。四分树的叶节点CU可包含一或多个PU和一或多个TU。
模式选择单元40可(例如)基于误差结果而选择译码模式(帧内或帧间)中的一者,且将所得的经帧内或帧间译码的块提供到求和器50以产生残余块数据,且提供到求和器62以重构建经编码块以便用作参考帧。模式选择单元40也将语法元素(例如,运动向量、帧内模式指示符、分割信息和其它这些语法信息)提供到熵编码单元56。根据本发明的技术,模式选择单元40可向熵编码单元56提供参考图片识别信息(例如,应将参考图片作为长期参考图片抑或短期参考图片对待),以及长期参考图片的图片次序计数(POC)值的最低有效位(LSB)。根据本发明的技术,视频编码器20的熵编码单元56或另一单元可包含切片的切片标头中的这些参考图片识别信息。替代地,熵编码单元56可包含(例如)图片参数集(PPS)或序列参数集(SPS)的参数集中的参考图片识别信息(例如,以指示哪个参考图片为长期参考图片)。
如上文所解释,可使用长期参考图片的POC值的LSB来发信长期参考图片。例如,熵编码单元56可通过在切片标头、PPS或SPS中发信参考图片的POC值的LSB来指示所述参考图片为长期参考图片。未以此方式发信的其它参考图片可经作为短期参考图片对待。
通过发信长期参考图片的识别信息,熵编码单元56提供数据,所述数据指示哪些参考图片将存储于视频解码器(例如,视频解码器30)的解码图片缓冲器(DPB)中达相对长期时间以及哪些参考图片可较早从解码图片缓冲器中去除。一般来说,长期参考图片可用作用于译码具有相对很晚解码次序时间的图片的参考图片。因此,发信长期参考图片的识别信息为视频解码器(例如,视频解码器30)提供信息,使得所述视频解码器可确定是否从其自身DPB中舍弃参考图片。
运动估计单元42与运动补偿单元44可高度集成,但出于概念目的而分开说明。由运动估计单元42执行的运动估计为产生运动向量的过程,运动向量估计视频块的运动。例如,运动向量可指示在当前视频帧或图片内的视频块的PU相对于参考帧(或其它经译码单元)内的预测性块(其与所述当前帧(或其它经译码单元)内正被译码的当前块相关)的位移。预测性块为经发现在像素差方面紧密地匹配待译码块的块,所述像素差可由绝对差和(SAD)、平方差和(SSD)或其它差度量确定。在一些实例中,视频编码器20可计算存储于参考图片存储器64中的参考图片的次整数像素位置的值。例如,视频编码器20可内插所述参考图片的四分之一像素位置、八分之一像素位置或其它分数像素位置的值。因此,运动估计单元42可执行相对于全像素位置和分数像素位置的运动搜索,且以分数像素精度输出运动向量。
运动估计单元42通过比较经帧间译码的切片中的视频块的PU的位置与参考图片的预测性块的位置来计算所述PU的运动向量。参考图片可从第一参考图片列表(列表0)或第二参考图片列表(例表1)选择,所述列表中的每一者识别存储于参考图片存储器64中的一或多个参考图片。参考图片存储器64可存储长期参考图片与短期参考图片两者。运动估计单元42将经计算运动向量发送到熵编码单元56和运动补偿单元44。
由运动补偿单元44执行的运动补偿可涉及基于由运动估计单元42确定的运动向量来提取或产生预测性块。此外,在一些实例中,运动估计单元42和运动补偿单元44可在功能上集成。在接收到当前视频块的PU的运动向量后,运动补偿单元44就可在参考图片列表中的一者中定位运动向量所指向的预测性块。求和器50通过从正被译码的当前视频块的像素值减去预测性块的像素值从而形成像素差值来形成残余视频块,如下文所论述。一般来说,运动估计单元42执行相对于亮度分量的运动估计,且运动补偿单元44将基于所述亮度分量所计算的运动向量用于色度分量与亮度分量两者。
模式选择单元40也可产生与视频块和视频切片相关联的语法元素以供视频解码器30用于解码视频切片的视频块。例如,在计算视频数据的块的运动向量之后(其中运动向量指向参考图片中的参考块),模式选择单元40可产生运动参数的值,例如,存储有参考图片的参考图片列表,和对应于参考图片在所述参考图片列表中的位置的所述参考图片列表的索引。这些和其它运动参数可基于运动向量译码模式进行译码。例如,使用先进运动向量预测(AMVP),熵编码单元56可识别运动向量预测符(对应于当前块在空间或时间上的相邻块),且明确地发信参考图片列表、参考图片索引,和水平与垂直运动向量差值。作为另一实例,通过使用合并模式,熵编码单元56可使用合并索引来识别运动向量预测符,且参考图片列表和参考索引可继承从运动向量预测符(例如,相邻块的运动信息为空间相邻块抑或时间相邻块)。
视频编码器20发信指示哪些参考图片为长期参考图片的信息,从而既指示不从DPB舍弃这些图片,又提供可用于参考图片列表构建过程期间的信息。以此方式,视频解码器(例如,视频解码器30)可能能够准确地再生参考图片列表,使得用作帧间预测块的运动信息的参考索引准确地指代正确的参考图片。
如上文所指出,可使用长期参考图片的POC值来发信长期参考图片。POC值大体上对应于指示图片的显示次序(也被称作输出次序)的数据,所述显示次序不必与解码次序(也被称作位流次序)相同。长期参考图片的POC值可仅使用最低有效位(LSB)来发信。可不定期发信表示MSB的数据,例如,在两个或两个以上长期参考图片具有相同LSB时发信。在一些情形中,甚至当图片中得以发信MSB数据的至少两个图片具有不同LSB时,视频编码器20仍可确定需要对两个(或两个以上)图片发信表示MSB的数据。
根据本发明的技术,视频编码器20可将表示MSB的数据作为差而发信(例如,一组MSB与另一组MSB之间的差)。例如,如上文关于表1所论述的,视频编码器20可计算基本MSB值与长期参考图片的MSB值之间的差。熵编码单元56可将此差作为表示长期参考图片的MSB的值而发信。基本MSB值可对应于当前图片的POC值的MSB。替代地,基本MSB值可对应于另一图片(例如,瞬时解码器再新(IDR)图片)的POC值的MSB。
在编码长期参考图片的差值之后,熵编码单元56可计算另一长期参考图片的POC值的MSB与先前长期参考图片的POC值的MSB之间的差。类似地,熵编码单元56可对后续长期参考图片发信此第二差值,使得例如视频解码器30的视频解码器可重构建所述后续长期参考图片的POC值的MSB。以此方式,视频编码器20可经配置以将表示长期参考图片的POC值的MSB的数据编码为差值,例如,相对于基本MSB值或相对于其它长期参考图片的POC值的先前编码的MSB。此外,甚至在POC值的LSB不同时,视频编码器20也可发信这些差值。
如上文所论述,在一些实例中,视频编码器20可经配置以针对表示一或多个长期参考图片的POC值的MSB与基本MSB值(或其它参考MSB)之间的差的差值编码负整数值。例如,当熵编码单元56(或视频编码器20的另一单元)确定当前图片的POC值等于MaxPicOrderCntLsb*N-1,且POC值等于MaxPicOrderCntLsb*N的图片为得以发信delta_poc_msb_cycle_lt[i]的第一LTRP时,熵编码单元56可针对LTRP的POC值的MSB译码值-1。
另外,或在替代方案中,视频编码器20可经配置以至少部分基于当前存储于参考图片集(或解码图片缓冲器)中的参考图片的总数目和/或当前存储于参考图片集(或解码图片缓冲器)中的短期参考图片的数目来编码表示长期参考图片的POC值的数据。例如,视频编码器20可经配置以基于参考图片集(或解码图片缓冲器)中是否存在具有与长期参考图片相同POC LSB值的任何其它长期参考图片来确定是否对所述长期参考图片发信POCMSB循环值。因此,当参考图片集中仅存在具有与所述长期参考图片相同POC LSB的一或多个短期参考图片时,视频编码器20可避免编码所述长期参考图片的POC MSB循环值。
另外,或在替代方案中,当解码图片缓冲器中存在具有与长期参考图片的POC值相同LSB的N个长期参考图片时,且当视频编码器20已编码所述长期参考图片中的N-1个图片的ΔPOC MSB循环值时,视频编码器20可确定不译码所述长期参考图片的ΔPOC MSB循环值。
作为由运动估计单元42和运动补偿单元44执行的帧间预测(如上文所描述)的替代,帧内预测单元46可帧内预测当前块。明确地说,帧内预测单元46可确定待用以编码当前块的帧内预测模式。在一些实例中,帧内预测单元46可(例如)在单独的编码遍次期间使用各种帧内预测模式来编码当前块,且帧内预测单元46(或在一些实例中,模式选择单元40)可从所测试的模式选择适当帧内预测模式来使用。
例如,帧内预测单元46可使用对各种经测试的帧内预测模式的位率-失真分析而计算位率-失真值,且在经测试模式当中选择具有最佳位率-失真特性的帧内预测模式。位率-失真分析大体上确定经编码块与经编码以产生所述经编码块的原始未经编码块之间的失真(或误差)的量以及用以产生经编码块的位率(即,位数目)。帧内预测单元46可从失真和位率计算各种经编码块的比率来确定哪一帧内预测模式展现块的最佳位率-失真值。
在选择块的帧内预测模式之后,帧内预测单元46可向熵编码单元56提供指示所述块的选定帧内预测模式的信息。熵编码单元56可编码指示选定帧内预测模式的信息。视频编码器20可在经传输的位流配置数据中包含各种块的编码上下文的定义和用于所述上下文中的每一者的最有可能的帧内预测模式、帧内预测模式索引表和经修改的帧内预测模式索引表的指示,所述位流配置数据可包含多个帧内预测模式索引表和多个经修改的帧内预测模式索引表(也被称作码字映射表)。
视频编码器20通过从正被译码的原始视频块减去来自模式选择单元40的预测数据而形成残余视频块。求和器50表示执行此减法运算的一或多个组件。变换处理单元52将例如离散余弦变换(DCT)或概念上类似的变换的变换应用于残余块,从而产生包括残余变换系数值的视频块。变换处理单元52可执行概念上类似于DCT的其它变换。也可使用小波变换、整数变换、子频带变换或其它类型的变换。在任何状况下,变换处理单元52将变换应用于残余块,从而产生残余变换系数的块。所述变换可将残余信息从像素值域转换到变换域(例如频域)。变换处理单元52可将所得的变换系数发送到量化单元54。量化单元54量化所述变换系数以进一步减少位率。所述量化过程可减少与所述系数中的一些或所有系数相关联的位深度。可通过调整量化参数而修改量化程度。在一些实例中,量化单元54可接着执行对包含经量化变换系数的矩阵的扫描。替代地,熵编码单元56可执行所述扫描。
在量化之后,熵编码单元56译码所述经量化变换系数熵。例如,熵编码单元56可执行上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)、基于语法的上下文自适应二进制算术译码(SBAC)、概率区间分割熵(PIPE)译码或另一熵译码技术。在基于上下文的熵译码的状况下,上下文可基于相邻块。在由熵编码单元56进行熵译码之后,可将经编码位流传输到另一装置(例如,视频解码器30)或经封存以供稍后传输或检索。
反量化单元58和反变换单元60分别应用反量化和反变换,以在像素域中重构建残余块,(例如)以供稍后用作参考块。运动补偿单元44可通过将所述残余块添加到参考图片存储器64的帧中的一者的预测性块来计算参考块。运动补偿单元44也可将一或多个内插滤波器应用于经重构建残余块以计算供在运动估计中使用的次整数像素值。求和器62将所述经重构建残余块添加到由运动补偿单元44产生的经运动补偿的预测块以产生经重构建视频块以供存储于参考图片存储器64中。所述经重构建视频块可由运动估计单元42和运动补偿单元44用作参考块以帧间译码后续视频帧中的块。
图2的视频编码器20表示视频编码器的实例,所述视频编码器可经配置以译码视频数据的当前图片的数据,其中经译码数据表示当前图片的长期参考图片的图片次序计数(POC)最高有效位(MSB)循环的负整数值,以及至少部分基于所述MSB循环的所述负整数值而译码当前图片中与长期参考图片有关的至少一部分。
图2的视频编码器20也表示视频编码器的实例,所述视频编码器可(另外或替代地)经配置以:编码视频数据的当前图片的与第一长期参考图片有关的至少第一部分和所述当前图片的与第二长期参考图片有关的至少第二部分;编码第一值,所述第一值表示所述视频数据的当前图片的图片次序计数(POC)值的基本最高有效位(MSB)值与所述视频数据的所述第一长期参考图片的第一POC值的第一MSB值之间的差;以及编码第二值,所述第二值表示所述视频数据的所述第二长期参考图片的第二POC值的第二MSB值与第一MSB值之间的差,其中所述第一POC值与所述第二POC值具有不同的最低有效位(LSB)值。
图2的视频编码器20也表示视频编码器的实例,所述视频编码器可(另外或替代地)经配置以:针对当前图片确定可用参考图片的总数目中的标记为短期参考图片的参考图片的数目;基于参考图片的所述总数目和标记为短期参考图片的参考图片的数目而译码所述当前图片的长期参考图片的最高有效位(MSB)值;以及译码所述当前图片中与所述可用参考图片中的至少一者有关的至少一部分。
图2的视频编码器20也表示视频编码器的实例,所述视频编码器可(另外或替代地)经配置以:确定当前图片中图片次序计数(POC)值具有相等最低有效位(LSB)值的数目N个参考图片;确定所述当前图片的参考图片集可包含N个长期参考图片;以及基于所述确定而针对所述长期参考图片中的最多N-1者译码ΔPOC最高有效位(MSB)循环值。
图3为说明视频解码器30的实例的框图,所述视频解码器30可实施用于切片标头中的长期参考图片的改善式发信的技术。在图3的实例中,视频解码器30包含熵解码单元70、运动补偿单元72、帧内预测单元74、反量化单元76、反变换单元78、参考图片存储器82和求和器80。在一些实例中,视频解码器30可执行与关于视频编码器20(图2)所描述的编码遍次大体上互逆的解码遍次。运动补偿单元72可基于从熵解码单元70接收的运动向量而产生预测数据,而帧内预测单元74可基于从熵解码单元70接收的帧内预测模式指示符而产生预测数据。
在解码过程期间,视频解码器30从视频编码器20接收表示经编码视频切片的视频块和相关联语法元素的经编码视频位流。视频解码器30的熵解码单元70熵解码所述位流,以产生经量化系数、运动向量或帧内预测模式指示符和其它语法元素。熵解码单元70将运动向量和其它语法元素转发到运动补偿单元72。视频解码器30可在视频切片层级和/或视频块层级接收语法元素。
当视频切片经译码为帧内译码(I)切片时,帧内预测单元74可基于所发信的帧内预测模式和来自当前帧或图片的先前经解码块的数据而产生当前视频切片的视频块的预测数据。当视频帧经译码为帧间译码(即,B、P或GPB)切片时,运动补偿单元72基于从熵解码单元70接收的运动向量和其它语法元素产生当前视频切片的视频块的预测性块。可从参考图片列表中的一者内的参考图片中的一者产生所述预测性块。视频解码器30可基于存储于参考图片存储器82中的参考图片使用默认构造技术构建所述参考图片列表(列表0和列表1)。
视频解码器30可确定参考图片集,其中视频解码器30可从所述参考图片集而构建参考图片列表。在一些实例中,例如,当视频解码器30符合HEVC时,视频解码器30可根据HEVC WD7的章节8.3.3而构建参考图片列表。参考图片集大体上对应于当前存储于经解码图片缓冲器中(例如,参考图片存储器82内)的参考图片。参考图片集的某些参考图片可标记为短期参考图片,而参考图片集的其它参考图片可标记为长期参考图片。一般来说,长期参考图片标记为(例如)在囊封参考图片的经译码视频数据的网络提取层(NAL)单元的NAL单元标头中“用于长期参考”。
根据本发明的技术,视频解码器30可经配置以使用差分译码来解码用于长期参考图片的识别符。例如,对于第一长期参考图片(例如,图片序列中索引值为0的长期参考图片),视频解码器30可解码指示长期参考图片的POC MSB与当前图片的POC MSB之间的差的差值。当前图片的POC MSB可被称作“基本MSB”。对于其它长期参考图片(例如,所述图片序列中索引值大于0的长期参考图片),视频解码器30可解码指示长期参考图片的POC MSB与先前长期参考图片的POC MSB之间的差的差值。假设POC MSB当前正经确定的长期参考图片的索引值为i,视频解码器30可参考索引值为0与i-1之间任一值(0与i-1包含在内)的长期参考图片的POC MSB来确定所述POC MSB。即,视频解码器30可参考索引值为j的长期参考图片的POC MSB,其中j介于0与i-1之间(0与i-1包含在内)。在一些情况中,差值可具有负整数值。
在接收描述长期参考图片的POC MSB之间的差的差值之后,视频解码器30可确定所述差值所应用的POC MSB值(即,将所述差值与所述POC MSB值相加,以重构建所述长期参考图片的POC MSB)。例如,如果长期参考图片的索引值为0(指示所述长期参考图片为图片序列中的序数第一长期参考图片),那么视频解码器30可将当前图片的POC MSB值用作基本MSB值,且将对长期参考图片发信的差值与所述基本MSB值相加。作为另一实例,如果长期参考图片的索引值大于0(指示所述长期参考图片并非所述图片序列中的序数第一长期参考图片),假设索引值为i,那么视频解码器30可将所发信的差值与索引值为i-1的长期参考图片的POC MSB相加。
以此方式,视频解码器30可解码第一值,所述第一值表示视频数据的当前图片的图片次序计数(POC)值的基本最高有效位(MSB)值与所述视频数据的第一长期参考图片的第一POC值的第一MSB值之间的差,以及解码第二值,所述第二值表示所述视频数据的第二长期参考图片的第二POC值的第二MSB值与所述第一MSB值之间的差,其中所述第一POC值与所述第二POC值具有不同的最低有效位(LSB)值。类似地,视频解码器30可使用所述第一值(即,第一差值)将第一长期参考图片的第一MSB循环值计算为DeltaPocMSBCycleLt[i-1],和将第二长期参考图片的第二MSB循环值计算为DeltaPocMSBCycleLt[i],其中计算所述第二MSB循环值包括基于DeltaPocMSBCycleLt[i-1]与所述第二值(即,第二差值)而计算DeltaPocMSBCycleLt[i]。
另外,视频解码器30可解码长期参考图片的POC值的LSB。LSB可在当前图片的切片的切片标头、包含当前图片的序列的序列参数集(SPS)、当前图片的图片参数集(PPS)中或在别处发信。视频解码器30可串接长期参考图片的POC值的MSB与LSB,以确定长期参考图片的完整POC值。接着,视频解码器30可组译包含POC值所识别的长期参考图片的参考图片列表。以此方式,视频解码器30可使用运动信息(例如,识别参考图片列表与参考索引的数据)以执行帧间预测。例如,如下文所解释,运动补偿单元72可至少部分基于对应于参考图片列表中的一者中的图片中的一者的识别参考图片的运动信息来确定当前图片的块的参考块。所述参考图片可对应于长期参考图片中的一者,或对应于短期参考图片。
运动补偿单元72通过剖析运动向量和其它语法元素来确定用于当前视频切片的视频块的预测信息,且使用所述预测信息以产生正经解码的当前视频块的预测性块。例如,运动补偿单元72使用所接收的语法元素中的一些来确定用以译码视频切片的视频块的预测模式(例如,帧内预测或帧间预测)、帧间预测切片类型(例如,B切片、P切片或GPB切片)、切片的参考图片列表中的一或多者的构建信息、切片的每一经帧间编码视频块的运动向量、切片的每一经帧间译码视频块的帧间预测状态,和用以解码当前视频切片中的视频块的其它信息。
运动补偿单元72也可基于内插滤波器执行内插。运动补偿单元72可使用如由视频编码器20在视频块的编码期间使用的内插滤波器,以计算参考块的次整数像素的内插值。在此状况下,运动补偿单元72可从接收的语法元素来确定由视频编码器20使用的内插滤波器,且使用所述内插滤波器来产生预测性块。
反量化单元76反量化(即,解量化)提供于位流中且由熵解码单元70解码的经量化变换系数。反量化过程可包含使用由视频解码器30针对视频切片中的每一视频块计算的量化参数QPY来确定量化的程度和同样地应应用的反量化的程度。反变换单元78将反变换(例如,反DCT、反整数变换或概念上类似的反变换过程)应用于变换系数,以便在像素域中产生残余块。
在运动补偿单元72基于运动向量和其它语法元素产生当前视频块的预测性块之后,视频解码器30通过将来自反变换单元78的残余块与由运动补偿单元72产生的对应预测性块求和而形成经解码视频块。求和器80表示执行此加法运算的一或多个组件。如果需要,也可应用解块滤波器来滤波经解码块以便去除方块效应伪影。其它回路滤波器(译码回路中或译码回路后)也可用以使像素转变平滑,或以其它方式改善视频质量。接着将给定帧或图片中的经解码视频块存储于参考图片存储器82中,所述参考图片存储器82存储用于后续运动补偿的参考图片。参考图片存储器82也存储经解码视频,用于稍后呈现于显示装置上(例如,图1的显示装置32)。
以此方式,图3的视频解码器30表示视频解码器的实例,所述视频解码器经配置以:解码第一值,所述第一值表示视频数据的当前图片的图片次序计数(POC)值的基本最高有效位(MSB)值与所述视频数据的第一长期参考图片的第一POC值的第一MSB值之间的差;解码第二值,所述第二值表示所述视频数据的第二长期参考图片的第二POC值的第二MSB值与所述第一MSB值之间的差,其中所述第一POC值与所述第二POC值具有不同的最低有效位(LSB)值;以及解码所述视频数据的当前图片中与使用所述第一值的所述第一长期参考图片和使用所述第一值与所述第二值的所述第二长期参考图片中的至少一者有关的至少一部分。
图3的视频解码器30也表示视频解码器的实例,所述视频解码器30可(另外或替代地)经配置以解码视频数据的当前图片的数据,其中经解码数据表示与当前图片有关的长期参考图片的图片次序计数(POC)最高有效位(MSB)循环的负整数值,且至少部分基于所述MSB循环的所述负整数值来解码当前图片中与长期参考图片有关的至少一部分。
图3的视频解码器30也表示视频解码器的实例,所述视频解码器可(另外或替代地)经配置以:针对当前图片确定可用参考图片的总数目中的标记为短期参考图片的参考图片的数目;基于参考图片的所述总数目和标记为短期参考图片的参考图片的所述数目,解码所述当前图片的长期参考图片的最高有效位(MSB)值;以及解码所述当前图片中与所述可用参考图片中的至少一者有关的至少一部分。
图3的视频解码器30也表示视频解码器的实例,所述视频解码器可(另外或替代地)经配置以:确定当前图片中图片次序计数(POC)值具有相等最低有效位(LSB)值的数目N个参考图片;确定参考图片集可包含N个长期参考图片;以及基于所述确定而针对所述长期参考图片中的最多N-1者解码ΔPOC最高有效位(MSB)循环值。
图4为说明经译码视频图片100到132的序列的概念图。所述图片具有不同阴影,以指示阶层式预测结构内的位置。例如,图片100、116和132具有黑色阴影,以表示图片100、116和132位于阶层式预测结构的顶部。图片100、116和132可包括(例如)以单一方向从其它图片预测的经帧内译码的图片或经帧间译码的图片(例如,P图片)。当进行帧内译码时,图片100、116、132仅从同一图片内的数据中预测。当进行帧间译码时,如从图片116到图片100的虚线箭头所指示,图片116(例如)可关于图片100的数据进行译码。图片116、132分别形成图片群组(GOP)134、136的关键图片。
图片108、124具有深阴影,以指示所述图片接着在编码阶层中位于图片100、116和132之后。图片108、124可包括经双向帧间模式预测编码的图片。例如,图片108可从图片100和116的数据而预测,而图片124可从图片116和132而预测。图片104、112、120和128具有浅阴影,以指示所述图片接着在编码阶层中位于图片108与124之后。图片104、112、120和128也可包括经双向帧间模式预测编码的图片。例如,图片104可从图片100和108而预测,图片112可从图片108和116而预测,图片120可从图片116和124而预测,且图片128可从图片124和132而预测。一般来说,阶层中较低的图片可从阶层中较高的任何参考图片而编码,假设所述参考图片仍在解码图片缓冲器中缓冲,且假设所述参考图片相比当前正经译码的图片更早地进行译码。
最后,图片102、106、110、114、118、122、126和130具有白色阴影,以指示这些图片在编码阶层位于最后。图片102、106、110、114、118、122、126和130可为经双向帧间模式预测编码的图片。图片102可从图片100和104而预测,图片106可从图片104和108而预测,图片110可从图片108和112而预测,图片114可从图片112和116而预测,图片118可从图片116和120而预测,图片122可从图片120和124而预测,图片126可从图片124和128而预测,且图片130可从图片128和132而预测。此外,应理解,译码阶层中较低的图片可从译码阶层中较高的其它图片而译码。例如,另外或在替代方案中,图片102、106、110或114中的任一者或全部可相对于图片100、116或108中的任一者而预测。
图片100到132是以显示次序进行说明。即,继解码之后,图片100显示于图片102之前,图片102显示于图片104之前,等等。如上文所论述,POC值大体上描述图片的显示次序,所述显示次序也实质上与原图片被编码之前经俘获或产生的次序相同。然而,归因于编码阶层,图片100到132可以不同次序进行解码。此外,在进行编码时,图片100到132可以解码次序而布置于包含图片100到132的经编码数据的位流中。例如,在GOP 134的图片中,图片116可最后一个显示。然而,归因于编码阶层,在GOP 134中,图片116可第一个解码。即,为了适当地解码图片108,例如,图片116可能需要第一个解码,以便充当图片108的参考图片。类似地,图片108可充当图片104、106、110和112的参考图片,且因此可能需要在图片104、106、110和112之前解码。
此外,某些图片可作为长期参考图片对待,而其它图片可作为短期参考图片对待。例如,假定图片100和116表示长期参考图片,而图片108、104和112表示短期参考图片。在此实例中,可能存在以下状况:图片102和106可关于图片100、116、108或104中的任一者进行预测,而图片110和114可关于图片100、116、108或112中的任一者进行预测。换句话说,图片104可能无法在译码图片110和114时用于参考。作为另一实例,假设图片100和116表示长期参考图片,且图片108、104和112表示短期参考图片,图片108、104和112可能无法在译码图片118、122、126和130时用于参考。
根据本发明的技术,可在用于图片100到132中的任一者或全部的切片的切片标头中发信与长期参考图片有关的数据。替代地,可在PPS、SPS或其它数据结构中发信数据。
再次假设,图片100和116表示长期参考图片,视频编码器20可将图片100的POCMSB编码为相对于基本MSB值(例如,例如图片102的当前图片的POC MSB)的差。即,视频编码器20可计算图片100的POC MSB与图片102的POC MSB之间的差,且编码图片100的差值。类似地,视频编码器20可计算图片116的POC MSB与图片100的POC MSB之间的差,且编码图片116的差值。视频编码器20也可编码图片100和116的LSB值。
因此,视频解码器30可通过解码图片100的差值,且将所述差值与图片102的基本MSB值相加,来重构建图片100和116的POC值。类似地,视频解码器30可解码图片116的差值,且将所述差值与图片100的POC MSB相加。视频解码器30也可解码图片100和116的POC LSB值。视频解码器30可串接图片100的POC MSB与图片100的POC LSB以再生图片100的POC值。类似地,视频解码器30可串接图片116的POC MSB与图片116的POC LSB以再生图片116的POC值。
以此方式,视频编码器20与视频解码器30两者可经配置以:译码第一值,所述第一值表示视频数据的当前图片的图片次序计数(POC)值的基本最高有效位(MSB)值与所述视频数据的第一长期参考图片的第一POC值的第一MSB值之间的差;译码第二值,所述第二值表示所述视频数据的第二长期参考图片的第二POC值的第二MSB值与所述第一MSB值之间的差,其中所述第一POC值与所述第二POC值具有不同的最低有效位(LSB)值;以及译码所述视频数据的当前图片中与使用所述第一值的所述第一长期参考图片和使用所述第一值与所述第二值的所述第二长期参考图片中的至少一者有关的至少一部分。
更确切来说,视频编码器20可编码表示待包含于当前图片(例如,图片102)的参考图片列表中的长期参考图片的POC值的数据。一般来说,视频编码器20可指示在当前图片的至少一部分关于参考图片而编码时,所述参考图片应包含于参考图片列表中。当图片的块关于参考图片而帧间编码,使得所述块的运动向量指向所述参考图片的参考块时,所述图片的一部分可视为关于所述参考图片编码。所述块的运动信息可包含参考图片列表识别符(例如,列表0或列表1),以及对应于由所述参考图片列表识别符所识别的参考图片列表中的参考图片的参考索引。
因此,视频编码器20可关于图片100的参考块而编码图片102的块。即,视频编码器20可对块执行运动搜索,且相对于其它参考块而确定图片100的参考块产生可接受的误差值。类似地,视频编码器20可关于图片116的参考块而编码图片102的不同块。
图5为根据本发明技术的说明用于编码长期参考图片的POC值的实例方法的流程图。出于解释的目的,图5的方法关于图1和2的视频编码器20和其组件而进行解释。然而,应理解,其它视频编码装置可经配置以执行图5的方法。
一开始,视频编码器20可使用一或多个参考图片来编码当前图片的数据(150)。接着,视频编码器20可确定用于编码当前图片的参考图片(152)。更确切来说,视频编码器20可确定一组可用参考图片中的实际上在编码当前图片时用于参考的参考图片。在一些实例中,可集成且实质上同时执行步骤150和152。可用参考图片可包含长期参考图片(LTRP)和短期参考图片(STRP)。视频编码器20可基于许多各种尝试译码遍次之后所获得的译码结果来确定将参考图片设定为长期参考图片抑或短期参考图片。例如,当译码结果(例如,位率-失真优化(RDO)度量)在特定参考图片被作为长期参考图片对待时大体上更好(潜在地偏移存储长期参考图片所消耗的存储器的量)时,视频编码器20可将那个参考图片作为长期参考图片对待。
在任何状况下,在确定一组参考图片和待作为长期参考图片处理的那些参考图片之后,视频编码器20可编码指示将作为长期参考图片包含于当前图片的参考图片列表中的图片的信息。经编码信息可包括表示长期参考图片的POC值的数据。视频编码器20可在当前图片的切片的切片标头、对应于当前图片的PPS、包含当前图片的序列的SPS中或在别处编码此信息。
视频编码器20可编码指示序数第一长期参考图片的POC值的MSB的数据以及指示序数第一长期参考图片的POC值的LSB的数据(154)。为了编码MSB,视频编码器20可计算第一长期参考图片的POC值的MSB与当前图片的POC值的MSB之间的差,且编码此计算出的差值。
接着,视频编码器20可确定后续LTRP的POC值的LSB是否等于当前图片的另一参考图片的POC值的LSB(156)。当视频编码器20确定后续LTRP的POC值的LSB等于当前图片的另一参考的POC值的LSB(156的“是”分支)时,视频编码器20可编码表示后续LTRP的POC值的MSB与先前LTRP(即,POC MSB信息经编码的最近LTRP)的POC值的MSB之间的差的数据(158)。最近LTRP的POC值的LSB不必与当前正经编码的LTRP的POC值的LSB相同。如上文所论述,为计算差值,假设后续LTRP具有索引值i,如果LTRP j为POC MSB信息经译码的先前LTRP,那么视频编码器20可计算LTRP i的POC值的MSB与LTRP j的POC值的MSB之间的差。接着,视频编码器20可编码所述差值。此差值可对应于delta_poc_msb_cycle_lt[i](或delta_poc_msb_cycle_lt_plus1[i])。
在编码差值之后,或当下一LTRP的POC值的LSB不等于另一参考图片的LSB(156的“否”分支)时,视频编码器20可译码LTRP的POC值的LSB(160)。接着,视频编码器20可确定是否存在当前图片的更多LTRP(162)。当存在当前图片的更多LTRP(162的“是”分支)时,视频编码器20可前进,以使用如上文所论述的差分译码来编码剩余LTRP的POC值的LSB和(在必要时)MSB。然而,当不存在当前图片的更多LTRP(162的“否”分支)时,视频编码器20可输出经编码数据(164),所述经编码数据可包含当前图片的经编码块、当前图片的长期参考图片的经编码POC值(包含LSB和当LSB并不唯一时,包含MSB的差值),和类似者。
以此方式,图5的方法表示方法的实例,所述方法包含:编码视频数据的当前图片的与第一长期参考图片有关的至少一第一部分和所述当前图片中的与第二长期参考图片有关的至少一第二部分;编码第一值,所述第一值表示所述视频数据的当前图片的图片次序计数(POC)值的基本最高有效位(MSB)值与所述视频数据的所述第一长期参考图片的第一POC值的第一MSB值之间的差;以及编码第二值,所述第二值表示所述视频数据的所述第二长期参考图片的第二POC值的第二MSB值与所述第一MSB值之间的差,其中所述第一POC值与所述第二POC值具有不同的最低有效位(LSB)值。
图6为根据本发明技术的说明用于解码长期参考图片的POC值的实例方法的流程图。出于解释的目的,图6的方法关于图1和图3的视频解码器30和其组件进行解释。然而,应理解,其它视频解码装置可经配置以执行图6的方法。
一开始,视频解码器30可解码当前图片的序数第一长期参考图片(LTRP)的POC值的MSB与LSB(200)。例如,视频解码器30可解码表示第一LTRP的POC值的MSB与当前图片的POC值的MSB之间的差的差值。接着,视频解码器30可将所述差值与当前图片的POC值的MSB相加,以获得第一LTRP的MSB。视频解码器30也可解码第一LTRP的POC值的LSB,且串接第一LTRP的POC值的MSB与LSB,以再生LTRP的POC值。视频解码器30也可在未发送MSB时仅解码第一LTRP的POC值的LSB,且可仅使用LSB值以识别是否不存在具有相同POC LSB值的其它参考图片。
接着,视频解码器30可解码下一个LTRP的POC值的LSB(202)。在图6的实例中,视频解码器30确定下一个LTRP的POC值的LSB是否等于当前图片的另一LTRP的LSB(204)。在(例如)如上文关于表1所解释的其它实例中,视频解码器30可确定旗标值是否指示对下一个LTRP的POC值发信MSB。在任何状况下,视频解码器30可确定是否对下一个LTRP的POC值发信MSB。当对下一个LTRP的POC值发信MSB时(例如,当下一个LTRP的POC值的LSB等于另一参考图片的LSB(204的“是”分支)时),视频解码器30可解码相对于先前LTRP的POC值的MSB的MSB差值(206)。即,视频解码器30可解码针对LTRP i发信的差值,且将所述差值与LTRP j的POC值的MSB相加,其中LTRP j为MSB信息得以解码的先前LTRP。视频解码器30可通过串接下一个LTRP的MSB(隐含地计算或确定)与LSB,来进一步重组译下一个LTRP的POC值。
在确定下一个LTRP的POC值的LSB不等于另一参考图片的LSB(204的“否”分支)之后,或在解码下一个LTRP的MSB的差值之后,视频解码器30可确定是否存在当前图片的更多LTRP(210)。如果存在当前图片的更多LTRP(210的“是”分支),那么视频解码器30可继续进行解码后续LTRP的POC值,例如,如上文所论述。一旦不存在当前图片的更多LTRP(210的“否”分支),视频解码器30便可组译包含经发信的LTRP的一或多个参考图片列表(212)。接着,视频解码器30可使用参考图片列表来解码当前图片(214)。
例如,当对块进行帧间预测时,所述块可包含参考图片列表的指示,和指示所述块的参考图片的所述参考图片列表的参考索引。所述块可进一步包含用于重构建所述块的运动向量的数据。因此,视频解码器30可使用运动向量而从参考图片中检索参考块。视频解码器30可(例如)通过解码块的变换系数、反量化和反变换来进一步解码块的误差值。接着,视频解码器30可组合参考块与经重构建的残余块,以解码所述块。
以此方式,图6的方法表示方法的实例,所述方法包含:解码第一值,所述第一值表示视频数据的当前图片的图片次序计数(POC)值的基本最高有效位(MSB)值与所述视频数据的第一长期参考图片的第一POC值的第一MSB值之间的差;解码第二值,所述第二值表示所述视频数据的第二长期参考图片的第二POC值的第二MSB值与所述第一MSB值之间的差,其中所述第一POC值与所述第二POC值具有不同的最低有效位(LSB)值;以及解码所述视频数据的当前图片中与使用所述第一值的所述第一长期参考图片和使用所述第一值与所述第二值的所述第二长期参考图片中的至少一者有关的至少一部分。
应认识到,取决于实例,本文中所描述的技术中的任一者的某些动作或事件可按照不同序列执行、可添加、合并或完全省略(例如,对于实践所述技术来说并非所有所描述的动作或事件皆系必要的)。此外,在某些实例中,可(例如)经由多线程处理、中断处理或多个处理器同时而非顺序地执行动作或事件。
在一或多个实例中,所描述的功能可以硬件、软件、固件或其任何组合来实施。如果以软件来实施,那么所述功能可作为一或多个指令或程序代码而存储于计算机可读媒体上或经由计算机可读媒体进行传输,且由基于硬件的处理单元执行。计算机可读媒体可包含计算机可读存储媒体(其对应于例如数据存储媒体的有形媒体)或通信媒体,通信媒体包含(例如)根据通信协议促进计算机程序从一处传送到另一处的任何媒体。以此方式,计算机可读媒体大体上可对应于(1)非暂时性的有形计算机可读存储媒体,或(2)例如信号或载波的通信媒体。数据存储媒体可为可由一或多个计算机或一或多个处理器存取以检索用于实施本发明中所描述的技术的指令、程序代码和/或数据结构的任何可用媒体。计算机程序产品可包含计算机可读媒体。
借助实例而非限制,这些计算机可读存储媒体可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置、快闪存储器,或可用以存储呈指令或数据结构的形式的所要程序代码且可由计算机存取的任何其它媒体。又,任何连接可适当地被称作计算机可读媒体。例如,如果使用同轴缆线、光缆、双绞线、数字用户线(DSL)或无线技术(例如,红外线、无线电和微波)而从网站、服务器或其它远端源传输指令,那么同轴缆线、光缆、双绞线、DSL或无线技术(例如,红外线、无线电和微波)包含于媒体的定义中。然而,应理解,计算机可读存储媒体和数据存储媒体不包含连接、载波、信号或其它暂时性媒体,而实情为,是有关非暂时性有形存储媒体。如本文中所使用,磁盘和光盘包含压缩光盘(CD)、激光光盘、光学光盘、数字影音光盘(DVD)、软盘和蓝光光盘,其中磁盘通常以磁性方式再生数据,而光盘通过激光以光学方式再生数据。以上各物的组合也应包含于计算机可读媒体的范围内。
可由例如一或多个数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其它等效集成或离散逻辑电路的一或多个处理器来执行指令。因此,本文中所使用的术语“处理器”可指前述结构或适于实施本文中所描述的技术的任何其它结构中的任一者。另外,在一些方面中,可将本文中所描述的功能性提供于经配置以用于编码和解码的专用硬件和/或软件模块内,或并入于组合式编解码器中。又,所述技术可完全实施于一或多个电路或逻辑元件中。
本发明的技术可以多种装置或设备实施,所述装置或设备包含无线手机、集成电路(IC)或IC集合(例如,芯片组)。在本发明中描述各种组件、模块或单元以强调经配置以执行所揭示技术的装置的功能方面,但未必需要由不同硬件单元来实现。相反地,如上文所描述,可将各种单元组合于编解码器硬件单元中,或由互操作性硬件单元的集合(包含如上文所描述的一或多个处理器)结合合适的软件和/或固件来提供所述单元。
已描述各种实例。这些和其它实例在以下权利要求书的范围内。

Claims (30)

1.一种解码视频数据的方法,所述方法包括:
解码第一值,所述第一值表示视频数据的当前图片的图片次序计数POC值的基本最高有效位MSB值与所述视频数据的第一长期参考图片的第一POC值的第一MSB值之间的差;
解码第二值,所述第二值表示所述视频数据的第二长期参考图片的第二POC值的第二MSB值与所述第一MSB值之间的差,其中所述第一POC值与所述第二POC值具有不同的最低有效位LSB值且所述第一MSB值不同于所述第二MSB值;以及
解码所述视频数据的当前图片中的与使用所述第一值的所述第一长期参考图片或使用所述第一值与所述第二值的所述第二长期参考图片中的至少一者有关的至少一部分。
2.根据权利要求1所述的方法,其进一步包括:
使用所述第一值将所述第一长期参考图片的第一MSB循环值计算为DeltaPocMSBCycleLt;以及
将所述第二长期参考图片的第二MSB循环值计算为DeltaPocMSBCycleLt,其中计算所述第二MSB循环值包括基于DeltaPocMSBCycleLt与所述第二值而计算DeltaPocMSBCycleLt。
3.根据权利要求1所述的方法,其中所述第一长期参考图片对应于索引j,其中所述第二长期参考图片对应于索引i,其中所述第一值包括delta_poc_msb_cycle_lt_plus1,其中所述第二值包括delta_poc_msb_cycle_lt_plus1,且其中j处于从包含0到包含i-1的范围中。
4.根据权利要求1所述的方法,其中所述第一值或所述第二值中的至少一者包括负整数值。
5.根据权利要求1所述的方法,其进一步包括至少部分基于标记为所述当前图片的短期参考图片的许多参考图片而确定所述第一POC值或所述第二POC值中的至少一者。
6.一种用于解码视频数据的装置,所述装置包括:
存储器,其经配置以存储视频数据;以及
视频解码器,其经配置以:解码第一值,所述第一值表示所述视频数据的当前图片的图片次序计数POC值的基本最高有效位MSB值与所述视频数据的第一长期参考图片的第一POC值的第一MSB值之间的差;解码第二值,所述第二值表示所述视频数据的第二长期参考图片的第二POC值的第二MSB值与所述第一MSB值之间的差,其中所述第一POC值与所述第二POC值具有不同的最低有效位LSB值且所述第一MSB值不同于所述第二MSB值;以及解码所述视频数据的当前图片中的与使用所述第一值的所述第一长期参考图片或使用所述第一值与所述第二值的所述第二长期参考图片中的至少一者有关的至少一部分。
7.根据权利要求6所述的装置,其中所述视频解码器经进一步配置以:使用所述第一值将所述第一长期参考图片的第一MSB循环值计算为DeltaPocMSBCycleLt[i-1];以及将所述第二长期参考图片的第二MSB循环值计算为DeltaPocMSBCycleLt,其中计算所述第二MSB循环值包括基于DeltaPocMSBCycleLt与所述第二值来计算DeltaPocMSBCycleLt。
8.根据权利要求6所述的装置,其中所述第一长期参考图片对应于索引i-1,其中所述第二长期参考图片对应于索引i,其中所述第一值包括delta_poc_msb_cycle_lt_plus1,且其中所述第二值包括delta_poc_msb_cycle_lt_plus1。
9.根据权利要求6所述的装置,其中所述第一值或所述第二值中的至少一者包括负整数值。
10.根据权利要求6所述的装置,其中所述视频解码器经进一步配置以:至少部分基于标记为所述当前图片的短期参考图片的许多参考图片来确定所述第一POC值或所述第二POC值中的至少一者。
11.一种用于解码视频数据的装置,所述装置包括:
用于解码第一值的装置,所述第一值表示视频数据的当前图片的图片次序计数POC值的基本最高有效位MSB值与所述视频数据的第一长期参考图片的第一POC值的第一MSB值之间的差;
用于解码第二值的装置,所述第二值表示所述视频数据的第二长期参考图片的第二POC值的第二MSB值与所述第一MSB值之间的差,其中所述第一POC值与所述第二POC值具有不同的最低有效位LSB值且所述第一MSB值不同于所述第二MSB值;以及
用于解码所述视频数据的当前图片中的与使用所述第一值的所述第一长期参考图片或使用所述第一值与所述第二值的所述第二长期参考图片中的至少一者有关的至少一部分的装置。
12.根据权利要求11所述的装置,其进一步包括:
用于使用所述第一值将所述第一长期参考图片的第一MSB循环值计算为DeltaPocMSBCycleLt的装置;以及
用于将所述第二长期参考图片的第二MSB循环值计算为DeltaPocMSBCycleLt的装置,其中计算所述第二MSB循环值包括基于DeltaPocMSBCycleLt与所述第二值来计算DeltaPocMSBCycleLt。
13.根据权利要求11所述的装置,其中所述第一长期参考图片对应于索引j,其中所述第二长期参考图片对应于索引i,其中所述第一值包括delta_poc_msb_cycle_lt_plus1,其中所述第二值包括delta_poc_msb_cycle_lt_plus1,且其中j处于从包含0到包含i-1的范围中。
14.根据权利要求11所述的装置,其中所述第一值或所述第二值中的至少一者包括负整数值。
15.根据权利要求11所述的装置,其进一步包括用于至少部分基于标记为所述当前图片的短期参考图片的许多参考图片来确定所述第一POC值或所述第二POC值中的至少一者的装置。
16.一种非暂时性计算机可读存储媒体,其上存储有指令,所述指令在被执行时使处理器:
解码第一值,所述第一值表示视频数据的当前图片的图片次序计数POC值的基本最高有效位MSB值与所述视频数据的第一长期参考图片的第一POC值的第一MSB值之间的差;
解码第二值,所述第二值表示所述视频数据的第二长期参考图片的第二POC值的第二MSB值与所述第一MSB值之间的差,其中所述第一POC值与所述第二POC值具有不同的最低有效位LSB值且所述第一MSB值不同于所述第二MSB值;以及
解码所述视频数据的当前图片中的与使用所述第一值的所述第一长期参考图片或使用所述第一值与所述第二值的所述第二长期参考图片中的至少一者有关的至少一部分。
17.根据权利要求16所述的非暂时性计算机可读存储媒体,其进一步包括使得所述处理器执行以下动作的指令:
使用所述第一值将所述第一长期参考图片的第一MSB循环值计算为DeltaPocMSBCycleLt;以及
将所述第二长期参考图片的第二MSB循环值计算为DeltaPocMSBCycleLt,其中计算所述第二MSB循环值包括基于DeltaPocMSBCycleLt与所述第二值来计算DeltaPocMSBCycleLt。
18.根据权利要求16所述的非暂时性计算机可读存储媒体,其中所述第一长期参考图片对应于索引j,其中所述第二长期参考图片对应于索引i,其中所述第一值包括delta_poc_msb_cycle_lt_plus1,其中所述第二值包括delta_poc_msb_cycle_lt_plus1,且其中j处于从0到包含i-1的范围中。
19.根据权利要求16所述的非暂时性计算机可读存储媒体,其中所述第一值或所述第二值中的至少一者包括负整数值。
20.根据权利要求16所述的非暂时性计算机可读存储媒体,其进一步包括使所述处理器执行以下操作的指令:至少部分基于标记为所述当前图片的短期参考图片的许多参考图片来确定所述第一POC值或所述第二POC值中的至少一者。
21.一种编码视频数据的方法,所述方法包括:
编码视频数据的当前图片中与第一长期参考图片有关的至少第一部分和所述当前图片中与第二长期参考图片有关的至少第二部分;
编码第一值,所述第一值表示所述视频数据的当前图片的图片次序计数POC值的基本最高有效位MSB值与所述视频数据的所述第一长期参考图片的第一POC值的第一MSB值之间的差;以及
编码第二值,所述第二值表示所述视频数据的所述第二长期参考图片的第二POC值的第二MSB值与所述第一MSB值之间的差,其中所述第一POC值与所述第二POC值具有不同的最低有效位LSB值且所述第一MSB值不同于所述第二MSB值。
22.根据权利要求21所述的方法,其进一步包括:
将所述第一值计算为所述第一长期参考图片的作为DeltaPocMSBCycleLt的第一MSB循环值与所述基本MSB值之间的差;以及
将所述第二值计算为所述第二长期参考图片的作为DeltaPocMSBCycleLt的第二MSB循环值与所述第一MSB值之间的差。
23.根据权利要求21所述的方法,其中所述第一长期参考图片对应于索引j,其中所述第二长期参考图片对应于索引i,其中所述第一值包括delta_poc_msb_cycle_lt_plus1,其中所述第二值包括delta_poc_msb_cycle_lt_plus1,且其中j处于从包含0到包含i-1的范围中。
24.根据权利要求21所述的方法,其中所述第一值或所述第二值中的至少一者包括负整数值。
25.根据权利要求21所述的方法,其中编码所述第一值与编码所述第二值包括至少部分基于标记为所述当前图片的短期参考图片的许多参考图片来编码所述第一值且编码所述第二值。
26.一种用于编码视频数据的装置,所述装置包括:
存储器,其经配置以存储视频数据;以及
视频编码器,其经配置以编码所述视频数据的当前图片中与第一长期参考图片有关的至少第一部分和所述当前图片中与第二长期参考图片有关的至少第二部分;编码第一值,所述第一值表示所述视频数据的当前图片的图片次序计数POC值的基本最高有效位MSB值与所述视频数据的所述第一长期参考图片的第一POC值的第一MSB值之间的差;以及编码第二值,所述第二值表示所述视频数据的所述第二长期参考图片的第二POC值的第二MSB值与所述第一MSB值之间的差,其中所述第一POC值与所述第二POC值具有不同的最低有效位LSB值且所述第一MSB值不同于所述第二MSB值。
27.根据权利要求26所述的装置,其中所述视频编码器经配置以:将所述第一值计算为所述第一长期参考图片的作为DeltaPocMSBCycleLt的第一MSB循环值与所述基本MSB值之间的差;以及将所述第二值计算为所述第二长期参考图片的作为DeltaPocMSBCycleLt的第二MSB循环值与所述第一MSB值之间的差。
28.根据权利要求26所述的装置,其中所述第一长期参考图片对应于索引j,其中所述第二长期参考图片对应于索引i,其中所述第一值包括delta_poc_msb_cycle_lt_plus1,其中所述第二值包括delta_poc_msb_cycle_lt_plus1,且其中j处于从包含0到包含i-1的范围中。
29.根据权利要求26所述的装置,其中所述第一值或所述第二值中的至少一者包括负整数值。
30.根据权利要求26所述的装置,其中为了编码所述第一值与所述第二值,所述视频编码器经配置以至少部分基于标记为所述当前图片的短期参考图片的许多参考图片来编码所述第一值与所述第二值。
CN201380034109.0A 2012-06-28 2013-06-24 对视频译码发信长期参考图片 Active CN104412599B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201261665784P 2012-06-28 2012-06-28
US61/665,784 2012-06-28
US13/924,016 US9332255B2 (en) 2012-06-28 2013-06-21 Signaling long-term reference pictures for video coding
US13/924,016 2013-06-21
PCT/US2013/047367 WO2014004391A1 (en) 2012-06-28 2013-06-24 Signaling long-term reference pictures for video coding

Publications (2)

Publication Number Publication Date
CN104412599A CN104412599A (zh) 2015-03-11
CN104412599B true CN104412599B (zh) 2018-02-06

Family

ID=49778158

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201380034109.0A Active CN104412599B (zh) 2012-06-28 2013-06-24 对视频译码发信长期参考图片

Country Status (25)

Country Link
US (1) US9332255B2 (zh)
EP (1) EP2868081B1 (zh)
JP (1) JP6239609B2 (zh)
KR (1) KR101719930B1 (zh)
CN (1) CN104412599B (zh)
AR (1) AR093754A1 (zh)
AU (1) AU2013280659B2 (zh)
BR (1) BR112014032473B1 (zh)
CA (1) CA2875713C (zh)
DK (1) DK2868081T3 (zh)
ES (1) ES2736312T3 (zh)
HK (1) HK1204185A1 (zh)
HU (1) HUE044918T2 (zh)
IL (1) IL235969A (zh)
MY (1) MY181793A (zh)
PH (1) PH12014502731B1 (zh)
PL (1) PL2868081T3 (zh)
PT (1) PT2868081T (zh)
RU (1) RU2642361C2 (zh)
SG (1) SG11201408111UA (zh)
SI (1) SI2868081T1 (zh)
TW (1) TWI558179B (zh)
UA (1) UA116214C2 (zh)
WO (1) WO2014004391A1 (zh)
ZA (1) ZA201500618B (zh)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130188709A1 (en) 2012-01-25 2013-07-25 Sachin G. Deshpande Video decoder for tiles with absolute signaling
US9979958B2 (en) 2012-04-20 2018-05-22 Qualcomm Incorporated Decoded picture buffer processing for random access point pictures in video sequences
US9479776B2 (en) * 2012-07-02 2016-10-25 Qualcomm Incorporated Signaling of long-term reference pictures for video coding
US10194146B2 (en) 2013-03-26 2019-01-29 Qualcomm Incorporated Device and method for scalable coding of video information
US10356426B2 (en) * 2013-06-27 2019-07-16 Google Llc Advanced motion estimation
US9510001B2 (en) 2013-07-09 2016-11-29 Electronics And Telecommunications Research Institute Video decoding method and apparatus using the same
US9848199B2 (en) * 2014-03-17 2017-12-19 Qualcomm Incorporated Device and method for scalable coding of video information
US11595652B2 (en) * 2019-01-28 2023-02-28 Op Solutions, Llc Explicit signaling of extended long term reference picture retention
US11985318B2 (en) * 2015-12-24 2024-05-14 OP Solultions, LLC Encoding video with extended long term reference picture retention
US11736687B2 (en) 2017-09-26 2023-08-22 Qualcomm Incorporated Adaptive GOP structure with future reference frame in random access configuration for video coding
WO2020112488A1 (en) * 2018-11-30 2020-06-04 Futurewei Technologies, Inc. Signaling of reference picture lists in video coding
US10904545B2 (en) * 2018-12-26 2021-01-26 Tencent America LLC Method for syntax controlled decoded picture buffer management
CN113615184B (zh) * 2019-01-28 2024-08-09 Op方案有限责任公司 扩展长期参考图片保留的显式信令
CN119052469A (zh) * 2019-01-28 2024-11-29 Op方案有限责任公司 扩展长期参考图片保留的在线和离线选择
US11109041B2 (en) * 2019-05-16 2021-08-31 Tencent America LLC Method and apparatus for video coding
US20240146994A1 (en) * 2022-11-01 2024-05-02 Qualcomm Incorporated Identifying and marking video data units for network transport of video data

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2381403B (en) 2000-05-10 2004-12-01 Picturetel Corp Video coding using multiple buffers
MY134659A (en) * 2002-11-06 2007-12-31 Nokia Corp Picture buffering for prediction references and display
US20050008240A1 (en) * 2003-05-02 2005-01-13 Ashish Banerji Stitching of video for continuous presence multipoint video conferencing
FR2874292B1 (fr) 2004-08-10 2007-01-26 Thales Sa Procede de mise en forme de trames d'une sequence video
KR101368493B1 (ko) 2006-10-13 2014-02-28 톰슨 라이센싱 멀티뷰 비디오 코딩을 위한 참조 화상 목록 관리 구문
US8494049B2 (en) * 2007-04-09 2013-07-23 Cisco Technology, Inc. Long term reference frame management with error video feedback for compressed video communication
US9210480B2 (en) 2007-12-20 2015-12-08 Broadcom Corporation Video processing system with layered video coding and methods for use therewith
US9237355B2 (en) * 2010-02-19 2016-01-12 Qualcomm Incorporated Adaptive motion resolution for video coding
EP2630799A4 (en) 2010-10-20 2014-07-02 Nokia Corp METHOD AND DEVICE FOR VIDEO ENCODING AND DECODING
KR101631774B1 (ko) * 2011-06-30 2016-06-24 텔레폰악티에볼라겟엘엠에릭슨(펍) 절대 또는 명확한 레퍼러스 픽처 시그널링
CN102256125B (zh) * 2011-07-14 2013-06-05 北京工业大学 面向高效视频编码hevc基于上下文的自适应算数编码方法
US9432665B2 (en) * 2011-12-02 2016-08-30 Qualcomm Incorporated Coding least significant bits of picture order count values identifying long-term reference pictures

Also Published As

Publication number Publication date
ZA201500618B (en) 2017-01-25
TW201408082A (zh) 2014-02-16
JP2015526026A (ja) 2015-09-07
AU2013280659B2 (en) 2017-10-05
SI2868081T1 (sl) 2019-06-28
AR093754A1 (es) 2015-06-24
HUE044918T2 (hu) 2019-11-28
JP6239609B2 (ja) 2017-11-29
IL235969A0 (en) 2015-01-29
CA2875713C (en) 2019-09-24
SG11201408111UA (en) 2015-01-29
PL2868081T3 (pl) 2019-10-31
ES2736312T3 (es) 2019-12-27
MY181793A (en) 2021-01-07
AU2013280659A1 (en) 2015-01-15
DK2868081T3 (da) 2019-07-22
PH12014502731A1 (en) 2015-02-02
UA116214C2 (uk) 2018-02-26
IL235969A (en) 2017-04-30
CN104412599A (zh) 2015-03-11
EP2868081B1 (en) 2019-04-17
RU2642361C2 (ru) 2018-01-24
CA2875713A1 (en) 2014-01-03
TWI558179B (zh) 2016-11-11
HK1204185A1 (zh) 2015-11-06
KR20150036218A (ko) 2015-04-07
KR101719930B1 (ko) 2017-03-24
US20140003538A1 (en) 2014-01-02
BR112014032473B1 (pt) 2023-04-25
PH12014502731B1 (en) 2018-04-13
PT2868081T (pt) 2019-07-23
BR112014032473A2 (pt) 2017-06-27
WO2014004391A1 (en) 2014-01-03
EP2868081A1 (en) 2015-05-06
RU2015102618A (ru) 2016-08-20
US9332255B2 (en) 2016-05-03

Similar Documents

Publication Publication Date Title
CN104412599B (zh) 对视频译码发信长期参考图片
CN104396257B (zh) 在视频译码中长期参考图片的随机存取和发信
CN105493507B (zh) 用于帧内块复制的残余预测
CN105474645B (zh) 对视频数据进行解码的方法、对视频数据进行编码的方法、视频解码装置及视频编码装置
CN104685887B (zh) 于视频译码中发信用于操作点的层识别符
CN107211124B (zh) 用于译码视频数据的方法、装置和计算机可读存储媒体
CN105284113B (zh) 分量间滤波
CN104380747B (zh) 视频译码中的参数集更新
CN106464919B (zh) 用于编码和解码具有视频数据的多层位流的方法和装置
CN104396265B (zh) 在视频译码中从清晰随机存取图片的全面随机存取
CN104704843B (zh) 视频性质的指示
CN104365106B (zh) 发信用于视频译码的长期参考图片的数据
CN104221380A (zh) 用于并行运动估计的共同空间候选块
CN108353167A (zh) 译码视频数据的正负号信息
CN104969555A (zh) 在视频译码中具有时间可扩缩性支持的渐进式改进
CN106464917A (zh) 用信号表示用于位流分区的hrd参数
CN109196869A (zh) 帧内预测模式的基于邻近的发信号
CN106664425A (zh) 视频译码中的跨分量预测
CN106105203A (zh) 块自适应颜色空间转换译码
CN105474646B (zh) 子pu级先进残余预测
CN107787583A (zh) 在块内复制模式中的参考图片列表构建
CN106105206A (zh) 用于使用置零系数的低复杂度正变换的系统和方法
CN104205835B (zh) 导出最末位置译码的上下文以供视频译码
CN105723707A (zh) 用于视频译码的色彩残差预测
CN104509113A (zh) 视频压缩中的变换跳过模式

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1204185

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1204185

Country of ref document: HK

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20191025

Address after: Ai Erlandubailin

Patentee after: Verona Media International Limited

Address before: California, USA

Patentee before: Qualcomm Incorporated

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20211015

Address after: California, USA

Patentee after: QUALCOMM Inc.

Address before: Ai Erlandubailin

Patentee before: Willow Media International Ltd.