JP6286718B2 - 高効率な次世代ビデオコーディングのためのフレーム階層応答型量子化を使用する、コンテンツ適応ビットレートおよび品質管理 - Google Patents
高効率な次世代ビデオコーディングのためのフレーム階層応答型量子化を使用する、コンテンツ適応ビットレートおよび品質管理 Download PDFInfo
- Publication number
- JP6286718B2 JP6286718B2 JP2015551074A JP2015551074A JP6286718B2 JP 6286718 B2 JP6286718 B2 JP 6286718B2 JP 2015551074 A JP2015551074 A JP 2015551074A JP 2015551074 A JP2015551074 A JP 2015551074A JP 6286718 B2 JP6286718 B2 JP 6286718B2
- Authority
- JP
- Japan
- Prior art keywords
- frame
- frames
- buffer
- complexity
- bits
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000013139 quantization Methods 0.000 title claims description 181
- 230000003044 adaptive effect Effects 0.000 title claims description 157
- 239000000872 buffer Substances 0.000 claims description 410
- 238000000034 method Methods 0.000 claims description 229
- 238000004458 analytical method Methods 0.000 claims description 117
- 230000002123 temporal effect Effects 0.000 claims description 62
- 238000012545 processing Methods 0.000 claims description 40
- 230000000873 masking effect Effects 0.000 claims description 31
- 230000003068 static effect Effects 0.000 claims description 31
- 230000015572 biosynthetic process Effects 0.000 claims description 27
- 238000003786 synthesis reaction Methods 0.000 claims description 25
- 238000013507 mapping Methods 0.000 claims description 24
- 238000009499 grossing Methods 0.000 claims description 22
- 230000008859 change Effects 0.000 claims description 20
- 238000013459 approach Methods 0.000 claims description 18
- 230000004044 response Effects 0.000 claims description 15
- 238000012360 testing method Methods 0.000 claims description 13
- 238000012795 verification Methods 0.000 claims description 10
- 238000011049 filling Methods 0.000 claims description 8
- 238000012546 transfer Methods 0.000 claims description 5
- 239000012160 loading buffer Substances 0.000 claims 3
- 230000001419 dependent effect Effects 0.000 claims 1
- 238000005192 partition Methods 0.000 description 118
- 230000008569 process Effects 0.000 description 101
- 238000001914 filtration Methods 0.000 description 80
- 238000000638 solvent extraction Methods 0.000 description 39
- 238000004364 calculation method Methods 0.000 description 35
- 238000004422 calculation algorithm Methods 0.000 description 25
- 230000006870 function Effects 0.000 description 23
- 238000003860 storage Methods 0.000 description 20
- 238000010586 diagram Methods 0.000 description 13
- 238000009826 distribution Methods 0.000 description 12
- 238000002474 experimental method Methods 0.000 description 12
- 239000013598 vector Substances 0.000 description 12
- 230000006835 compression Effects 0.000 description 11
- 238000007906 compression Methods 0.000 description 11
- 238000004891 communication Methods 0.000 description 10
- 230000004927 fusion Effects 0.000 description 9
- 230000000670 limiting effect Effects 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 8
- 238000001514 detection method Methods 0.000 description 8
- 238000012986 modification Methods 0.000 description 8
- 230000004048 modification Effects 0.000 description 8
- 241000023320 Luma <angiosperm> Species 0.000 description 7
- 238000004590 computer program Methods 0.000 description 7
- 230000005055 memory storage Effects 0.000 description 7
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 7
- 230000009466 transformation Effects 0.000 description 7
- 230000009471 action Effects 0.000 description 6
- 238000012937 correction Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 230000000007 visual effect Effects 0.000 description 6
- 230000014509 gene expression Effects 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 230000002688 persistence Effects 0.000 description 4
- 230000002829 reductive effect Effects 0.000 description 4
- 239000013074 reference sample Substances 0.000 description 4
- 230000002441 reversible effect Effects 0.000 description 4
- 230000006978 adaptation Effects 0.000 description 3
- 230000000903 blocking effect Effects 0.000 description 3
- 230000003111 delayed effect Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 239000000523 sample Substances 0.000 description 3
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 2
- 238000007792 addition Methods 0.000 description 2
- 230000001186 cumulative effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 230000002427 irreversible effect Effects 0.000 description 2
- NUHSROFQTUXZQQ-UHFFFAOYSA-N isopentenyl diphosphate Chemical compound CC(=C)CCO[P@](O)(=O)OP(O)(O)=O NUHSROFQTUXZQQ-UHFFFAOYSA-N 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 229940075930 picrate Drugs 0.000 description 2
- OXNIZHLAWKMVMX-UHFFFAOYSA-M picrate anion Chemical compound [O-]C1=C([N+]([O-])=O)C=C([N+]([O-])=O)C=C1[N+]([O-])=O OXNIZHLAWKMVMX-UHFFFAOYSA-M 0.000 description 2
- 239000013643 reference control Substances 0.000 description 2
- 230000011514 reflex Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000000844 transformation Methods 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 241000965477 Darksidea delta Species 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 239000003990 capacitor Substances 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000004883 computer application Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000000779 depleting effect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 239000012464 large buffer Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000013077 scoring method Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000000547 structure data Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 210000000707 wrist Anatomy 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/117—Filters, e.g. for pre-processing or post-processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/119—Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/12—Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/12—Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
- H04N19/122—Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
- H04N19/126—Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/13—Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/137—Motion inside a coding unit, e.g. average field, frame or block difference
- H04N19/139—Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/14—Coding unit complexity, e.g. amount of activity or edge presence estimation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/159—Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/167—Position within a video image, e.g. region of interest [ROI]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/182—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/184—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/186—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/1887—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a variable length codeword
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/189—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
- H04N19/192—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/189—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
- H04N19/196—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
- H04N19/31—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/40—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
- H04N19/517—Processing of motion vectors by encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/523—Motion estimation or motion compensation with sub-pixel accuracy
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/53—Multi-resolution motion estimation; Hierarchical motion estimation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/573—Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/577—Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/59—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/593—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/63—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/80—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
- H04N19/82—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/91—Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/96—Tree coding, e.g. quad-tree coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/147—Data rate or code amount at the encoder output according to rate distortion criteria
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/44—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
- H04N19/517—Processing of motion vectors by encoding
- H04N19/52—Processing of motion vectors by encoding by predictive encoding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Discrete Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Theoretical Computer Science (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Image Analysis (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Television Systems (AREA)
Description
本出願は、2013年1月30日に出願された、「次世代ビデオコーディング」という発明の名称の米国仮出願第61/758,314の利益を主張する。
scnchg:シーンの変更情報
spcpx:空間の複雑度情報
tpcpx:時間的な複雑度情報
pdist:時間的な予測距離情報
pap:複数の事前分析パラメータ(scnchg、 spcpx、tpcpx、pdist以外のあらゆる他の事前分析パラメータのためのプレースホルダ)
ptyp:複数のピクチャタイプの情報
pgst:ピクチャグループ構造情報
pptn cand:複数の予測パーティショニング候補
cptn cand:複数のコーディングパーティショニング候補
prp:前処理
xmtyp:変換タイプ情報
xmdir:変換方向情報
xmmod:変換モード
ethp:1/8のピクセル動き予測
pptn:予測パーティショニング
cptn:コーディングパーティショニング
mot&cod cost:動きおよびコーディングコスト
qs:量子化情報セット(量子化パラメータ(Qp)、量子化マトリックス(QM)選択肢を含む)
mv:複数の動きベクトル
mop:複数のモーフィングパラメータ
syp:複数の合成パラメータ
ddi:デブロックおよびディザリング情報
qri:品質復元フィルタリングインデックス/情報
api:適応精度フィルタリングインデックス/情報
fii:フュージョンフィルタリングインデックス/情報
mod:モード情報
reftyp:参照タイプ情報
idir:イントラ予測方向
詳細について図7を見ると、例示的な1パスCBRレートコントロール処理700が、本開示の少なくとも一部の実装に従って配置されている。処理700は、702から758までの番号が一様に付けられた、1または複数の動作によって示される、1または複数の動作、機能、またはアクションを含んでよい。処理700は、次世代ビデオコーディング処理の少なくとも一部を形成してよい。非限定的な例として、処理700は、図1のエンコーダシステム100、レートコントロール400、および/または本明細書に記載された任意の他のエンコーダシステム若しくは複数のサブシステムによって担当される、次世代ビデオエンコーディング処理の少なくとも一部を形成してよい。
式中、Nは、以下で計算される、inter_qの既定の割り当て値である。I‐ピクチャ(intra)およびF‐ピクチャ(fpic)の複数のQp値を取得するための、例示のAutoIQおよびAutoFQのマッピングテーブルが以下に示される。上限値は、対応するintra値またはfpic値より高い中間値である。
const double AutoIQ[128] = {
// 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12,
1.00,1.00,1.75,2.75,3.50,4.50,5.25,6.25,7.00,8.00,9.00,9.75,10.75,
// 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24,
11.50,12.50,13.25,14.25,15.00,16.00,17.00,17.75,18.75,19.50,20.50,21.25,
// 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36,
22.25,23.00,24.00,25.00,25.75,26.75,27.50,28.50,29.25,30.25,31.00,32.00,
// 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48,
33.00,33.75,34.75,35.50,36.50,37.25,38.25,39.00,40.00,41.00,41.75,42.75,
// 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60,
43.50,44.50,45.25,46.25,47.00,48.00,49.00,49.75,50.75,51.50,52.50,53.25,
// 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72,
54.25,55.00,56.00,57.00,57.75,58.75,59.50,60.50,61.25,62.25,63.00,64.00,
// 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84,
65.00,65.75,66.75,67.50,68.50,69.25,70.25,71.00,72.00,73.00,73.75,74.75,
// 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96,
75.50,76.50,77.25,78.25,79.00,80.00,81.00,81.75,82.75,83.50,84.50,85.25,
// 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108,
86.25,87.00,88.00,89.00,89.75,90.75,91.50,92.50,93.25,94.25,95.00,96.00,
// 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120,
97.00,97.75,98.75,99.50,100.50,101.25,102.25,103.00,104.00,105.00,105.75,106.75,
// 121, 122, 123, 124, 125, 126, 127
107.50,108.50,109.25,110.25,111.00,112.00,113.00
};
const double AutoFQ[128] = {
// 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12,
1.00,1.00,2.00,3.00,4.00,5.25,6.50,7.75,9.00,10.25,11.50,12.75,14.00,
// 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24,
15.25,16.50,17.75,19.00,20.25,21.50,22.75,24.00,25.25,26.50,27.75,29.00,
// 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36,
30.25,31.50,32.75,34.00,35.25,36.50,37.75,39.00,40.25,41.50,42.75,44.00,
// 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48,
45.25,46.50,47.75,49.00,50.25,51.50,52.75,54.00,55.25,56.50,57.75,59.00,
// 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60,
60.25,61.50,62.75,64.00,65.25,66.50,67.75,69.00,70.25,71.50,72.75,74.00,
// 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72,
75.25,76.50,77.75,79.00,80.25,81.50,82.75,84.00,85.25,86.50,87.75,89.00,
// 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84,
90.25,91.50,92.75,94.00,95.25,96.50,97.75,99.00,100.25,101.50,102.75,104.00,
// 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96,
105.25,106.50,107.75,109.00,110.25,111.50,112.75,114.00,115.25,116.50,117.75,119.00,
// 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108,
120.25,121.5,122.75,124.00,125.25,126.50,127.75,127.75,127.75,127.75,127.75,127.75,
// 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120,
127.75,127.75,127.75,127.75,127.75,127.75,127.75,127.75,127.75,127.75,127.75,127.75,
// 121, 122, 123, 124, 125, 126, 127
127.75,127.75,127.75,127.75,127.75,127.75,127.75
};
式中、((fpic_q[0] - inter_q[0]) + 1.0/2.0)は、デルタ係数と考えられる。よって、ランクr=0の後、ランクrは、前述の式(4)の使用のために、1に設定される。この式は、PおよびFの両方のピラミッドコーディングに対し良好であり、次に、この式を用いて、同一ランク上の複数のフレームは、同一の初期または既定のQp値(この場合、各ランクはQp値を有する)で開始する。つまり、より高いランクの任意のフレームに対するQpが、固定デルタ値を、その直前(またはより低い)のランク参照フレームの初期の既定Qpに追加することで、そのフレームタイプに関係なく、導き出される。これについて別の言い方をすると、デルタ係数に式(4)のrを乗じる代わりに、現在のランクに対し、より低いランクの隣接値のQpに、デルタ係数を追加すると、同一の結果が取得される。最大r値に到達すると、処理900は、量子化適応コントロールに対し、複数の初期/既定のQpを提供918してよい。ランク(0)またはベースレベル上にF‐ピクチャが実際には存在しない場合ですら、上記式が使用されることにも留意されたい。
式中、logQは、推定Qpの対数であり、C = (avg_temporal_complexity /target_bitrate)であり、target_bitrateはbps単位、avg_temporal_complexityは(avgTSC/(width*height)^0.25) として計算される、利用可能なあらゆる将来のフレームのtemporal_complexityの平均である。式中、TSCは簡単に言うと時間的な空間複雑度または時間的な複雑度の基準を意味する。
式中、width*heightはフレームの解像度である。さらに、ビットレートインデックス(bpp_id)は、複数の正確なbpp値を、9つの可能性のある整数0から8のうちの1つに減少させるための、図14に係る「bpp対bpp_idマッピング」テーブルを使用し、導き出される。テーブルに示される複数のbpp値は、その範囲またはインデックス値の最大値である。よって、例えば、0から0.0152までの任意の値に対し、bpp_idは0であるといった感じである。
式中、cplxが現在のフレームの複雑度であり、target_bitsが現在のフレームを含む全フレームに対する全ターゲットビット数である場合、avg_pqpは、これまでにエンコードされた全フレームの複数の平均Pqpであり、avg_cplxは平均時空複雑度であり、act_bitsは、これまでにエンコードされた全フレームに消費された全ビット数である。これにより、現在のフレームをエンコードするのに必要とされるQpがもたらされ、Qpがact_bitsをtarget_bits近傍に近づけ得る結果をもたらす。概して、複数の連続するフレームに対するQpに、avg_pqpの約15%のドリフトが許容される。Qpにおける結果的に得られる変化がこの制限値を上回る場合は、これが複雑度における突然の変更の結果であるとき、pqpの約25%の最大ドリフトが許容される(avg_cplxの約25%を上回ることにより)。このQpは、中間Qpに割り当てられる。
式中、mopは、中間動作ポイントである。よって、式(7)から導き出されるQpは、これらの制限値に抜き出される。
Qpclipが元々これらの制限値を上回っている場合、Qpclipを最も近い制限値に設定する。
一次関係:
二次関係:
式中、ip_ratioは上記複数の関係の1つを使用し導き出され得、PqpはP‐ピクチャのQp値である。複数のP‐ピクチャの推定されるビット数は、以下の関係を使用し、導き出され得る。
ここで、上記モデルはCIFデータの平均に基づき、I_act_bitsは、I‐ピクチャの実際のビット数である。
式中、pf_ratioは、上記複数の関係の1つを使用し、導き出され得る。複数のP‐ピクチャの推定されるビット数は、以下の関係を使用し、導き出され得る。
式中、Futr_anchor_bitsは、アンカP‐ピクチャの実際のビット数である。
式中、複数のモデルパラメータの複数の初期値は、複数のI‐ピクチャに対するLength=0、Value=0、およびWeight=0.25、および他の複数のピクチャタイプに対しては0.40を含む。Pdistanceモジュール内で計算される「TSC」基準はフレームのCplxの複雑度基準として使用される。本明細書におけるたくさんの式は、X += AはX = X + Aの割り当てを意味し、X *= AはX = X * Aを意味し、X -= AはX = X - A等を意味し、「++」は1ずつ等インクリメントすることを意味する、プログラミング言語で記載されていることを留意されたい。
式中、buf_fulは、現在のバッファ充填量である。処理700は、バッファの推定732で継続してよい。フレームシーケンスをコーディングユニットととも呼ばれる、2つのZERO_RANK参照フレーム間に位置される、複数のピクチャのサブグループ(SGOP)として考える。これについて別の言い方をすると、SGOPは、将来のZERO_RANKフレームから過去のZERO_RANKフレームに後続するフレームまでの、セットまたはシーケンスのピクチャまたはフレームであってよい。複数のバッファの現在の状態について、複数のQpおよび複数の推定モデル、およびバッファステータスは、SGOPの終了において予想されてよい。
SGOP内の全フレームについて:
式中、fr_est_bitsは、上記した初期フレームのビット推定の式を使用する、現在のフレームの推定されるビット数である。現在のフレームタイプおよびランクに対応するその時間的な空間複雑度およびqpは、式(4)を使用し、現在のPqpから導き出される。
式中、last_buf_fulは、現在のSGOP開始におけるバッファステータス(buf_ful)である。バッファステータスは、各ZERO_RANK参照フレームのインスタンスにおいて更新され、バッファステータスは、SGOP内の各フレームに対するこのポイントからのbuf_incrと考えらえる。
式中、
および式中
ここにおいて、デルタQpの2つの係数が導き出される。1つは、バッファの現在の状態(vbv_delta、 式中vbvはビデオバッファリング検証機能を意味する)に対応し、もう一つは、現在のシーンの複雑度(cplx_delta)に対応する。これらの2つの係数は、個別に処理される。また、これらの2つの係数は、それぞれvbvユニット420およびcmplxユニット422によって計算されてよい。というのは、デルタQpは、これら2つのパラメータの組み合わせに基づく、複数の異なる値を仮定してよいからである。vbv_deltaについては、バッファインクリメントが、現在のバッファレベルの閾値を超えているかどうかを特定すべく、最初に現在のバッファ746の状態が判断され、一例において、この閾値が上回られている場合、vbv_deltaが計算および使用される748。次に、式(39)について、delta_qpfの最初の係数は、現在のバッファ充填量buf_fulに対応するvbv_deltaであり、バッファインクリメントのレートincr_rateは、次のように計算される。
式中、avg_buf_fulは、buf_fulの移動平均であり、omはbuf_fulがbuf_mopを上回るまたは下回るかに依存する、動作マージンである。バッファステータスにより、バッファインクリメントの最大レートに対する閾値が計算される。当該閾値を判断すべく、閾値テーブル(図21)が使用される。よって、incr_rateに対する閾値、brTは、閾値テーブル(図21)で示すようになる。
バッファ充填量レベルは、次のように計算されてよい。
次に、buf_fulが境界内にあるかどうかを判断すべく、境界がチェックされてよい。
(2)(Buf_ful >= buf_mop) && (buf_incr<0)。VBVは過剰消費であり、シーンの複雑度はVBVに複数のビットを戻し中である。
(3)(Buf_ful < buf_mop) && (buf_incr<=0)。VBVは過少消費であり、フレームはVBVを消耗中である。
(4)(Buf_ful < buf_mop) && (buf_incr>0)。VBVは過少消費であり、フレームはVBVを入力中である。
Qpは、その後、フレームエンコーディングに利用可能である。
各フレームのためのdelta_qpを正確にコントロールすべく、バッファコントロールの代替方法が開発されている。ここで、主要な思想の1つは、バッファインクリメントを使用する代わりに、このアルゴリズムに対する他の複数の追加項目に加え、フレームQpを制御するための推定されるバッファステータスを直接使用することにある。この修正は、デルタQpの判断のためのアルゴリズムおよびその後のフレームQpの計算を置換または修正する。
次にSGOP内の全フレームに対し、
式中、fr_est_bitsは、複数の初期フレームと同様の複数のビット推定を持つ、複数のビット率モデルまたは複数の線形推定モデルを使用する、現在のフレームのための推定されるビット数である。現在のフレームタイプおよびランクに対応する時間的な空間複雑度およびQpは、式(4)を使用し、現在のPqpから導き出される。現在のバッファ充填量がbuf_fulの場合、同一Pqpで継続する、予想されるバッファステータス(buf_est)は、次のようになる。
あるいは、第2のサブカテゴリにおいては、バッファがオーバーフローする。
あるいは、ここで第2のサブカテゴリにおいても、バッファがオーバーフローする。
次の場合を除き、これら複数の用語が上記のように定義される。最終的なフレームQpは式(34)から(36)と同様に導き出される。
このセクションは、簡単にアルゴリズムフローについて記載し、概して上記の図7を参照する。
2.RCスタートアップ:複数のコマンドラインパラメータに基づいて、複数の異なるレートコントロールパラメータ(複数のバッファ、複数の推定モデル等)を複数の適切な値に設定する。ビットレートおよびシーケンスの解像度に基づいて、複数の初期のQpが所定のテーブルに基づいて導き出される。
3.Pic RC:これは、各フレームのエンコーディング前の、現在のフレームQpを決定する、フレームレートコントロールである。
A.平均的な複雑度:pdistanceモジュール内でこれまでに複数のバッファ内に読み込まれたすべての将来の入力フレームに基づいて、平均時空複雑度を計算する。
B.複数の静的/空白シーンのチェック:シーンが静的または一連の空白のフレームの場合、既定の固定Qpが使用される。たとえ、これがシーンの途中で発生した場合であっても(例えば短時間の間、シーンが静的/空白になるとき)、複数の最後の安定状態Qpが、これまでの全フレームに対し使用され、それらは複数の空白/静的フレームとして検出される。
C.フレームの複数のQp制限:
i.シーケンスの開始:それがシーケンスの絶対的開始である場合、複数の実験に基づいて作成された初期のQp推定テーブルが使用され、複数の境界Qpを導き出す。このテーブルは、複雑度、ビットレート(bpp)およびZERO_RANKのフレームQpのマッピングであり、特定のターゲットビットレートを生成可能な計算された平均複雑度を有する、完全なシーケンスのための中間のZERO_RANKのP‐ピクチャQpの予測を試行する。対応する複数の所定のテーブルから複数のQp制限値も導き出される。
ii.何らかの初期の履歴の構築後:平均的な複雑度に対し消費された過去の全ビット数および使用された平均Qpに係るいくらかの履歴を有するゆえ、過去の統計に対する現在のフレームを含む、予想される複雑度および複数のビットに基づき、新しいフレームに対するQpの予測を試行する。過去の統計に対する現在のフレームは、現在のフレームを含む全ビット消費量をターゲットレートに近付け得るものである。複数のQp制限値が、標準のP対IおよびP対FのQpマッピングを使用するこのQpから導き出される。
iii.既定:上記(ii)のケースは、現在のフレームの複雑度およびこれまでの実際のビットレートがこれまでの平均的な複雑度およびターゲットビットレートにそれぞれ近い場合にのみ使用される。他の任意のケースにおいては、既定のQpがこれまでの平均Qpとなり、複数のQp制限値は、標準のP対IおよびP対FのQpマッピングを使用するこのQpから導き出される。
D.フレームQp:
i.シーケンスの開始またはシーンの変更:フレームQpは、平均的な複雑度、ターゲットビットレート(bpp)および多くの実験に基づいて作成されたQpモデリングに基づいて、導き出される。このQpは、前のセクションCで導き出された複数の制限値に規制される。時折、モデルは開始(複数の空白のフレーム等)の異常な複雑度に起因して、複数の誤ったQpを予測する可能性があるので、これは必要である。
ii.バッファコントロール:任意の他のフレームについて、バッファコントロールはフレームQpを決定する。現在のバッファステータスが動作ポイントに近く、かつ、現在のフレームの複雑度がこれまでの平均的な複雑度と同様の場合、既定で、現在の中間動作Qpが現在のフレームのコーディングに使用されるべきである。あるいは、バッファを動作ポイントに近づける現在の中間Qpに対し、適用される必要のあるデルタQp値を導き出したいと考える。これは以下のような一連の段階において導き出される。
a.バッファ推定およびバッファインクリメント:複数のバッファの現在の状態について、複数のQpおよび複数の推定モデルは、現在のSGOPの終了において、バッファステータスを予想する。SGOPは、将来のZERO_RANKフレームから、過去のZERO_RANKフレームに後続するフレームまでの一連の複数のピクチャである。また、現在のSGOP内のコードされる全フレームに対し、これらのフレームが複数のQpの現在の動作セットを使用してコードされる場合、バッファインクリメントを計算する。
i.利用可能な履歴:十分な履歴が複数のビット推定モデルに構築されると、フレームがその複雑度に対し消費することとなるビット数を推定するためにこれらが使用され得る。フレームタイプおよびランクに対応する現在のQpがフレームで使用される。
ii.履歴なし:あるいは、複数の実験から導き出されたいくつかの割合モデルが使用され、特定の複雑度およびQpを持つ複数のフレームビットを推定する。これらのビット割合モデルは、I対Pビット率、P対Fビット率等である。
b.複数のバッファレベルインデックス:現在のバッファステータスが中間動作ポイントを下回るまたは上回るかどうかに基づいて、現在のバッファおよび複数の推定されるバッファレベルが、−10から+10までのスケールの複数のインデックスにマッピングされる。
c.バッファインクリメントレートおよびその閾値:平均バッファレベルに対する現在のフレームインスタンスにおけるバッファインクリメントレートを推定する。現在のバッファレベルにより、所定のテーブルは、このバッファインクリメントに対する閾値を付与する。このことは、当該テーブルが、バッファが充填量のその現在のレベルにおいて許容可能な、フレームインスタンスの最大インクリメントを付与することを意味する。
d.デルタQp計算:デルタQpの2つの係数が導き出される。1つは、バッファの現在の状態に対応し、もう1つは現在のシーンの複雑度に対応する。デルタQpは、これら2つのパラメータの組み合わせに基づいて、複数の異なる値を仮定し得るゆえ、これら2つを別個に処理する必要がある。
i.VBVデルタ:インクリメント/デクリメントのレートが、現在のバッファレベルの許容閾値を超える場合はいつでも、バッファステータスによるデルタQp重み付け係数が適用される。現在のバッファレベルに基づいて、重み付け係数が再度導き出される。
ii.複雑度デルタ:現在のシーンの複雑度による、デルタQp重み付け係数である。これは、VBVデルタと比べ、より小さな重み付けを有する。これは、将来の複雑度を含むべく、導き出される。
iii.デルタQp:現在の中間Qpに比例して、上記両方の係数が組み合わされて、単一のデルタQp値とされる。
e.フレームQp計算:上記のデルタQpを現在の中間Qpに追加し、かつセクション(c)で導き出される複数の境界Qpに制限することで、フレームQpが導き出される。
4.Pic RCの更新:これは、現在のフレームの複雑度、Qpおよびビット数に基づいて、各フレームエンコードの終了において、バッファステータスおよび複数の推定モデルを更新する。
5.RCシャットダウン:複数のレートコントロールパラメータを消去する。
図22Aから22Bを見ると、2パスの可変ビットレート(VBR)アルゴリズムまたは処理2200が示されており、本開示の少なくとも一部の実装に従って配置されている。処理2200は、2202から2248までの番号が一様に付けられた、1または複数の動作によって示される、1または複数の動作、機能、またはアクションを含んでよい。処理2200は、NGVコーデックに追加され得る2パスレートコントロールモードを形成してよい。非限定的な例として、処理2200は、図1のエンコーダシステム100、レートコントロール500、および/または本明細書に記載された任意の他のエンコーダシステム若しくは複数のサブシステムの追加の部分によって担当される、次世代ビデオエンコーディング処理の少なくとも一部を形成してよい。
式中、total_ns_bitsは、各フレームの非スケーラブルビット総数(複数のヘッダ等)であり、target_total_bitsは、スケーラブルおよび非スケーラブルのビット数を含むフレームのためのターゲットビット数であり、1pass_total_bitsは、第1のパス分析内で導き出されるフレームの現在の実ビット合計数である。シーケンス内の各フレームに対し、以下を使用し、スケールされたフレームサイズが導き出される。
式中、nsbitsは非スケーラブルなビット数であり、frmbitsはフレームのスケーラブルな(イメージ)ビット数である。
fs[j].bits < (fs[k].bits/3)の場合、
式中、fs[j].bits およびfs[k].bitsは、そのフレームのビット数でのフレームサイズを意味し、key_scale_factorは1.0に初期化される。キーフレームの追加ビット数は、次の式を使用し、導き出される。
各フレームのためのscaled_bitsは、これらの追加のキーフレームビットを構成すべく、再計算される。
式中、scaled_total_bitsは、フレームシーケンスのスケーラブルなビット合計数である。各フレームに対し再び、scaled_sizeが再計算される。
scaled_size > scaled_avgの場合、
式中、scaled_sizeは、フレームのビットサイズであり、scaled_avgは、分析されているフレームのシーケンス内の各タイプ‐ランクのための平均サイズであり、はじめにscale_factor_spend = 0.1で、はじめにscale_factor save = 0.2である。これにより効率的に、はじめにフレームの実際のサイズおよび平均化されたサイズ間の差分の約10または20%が取られ、その差分をフレームサイズに追加する。
式中、epfは、フレーム毎のエラーであり、一例において、epfは全ビットエラーの3%である(各フレームのエンコーディング後の更新されたtotal_act_bitsとtotal_scaled_sizeとの間の差分である)。epcは現在のフレーム毎のエラーで、この場合、全フレームタイプおよびランクの全ビット数に対する現在のフレームタイプおよびランクの重み付けである。
式中、est_qpは、フレームの推定されるQpで、現在のフレームをエンコードするのに使用される。式中、1pass_bitsおよびand 1pass_qpは、第1のパス分析からの各フレームのためのビット数およびQpである。各フレームのエンコーディング後、全ビットエラーが更新され、次の複数のフレームQp計算において使用される。
fs[i].bits > scaled_avgの場合、
式中、fs[i].bitsは、フレームスケーラブルなビット数、およびscaled_avgは、フレームシーケンス内の複数の特定タイプおよびランクのフレームにわたる平均的なスケーラブルなビット数である。ここで、複数の時間的な複雑度が、複数のQpデルタ係数にマッピングされ、それは、フレーム対平均ビット数の割合を、フレームランクに応答できる能力において提供する。よって、Qpデルタ係数は、フレームQpのスケーリング係数として使用可能である。
式中、sigmaは現在のフレームのいずれかのサイドで、3タップを使用すべく、1.5として選択される。特定のフレームについて、上記フィルタは、いずれかのサイドにおいて、複数の(filter_size/2)サンプルを持つ一連のサンプルに対し適用される。
式中、qおよびsumは、各参照サンプルに対しゼロに初期化される。最終的なqp_deltafは次のように導き出される。
target_bitsより少ないビット数を付与するそれらの段階をスキップする。
式中、target_bitsは、ターゲットビットレートから判断される。反復内の各Qpについては、expected_bits合計がこの新しいQpを使用し、各フレームのexpected_frame_bitsを計算し、それらを分析中のシーケンス内の全フレームに対し、累積することで計算される。expected_bitsは、次のように計算される。各フレームに対し、まず、現在のフレームタイプおよびランクに対応するscaled_qが次のように導き出される。
式中、rankQP[t][r]は、複数の初期の既定のQpである。このscaled_q[i]を使用し、現在のフレームに対し予想されるビット数は、次のようになる。
target_bitsに最も近いビット数を付与するQpが第2のパスの最善の中間Qpとして選択される。最善のQpを見つけるための反復の最大数(Qp段階サイズの見地より)は、次の式によって、制限される。
式中、total_expectedBitsは、シーケンス内の全フレームのexpectedBitsの総数であり、expectedBits_sumは、これまでにエンコードされた全フレームのexpectedBitsの総数である。
式中、tgt_errはビット総数エラーであり、est_qはビット総数エラーに対し調整された推定されるQpである。式中、scaled_qは、式(84)で導き出される現在のフレームのQpであり、actualBits_sumは、これまでにエンコードされた全フレームの実際のビット総数である。一アプローチにおいて、この補償は、複数のフレームに対し、選択的に適用されてよく、それによって、ベース(ランク0)における若しくはベース(ランク0)により近い箇所における複数のフレームに、より高い優先度が付与されるといった、ランクに従った優先度を付与する。
式中、est_qは、ターゲットビットレートエラーのためにここで調整される推定されるQpであり、式中、targetBits_sum およびtotal_nsBitsはそれぞれ、ターゲットビット総数、およびこれまでにエンコードされた各フレームの非スケーラブルなビット数である。現在のフレームのターゲットビット数は、第1のパス分析からのビット推定モデルを使用する、各フレーム(式(92))のための新しい推定されるターゲットQpを使用し、計算2240される。
このセクションは、概して図22Aから22Bを参照しつつ、アルゴリズムフローを簡潔に記載する。
2.第2のパス:分析パス内のstatファイルに書き込まれた複数の異なるフレームレベルstatが、複数のフレームバッファ内に読み取られる。第2のパスの開始前に、各フレームのためのビットターゲットを導き出すべく、レートコントロール分析がシーケンス内の全フレームに対し行われる。ビットターゲットは、全体のビットレートをターゲットに収束させるものである。当該アルゴリズムの主要な思想は、第1のパスstatに基づくターゲットビットレートに導く、固定Qpを第2のパスのために見つけ出すことにある。キーフレームブースティングおよび(時間的)複雑度マスキングから導き出される複数のデルタQp係数を使用し、適応量子化がフレームQpにわたり適用される。
A.複数の低い複雑度または静的シーンのキーフレームブースティング:複数の複雑度の低いシーンにおける複数のキーフレームについて、複数の追加ビットを費やすことによって品質を保持することで、他の複数のフレームのビット数を節約することになる。シーンの複雑度は、複数のビット割合に基づいて検出され、Qp重み付け係数は各GOP内のI‐ピクチャのために導き出される。
B.ビットシャフリングを使用する時間的複雑度マスキング:同様に、全フレームの残りに対し、複数の時間的な重み付け係数が、平均(各々のタイプおよびランク)に対するビット数の複数の相対的割合を使用し、導き出される。
C.Qp係数スムージング:同一タイプおよびランクの複数の連続するフレームに対する複数のQp係数は、複数の連続するフレーム(同一タイプおよびランクの)間のQpの広範な変化を避けるための単純なガウシアンフィルタを使用して、スムーズアウト(平準化)される。広範な変化は、品質の急激な変化をもたらし得る。
D. 各フレームのためのシーケンスおよびビットターゲットの中間Qpの検出:この段階では、複数の可能なQp選択肢のセットで反復し、第2のパスの最善なQpを見つける。最善なQpは、複数の前のセクションで導き出される複数のデルタQp係数を、対応するフレームQpに適用し、かつ、各フレームのビット数を導くためのビット推定モデルを使用しつつ、ターゲットビットレートをもたらし得る。終了時、これは各フレームのターゲットQpおよびビット数を付与する。
3.Picレートコントロール:これは、各フレームのエンコーディング前の、現在のフレームQpを決定するフレームレートコントロールである。
A. 推定されるQp:初期の2パスアルゴリズム(動作2222)は、各フレームの推定されるQpを付与する。しかしながら、複数の予測エラーおよび複数のビットレート偏差を補償すべく、第2のパスの実際のエンコーディング中に、各フレームに対し、推定されるQpは訂正される必要がある。
B.予測エラー:これまでにエンコードされた全フレームの実際のビット総数と予想されるビット総数との間の偏差は、フレームQp上で補償される。
C.ビットターゲット:ターゲットビットレートからの実際のビットレートの偏差も、ターゲットQpを導くための推定されるQp上で補償される。
D.ターゲットビット数:現在のフレームのためのこのターゲットビット数は、ビット推定モデルを使用するターゲットQpに基づいて計算される。
4.Pic RC更新:これは、各フレームエンコードの終了において、現在のフレームQp、予想されるビット数、ターゲットビット数および実際のビット数に基づいて、複数の累積的なフレーム統計を更新する。
5.RCシャットダウン:複数のレートコントロールパラメータを消去する。
図23を見ると、本開示の少なくとも一部の実装に従って配置された、ルックアヘッド処理2300を備えた、1パスCBRレートコントロールが示されている。処理2300は、2302から2364までの番号が一様に付けられた、1または複数の動作によって示される、1または複数の動作、機能、またはアクションを含んでよい。処理2300は、NGVコーデックに追加され得る、1パスのルックアヘッドレートコントロールモードを形成してよい。非限定的な例として、処理2300は、図1のエンコーダシステム100、レートコントロール400、および/または本明細書に記載された任意の他のエンコーダシステム若しくは複数のサブシステムの追加の部分によって担当される、次世代ビデオエンコーディング処理の少なくとも一部を形成してよい。ルックアヘッドを備えた1パスCBRレートコントロールの多くの動作の複数の説明は、一形態若しくは別形態における、1パス処理700(図7)によって既にカバーされているか、または含まれており、これらの場合、説明はここで繰り返されない。複数の同一または類似の動作および/または両方の処理における複数のコンポーネントは、同様に番号が振られている(例えば、処理700のRCスタートアップの実行は動作702、処理2300では2302)。
式中、fr_est_bitsは、前述した開始シーケンスフレームQp処理のビット率方法または線形推定方法を使用する、現在のフレームのための推定されるビット数である。式中、target_rateは、フレーム毎のターゲットビット数であり、その時空複雑度およびQpは、式(4)を使用して現在のPqpから導き出される現在のフレームタイプおよびランクに対応する。
ここで、
式中、enc_orderは現在のフレームのエンコーディング順序番号であり、total_framesはエンコードされる複数のピクチャの合計数である。vbvデルタは次に、一例において、vbvユニット420によって次のように計算されてよい2347。
式中、tgt_errは、全ターゲットビット数と、これまでにエンコードされた複数の過去のフレームに起因する前のターゲットエラーを含む、推定されるビット数との間の差分として付与されるターゲットエラーである。修正されたPgp'は式(100)に従って計算2349されてよい。
式中、TSCは、分析されるフレームの時間的な空間複雑度である。しかしながら、フレームは次のようにデルタQp係数にマッピングされる。
fs[i] .TSC > avgTSCの場合、
式中、sigmaは現在のフレームのいずれかのサイドで、3タップを使用すべく、1.5として選択される。特定のフレームについて、上記フィルタは、いずれかのサイドにおいて、複数の(filter_size/2)サンプルを持つ一連のサンプルに対し適用される。
式中、dは参照サンプルに対する現在のサンプルのインデックスである。
式中、qおよびsumは各参照サンプルに対し、ゼロに初期化される。最終的なqp_deltafは次のように導き出される。
式中、修正されたフレームQp(Pqp'')が再び新しい複数の制限値Qpを受ける2358。このQp境界チェックは、バッファステータスに応答できるPqp''について有効な第2の境界チェックである一方で、この動作は、開始、静的、あるいは複数の空白のフレームに対する境界チェックも含んでよい。動作706および2306に関し前述したとおり、例えば、複数の連続するフレーム間の大きすぎる偏差を回避すべく、複数のQp制限値が適用される。Qpは、その後、フレームエンコーディングに利用可能である。
このセクションは、概して図23を参照しつつ、当該アルゴリズムフローについて簡潔に記載する。
2.RCスタートアップ:複数のコマンドラインパラメータに基づいて、複数の異なるレートコントロールパラメータ(複数のバッファ、複数の推定モデル等)を複数の適切な値に設定する。ビットレートおよびシーケンスの解像度に基づいて、複数の初期のQpが所定のテーブルに基づいて導き出される。
3.ルックアヘッドを備えるPdistance:フレームタイプおよびランクの複数の決定が前と同じく発生する。待機時間パラメータが複数のルックアヘッドバッファ内の利用可能なピクチャ数に基づいて設定される。フレームエンコーディングは、対応する待機時間値が設定されている場合にのみ許容される。
4.ルックアヘッドを備えたPicレートコントロール:これは、各フレームのエンコーディング前の、現在のフレームQpを決定するフレームレートコントロールである。
A.平均的複雑度:複数のルックアヘッドバッファ内の利用可能な全入力フレームに基づき、平均時空複雑度を計算する。
B.複数の静的/空白シーンのチェック:シーンが静的または一連の空白フレームの場合、既定の固定Qpが使用される。たとえ、これがシーンの途中で発生した場合であっても(例えば短時間の間、シーンが静的/空白になるとき)、複数の最後の安定状態Qpが、これまでの全フレームに対し使用され、それらは複数の空白/静的フレームとして検出される。
C.フレームの複数のQp制限:
i.シーケンスの開始:それがシーケンスの絶対的開始である場合、複数の実験に基づいて作成された初期のQp推定テーブルが使用され、複数の境界Qpを導き出す。このテーブルは、複雑度、ビットレート(bpp)およびZERO_RANKのフレームQpのマッピングであり、特定のターゲットビットレートを生成可能な計算された平均複雑度を有する、完全なシーケンスのための中間のZERO_RANKのP‐ピクチャQpの予測を試行する。複数のQp制限値は、対応する複数の所定のテーブルからも導き出される。
ii.いくらかの初期の履歴の構築後:平均的な複雑度に対し消費された過去の全ビット数および使用された平均Qpに係るいくらかの履歴を有するゆえ、複数の過去の統計に対する現在のフレームを含む、予想される複雑度およびビット数に基づき、新しいフレームに対するQpの予測を試行する。複数の過去の統計に対する現在のフレームは、現在のフレームを含む全ビット消費量をターゲットレートに近付け得るものである。複数のQp制限値が、標準のP対IおよびP対FのQpマッピングを使用するこのQpから導き出される。
iii.既定:上記(ii)のケースは、現在のフレームの複雑度およびこれまでの実際のビットレートがこれまでの平均的な複雑度およびターゲットビットレートにそれぞれ近い場合にのみ使用される。他の任意のケースにおいては、既定のQpがこれまでの平均Qpとなり、複数のQp制限値は、標準のP対IおよびP対FのQpマッピングを使用するこのQpから導き出される。
D.時間的適応量子化:複数のルックアヘッドバッファ内の利用可能なフレーム全入力フレームの複雑度に基づいて、キーフレームブースティングおよび(時間的)複雑度マスキングから導き出される複数のデルタQp係数を使用し、適応量子化がフレームQpにわたり適用される。
i.複数の低い複雑度または静的シーンのキーフレームブースティング:複数の複雑度の低いシーンにおける複数のキーフレームについて、複数の追加ビットを費やすことによって品質を保持することで、他の複数のフレームのビット数を節約することになる。シーンの複雑度は、複数の複雑度割合に基づいて検出される。Qp重み付け係数がI‐ピクチャに対し、導き出される。
ii.時間的複雑度マスキング:同様に、複数のルックアヘッドバッファ内のすべての利用可能なフレームの残りに対する、複数の時間的な重み付け係数が、これまでに利用可能な全フレームの平均的な複雑度に対する、複雑度の複数の相対的割合を使用し、導き出される。
iii.複数のQp係数スムージング:複数のルックアヘッドバッファ内の利用可能な連続するフレームに対する複数のQp係数は、複数の連続するフレーム間のQpの広範な変化を避けるための単純なガウシアンフィルタを使用して、スムーズアウト(平準化)される。広範な変化は、品質の急激な変化をもたらし得る。これらのデルタQp係数は、次のように導き出されるフレームQpに適用される。
E.フレームQp:
i.シーケンスの開始またはシーンの変更:フレームQpは、平均的な複雑度、ターゲットビットレート(bpp)および多くの実験に基づいて作成されたQpモデリングに基づいて、導き出される。このQpは、前のセクションCで導き出された複数の制限値に規制される。時折、モデルは開始(複数の空白フレーム等)の異常な複雑度に起因して、複数の誤ったQpを予測する可能性があるので、これは必要である。
ii.バッファコントロール:任意の他のフレームについて、バッファコントロールはフレームQpを決定する。現在のバッファステータスが動作ポイントに近く、かつ、現在のフレームの複雑度がこれまでの平均的な複雑度と同様の場合、既定で、現在の中間動作Qpが現在のフレームのコーディングに使用されるべきである。あるいは、バッファを動作ポイントに近づける現在の中間Qpに対し、適用される必要のあるデルタQp値を導き出したいと考える。これは以下のような一連の段階において導き出される。
a.バッファ推定およびバッファインクリメント:複数のバッファ、複数のQp、および複数の推定モデルの現在の状態に関し、複数のルックアヘッドバッファ内のすべての利用可能な将来のフレームが、複数のQpの現在の動作セットを使用してコードされた場合、バッファステータスおよびバッファインクリメントを予想する。
(i)利用可能な履歴:十分な履歴が複数のビット推定モデルに構築されると、これらが使用され、フレームがその複雑度に対し消費することとなるビット数、および現在のフレームのタイプおよびランクに対応するQpが推定され得る。
(ii)履歴なし:あるいは、複数の実験から導き出されたいくつかの割合モデルが使用され、特定の複雑度およびQpを持つ複数のフレームビットを推定する。これらのビット割合モデルは、I対Pビット率、P対Fビット率等である。
b.複数のデルタQp係数の計算:デルタQpの2つの係数が導き出される。1つは、バッファの現在の状態に対応し、もう1つは現在のシーンの複雑度に対応する。
(i)VBVデルタ:バッファ偏差に起因するデルタQp重み付け係数が計算される。
(ii)複雑度デルタ:d(iii)で導き出されたデルタQp重み付け係数は、複雑度デルタQp係数として使用される。
c.フレームQp計算:上記VBVデルタQpを現在の中間Qpに追加し、セクションCで導き出される複数の境界Qpに制限することで、新しいP Qpが導き出される。異なるフレームタイプおよびランクの複数のQpがこの新しいP Qpに基づいて再計算される。最後に、複雑度デルタQpは現在のフレームQpにも追加され、再度セクションCで導き出される複数の境界Qpに制限される。これにより、最終的なフレームQpを付与する。
5.Pic RCの更新:これは、現在のフレームの複雑度、Qpおよびビット数に基づいて、各フレームエンコードの終了において、バッファステータスおよび複数の推定モデルを更新する。
6.RCシャットダウン:複数のレートコントロールパラメータを消去する。
別の態様において、より低いGOPサイズおよびIPPPコーディングが実装される。そこでは、ビデオ会議等の複数のアプリケーション向けに、低遅延化コーディングをサポートすべく、最新のNGVエンコーダに一連の変更が追加される。低遅延化コーディングのための典型的構成は、(1)IPPPコーディング、および(2)通常の場合における約2秒の、すなわち2秒バッファの遅延に対する少数フレームのバッファサイズ、である。ルックアヘッドバッファコントロールアルゴリズムを備える1パスCBRレートコントロールは、低遅延化コーディングシナリオに対処できるが、その理由は次の2つである。
inter_q[0]は、上記ランク(0)の複数のP‐ピクチャのための初期のQpで、fpic_qは、上記ランク(0)の複数のF‐ピクチャのために使用される上記初期のQpで、かつ、rは分析されている現在のフレームの上記ランクであり、オプションとして、複数の制限値をQp値に適用する段階を備えており、上記複数の制限値は、(1)シーケンスの開始における複数のフレームに対する、ビットレート、フレームレート、およびフレームの幅×高さに基づく、時空複雑度とピクセル毎のビット数(bpp)との間の関係に関連付けられた複数の所定値から導き出される複数の制限値、(2)シーケンスの開始における複数のフレーム以外の複数のフレームに対する、分析されているフレームと同一のシーケンスの既にエンコードされた複数のフレームからのデータを含む履歴に少なくとも部分的に基づく、複数の上記フレームのための複数の制限値、(3)複数のQp制限値を判断するために使用される中間Qpとしてこれまでにエンコードされた複数の上記フレームの平均Pqpを設定する段階の少なくとも1つから導き出され、(2)において、これまでにエンコードされた複数の上記フレームの(1)中間Qpは、(avg_pqp)これまでにエンコードされたすべての上記フレームの複数の上記平均Pqp、(avg_cplx)平均時空複雑度、(act_bits)これまでにエンコードされたすべての上記フレームに使用される全ビット数、(cplx)上記現在のフレームの複雑度、および(target_bits)上記現在のフレームを含む、すべての上記フレームのための全ターゲットビット数に基づいており、上記履歴のオプション(2)は、結果的に得られる上記中間Qpが上記平均Pqpの特定の割合の範囲内であるときに使用され、(3)において、Pqpは上記P‐ピクチャのランク(0)のQpであり、上記フレームがシーケンスの開始に存在するか、空白または静的シーンの一部であるか、あるいはそれらのいずれでもないかによって、初期のQpに対して、より最終的なフレームQpを別に判断する段階を備え、上記フレームの上記ランクに少なくとも部分的に基づいて、初期のQpに対して、より最終的なフレームQpを判断する段階を備え、上記初期のP‐ピクチャのランク(0)のQpと、I‐ピクチャ対P‐ピクチャのビット率との間の所定の関係に少なくとも部分的に基づいて、P‐ピクチャのための推定されるビット数の値(P_est_bits)を、確立する段階を備え、F‐ピクチャのための推定されるビット数の値(F_est_bits)を、初期のP‐ピクチャのランク(0)のQpと、P‐ピクチャ対F‐ピクチャのビット率との間の所定の関係に基づいて、確立する段階を備え、上記F‐ピクチャのために、複数の過去の参照フレーム、複数の将来の参照フレーム、あるいはそれら両方を使用するオプションが提供される、モーフィング技術または合成技術によって修正される、修正された複数の参照フレームをF‐ピクチャに提供する上記オプションを提供する段階を備え、フレームのビット数の推定は、線形モデルを用いて計算され、上記フレームのフレームタイプとレベルとの複数の異なる組み合わせに対して異なり、複数の上記フレームタイプは、少なくともP‐ピクチャ、F‐ピクチャ、B‐ピクチャ、またはI‐ピクチャを含む。
Claims (55)
- ビデオコーディングのためのコンピュータ実装方法であって、
入力ビデオ順序で、かつ、マルチレベル階層に関連付けられた状態でピクセルデータの複数のフレームを取得する段階と、
少なくとも1つの現在のフレームの前記階層の前記レベルに少なくとも依存して、複数の前記フレームに対する量子化パラメータ(Qp)を決定する段階とを備え、
前記マルチレベル階層は、
複数の参照フレームとして使用される、複数のI‐ピクチャ若しくは複数のP‐ピクチャまたはそれら両方を少なくとも備えるベースレベルと、
前記ベースレベル上の複数のフレームを複数の参照として使用する複数のピクチャを備える少なくとも1つの中間レベルと、
複数の参照フレームとして使用されず、かつ、他の複数のレベルの前記複数のフレームを複数の参照として使用する複数のピクチャを備える最大レベルとを含み、
複数のP‐ピクチャは、前記順序に関連して複数の過去のフレームを複数の参照として使用し、
前記最大レベル上の複数のピクチャは、複数の過去の参照フレーム、複数の将来の参照フレーム、あるいはそれら両方を使用するオプションが提供され、
各フレームは前記フレームが存在する前記レベルに関連付けられたランクが付与され、
前記量子化パラメータを決定する段階は、
ランク(0)以外の複数のフレームの前記量子化パラメータを、Qpr = inter_q[0]+デルタ係数×r(但し、inter_q[0]は既定値、rは分析されている現在のフレームの前記ランク)から導出する段階を有する、方法。 - 少なくともはじめに、前記フレームの前記レベルが前記ベースレベルに近いほど、前記複数のフレームのためのより小さい量子化パラメータを提供する段階を備える、請求項1に記載の方法。
- 少なくともはじめに、すべての前記他の複数のレベルと比較して、前記複数のフレームのための最小の量子化パラメータを前記ベースレベルに提供する段階を備える、請求項1に記載の方法。
- Qpと、ターゲットビットレート毎の複数の将来のフレームの複数の利用可能な複雑度のうち平均時間的複雑度の値との間の所定の関係から、少なくとも前記ランク(0)のP‐ピクチャの初期のQpを形成する段階を備える、請求項1に記載の方法。
- 前記ランク(0)のI‐ピクチャの複数のフレームの前記Qpを形成すべく、少なくとも前記P‐ピクチャのランク(0)の複数のフレームの初期のQpを使用する段階を備える、請求項1に記載の方法。
- フレームのための前記ランク(0)のI‐ピクチャのQp値を形成すべく、P‐ピクチャのランク(0)のQp値の、ランク(0)のI‐ピクチャのQp値に対する所定のマッピングを使用する段階を備える、請求項5に記載の方法。
- 各非ゼロレべルのための固定初期フレームQpを決定する段階を備える、請求項1に記載の方法。
- 非ゼロレベル上のフレームのタイプに関わらず、前記固定初期フレームQpが、前記非ゼロレベル上のすべてのフレームに対して確立される、請求項7に記載の方法。
- ランク(0)以外の複数のフレームの前記Qpを、以下の式から導出する段階を備え、
Qpr = inter_q[0] + ((fpic_q[0] - inter_q[0]) + (1.0/2.0)) x r
inter_q[0]は、前記ランク(0)の複数のP‐ピクチャのための初期のQpで、fpic_qは、前記ランク(0)の複数の機能性(F)‐ピクチャのために使用される前記初期のQpで、かつ、rは分析されている現在のフレームの前記ランクであり、F‐ピクチャのために、複数の過去の参照フレーム、複数の将来の参照フレーム、あるいはそれら両方を使用するオプションが提供される、請求項1に記載の方法。 - 複数の制限値をQp値に適用する段階を備えており、
前記複数の制限値は、
(1)シーケンスの開始における複数のフレームに対する、ビットレート、フレームレート、およびフレームの幅×高さに基づく、時空複雑度とピクセル毎のビット数(bpp)との間の関係に関連付けられた複数の所定値から導き出される複数の制限値、
(2)シーケンスの開始における複数のフレーム以外の複数のフレームに対する、分析されているフレームと同一のシーケンスの既にエンコードされた複数のフレームからのデータを含む履歴に少なくとも部分的に基づく、複数の前記フレームのための複数の制限値、
(3)複数のQp制限値を判断するために使用される中間Qpとしてこれまでにエンコードされた複数の前記フレームの平均Pqpを設定する段階の少なくとも1つから導き出され、
(2)において、
これまでにエンコードされた複数の前記フレームの中間Qpは、
(avg_pqp)これまでにエンコードされたすべての前記フレームの複数の前記平均Pqp、
(avg_cplx)平均時空複雑度、
(act_bits)これまでにエンコードされたすべての前記フレームに使用される全ビット数、
(cplx)前記現在のフレームの前記複雑度、および
(target_bits)前記現在のフレームを含む、すべての前記フレームのための全ターゲットビット数に基づいており、前記履歴のオプション(2)は、結果的に得られる前記中間Qpが前記平均Pqpの特定の割合の範囲内であるときに使用され、
(3)において、Pqpが前記P‐ピクチャのランク(0)のQpである、請求項1に記載の方法。 - 前記フレームがシーケンスの開始に存在するか、空白または静的シーンの一部であるか、あるいはそれらのいずれでもないかによって、初期のQpに対して、より最終的なフレームQpを別に決定する段階を備える、請求項1に記載の方法。
- 前記フレームの前記ランクに少なくとも部分的に基づいて、初期のQpに対して、より最終的なフレームQpを決定する段階を備える、請求項1に記載の方法。
- 初期のP‐ピクチャのランク(0)のQpと、I‐ピクチャ対P‐ピクチャのビット率との間の所定の関係に少なくとも部分的に基づいて、P‐ピクチャのための推定されるビット数の値(P_est_bits)を、確立する段階を備える、請求項1に記載の方法。
- 機能性(F)‐ピクチャのための推定されるビット数の値(F_est_bits)を、初期のP‐ピクチャのランク(0)のQpと、P‐ピクチャ対F‐ピクチャのビット率との間の所定の関係に基づいて、確立する段階を備え、前記F‐ピクチャのために、複数の過去の参照フレーム、複数の将来の参照フレーム、あるいはそれら両方を使用するオプションが提供される、請求項1に記載の方法。
- モーフィング技術または合成技術によって修正される、修正された複数の参照フレームを機能性(F)‐ピクチャに提供する前記オプションを提供する段階を備える、請求項8または13に記載の方法。
- フレームのビット数の推定は、線形モデルを用いて計算され、前記フレームのフレームタイプとレベルとの複数の異なる組み合わせに対して異なり、複数の前記フレームタイプは、少なくともP‐ピクチャ、機能性(F)‐ピクチャ、B‐ピクチャ、またはI‐ピクチャを含む、請求項1に記載の方法。
- バッファのビット容量に対する、前記バッファの中間動作ポイントに対するバッファ充填量を維持すべく、より最終的なフレームQpを決定する段階を備える、請求項1に記載の方法。
- 前記バッファは、デコーダにおけるバッファの複数のパラメータを模倣する、エンコーダにおける仮想バッファである、請求項17に記載の方法。
- バッファのバッファ充填量に応答する、フレームのためのより最終的なQpを決定する段階であって、
レベル応答型の複数のQpモデルで、前記フレームのビット数を推定する段階と、
バッファインクリメントのレートが閾値を超えているか否か、および、前記バッファの前記充填量のバッファ推定が閾値を超えているか否かの少なくとも一方に基づいてビデオバッファ検証(VBV)デルタを適用するかどうかを判断する段階と、
前記フレームの複雑度に対応する重み付け係数に関連付けられ、かつ、前記バッファインクリメントに関連付けられた複雑度デルタを計算する段階と、
前記VBVデルタを適用すると判断された場合に前記VBVデルタによって調整される初期のQpおよび前記複雑度デルタに少なくとも部分的に基づいて、前記より最終的なQpを決定する段階とを含み、
前記VBVデルタは、バッファステータスに関連付けられており、バッファの中間動作Qpに対し前記初期のQpを調整すべく適用されており、
前記バッファインクリメントは、フレームシーケンスのための平均ビットバッファレベルに対する前記ビット数の値であり、かつ前記フレームの前記ビット数を推定する前記段階に基づいており、
前記バッファ推定はバッファ充填量値と前記バッファインクリメントの値とに関連付けられている段階を備える、請求項1に記載の方法。 - 前記初期のQpは、ランク(0)のP‐ピクチャのQpである、請求項19に記載の方法。
- 現在のフレームに対する、複数の将来のフレームである多数のルックアヘッドフレームを事前分析する段階に少なくとも部分的に依存して、前記現在のフレームのためのより最終的なQpを形成する段階を備え、
前記事前分析する段階は、複数の前記ルックアヘッドフレームを完全にエンコードせずに、複数の前記ルックアヘッドフレームの複数の複雑度および動き特性を決定する段階を含む、請求項1に記載の方法。 - デルタ値でより初期のQpを調整する段階に少なくとも部分的に基づいて、より最終的なQpを決定する段階を備え、
前記調整する段階は、デルタ値を
(1)複雑度デルタ、および
(2)バッファの充填量に関連付けられたビデオバッファ検証(VBV)デルタを用いて決定する段階を含み、
前記複雑度デルタは、分析されている前記現在のフレームを有し、前記複数のルックアヘッドフレームを含むシーケンスの複雑度に関連付けられ、かつ、適応量子化によって形成されており、
前記適応量子化は、
I‐ピクチャに対するフレームの全ビット量と、前記I‐ピクチャを参照として使用する、同一シーケンス内の複数のI‐ピクチャ以外のものからの前記フレームの全ビット量とを変更することで、複数のビットをシフトすることによるキーフレームブースティングと
フレームの前記全ビット量を変更することで、複数のより複雑なフレームから複数のより複雑でないフレームへ、複数のビットを移し替える段階を含む時間的複雑度マスキングと、
複数の連続するフレームの複数のデルタ値のデルタQp係数スムージングとの少なくとも1つを含む、請求項21に記載の方法。 - 使用されたビット数および分析された複数の前記フレームの複雑度を取得すべく、初期のQpの複数の値を使用することによって、シーケンスの複数のフレームをエンコードする、第1のパス分析を実行する段階と、
前記シーケンスの複数の前記フレームを保持するバッファの中間動作ポイントに対応する中間動作ポイントQp近傍に、Qpを維持すべく、デルタ値によって前記初期のQpを調整することによって、前記シーケンスの複数の前記フレームのためのより最終的なフレームQpを決定すべく、第2のパス分析を実行する段階とを備え、
前記デルタ値は、バッファの充填量ステータスおよび分析されているフレームシーケンスの前記複雑度に関連付けられている、請求項1に記載の方法。 - 少なくともはじめに、前記フレームの前記レベルが前記ベースレベルに近いほど、前記複数のフレームのためのより小さい量子化パラメータを提供する段階を備え、
少なくともはじめに、すべての前記他の複数のレベルと比較して、前記複数のフレームのための最小の量子化パラメータを前記ベースレベルに提供する段階を備え、
Qpと、ターゲットビットレート毎の複数の将来のフレームの複数の利用可能な複雑度のうち平均時間的複雑度の値との間の所定の関係から、少なくとも前記ランク(0)のP‐ピクチャの初期のQpを形成する段階を備え、
前記ランク(0)のI‐ピクチャの複数のフレームの前記Qpを形成すべく、少なくとも前記P‐ピクチャのランク(0)の複数のフレームの前記初期のQpを使用する段階を備え、
フレームのためのランク(0)のI‐ピクチャのQp値を形成すべく、P‐ピクチャのランク(0)のQp値の、ランク(0)のI‐ピクチャのQp値に対する所定のマッピングを使用する段階を備え、
各非ゼロレべルのための固定初期フレームQpを決定する段階を備え、
非ゼロレベル上のフレームのタイプに関わらず、前記固定初期フレームQpが、前記非ゼロレベル上のすべてのフレームに対して確立され、
ランク(0)以外の複数のフレームの前記Qpを、以下の式から導出する段階を備え、
Qpr = inter_q[0] + ((fpic_q[0] - inter_q[0]) + (1.0/2.0)) x r
inter_q[0]は、前記ランク(0)の複数のP‐ピクチャのための初期のQpで、fpic_qは、前記ランク(0)の複数の機能性(F)‐ピクチャのために使用される前記初期のQpで、かつ、rは分析されている現在のフレームの前記ランクであり、
オプションとして、
複数の制限値をQp値に適用する段階を備えており、
前記複数の制限値は、
(1)シーケンスの開始における複数のフレームに対する、ビットレート、フレームレート、およびフレームの幅×高さに基づく、時空複雑度とピクセル毎のビット数(bpp)との間の関係に関連付けられた複数の所定値から導き出される複数の制限値、
(2)シーケンスの開始における複数のフレーム以外の複数のフレームに対する、分析されているフレームと同一のシーケンスの既にエンコードされた複数のフレームからのデータを含む履歴に少なくとも部分的に基づく、複数の前記フレームのための複数の制限値、
(3)複数のQp制限値を判断するために使用される中間Qpとしてこれまでにエンコードされた複数の前記フレームの平均Pqpを設定する段階の少なくとも1つから導き出され、
(2)において、
これまでにエンコードされた複数の前記フレームの中間Qpは、
(avg_pqp)これまでにエンコードされたすべての前記フレームの複数の前記平均Pqp、
(avg_cplx)平均時空複雑度、
(act_bits)これまでにエンコードされたすべての前記フレームに使用される全ビット数、
(cplx)前記現在のフレームの前記複雑度、および
(target_bits)前記現在のフレームを含む、すべての前記フレームのための全ターゲットビット数に基づいており、前記履歴のオプション(2)は、結果的に得られる前記中間Qpが前記平均Pqpの特定の割合の範囲内であるときに使用され、
(3)において、Pqpは前記P‐ピクチャのランク(0)のQpであり、
前記フレームがシーケンスの開始に存在するか、空白または静的シーンの一部であるか、あるいはそれらのいずれでもないかによって、初期のQpに対して、より最終的なフレームQpを別に決定する段階を備え、
前記フレームの前記ランクに少なくとも部分的に基づいて、初期のQpに対して、より最終的なフレームQpを決定する段階を備え、
前記初期のP‐ピクチャのランク(0)のQpと、I‐ピクチャ対P‐ピクチャのビット率との間の所定の関係に少なくとも部分的に基づいて、P‐ピクチャのための推定されるビット数の値(P_est_bits)を、確立する段階を備え、
F‐ピクチャのための推定されるビット数の値(F_est_bits)を、初期のP‐ピクチャのランク(0)のQpと、P‐ピクチャ対F‐ピクチャのビット率との間の所定の関係に基づいて、確立する段階を備え、前記F‐ピクチャのために、複数の過去の参照フレーム、複数の将来の参照フレーム、あるいはそれら両方を使用するオプションが提供される、
モーフィング技術または合成技術によって修正される、修正された複数の参照フレームをF‐ピクチャに提供する前記オプションを提供する段階を備え、
フレームのビット数の推定は、線形モデルを用いて計算され、前記フレームのフレームタイプとレベルとの複数の異なる組み合わせに対して異なり、複数の前記フレームタイプは、少なくともP‐ピクチャ、F‐ピクチャ、B‐ピクチャ、またはI‐ピクチャを含む、
バッファのビット容量に対する、前記バッファの中間動作ポイントに対するバッファ充填量を維持すべく、より最終的なフレームQpを決定する段階を備え、
前記バッファは、デコーダにおけるバッファの複数のパラメータを模倣する、エンコーダにおける仮想バッファであり、
バッファのバッファ充填量に応答する、フレームのためのより最終的なQpを決定する段階であって、
レベル応答型の複数のQpモデルで、前記フレームのビット数を推定する段階と、
バッファインクリメントのレートが閾値を超えているか否か、および、前記バッファの前記充填量のバッファ推定が閾値を超えているか否かの少なくとも一方に基づいてビデオバッファ検証(VBV)デルタを適用するかどうかを判断する段階と、
前記フレームの複雑度に対応する重み付け係数に関連付けられ、かつ、前記バッファインクリメントに関連付けられた複雑度デルタを計算する段階と、
前記VBVデルタを適用すると判断された場合に前記VBVデルタによって調整される前記初期のQpおよび前記複雑度デルタに少なくとも部分的に基づいて、前記より最終的なQpを決定する段階とを含み、
前記VBVデルタは、バッファステータスに関連付けられており、バッファの中間動作Qpに対し初期のQpを調整すべく適用されており、
前記1または複数の閾値は、前記バッファインクリメントのレートの閾値、および、前記バッファの前記充填量のバッファ推定の閾値の少なくとも1つであり、
前記バッファインクリメントは、フレームシーケンスのための平均ビットバッファレベルに対する前記ビット数の値であり、かつ前記フレームのビット数を推定する段階に基づいており、
前記バッファ推定はバッファ充填量値と前記バッファインクリメントの値とに関連付けられている段階を備え、
前記初期のQpは、ランク(0)のP‐ピクチャのQpであり、
少なくとも以下の(A)および(B)の1つを含んでおり、
(A)ルックアヘッドを備える単一パスの分析を実行する段階であって、
現在のフレームに対する、複数の将来のフレームである多数のルックアヘッドフレームを事前分析する段階に少なくとも部分的に依存して、前記現在のフレームのためのより最終的なQpを形成する段階を備え、
前記事前分析する段階は、複数の前記ルックアヘッドフレームを完全にエンコードせずに、複数の前記ルックアヘッドフレームの複数の前記複雑度および動き特性を決定する段階を含む、
デルタ値でより初期のQpを調整する段階に少なくとも部分的に基づいて、より最終的なQpを決定する段階を備え、
前記調整する段階は、デルタ値を
(1)複雑度デルタ、および
(2)バッファの充填量に関連付けられたビデオバッファ検証(VBV)デルタを用いて決定する段階を含み、
前記複雑度デルタは、分析されている前記現在のフレームを有し、前記複数のルックアヘッドフレームを含むシーケンスの複雑度に関連付けられ、かつ、適応量子化によって形成されており、
前記適応量子化は、
I‐ピクチャに対するフレームの全ビット量と、前記I‐ピクチャを参照として使用する、同一シーケンス内の複数のI‐ピクチャ以外のものからの前記フレームの全ビット量とを変更することで、複数のビットをシフトすることによるキーフレームブースティングと、
フレームの全ビット量を変更することで、複数のより複雑なフレームから複数のより複雑でないフレームへ、複数のビットを移し替える段階を含む時間的複雑度マスキングと、
複数の連続するフレームの複数のデルタ値のデルタQp係数スムージングとの少なくとも1つを含むルックアヘッドを備える単一パスの分析を実行する段階と、
(B)2パスの分析を実行する段階であって、
使用された前記ビット数および分析された複数の前記フレームの複雑度を取得すべく、前記初期のQpの複数の値を使用することによって、シーケンスの複数のフレームをエンコードする、第1のパス分析を実行する段階と、
前記シーケンスの複数の前記フレームを保持するバッファの中間動作ポイントに対応する中間動作ポイントQp近傍に、Qpを維持すべく、デルタ値によって前記初期のQpを調整することによって、前記シーケンスの複数の前記フレームのためのより最終的なフレームQpを決定すべく、第2のパス分析を実行する段階とを備え、
前記デルタ値は、バッファの充填量ステータスおよび分析されている前記フレームシーケンスの前記複雑度に関連付けられている2パスの分析を実行する段階を備える、請求項1に記載の方法。 - イメージバッファと、
グラフィックス処理ユニットとを備えるコーダであって、
前記グラフィックス処理ユニットは、入力ビデオ順序で、かつ、マルチレベル階層に関連付けられた状態でピクセルデータの複数のフレームを取得し、
少なくとも1つの現在のフレームの前記階層の前記レベルに少なくとも依存して、複数の前記フレームに対する量子化パラメータ(Qp)を決定すると共に、ランク(0)以外の複数のフレームの前記量子化パラメータを、Qpr = inter_q[0]+デルタ係数×r(但し、inter_q[0]は既定値、rは分析されている現在のフレームの前記ランク)から導出し、
前記マルチレベル階層は、
複数の参照フレームとして使用される、複数のI‐ピクチャ若しくは複数のP‐ピクチャまたはそれら両方を少なくとも備えるベースレベルと、
前記ベースレベル上の複数のフレームを複数の参照として使用する複数のピクチャを備える少なくとも1つの中間レベルと、
複数の参照フレームとして使用されず、かつ、他の複数のレベルの前記複数のフレームを複数の参照として使用する複数のピクチャを備える最大レベルとを含み、
複数のP‐ピクチャは、前記順序に関連して複数の過去のフレームを複数の参照として使用し、
前記最大レベル上の複数のピクチャは、複数の過去の参照フレーム、複数の将来の参照フレーム、あるいはそれら両方を使用するオプションが提供され、
各フレームは前記フレームが存在する前記レベルに関連付けられたランクが付与されるよう構成されているコーダ。 - さらに、少なくともはじめに、前記フレームの前記レベルが前記ベースレベルに近いほど、前記複数のフレームのためのより小さい量子化パラメータを提供し、
少なくともはじめに、すべての前記他の複数のレベルと比較して、前記複数のフレームのための最小の量子化パラメータを前記ベースレベルに提供し、
Qpと、ターゲットビットレート毎の複数の将来のフレームの複数の利用可能な複雑度のうち平均時間的複雑度の値との間の所定の関係から、少なくとも前記ランク(0)のP‐ピクチャの初期のQpを形成し、
前記ランク(0)のI‐ピクチャの複数のフレームの前記Qpを形成すべく、少なくとも前記P‐ピクチャのランク(0)の複数のフレームの前記初期のQpを使用し、
フレームのためのランク(0)のI‐ピクチャのQp値を形成すべく、P‐ピクチャのランク(0)のQp値の、ランク(0)のI‐ピクチャのQp値に対する所定のマッピングを使用し、
各非ゼロレベルのための固定初期フレームQpを決定し、
非ゼロレベル上のフレームのタイプに関わらず、前記固定初期フレームQpが、前記非ゼロレベル上のすべてのフレームに対して確立され、
ランク(0)以外の複数のフレームの前記Qpを、以下の式から導出し、
Qpr = inter_q[0] + ((fpic_q[0] - inter_q[0]) + (1.0/2.0)) x r
inter_q[0]は、前記ランク(0)の複数のP‐ピクチャのための初期のQpで、fpic_qは、前記ランク(0)の複数の機能性(F)‐ピクチャのために使用される前記初期のQpで、かつ、rは分析されている現在のフレームの前記ランクであり、
オプションとして、
複数の制限値をQp値に適用し、
前記複数の制限値は、
(1)シーケンスの開始における複数のフレームに対する、ビットレート、フレームレート、およびフレームの幅×高さに基づく、時空複雑度とピクセル毎のビット数(bpp)との間の関係に関連付けられた複数の所定値から導き出される複数の制限値、
(2)シーケンスの開始における複数のフレーム以外の複数のフレームに対する、分析されているフレームと同一のシーケンスの既にエンコードされた複数のフレームからのデータを含む履歴に少なくとも部分的に基づく、複数の前記フレームのための複数の制限値、
(3)複数のQp制限値を判断するために使用される中間Qpとしてこれまでにエンコードされた複数の前記フレームの平均Pqpを設定することの少なくとも1つから導き出され、
(2)において、
これまでにエンコードされた複数の前記フレームの中間Qpは、
(avg_pqp)これまでにエンコードされたすべての前記フレームの複数の前記平均Pqp、
(avg_cplx)平均時空複雑度、
(act_bits)これまでにエンコードされたすべての前記フレームに使用される全ビット数、
(cplx)前記現在のフレームの前記複雑度、および
(target_bits)前記現在のフレームを含む、すべての前記フレームのための全ターゲットビット数に基づいており、前記履歴のオプション(2)は、結果的に得られる前記中間Qpが前記平均Pqpの特定の割合の範囲内であるときに使用され、
(3)において、Pqpは前記P‐ピクチャのランク(0)のQpであり、
前記フレームがシーケンスの開始に存在するか、空白または静的シーンの一部であるか、あるいはそれらのいずれでもないかによって、初期のQpに対して、より最終的なフレームQpを別に決定し、
前記フレームの前記ランクに少なくとも部分的に基づいて、初期のQpに対して、より最終的なフレームQpを決定し、
前記初期のP‐ピクチャのランク(0)のQpと、I‐ピクチャ対P‐ピクチャのビット率との間の所定の関係に少なくとも部分的に基づいて、P‐ピクチャのための推定されるビット数の値(P_est_bits)を確立し、
F‐ピクチャのための推定されるビット数の値(F_est_bits)を、初期のP‐ピクチャのランク(0)のQpと、P‐ピクチャ対F‐ピクチャのビット率との間の所定の関係に基づいて確立することを備え、前記F‐ピクチャのために、複数の過去の参照フレーム、複数の将来の参照フレーム、あるいはそれら両方を使用するオプションが提供され、
モーフィング技術または合成技術によって修正される、修正された複数の参照フレームをF‐ピクチャに提供する前記オプションを提供し、
フレームのビット数の推定は、線形モデルを用いて計算され、前記フレームのフレームタイプとレベルとの複数の異なる組み合わせに対して異なり、複数の前記フレームタイプは、少なくともP‐ピクチャ、F‐ピクチャ、B‐ピクチャ、またはI‐ピクチャを含み、
バッファのビット容量に対する、前記バッファの中間動作ポイントに対するバッファ充填量を維持すべく、より最終的なフレームQpを決定し、
前記バッファは、デコーダにおけるバッファの複数のパラメータを模倣する、エンコーダにおける仮想バッファであり、
バッファのバッファ充填量に応答する、フレームのためのより最終的なQpを決定することであって、
レベル応答型の複数のQpモデルで、前記フレームのビット数を推定し、
バッファインクリメントのレートが閾値を超えているか否か、および、前記バッファの前記充填量のバッファ推定が閾値を超えているか否かの少なくとも一方に基づいてビデオバッファ検証(VBV)デルタを適用するかどうかを判断し、
前記フレームの複雑度に対応する重み付け係数に関連付けられ、かつ、前記バッファインクリメントに関連付けられた複雑度デルタを計算し、
前記VBVデルタを適用すると判断された場合に前記VBVデルタによって調整される前記初期のQpおよび前記複雑度デルタに少なくとも部分的に基づいて、前記より最終的なQpを決定することとを含み、
前記VBVデルタは、バッファステータスに関連付けられており、バッファの中間動作Qpに対し初期のQpを調整すべく適用されており、
前記1または複数の閾値は、前記バッファインクリメントのレートの閾値、および、前記バッファの前記充填量のバッファ推定の閾値の少なくとも1つであり、
前記バッファインクリメントは、フレームシーケンスのための平均ビットバッファレベルに対する前記ビット数の値であり、かつ前記フレームのビット数を推定することに基づいており、
前記バッファ推定はバッファ充填量値と前記バッファインクリメントの値とに関連付けられており、
前記初期のQpは、ランク(0)のP‐ピクチャのQpであり、
少なくとも以下の(A)および(B)の1つを含んでおり、
(A)ルックアヘッドを備える単一パスの分析を実行することであって、
現在のフレームに対する、複数の将来のフレームである多数のルックアヘッドフレームを事前分析することに少なくとも部分的に依存して、前記現在のフレームのためのより最終的なQpを形成し、
前記事前分析することは、複数の前記ルックアヘッドフレームを完全にエンコードせずに、複数の前記ルックアヘッドフレームの複数の前記複雑度および動き特性を決定することを含み、
デルタ値でより初期のQpを調整することに少なくとも部分的に基づいて、より最終的なQpを決定し、
前記調整することは、デルタ値を
(1)複雑度デルタ、および
(2)バッファの充填量に関連付けられたビデオバッファ検証(VBV)デルタを用いて決定することを含み、
前記複雑度デルタは、分析されている前記現在のフレームを有し、前記複数のルックアヘッドフレームを含むシーケンスの複雑度に関連付けられ、かつ、適応量子化によって形成されており、
前記適応量子化は、
I‐ピクチャに対するフレームの全ビット量と、前記I‐ピクチャを参照として使用する、同一シーケンス内の複数のI‐ピクチャ以外のものからの前記フレームの全ビット量とを変更することで、複数のビットをシフトすることによるキーフレームブースティングと、
フレームの全ビット量を変更することで、複数のより複雑なフレームから複数のより複雑でないフレームへ、複数のビットを移し替えることを含む時間的複雑度マスキングと、
複数の連続するフレームの複数のデルタ値のデルタQp係数スムージングとの少なくとも1つを含むルックアヘッドを備える単一パスの分析を実行することと、
(B)2パスの分析を実行することであって、
使用された前記ビット数および分析された複数の前記フレームの複雑度を取得すべく、前記初期のQpの複数の値を使用することによって、シーケンスの複数のフレームをエンコードする、第1のパス分析を実行し、
前記シーケンスの複数の前記フレームを保持するバッファの中間動作ポイントに対応する中間動作ポイントQp近傍に、Qpを維持すべく、デルタ値によって前記初期のQpを調整することによって、前記シーケンスの複数の前記フレームのためのより最終的なフレームQpを決定すべく、第2のパス分析を実行することを備え、
前記デルタ値は、バッファの充填量ステータスおよび分析されている前記フレームシーケンスの前記複雑度に関連付けられている2パスの分析を実行することを備えるよう構成されている、請求項25に記載のコーダ。 - ビデオコーディングのためのルックアヘッドを備える1パスレートコントロールのためのコンピュータ実装方法であって、
入力ビデオ順序で、かつ、マルチレベル階層に関連付けられた状態でピクセルデータの複数のフレームを取得する段階と、
現在のフレームの前記階層の前記レベルに少なくとも依存して、複数の前記フレームに対する初期の量子化パラメータ(Qp)を決定する段階であって、各フレームは前記フレームが存在する前記レベルに関連付けられたランクが付与される段階と、
現在のフレームに対する、複数の将来のフレームであり、かつ、複数のルックアヘッドフレームを完全にエンコードせずに、前記複数のルックアヘッドフレームの複雑度または動きあるいはそれら両方の複数の特性を決定すべく、分析された、多数のルックアヘッドフレームを事前分析する段階と、
前記現在のフレームの前記初期のQpを調整すべく、前記複数のルックアヘッドフレームの分析の複数の結果を使用することにより、より最終的なQpを決定する段階とを備え、
前記マルチレベル階層は、
複数の参照フレームとして使用される、複数のI‐ピクチャ若しくは複数のP‐ピクチャまたはそれら両方を少なくとも備えるベースレベルと、
前記ベースレベル上の複数のフレームを複数の参照として使用する複数のピクチャを備える少なくとも1つの中間レベルと、
複数の参照フレームとして使用されず、かつ、他の複数のレベルの前記複数のフレームを複数の参照として使用する複数のピクチャを備える最大レベルとを含み、
複数のP‐ピクチャは、前記順序に関連して複数の過去のフレームを複数の参照として使用し、
前記最大レベル上の複数のピクチャは、複数の過去の参照フレーム、複数の将来の参照フレーム、あるいはそれら両方を使用するオプションが提供され、
前記初期の量子化パラメータを決定する段階は、
ランク(0)以外の複数のフレームの前記初期の量子化パラメータを、Qpr = inter_q[0]+デルタ係数×r(但し、inter_q[0]は既定値、rは分析されている現在のフレームの前記ランク)から導出する段階を有する、方法。 - デコーダにおけるバッファの動作を模倣するバッファのバッファステータスを決定する段階に少なくとも部分的に基づいて、より最終的なQpを決定する段階を備え、
前記バッファは、前記ルックアヘッドの複数の将来のフレームのためのスペースを含む、請求項27に記載の方法。 - バッファステータスを決定する前記段階は、前記バッファの中間動作ポイントに対応するターゲットの中間動作ポイントQpに近づけるべく、複数のフレームのための現在のQpを変調する段階を含む、請求項28に記載の方法。
- 前記より最終的なQpを決定する段階は、前記バッファの前記充填量ステータスに関連付けられたビデオバッファ検証デルタで少なくとも部分的に形成されたデルタ値によって、初期のQpを調整する段階を含む、請求項28に記載の方法。
- 前記より最終的なQpを決定する段階は、分析されている、前記現在のフレームおよび複数の前記ルックアヘッドフレームを含むフレームシーケンスの前記複雑度に関連付けられた複雑度デルタで少なくとも部分的に形成されたデルタ値によって、初期のQpを調整する段階を含む、請求項28に記載の方法。
- 前記複雑度デルタは、
適応量子化を実行する段階、および
前記フレームシーケンスの平均複雑度を使用する段階によって形成され、
前記適応量子化は、複数のより複雑でないフレームから複数のより複雑なフレームへ複数のビットを移し替える時間的複雑度マスキングを含み、
前記フレームシーケンスの平均複雑度は、複数の前記ルックアヘッドフレームの複数の前記複雑度を含む、請求項31に記載の方法。 - 前記複雑度デルタは、適応量子化を実行する段階によって形成され、
前記適応量子化は、低い複雑度の複数のフレームシーケンスにおいて、I‐ピクチャに対する、かつ、前記I‐ピクチャを参照として使用する、同一シーケンス内の複数のI‐ピクチャ以外のものからの、複数のビットをシフトすることによるキーフレームブースティングを含み、
前記フレームシーケンスは、複数の前記ルックアヘッドフレームの複数の前記複雑度を少なくとも部分的に使用することによって、低い複雑度であると決定される、請求項31に記載の方法。 - VBVデルタ後の結果的に得られるQpが適用され、バッファの充填量ステータスに関連付けられており、前記複雑度デルタを適用することによって、前記結果的に得られるQpを調整する、請求項31に記載の方法。
- 前記より最終的なQpを決定する段階は、適応量子化を実行することによって初期のQpを調整する段階と、
複数の連続するフレーム間のQpの変化を制限するためのVBVのQp係数スムージングと複数の連続するフレームの複雑度デルタの複数の値とに少なくとも部分的により、かつ、複数の前記フレームのタイプとランクの組み合わせに依存して、デルタを形成する段階とを含んでおり、
前記適応量子化は、前記初期のQpを調整するための前記デルタを形成する、請求項31に記載の方法。 - デコーダにおけるバッファの動作を模倣するバッファのバッファステータスを決定する段階に少なくとも部分的に基づいて、より最終的なQpを決定する段階を備え、
前記バッファは、前記ルックアヘッドの複数の将来のフレームのためのスペースを含み、
バッファステータスを決定する前記段階は、前記バッファの中間動作ポイントに対応するターゲットの中間動作ポイントQpに近づけるべく、複数のフレームのための現在のQpを変調する段階を含み、
前記より最終的なQpを決定する段階は、
前記バッファの充填量ステータスに関連付けられたビデオバッファ検証デルタと、
分析されている、前記現在のフレームおよび複数の前記ルックアヘッドフレームを含むフレームシーケンスの前記複雑度に関連付けられた複雑度デルタとの、少なくとも1つによって部分的に形成されたデルタ値による、初期のQpを調整する段階を含み、
前記複雑度デルタは、
適応量子化を実行する段階、および
前記フレームシーケンスの平均複雑度を使用する段階によって形成され、
前記適応量子化は、複数のより複雑でないフレームから複数のより複雑なフレームへ複数のビットを移し替える時間的複雑度マスキングを含み、
前記フレームシーケンスの平均複雑度は、複数の前記ルックアヘッドフレームの複数の前記複雑度を含み、
前記複雑度デルタは、適応量子化を実行する段階によって形成され、
前記適応量子化は、低い複雑度の複数のフレームシーケンスにおいて、I‐ピクチャに対する、かつ、前記I‐ピクチャを参照として使用する、同一シーケンス内の複数のI‐ピクチャ以外のものからの、複数のビットをシフトすることによるキーフレームブースティングを含み、
前記フレームシーケンスは、複数の前記ルックアヘッドフレームの複数の前記複雑度を少なくとも部分的に使用することによって、低い複雑度であると決定され、
VBVデルタ後の結果的に得られるQpが適用され、バッファの充填量ステータスに関連付けられており、前記複雑度デルタを適用することによって、前記結果的に得られるQpを調整する、
前記より最終的なQpを決定する段階は、適応量子化を実行することによって初期のQpを調整する段階と、
複数の連続するフレーム間のQpの変化を制限するためのVBVのQp係数スムージングと複数の連続するフレームの複雑度デルタの複数の値とに少なくとも部分的により、かつ、複数の前記フレームのタイプとランクの組み合わせに依存して、デルタを形成する段階とを含んでおり、
前記適応量子化は、前記初期のQpを調整するための前記デルタを形成する、請求項27に記載の方法。 - イメージバッファと、
グラフィックス処理ユニットとを備えるコーダであって、
前記グラフィックス処理ユニットは、
入力ビデオ順序で、かつ、マルチレベル階層に関連付けられた状態でピクセルデータの複数のフレームを取得し、
現在のフレームの前記階層の前記レベルに少なくとも依存して、複数の前記フレームに対する初期の量子化パラメータ(Qp)を決定すると共に、ランク(0)以外の複数のフレームの前記初期の量子化パラメータを、Qpr = inter_q[0]+デルタ係数×r(但し、inter_q[0]は既定値、rは分析されている現在のフレームの前記ランク)から導出し、各フレームは前記フレームが存在する前記レベルに関連付けられたランクが付与され、
現在のフレームに対する、複数の将来のフレームであり、かつ、複数のルックアヘッドフレームを完全にエンコードせずに、前記複数のルックアヘッドフレームの複雑度または動きあるいはそれら両方の複数の特性を決定すべく分析された、多数のルックアヘッドフレームを事前分析し、
前記現在のフレームの前記初期のQpを調整すべく、前記複数のルックアヘッドフレームの分析の複数の結果を使用することにより、より最終的なQpを決定し、
前記マルチレベル階層は、
複数の参照フレームとして使用される、複数のI‐ピクチャ若しくは複数のP‐ピクチャまたはそれら両方を少なくとも備えるベースレベルと、
前記ベースレベル上の複数のフレームを複数の参照として使用する複数のピクチャを備える少なくとも1つの中間レベルと、
複数の参照フレームとして使用されず、かつ、他の複数のレベルの前記複数のフレームを複数の参照として使用する複数のピクチャを備える最大レベルとを含み、
複数のP‐ピクチャは、前記順序に関連して複数の過去のフレームを複数の参照として使用し、
前記最大レベル上の複数のピクチャは、複数の過去の参照フレーム、複数の将来の参照フレーム、あるいはそれら両方を使用するオプションが提供されるよう構成されているコーダ。 - さらに、
デコーダにおけるバッファの動作を模倣するバッファのバッファステータスを決定することに少なくとも部分的に基づいて、より最終的なQpを決定し、
前記バッファは、ルックアヘッドの複数の将来のフレームのためのスペースを含み、
バッファステータスを決定することは、前記バッファの中間動作ポイントに対応するターゲットの中間動作ポイントQpに近づけるべく、複数のフレームのための現在のQpを変調することを含み、
前記より最終的なQpを決定することは、
前記バッファの充填量ステータスに関連付けられたビデオバッファ検証デルタと、
分析されている、前記現在のフレームおよび複数の前記ルックアヘッドフレームを含むフレームシーケンスの前記複雑度に関連付けられた複雑度デルタとの、少なくとも1つによって部分的に形成されたデルタ値による、初期のQpを調整することを含み、
前記複雑度デルタは、
適応量子化を実行すること、および
前記フレームシーケンスの平均複雑度を使用することによって形成され、
前記適応量子化は、複数のより複雑でないフレームから複数のより複雑なフレームへ複数のビットを移し替える時間的複雑度マスキングを含み、
前記フレームシーケンスの平均複雑度は、複数の前記ルックアヘッドフレームの複数の前記複雑度を含み、
前記複雑度デルタは、適応量子化を実行することによって形成され、
前記適応量子化は、低い複雑度の複数のフレームシーケンスにおいて、I‐ピクチャに対する、かつ、前記I‐ピクチャを参照として使用する、同一シーケンス内の複数のI‐ピクチャ以外のものからの、複数のビットをシフトすることによるキーフレームブースティングを含み、
前記フレームシーケンスは、複数の前記ルックアヘッドフレームの複数の前記複雑度を少なくとも部分的に使用することによって、低い複雑度であると決定され、
VBVデルタ後の結果的に得られるQpが適用され、バッファの充填量ステータスに関連付けられており、前記複雑度デルタを適用することによって、前記結果的に得られるQpを調整し、
前記より最終的なQpを決定することは、適応量子化を実行することによって初期のQpを調整することと、
複数の連続するフレーム間のQpの変化を制限するためのVBVのQp係数スムージングと複数の連続するフレームの複雑度デルタの複数の値とに少なくとも部分的により、かつ、複数の前記フレームのタイプとランクの組み合わせに依存して、デルタを形成することとを含んでおり、
前記適応量子化は、前記初期のQpを調整するための前記デルタを形成するように構成されている、請求項37に記載のコーダ。 - ビデオコーディングのための2パスレートコントロールのためのコンピュータ実装方法であって、
入力ビデオ順序で、かつ、マルチレベル階層に関連付けられた状態でピクセルデータの複数のフレームを取得する段階と、
分析される各フレームのための初期の既定の量子化パラメータ(Qp)を用いて第1のパス分析を実行する段階と、
個々の複数のフレームおよびコーディングのための、より最終的な量子化パラメータ(Qp)を決定する段階を含む第2のパス分析を実行する段階と、
コーディングに使用されるフレームのためのターゲットQp、および前記第1のパス分析の複数の統計を更新するためのフレームのためのターゲットビット数を決定する段階とを備え、
前記第1のパス分析を実行する段階において、複数の前記初期の既定のQpは、現在のフレームの前記階層の前記レベルに少なくとも部分的に基づいて確立され、各フレームは前記フレームが存在する前記レベルに関連付けられたランクが付与されており、ランク(0)以外の複数のフレームの前記初期の既定のQPは、Qpr = inter_q[0]+デルタ係数×r(但し、inter_q[0]は既定値、rは分析されている現在のフレームの前記ランク)から導出され、かつ、前記第1のパス分析を実行する段階は、分析される複数の前記フレームのための複雑度およびビット数を決定するのに十分なように複数の前記フレームをエンコーディングする段階を含み、
前記第2のパス分析を実行する段階は、1または複数のフレームの品質を強化すべく、適応量子化を実行する段階を含み、前記適応量子化を実行する段階は、同一のシーケンス内の少なくとも1つの他のフレームのためのビット量を減少させつつ、少なくとも1つのフレームのための全ビット量を増加させることによって複数のビットをシフトすることを含み、
前記マルチレベル階層は、
複数の参照フレームとして使用される、複数のI‐ピクチャ若しくは複数のP‐ピクチャまたはそれら両方を少なくとも備えるベースレベルと、
前記ベースレベル上の複数のフレームを複数の参照として使用する複数のピクチャを備える少なくとも1つの中間レベルと、
複数の参照フレームとして使用されず、かつ、他の複数のレベルの前記複数のフレームを複数の参照として使用する複数のピクチャを備える最大レベルとを含み、
複数のP‐ピクチャは、前記順序に関連して複数の過去のフレームを複数の参照として使用し、
前記最大レベル上の複数のピクチャは、複数の過去の参照フレーム、複数の将来の参照フレーム、あるいはそれら両方を使用するオプションが提供される方法。 - 前記第1のパス分析は、前記シーケンス内のすべての前記フレームをエンコードする、請求項39に記載の方法。
- 複雑度、ビットレート、およびQpの間の所定の関係を使用することによって、前記初期の既定のランク(0)のP‐ピクチャが形成される、請求項39に記載の方法。
- フレーム毎のターゲットビット数に一致させるべく、複数の前記フレームをスケーリングする段階を備える、請求項39に記載の方法。
- 前記適応量子化を実行する段階は、I‐フレームに対する、かつ、前記I‐フレームを参照として使用する複数の前記フレームからの、複数のビットをシフトすることを含むキーフレームブースティングを含む、請求項39に記載の方法。
- 前記適応量子化を実行する段階は、シーケンス内の複数のより複雑なフレームから、複数のより複雑でないフレームへ移し替えることを含み、かつ、同一タイプおよびランクのフレームの複数の組み合わせに依存する、時間的複雑度マスキングを含む、請求項39に記載の方法。
- スケーリングする段階および前記適応量子化は、ターゲットビットフレームサイズをもたらし、
前記方法は、前記第1のパス分析および前記ターゲットビットフレームサイズ(tgt_size)において決定された、前記フレームの前記ビット数およびQpに依存して、フレームのコーディングのための推定される最終的なQpを決定する段階を含む、請求項39に記載の方法。 - 前記適応量子化を実行する段階は、デルタQp係数を形成し、かつ、
複数の連続するフレーム間のQpの変化を制限するための複数の連続するフレームのQp係数スムージングを含み、かつ、複数の前記フレームのタイプとランクの組み合わせに依存する、請求項39に記載の方法。 - 分析されている前記フレームのフレームランクおよびタイプを考慮する反復を使用することによって、より最終的なQpを決定する段階を備える、請求項39に記載の方法。
- 前記反復は、適応量子化のデルタQp係数も考慮する、請求項47に記載の方法。
- 前記反復は、前記第1のパス分析からのフレーム毎の前記ビット数およびQpも考慮する、請求項47に記載の方法。
- 前記反復は、
段階値に基づき、テストQp値を設定する段階と、
選択されたフレームのための予想される全ビット数を計算する段階と、
前記予想される全ビット数を、閾値としてのターゲットビット数の値と比較する段階と、
前記予想される全ビット数が前記閾値を超えているかどうかによって、前記テストQp値を別に変更する段階と、
テストQpを有限回数に設定することで、処理を再開する段階とを含み、
前記予想される全ビット数は、分析されている前記フレームのフレームランクおよびタイプ、適応量子化のデルタQp係数、および前記第1のパス分析からのフレーム毎のビット数およびQpに少なくとも部分的に基づいている、請求項47に記載の方法。 - 前記第1のパス分析は、前記シーケンス内のすべての前記フレームをエンコードし、
複雑度、ビットレート、およびQpの間の所定の関係を使用することによって、前記初期の既定のランク(0)のP‐ピクチャが形成され、
フレーム毎のターゲットビット数に一致させるべく、複数の前記フレームをスケーリングする段階を備え、
前記適応量子化を実行する段階は、I‐フレームに対する、かつ、前記I‐フレームを参照として使用する複数の前記フレームからの、複数のビットをシフトすることを含むキーフレームブースティングを含み、
前記適応量子化を実行する段階は、シーケンス内の複数のより複雑なフレームから、複数のより複雑でないフレームへ移し替えることを含み、かつ、同一タイプおよびランクのフレームの複数の組み合わせに依存する、時間的複雑度マスキングを含み、
スケーリングする段階および前記適応量子化は、ターゲットビットフレームサイズをもたらし、
前記方法は、前記第1のパス分析および前記ターゲットビットフレームサイズ(tgt_size)において決定された、前記フレームの前記ビット数およびQpに依存して、フレームのコーディングのための推定される最終的なQpを決定する段階を含み、
前記適応量子化を実行する段階は、デルタQp係数を形成し、かつ、
複数の連続するフレーム間のQpの変化を制限するための複数の連続するフレームのQp係数スムージングを含み、かつ、複数の前記フレームのタイプとランクの組み合わせに依存し、
分析されている前記フレームのフレームランクおよびタイプを考慮する反復を使用することによって、より最終的なQpを決定する段階を備え、
前記反復は、適応量子化の前記デルタQp係数も考慮し、
前記反復は、前記第1のパス分析からのフレーム毎の前記ビット数およびQpも考慮し、
前記反復は、
段階値に基づき、テストQp値を設定する段階と、
選択されたフレームのための予想される全ビット数を計算する段階と、
前記予想される全ビット数を、閾値としてのターゲットビット数の値と比較する段階と、
前記予想される全ビット数が前記閾値を超えているかどうかによって、前記テストQp値を別に変更する段階と、
テストQpを有限回数に設定することで、処理を再開する段階とを含み、
前記予想される全ビット数は、分析されている前記フレームのフレームランクおよびタイプ、適応量子化のデルタQp係数、および前記第1のパス分析からのフレーム毎のビット数およびQpに少なくとも部分的に基づいている、請求項39に記載の方法。 - イメージバッファと、
グラフィックス処理ユニットとを備えるコーダであって、
入力ビデオ順序で、かつ、マルチレベル階層に関連付けられた状態でピクセルデータの複数のフレームを取得し、
分析される各フレームのための初期の既定の量子化パラメータ(Qp)を用いて第1のパス分析を実行し、
個々の複数のフレームおよびコーディングのための、より最終的な量子化パラメータ(Qp)を決定することを含む第2のパス分析を実行することと、
コーディングに使用されるフレームのためのターゲットQp、および前記第1のパス分析の複数の統計を更新するためのフレームのためのターゲットビット数を決定することとを備え、
前記第1のパス分析を実行することにおいて、複数の前記初期の既定のQpは、現在のフレームの前記階層の前記レベルに少なくとも部分的に基づいて確立され、各フレームは前記フレームが存在する前記レベルに関連付けられたランクが付与されており、ランク(0)以外の複数のフレームの前記初期の既定のQPは、Qpr = inter_q[0]+デルタ係数×r(但し、inter_q[0]は既定値、rは分析されている現在のフレームの前記ランク)から導出され、かつ、前記第1のパス分析を実行することは、分析される複数の前記フレームのための複雑度およびビット数を決定するのに十分なように複数の前記フレームをエンコーディングすることを含み、
前記第2のパス分析を実行することは、1または複数のフレームの品質を強化すべく、適応量子化を実行することを含み、前記適応量子化を実行することは、同一のシーケンス内の少なくとも1つの他のフレームのためのビット量を減少させつつ、少なくとも1つのフレームのための全ビット量を増加させることによって複数のビットをシフトすることを含み、
前記マルチレベル階層は、
複数の参照フレームとして使用される、複数のI‐ピクチャ若しくは複数のP‐ピクチャまたはそれら両方を少なくとも備えるベースレベルと、
前記ベースレベル上の複数のフレームを複数の参照として使用する複数のピクチャを備える少なくとも1つの中間レベルと、
複数の参照フレームとして使用されず、かつ、他の複数のレベルの前記複数のフレームを複数の参照として使用する複数のピクチャを備える最大レベルとを含み、
複数のP‐ピクチャは、前記順序に関連して複数の過去のフレームを複数の参照として使用し、
前記最大レベル上の複数のピクチャは、複数の過去の参照フレーム、複数の将来の参照フレーム、あるいはそれら両方を使用するオプションが提供されるよう構成されているコーダ。 - 前記第1のパス分析は、前記シーケンス内のすべての前記フレームをエンコードし、
複雑度、ビットレート、およびQpの間の所定の関係を使用することによって、前記初期の既定のランク(0)のP‐ピクチャが形成され、
前記コーダは、フレーム毎のターゲットビット数に一致させるべく、複数の前記フレームをスケーリングするよう構成されており、
前記適応量子化を実行することは、I‐フレームに対する、かつ、前記I‐フレームを参照として使用する複数の前記フレームからの、複数のビットをシフトすることを含むキーフレームブースティングを含み、
前記適応量子化を実行することは、シーケンス内の複数のより複雑なフレームから、複数のより複雑でないフレームへ移し替えることを含み、かつ、同一タイプおよびランクのフレームの複数の組み合わせに依存する、時間的複雑度マスキングを含み、
スケーリングすることおよび前記適応量子化は、ターゲットビットフレームサイズをもたらし、
前記第1のパス分析および前記ターゲットビットフレームサイズ(tgt_size)において決定された、前記フレームの前記ビット数およびQpに依存して、フレームのコーディングのための推定される最終的なQpを決定することを含み、
前記適応量子化を実行することは、デルタQp係数を形成し、かつ、
複数の連続するフレーム間のQpの変化を制限するための複数の連続するフレームのQp係数スムージングを含み、かつ、複数の前記フレームのタイプとランクの組み合わせに依存し、
前記コーダは、分析されている前記フレームのフレームランクおよびタイプを考慮する反復を使用することによって、より最終的なQpを決定するよう構成されており、
前記反復は、適応量子化の前記デルタQp係数も考慮し、
前記反復は、前記第1のパス分析からのフレーム毎の前記ビット数およびQpも考慮し、
前記反復は、
段階値に基づき、テストQp値を設定することと、
選択されたフレームのための予想される全ビット数を計算することと、
前記予想される全ビット数を、閾値としてのターゲットビット数の値と比較することと、
前記予想される全ビット数が前記閾値を超えているかどうかによって、前記テストQp値を別に変更することと、
テストQpを有限回数に設定することで、処理を再開することとを含み、
前記予想される全ビット数は、分析されている前記フレームのフレームランクおよびタイプ、適応量子化のデルタQp係数、および前記第1のパス分析からのフレーム毎のビット数およびQpに少なくとも部分的に基づいているように構成されている、請求項52に記載のコーダ。 - コンピューティングデバイス上での実行に応答して、前記コンピューティングデバイスに対し、請求項1から24のいずれか一項に記載の方法を実行させる、少なくとも1つのプログラム。
- コンピュータによって請求項1から24のいずれか一項に記載の方法を実行する装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361758314P | 2013-01-30 | 2013-01-30 | |
US61/758,314 | 2013-01-30 | ||
PCT/US2014/013915 WO2014120960A1 (en) | 2013-01-30 | 2014-01-30 | Content adaptive bitrate and quality control by using frame hierarchy sensitive quantization for high efficiency next generation video coding |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016508327A JP2016508327A (ja) | 2016-03-17 |
JP6286718B2 true JP6286718B2 (ja) | 2018-03-07 |
Family
ID=51262831
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015545956A Expired - Fee Related JP6163674B2 (ja) | 2013-01-30 | 2013-12-28 | 高効率次世代ビデオコーディングのためのコンテンツ適応双方向性又は機能性予測マルチパスピクチャ |
JP2015551073A Active JP6339099B2 (ja) | 2013-01-30 | 2014-01-24 | 次世代ビデオのパーティションデータのコンテンツ適応的エントロピーコーディング |
JP2015551074A Expired - Fee Related JP6286718B2 (ja) | 2013-01-30 | 2014-01-30 | 高効率な次世代ビデオコーディングのためのフレーム階層応答型量子化を使用する、コンテンツ適応ビットレートおよび品質管理 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015545956A Expired - Fee Related JP6163674B2 (ja) | 2013-01-30 | 2013-12-28 | 高効率次世代ビデオコーディングのためのコンテンツ適応双方向性又は機能性予測マルチパスピクチャ |
JP2015551073A Active JP6339099B2 (ja) | 2013-01-30 | 2014-01-24 | 次世代ビデオのパーティションデータのコンテンツ適応的エントロピーコーディング |
Country Status (8)
Country | Link |
---|---|
US (14) | US9794569B2 (ja) |
EP (12) | EP2952002A4 (ja) |
JP (3) | JP6163674B2 (ja) |
KR (6) | KR102063385B1 (ja) |
CN (10) | CN104885470B (ja) |
BR (1) | BR112015015575A2 (ja) |
RU (1) | RU2612600C2 (ja) |
WO (11) | WO2014120369A1 (ja) |
Families Citing this family (274)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2653437T3 (es) | 2002-08-08 | 2018-02-07 | Godo Kaisha Ip Bridge 1 | Procedimiento de descodificación de imágenes en movimiento |
US9008180B2 (en) * | 2011-04-21 | 2015-04-14 | Intellectual Discovery Co., Ltd. | Method and apparatus for encoding/decoding images using a prediction method adopting in-loop filtering |
US9380327B2 (en) * | 2011-12-15 | 2016-06-28 | Comcast Cable Communications, Llc | System and method for synchronizing timing across multiple streams |
US9591302B2 (en) | 2012-07-02 | 2017-03-07 | Microsoft Technology Licensing, Llc | Use of chroma quantization parameter offsets in deblocking |
US9414054B2 (en) | 2012-07-02 | 2016-08-09 | Microsoft Technology Licensing, Llc | Control and use of chroma quantization parameter values |
CN102883163B (zh) * | 2012-10-08 | 2014-05-28 | 华为技术有限公司 | 用于运动矢量预测的运动矢量列表建立的方法、装置 |
CN104704827B (zh) | 2012-11-13 | 2019-04-12 | 英特尔公司 | 用于下一代视频的内容自适应变换译码 |
CN104885470B (zh) | 2013-01-30 | 2018-08-07 | 英特尔公司 | 用于下一代视频的预测和编码的内容自适应划分 |
US11438609B2 (en) | 2013-04-08 | 2022-09-06 | Qualcomm Incorporated | Inter-layer picture signaling and related processes |
US10057599B2 (en) * | 2014-02-19 | 2018-08-21 | Mediatek Inc. | Method for performing image processing control with aid of predetermined tile packing, associated apparatus and associated non-transitory computer readable medium |
CN103929642B (zh) * | 2014-04-24 | 2017-04-12 | 北京航空航天大学 | 一种hevc变换系数的熵编码上下文模型偏移值快速计算方法 |
US9723377B2 (en) | 2014-04-28 | 2017-08-01 | Comcast Cable Communications, Llc | Video management |
US10397574B2 (en) * | 2014-05-12 | 2019-08-27 | Intel Corporation | Video coding quantization parameter determination suitable for video conferencing |
US11064204B2 (en) | 2014-05-15 | 2021-07-13 | Arris Enterprises Llc | Automatic video comparison of the output of a video decoder |
US20170249521A1 (en) * | 2014-05-15 | 2017-08-31 | Arris Enterprises, Inc. | Automatic video comparison of the output of a video decoder |
US10057593B2 (en) * | 2014-07-08 | 2018-08-21 | Brain Corporation | Apparatus and methods for distance estimation using stereo imagery |
US9699464B2 (en) * | 2014-07-10 | 2017-07-04 | Intel Corporation | Adaptive bitrate streaming for wireless video |
US9549188B2 (en) * | 2014-07-30 | 2017-01-17 | Intel Corporation | Golden frame selection in video coding |
CN104301724B (zh) * | 2014-10-17 | 2017-12-01 | 华为技术有限公司 | 视频处理方法、编码设备和解码设备 |
TWI536799B (zh) * | 2014-10-29 | 2016-06-01 | 虹光精密工業股份有限公司 | 智慧型複印設備 |
WO2016090568A1 (en) * | 2014-12-10 | 2016-06-16 | Mediatek Singapore Pte. Ltd. | Binary tree block partitioning structure |
US10171807B2 (en) * | 2015-01-29 | 2019-01-01 | Arris Enterprises Llc | Picture-level QP rate control for HEVC encoding |
US10410398B2 (en) * | 2015-02-20 | 2019-09-10 | Qualcomm Incorporated | Systems and methods for reducing memory bandwidth using low quality tiles |
CN104780377B (zh) * | 2015-03-18 | 2017-12-15 | 同济大学 | 一种基于分布式计算机系统的并行hevc编码系统及方法 |
CN108028942B (zh) | 2015-06-04 | 2020-06-26 | 清华大学 | 像素预测方法、编码方法、解码方法及其装置、存储介质 |
GB2539198B (en) * | 2015-06-08 | 2019-09-25 | Imagination Tech Ltd | Motion estimation using collocated blocks |
US9942552B2 (en) * | 2015-06-12 | 2018-04-10 | Intel Corporation | Low bitrate video coding |
US10354290B2 (en) * | 2015-06-16 | 2019-07-16 | Adobe, Inc. | Generating a shoppable video |
WO2016206748A1 (en) * | 2015-06-25 | 2016-12-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Refinement of a low-pel resolution motion estimation vector |
JP6715467B2 (ja) * | 2015-07-01 | 2020-07-01 | パナソニックIpマネジメント株式会社 | 符号化方法、復号方法、符号化装置、復号装置および符号化復号装置 |
US10419512B2 (en) * | 2015-07-27 | 2019-09-17 | Samsung Display Co., Ltd. | System and method of transmitting display data |
US11076153B2 (en) * | 2015-07-31 | 2021-07-27 | Stc.Unm | System and methods for joint and adaptive control of rate, quality, and computational complexity for video coding and video delivery |
US10430031B2 (en) * | 2015-08-30 | 2019-10-01 | EVA Automation, Inc. | Displaying HDMI content in a tiled window |
US10743059B2 (en) * | 2015-08-30 | 2020-08-11 | EVA Automation, Inc. | Displaying HDMI content at an arbitrary location |
FR3040849A1 (fr) * | 2015-09-04 | 2017-03-10 | Stmicroelectronics (Grenoble 2) Sas | Procede de compression d'un flux de donnees video |
US9971791B2 (en) * | 2015-09-16 | 2018-05-15 | Adobe Systems Incorporated | Method and apparatus for clustering product media files |
WO2017052250A1 (ko) * | 2015-09-23 | 2017-03-30 | 엘지전자(주) | 영상의 부호화/복호화 방법 및 이를 위한 장치 |
WO2017057953A1 (ko) * | 2015-09-30 | 2017-04-06 | 엘지전자 주식회사 | 비디오 코딩 시스템에서 레지듀얼 신호 코딩 방법 및 장치 |
US10805627B2 (en) | 2015-10-15 | 2020-10-13 | Cisco Technology, Inc. | Low-complexity method for generating synthetic reference frames in video coding |
US9998745B2 (en) * | 2015-10-29 | 2018-06-12 | Microsoft Technology Licensing, Llc | Transforming video bit streams for parallel processing |
WO2017073360A1 (ja) * | 2015-10-30 | 2017-05-04 | ソニー株式会社 | 画像処理装置および方法 |
EP3166313A1 (en) | 2015-11-09 | 2017-05-10 | Thomson Licensing | Encoding and decoding method and corresponding devices |
US10283094B1 (en) * | 2015-11-09 | 2019-05-07 | Marvell International Ltd. | Run-length compression and decompression of media tiles |
US10972731B2 (en) * | 2015-11-10 | 2021-04-06 | Interdigital Madison Patent Holdings, Sas | Systems and methods for coding in super-block based video coding framework |
CN115118969A (zh) * | 2015-11-20 | 2022-09-27 | 韩国电子通信研究院 | 用于对图像进行编/解码的方法和存储比特流的方法 |
US20170155905A1 (en) * | 2015-11-30 | 2017-06-01 | Intel Corporation | Efficient intra video/image coding using wavelets and variable size transform coding |
CN108369751B (zh) * | 2015-12-14 | 2023-09-08 | 松下电器(美国)知识产权公司 | 三维数据编码方法、解码方法、编码装置、解码装置 |
CN108781299A (zh) * | 2015-12-31 | 2018-11-09 | 联发科技股份有限公司 | 用于视频和图像编解码的预测二叉树结构的方法和装置 |
US10212444B2 (en) | 2016-01-15 | 2019-02-19 | Qualcomm Incorporated | Multi-type-tree framework for video coding |
US10445862B1 (en) * | 2016-01-25 | 2019-10-15 | National Technology & Engineering Solutions Of Sandia, Llc | Efficient track-before detect algorithm with minimal prior knowledge |
WO2017135663A2 (ko) * | 2016-02-01 | 2017-08-10 | 엘지전자 주식회사 | 행 -열 변환 (row- column transform)을 이용하여 변환을 수행하는 방법 및 장치 |
KR102728701B1 (ko) * | 2016-02-15 | 2024-11-12 | 삼성전자주식회사 | 영상처리장치, 영상처리방법 및 이를 기록한 기록매체 |
CN116506604A (zh) * | 2016-03-11 | 2023-07-28 | 数字洞察力有限公司 | 视频编码方法以及装置 |
US11223852B2 (en) | 2016-03-21 | 2022-01-11 | Qualcomm Incorporated | Coding video data using a two-level multi-type-tree framework |
US20170280139A1 (en) * | 2016-03-22 | 2017-09-28 | Qualcomm Incorporated | Apparatus and methods for adaptive calculation of quantization parameters in display stream compression |
ES2853700T3 (es) | 2016-04-15 | 2021-09-17 | Magic Pony Tech Limited | Compensación de movimiento utilizando interpolación de imagen temporal |
EP3298786A1 (en) * | 2016-04-15 | 2018-03-28 | Magic Pony Technology Limited | In-loop post filtering for video encoding and decoding |
US10574999B2 (en) * | 2016-05-05 | 2020-02-25 | Intel Corporation | Method and system of video coding with a multi-pass prediction mode decision pipeline |
KR102571062B1 (ko) | 2016-05-10 | 2023-08-25 | 삼성전자주식회사 | 영상을 부호화/복호화 하는 방법 및 그 장치 |
KR102379874B1 (ko) * | 2016-05-13 | 2022-03-30 | 브이아이디 스케일, 인크. | 비디오 코딩을 위한 일반화된 다중-가설 예측 시스템 및 방법 |
TWI689148B (zh) * | 2016-05-17 | 2020-03-21 | 英屬開曼群島商鴻騰精密科技股份有限公司 | 電連接器組件 |
US10456672B2 (en) | 2016-05-19 | 2019-10-29 | Google Llc | Methods and systems for facilitating participation in a game session |
US10284845B2 (en) | 2016-05-25 | 2019-05-07 | Arris Enterprises Llc | JVET quadtree plus binary tree (QTBT) structure with multiple asymmetrical partitioning |
CA3025477C (en) * | 2016-05-25 | 2023-10-03 | Arris Enterprises Llc | Jvet coding block structure with asymmetrical partitioning |
CA3025340A1 (en) * | 2016-05-25 | 2017-11-30 | Arris Enterprises Llc | General block partitioning method |
EP3446483B1 (en) * | 2016-05-25 | 2021-04-21 | ARRIS Enterprises LLC | Binary, ternary and quad tree partitioning for jvet coding of video data |
US10567808B2 (en) | 2016-05-25 | 2020-02-18 | Arris Enterprises Llc | Binary ternary quad tree partitioning for JVET |
US10743210B2 (en) * | 2016-06-01 | 2020-08-11 | Intel Corporation | Using uplink buffer status to improve video stream adaptation control |
KR102445668B1 (ko) * | 2016-06-01 | 2022-09-21 | 삼성전자주식회사 | 부호화 순서 부호화 방법 및 그 장치, 복호화 방법 및 그 장치 |
US10880548B2 (en) | 2016-06-01 | 2020-12-29 | Samsung Electronics Co., Ltd. | Methods and apparatuses for encoding and decoding video according to coding order |
US10657674B2 (en) | 2016-06-17 | 2020-05-19 | Immersive Robotics Pty Ltd. | Image compression method and apparatus |
US10169362B2 (en) * | 2016-07-07 | 2019-01-01 | Cross Commerce Media, Inc. | High-density compression method and computing system |
CN109644276B (zh) * | 2016-08-01 | 2022-12-30 | 韩国电子通信研究院 | 图像编码/解码方法 |
CN109644267B (zh) * | 2016-08-03 | 2023-07-04 | 株式会社Kt | 视频信号处理方法和装置 |
WO2018023554A1 (en) * | 2016-08-04 | 2018-02-08 | SZ DJI Technology Co., Ltd. | System and methods for bit rate control |
US10715818B2 (en) * | 2016-08-04 | 2020-07-14 | Intel Corporation | Techniques for hardware video encoding |
EP3866465A1 (en) * | 2016-08-04 | 2021-08-18 | SZ DJI Technology Co., Ltd. | Parallel video encoding |
US11089312B2 (en) | 2016-08-08 | 2021-08-10 | Lg Electronics Inc. | Method for processing image and apparatus therefor |
US10609423B2 (en) | 2016-09-07 | 2020-03-31 | Qualcomm Incorporated | Tree-type coding for video coding |
CN107872669B (zh) * | 2016-09-27 | 2019-05-24 | 腾讯科技(深圳)有限公司 | 视频码率处理方法和装置 |
US10567775B2 (en) * | 2016-10-01 | 2020-02-18 | Intel Corporation | Method and system of hardware accelerated video coding with per-frame parameter control |
KR20230010060A (ko) * | 2016-10-04 | 2023-01-17 | 주식회사 비원영상기술연구소 | 영상 데이터 부호화/복호화 방법 및 장치 |
KR102690804B1 (ko) * | 2016-10-04 | 2024-08-01 | 주식회사 비원영상기술연구소 | 영상 데이터 부호화/복호화 방법 및 장치 |
CN114245118B (zh) | 2016-10-04 | 2023-03-28 | 有限公司B1影像技术研究所 | 图像数据编码/解码方法和计算机可读记录介质 |
KR20190052128A (ko) | 2016-10-04 | 2019-05-15 | 김기백 | 영상 데이터 부호화/복호화 방법 및 장치 |
EP3306938A1 (en) | 2016-10-05 | 2018-04-11 | Thomson Licensing | Method and apparatus for binary-tree split mode coding |
EP3306927A1 (en) * | 2016-10-05 | 2018-04-11 | Thomson Licensing | Encoding and decoding methods and corresponding devices |
US12022199B2 (en) | 2016-10-06 | 2024-06-25 | B1 Institute Of Image Technology, Inc. | Image data encoding/decoding method and apparatus |
US20180103271A1 (en) * | 2016-10-10 | 2018-04-12 | Qualcomm Incorporated | Systems and methods for signaling missing or corrupted video data |
KR20180039323A (ko) * | 2016-10-10 | 2018-04-18 | 디지털인사이트 주식회사 | 다양한 블록 분할 구조를 결합하여 사용하는 비디오 코딩 방법 및 장치 |
EP4167569A1 (en) * | 2016-10-10 | 2023-04-19 | Samsung Electronics Co., Ltd. | Method and device for encoding or decoding image by means of block map |
US10187178B2 (en) * | 2016-10-11 | 2019-01-22 | Microsoft Technology Licensing, Llc | Dynamically partitioning media streams |
US10779004B2 (en) | 2016-10-12 | 2020-09-15 | Mediatek Inc. | Methods and apparatuses of constrained multi-type-tree block partition for video coding |
WO2018072675A1 (en) * | 2016-10-18 | 2018-04-26 | Zhejiang Dahua Technology Co., Ltd. | Methods and systems for video processing |
WO2018074825A1 (ko) * | 2016-10-19 | 2018-04-26 | 에스케이텔레콤 주식회사 | 영상 부호화 또는 복호화를 위한 장치 및 방법 |
KR20180043151A (ko) | 2016-10-19 | 2018-04-27 | 에스케이텔레콤 주식회사 | 영상 부호화 또는 복호화를 위한 장치 및 방법 |
CN106454355B (zh) * | 2016-10-24 | 2019-03-01 | 西南科技大学 | 一种视频编码方法及装置 |
EP3544300B1 (en) | 2016-11-21 | 2021-10-13 | Panasonic Intellectual Property Corporation of America | Devices and methods for image coding and decoding using a block size dependent split ratio |
JPWO2018092868A1 (ja) | 2016-11-21 | 2019-10-17 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 符号化装置、復号装置、符号化方法及び復号方法 |
KR20180057564A (ko) * | 2016-11-22 | 2018-05-30 | 한국전자통신연구원 | 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체 |
GB2556923B (en) * | 2016-11-25 | 2020-04-15 | Canon Kk | Generation of VCA Reference results for VCA Auto-setting |
CN109997363B (zh) * | 2016-11-28 | 2023-12-05 | 英迪股份有限公司 | 图像编码/解码方法和装置以及存储有比特流的记录介质 |
US10694202B2 (en) * | 2016-12-01 | 2020-06-23 | Qualcomm Incorporated | Indication of bilateral filter usage in video coding |
US10631012B2 (en) * | 2016-12-02 | 2020-04-21 | Centurylink Intellectual Property Llc | Method and system for implementing detection and visual enhancement of video encoding artifacts |
US10397590B2 (en) * | 2016-12-05 | 2019-08-27 | Nice-Systems Ltd. | System and method for enabling seek in a video recording |
JP6565885B2 (ja) * | 2016-12-06 | 2019-08-28 | 株式会社Jvcケンウッド | 画像符号化装置、画像符号化方法及び画像符号化プログラム、並びに画像復号化装置、画像復号化方法及び画像復号化プログラム |
CN116866575A (zh) | 2016-12-16 | 2023-10-10 | 夏普株式会社 | 图像解码装置 |
WO2018117892A1 (en) * | 2016-12-23 | 2018-06-28 | Huawei Technologies Co., Ltd. | An intra-prediction apparatus for extending a set of predetermined directional intra-prediction modes |
KR20180110047A (ko) * | 2016-12-26 | 2018-10-08 | 닛본 덴끼 가부시끼가이샤 | 영상 인코딩 방법, 영상 디코딩 방법, 영상 인코딩 장치, 영상 디코딩 장치, 및 프로그램 |
KR20180110061A (ko) * | 2016-12-26 | 2018-10-08 | 닛본 덴끼 가부시끼가이샤 | 영상 인코딩 방법, 영상 디코딩 방법, 영상 인코딩 장치, 영상 디코딩 장치, 및 프로그램 |
CA3048242C (en) * | 2016-12-28 | 2023-10-31 | Arris Enterprises Llc | Improved video bitstream coding |
US10681370B2 (en) * | 2016-12-29 | 2020-06-09 | Qualcomm Incorporated | Motion vector generation for affine motion model for video coding |
TWI617181B (zh) * | 2017-01-04 | 2018-03-01 | 晨星半導體股份有限公司 | 用於高效率視訊編碼裝置之排程方法 |
KR20240142572A (ko) | 2017-01-05 | 2024-09-30 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 화상의 블록 기반 예측 코딩 및 디코딩 |
US10848788B2 (en) | 2017-01-06 | 2020-11-24 | Qualcomm Incorporated | Multi-type-tree framework for video coding |
EP3349454A1 (en) * | 2017-01-11 | 2018-07-18 | Thomson Licensing | Method and device for coding a block of video data, method and device for decoding a block of video data |
KR20180088188A (ko) * | 2017-01-26 | 2018-08-03 | 삼성전자주식회사 | 적응적 영상 변환 방법 및 장치 |
WO2018143687A1 (ko) * | 2017-02-01 | 2018-08-09 | 엘지전자(주) | 행-열 변환을 이용하여 변환을 수행하는 방법 및 장치 |
JP6745979B2 (ja) * | 2017-02-06 | 2020-08-26 | 華為技術有限公司Huawei Technologies Co.,Ltd. | 符号化方法および装置、ならびに復号方法および装置 |
CN110495107A (zh) | 2017-02-08 | 2019-11-22 | 因默希弗机器人私人有限公司 | 用于移动设备通信的天线控制 |
US10362332B2 (en) * | 2017-03-14 | 2019-07-23 | Google Llc | Multi-level compound prediction |
WO2018169571A1 (en) * | 2017-03-15 | 2018-09-20 | Google Llc | Segmentation-based parameterized motion models |
US10820017B2 (en) * | 2017-03-15 | 2020-10-27 | Mediatek Inc. | Method and apparatus of video coding |
US11496747B2 (en) | 2017-03-22 | 2022-11-08 | Qualcomm Incorporated | Intra-prediction mode propagation |
US10904531B2 (en) * | 2017-03-23 | 2021-01-26 | Qualcomm Incorporated | Adaptive parameters for coding of 360-degree video |
CN108665410B (zh) * | 2017-03-31 | 2021-11-26 | 杭州海康威视数字技术股份有限公司 | 一种图像超分辨率重构方法、装置及系统 |
US11551067B2 (en) * | 2017-04-06 | 2023-01-10 | Shanghai Cambricon Information Technology Co., Ltd | Neural network processor and neural network computation method |
TWI721816B (zh) | 2017-04-21 | 2021-03-11 | 美商時美媒體公司 | 用於產生遊戲的運動向量的系統及方法 |
WO2018195461A1 (en) | 2017-04-21 | 2018-10-25 | Zenimax Media Inc. | Player input motion compensation by anticipating motion vectors |
CA3059743A1 (en) | 2017-04-21 | 2018-10-25 | Zenimax Media Inc. | Systems and methods for deferred post-processes in video encoding |
GB2583826B (en) | 2017-04-21 | 2021-05-19 | Zenimax Media Inc | Systems and methods for rendering & pre-encoded load estimation based encoder hinting |
RU2759505C2 (ru) | 2017-04-21 | 2021-11-15 | Зенимакс Медиа Инк. | Системы и способы рендеринга с адаптируемым качеством под управлением кодировщика |
US10979728B2 (en) * | 2017-04-24 | 2021-04-13 | Intel Corporation | Intelligent video frame grouping based on predicted performance |
CN108810556B (zh) * | 2017-04-28 | 2021-12-24 | 炬芯科技股份有限公司 | 压缩参考帧的方法、装置及芯片 |
US10638127B2 (en) * | 2017-05-15 | 2020-04-28 | Qualcomm Incorporated | Adaptive anchor frame and quantization parameter decision in video coding |
AU2018280337B2 (en) * | 2017-06-05 | 2023-01-19 | Immersive Robotics Pty Ltd | Digital content stream compression |
KR102315524B1 (ko) * | 2017-06-16 | 2021-10-21 | 한화테크윈 주식회사 | 영상의 비트레이트 조절 방법 및 영상 획득 장치 |
CN107222751B (zh) * | 2017-06-23 | 2019-05-10 | 宁波大学科学技术学院 | 基于多视点视频特征的3d-hevc深度视频信息隐藏方法 |
RU2770185C2 (ru) * | 2017-06-26 | 2022-04-14 | ИНТЕРДИДЖИТАЛ ВиСи ХОЛДИНГЗ, ИНК. | Множество кандидатов предсказателя для компенсации движения |
CN112601083A (zh) | 2017-06-28 | 2021-04-02 | 华为技术有限公司 | 一种图像数据的编码、解码方法及装置 |
US11032545B2 (en) | 2017-06-29 | 2021-06-08 | Qualcomm Incorporated | Reducing seam artifacts in 360-degree video |
CN109218748B (zh) * | 2017-06-30 | 2020-11-27 | 京东方科技集团股份有限公司 | 视频传输方法、装置及计算机可读存储介质 |
CN114449271B (zh) * | 2017-07-04 | 2023-09-22 | 三星电子株式会社 | 使用多核变换的视频解码/编码方法和设备 |
CN107360419B (zh) * | 2017-07-18 | 2019-09-24 | 成都图必优科技有限公司 | 一种基于透视模型的运动前视视频帧间预测编码方法 |
KR102604776B1 (ko) | 2017-07-19 | 2023-11-21 | 삼성전자주식회사 | 부호화 방법 및 그 장치, 복호화 방법 및 그 장치 |
US11146608B2 (en) * | 2017-07-20 | 2021-10-12 | Disney Enterprises, Inc. | Frame-accurate video seeking via web browsers |
CN107483949A (zh) * | 2017-07-26 | 2017-12-15 | 千目聚云数码科技(上海)有限公司 | 增加svac svc实用性的方法及系统 |
CN107295334B (zh) * | 2017-08-15 | 2019-12-03 | 电子科技大学 | 自适应的参考图像抉择方法 |
CN107483960B (zh) * | 2017-09-15 | 2020-06-02 | 信阳师范学院 | 一种基于空间预测的运动补偿帧率上转换方法 |
US10645408B2 (en) * | 2017-09-17 | 2020-05-05 | Google Llc | Dual deblocking filter thresholds |
EP3457695A1 (en) | 2017-09-18 | 2019-03-20 | Thomson Licensing | Method and apparatus for motion vector predictor adaptation for omnidirectional video |
US10609384B2 (en) * | 2017-09-21 | 2020-03-31 | Futurewei Technologies, Inc. | Restriction on sub-block size derivation for affine inter prediction |
EP3598750A4 (en) * | 2017-09-28 | 2020-06-10 | LG Electronics Inc. -1- | Image decoding method and device in accordance with block split structure in image coding system |
US10623744B2 (en) * | 2017-10-04 | 2020-04-14 | Apple Inc. | Scene based rate control for video compression and video streaming |
EP3600581B1 (en) | 2017-10-10 | 2024-02-21 | Google LLC | Distributed sample-based game profiling with game metadata and metrics and gaming api platform supporting third-party content |
US11553187B2 (en) | 2017-11-21 | 2023-01-10 | Immersive Robotics Pty Ltd | Frequency component selection for image compression |
EP3714602A4 (en) | 2017-11-21 | 2021-07-28 | Immersive Robotics Pty Ltd | DIGITAL REALITY IMAGE COMPRESSION |
WO2019104862A1 (en) | 2017-11-30 | 2019-06-06 | SZ DJI Technology Co., Ltd. | System and method for reducing video coding fluctuation |
WO2019104611A1 (en) | 2017-11-30 | 2019-06-06 | SZ DJI Technology Co., Ltd. | System and method for controlling video coding within image frame |
WO2019104635A1 (en) | 2017-11-30 | 2019-06-06 | SZ DJI Technology Co., Ltd. | System and method for controlling video coding at frame level |
CN109949217B (zh) * | 2017-12-20 | 2023-04-11 | 四川大学 | 基于残差学习和隐式运动补偿的视频超分辨率重建方法 |
US11140207B2 (en) | 2017-12-21 | 2021-10-05 | Google Llc | Network impairment simulation framework for verification of real time interactive media streaming systems |
KR101975404B1 (ko) * | 2017-12-27 | 2019-08-28 | 세종대학교산학협력단 | 절차적 콘텐츠 생성장치 및 방법 |
TWI680675B (zh) * | 2017-12-29 | 2019-12-21 | 聯發科技股份有限公司 | 影像處理裝置與相關的影像處理方法 |
CN118921472A (zh) | 2018-01-24 | 2024-11-08 | 交互数字Vc控股公司 | 用于具有降低的译码复杂性的视频译码的广义双预测 |
US11095876B2 (en) * | 2018-01-26 | 2021-08-17 | Samsung Electronics Co., Ltd. | Image processing device |
KR102543449B1 (ko) * | 2018-01-26 | 2023-06-14 | 삼성전자주식회사 | 이미지 처리 장치 및 이미지 처리 장치의 동작 방법 |
KR102465206B1 (ko) * | 2018-01-26 | 2022-11-09 | 삼성전자주식회사 | 이미지 처리 장치 |
CN111727460A (zh) * | 2018-01-26 | 2020-09-29 | 松下电器(美国)知识产权公司 | 三维数据编码方法、三维数据解码方法、三维数据编码装置、以及三维数据解码装置 |
KR20200112945A (ko) | 2018-01-29 | 2020-10-05 | 인터디지털 브이씨 홀딩스 인코포레이티드 | 재구성된 픽처의 정제를 갖는 인코딩 및 디코딩 |
WO2019165162A1 (en) * | 2018-02-26 | 2019-08-29 | Interdigital Vc Holdings, Inc. | Method and apparatus for generalized obmc |
US11004178B2 (en) * | 2018-03-01 | 2021-05-11 | Nvidia Corporation | Enhancing high-resolution images with data from low-resolution images |
CN111801948B (zh) * | 2018-03-01 | 2023-01-03 | 索尼公司 | 图像处理装置和方法、成像元件和成像装置 |
US10432962B1 (en) * | 2018-03-13 | 2019-10-01 | Pixelworks, Inc. | Accuracy and local smoothness of motion vector fields using motion-model fitting |
CN110309328B (zh) * | 2018-03-14 | 2022-03-25 | 深圳云天励飞技术有限公司 | 数据存储方法、装置、电子设备及存储介质 |
EP4276814A3 (en) * | 2018-03-22 | 2023-12-20 | Google LLC | Methods and systems for rendering and encoding content for online interactive gaming sessions |
CN108449599B (zh) * | 2018-03-23 | 2021-05-18 | 安徽大学 | 一种基于面透射变换的视频编码与解码方法 |
KR20190114913A (ko) | 2018-03-29 | 2019-10-10 | 세종대학교산학협력단 | 디코더 사이드 움직임 유도 기반의 영상 부호화/복호화 방법 및 장치 |
US11077364B2 (en) | 2018-04-02 | 2021-08-03 | Google Llc | Resolution-based scaling of real-time interactive graphics |
CN115253276B (zh) | 2018-04-02 | 2024-07-19 | 谷歌有限责任公司 | 交互式云游戏的方法、设备和系统 |
CN118354098A (zh) * | 2018-04-02 | 2024-07-16 | 寰发股份有限公司 | 用于视频编解码系统中的子块运动补偿的视频处理方法和装置 |
EP3740292A2 (en) | 2018-04-02 | 2020-11-25 | Google LLC | Input device for an electronic system |
KR20230173223A (ko) | 2018-04-10 | 2023-12-26 | 구글 엘엘씨 | 게이밍 렌더링에서의 메모리 관리 |
US10491897B2 (en) * | 2018-04-13 | 2019-11-26 | Google Llc | Spatially adaptive quantization-aware deblocking filter |
US10798382B2 (en) * | 2018-04-26 | 2020-10-06 | Tencent America LLC | Sub-block transform |
EP3562162A1 (en) | 2018-04-27 | 2019-10-30 | InterDigital VC Holdings, Inc. | Method and apparatus for video encoding and decoding based on neural network implementation of cabac |
SG11202010696UA (en) * | 2018-05-29 | 2020-11-27 | Interdigital Vc Holdings Inc | Method and apparatus for video encoding and decoding with partially shared luma and chroma coding trees |
WO2019244055A1 (en) * | 2018-06-19 | 2019-12-26 | Beijing Bytedance Network Technology Co., Ltd. | Mode dependent mvd precision set |
CN108848380B (zh) * | 2018-06-20 | 2021-11-30 | 腾讯科技(深圳)有限公司 | 视频编码和解码方法、装置、计算机设备及存储介质 |
US10602147B2 (en) * | 2018-07-10 | 2020-03-24 | Samsung Display Co., Ltd. | Efficient entropy coding group grouping methodology for transform mode |
US11039315B2 (en) | 2018-08-01 | 2021-06-15 | At&T Intellectual Property I, L.P. | On-demand super slice instantiation and orchestration |
JP7410033B2 (ja) * | 2018-08-20 | 2024-01-09 | 日本放送協会 | 符号化装置、復号装置及びプログラム |
CN115250350B (zh) * | 2018-09-03 | 2024-04-09 | 华为技术有限公司 | 运动矢量的获取方法、装置、计算机设备及存储介质 |
US10863179B1 (en) * | 2018-09-05 | 2020-12-08 | Amazon Technologies, Inc. | Overlapped rate control for high-quality segmented video encoding |
US11665365B2 (en) * | 2018-09-14 | 2023-05-30 | Google Llc | Motion prediction coding with coframe motion vectors |
WO2020058886A1 (en) | 2018-09-19 | 2020-03-26 | Beijing Bytedance Network Technology Co., Ltd. | Fast algorithms for adaptive motion vector resolution in affine mode |
US11218694B2 (en) * | 2018-09-24 | 2022-01-04 | Qualcomm Incorporated | Adaptive multiple transform coding |
US11606569B2 (en) * | 2018-09-25 | 2023-03-14 | Apple Inc. | Extending supported components for encoding image data |
US10893281B2 (en) | 2018-10-12 | 2021-01-12 | International Business Machines Corporation | Compression of a video stream having frames with relatively heightened quality parameters on blocks on an identified point of interest (PoI) |
US10764589B2 (en) * | 2018-10-18 | 2020-09-01 | Trisys Co., Ltd. | Method and module for processing image data |
WO2020084476A1 (en) * | 2018-10-22 | 2020-04-30 | Beijing Bytedance Network Technology Co., Ltd. | Sub-block based prediction |
CN111083491B (zh) | 2018-10-22 | 2024-09-20 | 北京字节跳动网络技术有限公司 | 细化运动矢量的利用 |
CN109640082B (zh) * | 2018-10-26 | 2021-02-12 | 浙江鼎越电子有限公司 | 音视频多媒体数据处理方法及其设备 |
US11412260B2 (en) * | 2018-10-29 | 2022-08-09 | Google Llc | Geometric transforms for image compression |
US10939102B2 (en) * | 2018-11-01 | 2021-03-02 | Mediatek Inc. | Post processing apparatus with super-resolution filter and loop restoration filter in block-level pipeline and associated post processing method |
JP7146086B2 (ja) | 2018-11-12 | 2022-10-03 | 北京字節跳動網絡技術有限公司 | インター予測のためのバンド幅制御方法 |
WO2020102493A1 (en) | 2018-11-16 | 2020-05-22 | Google Llc | Shadow tracking of real-time interactive simulations for complex system analysis |
US10666985B1 (en) * | 2018-11-18 | 2020-05-26 | Sony Corporation | Sub-block based entropy coding for image coding |
CN113170097B (zh) | 2018-11-20 | 2024-04-09 | 北京字节跳动网络技术有限公司 | 视频编解码模式的编解码和解码 |
JP7241870B2 (ja) | 2018-11-20 | 2023-03-17 | 北京字節跳動網絡技術有限公司 | 部分的な位置に基づく差分計算 |
WO2020103936A1 (en) | 2018-11-22 | 2020-05-28 | Beijing Bytedance Network Technology Co., Ltd. | Pruning method for inter prediction with geometry partition |
US11184633B2 (en) | 2018-11-27 | 2021-11-23 | Qualcomm Incorporated | Simplification of history-based motion vector prediction |
JP7040422B2 (ja) * | 2018-11-28 | 2022-03-23 | 日本電信電話株式会社 | 動きベクトル生成装置、投影像生成装置、動きベクトル生成方法、およびプログラム |
US11025947B2 (en) * | 2018-11-29 | 2021-06-01 | Mediatek Inc. | Method and apparatus for generating motion field motion vectors for blocks of current frame in on-the-fly manner |
US10855988B2 (en) | 2018-12-19 | 2020-12-01 | Qualcomm Incorporated | Adaptive prediction structures |
MX2021007873A (es) * | 2018-12-27 | 2021-10-26 | Huawei Tech Co Ltd | Un codificador de video, un decodificador de video y métodos correspondientes. |
KR20210064332A (ko) * | 2018-12-29 | 2021-06-02 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 컴팩트한 mv 스토리지를 사용하는 인코더, 디코더 및 대응하는 방법 |
WO2020140908A1 (en) * | 2018-12-31 | 2020-07-09 | Beijing Bytedance Network Technology Co., Ltd. | Mapping between distance index and distance in merge with mvd |
US10645386B1 (en) * | 2019-01-03 | 2020-05-05 | Sony Corporation | Embedded codec circuitry for multiple reconstruction points based quantization |
JP7235877B2 (ja) | 2019-01-31 | 2023-03-08 | 北京字節跳動網絡技術有限公司 | アフィンモード適応型動きベクトル解像度を符号化するためのコンテキスト |
CN113366851A (zh) | 2019-01-31 | 2021-09-07 | 北京字节跳动网络技术有限公司 | 对称运动矢量差编解码模式的快速算法 |
US10778972B1 (en) * | 2019-02-27 | 2020-09-15 | Google Llc | Adaptive filter intra prediction modes in image/video compression |
JP2022521554A (ja) | 2019-03-06 | 2022-04-08 | 北京字節跳動網絡技術有限公司 | 変換された片予測候補の利用 |
JP7252016B2 (ja) * | 2019-03-13 | 2023-04-04 | 日本放送協会 | 動画像符号化装置、動画像復号装置及びプログラム |
CN113632493B (zh) | 2019-03-13 | 2024-07-12 | 北京字节跳动网络技术有限公司 | 变换跳过模式中的子块变换 |
US10924625B2 (en) * | 2019-03-20 | 2021-02-16 | Xerox Corporation | Dynamic compression acceleration using real-time image data entropy analysis |
US11956447B2 (en) * | 2019-03-21 | 2024-04-09 | Google Llc | Using rate distortion cost as a loss function for deep learning |
US11310496B2 (en) * | 2019-03-27 | 2022-04-19 | Ati Technologies Ulc | Determining quality values for blocks of encoded video |
JP7307192B2 (ja) | 2019-04-02 | 2023-07-11 | 北京字節跳動網絡技術有限公司 | デコーダ側の動きベクトルの導出 |
CN111901593B (zh) * | 2019-05-04 | 2024-01-02 | 华为技术有限公司 | 一种图像划分方法、装置及设备 |
US11223838B2 (en) * | 2019-05-26 | 2022-01-11 | Alibaba Group Holding Limited | AI-assisted programmable hardware video codec |
US10949982B1 (en) * | 2019-06-21 | 2021-03-16 | Amazon Technologies, Inc. | Moving object recognition, speed estimation, and tagging |
KR20220024659A (ko) | 2019-06-24 | 2022-03-03 | 알리바바 그룹 홀딩 리미티드 | 비디오 처리에서의 적응적 해상도 변경 |
CN110339567B (zh) * | 2019-07-17 | 2023-05-26 | 三星电子(中国)研发中心 | 系统资源配置、场景预测模型训练方法和装置 |
EP3991423A4 (en) * | 2019-07-25 | 2022-09-07 | Beijing Bytedance Network Technology Co., Ltd. | MAPPING RESTRICTION FOR INTRABLOC COPY VIRTUAL BUFFER |
WO2021026363A1 (en) * | 2019-08-06 | 2021-02-11 | Op Solutions, Llc | Implicit signaling of adaptive resolution management based on frame type |
CN114616826A (zh) | 2019-08-06 | 2022-06-10 | Op方案有限责任公司 | 基于帧类型的自适应分辨率管理的隐式标识 |
EP4011083A4 (en) | 2019-08-06 | 2023-06-28 | OP Solutions, LLC | Block-based adaptive resolution management |
CN114467305A (zh) | 2019-08-06 | 2022-05-10 | Op方案有限责任公司 | 自适应分辨率管理预测重缩放 |
GB2586517B (en) * | 2019-08-23 | 2022-06-15 | Imagination Tech Ltd | Methods and decompression units for decompressing a compressed block of image data |
CN112449140B (zh) * | 2019-08-29 | 2021-09-14 | 华为技术有限公司 | 视频超分辨率处理方法及装置 |
WO2021058277A1 (en) * | 2019-09-23 | 2021-04-01 | Interdigital Vc Holdings France, Sas | Video encoding and decoding using block area based quantization matrices |
CN112702603B (zh) * | 2019-10-22 | 2024-11-29 | 腾讯科技(深圳)有限公司 | 视频编码方法、装置、计算机设备和存储介质 |
EP3820138A1 (en) * | 2019-11-06 | 2021-05-12 | Koninklijke Philips N.V. | A system for performing image motion compensation |
MX2022005534A (es) | 2019-11-08 | 2022-08-04 | Op Solutions Llc | Metodos y sistemas para recorte adaptativo.. |
US11843772B2 (en) * | 2019-12-06 | 2023-12-12 | Ati Technologies Ulc | Video encode pre-analysis bit budgeting based on context and features |
US11308093B1 (en) * | 2019-12-13 | 2022-04-19 | Amazon Technologies, Inc. | Encoding scheme for numeric-like data types |
CN111814844B (zh) * | 2020-03-17 | 2023-07-11 | 同济大学 | 一种基于位置编码融合的密集型视频描述方法 |
EP3902244B1 (en) * | 2020-04-23 | 2022-03-23 | Axis AB | Controlling a pan-tilt-zoom camera |
US11589052B2 (en) * | 2020-06-10 | 2023-02-21 | Tencent America LLC | Techniques for bitstream extraction for subpicture in coded video stream |
CN111757107B (zh) * | 2020-06-29 | 2024-03-05 | 北京百度网讯科技有限公司 | 一种视频编码方法、装置、设备及介质 |
US11790533B2 (en) * | 2020-07-02 | 2023-10-17 | Sony Group Corporation | Machine learning based image segmentation training with contour accuracy evaluation |
US11388413B1 (en) | 2020-08-03 | 2022-07-12 | Meta Platforms, Inc. | Fast encoding parameter selection for convex hull video encoding |
US11436699B1 (en) * | 2020-08-03 | 2022-09-06 | Meta Platforms, Inc. | Predicting encoding parameters for convex hull video encoding |
US12184855B2 (en) * | 2020-11-19 | 2024-12-31 | Intel Corporation | Method and system of video coding with content adaptive quantization |
CN114630120B (zh) * | 2020-12-14 | 2024-03-29 | 瑞昱半导体股份有限公司 | 基于自适应压缩率的视频压缩方法与电路系统 |
US11363262B1 (en) * | 2020-12-14 | 2022-06-14 | Google Llc | Adaptive GOP structure using temporal dependencies likelihood |
KR20220090887A (ko) * | 2020-12-23 | 2022-06-30 | 삼성전자주식회사 | 이미지 처리 장치 및 이미지 처리 장치의 동작 방법 |
US20220264111A1 (en) * | 2021-02-13 | 2022-08-18 | Meta Platforms, Inc. | Video coding efficiency improvement using dynamic frame boost scaling |
WO2022174118A1 (en) * | 2021-02-13 | 2022-08-18 | Meta Platforms, Inc. | Video coding efficiency improvement using dynamic frame boost scaling |
US11638025B2 (en) | 2021-03-19 | 2023-04-25 | Qualcomm Incorporated | Multi-scale optical flow for learned video compression |
US11523117B2 (en) * | 2021-03-22 | 2022-12-06 | Realtek Semiconductor Corp. | Encoder using coding tree unit level adaptive quantization mode to adjust frame level quantization parameter and associated signal processing method |
US11871061B1 (en) | 2021-03-31 | 2024-01-09 | Amazon Technologies, Inc. | Automated adaptive bitrate encoding |
CN113115038B (zh) * | 2021-04-16 | 2022-03-29 | 维沃移动通信有限公司 | 运动估计方法、装置、电子设备及可读存储介质 |
GB2608107B (en) * | 2021-06-18 | 2023-06-14 | Imagination Tech Ltd | Mapping multi-dimensional coordinates to a 1D space |
KR102562380B1 (ko) * | 2021-10-18 | 2023-08-02 | (주)카이미디어 | 8k 스케일러블 비디오 부호화 방법 |
US11991424B2 (en) * | 2021-11-05 | 2024-05-21 | Tencent America LLC | Immersive media data complexity analyzer for transformation of asset formats |
CN115002482B (zh) * | 2022-04-27 | 2024-04-16 | 电子科技大学 | 使用结构性保持运动估计的端到端视频压缩方法及系统 |
CN119032570A (zh) * | 2022-05-07 | 2024-11-26 | 谷歌有限责任公司 | 使用运动矢量精度的运动矢量编解码 |
US20230412812A1 (en) * | 2022-06-15 | 2023-12-21 | Tencent America LLC | Systems and methods for joint signaling of transform coefficient signs |
US20240080483A1 (en) * | 2022-08-26 | 2024-03-07 | Tencent America LLC | Systems and methods for warp sample selection and grouping |
CN115272083B (zh) * | 2022-09-27 | 2022-12-02 | 中国人民解放军国防科技大学 | 一种图像超分辨率方法、装置、设备及介质 |
US20240223768A1 (en) * | 2022-12-28 | 2024-07-04 | Ati Technologies Ulc | Content adaptive configurable hierarchical and partitional motion estimation search |
WO2024254041A1 (en) * | 2023-06-06 | 2024-12-12 | Google Llc | Temporally interpolated picture prediction using a frame-level motion vector |
Family Cites Families (169)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR0151011B1 (ko) | 1994-11-30 | 1998-10-01 | 김광호 | 바이폴라 트랜지스터 및 그 제조방법 |
US6542547B1 (en) * | 1995-05-30 | 2003-04-01 | Texas Instruments Incorporated | Efficient heuristic based motion estimation method for video compression |
US5864711A (en) * | 1995-07-05 | 1999-01-26 | Microsoft Corporation | System for determining more accurate translation between first and second translator, and providing translated data to second computer if first translator is more accurate |
US5729691A (en) * | 1995-09-29 | 1998-03-17 | Intel Corporation | Two-stage transform for video signals |
ES2153597T3 (es) | 1995-10-25 | 2001-03-01 | Koninkl Philips Electronics Nv | Sistema y metodo de codificacion de imagen segmentada, y sistema y metodo de decodificacion correspondiente. |
US6160846A (en) | 1995-10-25 | 2000-12-12 | Sarnoff Corporation | Apparatus and method for optimizing the rate control in a coding system |
JP3743837B2 (ja) * | 1996-06-14 | 2006-02-08 | 株式会社大宇エレクトロニクス | ランレングス符号器 |
US5953506A (en) * | 1996-12-17 | 1999-09-14 | Adaptive Media Technologies | Method and apparatus that provides a scalable media delivery system |
WO1998031152A2 (en) * | 1997-01-13 | 1998-07-16 | Koninklijke Philips Electronics N.V. | Embedding supplemental data in a digital video signal |
US6208693B1 (en) * | 1997-02-14 | 2001-03-27 | At&T Corp | Chroma-key for efficient and low complexity shape representation of coded arbitrary video objects |
JP3843581B2 (ja) * | 1998-03-05 | 2006-11-08 | 富士ゼロックス株式会社 | 画像符号化装置、画像復号化装置および画像処理装置、並びに画像符号化方法、画像復号化方法および画像処理方法 |
JP2000050263A (ja) * | 1998-07-28 | 2000-02-18 | Hitachi Ltd | 画像符号化並びに復号化装置及びこれを用いた撮像装置 |
US6895051B2 (en) | 1998-10-15 | 2005-05-17 | Nokia Mobile Phones Limited | Video data encoder and decoder |
US6223162B1 (en) * | 1998-12-14 | 2001-04-24 | Microsoft Corporation | Multi-level run length coding for frequency-domain audio coding |
US7065253B2 (en) | 1999-09-03 | 2006-06-20 | Intel Corporation | Wavelet zerotree coding of ordered bits |
WO2002051157A2 (en) | 2000-12-19 | 2002-06-27 | Pulsent Corporation | Adaptive transforms |
US20020122491A1 (en) | 2001-01-03 | 2002-09-05 | Marta Karczewicz | Video decoder architecture and method for using same |
KR100973374B1 (ko) | 2001-11-06 | 2010-07-30 | 파나소닉 주식회사 | 복호화 시스템 |
US7453936B2 (en) * | 2001-11-09 | 2008-11-18 | Sony Corporation | Transmitting apparatus and method, receiving apparatus and method, program and recording medium, and transmitting/receiving system |
GB2382940A (en) | 2001-11-27 | 2003-06-11 | Nokia Corp | Encoding objects and background blocks |
CN101448162B (zh) * | 2001-12-17 | 2013-01-02 | 微软公司 | 处理视频图像的方法 |
JP4610195B2 (ja) * | 2001-12-17 | 2011-01-12 | マイクロソフト コーポレーション | スキップマクロブロックコード化 |
JP2004088722A (ja) | 2002-03-04 | 2004-03-18 | Matsushita Electric Ind Co Ltd | 動画像符号化方法および動画像復号化方法 |
AU2003226585A1 (en) | 2002-04-23 | 2003-11-10 | Nokia Corporation | Method and device for indicating quantizer parameters in a video coding system |
JP2003324731A (ja) | 2002-04-26 | 2003-11-14 | Sony Corp | 符号化装置、復号装置、画像処理装置、それらの方法およびプログラム |
US20040001546A1 (en) | 2002-06-03 | 2004-01-01 | Alexandros Tourapis | Spatiotemporal prediction for bidirectionally predictive (B) pictures and motion vector prediction for multi-picture reference motion compensation |
JP4767992B2 (ja) | 2002-06-06 | 2011-09-07 | パナソニック株式会社 | 可変長符号化方法および可変長復号化方法 |
US7729563B2 (en) | 2002-08-28 | 2010-06-01 | Fujifilm Corporation | Method and device for video image processing, calculating the similarity between video frames, and acquiring a synthesized frame by synthesizing a plurality of contiguous sampled frames |
JP3997171B2 (ja) | 2003-03-27 | 2007-10-24 | 株式会社エヌ・ティ・ティ・ドコモ | 動画像符号化装置、動画像符号化方法、動画像符号化プログラム、動画像復号装置、動画像復号方法、及び動画像復号プログラム |
HUP0301368A3 (en) * | 2003-05-20 | 2005-09-28 | Amt Advanced Multimedia Techno | Method and equipment for compressing motion picture data |
JP2004007778A (ja) | 2003-07-14 | 2004-01-08 | Victor Co Of Japan Ltd | 動き補償復号化方法 |
US20050094729A1 (en) | 2003-08-08 | 2005-05-05 | Visionflow, Inc. | Software and hardware partitioning for multi-standard video compression and decompression |
CN1332563C (zh) * | 2003-12-31 | 2007-08-15 | 中国科学院计算技术研究所 | 一种视频图像跳过宏块的编码方法 |
US7492820B2 (en) * | 2004-02-06 | 2009-02-17 | Apple Inc. | Rate control for video coder employing adaptive linear regression bits modeling |
EP1571850A3 (en) | 2004-03-05 | 2006-12-13 | Samsung Electronics Co., Ltd. | Apparatus and method for encoding and decoding image containing grayscale alpha channel image |
KR100654431B1 (ko) * | 2004-03-08 | 2006-12-06 | 삼성전자주식회사 | 가변 gop 사이즈를 갖는 스케일러블 비디오 코딩방법및 이를 위한 스케일러블 비디오 인코더 |
US7461525B2 (en) * | 2004-03-13 | 2008-12-09 | Wilson Rodney W | Tile sponge washing and conditioning apparatus |
JP2005301457A (ja) | 2004-04-07 | 2005-10-27 | Fuji Xerox Co Ltd | 画像処理装置、プログラムおよび記録媒体 |
US7689051B2 (en) | 2004-04-15 | 2010-03-30 | Microsoft Corporation | Predictive lossless coding of images and video |
CN102833539B (zh) * | 2004-06-27 | 2015-03-25 | 苹果公司 | 多通路视频编码 |
KR100664932B1 (ko) | 2004-10-21 | 2007-01-04 | 삼성전자주식회사 | 비디오 코딩 방법 및 장치 |
EP1675402A1 (en) * | 2004-12-22 | 2006-06-28 | Thomson Licensing | Optimisation of a quantisation matrix for image and video coding |
JP2006270301A (ja) * | 2005-03-23 | 2006-10-05 | Nippon Hoso Kyokai <Nhk> | シーンチェンジ検出装置およびシーンチェンジ検出プログラム |
KR100703773B1 (ko) | 2005-04-13 | 2007-04-06 | 삼성전자주식회사 | 향상된 코딩 효율을 갖는 엔트로피 코딩 및 디코딩 방법과이를 위한 장치, 이를 포함하는 비디오 코딩 및 디코딩방법과 이를 위한 장치 |
WO2006109974A1 (en) * | 2005-04-13 | 2006-10-19 | Samsung Electronics Co., Ltd. | Method for entropy coding and decoding having improved coding efficiency and apparatus for providing the same |
US7397933B2 (en) | 2005-05-27 | 2008-07-08 | Microsoft Corporation | Collusion resistant desynchronization for digital video fingerprinting |
US8064516B2 (en) * | 2005-06-02 | 2011-11-22 | Broadcom Corporation | Text recognition during video compression |
KR20070006445A (ko) | 2005-07-08 | 2007-01-11 | 삼성전자주식회사 | 하이브리드 엔트로피 부호화, 복호화 방법 및 장치 |
WO2007011851A2 (en) * | 2005-07-15 | 2007-01-25 | Texas Instruments Incorporated | Filtered and warped motion compensation |
CN101263513A (zh) | 2005-07-15 | 2008-09-10 | 德克萨斯仪器股份有限公司 | 过滤和扭曲的运动补偿 |
US9077960B2 (en) * | 2005-08-12 | 2015-07-07 | Microsoft Corporation | Non-zero coefficient block pattern coding |
US9258519B2 (en) | 2005-09-27 | 2016-02-09 | Qualcomm Incorporated | Encoder assisted frame rate up conversion using various motion models |
CN101361370B (zh) | 2005-11-30 | 2010-12-01 | 株式会社东芝 | 图像编码/图像解码方法以及图像编码/图像解码装置 |
US8243804B2 (en) | 2005-12-01 | 2012-08-14 | Lsi Corporation | Hierarchical motion estimation for images with varying horizontal and/or vertical dimensions |
US8265145B1 (en) * | 2006-01-13 | 2012-09-11 | Vbrick Systems, Inc. | Management and selection of reference frames for long term prediction in motion estimation |
US8279928B2 (en) * | 2006-05-09 | 2012-10-02 | Canon Kabushiki Kaisha | Image encoding apparatus and encoding method, image decoding apparatus and decoding method |
US8275045B2 (en) * | 2006-07-12 | 2012-09-25 | Qualcomm Incorporated | Video compression using adaptive variable length codes |
TWI375469B (en) | 2006-08-25 | 2012-10-21 | Lg Electronics Inc | A method and apparatus for decoding/encoding a video signal |
JP5474546B2 (ja) * | 2006-08-25 | 2014-04-16 | トムソン ライセンシング | 低減された解像度の分割の方法及び装置 |
US20100040146A1 (en) | 2006-09-22 | 2010-02-18 | Beibei Wang | Method and apparatus for multiple pass video coding and decoding |
US20080075173A1 (en) * | 2006-09-22 | 2008-03-27 | Texas Instruments Incorporated | Systems and Methods for Context Adaptive Video Data Preparation |
CN105392005A (zh) | 2006-11-08 | 2016-03-09 | 汤姆逊许可证公司 | 用于环内去伪影滤波的方法和设备 |
US7460725B2 (en) | 2006-11-09 | 2008-12-02 | Calista Technologies, Inc. | System and method for effectively encoding and decoding electronic information |
US8875199B2 (en) * | 2006-11-13 | 2014-10-28 | Cisco Technology, Inc. | Indicating picture usefulness for playback optimization |
EP1926321A1 (en) | 2006-11-27 | 2008-05-28 | Matsushita Electric Industrial Co., Ltd. | Hybrid texture representation |
US8396118B2 (en) * | 2007-03-19 | 2013-03-12 | Sony Corporation | System and method to control compressed video picture quality for a given average bit rate |
TW200840366A (en) | 2007-03-28 | 2008-10-01 | Univ Nat Central | Complexity control method of video encoder |
KR101336445B1 (ko) * | 2007-06-08 | 2013-12-04 | 삼성전자주식회사 | 비디오 인코딩 데이터율 제어 방법 |
US8571104B2 (en) | 2007-06-15 | 2013-10-29 | Qualcomm, Incorporated | Adaptive coefficient scanning in video coding |
US8437564B2 (en) | 2007-08-07 | 2013-05-07 | Ntt Docomo, Inc. | Image and video compression using sparse orthonormal transforms |
GB0716158D0 (en) | 2007-08-17 | 2007-09-26 | Imagination Tech Ltd | Data compression |
US8526489B2 (en) * | 2007-09-14 | 2013-09-03 | General Instrument Corporation | Personal video recorder |
EP2193663B1 (en) * | 2007-09-28 | 2017-11-08 | Dolby Laboratories Licensing Corporation | Treating video information |
CN101855910B (zh) * | 2007-09-28 | 2014-10-29 | 杜比实验室特许公司 | 视频压缩和传送技术 |
US20090135901A1 (en) | 2007-11-28 | 2009-05-28 | The Hong Kong University Of Science And Technology | Complexity adaptive video encoding using multiple reference frames |
US8149915B1 (en) * | 2007-11-29 | 2012-04-03 | Lsi Corporation | Refinement of motion vectors in hierarchical motion estimation |
US20090154567A1 (en) | 2007-12-13 | 2009-06-18 | Shaw-Min Lei | In-loop fidelity enhancement for video compression |
JP5203717B2 (ja) | 2007-12-19 | 2013-06-05 | パナソニック株式会社 | 符号器、復号器、符号化方法、及び、復号方法 |
JP4309453B2 (ja) | 2007-12-26 | 2009-08-05 | 株式会社東芝 | 補間フレーム生成装置、補間フレーム生成方法及び放送受信装置 |
US20090167775A1 (en) | 2007-12-30 | 2009-07-02 | Ning Lu | Motion estimation compatible with multiple standards |
US8126054B2 (en) | 2008-01-09 | 2012-02-28 | Motorola Mobility, Inc. | Method and apparatus for highly scalable intraframe video coding |
CN101272494B (zh) * | 2008-01-25 | 2011-06-08 | 浙江大学 | 利用合成参考帧的视频编解码方法及装置 |
US8798137B2 (en) * | 2008-02-29 | 2014-08-05 | City University Of Hong Kong | Bit rate estimation in data or video compression |
US8254469B2 (en) | 2008-05-07 | 2012-08-28 | Kiu Sha Management Liability Company | Error concealment for frame loss in multiple description coding |
CN102037730B (zh) | 2008-05-22 | 2013-06-12 | 爱立信电话股份有限公司 | 内容自适应视频编码器和编码方法 |
US8897359B2 (en) * | 2008-06-03 | 2014-11-25 | Microsoft Corporation | Adaptive quantization for enhancement layer video coding |
JP2010016454A (ja) * | 2008-07-01 | 2010-01-21 | Sony Corp | 画像符号化装置および方法、画像復号装置および方法、並びにプログラム |
TWI359617B (en) | 2008-07-03 | 2012-03-01 | Univ Nat Taiwan | Low-complexity and high-quality error concealment |
US8625681B2 (en) * | 2008-07-09 | 2014-01-07 | Intel Corporation | Rate-distortion cost reducing video encoding techniques |
US8385404B2 (en) | 2008-09-11 | 2013-02-26 | Google Inc. | System and method for video encoding using constructed reference frame |
US8503527B2 (en) * | 2008-10-03 | 2013-08-06 | Qualcomm Incorporated | Video coding with large macroblocks |
KR101441903B1 (ko) | 2008-10-16 | 2014-09-24 | 에스케이텔레콤 주식회사 | 참조 프레임 생성 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치 |
JP4427600B1 (ja) | 2008-11-28 | 2010-03-10 | 株式会社東芝 | 映像解析装置およびプログラム |
US8774559B2 (en) * | 2009-01-19 | 2014-07-08 | Sharp Laboratories Of America, Inc. | Stereoscopic dynamic range image sequence |
TWI498003B (zh) | 2009-02-02 | 2015-08-21 | Thomson Licensing | 代表一序列圖像的碼式資料連流之解碼方法和一序列圖像之寫碼方法及碼式圖像資料結構 |
KR20100095992A (ko) | 2009-02-23 | 2010-09-01 | 한국과학기술원 | 비디오 부호화에서의 분할 블록 부호화 방법, 비디오 복호화에서의 분할 블록 복호화 방법 및 이를 구현하는 기록매체 |
US9110849B2 (en) * | 2009-04-15 | 2015-08-18 | Qualcomm Incorporated | Computing even-sized discrete cosine transforms |
EP2271102A1 (en) | 2009-06-29 | 2011-01-05 | Thomson Licensing | Adaptive residual image coding |
TW201132129A (en) | 2009-08-06 | 2011-09-16 | Panasonic Corp | Encoding method, decoding method, encoding device and decoding device |
US8379718B2 (en) | 2009-09-02 | 2013-02-19 | Sony Computer Entertainment Inc. | Parallel digital picture encoding |
US8711938B2 (en) * | 2009-09-04 | 2014-04-29 | Sharp Laboratories Of America, Inc. | Methods and systems for motion estimation with nonlinear motion-field smoothing |
JP2011066844A (ja) | 2009-09-18 | 2011-03-31 | Toshiba Corp | 並列復号装置及びプログラム並びに符号化データの並列復号方法 |
JPWO2011039931A1 (ja) | 2009-09-30 | 2013-02-21 | 三菱電機株式会社 | 画像符号化装置、画像復号装置、画像符号化方法及び画像復号方法 |
US8705623B2 (en) * | 2009-10-02 | 2014-04-22 | Texas Instruments Incorporated | Line-based compression for digital image data |
EP2312854A1 (de) * | 2009-10-15 | 2011-04-20 | Siemens Aktiengesellschaft | Verfahren zur Codierung von Symbolen aus einer Folge digitalisierter Bilder |
US9445119B2 (en) * | 2009-10-29 | 2016-09-13 | Vestel Elektronik Sanayi Ve Ticaret A.S. | Method and device for processing a video sequence |
US9473792B2 (en) | 2009-11-06 | 2016-10-18 | Texas Instruments Incorporated | Method and system to improve the performance of a video encoder |
US20110109721A1 (en) | 2009-11-06 | 2011-05-12 | Sony Corporation | Dynamic reference frame reordering for frame sequential stereoscopic video encoding |
KR20120086232A (ko) | 2011-01-25 | 2012-08-02 | (주)휴맥스 | 율-왜곡 최적화를 위한 영상 부호화/복호화 방법 및 이를 수행하는 장치 |
US9819358B2 (en) | 2010-02-19 | 2017-11-14 | Skype | Entropy encoding based on observed frequency |
US8559511B2 (en) | 2010-03-30 | 2013-10-15 | Hong Kong Applied Science and Technology Research Institute Company Limited | Method and apparatus for video coding by ABT-based just noticeable difference model |
KR101390620B1 (ko) | 2010-03-31 | 2014-04-30 | 인텔 코포레이션 | 비디오 인코딩을 위한 전력 효율적인 움직임 추정 기법 |
JP5377395B2 (ja) * | 2010-04-02 | 2013-12-25 | 日本放送協会 | 符号化装置、復号装置及びプログラム |
KR20110112168A (ko) | 2010-04-05 | 2011-10-12 | 삼성전자주식회사 | 내부 비트뎁스 확장에 기반한 비디오 부호화 방법 및 그 장치, 내부 비트뎁스 확장에 기반한 비디오 복호화 방법 및 그 장치 |
JP5393573B2 (ja) * | 2010-04-08 | 2014-01-22 | 株式会社Nttドコモ | 動画像予測符号化装置、動画像予測復号装置、動画像予測符号化方法、動画像予測復号方法、動画像予測符号化プログラム、及び動画像予測復号プログラム |
US8410959B2 (en) * | 2010-04-09 | 2013-04-02 | Qualcomm, Incorporated | Variable length codes for coding of video data |
KR101752418B1 (ko) | 2010-04-09 | 2017-06-29 | 엘지전자 주식회사 | 비디오 신호 처리 방법 및 장치 |
US8942282B2 (en) | 2010-04-12 | 2015-01-27 | Qualcomm Incorporated | Variable length coding of coded block pattern (CBP) in video compression |
JP5676744B2 (ja) * | 2010-04-13 | 2015-02-25 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | エントロピー符号化 |
KR101994900B1 (ko) | 2010-04-13 | 2019-06-28 | 지이 비디오 컴프레션, 엘엘씨 | 이미지들의 멀티-트리 서브-디비젼을 이용한 비디오 코딩 |
WO2011127961A1 (en) | 2010-04-13 | 2011-10-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. | Adaptive image filtering method and apparatus |
US20110255594A1 (en) * | 2010-04-15 | 2011-10-20 | Soyeb Nagori | Rate Control in Video Coding |
KR101444691B1 (ko) * | 2010-05-17 | 2014-09-30 | 에스케이텔레콤 주식회사 | 참조영상 구성 및 인덱싱 장치 및 방법 |
KR101652149B1 (ko) | 2010-05-26 | 2016-08-29 | 퀄컴 인코포레이티드 | 카메라 파라미터 지원 비디오 프레임 레이트 상향 변환 |
KR20110135787A (ko) | 2010-06-11 | 2011-12-19 | 삼성전자주식회사 | 엣지-적응 변환을 이용한 영상 부호화/복호화 시스템 및 방법 |
WO2011158225A1 (en) * | 2010-06-17 | 2011-12-22 | Mirtemis Ltd. | System and method for enhancing images |
US20110310976A1 (en) * | 2010-06-17 | 2011-12-22 | Qualcomm Incorporated | Joint Coding of Partition Information in Video Coding |
WO2012008925A1 (en) * | 2010-07-15 | 2012-01-19 | Agency For Science, Technology And Research | Method, apparatus and computer program product for encoding video data |
US8934540B2 (en) * | 2010-07-20 | 2015-01-13 | Cisco Technology, Inc. | Video compression using multiple variable length coding methods for multiple types of transform coefficient blocks |
EP2609744A4 (en) | 2010-08-26 | 2017-07-19 | NXP USA, Inc. | Video processing system and method for parallel processing of video data |
CN103141105B (zh) * | 2010-09-27 | 2018-05-15 | Lg电子株式会社 | 用于分割块的方法和解码设备 |
JP2012080213A (ja) | 2010-09-30 | 2012-04-19 | Mitsubishi Electric Corp | 動画像符号化装置、動画像復号装置、動画像符号化方法及び動画像復号方法 |
US8885704B2 (en) * | 2010-10-01 | 2014-11-11 | Qualcomm Incorporated | Coding prediction modes in video coding |
US9628821B2 (en) * | 2010-10-01 | 2017-04-18 | Apple Inc. | Motion compensation using decoder-defined vector quantized interpolation filters |
US8902988B2 (en) | 2010-10-01 | 2014-12-02 | Qualcomm Incorporated | Zero-out of high frequency coefficients and entropy coding retained coefficients using a joint context model |
US8750373B2 (en) * | 2010-10-04 | 2014-06-10 | Vidyo, Inc. | Delay aware rate control in the context of hierarchical P picture coding |
US9055305B2 (en) * | 2011-01-09 | 2015-06-09 | Mediatek Inc. | Apparatus and method of sample adaptive offset for video coding |
WO2012052968A1 (en) * | 2010-10-20 | 2012-04-26 | Nokia Corporation | Method and device for video coding and decoding |
US8873627B2 (en) * | 2010-12-07 | 2014-10-28 | Mediatek Inc | Method and apparatus of video coding using picture structure with low-delay hierarchical B group |
US8761245B2 (en) | 2010-12-21 | 2014-06-24 | Intel Corporation | Content adaptive motion compensation filtering for high efficiency video coding |
US9462280B2 (en) | 2010-12-21 | 2016-10-04 | Intel Corporation | Content adaptive quality restoration filtering for high efficiency video coding |
CN102572419B (zh) * | 2010-12-28 | 2014-09-03 | 深圳市云宙多媒体技术有限公司 | 一种帧间预测方法、装置 |
CN103416062A (zh) | 2011-01-07 | 2013-11-27 | 三星电子株式会社 | 能够执行双向预测和单向预测的视频预测方法及其装置、视频编码方法及其装置以及视频解码方法及其装置 |
US10027957B2 (en) * | 2011-01-12 | 2018-07-17 | Sun Patent Trust | Methods and apparatuses for encoding and decoding video using multiple reference pictures |
US9602819B2 (en) * | 2011-01-31 | 2017-03-21 | Apple Inc. | Display quality in a variable resolution video coder/decoder system |
US8953690B2 (en) | 2011-02-16 | 2015-02-10 | Google Technology Holdings LLC | Method and system for processing video data |
GB2488159B (en) | 2011-02-18 | 2017-08-16 | Advanced Risc Mach Ltd | Parallel video decoding |
JP2012186763A (ja) | 2011-03-08 | 2012-09-27 | Mitsubishi Electric Corp | 動画像符号化装置、動画像復号装置、動画像符号化方法及び動画像復号方法 |
US9848197B2 (en) * | 2011-03-10 | 2017-12-19 | Qualcomm Incorporated | Transforms in video coding |
US9154799B2 (en) * | 2011-04-07 | 2015-10-06 | Google Inc. | Encoding and decoding motion via image segmentation |
US20120262545A1 (en) * | 2011-04-18 | 2012-10-18 | Paul Kerbiriou | Method for coding and decoding a 3d video signal and corresponding devices |
US9485517B2 (en) | 2011-04-20 | 2016-11-01 | Qualcomm Incorporated | Motion vector prediction with motion vectors from multiple views in multi-view video coding |
US9008180B2 (en) | 2011-04-21 | 2015-04-14 | Intellectual Discovery Co., Ltd. | Method and apparatus for encoding/decoding images using a prediction method adopting in-loop filtering |
US8494290B2 (en) | 2011-05-05 | 2013-07-23 | Mitsubishi Electric Research Laboratories, Inc. | Method for coding pictures using hierarchical transform units |
US8989270B2 (en) * | 2011-06-23 | 2015-03-24 | Apple Inc. | Optimized search for reference frames in predictive video coding system |
CN103828376B (zh) | 2011-06-29 | 2018-04-03 | 谷歌技术控股有限责任公司 | 用于在帧内编译期间使用扫描编译图案的方法和系统 |
NO335667B1 (no) | 2011-06-29 | 2015-01-19 | Cisco Systems Int Sarl | Metode for videokomprimering |
SG10201709427VA (en) | 2011-07-01 | 2017-12-28 | Samsung Electronics Co Ltd | Method And Apparatus For Entropy Encoding Using Hierarchical Data Unit, And Method And Apparatus For Decoding |
US11245912B2 (en) * | 2011-07-12 | 2022-02-08 | Texas Instruments Incorporated | Fast motion estimation for hierarchical coding structures |
KR101362696B1 (ko) | 2011-10-19 | 2014-02-17 | 전북대학교산학협력단 | 하이브리드 아키텍쳐가 적용된 신호 변환 장치, 신호 변환 방법 및 기록매체 |
KR20130045425A (ko) | 2011-10-25 | 2013-05-06 | (주)케이테크 | 소셜 온톨로지 기반 지식 전문가 추천방법 |
US10452743B2 (en) | 2011-11-07 | 2019-10-22 | Vid Scale, Inc. | Video and data processing using even-odd integer transforms |
US20130223524A1 (en) * | 2012-02-29 | 2013-08-29 | Microsoft Corporation | Dynamic insertion of synchronization predicted video frames |
US9912944B2 (en) * | 2012-04-16 | 2018-03-06 | Qualcomm Incorporated | Simplified non-square quadtree transforms for video coding |
KR101327078B1 (ko) * | 2012-04-27 | 2013-11-07 | 엘지이노텍 주식회사 | 카메라 및 이의 영상 처리 방법 |
KR101677406B1 (ko) * | 2012-11-13 | 2016-11-29 | 인텔 코포레이션 | 차세대 비디오용 비디오 코덱 아키텍처 |
CN104704827B (zh) | 2012-11-13 | 2019-04-12 | 英特尔公司 | 用于下一代视频的内容自适应变换译码 |
US9743091B2 (en) * | 2012-12-17 | 2017-08-22 | Lg Electronics Inc. | Method for encoding/decoding image, and device using same |
CN104885470B (zh) | 2013-01-30 | 2018-08-07 | 英特尔公司 | 用于下一代视频的预测和编码的内容自适应划分 |
-
2013
- 2013-12-24 CN CN201380068582.0A patent/CN104885470B/zh not_active Expired - Fee Related
- 2013-12-24 KR KR1020177015400A patent/KR102063385B1/ko active IP Right Grant
- 2013-12-24 EP EP13873620.2A patent/EP2952002A4/en not_active Ceased
- 2013-12-24 WO PCT/US2013/077702 patent/WO2014120369A1/en active Application Filing
- 2013-12-24 EP EP13873683.0A patent/EP2951999A4/en not_active Ceased
- 2013-12-24 US US14/379,548 patent/US9794569B2/en active Active
- 2013-12-24 BR BR112015015575A patent/BR112015015575A2/pt not_active Application Discontinuation
- 2013-12-24 KR KR1020157017114A patent/KR20150090206A/ko active Search and Examination
- 2013-12-24 US US14/433,601 patent/US9973758B2/en active Active
- 2013-12-24 WO PCT/US2013/077698 patent/WO2014120368A1/en active Application Filing
- 2013-12-24 CN CN201380068546.4A patent/CN104885467B/zh not_active Expired - Fee Related
- 2013-12-24 US US14/379,532 patent/US9787990B2/en active Active
- 2013-12-24 WO PCT/US2013/077692 patent/WO2014120367A1/en active Application Filing
- 2013-12-24 KR KR1020157009528A patent/KR20150058324A/ko active Application Filing
- 2013-12-24 CN CN201380053525.5A patent/CN104737542B/zh not_active Expired - Fee Related
- 2013-12-24 EP EP13874126.9A patent/EP2952003B1/en active Active
- 2013-12-27 US US14/379,403 patent/US9973757B2/en active Active
- 2013-12-27 KR KR1020157009347A patent/KR20150055005A/ko not_active Application Discontinuation
- 2013-12-27 US US14/375,690 patent/US9794568B2/en active Active
- 2013-12-27 WO PCT/US2013/077967 patent/WO2014120373A1/en active Application Filing
- 2013-12-27 EP EP13873470.2A patent/EP2951998A4/en not_active Ceased
- 2013-12-27 KR KR1020157016934A patent/KR20150090178A/ko not_active Application Discontinuation
- 2013-12-27 CN CN201380053523.6A patent/CN104718756B/zh not_active Expired - Fee Related
- 2013-12-27 WO PCT/US2013/078114 patent/WO2014120374A1/en active Application Filing
- 2013-12-27 CN CN201380068583.5A patent/CN104885471B/zh not_active Expired - Fee Related
- 2013-12-27 EP EP13873217.7A patent/EP2952001A4/en not_active Withdrawn
- 2013-12-28 EP EP14075087.8A patent/EP3013053A3/en not_active Withdrawn
- 2013-12-28 US US14/436,058 patent/US10021392B2/en active Active
- 2013-12-28 CN CN201380053522.1A patent/CN105556964B/zh not_active Expired - Fee Related
- 2013-12-28 EP EP13075091.2A patent/EP2996338A3/en not_active Withdrawn
- 2013-12-28 JP JP2015545956A patent/JP6163674B2/ja not_active Expired - Fee Related
- 2013-12-28 WO PCT/US2013/078157 patent/WO2014120375A2/en active Application Filing
- 2013-12-28 EP EP13873428.0A patent/EP3008900A4/en not_active Withdrawn
-
2014
- 2014-01-24 CN CN201480003744.7A patent/CN105453570B/zh active Active
- 2014-01-24 JP JP2015551073A patent/JP6339099B2/ja active Active
- 2014-01-24 EP EP14746821.9A patent/EP2952004A4/en not_active Withdrawn
- 2014-01-24 US US14/375,953 patent/US9686551B2/en active Active
- 2014-01-24 WO PCT/US2014/013027 patent/WO2014120575A1/en active Application Filing
- 2014-01-28 EP EP14746494.5A patent/EP2951993A4/en not_active Withdrawn
- 2014-01-28 WO PCT/US2014/013333 patent/WO2014120656A1/en active Application Filing
- 2014-01-28 CN CN201480003751.7A patent/CN105052140B/zh not_active Expired - Fee Related
- 2014-01-28 US US14/375,935 patent/US9609330B2/en active Active
- 2014-01-28 RU RU2015126241A patent/RU2612600C2/ru not_active IP Right Cessation
- 2014-01-30 KR KR1020157017027A patent/KR101770047B1/ko active IP Right Grant
- 2014-01-30 WO PCT/US2014/013915 patent/WO2014120960A1/en active Application Filing
- 2014-01-30 US US14/759,165 patent/US10284852B2/en active Active
- 2014-01-30 EP EP14746133.9A patent/EP2951995A4/en not_active Withdrawn
- 2014-01-30 CN CN201480003732.4A patent/CN105191309B/zh not_active Expired - Fee Related
- 2014-01-30 WO PCT/US2014/013965 patent/WO2014120987A1/en active Application Filing
- 2014-01-30 EP EP14745362.5A patent/EP2951994A4/en not_active Withdrawn
- 2014-01-30 CN CN201480003747.0A patent/CN104885455B/zh not_active Expired - Fee Related
- 2014-01-30 US US14/759,171 patent/US20150373328A1/en not_active Abandoned
- 2014-01-30 JP JP2015551074A patent/JP6286718B2/ja not_active Expired - Fee Related
- 2014-02-24 WO PCT/US2014/018077 patent/WO2015099814A1/en active Application Filing
- 2014-02-24 US US15/100,211 patent/US20180176577A1/en not_active Abandoned
- 2014-04-14 US US15/100,216 patent/US10284853B2/en active Active
- 2014-07-17 US US14/334,257 patent/US9762911B2/en active Active
-
2017
- 2017-07-18 US US15/653,263 patent/US10009610B2/en active Active
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6286718B2 (ja) | 高効率な次世代ビデオコーディングのためのフレーム階層応答型量子化を使用する、コンテンツ適応ビットレートおよび品質管理 | |
US10469854B2 (en) | Content, psychovisual, region of interest, and persistence based adaptive quantization for video coding | |
KR101789954B1 (ko) | 차세대 비디오 코딩을 위한 콘텐츠 적응적 이득 보상된 예측 | |
JP6120390B2 (ja) | 次世代動画用コンテンツに適応的な特性補償済み予測 | |
US11082706B2 (en) | Method and system of video coding with a multi-pass prediction mode decision pipeline | |
US10291925B2 (en) | Techniques for hardware video encoding | |
US8023562B2 (en) | Real-time video coding/decoding | |
CN110740318A (zh) | 用于视频处理和视频译码的自动自适应长期参考帧选择 | |
US10205953B2 (en) | Object detection informed encoding | |
US20190045195A1 (en) | Reduced Partitioning and Mode Decisions Based on Content Analysis and Learning | |
JP2022537064A (ja) | エンコーダ、デコーダ、および対応する方法 | |
US20150326857A1 (en) | Video coding quantization parameter determination suitable for video conferencing | |
CN113557730A (zh) | 用于利用基于子块的局部光照补偿的视频编码和解码方法和装置 | |
US20180184089A1 (en) | Target bit allocation for video coding | |
CN112087628A (zh) | 使用两级帧内搜索对视频进行编码 | |
US10812832B2 (en) | Efficient still image coding with video compression techniques | |
US20210306640A1 (en) | Fine grain lookahead enhancement for video coding | |
NL2029548B1 (en) | Determining adaptive quantization matrices using machine learning for video coding | |
RU2824186C2 (ru) | Кодер, декодер и соответствующие способы |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160620 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160720 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20161017 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20161209 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170120 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170523 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170818 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180109 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180112 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6286718 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |