[go: up one dir, main page]

JPH03237887A - Dct processor unit - Google Patents

Dct processor unit

Info

Publication number
JPH03237887A
JPH03237887A JP2034310A JP3431090A JPH03237887A JP H03237887 A JPH03237887 A JP H03237887A JP 2034310 A JP2034310 A JP 2034310A JP 3431090 A JP3431090 A JP 3431090A JP H03237887 A JPH03237887 A JP H03237887A
Authority
JP
Japan
Prior art keywords
bit
bit length
processing
data
dct
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2034310A
Other languages
Japanese (ja)
Other versions
JP2910124B2 (en
Inventor
Mikio Fujiwara
藤原 美貴雄
Takayuki Minemaru
貴行 峯丸
Hisashi Takayama
久 高山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2034310A priority Critical patent/JP2910124B2/en
Publication of JPH03237887A publication Critical patent/JPH03237887A/en
Application granted granted Critical
Publication of JP2910124B2 publication Critical patent/JP2910124B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Complex Calculations (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

PURPOSE:To make a linear DCT (discrete cosine transformation) processing complete by dividing a bit length into specific bit length sets, executing the calculation of partial product in parallel depending on the bit length and executing the sum of intermediate results finally. CONSTITUTION:The DCT processor is provided with a 14-bit picture signal input u(j)2, 14-bit data registers 3-10 and 14-bit picture signal {u(n=mod(j)s), m=0-7} 11-18. Bit serial arithmetic sections 19-22 employ shift registers to apply addition and subtraction in bit serial. An M-bit length is divided into L bit length sets to satisfy the relation of L<N, the calculation of partial product is executed in parallel in the L bit length and the intermediate results are added finally. Thus, in the case of N=8, J=2, 8X1 linear DCT processing is realized for a period of 8 sampling clocks and the accuracy of the internal arithmetic operation is ensured up to the accuracy of M=14-bit without use of a multiplier.

Description

【発明の詳細な説明】 産業上の利用分野 本発明(よ テレビ会議システヘ テレビ電話の動画像
帯域圧縮でCCITTにより標準化作業がなされている
64にビット/秒の画像コーデック処理テ用イられるD
 CT (Discrete Co51ne Tran
sfora離散コサイン変換)処理装置に関すん 従来の技術 1画素データがMビット長であるM×NIf素ブロック
に対して、DCTを行なう場合、フィルター処理等の場
合と異なり、N画素のデータアクセス期間中に −次元
方向の処理が完結していれば良いという利点があん こ
の利点を活用して、ビットシリアルに演算処理をおこな
う方法力t 分数型演算手法として、例えば アイ・イ
ー・イー・イー・トランザクション・アコースティック
入スピーチ、シグナ/k  プロセッシング第22巻(
1974年12月)第456頁から第462頁(I E
 E E Trans、Ac。
DETAILED DESCRIPTION OF THE INVENTION Industrial Fields of Application The present invention is applicable to videoconferencing systems.The 64 bits per second image codec processing system is being used for standardization work by the CCITT for video telephony video bandwidth compression.
CT (Discrete Co51ne Tran)
sfora (discrete cosine transform) processing device Conventional technology When performing DCT on an M×NIf element block in which one pixel data has a length of M bits, the data access period of N pixels is different from the case of filter processing, etc. Among them, there is an advantage that processing in the -dimensional direction only needs to be completed. Taking advantage of this advantage, there is a method to perform bit-serial calculation processing. As a fractional type calculation method, for example, I. Transaction Acoustic Speech, Signa/k Processing Volume 22 (
December 1974), pages 456 to 462 (IE
E E Trans, Ac.

ustic、、5peech、Signal Proc
essing vol、ASSP=22゜pp、 45
6−462. Dec。1974どA new har
dware realization of digi
tal filters、’by A、Pe1ed a
nd B、Li。
ustic, 5peech, Signal Proc
essing vol, ASSP=22゜pp, 45
6-462. Dec. 1974 A new har
dware realization of digi
tal filters,'by A, Pe1ed a
nd B, Li.

U)に発表されていも この処理手法&よ Mビット長
のデータに関する演算を、 iビット目の演算というサ
ブセットに着目して算出し その結果に対して21+−
11の桁補正を施して加算することにより最終結果を求
めるというものであ4  DCT処理について、この手
法を適用すると、以下のようになん 今、Mビット長で
負の数を2の補数で表ゎ−1 すN個の整数データ列(u(n)−Σa+ (n)2’
、an−+ (n)−−■ [0,−1]、 (at (n)(0,1コ、0≦i≦
12,0≦n≦N−1))に対する一次元のDCI友 
式(1−1)〜(1−3)と表現することが出来も この式で、iに関する加算でまとめると、次式のように
なん 、0≦に≦N−1(1−5) 式(1−5)で、大括弧()の中のデータ”’Q、  
at(n)は0か1あるいはOか−1の1ビツトのデー
タであに準備することが可能であも 故に 大括弧( 1172 α(0)−(> (1−2) 2  1′な α(k)−(−)、   O≦に≦N−1(1−3)上
式(1−1)に u(n)の指数表現を代入すると、式
(1−4)のように書けも 算を用いることなく加減算のみで実行することが出来 
集積回路で実現する場合に 並列乗算器を用いる場合に
比べてチップサイズを小さくすることが出来る利点を有
していも さらにDCTO場が偶数の場A  N−2N
’として式(1−5>は以下のようにあられすことが出
来も 上式の第二項のC05(・)の項を変形すると、となも
 式(1−8)、 (1−9)を用いて、kについて偶
数項と奇数項で式(1−7)を変形すると、次式のよう
になも に−2に’ 、 O≦に′≦N′−1の時ν(2に’)
−Σ21(Σ(at (n)+a+ (2N’ −1−
11) )(Z (2に’ )cos雪・  n・− に−2に’ +1.0≦に°≦N°−1の時同様に に−2に’ +1. O≦に′≦N′−1の時となも 式(1−10)と(1−11)により、DCTの変換核
cos[ π (2n+1)k ]の対称性を利用すると、 α(k)cos 容量(よ 1つのkに対してがワードから2111/I
llに節約することが出来ることがわかん しかL  
(a、(n)+a+ (2N’−1−n))や(a+ 
(n)−a+ (2N’−1−n))項か転キャリーお
よびボロー発生があるので、iに関する加算回数は(M
+1)回となん このように この演算方式は 大括弧
()の中の演算を、DCTの変換同時にDCTの変換核
の対称性を利用してROM容量を節約することがでよ 
演算そのものは乗算を用いることなく加減算のみで実行
することが出来も これらの特mtt  集積回路で実
現する場合に 並列乗算器を用いる場合に比べてチップ
サイズを小さくすることが出来るという利点を有してい
も 発明が解決しようとする課題 しかしなが転 1¥A素のサンプリング時間が1基本ク
ロック期間であるとして、この1クロック期間に一回の
加算処理や一回のROMアクセスが可能な同期系を想定
すると、 ビット長M#tDCTの処理単位Nよりも大
きい場合 そのままでζ上処理が完結しないことを意味
すム これ!!  N−16以上の場合には問題になら
ない爪 CCITTにより標準化作業がなされている6
4にビット/秒の画像コーデック処理で用いられるN−
8のDCTの場合にば M≦8ビットで制限されること
になるた吹中間処理部で十分な精度を得られないという
問題点があっ1.  本発明はかかる点に鑑−LM>N
ビットの精度でNサンプリングクロックの期間でNx1
の一次元のDCT処理を完結するN×NのDCT処理装
置を安価に提供することを目的とすも課題を解決するた
めの手段 上記の問題点を解決するた吹 本発明のDCT処理装置
+&  Mビット長をL<Nを満足するLビット長に分
割L−Lビット長で部分積の演算を並列的に実行し 最
後にそれらの中間結果の加算を実行するという構成を備
えたものであも作用 本発明は前記した構成により、Lビット長で部分積の演
算が並列に実行されると、中間和が並列に生成されるた
めに 演算が高速に実行されることとなり、ビット長M
がDCTの処理単位Nよりも大きい場合においてもNサ
ンプリングクロックの期間で処理が完結すも 実施例 以下、本発明のDCT処理装置の一実施例を図面と共に
説明すも 第1図は本発明の一実施例における14ビツ
トの画像信号人力u(j)に対する8×1の一次元のD
CT処理装置のブロック図であも図において、2は14
ビツトの画像信号人力u(j)、3〜10は14ビツト
のデータレシス久 11〜18は14ビツトの画像信号
[u(n=mod(j )* )、 m−0〜7 )で
あも19〜22はビットシリアル演算部であり、シフト
レジスタを用いて、ビットシリアルに加算および減算を
行なう。23〜38はビットシリアル演算部19〜22
のビットシリアル演算の結果である各1ビツトの信号で
、39〜42は1ビツトの演算結果23〜38を各4ビ
ツトごとにまとめたデータ線であム43〜46はデータ
線39〜42の4ビツトのデータをアドレス情報とり、
、ROMにより係数とデータの乗算の部分積を生成し 
その値に左方シフトを施し累積加算を行なうROMと加
算器による係数乗算部であ′;4o47〜54は8×1
のDCT処理結果の33ビツトの出力4言号(ν(k)
、 k−0〜7)であも 55〜62は33ビツトトラ
イステートドライバであり、出力データの並列/直列変
換を行なう。63は33ビツトトライステートドライバ
の55〜62の動作により時系列化された33ビット信
号出力であも 第2図は第1図のビットシリアル演算部
19〜22の回路構成図であモロ5は14ビツトの画像
信号u(n)、66は14ビツトの画像信号u(7−n
)であ7)c、67.68は上位7ビツトと下位7ビツ
トが独立な14ビツトのデータロード機能付き右方シフ
ターであり、ビットシリアル演算に必要なビット単位で
の処理を行なう。69.70は1ビツト全加算!  7
1.72は1ビツト全減算器であモア3〜76は1ビツ
トのデータラッチ玄 1ビット全加算器69.70での
演算で発生するキャリーおよび1ビット全減算器71.
72での演算で発生するボローを保持すん77〜80は
各1ビツトの演算結果の信号であり、係数との乗算の部
分積をROMから読み出す時のアドレス情報として用い
られも 第3図は第1図のROMと加算器による係数乗
算部43〜46の回路構成図であム82〜85は係数と
の乗算の部分積をROMから読み出す時のアドレス情報
である各4ビツトのデータであモ86〜89は16ワー
ド×18ビツト容量玄 係数との乗算の部分積を生成す
るROK90〜93は26ビツト全加算銖94〜97は
26ビツトのデータロード機能付き右方シフター、98
.99は33ビツト全加算器 100.101は33ビ
ツトレジス久 102は33ビット出力信号ν(2に’
 )、103は33ビット出力信号ν(2に’+1)で
あも 第1図と第2図と第3図を用いて、 8×1の一
次元DCT処理の動作について説明すも 本発明におい
てLLM>8ビツト長の1画素データをLビット長のデ
ータに分割して、処理を実行すも 例えばMビット長の
データを3個のLビット長データに分割すると、式(1
−5)は次のように変形できム2π(2n+1)k ν(k)−Σ21(Σat(n)α(k)cos []
 )−一 内°−2N 上式は3個の部分項の和によって戒り立板 各部分項は
L回の加算により実行されることを意味してい4L回の
加算時間と3個の項を加算する時間の総和75t  N
個のデータのサンプリング時間よりも短ければ 目的と
する高速処理が実現出来も一例として、N−8、J−2
の場合を考えも この時以下の式を満足するMビット長
のデータまで高速処理が可能であも 8≧trune(M/2+0.5)+1 ;trune
(−)切り捨て(1−13)故にM≦14となも まf
、ROM容量削減のた吹従来例と同様に 式(1−12
)に対し式(1−10)、 (1−11)を適用すると
式(1−14)、(1−15)が得られもに−2に’、
0≦に′≦3の時 ・      1 y(2に’)−Σ2’(Σ(a+(n)十a+(7−n
))α(2に’)cosl−@      *−・ 2π(2n+1)k’ [−1)、O≦に′≦3 に−2に’ +1. O≦に′≦3の時(1−14) ν(2に’+1)−Σ2 −I (Σ(a+ (n)−a+ (7−n)) a (2に
’ +1)cosン構戊溝底用することにより、M−1
4ビツトの精度で8画素のサンプリングクロックの期間
で8xlの一次元のDCT処理を実現することができも
第1図において、 8×1の一次元DCT処理の動作を
説明すモ14ビットの画像信号人力u(j)2は8画素
のサブセットに対してDCT処理を施されるた6 14
ビツトレジスタ3〜10ニ  それぞれ[u(n)、n
−mod(j)s、O≦n≦7)と分割されて保持され
も14ビツトレジスタ3〜10で(よ この8個のサブ
セットデータ列(u(n)、0≦n≦7)が完全に更新
されるま”Q1回のデータサンプリングに対して1回の
シフト動作を行な(\ データを順次送っていく。
Although this processing method was published in
The final result is obtained by applying 11 digit corrections and adding them.4 When this method is applied to DCT processing, the result is as follows.ゎ-1 N integer data string (u(n)-Σa+ (n)2'
, an-+ (n)--■ [0,-1], (at (n) (0,1, 0≦i≦
One-dimensional DCI friend for 12,0≦n≦N-1))
This formula can be expressed as formulas (1-1) to (1-3), and when summarized by addition regarding i, as in the following formula, 0≦≦N-1 (1-5) Formula (1-5), the data in brackets ()''Q,
at(n) can be prepared with 1-bit data of 0 or 1 or O or -1, so it is written in square brackets (1172 α(0)-(> (1-2) 2 1'). α(k)-(-), O≦≦N-1 (1-3) Substituting the exponential expression of u(n) into the above equation (1-1), it can be written as equation (1-4). It can also be executed using only addition and subtraction without using arithmetic.
Even though it has the advantage of being able to reduce the chip size when implemented using an integrated circuit compared to using parallel multipliers, in addition, if the DCTO field is an even number, A N-2N
', the equation (1-5> can be written as below.If we transform the second term C05(・) in the above equation, we get Equation (1-8), (1-9 ) and transform equation (1-7) with an even term and an odd term for k, we get ν(2 ni')
-Σ21(Σ(at (n)+a+ (2N' -1-
11) ) (Z (to 2') cos snow・n・− to −2′ +1.0≦°≦N°Similarly when −1, to −2′ +1. O≦′≦N′ −1, using equations (1-10) and (1-11), and using the symmetry of the DCT transformation kernel cos[π (2n+1)k], α(k)cos capacity (as one 2111/I for k from word
I don't know how much money I can save.
(a, (n)+a+ (2N'-1-n)) or (a+
(n)-a+ (2N'-1-n)) term, carry and borrow occur, so the number of additions for i is (M
+1) times In this way, this calculation method can save ROM capacity by using the symmetry of the DCT transformation kernel while converting the operations in square brackets () to the DCT.
The operations themselves can be performed using only addition and subtraction without using multiplication.These characteristics have the advantage that the chip size can be made smaller when implemented using integrated circuits compared to when parallel multipliers are used. However, the problem to be solved by the invention is as follows: Assuming that the sampling time of 1\A element is one basic clock period, there is a synchronous system that can perform one addition process and one ROM access in this one clock period. Assuming that, if the bit length M#tDCT is larger than the processing unit N, this means that the processing on ζ will not be completed. ! Nails that are not a problem in cases of N-16 or higher Standardization work is being carried out by CCITT6
N- used in image codec processing at 4 bits per second
In the case of a DCT of 8 bits, there is a problem that sufficient accuracy cannot be obtained in the intermediate processing section, which is limited to M≦8 bits.1. The present invention takes into consideration this point - LM>N
Nx1 with a period of N sampling clocks with bit precision
The object of the present invention is to provide an N×N DCT processing device that completes one-dimensional DCT processing at a low cost. It has a structure in which the M bit length is divided into L bit lengths satisfying L<N, partial product operations are executed in parallel with L-L bit lengths, and finally the intermediate results are added. According to the present invention, with the above-described configuration, when partial product operations are executed in parallel with a length of L bits, intermediate sums are generated in parallel, so that the operations are executed at high speed.
Even if the DCT processing unit N is larger than the processing unit N of the DCT, the processing is completed in a period of N sampling clocks. An 8×1 one-dimensional D for a 14-bit image signal u(j) in one embodiment
In the block diagram of the CT processing device, 2 is 14.
11-18 are 14-bit image signals [u(n=mod(j)*), m-0-7) and 19 .about.22 is a bit-serial calculation unit that performs bit-serial addition and subtraction using a shift register. 23 to 38 are bit serial calculation units 19 to 22
The signals 39 to 42 are each 1-bit signal which is the result of the bit serial operation of Takes 4-bit data as address information,
, generate partial products of multiplication of coefficients and data by ROM.
It is a coefficient multiplication unit consisting of a ROM and an adder that performs cumulative addition by shifting the value to the left; 4o47 to 54 are 8×1
The 33-bit output 4 words (ν(k)
, k-0 to k-7) and 55 to 62 are 33-bit tri-state drivers, which perform parallel/serial conversion of output data. 63 is the 33-bit signal output time-series by the operation of 55-62 of the 33-bit tri-state driver. The 14-bit image signal u(n), 66 is the 14-bit image signal u(7-n
) and 7)c, 67.68 is a 14-bit right shifter with a data load function in which the upper 7 bits and lower 7 bits are independent, and performs bit-by-bit processing necessary for bit serial operation. 69.70 is 1 bit total addition! 7
1.72 is a 1-bit full subtractor, and mores 3 to 76 are 1-bit data latch blocks, a carry generated by the operation in the 1-bit full adder 69, and 70, and a 1-bit full subtractor 71.
The signals 77 to 80 that hold the borrow generated in the operation at 72 are each 1-bit operation result signals, and are used as address information when reading out the partial product of multiplication with a coefficient from the ROM. Figure 1 is a circuit diagram of the coefficient multipliers 43 to 46 using the ROM and the adder. Figures 82 to 85 are 4-bit data each serving as address information when reading out the partial product of multiplication with a coefficient from the ROM. 86 to 89 are 16 word x 18 bit capacity. ROK 90 to 93 are 26 bit full adders that generate partial products for multiplication with coefficients. 94 to 97 are 26 bit right shifters with data loading function.
.. 99 is a 33-bit full adder, 100.101 is a 33-bit register, and 102 is a 33-bit output signal ν (2).
), 103 is a 33-bit output signal ν (2 + 1).The operation of 8×1 one-dimensional DCT processing will be explained using FIGS. One pixel data with LLM>8 bit length is divided into L bit length data and processing is executed. For example, if M bit length data is divided into three L bit length data, the formula (1
−5) can be transformed as follows: 2π(2n+1)k ν(k)−Σ21(Σat(n)α(k)cos []
) - 1 inside ° - 2N The above equation is calculated by the sum of 3 subterms. This means that each subterm is executed by L additions, which requires 4L addition times and 3 terms. Total time to add 75t N
For example, if the sampling time is shorter than the data sampling time of N-8, J-2, the desired high-speed processing can be achieved.
Consider the case of 8≧trune(M/2+0.5)+1;trune
(-) Round down (1-13), so M≦14.
, the formula (1-12
), applying equations (1-10) and (1-11), equations (1-14) and (1-15) are obtained, and -2',
When 0≦′≦3・1 y(2′)−Σ2′(Σ(a+(n)10a+(7−n
)) α(to 2')cosl-@*-・2π(2n+1)k' [-1), O≦to'≦3to-2'+1. When O≦′≦3 (1-14) ν (2′+1)−Σ2 −I (Σ(a+ (n)−a+ (7−n)) a (2′+1) cosonic structure By using the groove bottom, M-1
It is possible to realize 8xl one-dimensional DCT processing with 4-bit precision and an 8-pixel sampling clock period. Since the signal force u(j)2 is subjected to DCT processing on a subset of 8 pixels, 6 14
Bit registers 3 to 10 [u(n), n
-mod(j)s, O≦n≦7) and is held in 14-bit registers 3 to 10 (these eight subset data strings (u(n), 0≦n≦7) are completely Until the data is updated, one shift operation is performed for one data sampling (\ Data is sent sequentially.

つまり、 8回のデータサンプリング毎に 新しいサブ
セットデータカ<、14ビツトレジスタ3〜10にu(
7)、・・・・、u(0)としてセットされも 次に 
このデータ&上14ビットの信号線11〜18を介して
、それぞれビットシリアル演算部19〜22に供給され
もこのビットシリアル演算部19〜22における処理を
、第2図を用いて説明すモ14ビットの画像入力65〜
661上  第1図の14ビツトレジスタ3〜10のい
ずれかからのデータ玄 2の補数表現を用いて現わ(a
+*(7−n)ε[0,−1コ、at(7−n)E[0
,1]、0≦i≦ 12.O≦n≦3)であも これら
のデータカ丈 上位7ビツトと下位7ビツトが独立した
14ビツトのデータロード機能付き右方シフター67、
68に入力され それぞ位7ビツトが分離した形で処理
され 1クロック期間毎に1回のLSB側への右方シフ
トが実行される。データロード機能付き右方シフター6
7.68より出力される信号CL  u(n)およびu
(7−n)の上位7ビツトと下位7ビツトに関して2L
桁の各1ビツトの値で、 al(n)とat・〒(n)
とat (7−n)とa+*y(7−1)であも これ
らの信号により、 1ビツト全加算器69.70と1ビ
ット全減算器71.72において、式(1−14)%式
%() (7 ))の演算を実行すも これらの演算により発生するキ
ャリーおよびボローは1ビツトラツチ73〜76に保持
され 1クロツク後の演算に用いられるために 元の1
ビット全加算器69. Toと1ビット全減算器71.
72に再帰的に入力されも 1ビット全加算器69.7
0の演算結果(友 1ビツトデータ線77、78に各々
出力され 1ビット全減算器71.72の演算結果ζ友
 1ビットデータ線79.80に各々出力されも第2図
で説明したのと同様に ビットシリアル演算部19.2
2で(よ 式(1−4L(1−5)の右辺の(a+◆マ
(n)+a+−7(7−n>)、(at (n)+a+
 (7−n))、((aly(n)−a−7(7−n)
)、(at (n)−at (7−n))の演算が実行
され ビットシリアル演算部19ではu(0)とu(7
)について、ビットシリアル演算部20ではu(1)と
u(6)について、ビットシリアル演算部21ではu(
2)とu(5)について、ビットシリアル演算部22で
はu(3)とu(4)について、この演算を実行すも 
この語気 各ビットシリアル演算部19〜22より出力
される4ビットデータ線39〜424;L4ビットデー
タ線39が((a+*〒(n)+a+◆v(7−n))
、rro、 1.2.3)を示L4ビットデータ線40
が((at (n)+a+ (7−n))、n−0,1
,2,3)を示LA 4ビツトデータ線41が((at
−v(n)−a+◆y(7−n))、n−0,1,2゜
3)を示り、4ビツトデータ線42が((at (n)
−at (7−n))、n−0,1,2,3)をそれぞ
れ示していも これらの4ビツトの信号の意味を、もう
少し詳しく説明するために 式(1−14)、(1−1
5)に戻って説明すも 式(1−14)および式(1−
15)のnに関する和の部分を展開すると、次式のよう
に表現することが出来もに−2に’ 、 O≦に°≦3
の時 k−2k”+1,0≦に′≦3の時 、0≦k”≦3          (1−17)δ 、0≦に′≦3 (1−16) このように 上式(1−16)における各2L桁に関す
る演算は K′を固定すれgi  ((at−v(n)
+a+−y(7−n))、n−0,1,2,3)の4ビ
ツトのデータと((at (n)+a+(7−n))、
n−0,1,2,3)の4ビツトのデータによって一意
的に決定することが出来も 又 式(1−17)につい
ても同様のことが成立すも 故にこれらの4ビット信号
をアドレス情報とし そのアドレス情とは容易であん 
このように 4ビツトデータ線39の4ビツトデータ(
よ 式(1−14)における2197桁らh  ROM
と加算器による係数乗算部43〜46に入力されも 同
様に 4ビツトデータ線40の4ビ(1−15)におけ
る2′″7桁での(Σ(a+*〒(n)−a+−y(7
−ドレス情報として用いらh  ROMと加算器による
係数乗算部43〜46に入力されも 同様に 4ビツト
データ線42の4ビツトデータζ友 式(1−15)に
として用いらN  ROMと加算器による係数乗算部4
3〜46に入力されも 次に ROMと加算器による係
数乗算部43〜46の中での処理について、第3図を用
いて説明すも 第3図において、 4ビット信号82は
、式(1−14)における21+?桁での、(,4(a
+求めるアドレス情報として用いらt”t  ROMと
加算器による係数乗算部43〜46に入力されも 同様
ピッ トデータ線41の4 ピッ トデータは 式 求めるアドレス情報で、 4ビツトデータ線39を介し
て入力されも 同様に 4ビット信号線83ハ式(1−
14)における 2+桁での(Σ(a+(n)+a+(7−n))α16
ワード×18ビツト容量のROM87でi3 4ピッで
、 4ビツトデータ線40を介して人力されも 同様に
 4ビット信号84ζ友 式(1−15)における21
0yr (2n+1)(2に’ +1) [])を求めるアドレス情報型 4 ビットデータ線41を介して入力されも 同様に4ビツ ト信号85(上 式(1−15)における2 桁での トのデータとして出力すも 同様ニ16ワード×18ビ
ット容量のROM88では 4ビット信号84を一夕と
して出力すも 同様?、、  18ワード×18ビツト
容量のROM89では 4ビット信号85をアドレπ(
2n+1 )(2に’ +1 ) [])を求めるアドレス情報で、4ビ ットデータ線42を介して入力されも 次ニ167−ド
×18ビッ ト容量のROM86では 4ビツ ト信 号82をア ドレス情報として受け(Σ(a+◆マ(n)+a+◆テ
値を18ビツ トのデータとして出力すム 同様に 出力すム 次に26ビツト全加算器90〜93と、26
ビツトのデータロード機能付き右方シフター94〜97
(表 4組の26ビツト累積加算器として働き、前記R
OM86〜89からの18ビツトの出力データ(友 2
6ビツト全加算器90〜93の一方の入力のMSB側1
8ビットに入力され7に、26ビツト全加算器90〜9
3での加算結果ζよ それぞれ26ビツトのデータロー
ド機能付き右方シフター94〜97でLSB側に(右方
に)1ビツトシフトされ 次のクロック期間で、前記R
OM86〜89の出力と加算されも 但し この動作で
、i−Oの時にζ上26ビツトのデータロード機能付き
シフター94〜97から26ビツト全加算器90〜93
に入力されるデータは0”に初期化されもこの操作によ
り、8回のクロック期間で、式(1−14)、(1−1
5)のそれぞれ4つの項が算出されモ33ビット全加算
器98〜99で(上26ビツトシフター94〜97の出
力を加算すも ここで、26ビツトシフター94と96
の出力は加算時に27で桁補正が行なわれ式(1−14
)、(1−15)のν(2に’ )、(2に’ +1)
の値を算出すa そして、33ビットレジスター100
.l0IE、  その演算結果をセットすモ33ビット
レジスター100.101は次の8クロツクの朝駆 新
しいサブセットに対してν(2に’ )、(2に’+1
)の値が算出されるま℃ 現在の値を保持すん ここで
第1図に戻って、説明を続けも 第3図における前記3
3ビットレジスター100,101からのデータ102
.103iよ 第1図の47〜54に対応し 他の3つ
のブロックの信号の出力信号と合わせて、DCT処理さ
れた信号列(ν(k)、0≦に≦7)となん この33
ビット出力信号列(ν(k)。
In other words, every 8 data samplings, a new subset data count <, u(
7),..., even if set as u(0), then
This data is supplied to the bit serial calculation units 19 to 22 via the upper 14 bit signal lines 11 to 18, respectively.The processing in the bit serial calculation units 19 to 22 will be explained with reference to FIG. Bit image input 65~
661 Upper Data entry from any of the 14-bit registers 3 to 10 in Figure 1 is expressed using two's complement representation (a
+*(7-n)ε[0,-1, at(7-n)E[0
, 1], 0≦i≦ 12. O≦n≦3) These data lengths: Right shifter 67 with a 14-bit data load function where the upper 7 bits and lower 7 bits are independent;
68, each seven bits are processed separately and right-shifted to the LSB side once every clock period. Right shifter 6 with data load function
7. Signals CL u(n) and u output from 68
2L for the upper 7 bits and lower 7 bits of (7-n)
The value of each 1 bit of the digit is al(n) and at・〒(n)
and at(7-n) and a+*y(7-1) With these signals, in the 1-bit full adder 69.70 and the 1-bit full subtracter 71.72, the formula (1-14) The carries and borrows generated by these operations are held in 1-bit latches 73 to 76, and are used for the operation one clock later, so that the original 1
Bit full adder 69. To and 1-bit full subtractor 71.
1-bit full adder 69.7
The operation result of 0 (outputted to the 1-bit data lines 77 and 78, respectively, and the operation result of the 1-bit full subtracter 71, 72 outputted to the 1-bit data line 79, 80, respectively) is the same as explained in FIG. Similarly, bit serial operation section 19.2
2, (y) (a+◆ma(n)+a+-7(7-n>), (at (n)+a+) on the right side of equation (1-4L(1-5))
(7-n)), ((aly(n)-a-7(7-n)
), (at (n)-at (7-n)) are executed, and the bit serial calculation unit 19 calculates u(0) and u(7
), the bit serial calculation unit 20 calculates u(1) and u(6), and the bit serial calculation unit 21 calculates u(
2) and u(5), the bit serial calculation unit 22 executes this calculation for u(3) and u(4).
4-bit data lines 39 to 424 output from each bit serial calculation unit 19 to 22; L4 bit data line 39 is ((a+*〒(n)+a+◆v(7-n))
, rro, 1.2.3) L4 bit data line 40
is ((at (n)+a+ (7-n)), n-0,1
, 2, 3).The LA 4-bit data line 41 indicates ((at
-v(n)-a+◆y(7-n)), n-0,1,2°3), and the 4-bit data line 42 shows ((at (n)
-at (7-n)), n-0, 1, 2, 3) respectively. 1
Returning to 5), equation (1-14) and equation (1-
Expanding the sum part with respect to n in 15), it can be expressed as follows: -2', O≦°≦3
When k-2k''+1, when 0≦′≦3, 0≦k”≦3 (1-17) δ, 0≦′≦3 (1-16) Thus, the above equation (1-16 ) for each 2L digit, fix K' and write gi ((at-v(n)
4-bit data of +a+-y(7-n)), n-0, 1, 2, 3) and ((at (n)+a+(7-n)),
It can be uniquely determined by the 4-bit data of n-0, 1, 2, 3), and the same holds true for equation (1-17).Therefore, these 4-bit signals can be used as address information. It is not easy to determine the address information.
In this way, the 4-bit data on the 4-bit data line 39 (
From the 2197th digit in formula (1-14) h ROM
Similarly, 2''' 7 digits (Σ(a+*〒(n)-a+-y (7
Similarly, the 4-bit data on the 4-bit data line 42 is input to the coefficient multipliers 43 to 46 using the h ROM and the adder. Coefficient multiplier 4 by
Next, the processing in the coefficient multipliers 43 to 46 by the ROM and adder will be explained using FIG. 3. In FIG. -14) 21+? digit, (,4(a
+Used as the desired address information t''t Also input to the coefficient multipliers 43 to 46 by the ROM and adder.Similarly, the pit data line 41-4 is the address information sought by the formula, and is input via the 4-bit data line 39. Similarly, the 4-bit signal line 83C type (1-
(Σ(a+(n)+a+(7-n))α16 in 2+ digits in 14)
Similarly, if a ROM 87 with a word x 18-bit capacity is input manually via a 4-bit data line 40 using i3 4 bits, the 4-bit signal 84
0yr (2n+1) (2 to ' +1) []) Even if input via the 4-bit data line 41, the 4-bit signal 85 (the 2-digit value in the above equation (1-15)) is inputted via the 4-bit data line 41. Similarly, a ROM88 with a capacity of 16 words x 18 bits outputs a 4-bit signal 84 all at once.Similarly, a ROM89 with a capacity of 18 words x 18 bits sends a 4-bit signal 85 to an address π(
2n+1) (2 to '+1) []) Even if it is input via the 4-bit data line 42, the ROM 86, which has a capacity of 167-bits and 18-bits, receives the 4-bit signal 82 as the address information ( Σ(a+◆ma(n)+a+◆te value is output as 18-bit data. Next, 26-bit full adders 90 to 93 and 26-bit full adders 90 to 93,
BIT's right shifter with data load function 94-97
(Table 4 functions as a 26-bit cumulative adder, and the R
18-bit output data from OM86 to 89 (friend 2
MSB side 1 of one input of 6-bit full adders 90 to 93
8 bits input to 7, 26 bit full adder 90-9
The addition result ζ in step 3 is shifted by 1 bit to the LSB side (to the right) by right shifters 94 to 97, each with a 26-bit data loading function.
However, in this operation, when I-O, 26-bit data load function shifters 94-97 on ζ are added to 26-bit full adders 90-93.
Although the data input to the input terminal is initialized to 0'', this operation allows the expressions (1-14) and (1-1
5) are calculated by the 33-bit full adders 98 to 99 (the outputs of the upper 26-bit shifters 94 to 97 are added together).
The output of is corrected by 27 at the time of addition and becomes the formula (1-14
), (1-15) ν(2' ), (2' +1)
Calculate the value of a and the 33-bit register 100
.. l0IE, the result of the operation is set in the 33-bit register 100.101 for the next 8 clocks.
) is calculated, hold the current value. Now return to Figure 1 and continue the explanation.
Data 102 from 3-bit registers 100, 101
.. 103i, which corresponds to 47 to 54 in Fig. 1, and together with the output signals of the other three blocks, the DCT processed signal sequence (ν(k), 0≦to≦7) and this 33
Bit output signal sequence (ν(k).

0≦に≦7)がそれぞれトライステートドライバー55
〜62により、時系列化されて出力端子63より出力さ
れも 第4図は本発明の一実施例によるアダプティブD
CT処理装置の概略構成を示すものであa104は制御
信号入力端子、105はデータストローブ信号入力端子
、106は14ビツトの画像信号入力端子、107は1
4ビツトの参照画像信号入力端子、108は差分器10
9はクリッピング回[110は8×1の一次元のDCT
処理回路111に対するタイミング信号生成同区112
はクリッピング・丸め込み処理同区113は128ワー
ド×16ビツトのデュアルポートメモリ114への書き
込み制御同区115はデュアルポートメモリ114から
の読み出し制御同区 116は8×1の一次元のDCT
処理回路117に対するタイミング信号生成回j!1 
118はクリッピング・丸め込み処理同区119は14
ビツトの画像出力端子であも 第4図は第1図の8×1
のDCT処理回路ブロックを利用した8×8のアダプテ
ィブDCT処理装置の一例であん 制御信号104によ
りアダプティブ処理を行なう場合6上 差分器108に
おいて、14ビツト画像信号人力106と、14ビツト
参照画像信号人力107の差分をとも その結果の信号
が前提とされている最大・最小のしきい値を越える場合
はクリッピング回路109でクリップさtN、 8X1
の一次元のDCT処理回路111に入力されも クリッ
プを行なわない場合Cヨ  差分器108からの信号が
スルーされ 8×1の一次元のDCT処理回路111に
人力され 8×1のDCT処理が施され、18xlの一
次元のDCT処理回路111における処理タイミング(
よ データストローブ信号入力端子105より入力され
る14ビツト画像信号人力106から入力される一組6
4個のデジタル画像信号の先頭の信号を示すストローブ
信号をトリガーとして、タイミング信号生成回路110
により制御されも 次に クリッピング・丸め込み処理
回路112でば 8×1の一次元のDCT処理回路11
1からの処理出力に対しクリッピング・丸め込み処理を
行なL\ その結果を128ワード×16ビツトのデュ
アルポートメモリ114に入力すモ128ワード×16
ビツトのデュアルポートメモリ114の書き込ム 読み
だしく表 書き込み制御回路11a、読みだし制御回路
115により制御されも 次に 8X1の一次元のDC
T処理回路117で(友 128ワード×16ビツトの
デュアルポートメモリ114からの入力信号をDCT処
理し ここでの処理タイミングはタイミング信号生成回
路116により制御されも 8×1の一次元のDCT処
理回路117からの出力データ床 クリッピング・丸め
込み処理回路118を通じて、14ビツトの画像出力端
子119に出力され 二次元の8×8のDCT処理が完
結すもなお本実施例では1画素データが14ビツト長の
啄7ビツト長の信号に2分割した力<、M>Nを満たす
Mビット長をLビット長の信号に分割しても(ただしL
1ビット長の信号に分割する場合を除く)同様の効果を
有すん 発明の効果 以上 説明したごとく本発明によれζCMビット長をL
>Nを満足するLビット長に分割LLビット長で部分積
の演算を並列的に実行し 最後にそれらの中間結果の加
算を実行する方式により、N=8.J=2の時に 8つ
のサンプリングクロックの期間で8×1の一次元のDC
T処理を実現することがでよ かつ内部演算精度をM=
14ビットの精度まで乗算器を用いずに確保することが
でき、その実用的効果は大きし1
0≦ and ≦7) are each tri-state driver 55
FIG. 4 shows the adaptive D according to an embodiment of the present invention.
This figure shows the general configuration of the CT processing device, in which a104 is a control signal input terminal, 105 is a data strobe signal input terminal, 106 is a 14-bit image signal input terminal, and 107 is a 1-bit image signal input terminal.
4-bit reference image signal input terminal, 108 is a subtractor 10
9 is the clipping time [110 is 8×1 one-dimensional DCT
Timing signal generation section 112 for processing circuit 111
The same area 113 controls the writing to the 128 word x 16 bit dual port memory 114. The area 115 controls the reading from the dual port memory 114. The area 116 shows the 8x1 one-dimensional DCT.
Timing signal generation time j for the processing circuit 117! 1
118 is clipping/rounding processing; 119 is 14
Even if it is a bit image output terminal, Figure 4 shows the 8x1 of Figure 1.
This is an example of an 8x8 adaptive DCT processing device using the DCT processing circuit block of 6. In the case where adaptive processing is performed using the control signal 104, the subtractor 108 inputs the 14-bit image signal 106 and the 14-bit reference image signal. If the resulting signal exceeds the assumed maximum and minimum thresholds, it is clipped by the clipping circuit 109, tN, 8X1.
If the signal is not clipped even if it is input to the one-dimensional DCT processing circuit 111, the signal from the subtractor 108 is passed through, and is manually input to the 8×1 one-dimensional DCT processing circuit 111, where it is subjected to 8×1 DCT processing. and the processing timing in the 18xl one-dimensional DCT processing circuit 111 (
A set of 14-bit image signals input from the data strobe signal input terminal 105 and a set 6 input from the input terminal 106
The timing signal generation circuit 110 is triggered by a strobe signal indicating the first signal of the four digital image signals.
Next, the clipping/rounding processing circuit 112 is controlled by the 8×1 one-dimensional DCT processing circuit 11.
Clipping and rounding processing is performed on the processing output from 1, and the result is input to the 128 word x 16 bit dual port memory 114.
When writing and reading the bit dual port memory 114, it is controlled by the write control circuit 11a and the read control circuit 115.Next, the 8X1 one-dimensional DC
The T processing circuit 117 performs DCT processing on the input signal from the 128 word x 16 bit dual port memory 114, and the processing timing here is controlled by the timing signal generation circuit 116. The output data floor from 117 is output to a 14-bit image output terminal 119 through a clipping/rounding processing circuit 118, and two-dimensional 8×8 DCT processing is completed, but in this embodiment, one pixel data has a length of 14 bits. Even if you divide the M-bit length into a L-bit-long signal that satisfies the force <, M>N of dividing the signal into 2 into a 7-bit-long signal (however, L
As explained above, according to the present invention, the ζCM bit length can be reduced to L.
> N=8. By dividing the partial product into L bit lengths satisfying N, the partial product operation is executed in parallel with LL bit length, and finally the intermediate results are added. When J=2, 8×1 one-dimensional DC in 8 sampling clock periods
It is possible to realize T processing and the internal calculation accuracy is M =
Accuracy up to 14 bits can be secured without using a multiplier, and its practical effect is 1.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明の一実施例における8X1の一次元のD
CT処理回路のブロック& 第2図はビットシリアル演
算部の回路構成は 第3図はROMと加算器による係数
乗算部の回路構成飄 第4図は本発明の一実施例による
アダプティブDCT処理回路の概略構成図であも 2・・・・画像信号入九 3〜10・・・・データレシ
ス久 19〜22・・・・ビットシリアル演算臥43〜
46・・・・ROMと加算器による係数乗算@  11
1,117・・・・8Xlの一次元DCT処理回跋11
4・・・・デュアルポートメモリ。
FIG. 1 shows an 8×1 one-dimensional D
Blocks of the CT processing circuit & Figure 2 shows the circuit configuration of the bit serial operation section. Figure 3 shows the circuit configuration of the coefficient multiplication section using ROM and an adder. Figure 4 shows the circuit configuration of the adaptive DCT processing circuit according to an embodiment of the present invention. In the schematic configuration diagram, 2...Image signal input 9 3-10...Data reception 19-22...Bit serial operation 43-
46...Coefficient multiplication by ROM and adder @ 11
1,117...8Xl one-dimensional DCT processing speed 11
4...Dual port memory.

Claims (2)

【特許請求の範囲】[Claims] (1)画像信号の帯域圧縮で用いられるDCT処理にお
いて、Mビット長の信号をN×N画素の処理単位でDC
T処理を行なう場合に、M>Nの関係が成立する時、M
ビット長をL<Nを満足するLビット長の信号に分割し
、各Lビット長の部分積の演算をビットシリアルに加算
器とROMを用いて演算を実行し、最後にそれらの演算
結果を加算することにより、N回のサンプリングクロッ
ク期間で、Mビット長のN×1の一次元DCT処理を完
結することを特徴とするDCT処理装置。
(1) In DCT processing used for band compression of image signals, a signal of M bit length is converted to DC in a processing unit of N×N pixels.
When performing T processing, when the relationship M>N holds, M
Divide the bit length into L-bit length signals that satisfy L<N, perform the calculation of partial products of each L-bit length in a bit-serial manner using an adder and ROM, and finally calculate the results of these operations. A DCT processing device characterized in that by performing addition, N×1 one-dimensional DCT processing of M bit length is completed in N sampling clock periods.
(2)上記Mビット長のN×1の一次元DCT処理装置
2個とデータ列のスキャン方向を変換するデュアルポー
トメモリを用いることを特徴とするMビット長のN×N
の二次元DCT処理装置。
(2) N×N of M bit length characterized by using two N×1 one-dimensional DCT processing devices of M bit length and a dual port memory for converting the scanning direction of the data string.
Two-dimensional DCT processing device.
JP2034310A 1990-02-14 1990-02-14 DCT processing equipment Expired - Fee Related JP2910124B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2034310A JP2910124B2 (en) 1990-02-14 1990-02-14 DCT processing equipment

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2034310A JP2910124B2 (en) 1990-02-14 1990-02-14 DCT processing equipment

Publications (2)

Publication Number Publication Date
JPH03237887A true JPH03237887A (en) 1991-10-23
JP2910124B2 JP2910124B2 (en) 1999-06-23

Family

ID=12410590

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2034310A Expired - Fee Related JP2910124B2 (en) 1990-02-14 1990-02-14 DCT processing equipment

Country Status (1)

Country Link
JP (1) JP2910124B2 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999044368A1 (en) * 1998-02-27 1999-09-02 Kanebo Limited Image data processing device and processing method
WO2007010694A1 (en) * 2005-07-15 2007-01-25 Matsushita Electric Industrial Co., Ltd. Image encoding device and image encoding method
WO2024241134A1 (en) * 2023-05-19 2024-11-28 株式会社半導体エネルギー研究所 Drive circuit, display device, and electronic apparatus

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999044368A1 (en) * 1998-02-27 1999-09-02 Kanebo Limited Image data processing device and processing method
US6961474B1 (en) 1998-02-27 2005-11-01 Shikino High-Tech Co., Ltd. Huffman encoder for encoding/decoding DCT coefficients
WO2007010694A1 (en) * 2005-07-15 2007-01-25 Matsushita Electric Industrial Co., Ltd. Image encoding device and image encoding method
WO2024241134A1 (en) * 2023-05-19 2024-11-28 株式会社半導体エネルギー研究所 Drive circuit, display device, and electronic apparatus

Also Published As

Publication number Publication date
JP2910124B2 (en) 1999-06-23

Similar Documents

Publication Publication Date Title
JPS6312070A (en) 1-d cosine conversion value calculator and image encoder anddecoder containing the same
TW200414023A (en) Method and system for performing a calculation operation and a device
JPH11505640A (en) Bit slice table lookup digital convolution
WO2019057093A1 (en) Multiplication circuit, system on chip, and electronic device
JPH03165192A (en) System for computing binary independent conversion and circuit
Senthilkumar et al. Design of recustomize finite impulse response filter using truncation based scalable rounding approximate multiplier and error reduced carry prediction approximate adder for image processing application
Cao et al. An efficient VLSI implementation of distributed architecture for DWT
Gardezi et al. Design and VLSI Implementation of CSD based DA Architecture for 5/3 DWT
JPH03237887A (en) Dct processor unit
JPH06149861A (en) Dct and inverse dct computing device and method
Mukherjee et al. Hardware efficient architecture for 2D DCT and IDCT using Taylor-series expansion of trigonometric functions
Wahid Low complexity implementation of daubechies wavelets for medical imaging applications
JPH03256455A (en) Idct processor
JPS6027024A (en) Arithmetic device
JPH03661B2 (en)
Savić et al. High-performance 1-D and 2-D inverse DWT 5/3 filter architectures for efficient hardware implementation
Shirakol et al. Architectural Design and Optimization of Distributed Arithmetic based 2-D Discrete Cosine Transform
Petrovsky et al. Pipelined block-lifting-based embedded processor for multiplying quaternions using distributed arithmetic
JPS5841532B2 (en) Sekiwa Keisan Cairo
JP2864597B2 (en) Digital arithmetic circuit
KR100575285B1 (en) High speed low power discrete cosine converter and method
JP3547567B2 (en) Discrete cosine transformer
Ismail et al. High speed on-chip multiple cosine transform generator
JP2790911B2 (en) Orthogonal transform operation unit
JPS5970308A (en) Digital filter

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080409

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090409

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees