JP7023149B2 - 半導体装置 - Google Patents
半導体装置 Download PDFInfo
- Publication number
- JP7023149B2 JP7023149B2 JP2018054284A JP2018054284A JP7023149B2 JP 7023149 B2 JP7023149 B2 JP 7023149B2 JP 2018054284 A JP2018054284 A JP 2018054284A JP 2018054284 A JP2018054284 A JP 2018054284A JP 7023149 B2 JP7023149 B2 JP 7023149B2
- Authority
- JP
- Japan
- Prior art keywords
- input
- product
- value
- data
- input terminal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F7/00—Methods or arrangements for processing data by operating upon the order or content of the data handled
- G06F7/38—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
- G06F7/48—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
- G06F7/544—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices for evaluating functions by calculation
- G06F7/5443—Sum of products
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computational Mathematics (AREA)
- Computing Systems (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Complex Calculations (AREA)
Description
1 半導体装置の構成
図1は、実施形態に係る半導体装置100を示す図である。
W={wm,t}0≦m≦M-1,0≦t≦T-1 ,
X={xt,r}0≦t≦T-1,0≦r≦R-1
とする。
2 積和演算回路1の構成及び半導体装置の動作
2-1 第1の例の積和演算回路(ビット限定なしの積和演算回路)
図2は、実施形態に係る半導体装置100の積和演算回路1の第1の例を示す図である。
ym、r、t = ym、r、t-1 + wm,t × xt,r
…(2)
ここで、ym、r、tは、時刻tに演算器um,rのレジスタ13に新たに格納された値である。この結果Tサイクルで、(1)式の演算が完了する。つまり、M×R個の演算器が、それぞれTサイクルかけてym,rを計算することで、行列式Y=M×Xを計算することができる。
2-2 第2の例の積和演算回路(乗算器11が1ビットの積和演算回路1)
図3は、実施形態に係る半導体装置100の積和演算回路1aの第2の例を示す図である。第2の例の積和演算回路1aは、乗算器11が1ビットである場合を示す。
2-3 第3の例の積和演算回路(多ビットの場合1:入力されるデータwm,t,xt,rが3ビットの場合の積和演算回路)
図4は、実施形態に係る半導体装置100の積和演算回路1bの第3の例を示す図である。第3の例の積和演算回路1bは、入力される各データw0,t,xt,0が3ビットの場合を示す。演算器ub0,0~u2,2の構成は、図3に示した演算器uaと同じである。
…(3)
xt=xt (2)×22+xt (1)×21+xt (0)×20
…(4)
このとき、(1)式は、次のようになる。
各演算器ub0,0~u2,2の出力は、後処理回路3に出力される。後処理回路3では、各シグマにそれぞれ対応する2のべき乗の係数を掛けて足し合わせることで、最終的な多ビットの積和演算の結果が得られる。なお、後処理回路3における2のべき乗の係数を掛ける処理は、シフト演算で容易に実行することができる。
・負の数の取り扱いについて
データの値を2の補数表現で扱う場合、(3)、(4)式は次のようになる。
wt=-wt (2)×22+wt (1)×21+wt (0)×20
…(3’)
xt=-xt (2)×22+xt (1)×21+xt (0)×20
…(4’)
この時、(5)式は次のようになる。
2-4 第4の例の積和演算回路(多ビットの場合2:入力されるデータwm,t,が異なるビット、xt,rが4ビットの場合の積和演算回路)
次に、第4の例の積和演算回路1について説明する。
同様に、32サイクル後には、y1,0に含まれるy(u1,0)からy(u2,3)は、(7)式に示す値となる。
y1,0=24×y(u1,0)+23×y(u1,1)+22×y(u1,2)+21×y(u1,3)
+23×y(u2,0)+22×y(u2,1)+21×y(u2,2)+20×y(u2,3)
…(8)
このように、各演算器um,rの結果それぞれに対する、係数(2のべき乗)の値及び出力のどの要素に対応するか(インデックス)は、互いに異なる。例えば、係数の値と、出力インデックスを以下のように設定する。
y(u0,1):係数=22、出力インデックス=(0,0)
y(u0,2):係数=21、出力インデックス=(0,0)
y(u0,3):係数=20、出力インデックス=(0,0)
y(u1,0):係数=24、出力インデックス=(1,0)
y(u1,1):係数=23、出力インデックス=(1,0)
y(u1,2):係数=22、出力インデックス=(1,0)
y(u1,3):係数=21、出力インデックス=(1,0)
y(u1,0):係数=23、出力インデックス=(1,0)
y(u1,1):係数=22、出力インデックス=(1,0)
y(u1,2):係数=21、出力インデックス=(1,0)
y(u1,3):係数=20、出力インデックス=(1,0)
…(9)
つまり、実施形態では、(m,r)をアドレスとする係数と出力インデックスを格納したLUT4を用意する。図6は、LUT4を示す図である。
y(u14,1): 係数=24、 出力インデックス=(7,0)
y(u14,2): 係数=23、 出力インデックス=(7,0)
y(u14,3): 係数=22、 出力インデックス=(7,0)
y(u15,0): 係数=24、 出力インデックス=(7,0)
y(u15,1): 係数=23、 出力インデックス=(7,0)
y(u15,2): 係数=22、 出力インデックス=(7,0)
y(u15,3): 係数=21、 出力インデックス=(7,0)
…(10)
従って、y7,0は以下の値となる。
…(11)
残りの1ビットは、図5Aに示した演算が完了した後に、今度は、図5Bに示すwを演算器u0,0~u15,15に入力する。この例では、xは図5Aと同じである。y7,0の残りの下位1ビットに該当するy(u0,0)からy(u0,3)に対応する係数と出力インデックスは以下の通りである。
y(u0,1):係数=22,出力インデックス=(7,0)
y(u0,2):係数=21,出力インデックス=(7,0)
y(u0,3):係数=20,出力インデックス=(7,0)
これらの値を使って、係数と出力インデックスに基づくアルゴリズムに従って後処理を行なうと、(11)式の結果と合わせて、(12)式となる。
…(12)
これにより、図5Aに示した処理において途中であったy7,0の計算が完了する。
3 半動作体装置の効果
実施形態の半導体装置100の積和演算回路1の構成によれば、SRAM等のメモリから積和演算回路1の演算器アレイへのデータ移動を少なくできる。その結果、半導体装置100のデータ処理の効率化を図ることができる。
Claims (9)
- 第1の入力端子と、
第2の入力端子と、
前記第1の入力端子から入力された値と、前記第2の入力端子から入力された値との積を計算する乗算器と、
前記乗算器の出力を積算して出力するアキュームレータと、
を備える演算回路を複数具備し、
前記複数の演算回路は、複数行と複数列による二次元配列状に配置され、
前記複数行の各行における第1数の演算回路のそれぞれの前記第1の入力端子には、第1入力データの行方向のビット数のうち前記第1数のビット数の第1ビットデータが共通に入力され、
前記複数列の各列における第2数の演算回路のそれぞれの前記第2の入力端子には、第2入力データの列方向のビット数のうち前記第2数のビット数の第2ビットデータが共通に入力され、
前記複数の演算回路の前記アキュームレータの出力にそれぞれ係数をかけた結果を足し合わせて積和演算結果を求める処理回路と、
をさらに具備する半導体装置。 - 前記第1の入力端子のそれぞれに入力される第1の値及び前記第2の入力端子のそれぞれに入力される第2の値はそれぞれ1ビットであり、
前記乗算器は、AND論理ゲートである、
請求項1記載の半導体装置。 - 前記アキュームレータは、非同期カウンタである、請求項1記載の半導体装置。
- 前記第1の入力端子のそれぞれに入力される第1の値及び前記第2の入力端子のそれぞれに入力される第2の値はそれぞれ1ビットであり、
前記乗算器は、XNOR論理ゲートである、
請求項1記載の半導体装置。 - 前記第1の入力端子のそれぞれに入力される第1の値及び前記第2の入力端子のそれぞれに入力される第2の値はそれぞれ1ビットであり、
前記乗算器は、AND論理ゲートと、XNOR論理ゲートと、前記AND論理ゲート及び前記XNOR論理ゲートのいずれかを選択する選択回路と、をさらに具備する、
請求項1記載の半導体装置。 - 前記複数の演算回路毎に、前記演算回路の出力に対する係数及びインデックス値を記憶する記憶回路をさらに具備し、
前記処理回路は、前記記憶回路を参照して、求められた積和演算結果に、前記演算回路に対応するインデックス値を付加する、
請求項1記載の半導体装置。 - 第1の入力端子と、
第2の入力端子と、
前記第1の入力端子から入力された値と、前記第2の入力端子から入力された値との積を計算する乗算器と、
前記乗算器の出力を積算して出力するアキュームレータと、
を備える演算回路を複数具備し、
前記複数の演算回路は、
それぞれの前記第1の入力端子に共通の第1の値が入力される第1のグループと、
それぞれの前記第2の入力端子に共通の第2の値が入力される第2のグループと、
を有し、
前記第1の値及び前記第2の値はそれぞれ1ビットであり、
前記乗算器は、
AND論理ゲートと、XNOR論理ゲートと、前記AND論理ゲート及び前記XNOR論理ゲートのいずれかを選択する選択回路と、
を有する
半導体装置。 - メモリと、
前記メモリから読み出された行列形式で表現される第1データと、第2データとの積和演算を行う積和演算回路と、
前記積和演算回路による前記積和演算の結果を受信するプロセッサと、
を具備し、
前記積和演算回路は、
第1の入力端子と、
第2の入力端子と、
前記第1の入力端子から入力された値と、前記第2の入力端子から入力された値との積を計算する乗算器と、
前記乗算器の出力を積算して出力するアキュームレータと、
を備える演算回路を複数具備し、
前記複数の演算回路は、複数行と複数列による二次元配列状に配置され、
前記複数行の各行における第1数の演算回路のそれぞれの前記第1の入力端子には、第1入力データの行方向のビット数のうち前記第1数のビット数の第1ビットデータが共通に入力され、
前記複数列の各列における第2数の演算回路のそれぞれの前記第2の入力端子には、第2入力データの列方向のビット数のうち前記第2数のビット数の第2ビットデータが共通に入力され、
前記複数の演算回路の前記アキュームレータの出力にそれぞれ係数をかけた結果を足し合わせて積和演算結果を求める処理回路と、
をさらに具備するメモリシステム。 - メモリと、
前記メモリから読み出された行列形式で表現される第1データと、第2データとの積和演算を行う積和演算回路と、
前記積和演算回路による前記積和演算の結果を受信するプロセッサと、
を具備し、
前記積和演算回路は、
第1の入力端子と、
第2の入力端子と、
前記第1の入力端子から入力された値と、前記第2の入力端子から入力された値との積を計算する乗算器と、
前記乗算器の出力を積算して出力するアキュームレータと、
を備える演算回路を複数具備し、
前記複数の演算回路は、
それぞれの前記第1の入力端子に前記第1データの一部であって、且つ共通の第1の値が入力される第1のグループと、
それぞれの前記第2の入力端子に前記第2データの一部であって、且つ共通の第2の値が入力される第2のグループと、
を有し、
前記第1の値及び前記第2の値はそれぞれ1ビットであり、
前記乗算器は、
AND論理ゲートと、XNOR論理ゲートと、前記AND論理ゲート及び前記XNOR論理ゲートのいずれかを選択する選択回路と、
を有する、
メモリシステム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018054284A JP7023149B2 (ja) | 2018-03-22 | 2018-03-22 | 半導体装置 |
US16/124,903 US10802799B2 (en) | 2018-03-22 | 2018-09-07 | Semiconductor device having plural operation circuits including multiplier and accumulator |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018054284A JP7023149B2 (ja) | 2018-03-22 | 2018-03-22 | 半導体装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019168783A JP2019168783A (ja) | 2019-10-03 |
JP7023149B2 true JP7023149B2 (ja) | 2022-02-21 |
Family
ID=67985119
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018054284A Active JP7023149B2 (ja) | 2018-03-22 | 2018-03-22 | 半導体装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US10802799B2 (ja) |
JP (1) | JP7023149B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102447445B1 (ko) * | 2021-03-08 | 2022-09-26 | 공재섭 | 행렬 연산의 효율적 병렬처리를 위한 연산 장치 및 이를 포함하는 메모리 장치 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002511988A (ja) | 1997-06-02 | 2002-04-16 | ホビン・マッツ・アーリング | 周波数変調入力または中間値を用いたアナログ−デジタル変換 |
US20180060726A1 (en) | 2016-08-30 | 2018-03-01 | International Business Machines Corporation | Voltage control of learning rate for rpu devices for deep neural network training |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5014235A (en) | 1987-12-15 | 1991-05-07 | Steven G. Morton | Convolution memory |
US5121352A (en) * | 1990-02-06 | 1992-06-09 | Micron Technology, Inc. | Multiplier-accumulator circuit array operable in multiple modes |
TW318933B (en) | 1996-03-08 | 1997-11-01 | Hitachi Ltd | Semiconductor IC device having a memory and a logic circuit implemented with a single chip |
JP4474424B2 (ja) | 1996-06-10 | 2010-06-02 | 株式会社日立製作所 | 半導体集積回路装置 |
US6029187A (en) * | 1997-10-28 | 2000-02-22 | Atmel Corporation | Fast regular multiplier architecture |
US7849119B2 (en) * | 2003-12-29 | 2010-12-07 | Xilinx, Inc. | Digital signal processing circuit having a pattern detector circuit |
US7840630B2 (en) * | 2003-12-29 | 2010-11-23 | Xilinx, Inc. | Arithmetic logic unit circuit |
JP4713873B2 (ja) | 2004-11-12 | 2011-06-29 | 株式会社東芝 | 半導体記憶装置 |
US7746109B1 (en) * | 2009-04-02 | 2010-06-29 | Xilinx, Inc. | Circuits for sharing self-timed logic |
JP5951570B2 (ja) * | 2013-09-13 | 2016-07-13 | 株式会社東芝 | 行列演算装置 |
-
2018
- 2018-03-22 JP JP2018054284A patent/JP7023149B2/ja active Active
- 2018-09-07 US US16/124,903 patent/US10802799B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002511988A (ja) | 1997-06-02 | 2002-04-16 | ホビン・マッツ・アーリング | 周波数変調入力または中間値を用いたアナログ−デジタル変換 |
US20180060726A1 (en) | 2016-08-30 | 2018-03-01 | International Business Machines Corporation | Voltage control of learning rate for rpu devices for deep neural network training |
Non-Patent Citations (1)
Title |
---|
下田将之ほか,完全2値化畳み込みニューラルネットワークについて,FIT2017 第16回情報科学技術フォーラム 講演論文集 第1分冊 選奨論文・一般論文 モデル・アルゴリズム・プログラミング ソフトウェア ハードウェア・アーキテクチャ,日本,一般社団法人 情報処理学会,2017年09月05日,51~57ページ |
Also Published As
Publication number | Publication date |
---|---|
JP2019168783A (ja) | 2019-10-03 |
US10802799B2 (en) | 2020-10-13 |
US20190294414A1 (en) | 2019-09-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US12205018B2 (en) | Transposing neural network matrices in hardware | |
KR102512936B1 (ko) | 하드웨어에서의 커널 스트라이딩 수행 | |
US6539368B1 (en) | Neural processor, saturation unit, calculation unit and adder circuit | |
JP7325158B2 (ja) | ニューラル・ネットワーク・コアにおける動的精度のためのデータ表現 | |
US11341400B1 (en) | Systems and methods for high-throughput computations in a deep neural network | |
US10635397B2 (en) | System and method for long addition and long multiplication in associative memory | |
US20250094126A1 (en) | In-memory computation circuit and method | |
CN113168310B (zh) | 用于转换数字的硬件模块 | |
CN1253340A (zh) | 分布式运算体系结构的信号处理 | |
JP2020013455A (ja) | 畳み込みニューラルネットワークの層において畳み込み演算処理を行なう情報処理装置 | |
JP7023149B2 (ja) | 半導体装置 | |
CN115730653A (zh) | 量化神经网络训练与推理 | |
JP7251354B2 (ja) | 情報処理装置、情報処理プログラム、及び情報処理方法 | |
JP2020042399A (ja) | 積和演算装置、積和演算方法、及びシステム | |
JP7598714B2 (ja) | 半導体装置およびそれに用いるデータ生成方法 | |
JP2022074442A (ja) | 演算装置および演算方法 | |
CN111126580A (zh) | 采用Booth编码的多精度权重系数神经网络加速芯片运算装置 | |
TWI814618B (zh) | 矩陣運算裝置及其操作方法 | |
US11610095B2 (en) | Systems and methods for energy-efficient data processing | |
JP4405452B2 (ja) | 逆変換回路 | |
CN114127717A (zh) | 硬件中的使用模数学的矩阵相乘 | |
CN117252245A (zh) | 执行卷积运算的计算设备、方法和存储介质 | |
CN118133910A (zh) | 一种基于深度神经网络处理器的计算处理方法及装置 | |
KR20240135773A (ko) | 반복 혼성 행렬 곱셈기 | |
CN116955906A (zh) | 一种哈密顿矩阵正交归一化方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20180831 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200915 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210831 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210907 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211108 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220111 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220208 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7023149 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |