KR102692017B1 - 전자 장치 및 전자 장치의 동작 방법 - Google Patents
전자 장치 및 전자 장치의 동작 방법 Download PDFInfo
- Publication number
- KR102692017B1 KR102692017B1 KR1020180102183A KR20180102183A KR102692017B1 KR 102692017 B1 KR102692017 B1 KR 102692017B1 KR 1020180102183 A KR1020180102183 A KR 1020180102183A KR 20180102183 A KR20180102183 A KR 20180102183A KR 102692017 B1 KR102692017 B1 KR 102692017B1
- Authority
- KR
- South Korea
- Prior art keywords
- object recognition
- feature vector
- sub
- weights
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 15
- 239000013598 vector Substances 0.000 claims abstract description 171
- 238000013528 artificial neural network Methods 0.000 claims abstract description 37
- 239000000872 buffer Substances 0.000 claims description 51
- 238000012545 processing Methods 0.000 claims description 27
- 238000009825 accumulation Methods 0.000 claims description 24
- 238000004364 calculation method Methods 0.000 claims description 11
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 claims description 6
- 229910052710 silicon Inorganic materials 0.000 claims description 6
- 239000010703 silicon Substances 0.000 claims description 6
- 238000012549 training Methods 0.000 claims description 6
- 238000013136 deep learning model Methods 0.000 claims description 4
- 238000003062 neural network model Methods 0.000 claims description 4
- 230000000149 penetrating effect Effects 0.000 claims description 2
- 238000013473 artificial intelligence Methods 0.000 description 29
- 238000010586 diagram Methods 0.000 description 24
- 210000004027 cell Anatomy 0.000 description 18
- 238000003491 array Methods 0.000 description 11
- 238000005516 engineering process Methods 0.000 description 7
- 241000724291 Tobacco streak virus Species 0.000 description 6
- 238000010801 machine learning Methods 0.000 description 6
- 239000011159 matrix material Substances 0.000 description 6
- 230000004044 response Effects 0.000 description 6
- 238000012360 testing method Methods 0.000 description 6
- 238000013135 deep learning Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000004913 activation Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 4
- 239000004065 semiconductor Substances 0.000 description 3
- 210000004556 brain Anatomy 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 239000003990 capacitor Substances 0.000 description 1
- 230000019771 cognition Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010304 firing Methods 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 229910000679 solder Inorganic materials 0.000 description 1
- 210000000225 synapse Anatomy 0.000 description 1
- 230000000946 synaptic effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/063—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/20—Processor architectures; Processor configuration, e.g. pipelining
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/76—Architectures of general purpose stored program computers
- G06F15/78—Architectures of general purpose stored program computers comprising a single central processing unit
- G06F15/7807—System on chip, i.e. computer system on a single chip; System in package, i.e. computer system on one or more chips in a single package
- G06F15/7821—Tightly coupled to memory, e.g. computational memory, smart memory, processor in memory
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/2163—Partitioning the feature space
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/60—Memory management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/94—Hardware or software architectures specially adapted for image or video understanding
- G06V10/95—Hardware or software architectures specially adapted for image or video understanding structured as a network, e.g. client-server architectures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/94—Hardware or software architectures specially adapted for image or video understanding
- G06V10/955—Hardware or software architectures specially adapted for image or video understanding using specific electronic processors
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11C—STATIC STORES
- G11C5/00—Details of stores covered by group G11C11/00
- G11C5/02—Disposition of storage elements, e.g. in the form of a matrix array
- G11C5/04—Supports for storage elements, e.g. memory modules; Mounting or fixing of storage elements on such supports
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11C—STATIC STORES
- G11C5/00—Details of stores covered by group G11C11/00
- G11C5/06—Arrangements for interconnecting storage elements electrically, e.g. by wiring
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72403—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
-
- H—ELECTRICITY
- H10—SEMICONDUCTOR DEVICES; ELECTRIC SOLID-STATE DEVICES NOT OTHERWISE PROVIDED FOR
- H10B—ELECTRONIC MEMORY DEVICES
- H10B80/00—Assemblies of multiple devices comprising at least one memory device covered by this subclass
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Multimedia (AREA)
- Neurology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computer Hardware Design (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Microelectronics & Electronic Packaging (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Image Analysis (AREA)
- Human Computer Interaction (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
Abstract
Description
도 2는 본 발명의 실시예들에 따른 도 1의 객체 인식 모델을 나타낸다.
도 3은 본 발명의 실시예들에 따른 도 1의 인공 신경망 엔진을 나타내는 블록도이다.
도 4는 본 발명의 실시예들에 따른 도 3의 학습 모듈을 나타내는 블록도이다.
도 5는 본 발명의 실시예들에 따른 도 3의 인식 모듈을 나타내는 블록도이다.
도 6은 본 발명의 실시예들에 따른 도 1의 전자 장치에서 적층형 메모리 장치를 나타내는 블록도이다.
도 7은 본 발명의 실시예들에 따른 도 6의 적층형 메모리 장치를 나타내는 블록도이다.
도 8은 도 7의 적층형 메모리 장치에서 인공 지능 연산의 분배가 수행되는 것을 나타낸다.
도 9는 본 발명의 실시예들에 따른 도 1의 프로세서-인-메모리 회로를 나타내는 블록도이다.
도 10은 본 발명의 실시예들에 따른 도 9의 곱셈 및 누적 회로를 나타내는 블록도이다.
도 11은 본 발명의 실시예들에 따른 도 6의 적층형 메모리 장치에 포함되는 메모리 다이들 중 하나를 나타내는 블록도이다.
도 12는 본 발명의 실시예들에 따른 도 11의 메모리 다이에서 제1 뱅크 어레이를 나타낸다.
도 13은 도 9의 프로세서-인-메모리 회로의 특징 벡터와 가중치와 관련된 커널을 나타낸다.
도 14는 도 1의 그래픽 프로세서에서의 제2 연산을 나타내고, 도 15는 프로세서-인-메모리 회로에서의 제1 연산을 나타내고, 도 16은 도 9의 병합기의 동작을 나타낸다.
도 17 및 도 18은 도 9의 데이터 분배기가 입력 데이터 또는 특징 벡터를 제1 서브 특징 벡터 및 제2 서브 특징 벡터로 분할하는 것을 나타낸다.
도 19는 본 발명의 실시예들에 따른 적층형 메모리 장치에서 데이터카피 동작이 수행되는 예를 나타내는 블록도이다.
도 20은 본 발명의 실시예들에 따른 전자 장치의 동작 방법을 나타내는 흐름도이다.
도 21은 본 발명의 실시예들에 따른 객체 인식 장치를 포함하는 인공 지능 가속기를 나타내는 블록도이다.
도 22는 본 발명의 실시예들에 따른 적층형 메모리 장치를 포함하는 반도체 패키지의 예를 나타내는 구조도이다.
Claims (10)
- 학습 데이터와 가중치들을 이용하여 객체 인식 모델을 학습시켜 학습된 객체 인식 모델을 제공하는 인공 신경망 엔진을 구비하는 그래픽 프로세서; 및
상기 학습 데이터와 상기 가중치들을 저장하고, 상기 학습 데이터와 상기 가중치들을 상기 그래픽 프로세서에 제공하고, 입력 데이터로부터 추출된 특징 벡터를 제1 서브 특징 벡터와 제2 서브 특징 벡터로 분할하고, 상기 제1 서브 특징 벡터를 상기 그래픽 프로세서에 제공하고, 상기 학습된 객체 인식 모델을 상기 그래픽 프로세서로부터 수신하고, 상기 제2 서브 특징 벡터와 상기 가중치들을 상기 학습된 객체 인식 모델에 적용하여 제2 객체 인식 결과를 제공하는 제1 연산을 수행하는 적층형 메모리 장치를 포함하고,
상기 인공 신경망 엔진은 상기 제1 연산과 병렬적으로 상기 제1 서브 특징 벡터와 상기 가중치들을 상기 학습된 객체 인식 모델에 적용하여 제1 객체 인식 결과를 생성하는 제2 연산을 수행하고, 상기 제1 객체 인식 결과를 상기 적층형 메모리 장치에 제공하는 전자 장치. - 제1항에 있어서,
상기 적층형 메모리 장치는 상기 제1 객체 인식 결과를 저장하고, 상기 제1 객체 인식 결과와 상기 제2 객체 인식 결과를 병합하여 병합된 객체 인식 결과를 사용자에게 제공하고,
상기 적층형 메모리 장치는
상기 그래픽 프로세서 및 외부 장치와 통신하는 버퍼 다이;
상기 버퍼 다이 상에 적층되는 복수의 메모리 다이들; 및
상기 메모리 다이들을 관통하는 복수의 관통 실리콘 비아(through silicon via)들을 포함하고,
상기 메모리 다이들 각각은 복수의 워드라인들과 복수의 비트라인들에 연결되며, 상기 학습 데이터, 상기 가중치들 및 상기 특징 벡터를 저장하는 복수의 동적 메모리 셀들을 구비하는 메모리 셀 어레이를 포함하고,
상기 버퍼 다이는 상기 관통 실리콘 비아들을 통하여 상기 메모리 다이들과 연결되고 상기 특징 벡터를 상기 제1 서브 특징 벡터와 상기 제2 서브 특징 벡터로 분할하고, 상기 제1 연산을 수행하는 프로세서-인-메모리 (processor-in-memory) 회로를 포함하는 전자 장치. - 제2항에 있어서, 상기 프로세서-인-메모리 회로는
상기 메모리 다이들 중 적어도 일부로부터 상기 특징 벡터를 수신하고, 상기 특징 벡터를 상기 제1 서브 특징 벡터와 상기 제2 서브 특징 벡터로 분할하고, 상기 제1 서브 특징 벡터를 상기 그래픽 프로세서에 제공하는 데이터 분배기;
상기 데이터 분배기로부터 상기 제2 서브 특징 벡터를 수신하고, 상기 제2 서브 특징 벡터에 상기 가중치들을 적용하여 상기 제1 연산을 수행하여 상기 제2 객체 인식 결과를 출력하는 곱셈 및 누적 회로; 및
상기 곱셈 및 누적 회로를 제어하는 컨트롤러를 포함하고,
상기 곱셈 및 누적 회로는 상기 제2 서브 특징 벡터와 상기 가중치들에 대하여 행렬-벡터 곱셈 연산을 수행하는 전자 장치. - 제3항에 있어서,
버스를 통하여 상기 그래픽 프로세서 및 상기 적층형 메모리 장치와 통신하는 중앙 처리 장치를 포함하고,
상기 중앙 처리 장치는 상기 데이터 분배기와 상기 컨트롤러를 제어하는 시스템 소프트웨어를 포함하고,
상기 시스템 소트프웨어는 상기 제1 서브 특징 벡터와 상기 제2 서브 특징 벡터의 분할 비율을 결정하는 전자 장치. - 제2항에 있어서,
상기 버퍼 다이는 상기 제1 연산과 상기 제2 연산이 종료된 경우, 상기 제1 객체 인식 결과와 상기 제2 객체 인식 결과를 수신하고, 상기 제1 객체 인식 결과와 상기 제2 객체 인식 결과를 병합하여 병합된 객체 인식 결과를 출력하는 병합기; 및
상기 버퍼 다이 상에 형성되며, 상기 학습된 객체 인식 모델을 저장하는 비휘발성 메모리를 더 포함하는 전자 장치. - 제1항에 있어서,
상기 제1 서브 특징 벡터와 상기 제2 서브 특징 벡터는 적어도 일부의 중복 데이터를 포함하고,
상기 그래픽 프로세서는 상기 중복 데이터에 대한 중간 연산 결과를 상기 적층형 메모리 장치에 제공하고,
상기 적층형 메모리 장치는 상기 중복 데이터에 대한 상기 중간 연산 결과를 이용하여 상기 제1 연산을 수행하는 전자 장치. - 제1항에 있어서,
상기 인공 신경망 엔진은 상기 학습 데이터와 상기 가중치들을 상기 객체 인식 모델에 적용한 결과와 상기 학습 데이터에 대한 기대값의 유사도가 제1 기준값 이상인 경우에 상기 학습된 객체 인식 모델을 상기 적층형 메모리 장치에 제공하고,
상기 객체 인식 모델은 복수의 네트워크 노드들 간의 연결관계 및 상기 복수의 네트워크 노드들의 상기 가중치들에 기초하여 연산을 수행하는 신경망 모델 또는 딥러닝 모델인 전자 장치. - 제7항에 있어서, 상기 객체 인식 모델은
상기 학습 데이터 또는 상기 제1 서브 특징 벡터를 수신하며, 입력 노드들을 포함하는 입력 레이어;
상기 학습 데이터 또는 상기 제1 서브 특징 벡터에 대한 출력을 제공하며 출력 노드들을 포함하는 출력 레이어;
상기 입력 레이어를 상기 출력 레이어에 연결시키며, 히든 노드들을 포함하는 히든 레이어
상기 입력 노드들 각각과 상기 히든 노드들 각각을 제1 가중치들을 가지고 연결하는 제1 연결선들; 및
상기 히든 노드들 각각과 상기 출력 노드들 각각을 제2 가중치들을 가지고 연결하는 제2 연결선들을 포함하는 전자 장치. - 학습 데이터와 가중치들을 제공하고, 객체를 구성하는 객체 데이터로부터 추출된 특징 벡터를 제공하는 어플리케이션 프로세서;
상기 학습 데이터와 가중치들을 이용하여 객체 인식 모델을 학습시켜 학습된 객체 인식 모델을 제공하는 인공 신경망 엔진을 구비하는 그래픽 프로세서; 및
상기 어플리케이션 프로세서로부터 수신된 상기 학습 데이터, 상기 가중치들 및 상기 특징 벡터를 저장하고, 상기 학습 데이터와 상기 가중치들을 상기 그래픽 프로세서에 제공하고, 상기 특징 벡터를 제1 서브 특징 벡터와 제2 서브 특징 벡터로 분할하고, 상기 제1 서브 특징 벡터를 상기 그래픽 프로세서에 제공하고, 상기 그래픽 프로세서로부터 수신된 상기 학습된 객체 인식 모델을 저장하고, 상기 제2 서브 특징 벡터와 상기 가중치들을 상기 학습된 객체 인식 모델에 적용하여 제2 객체 인식 결과를 제공하는 제1 연산을 수행하는 적층형 메모리 장치를 포함하고,
상기 인공 신경망 엔진은 상기 제1 연산과 병렬적으로 상기 제1 서브 특징 벡터와 상기 가중치들을 상기 학습된 객체 인식 모델에 적용하여 제1 객체 인식 결과를 생성하는 제2 연산을 수행하고, 상기 제1 객체 인식 결과를 상기 적층형 메모리 장치에 제공하는 전자 장치. - 인공 신경망 엔진을 구비하는 그래픽 프로세서 및 상기 그래픽 프로세서와 통신하는 적층형 메모리 장치를 구비하는 전자 장치의 동작 방법으로서,
상기 인공 신경망 엔진에서 학습 데이터와 가중치들을 객체 인식 모델에 적용하여 상기 객체 인식 모델을 학습시키는 단계;
상기 적층형 메모리 장치의 데이터 분배기에서 입력 데이터와 관련된 특징 벡터를 제1 서브 특징 벡터와 제2 서브 특징 벡터로 분할하고, 상기 제2 서브 특징 벡터를 상기 그래픽 프로세서에 제공하는 단계;
상기 적층형 메모리 장치의 곱셈 및 누적 회로에서 상기 제2 서브 특징 벡터와 상기 가중치들을 상기 학습된 객체 인식 모델에 적용하여 제2 객체 인식 결과를 출력하는 제1 연산을 수행하는 단계;
상기 그래픽 프로세서의 상기 인공 신경망 엔진에서 상기 제1 서브 특징 벡터와 상기 가중치들을 상기 학습된 객체 인식 모델에 적용하여 제1 객체 인식 결과를 출력하는 제2 연산을 수행하는 단계; 및
상기 적층형 메모리 장치의 합성기에서 상기 제1 객체 인식 결과와 상기 제2 객체 인식 결과를 병합하여 병합된 객체 인식 결과를 사용자에게 제공하는 단계를 포함하고,
상기 제1 연산과 상기 제2 연산은 병렬적으로 수행되는 전자 장치의 동작 방법.
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180102183A KR102692017B1 (ko) | 2018-08-29 | 2018-08-29 | 전자 장치 및 전자 장치의 동작 방법 |
US16/295,526 US10936891B2 (en) | 2018-08-29 | 2019-03-07 | Electronic devices and methods of operating electronic devices |
CN201910535301.7A CN110874810B (zh) | 2018-08-29 | 2019-06-19 | 电子设备和操作电子设备的方法 |
US17/188,166 US11521374B2 (en) | 2018-08-29 | 2021-03-01 | Electronic devices |
US18/074,916 US20230106073A1 (en) | 2018-08-29 | 2022-12-05 | Semiconductor Package |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180102183A KR102692017B1 (ko) | 2018-08-29 | 2018-08-29 | 전자 장치 및 전자 장치의 동작 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20200025200A KR20200025200A (ko) | 2020-03-10 |
KR102692017B1 true KR102692017B1 (ko) | 2024-08-05 |
Family
ID=69639917
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020180102183A Active KR102692017B1 (ko) | 2018-08-29 | 2018-08-29 | 전자 장치 및 전자 장치의 동작 방법 |
Country Status (3)
Country | Link |
---|---|
US (3) | US10936891B2 (ko) |
KR (1) | KR102692017B1 (ko) |
CN (1) | CN110874810B (ko) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11625245B2 (en) * | 2018-09-28 | 2023-04-11 | Intel Corporation | Compute-in-memory systems and methods |
US11494645B2 (en) * | 2018-12-06 | 2022-11-08 | Egis Technology Inc. | Convolutional neural network processor and data processing method thereof |
KR102764317B1 (ko) | 2019-01-31 | 2025-02-07 | 삼성전자주식회사 | 뉴럴 네트워크의 컨볼루션 연산을 처리하는 방법 및 장치 |
US12014505B2 (en) * | 2019-01-31 | 2024-06-18 | Samsung Electronics Co., Ltd. | Method and apparatus with convolution neural network processing using shared operand |
KR102783027B1 (ko) * | 2020-01-17 | 2025-03-18 | 에스케이하이닉스 주식회사 | Aim 장치 |
US20210320967A1 (en) * | 2020-04-09 | 2021-10-14 | Micron Technology, Inc. | Edge Server with Deep Learning Accelerator and Random Access Memory |
US11461651B2 (en) | 2020-04-09 | 2022-10-04 | Micron Technology, Inc. | System on a chip with deep learning accelerator and random access memory |
US12327175B2 (en) | 2020-08-06 | 2025-06-10 | Micron Technology, Inc. | Collaborative sensor data processing by deep learning accelerators with integrated random access memory |
CN111915001B (zh) * | 2020-08-18 | 2024-04-12 | 腾讯科技(深圳)有限公司 | 卷积计算引擎、人工智能芯片以及数据处理方法 |
US11226767B1 (en) * | 2020-09-30 | 2022-01-18 | Micron Technology, Inc. | Apparatus with access control mechanism and methods for operating the same |
CN112418423B (zh) * | 2020-11-24 | 2023-08-15 | 百度在线网络技术(北京)有限公司 | 利用神经网络向用户推荐对象的方法、设备和介质 |
CN115374031A (zh) * | 2021-05-17 | 2022-11-22 | 三星电子株式会社 | 近存储器处理双列直插式存储器模块及其操作方法 |
CN115617739B (zh) * | 2022-09-27 | 2024-02-23 | 南京信息工程大学 | 一种基于Chiplet架构的芯片及控制方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180225150A1 (en) | 2015-07-27 | 2018-08-09 | Hewlett Packard Enterprise Development Lp | Scheduling heterogenous processors |
US20180285718A1 (en) | 2017-04-04 | 2018-10-04 | Hailo Technologies Ltd. | Neural Network Processor Incorporating Multi-Level Hierarchical Aggregated Computing And Memory Elements |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5517596A (en) * | 1991-05-17 | 1996-05-14 | International Business Machines Corporation | Learning machine synapse processor system apparatus |
DE60234900D1 (de) | 2001-12-21 | 2010-02-11 | Ibm | Verfahren und Schaltungen zur Bildskalierung mit Hilfe neuronaler Netzwerke |
US7567252B2 (en) * | 2003-12-09 | 2009-07-28 | Microsoft Corporation | Optimizing performance of a graphics processing unit for efficient execution of general matrix operations |
JP5368687B2 (ja) | 2007-09-26 | 2013-12-18 | キヤノン株式会社 | 演算処理装置および方法 |
US9195934B1 (en) * | 2013-01-31 | 2015-11-24 | Brain Corporation | Spiking neuron classifier apparatus and methods using conditionally independent subsets |
US20150317557A1 (en) * | 2014-05-01 | 2015-11-05 | Qualcomm Incorporated | Temporal spike encoding for temporal learning |
CN104035751B (zh) * | 2014-06-20 | 2016-10-12 | 深圳市腾讯计算机系统有限公司 | 基于多图形处理器的数据并行处理方法及装置 |
US9836277B2 (en) | 2014-10-01 | 2017-12-05 | Samsung Electronics Co., Ltd. | In-memory popcount support for real time analytics |
US20160162779A1 (en) * | 2014-12-05 | 2016-06-09 | RealMatch, Inc. | Device, system and method for generating a predictive model by machine learning |
CN104535965A (zh) * | 2014-12-29 | 2015-04-22 | 江苏科技大学 | 基于嵌入式gpu系统的并行化声源定位系统及方法 |
US10528613B2 (en) | 2015-11-23 | 2020-01-07 | Advanced Micro Devices, Inc. | Method and apparatus for performing a parallel search operation |
CN105869117B (zh) * | 2016-03-28 | 2021-04-02 | 上海交通大学 | 一种针对深度学习超分辨率技术的gpu加速方法 |
CN107615241A (zh) * | 2016-03-31 | 2018-01-19 | 慧与发展有限责任合伙企业 | 逻辑操作 |
US11055063B2 (en) * | 2016-05-02 | 2021-07-06 | Marvell Asia Pte, Ltd. | Systems and methods for deep learning processor |
US10198349B2 (en) | 2016-09-19 | 2019-02-05 | Advanced Micro Devices, Inc. | Programming in-memory accelerators to improve the efficiency of datacenter operations |
CN107239824A (zh) * | 2016-12-05 | 2017-10-10 | 北京深鉴智能科技有限公司 | 用于实现稀疏卷积神经网络加速器的装置和方法 |
US9754221B1 (en) | 2017-03-09 | 2017-09-05 | Alphaics Corporation | Processor for implementing reinforcement learning operations |
US11222260B2 (en) * | 2017-03-22 | 2022-01-11 | Micron Technology, Inc. | Apparatuses and methods for operating neural networks |
CN107945098B (zh) * | 2017-11-24 | 2022-03-01 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、计算机设备和存储介质 |
CN108021395B (zh) * | 2017-12-27 | 2022-04-29 | 北京金山安全软件有限公司 | 一种面向神经网络的数据并行处理方法及系统 |
US10726096B2 (en) * | 2018-10-12 | 2020-07-28 | Hewlett Packard Enterprise Development Lp | Sparse matrix vector multiplication with a matrix vector multiplication unit |
-
2018
- 2018-08-29 KR KR1020180102183A patent/KR102692017B1/ko active Active
-
2019
- 2019-03-07 US US16/295,526 patent/US10936891B2/en active Active
- 2019-06-19 CN CN201910535301.7A patent/CN110874810B/zh active Active
-
2021
- 2021-03-01 US US17/188,166 patent/US11521374B2/en active Active
-
2022
- 2022-12-05 US US18/074,916 patent/US20230106073A1/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180225150A1 (en) | 2015-07-27 | 2018-08-09 | Hewlett Packard Enterprise Development Lp | Scheduling heterogenous processors |
US20180285718A1 (en) | 2017-04-04 | 2018-10-04 | Hailo Technologies Ltd. | Neural Network Processor Incorporating Multi-Level Hierarchical Aggregated Computing And Memory Elements |
Also Published As
Publication number | Publication date |
---|---|
US10936891B2 (en) | 2021-03-02 |
US20230106073A1 (en) | 2023-04-06 |
US11521374B2 (en) | 2022-12-06 |
CN110874810A (zh) | 2020-03-10 |
US20200074202A1 (en) | 2020-03-05 |
US20210192248A1 (en) | 2021-06-24 |
KR20200025200A (ko) | 2020-03-10 |
CN110874810B (zh) | 2024-07-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102692017B1 (ko) | 전자 장치 및 전자 장치의 동작 방법 | |
US11416178B2 (en) | Memory device performing parallel calculation processing, operating method thereof, and operating method of memory controller controlling the memory device | |
US20210125045A1 (en) | Stacked neuromorphic devices and neuromorphic computing systems | |
KR102778081B1 (ko) | 신경 프로세싱 유닛 | |
US10803929B2 (en) | Static random-access memory with virtual banking architecture, and system and method including the same | |
US11620504B2 (en) | Neuromorphic device based on memory | |
US12354649B2 (en) | Signal routing between memory die and logic die for performing operations | |
US20220188606A1 (en) | Memory Configuration to Support Deep Learning Accelerator in an Integrated Circuit Device | |
US20220020406A1 (en) | Processing-in-memory (pim) systems | |
US11915124B2 (en) | Performing processing-in-memory operations related to spiking events, and related methods, systems and devices | |
TW202006609A (zh) | 用於類神經網路的記憶體內運算裝置 | |
KR20230005345A (ko) | 신경망을 트레이닝시키는 메모리 디바이스 | |
KR20220142333A (ko) | 데이터 재사용이 가능한 신경 프로세싱 유닛 및 그 방법 | |
US11531618B2 (en) | Memory modules and methods of operating same | |
KR20200141663A (ko) | 컨볼루션 신경망 모델에 기초한 컴퓨팅 장치 및 그 동작 방법 | |
KR20230043619A (ko) | 내부 프로세싱 동작에 대한 타이밍 파라미터들 및 전력 소모를 줄이는 메모리 장치 및 이를 구현하는 방법 | |
WO2022031808A1 (en) | Collaborative sensor data processing by deep learning accelerators with integrated random access memory | |
KR102832599B1 (ko) | 메모리 기반의 뉴로모픽 장치 | |
US20200257959A1 (en) | Memory device having an address generator using a neural network algorithm and a memory system including the same | |
US20250068500A1 (en) | Fail data augmentation device and method for random access memory | |
KR102824754B1 (ko) | 전압 강하를 고려한 뉴럴 네트워크 장치 및 이의 구현 방법 | |
TWI882041B (zh) | 執行平行計算處理的記憶體裝置及其操作方法、以及控制所述記憶體裝置的記憶體控制器的操作方法 | |
US20220283806A1 (en) | Processing-in-memory device having a plurality of global buffers and processing-in-memory system including the same | |
US20250201332A1 (en) | Fail classification device for plurality of memory cells and method thereof | |
US20230033179A1 (en) | Accumulator and processing-in-memory (pim) device including the accumulator |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20180829 |
|
PG1501 | Laying open of application | ||
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20210714 Comment text: Request for Examination of Application Patent event code: PA02011R01I Patent event date: 20180829 Comment text: Patent Application |
|
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20240322 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20240725 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20240731 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20240801 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration |