KR20230081697A - 팽창 컨볼루션 계산 가속화 방법 및 장치 - Google Patents
팽창 컨볼루션 계산 가속화 방법 및 장치 Download PDFInfo
- Publication number
- KR20230081697A KR20230081697A KR1020227031052A KR20227031052A KR20230081697A KR 20230081697 A KR20230081697 A KR 20230081697A KR 1020227031052 A KR1020227031052 A KR 1020227031052A KR 20227031052 A KR20227031052 A KR 20227031052A KR 20230081697 A KR20230081697 A KR 20230081697A
- Authority
- KR
- South Korea
- Prior art keywords
- convolution
- expansion
- rхs
- sub
- computing units
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/063—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/15—Correlation function computation including computation of convolution operations
- G06F17/153—Multidimensional correlation or convolution
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F7/00—Methods or arrangements for processing data by operating upon the order or content of the data handled
- G06F7/38—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
- G06F7/48—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
- G06F7/50—Adding; Subtracting
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F7/00—Methods or arrangements for processing data by operating upon the order or content of the data handled
- G06F7/38—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
- G06F7/48—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
- G06F7/52—Multiplying; Dividing
- G06F7/523—Multiplying only
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/20—Image enhancement or restoration using local operators
- G06T5/30—Erosion or dilatation, e.g. thinning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/60—Analysis of geometric attributes
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computational Mathematics (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Analysis (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Mathematical Optimization (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Geometry (AREA)
- Neurology (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Complex Calculations (AREA)
- Image Processing (AREA)
Abstract
Description
도 1은 종래 기술의 Im2col 기반 팽창 컨볼루션 연산에 대한 예시도이다.
도 2는 컨볼루션 신경망 컴퓨팅 장치의 예시적인 구조도이다.
도 3은 본 발명의 일 실시예에 따른 팽창 컨볼루션 계산 가속화 방법의 예시적인 흐름도이다.
도 4a는 팽창 컨볼루션 연산에 대한 일 예시도이고, 도 4b는 도 4a에 도시된 팽창 컨볼루션 연산에 대한 다른 일 예시도이다.
도 5는 본 발명의 일 실시예에 따라 RХS 팽창 컨볼루션 연산을 S개의 RХ1 서브 팽창 컨볼루션 연산으로 분해하는 동작에 대한 일 예시도이다.
도 6은 본 발명의 일 실시예에 따라 RХS 팽창 컨볼루션 연산을 S개의 RХ1 서브 팽창 컨볼루션 연산으로 분해하는 동작에 대한 다른 일 예시도이다.
도 7은 본 발명의 일 실시예에 따라 가중치가 각각 캐싱된 컴퓨팅 유닛(PE)들에 의해 수행되는 팽창 컨볼루션에 대한 예시도이다.
도 8은 본 발명의 일 실시예에 따른 가중치가 캐싱된 일 컴퓨팅 유닛(PE)에 의해 수행되는 슬라이딩 윈도우 동작에 대한 예시도이다.
도 9는 본 발명의 일 실시예에 따른 팽창 컨볼루션 계산 가속화 장치의 예시적인 구조도이다.
첨부된 도면에서, 동일한 또는 대응되는 도면 부호는 동일한 또는 대응되는 부분을 나타낸다.
Claims (10)
- 팽창 컨볼루션 계산을 가속화하는 방법으로서,
RХS 팽창 컨볼루션 연산을 S개의 RХ1 서브 팽창 컨볼루션 연산으로 분해하는 것 - 상기 R은 상기 RХS 팽창 컨볼루션 연산의 컨볼루션 커널의 높이를 나타내고 상기 S는 상기 컨볼루션 커널의 너비를 나타냄 - ;
각 RХ1 서브 팽창 컨볼루션 연산에 대해, 복수의 가중치를 컴퓨팅 유닛 어레이의 복수의 컴퓨팅 유닛에 병렬로 캐싱하는 것;
입력 이미지 데이터로부터, 상기 복수의 가중치에 각각 대응되는 복수의 입력 데이터 스트림을 결정하고, 상기 복수의 입력 데이터 스트림을 상기 복수의 컴퓨팅 유닛에 병렬로 입력하는 것;
상기 복수의 컴퓨팅 유닛 내에서 각각의 캐싱된 가중치 및 각각의 입력된 입력 데이터 스트림에 기반하여 슬라이딩 윈도우 연산 및 곱셈 연산을 수행하고, 상기 복수의 컴퓨팅 유닛 간 누산 연산을 수행하여 상기 각 RХ1 서브 팽창 컨볼루션 연산의 중간 결과를 출력하는 것; 및
상기 S개의 RХ1 서브 팽창 컨볼루션 연산의 각 중간 결과를 가산하여 상기 RХS 팽창 컨볼루션 연산의 컨볼루션 결과를 획득하는 것을 포함하는,
팽창 컨볼루션 계산 가속화 방법.
- 청구항 1에 있어서,
각 가중치에 대응되는 입력 데이터 스트림은, 상기 RХS 팽창 컨볼루션 연산의 팽창 비율 및 컨볼루션 보폭에 따라 상기 입력 이미지 데이터로부터 필요한 데이터를 판독하여 연결시킴으로써 결정되는,
팽창 컨볼루션 계산 가속화 방법.
- 청구항 1에 있어서,
각 가중치에 대응되는 입력 데이터 스트림은, 상기 RХS 팽창 컨볼루션 연산의 팽창 비율 및 컨볼루션 보폭에 따라 상기 입력 이미지 데이터에서 복수의 행의 데이터를 판독하여 연결시킴으로써 결정되는
팽창 컨볼루션 계산 가속화 방법.
- 청구항 1에 있어서,
상기 슬라이딩 윈도우 연산의 슬라이딩 보폭은 상기 RХS 팽창 컨볼루션 연산의 컨볼루션 보폭에 따라 결정되는,
팽창 컨볼루션 계산 가속화 방법.
- 청구항 1에 있어서,
상기 S개의 RХ1 서브 팽창 컨볼루션 연산의 각 중간 결과를 가산하는 것은,
상기 S개의 RХ1 서브 팽창 컨볼루션 연산 과정에서 각 중간 결과를 실시간으로 누산하는 것, 또는
상기 S개의 RХ1 서브 팽창 컨볼루션 연산 완료 후 각 중간 결과를 합산하는 것을 포함하는
팽창 컨볼루션 계산 가속화 방법.
- 팽창 컨볼루션 계산을 가속화하기 위한 장치로서,
로직 제어 유닛 및 컴퓨팅 유닛 어레이를 포함하되,
상기 로직 제어 유닛은, RХS 팽창 컨볼루션 연산을 S개의 RХ1 서브 팽창 컨볼루션 연산으로 분해하는 동작 - 상기 R은 상기 RХS 팽창 컨볼루션 연산의 컨볼루션 커널의 높이를 나타내고 상기 S는 상기 컨볼루션 커널의 너비를 나타냄 - ; 각 RХ1 서브 팽창 컨볼루션 연산에 대해, 복수의 가중치를 상기 컴퓨팅 유닛 어레이의 복수의 컴퓨팅 유닛에 병렬로 캐싱하는 동작; 및 입력 이미지 데이터로부터, 상기 복수의 가중치에 각각 대응되는 복수의 입력 데이터 스트림을 결정하고, 상기 복수의 입력 데이터 스트림을 상기 복수의 컴퓨팅 유닛에 병렬로 입력하는 동작을 수행하도록 구성되고;
상기 컴퓨팅 유닛 어레이는, 상기 복수의 컴퓨팅 유닛 내에서 각각의 캐싱된 가중치 및 각각의 입력된 입력 데이터 스트림에 기반하여 슬라이딩 윈도우 연산 및 곱셈 연산을 수행하고, 상기 복수의 컴퓨팅 유닛 간 누산 연산을 수행하여 상기 각 RХ1 서브 팽창 컨볼루션 연산의 중간 결과를 출력하는 동작; 및 상기 S개의 RХ1 서브 팽창 컨볼루션 연산의 각 중간 결과를 가산하여 상기 RХS 팽창 컨볼루션 연산의 컨볼루션 결과를 획득하는 동작을 수행하도록 구성된,
팽창 컨볼루션 계산 가속화 장치.
- 청구항 6에 있어서,
상기 로직 제어 유닛은, 상기 RХS 팽창 컨볼루션 연산의 팽창 비율 및 컨볼루션 보폭에 따라 상기 입력 이미지 데이터로부터 필요한 데이터를 판독하여 연결시킴으로써 각 가중치에 대응되는 입력 데이터 스트림을 결정하도록 구성된,
팽창 컨볼루션 계산 가속화 장치.
- 청구항 6에 있어서,
상기 로직 제어 유닛은, 상기 RХS 팽창 컨볼루션 연산의 팽창 비율 및 컨볼루션 보폭에 따라 상기 입력 이미지 데이터에서 복수의 행의 데이터를 판독하여 연결시킴으로써 각 가중치에 대응되는 입력 데이터 스트림을 결정하도록 구성된,
팽창 컨볼루션 계산 가속화 장치.
- 청구항 6에 있어서,
상기 슬라이딩 윈도우 연산의 슬라이딩 보폭은 상기 RХS 팽창 컨볼루션 연산의 컨볼루션 보폭에 따라 결정된
팽창 컨볼루션 계산 가속화 장치.
- 청구항 6에 있어서,
상기 컴퓨팅 유닛 어레이는, 상기 S개의 RХ1 서브 팽창 컨볼루션 연산 과정에서 각 중간 결과를 실시간으로 누산하거나, 또는 상기 S개의 RХ1 서브 팽창 컨볼루션 연산 완료 후 각 중간 결과를 합산하도록 구성된
팽창 컨볼루션 계산 가속화 장치.
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202010659646.6 | 2020-07-08 | ||
| CN202010659646.6A CN113989169B (zh) | 2020-07-08 | 2020-07-08 | 一种膨胀卷积加速计算方法及装置 |
| PCT/CN2020/126195 WO2022007265A1 (zh) | 2020-07-08 | 2020-11-03 | 一种膨胀卷积加速计算方法及装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| KR20230081697A true KR20230081697A (ko) | 2023-06-07 |
| KR102838881B1 KR102838881B1 (ko) | 2025-07-28 |
Family
ID=79552764
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020227031052A Active KR102838881B1 (ko) | 2020-07-08 | 2020-11-03 | 팽창 컨볼루션 계산 가속화 방법 및 장치 |
Country Status (6)
| Country | Link |
|---|---|
| US (1) | US12056530B2 (ko) |
| EP (1) | EP4181024A4 (ko) |
| JP (1) | JP7419574B2 (ko) |
| KR (1) | KR102838881B1 (ko) |
| CN (1) | CN113989169B (ko) |
| WO (1) | WO2022007265A1 (ko) |
Families Citing this family (12)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US12205013B1 (en) * | 2020-09-01 | 2025-01-21 | Amazon Technologies, Inc. | Accelerated convolution of neural networks |
| GB2602997B (en) * | 2021-01-25 | 2023-03-01 | Imagination Tech Ltd | Implementing dilated convolution in hardware |
| CN114565501B (zh) * | 2022-02-21 | 2024-03-22 | 格兰菲智能科技有限公司 | 用于卷积运算的数据加载方法及其装置 |
| CN115292662B (zh) * | 2022-08-18 | 2023-09-22 | 上海燧原科技有限公司 | 一种卷积加速运算方法、装置、电子设备及存储介质 |
| EP4336410A1 (en) * | 2022-09-09 | 2024-03-13 | HCL Technologies Limited | Method and system for feature extraction using reconfigurable convolutional cluster engine in image sensor pipeline |
| CN115809689A (zh) * | 2022-12-05 | 2023-03-17 | 亿咖通(湖北)技术有限公司 | 深度学习中非常规卷积的实现方法、电子设备和存储介质 |
| CN116152037A (zh) * | 2022-12-06 | 2023-05-23 | 嘉楠明芯(北京)科技有限公司 | 图像反卷积方法和设备、存储介质 |
| KR102887942B1 (ko) * | 2023-09-06 | 2025-11-18 | 한국전자통신연구원 | 효율적인 행렬곱 연산을 갖는 인공신경망 처리 방법 및 장치 |
| CN117407733B (zh) * | 2023-12-12 | 2024-04-02 | 南昌科晨电力试验研究有限公司 | 一种基于对抗生成shapelet的流量异常检测方法及系统 |
| CN118277328B (zh) * | 2024-04-18 | 2025-04-18 | 摩尔线程智能科技(北京)股份有限公司 | 数据处理方法、处理器、芯片及电子设备 |
| CN119599858B (zh) * | 2024-11-19 | 2025-11-11 | 北京航空航天大学 | 数据处理方法、处理电路、电路控制方法和处理系统 |
| CN120163190B (zh) * | 2025-05-20 | 2025-08-22 | 南京大学 | 一种基于逐通道逐行的片上网络运算数据流传输方法 |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20200049366A (ko) * | 2018-10-31 | 2020-05-08 | 삼성전자주식회사 | 뉴럴 네트워크 프로세서 및 그것의 컨볼루션 연산 방법 |
| CN111178519A (zh) * | 2019-12-27 | 2020-05-19 | 华中科技大学 | 卷积神经网络加速引擎、卷积神经网络加速系统及方法 |
| KR20200066952A (ko) * | 2018-12-03 | 2020-06-11 | 삼성전자주식회사 | 확장 컨벌루션 연산을 수행하는 장치 및 방법 |
Family Cites Families (11)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN104915322B (zh) * | 2015-06-09 | 2018-05-01 | 中国人民解放军国防科学技术大学 | 一种卷积神经网络硬件加速方法 |
| US10067509B1 (en) | 2017-03-10 | 2018-09-04 | TuSimple | System and method for occluding contour detection |
| US10838910B2 (en) * | 2017-04-27 | 2020-11-17 | Falcon Computing | Systems and methods for systolic array design from a high-level program |
| US10990648B2 (en) * | 2017-08-07 | 2021-04-27 | Intel Corporation | System and method for an optimized winograd convolution accelerator |
| CN107862650B (zh) * | 2017-11-29 | 2021-07-06 | 中科亿海微电子科技(苏州)有限公司 | 加速计算二维图像cnn卷积的方法 |
| CN109919295B (zh) * | 2017-12-12 | 2022-10-28 | 北京大学深圳研究生院 | 一种基于轻量级卷积神经网络的嵌入式音频事件检测方法 |
| CN109032781A (zh) * | 2018-07-13 | 2018-12-18 | 重庆邮电大学 | 一种卷积神经网络算法的fpga并行系统 |
| CN109447893A (zh) * | 2019-01-28 | 2019-03-08 | 深兰人工智能芯片研究院(江苏)有限公司 | 一种卷积神经网络fpga加速中图像前处理方法及装置 |
| CN110543849B (zh) | 2019-08-30 | 2022-10-04 | 北京市商汤科技开发有限公司 | 检测器的配置方法及装置、电子设备和存储介质 |
| CN111260037B (zh) | 2020-02-11 | 2023-10-13 | 深圳云天励飞技术股份有限公司 | 图像数据的卷积运算方法、装置、电子设备及存储介质 |
| CN111951269B (zh) * | 2020-10-16 | 2021-01-05 | 深圳云天励飞技术股份有限公司 | 图像处理方法及相关设备 |
-
2020
- 2020-07-08 CN CN202010659646.6A patent/CN113989169B/zh active Active
- 2020-11-03 JP JP2022580125A patent/JP7419574B2/ja active Active
- 2020-11-03 US US18/014,635 patent/US12056530B2/en active Active
- 2020-11-03 KR KR1020227031052A patent/KR102838881B1/ko active Active
- 2020-11-03 EP EP20944528.7A patent/EP4181024A4/en active Pending
- 2020-11-03 WO PCT/CN2020/126195 patent/WO2022007265A1/zh not_active Ceased
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20200049366A (ko) * | 2018-10-31 | 2020-05-08 | 삼성전자주식회사 | 뉴럴 네트워크 프로세서 및 그것의 컨볼루션 연산 방법 |
| KR20200066952A (ko) * | 2018-12-03 | 2020-06-11 | 삼성전자주식회사 | 확장 컨벌루션 연산을 수행하는 장치 및 방법 |
| CN111178519A (zh) * | 2019-12-27 | 2020-05-19 | 华中科技大学 | 卷积神经网络加速引擎、卷积神经网络加速系统及方法 |
Non-Patent Citations (1)
| Title |
|---|
| M. Sankaradas 등. "A Massively Parallel Coprocessor for Convolutional Neural Networks". 20th IEEE International Conference on Application-specific Systems, Architectures and Processors* * |
Also Published As
| Publication number | Publication date |
|---|---|
| CN113989169B (zh) | 2024-12-10 |
| WO2022007265A1 (zh) | 2022-01-13 |
| US20230273829A1 (en) | 2023-08-31 |
| US12056530B2 (en) | 2024-08-06 |
| EP4181024A1 (en) | 2023-05-17 |
| EP4181024A4 (en) | 2024-04-24 |
| KR102838881B1 (ko) | 2025-07-28 |
| CN113989169A (zh) | 2022-01-28 |
| JP7419574B2 (ja) | 2024-01-22 |
| JP2023531070A (ja) | 2023-07-20 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR102838881B1 (ko) | 팽창 컨볼루션 계산 가속화 방법 및 장치 | |
| US12056531B2 (en) | Method and apparatus for accelerating convolutional neural network | |
| US12174908B2 (en) | Method, electronic device and storage medium for convolution calculation in neural network | |
| US11574031B2 (en) | Method and electronic device for convolution calculation in neural network | |
| US12307350B2 (en) | Systems and methods for hardware-based pooling | |
| EP4384899B1 (en) | Partial sum management and reconfigurable systolic flow architectures for in-memory computation | |
| CN109993293B (zh) | 一种适用于堆叠式沙漏网络的深度学习加速器 | |
| WO2022206556A1 (zh) | 图像数据的矩阵运算方法、装置、设备及存储介质 | |
| US10884736B1 (en) | Method and apparatus for a low energy programmable vector processing unit for neural networks backend processing | |
| CN118643253B (zh) | 数据处理方法、装置、设备和存储介质 | |
| EP4374296A1 (en) | Hybrid machine learning architecture with neural processing unit and compute-in-memory processing elements | |
| US20230376733A1 (en) | Convolutional neural network accelerator hardware | |
| KR20200043617A (ko) | 고효율 연산 처리를 위한 인공 신경망 모듈 및 이의 스케쥴링 방법 | |
| US11748100B2 (en) | Processing in memory methods for convolutional operations | |
| KR20210014897A (ko) | 인공 신경망을 위한 행렬 연산기 및 행렬 연산 방법 | |
| CN118503205B (zh) | 用于处理张量数据的方法和装置 | |
| CN111831207B (zh) | 一种数据处理方法、装置及其设备 | |
| US12399845B2 (en) | Memory organization and access for efficient matrix operations | |
| CN120670716A (zh) | 基于人工智能模型的矩阵计算和存储协同优化方法、装置和计算机设备 | |
| KR20250104833A (ko) | 데이터 사전 구조 변경 및 활성화 가변 기능을 갖는 합성곱 신경망 가속기 | |
| CN119323241A (zh) | 一种基于FPGA的Winograd算法卷积加速器 | |
| CN119473146A (zh) | 一种矩阵乘算子的优化方法、设备、存储介质及程序产品 | |
| WO2023004374A1 (en) | Hybrid machine learning architecture with neural processing unit and compute-in-memory processing elements | |
| CN117786298A (zh) | 一种用于arm架构的通用矩阵乘法计算方法及系统 | |
| CN120182617A (zh) | 一种yolo算法的加速器系统及其实现方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PA0105 | International application |
St.27 status event code: A-0-1-A10-A15-nap-PA0105 |
|
| PA0201 | Request for examination |
St.27 status event code: A-1-2-D10-D11-exm-PA0201 |
|
| P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
| P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
| T11-X000 | Administrative time limit extension requested |
St.27 status event code: U-3-3-T10-T11-oth-X000 |
|
| T11-X000 | Administrative time limit extension requested |
St.27 status event code: U-3-3-T10-T11-oth-X000 |
|
| P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
| P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
| T11-X000 | Administrative time limit extension requested |
St.27 status event code: U-3-3-T10-T11-oth-X000 |
|
| P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
| P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
| PG1501 | Laying open of application |
St.27 status event code: A-1-1-Q10-Q12-nap-PG1501 |
|
| P22-X000 | Classification modified |
St.27 status event code: A-2-2-P10-P22-nap-X000 |
|
| E902 | Notification of reason for refusal | ||
| PE0902 | Notice of grounds for rejection |
St.27 status event code: A-1-2-D10-D21-exm-PE0902 |
|
| P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
| P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
| E701 | Decision to grant or registration of patent right | ||
| PE0701 | Decision of registration |
St.27 status event code: A-1-2-D10-D22-exm-PE0701 |
|
| F11 | Ip right granted following substantive examination |
Free format text: ST27 STATUS EVENT CODE: A-2-4-F10-F11-EXM-PR0701 (AS PROVIDED BY THE NATIONAL OFFICE) |
|
| PR0701 | Registration of establishment |
St.27 status event code: A-2-4-F10-F11-exm-PR0701 |
|
| PR1002 | Payment of registration fee |
St.27 status event code: A-2-2-U10-U12-oth-PR1002 Fee payment year number: 1 |
|
| U12 | Designation fee paid |
Free format text: ST27 STATUS EVENT CODE: A-2-2-U10-U12-OTH-PR1002 (AS PROVIDED BY THE NATIONAL OFFICE) Year of fee payment: 1 |
|
| PG1601 | Publication of registration |
St.27 status event code: A-4-4-Q10-Q13-nap-PG1601 |
|
| Q13 | Ip right document published |
Free format text: ST27 STATUS EVENT CODE: A-4-4-Q10-Q13-NAP-PG1601 (AS PROVIDED BY THE NATIONAL OFFICE) |