CN107229598B - 一种面向卷积神经网络的低功耗电压可调卷积运算模块 - Google Patents
一种面向卷积神经网络的低功耗电压可调卷积运算模块 Download PDFInfo
- Publication number
- CN107229598B CN107229598B CN201710266364.8A CN201710266364A CN107229598B CN 107229598 B CN107229598 B CN 107229598B CN 201710266364 A CN201710266364 A CN 201710266364A CN 107229598 B CN107229598 B CN 107229598B
- Authority
- CN
- China
- Prior art keywords
- data
- convolution
- voltage
- reuse
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/15—Correlation function computation including computation of convolution operations
- G06F17/153—Multidimensional correlation or convolution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Algebra (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Complex Calculations (AREA)
- Memory System Of A Hierarchy Structure (AREA)
Abstract
本发明公开了一种面向卷积神经网络的低功耗电压可调卷积运算模块,包括数据传输单元、电压可调缓存单元、卷积运算模块三部分。对于卷积神经网络,卷积运算占据整体运算量的一半以上,而卷积计算时图像数据矩阵中数据会被同一卷积核读取多次,且存在多个卷积核对这些数据进行同时访问的情况,使数据重用频次进一步提高。由于数据矩阵中的数据重用频次存在较大差异,将重用频次相同或相近的数据存放在一起,根据缓存中数据重用频次的分布调节存储模块电压,可以降低卷积神经网络加速器的整体功耗。本发明提出的低功耗电压可调卷积运算模块可以根据不同重用次数,进行不同缓存区域的电压调节,用以完成不同规模及步长情况下的卷积运算。
Description
技术领域
本发明涉及一种面向卷积神经网络的低功耗电压可调卷积运算模块,利用卷积运算中存在数据大量重用的规律,实现卷积神经网络进行大数量循环卷积运算,对数据进行重用。在卷积网络的一层卷积运算中,根据数据重用频度比例,在缓存中的不同存储片区中选取不同电压,降低功耗。属于神经网络硬件加速器技术领域。
背景技术
卷积运算在图像处理领域有着广泛的用途,例如在图像滤波、图像增强、图像分析等处理时都要用到卷积运算,图像卷积运算实质是一种矩阵运算,其特点是运算量大,并且数据复用率高,用软件计算图像卷积很难达到实时性的要求。
卷积神经网络作为一种前馈多层神经网络,能够对大量有标签数据进行自动学习并从中提取复杂特征,卷积神经网络的优点在于只需要对输入图像进行较少的预处理就能够从像素图像中识别出视觉模式,并且对有较多变化的识别对象也有较好的识别效果,同时卷积神经网络的识别能力不易受到图像的畸变或简单几何变换的影响。作为多层人工神经网络研究的一个重要方向,卷积神经网络多年来一直是研究的热点。
传统方式卷积运算的缓存是直接从外部存储读取,由于受到数据读取带宽的限制,以及没有可配置阵列,完成多层卷积循环运算,效率较低。如果能把进入缓存中的一块数据完全利用,不用根据轨迹的变化,不断从外存中读取,将降低吞吐要求,并且解决了不同重用次数数据之间存在读取时间等待的问题,即不同缓存区域数据可以对应不同读取主频这里选用不同电压的缓存,那些重用次数低,对读取主频要求的数据可以在低电压缓存区域,根据低重用次数数据的占比,可以动态调节电压,降低功耗。
对于典型卷积神经网络,其卷积计算量占据整体计算的主要部分,而卷积计算时,图像数据矩阵中许多数据会被同一卷积核重用多次,而且存在多个卷积核,这样就会存在更多数据重用。卷积网络卷积运动是十分有规律的,如果具体到每个数据的重用次数,根据读取频度做存储分配,不同缓存对应不同电压,不同于原有电压不考虑读取次数多少的问题,功耗会大为降低。目前便携式设备最主要的问题就是功耗,而本发明的出发点就是通过重用次数分析,数据在不同电压缓存中分布,降低功耗。
发明内容
发明目的:针对现有技术中存在的卷积计算中吞吐量低等问题,本发明提供一种面向卷积神经网络的低功耗电压可调卷积运算模块,可以加速完成大数量卷积计算的要求,对数据进入缓存是规整读取数据块再转换为一维数据,降低对宽带的压力。根据输入图像数据重用结构,利用循环卷积运算中的高重用率特性,对应不同重用次数在数据中的占比,可以调节电压,平衡不同重用次数间的读取速率,达到降低功耗的目的,并且卷积运算的卷积核及图片规模变化都适用于此方法。
技术方案:一种面向卷积神经网络的低功耗电压可调卷积运算模块,包括数据传输单元、电压可调缓存单元、卷积计算单元三部分。
所述数据传输单元,将计算数据根据此次卷积运算的卷积核及图片的规模大小,获得图像数据重用分布,切割数据块与卷积核大小一致,并转换为一维数据进入电压可调缓存单元。
在电压可调缓存单元,根据进入电压可调缓存单元的一维数据的重用次数累加和,与达到此累加和的先后顺序,仲裁在缓存单元中不同存储片区的排布,按重用频度从高到低的排布,选取高重用频度数据(重用6次及以上)进入高电压缓存区域,低重用频度数据(重用5次及以下)进入低电压缓存区域,根据重用频度将数据存储至相应电压的缓存区域。
分好区域后,存储片区数据读取的快慢要求较大,即主频差异较大,最高读取次数和最低读取次数相差数倍,如果依照重用频度分块,使不同区域电压实现可调,高重用次数处,电压较高,低重用次数处电压变低,这样模块的功耗大大降低。针对低主频卷积计算,可通过降低电源电压的方式来有效的降低功耗(正比于电压平方次)。当重用次数较高时,这时系统可以让处理器工作在常规电源电压,实现电压可调可以使能效比大为提高。
在卷积计算单元中,使多个卷积核同时对缓存中一个片区的图像数据进行卷积,这里并行实现,且在电压可调缓存单元中缓存的图像数据需要根据卷积运算的原有轨迹,完成原有轨迹一次卷积运算的相加运算,这里采用Crossbar结构,完成卷积运算的输出。卷积计算中相乘运算完成后,每个值和多个权重值相乘,会得到多个结果,根据轨迹进入临时寄存器,待选取部分相乘完成,就会把一次卷积轨迹填满,这里是并行化完成的,最终相加得到终值。
卷积相乘结果存进来只用一次,卷积计算单元内部相加单元对应临时寄存器选取crossbar结构,临时数据寄存器单元TDR与计算单元的互连,临时数据寄存器之间的互连,临时数据寄存器阵列中每一行的任意一个临时数据寄存器,其输入数据可以来自其上一行的任意一个临时数据寄存器,并且最顶行临时寄存器的输入,连接到最底行临时寄存器的数据输出端,从而整个临时数据寄存器阵列构成了一个单向循环互连的拓扑结构。
有益效果:与现有技术相比,本发明提供的面向卷积神经网络的低功耗电压可调卷积运算模块,可以大幅提高卷积计算中的访存速度,减少访存开销,提升卷积计算的速度和效率。
附图说明
图1为图像数据为9×9,卷积核为3×3的数据分类示意图;
图2为卷积计算中数据为偶矩阵时重用次数分布图;
图3为卷积计算中数据为奇矩阵时重用次数分布图;
图4为基于宽电压SRAM的低功耗卷积神经网络卷积运算设计整体框图;
图5为基于宽电压SRAM的低功耗卷积神经网络卷积运算设计流程图。
具体实施方式
下面结合具体实施例,进一步阐明本发明,应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
面向卷积神经网络的低功耗电压可调卷积运算模块,包括数据传输单元、电压可调缓存单元、卷积计算单元三部分。
数据传输单元,用于传输图像数据进入电压可调缓存单元;电压可调缓存单元用以根据数据重用频度,将数据分布于不同电压的存储片区;卷积计算单元卷将存储片区的数据进行卷积运算,输出运算结果;
数据传输单元,将计算数据根据此次卷积运算的卷积核及图片的规模大小,获得图像数据重用分布,切割合适宽度数据块转换为一维数据进入电压可调缓存单元;
在电压可调缓存单元,根据进入电压可调缓存单元的一维数据的重用次数累加和,与达到此累加和的先后顺序,仲裁在缓存单元中不同存储片区的排布,按重用频度从高到低的排布,选取高重用频度数据进入高电压缓存区域,低重用频度数据进入低电压缓存区域,根据频度重用数据占比来调节存储片区电压;
在卷积计算单元中,使多个卷积核同时对缓存中一个片区的数据进行卷积,这里并行实现,且在电压可调缓存单元中缓存的图像数据需要根据卷积运算的原有轨迹,完成原有轨迹一次卷积运算的相加运算,这里采用Crossbar结构,完成卷积运算的输出。
数据传输单元包括数据仲裁模块、数据读取模块;数据仲裁模块根据此层数据卷积运算卷积核和图像数据的规模大小,对应数据的重用频度分布,判定选取二维图像数据的拼接区域大小;当图像数据和卷积核的规模确定时,整个图像数据的重用频度分布在卷积运算算法的基础上已经确定,在电压可调缓存单元,不同数据读取频度存放在不同存储片区上,以降低功耗开销;数据读取模块,根据切割图片大小,将此区域数据多行拼接为一行,进入电压可调缓存单元。
电压可调缓存单元,包括重用频度判断模块、优先级判断模块、电压调节及数据读取判断模块;重用频度判断模块根据数据的重用频度分布,将一维数据进入缓存的重用次数累积求和,基于累积和确定在缓存中的排布顺序;在缓存过程中,高累积和在缓存的偏上区域,低累积和在偏下区域,当累积和相同时,根据到达此累积和的先后顺序进行排列,即优先级判断模块根据卷积过程中原轨迹,判定到达此逻辑和的先后顺序,在存储片区中由高到低依次排列;电压调节及数据读取判断模块,根据低重用次数数据的比例,调节不同存储片区的电压,数据重用频度低于5次(含),选择较低电压(典型值:0.6V);,重用频度高于6次(含),采用较高电压(典型值:1.1V);同时,在存储片区内数据重用频度基本一致时,不同存储片区选择相同电压;如果重用频度处理缓存模块中数据被卷积运算阵列读取,需要从数据传输单元中更新数据,并传输给卷积计算单元。
卷积计算单元利用在电压可调缓存单元排布的数据运算,包括乘运算模块、卷积轨迹判断模块和加运算模块;乘运算模块中,进入卷积运算阵列的数据会和一个卷积核中多个权重相乘,得到多个结果对应多次卷积轨迹;卷积轨迹判断模块中要根据卷积运算原有卷积轨迹,将相乘结果存在Crossbar结构的临时数据寄存器中,在加运算模块中利用根据卷积轨迹判断模块已存放的结果,完成相加运算,得到卷积运算结果。
卷积运算数据重用频度分析,其是在卷积运算算法分析基础上提取出的,根据卷积核及图像矩阵规模大小,图像数据矩阵中每个数据都具有自身的重用频度,在进行卷积运算前,数据重用频度分布就已得到;整体规律趋势是图像数据矩阵边角处数据重用频度低,中心处数据重用频度高;根据数据重用频度分布,为数据传输单元提供拼接数据块大小,及电压可调缓存单元累积求和提供依据。
数据传输单元、电压可调缓存单元、卷积计算单元三部分相互配合,首先,将计算数据根据此次卷积运算的卷积核及图片的规模大小,获得图像数据重用次数分布,切割数据块与卷积核大小一致,拼接为一维数据进入电压调节缓存单元。
如图1所示,面向卷积神经网络的低功耗电压可调卷积运算模块,选取图片数据为9×9矩阵,卷积核为3×3矩阵,一次卷积运算是对二维图像数据进行卷积,这里是多张图片同时卷积,访存要求较高,在访存采用拼接的方法将二维数据转换为一维数据,数据区域只读取一次,提高访存效率,降低外存功耗。这里存在2×2、3×3、5×5等多种卷积核大小时组成一维模式,对于一片区域只需发起一次访问,而不需多次。
选取大小为M*M的图像,大小为K*K的卷积核为例。卷积运算算法特征是一致的,当M>=2K-1时,对应卷积结构如下表所示:
被卷积的次数 | 被卷积对应次数的数据单元个数 |
1 | 4 |
2 | 8 |
…… | …… |
K | 4n |
…… | …… |
2K | 4n |
…… | …… |
(K-1)*K | 4n |
K*K | n<sup>2</sup> |
M越大,即输入矩阵的规模越大,卷积的次数最大值越大,卷积次数为K,2K,3K……(K-1)的子单元的数目为4n(其中参数n的数值计算方式:当M=2K-1时n=1;M每增加1,n就增加1);当卷积次数为其他值的时候,对应的子单元的数目是一个固定值。
推广到更一般的情况,如图2为卷积计算中卷积数据为偶阵列时重用次数分布图,及图3为卷积计算中卷积数据为奇阵列时重用次数分布图,即在边缘处的图像数据被重用次数少,中间处图像数据被重用次数多。因此,在图像进行卷积运算之前,已经得到整个图像数据的重用频度分布,在动态电压缓存单元分布在不同存储片区,满足不同缓存间计算时间的一致性。由图4所示,数据传输单元根据切割图片大小,将此区域多行拼接为一行,进入电压可调缓存单元。
电压可调缓存单元,包括重用频度累积和判断模块、优先级判断模块、电压调节及数据读取判断模块,重用频度累积和判断模块根据在数据传输单元中的重用频度分布,得到一维数据进入缓存的重用次数累积求和,基于累积和确定在缓存中的排布顺序。对比累积和的大小,当累积和不同时,按照其大小顺序在缓存中按由高到低的顺序排列;当累积和相同时,优先级判断模块会根据卷积轨迹,进一步判断到达此逻辑和的先后顺序,在缓存中按由高到低的顺序排列,再根据重用次数分析,将已变成一维的数据进行调整,最上边区域是重用次数最高的区域,而最下面是重用次数最低的区域,具体结构如图4中电压可调缓存单元,分好区域后,这里数据读取的主频差异较大,最高读取次数和最低读取次数相差数倍,如果这里依照分块,使不同区域电压实现可调,高重用次数处,电压较高,低电压处电压变低,这样模块的功耗大大降低。
如图4所示,数据读取判断完成之后,即可在卷积计算单元进行卷积运算。利用在电压可调缓存单元排布的数据运算,卷积计算单元包括乘法模块和卷积轨迹判断模块。由图2中卷积计算单元所示,选取一个数据定为X1为起点,第一个正被卷积数据即是第一个卷积核通过此区域的数据,X1会被重用9次。在卷积相乘后,结果进入临时寄存器,只利用一次,可以采用crossbar结构,数据被读取一次后清除相加得结果。即乘法模块中,进入卷积运算阵列的数据会和一个卷积核中多个权重相乘,得到多个结果对应多次卷积轨迹。卷积轨迹判断模块中要根据卷积运算原有卷积轨迹,将相乘结果存在Crossbar结构中的临时寄存器中,继而进行累加运算,得到最终卷积运算结果。
整体实现流程图如5所示,主要包括如下步骤:
1)根据计算需求,发起数据访问请求,二维截取部分拼接为一维数据,在最大部分截取大小选取合适大小数据块;
2)根据重用分析,在片上存储中根据重用次数分区域存储;
3)根据数据重用次数,判断重用次数累积和以及到达此累积和的先后轨迹顺序,实现动态电压可调,读取次数少时,要求读取速率慢,即低主频,可使用低电压,相反,重用较多模块,使用高电压;
4)重用部分数据进入卷积阵列相乘部分计算,这里因为要被多个卷积核使用,可以实现一取多读,数据进入阵列和预存在计算阵列里的卷积核权重值相乘,得出多个结果,分配给加法计算里的临时寄存器;
5)卷积阵列相加部分,用相乘送入临时寄存器的值,根据卷积轨迹,把一次卷积所有结果相加;
6)把计算结果输出,得到下一层卷积输入矩阵。
针对低主频卷积计算,可通过降低电源电压的方式来有效的降低功耗(正比于V2)。当重用次数较高时时,这时系统可以让处理器工作在常规电源电压,实现电压可调可以使能效大为提高,已选取0.6V和1.1V两种电压为例,功耗只有前者的29%,在低重用次数数据较多情况下,选取此电压作为低存储片区的电压,0.8V时,功耗是1.1V的54%,此时可以选择低重用次数适中的情况。通过这里的电压选择,显著降低功耗。
Claims (5)
1.一种面向卷积神经网络的低功耗电压可调卷积运算模块,其特征在于:包括数据传输单元、电压可调缓存单元和卷积计算单元;
所述数据传输单元,用于传输图像数据进入电压可调缓存单元;电压可调缓存单元用以根据数据重用频度,将数据分布于不同电压的存储片区;卷积计算单元卷将存储片区的数据进行卷积运算,输出运算结果;
所述数据传输单元,将计算数据根据此次卷积运算的卷积核及图片的规模大小,获得图像数据重用分布,切割数据块转换为一维数据进入电压可调缓存单元;
在电压可调缓存单元,根据进入电压可调缓存单元的一维数据的重用次数累加和,与达到此累加和的先后顺序,仲裁在缓存单元中不同存储片区的排布,按重用频度从高到低的排布,选取高重用频度数据进入高电压缓存区域,低重用频度数据进入低电压缓存区域,根据频度重用数据占比来调节存储片区电压;
在卷积计算单元中,使多个卷积核同时对缓存中一个片区的数据进行卷积,这里并行实现,且在电压可调缓存单元中缓存的图像数据需要根据卷积运算的原有轨迹,完成原有轨迹一次卷积运算的相加运算,这里采用Crossbar结构,完成卷积运算的输出。
2.根据权利要求1所述的一种面向卷积神经网络的低功耗电压可调卷积运算模块,其特征在于:所述数据传输单元包括数据仲裁模块、数据读取模块;所述数据仲裁模块根据此层数据卷积运算卷积核和图像数据的规模大小,对应数据的重用频度分布,判定选取二维图像数据的拼接区域大小;当图像数据和卷积核的规模确定时,整个图像数据的重用频度分布在卷积运算算法的基础上已经确定,在电压可调缓存单元,不同数据读取频度存放在不同存储片区上,以降低功耗开销;所述数据读取模块,根据切割图片大小,将此区域数据多行拼接为一行,进入电压可调缓存单元。
3.根据权利要求1或2所述的一种面向卷积神经网络的低功耗电压可调卷积运算模块,其特征在于:所述电压可调缓存单元,包括重用频度判断模块、优先级判断模块、电压调节及数据读取判断模块;重用频度判断模块根据数据的重用频度分布,将一维数据进入缓存的重用次数累积求和,基于累积和确定在缓存中的排布顺序;在缓存过程中,高累积和在缓存的偏上区域,低累积和在偏下区域,当累积和相同时,根据到达此累积和的先后顺序进行排列,即优先级判断模块根据卷积过程中原轨迹,判定到达此逻辑和的先后顺序,在存储片区中由高到低依次排列;电压调节及数据读取判断模块,根据低重用次数数据的比例,调节不同存储片区的电压,数据重用频度≤5次,选择0.6V电压;重用频度≥6次,采用1.1V电压;同时,在存储片区内数据重用频度一致时,不同存储片区选择相同电压;如果重用频度处理缓存模块中数据被卷积运算阵列读取,需要从数据传输单元中更新数据,并传输给卷积计算单元。
4.根据权利要求1所述的一种面向卷积神经网络的低功耗电压可调卷积运算模块,其特征在于:卷积计算单元利用在电压可调缓存单元排布的数据运算,包括乘运算模块、卷积轨迹判断模块和加运算模块;乘运算模块中,进入卷积运算阵列的数据会和一个卷积核中多个权重相乘,得到多个结果对应多次卷积轨迹;卷积轨迹判断模块中要根据卷积运算原有卷积轨迹,将相乘结果存在Crossbar结构的临时数据寄存器中,在加运算模块中利用根据卷积轨迹判断模块已存放的结果,完成相加运算,得到卷积运算结果。
5.根据权利要求1所述的一种面向卷积神经网络的低功耗电压可调卷积运算模块,其特征在于:所述数据重用频度的分布在进行卷积运算前就已得到;整体规律趋势是图像数据矩阵边角处数据重用频度低,中心处数据重用频度高;根据数据重用频度分布,为数据传输单元提供拼接数据块大小,及电压可调缓存单元累积求和提供依据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710266364.8A CN107229598B (zh) | 2017-04-21 | 2017-04-21 | 一种面向卷积神经网络的低功耗电压可调卷积运算模块 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710266364.8A CN107229598B (zh) | 2017-04-21 | 2017-04-21 | 一种面向卷积神经网络的低功耗电压可调卷积运算模块 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107229598A CN107229598A (zh) | 2017-10-03 |
CN107229598B true CN107229598B (zh) | 2021-02-26 |
Family
ID=59933141
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710266364.8A Expired - Fee Related CN107229598B (zh) | 2017-04-21 | 2017-04-21 | 一种面向卷积神经网络的低功耗电压可调卷积运算模块 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107229598B (zh) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109725700A (zh) * | 2017-10-29 | 2019-05-07 | 上海寒武纪信息科技有限公司 | 动态调压调频装置和方法 |
KR102434728B1 (ko) | 2017-10-20 | 2022-08-19 | 상하이 캠브리콘 인포메이션 테크놀로지 컴퍼니 리미티드 | 처리방법 및 장치 |
US10657439B2 (en) | 2017-10-24 | 2020-05-19 | Shanghai Cambricon Information Technology Co., Ltd | Processing method and device, operation method and device |
CN107766292B (zh) * | 2017-10-30 | 2020-12-29 | 中国科学院计算技术研究所 | 一种神经网络处理方法及处理系统 |
CN107862650B (zh) * | 2017-11-29 | 2021-07-06 | 中科亿海微电子科技(苏州)有限公司 | 加速计算二维图像cnn卷积的方法 |
CN108388333B (zh) * | 2018-01-25 | 2019-12-27 | 福州瑞芯微电子股份有限公司 | 一种基于电量设置乘法器精度的功耗调整方法和装置 |
CN109102069A (zh) * | 2018-07-20 | 2018-12-28 | 西安邮电大学 | 一种基于查找表的快速图像卷积运算实现方法 |
CN111048135A (zh) * | 2018-10-14 | 2020-04-21 | 天津大学青岛海洋技术研究院 | 一种基于忆阻器内存计算的cnn处理装置及其工作方法 |
CN109886860B (zh) * | 2019-01-31 | 2022-11-29 | 西安理工大学 | 一种低分辨率细胞图像的神经网络结构及加速电路 |
CN111523654B (zh) * | 2019-02-03 | 2024-03-29 | 上海寒武纪信息科技有限公司 | 处理装置及方法 |
KR102360452B1 (ko) * | 2019-06-18 | 2022-02-11 | 주식회사 퓨리오사에이아이 | 뉴럴 네트워크 프로세서의 컨벌루션 연산 처리 방법 및 장치 |
US10755772B1 (en) | 2019-07-31 | 2020-08-25 | Shanghai Cambricon Information Technology Co., Ltd | Storage device and methods with fault tolerance capability for neural networks |
CN110533177B (zh) * | 2019-08-22 | 2023-12-26 | 安谋科技(中国)有限公司 | 一种数据读写装置、方法、设备、介质及卷积加速器 |
CN110750231B (zh) * | 2019-09-27 | 2021-09-28 | 东南大学 | 一种面向卷积神经网络的双相系数可调模拟乘法计算电路 |
CN110717580B (zh) * | 2019-09-27 | 2022-03-11 | 东南大学 | 面向二值化神经网络的基于电压调制的计算阵列 |
CN114201726B (zh) * | 2020-09-18 | 2023-02-10 | 深圳先进技术研究院 | 一种卷积运算优化方法、系统、终端以及存储介质 |
CN112598122B (zh) * | 2020-12-23 | 2023-09-05 | 北方工业大学 | 一种基于可变电阻式随机存储器的卷积神经网络加速器 |
CN112668709B (zh) * | 2020-12-30 | 2023-06-13 | 上海壁仞智能科技有限公司 | 计算装置以及用于数据重用的方法 |
CN113157034B (zh) * | 2021-01-19 | 2022-06-03 | 浙江大学 | 一种被动稳压电路实现的高线性度神经形态计算电路 |
CN113780539A (zh) * | 2021-08-25 | 2021-12-10 | 鹏城实验室 | 一种神经网络数据处理方法、装置、设备及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102999656A (zh) * | 2011-09-07 | 2013-03-27 | 台湾积体电路制造股份有限公司 | 用于半导体器件的基于目标的虚拟插入 |
CN104347025A (zh) * | 2013-07-31 | 2015-02-11 | 乐金显示有限公司 | 用于转换数据的装置以及显示装置 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020176511A1 (en) * | 2001-03-16 | 2002-11-28 | Fullerton Larry W. | High pulse-rate radio-frequency apparatus and associated methods |
US8866899B2 (en) * | 2011-06-07 | 2014-10-21 | Photon Dynamics Inc. | Systems and methods for defect detection using a whole raw image |
US9063002B2 (en) * | 2012-01-20 | 2015-06-23 | California Institute Of Technology | Broadband, common-path, interferometric wavefront sensor |
CN103366389A (zh) * | 2013-04-27 | 2013-10-23 | 中国人民解放军北京军区总医院 | Ct图像重建方法 |
CN105260776B (zh) * | 2015-09-10 | 2018-03-27 | 华为技术有限公司 | 神经网络处理器和卷积神经网络处理器 |
CN106250103A (zh) * | 2016-08-04 | 2016-12-21 | 东南大学 | 一种卷积神经网络循环卷积计算数据重用的系统 |
CN106530210B (zh) * | 2016-10-31 | 2019-09-06 | 北京大学 | 基于阻变存储器件阵列实现并行卷积计算的设备和方法 |
-
2017
- 2017-04-21 CN CN201710266364.8A patent/CN107229598B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102999656A (zh) * | 2011-09-07 | 2013-03-27 | 台湾积体电路制造股份有限公司 | 用于半导体器件的基于目标的虚拟插入 |
CN104347025A (zh) * | 2013-07-31 | 2015-02-11 | 乐金显示有限公司 | 用于转换数据的装置以及显示装置 |
Non-Patent Citations (2)
Title |
---|
"Design and Development of an Embedded System for the Measurement of Boltzmann’s Constant";G. Sreenivasulu 等;《Indian Journal of Science and Technology》;20161020;第9卷(第39期);第1-2页 * |
王含 等." 一种模糊神经网络的硬件电路优化设计方式".《云南大学学报(自然科学版)》.2015,第37卷(第2期), * |
Also Published As
Publication number | Publication date |
---|---|
CN107229598A (zh) | 2017-10-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107229598B (zh) | 一种面向卷积神经网络的低功耗电压可调卷积运算模块 | |
CN110097174B (zh) | 基于fpga和行输出优先的卷积神经网络实现方法、系统及装置 | |
CN111684473B (zh) | 提高神经网络阵列的性能 | |
CN111242208B (zh) | 一种点云分类方法、分割方法及相关设备 | |
CN108108809B (zh) | 一种针对卷积神经元网络进行推理加速的硬件架构及其工作方法 | |
WO2021004366A1 (zh) | 基于结构化剪枝和低比特量化的神经网络加速器及方法 | |
JP7007488B2 (ja) | ハードウェアベースのプーリングのシステムおよび方法 | |
US20190303731A1 (en) | Target detection method and device, computing device and readable storage medium | |
CN112862090B (zh) | 一种基于深度时空神经网络的气温预报方法 | |
CN110533164A (zh) | 一种面向卷积神经网络加速器的Winograd卷积拆分方法 | |
CN109102065A (zh) | 一种基于PSoC的卷积神经网络加速器 | |
US11120101B2 (en) | Matrix multiplication system and method | |
CN110175670B (zh) | 一种基于FPGA实现YOLOv2检测网络的方法及系统 | |
CN107633297A (zh) | 一种基于并行快速fir滤波器算法的卷积神经网络硬件加速器 | |
CN110543934A (zh) | 一种用于卷积神经网络的脉动阵列计算结构及方法 | |
CN112016522A (zh) | 一种视频数据处理方法、系统及相关组件 | |
CN108647184A (zh) | 一种高精度动态比特位卷积乘法快速实现方法 | |
CN110414672B (zh) | 卷积运算方法、装置及系统 | |
CN116826734A (zh) | 一种基于多输入模型的光伏发电功率预测方法及装置 | |
CN110377874B (zh) | 卷积运算方法及系统 | |
CN114003201B (zh) | 矩阵变换方法、装置及卷积神经网络加速器 | |
CN108415881A (zh) | 卷积神经网络的运算装置及方法 | |
Xu et al. | Design and implementation of an efficient CNN accelerator for low-cost FPGAs | |
CN109416743A (zh) | 一种用于识别人为动作的三维卷积装置 | |
CN113744220B (zh) | 一种基于pynq的无预选框检测系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20210226 |