CN103984524B - 一种面向risc处理器的三端口浮点寄存器文件 - Google Patents
一种面向risc处理器的三端口浮点寄存器文件 Download PDFInfo
- Publication number
- CN103984524B CN103984524B CN201410206420.5A CN201410206420A CN103984524B CN 103984524 B CN103984524 B CN 103984524B CN 201410206420 A CN201410206420 A CN 201410206420A CN 103984524 B CN103984524 B CN 103984524B
- Authority
- CN
- China
- Prior art keywords
- enable
- reading
- write
- depositor
- read
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Executing Machine-Instructions (AREA)
- Multi Processors (AREA)
Abstract
本发明公开了一种面向RISC处理器的三端口浮点寄存器文件,通过在寄存器文件的输入信号中,增加源操作数和目标操作数的精度标志位,寄存器阵列的控制逻辑根据精度标志位和读写标志位,对源操作数和目标操作数地址指定的寄存器及与它地址相邻的寄存器同时进行读写操作,可以单周期完成双精度、四精度浮点数的读取和回写,解决了浮点运算过程中面临的SRAM带宽问题。
Description
技术领域
本发明专利属于微处理器体系结构领域,涉及一种面向RISC处理器的三端口浮点寄存器文件。
背景技术
精简指令集(RISC)处理器的大部分指令操作都在寄存器之间进行,必须由专门的访存指令完成外部存储器的读写操作。为了加快指令的执行速度,RISC处理器内部都有寄存器文件,指令执行过程中从寄存器文件取得源操作数,并将执行结果(目标操作数)写回到寄存器文件。一般情况下,RISC处理器的指令使用两个源操作数,计算得到一个目标操作数,基于此,寄存器文件应具有三个端口,具体包括两个读端口和一个写端口。
当前,三端口的寄存器文件的主要设计方法有两种,第一种为针对特殊应用要求(如抗辐照)的全定制设计,此类方法并不适用于通用处理器的寄存器文件实现。另一种基于单元库的半定制设计,即利用两块单元库中提供的双端口SRAM构造三端口的寄存器文件,如Atmel公司的AT697E、AT697F系列处理器,Gaisler研究所的LEON系列处理器及UT699系列处理器等。
文献“UT699LEON3FT/SPARCV8MicroProcessorFunctionalManual”公开了UT699处理器中寄存器文件的设计方法,通过两块256x48的双端口SRAM构造一个168x39的三端口寄存器文件,构造方法如图1所示,将目标操作数同时回写到两块SRAM中,以保证两块SRAM中数据的一致性,两个源操作数则是通过分别向两块SRAM请求数据获得。
基于单元库的半定制设计主要存在以下不足:(1)硬件资源浪费,增大了设计的功耗。该方法至少需要2倍于实际寄存器文件大小的SRAM存储单元,忽略SRAM存储单元中的行浪费,UT699中为3倍(2x256÷169);(2)带宽限制。当处理器进行大于单精度的浮点运算时,其所需的源操作数需要多个周期获得,影响处理器性能(同一时刻,SRAM只能译码一个读地址,也只能给出一个存储单元的数据)。
中国专利“一种用于浮点协处理器的寄存器文件分组编址、读写控制方法”(ZL201010261146.3)解决了浮点运算时SRAM带宽限制的问题,该方法通过将原来两块的SRAM分成两组,每组又分为四个小组,通过处理器对八个小组分别提供读写控制信号实现对输入、输出128位数据的控制。由于该方法基于单元库中SRAM,可能不存在合适大小的SRAM而造成更大的资源浪费,增加了功耗,另外该设计需要处理器产生8组控制信号,增加了处理器设计复杂性及后端布线的难度。
发明内容
本发明解决的技术问题在于提供一种面向RISC处理器的三端口浮点寄存器文件,通过使用寄存器阵列代替单元库中的SRAM作为三端口寄存器文件的存储单元,避免了硬件资源的浪费,降低了功耗。
本发明专利是通过以下技术方案来实现:
一种面向RISC处理器的三端口浮点寄存器文件,包括:
写地址译码模块,输入为寄存器文件写使能和写地址,当写使能有效时,置与写地址对应的寄存器AR的写使能w_en有效,并将其分别输出至写控制模块和写数据互连网络;
写控制模块,根据输入的写使能w_en和端口的输入写操作精度标志位,决定寄存器AR下面相邻的寄存器的写使能是否有效;输出m位写使能至寄存器阵列中m个寄存器的写使能端;
写数据互连网络,在写使能w_en控制下,将输入的寄存器文件128位写数据从低位到高位,以32位一组分为a、b、c、d四组;输出为m个32位的数据,分别连接至寄存器阵列中m个寄存器的数据输入端:将a组连接到寄存器AR的数据输入端datai;将b、c、d三组分别依次连接至AR下面相邻的三个寄存器的数据输入端datai,除a、b、c、d四组之外其余m-4组均为0;
寄存器阵列,为线性编址的一维寄存器阵列,大小为m×32,阵列的宽等于浮点寄存器的位宽,阵列的深度m等于浮点寄存器的个数,阵列中每一个寄存器有写使能,其每个寄存器的写使能和数据输入端分别来自写控制模块和数据互连网络,寄存器阵列有m个32位输出,全部连接至读数据互连网络;当某个寄存器写使能有效时,其输入的数据在时钟上升沿写入该寄存器,阵列中寄存器的输出恒有效;
第一读地址译码模块,输入为源操作数1的读使能1和读地址1,当读使能1有效时,置与读地址对应的寄存器AR的读使能r_en0有效,并将其输出至第一读控制模块;
第一读控制模块,输出为4位读使能r_en0、r_en1、r_en2、r_en3,全部连接至读数据互连网络;该模块根据输入读操作1精度标志位和读使能1,决定AR下面相邻的寄存器的读使能是否有效;
第二读地址译码模块,输入为源操作数2的读使能2和读地址2,当读使能2有效时,置与读地址对应的寄存器AR的读使能r_en0有效,并将其输出至第二写读控制模块;
第二读控制模块,输出为4位读使能r_en0、r_en1、r_en2、r_en3,全部连接至读数据互连网络;该模块根据输入读操作2精度标志位和读使能2,决定AR下面相邻的寄存器的读使能是否有效;
读数据互连网络,根据输入寄存器阵列的m个32位的输出和第二读控制模块的四位读使能的信号,生成1个128位的数据进行输出;
根据输入寄存器阵列的m个32位的输出和第一读控制模块的四位读使能的信号,生成1个128位的数据进行输出。
所述的写控制模块,根据写使能w_en和端口的输入写操作精度标志位进行如下判断:
如果写操作的精度标志位为双精度,则将寄存器阵列中AR的下一个寄存器的写使能w_en置有效;
如果写操作的精度标志位为四精度,则将寄存器阵列中AR的下三个寄存器的写使能w_en全部置有效(高电平);
如果写操作的精度标志位为单精度,只保持AR的写使能w_en有效。
所述的第一读控制模块进行以下判断:
如果读操作1的精度标志位为双精度,则将寄存器阵列中AR的下一个寄存器的读使能r_en1置有效;
如果读操作1的精度标志位为四精度,则将寄存器阵列中AR的下三个寄存器的读使能r_en1、r_en2、r_en3全部置有效;
如果读操作1的精度标志位为单精度,只保持AR的读使能r_en0有效。
所述的第二读控制模块进行以下判断:
如果读操作2的精度标志位为双精度,则将寄存器阵列中AR的下一个寄存器的读使能r_en1置有效;
如果读操作2的精度标志位为四精度,则将寄存器阵列中AR的下三个寄存器的读使能r_en1、r_en2、r_en3全部置有效;
如果读操作2的精度标志位为单精度,只保持AR的读使能r_en0有效。
所述的寄存器阵列对m个32位寄存器实行线性编址,构成一维寄存器阵列,地址范围0~m-1。
所述的读数据互连网络输出的128位的数据是由从低到高的a、b、c、d四组32位数据组成,a组的读使能对应读控制模块产生的r_en0,b组的读使能对应读控制模块产生的r_en1,c组的读使能对应读控制模块产生的r_en2,d组的读使能对应读控制模块产生的r_en3,若a、b、c、d中任一组的读使能有效,则该组数据为对应寄存器的数据输出,否则该组对应的数据为32位的0。
与现有技术相比,本发明具有以下有益的技术效果:
本发明提供的一种面向RISC处理器的三端口浮点寄存器文件,通过在寄存器文件的输入信号中,增加源操作数和目标操作数的精度标志位,寄存器阵列的控制逻辑根据精度标志位和读写标志位,对源操作数和目标操作数地址指定的寄存器及与它地址相邻的寄存器同时进行读写操作,可以单周期完成双精度、四精度浮点数的读取和回写,解决了浮点运算过程中面临的SRAM带宽问题。
本发明提供的一种面向RISC处理器的三端口浮点寄存器文件,使用寄存器阵列代替单元库中的SRAM作为三端口寄存器文件的存储单元,可以由设计者在不依赖单元库的基础上,根据处理器架构的要求,控制寄存器阵列的大小,避免了SRAM硬件资源的浪费,降低了功耗。
本发明提供的一种面向RISC处理器的三端口浮点寄存器文件,不需要改变处理器任何控制逻辑,不需要提供额外的读写控制信号,仅需处理器给出寄存器文件读写操作时的精度标志位,控制较为简单。
本发明提供的一种面向RISC处理器的三端口浮点寄存器文件,可以在单周期内完成双、四精度浮点数据的读取和回写,效率较高,提高了处理器性能。
附图说明
图1为现有的半定制三端口寄存器文件的结构图;
图2为基于本发明的寄存器阵列框图,其中图(a)为寄存器阵列中的任意一个n位寄存器示意图,图(b)为一维线性编址的寄存器阵列框图;
图3为基于本发明的三端口寄存器文件的电路结构图;
图4为读过程中的数据处理示意图。
具体实施方式
下面结合附图对本发明专利做进一步详细描述,所述是对本发明的解释而不是限定。
如图2、图3所示,一种面向RISC处理器的三端口浮点寄存器文件,包括写地址译码模块、写控制模块、写数据互连网络、寄存器阵列、第一读地址译码模块、第二读地址译码模块、第一读控制模块、第二读控制模块、读数据互连网络;
所述写地址译码模块,输入为寄存器文件写使能和写地址,当写使能有效时(高电平),置与写地址对应的寄存器AR的写使能w_en有效,并将其输出至写控制模块和写数据互连网络。
所述写控制模块,输出为m位写使能,分别连接至寄存器阵列中m个寄存器的写使能端。该模块根据写使能w_en和端口的输入写操作精度标志位,决定AR下面相邻的寄存器的写使能是否有效;如果写操作的精度标志位为双精度,则将寄存器阵列中AR的下一个寄存器(AR的地址加1)的写使能w_en置有效(高电平);如果写操作的精度标志位为四精度,则将寄存器阵列中AR的下三个寄存器(AR的地址加1,加2,加3对应的三个寄存器)的写使能w_en全部置有效(高电平),其余情况(单精度)只保持AR的写使能w_en有效。
所述写数据互连网络,输出为m个32位的数据,分别连接至寄存器阵列中m个寄存器的数据输入端。该模块在AR的写使能控制下,将寄存器文件的128写位数据从低位到高位,以32位一组,分为a、b、c、d四组,将a组连接到寄存器AR的数据输入端datai;将b、c、d三组分别依次连接至AR下面相邻的三个寄存器的数据输入端datai。
所述的寄存器阵列,如图2所示,线性编址的一维寄存器阵列,大小为m×32,阵列的宽(32)等于浮点寄存器的位宽,阵列的深度m等于浮点寄存器的个数,阵列中每一个寄存器有写使能,当某个寄存器写使能有效时,那么数据在时钟上升沿写入该寄存器,阵列中寄存器的输出恒有效。其每个寄存器的写使能和数据输入端分别来自写控制模块和数据互连网络,寄存器阵列有m个32位输出,全部连接至读数据互连网络。
所述的第一读地址译码模块,输入为源操作数1的读使能1和读地址1,当读使能1有效时(高电平),置与读地址对应的寄存器AR的读使能r_en0有效,并将其输出至第一读控制模块。
所述的第一读控制模块,输出为4位读使能r_en0、r_en1、r_en2、r_en3,全部连接至读数据互连网络。该模块根据输入读操作1精度标志位和读使能1,决定AR下面相邻的寄存器的读使能是否有效;如果读操作1的精度标志位为双精度,则将寄存器阵列中AR的下一个寄存器(AR的地址加1)的读使能r_en1置有效(高电平);如果读操作的精度标志位为四精度,则将寄存器阵列中AR的下三个寄存器(AR的地址加1,加2,加3对应的三个寄存器)的读使能r_en1、r_en2、r_en3全部置有效(高电平),其余只保持AR的读使能r_en0有效。
所述的第二读地址译码模块,输入为源操作数2的读使能2和读地址2,当读使能2有效时(高电平),置与读地址对应的寄存器AR的读使能r_en0有效,并将其输出至写读控制模块2。
所述的第二读控制模块,输出为4位读使能r_en0、r_en1、r_en2、r_en3,全部连接至读数据互连网络。该模块根据输入读操作2精度标志位和读使能2,决定AR下面相邻的寄存器的读使能是否有效;如果读操作2的精度标志位为双精度,则将寄存器阵列中AR的下一个寄存器(AR的地址加1)的读使能r_en1置有效(高电平);如果读操作的精度标志位为四精度,则将寄存器阵列中AR的下三个寄存器(AR的地址加1,加2,加3对应的三个寄存器)的读使能r_en1、r_en2、r_en3全部置有效(高电平),其余只保持AR的读使能r_en0有效。
所述读数据互连网络,输入为寄存器阵列的m个32位的输出、第二读控制模块的四位读使能,根据上述输入信号生成1个128位的数据进行输出;
输入为寄存器阵列的m个32位的输出,第一读控制模块的四位读使能,根据上述输入信号,生成1个128位的数据进行输出。
如图4所示,所述的读数据互连网络输出的128位的数据是由从低到高的a、b、c、d四组32位数据组成,a组的读使能对应读控制模块产生的r_en0,b组的读使能对应读控制模块产生的r_en1,c组的读使能对应读控制模块产生的r_en2,d组的读使能对应读控制模块产生的r_en3,若a、b、c、d中任一组的读使能有效,则该组数据为对应寄存器的数据输出,否则该组对应的数据为32位的0。
基于本发明实现的三端口浮点寄存器文件已经应用在一款SPARCV8架构的处理器中。相对于基本单元库的半定制设计方法,本发明使设计者根据处理器架构的要求,自主控制寄存器阵列的大小,避免了单元库中SRAM硬件资源的浪费;本发明不需要改变处理器任何控制逻辑,仅需处理器给出寄存器文件读写操作时的精度标志位,控制较为简单;本发明三端口浮点寄存器文件,可以使处理器在单周期内完成双、四精度浮点数据的读取和回写,效率较高,提高了处理器性能。
Claims (6)
1.一种面向RISC处理器的三端口浮点寄存器文件,其特征在于,包括:
写地址译码模块,输入为寄存器文件写使能和写地址,当写使能有效时,置与写地址对应的寄存器AR的写使能w_en有效,并将其分别输出至写控制模块和写数据互连网络;
写控制模块,根据输入的写使能w_en和端口的输入写操作精度标志位,决定寄存器AR下面相邻的寄存器的写使能是否有效;输出m位写使能至寄存器阵列中m个寄存器的写使能端;
写数据互连网络,在写使能w_en控制下,将输入的寄存器文件128位写数据从低位到高位,以32位一组分为a、b、c、d四组;输出为m个32位的数据,分别连接至寄存器阵列中m个寄存器的数据输入端:将a组连接到寄存器AR的数据输入端datai;将b、c、d三组分别依次连接至AR下面相邻的三个寄存器的数据输入端datai,除a、b、c、d四组之外其余m-4组均为0;
寄存器阵列,为线性编址的一维寄存器阵列,大小为m×32,阵列的宽等于浮点寄存器的位宽,阵列的深度m等于浮点寄存器的个数,阵列中每一个寄存器有写使能,其每个寄存器的写使能和数据输入端分别来自写控制模块和写数据互连网络,寄存器阵列有m个32位输出,全部连接至读数据互连网络;当某个寄存器写使能有效时,其输入的数据在时钟上升沿写入该寄存器,阵列中寄存器的输出恒有效;
第一读地址译码模块,输入为源操作数1的读使能1和读地址1,当读使能1有效时,置与读地址1对应的寄存器AR的读使能r_en0有效,并将其输出至第一读控制模块;
第一读控制模块,输出为4位读使能r_en0、r_en1、r_en2、r_en3,全部连接至读数据互连网络;该模块根据输入读操作1精度标志位和读使能1,决定AR下面相邻的寄存器的读使能是否有效;
第二读地址译码模块,输入为源操作数2的读使能2和读地址2,当读使能2有效时,置与读地址2对应的寄存器AR的读使能r_en0有效,并将其输出至第二读控制模块;
第二读控制模块,输出为4位读使能r_en0、r_en1、r_en2、r_en3,全部连接至读数据互连网络;该模块根据输入读操作2精度标志位和读使能2,决定AR下面相邻的寄存器的读使能是否有效;
读数据互连网络,根据寄存器阵列的m个32位的输出和第二读控制模块的四位读使能的信号,生成1个128位的数据进行输出;
根据寄存器阵列的m个32位的输出和第一读控制模块的四位读使能的信号,生成1个128位的数据进行输出。
2.如权利要求1所述的面向RISC处理器的三端口浮点寄存器文件,其特征在于,所述的写控制模块,根据写使能w_en和端口的输入写操作精度标志位进行如下判断:
如果写操作的精度标志位为双精度,则将寄存器阵列中AR的下一个寄存器的写使能w_en置有效;
如果写操作的精度标志位为四精度,则将寄存器阵列中AR的下三个寄存器的写使能w_en全部置有效,即高电平;
如果写操作的精度标志位为单精度,只保持AR的写使能w_en有效。
3.如权利要求1所述的面向RISC处理器的三端口浮点寄存器文件,其特征在于,所述的第一读控制模块进行以下判断:
如果读操作1的精度标志位为双精度,则将寄存器阵列中AR的下一个寄存器的读使能r_en1置有效;
如果读操作1的精度标志位为四精度,则将寄存器阵列中AR的下三个寄存器的读使能r_en1、r_en2、r_en3全部置有效;
如果读操作1的精度标志位为单精度,只保持AR的读使能r_en0有效。
4.如权利要求1所述的面向RISC处理器的三端口浮点寄存器文件,其特征在于,所述的第二读控制模块进行以下判断:
如果读操作2的精度标志位为双精度,则将寄存器阵列中AR的下一个寄存器的读使能r_en1置有效;
如果读操作2的精度标志位为四精度,则将寄存器阵列中AR的下三个寄存器的读使能r_en1、r_en2、r_en3全部置有效;
如果读操作2的精度标志位为单精度,只保持AR的读使能r_en0有效。
5.如权利要求1所述的面向RISC处理器的三端口浮点寄存器文件,其特征在于,所述的寄存器阵列对m个32位寄存器实行线性编址,构成一维寄存器阵列,地址范围0~m-1。
6.如权利要求1所述的面向RISC处理器的三端口浮点寄存器文件,其特征在于,所述的读数据互连网络输出的128位的数据是由从低到高的a、b、c、d四组32位数据组成,a组的读使能对应读控制模块产生的r_en0,b组的读使能对应读控制模块产生的r_en1,c组的读使能对应读控制模块产生的r_en2,d组的读使能对应读控制模块产生的r_en3,若a、b、c、d中任一组的读使能有效,则该组数据为对应寄存器的数据输出,否则该组对应的数据为32位的0。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410206420.5A CN103984524B (zh) | 2014-05-15 | 2014-05-15 | 一种面向risc处理器的三端口浮点寄存器文件 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410206420.5A CN103984524B (zh) | 2014-05-15 | 2014-05-15 | 一种面向risc处理器的三端口浮点寄存器文件 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103984524A CN103984524A (zh) | 2014-08-13 |
CN103984524B true CN103984524B (zh) | 2016-07-06 |
Family
ID=51276518
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410206420.5A Active CN103984524B (zh) | 2014-05-15 | 2014-05-15 | 一种面向risc处理器的三端口浮点寄存器文件 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103984524B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111683077B (zh) * | 2020-06-02 | 2021-05-04 | 硅谷数模(苏州)半导体有限公司 | 虚拟现实设备及数据的处理方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5771368A (en) * | 1990-10-29 | 1998-06-23 | Sun Microsystems, Inc. | Memory addressing scheme for increasing the number of memory locations available in a computer for storing higher precision numbers |
CN1334525A (zh) * | 2000-06-30 | 2002-02-06 | 英特尔公司 | 用于校准的单指令多数据的通用寄存器文件结构 |
CN101539850A (zh) * | 2008-03-21 | 2009-09-23 | 富士通株式会社 | 单精度浮点数据存储方法和处理器 |
CN101930356A (zh) * | 2010-08-24 | 2010-12-29 | 中国航天科技集团公司第九研究院第七七一研究所 | 用于浮点协处理器的寄存器文件分组编址、读写控制方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6343356B1 (en) * | 1998-10-09 | 2002-01-29 | Bops, Inc. | Methods and apparatus for dynamic instruction controlled reconfiguration register file with extended precision |
JP3697711B2 (ja) * | 2001-07-04 | 2005-09-21 | 日本電気株式会社 | Ppp終端装置、ネットワーク装置及びlcpエコー要求応答方法 |
-
2014
- 2014-05-15 CN CN201410206420.5A patent/CN103984524B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5771368A (en) * | 1990-10-29 | 1998-06-23 | Sun Microsystems, Inc. | Memory addressing scheme for increasing the number of memory locations available in a computer for storing higher precision numbers |
CN1334525A (zh) * | 2000-06-30 | 2002-02-06 | 英特尔公司 | 用于校准的单指令多数据的通用寄存器文件结构 |
CN101539850A (zh) * | 2008-03-21 | 2009-09-23 | 富士通株式会社 | 单精度浮点数据存储方法和处理器 |
CN101930356A (zh) * | 2010-08-24 | 2010-12-29 | 中国航天科技集团公司第九研究院第七七一研究所 | 用于浮点协处理器的寄存器文件分组编址、读写控制方法 |
Also Published As
Publication number | Publication date |
---|---|
CN103984524A (zh) | 2014-08-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2668576B1 (en) | State grouping for element utilization | |
CN102541774B (zh) | 多粒度并行存储系统与存储器 | |
CN111433758A (zh) | 可编程运算与控制芯片、设计方法及其装置 | |
CN102541749B (zh) | 多粒度并行存储系统 | |
CN111124999B (zh) | 一种支持存储内计算的双模计算机架构 | |
CN108388527A (zh) | 直接存储器存取引擎及其方法 | |
Sadredini et al. | eAP: A scalable and efficient in-memory accelerator for automata processing | |
CN111488963B (zh) | 神经网络计算装置和方法 | |
CN116822600A (zh) | 一种基于risc-v架构的神经网络搜索芯片 | |
CN112232517B (zh) | 一种人工智能加速引擎和人工智能处理器 | |
CN101930355B (zh) | 实现寄存器文件分组编址、读写控制方法的寄存器电路 | |
CN109614145A (zh) | 一种处理器核心结构及数据访存方法 | |
CN116432765A (zh) | 一种基于risc-v的后量子密码算法专用处理器 | |
CN103984524B (zh) | 一种面向risc处理器的三端口浮点寄存器文件 | |
CN106133838B (zh) | 一种可扩展可配置的fpga存储结构和fpga器件 | |
CN101930356B (zh) | 用于浮点协处理器的寄存器文件分组编址、读写控制方法 | |
US20070067380A2 (en) | Floating Point Intensive Reconfigurable Computing System for Iterative Applications | |
Gan et al. | Solving mesoscale atmospheric dynamics using a reconfigurable dataflow architecture | |
WO2016063667A1 (ja) | 再構成可能デバイス | |
CN117271953A (zh) | 一种用于优化快速傅里叶变换的存内计算加速电路及方法 | |
CN102289424B (zh) | 一种动态可重构阵列处理器的构令流工作方法 | |
CN110119806A (zh) | 基于fpga实现人工神经网络的方法和装置 | |
CN112486904B (zh) | 可重构处理单元阵列的寄存器堆设计方法及装置 | |
Winkler et al. | FPGA processing of decision tree ensembles stored in external DRAM | |
CN102622318B (zh) | 一种存储器控制电路及其控制的向量数据寻址方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |