[go: up one dir, main page]

CN1561478A - 用于有效的混和精度dsp的分割乘法器 - Google Patents

用于有效的混和精度dsp的分割乘法器 Download PDF

Info

Publication number
CN1561478A
CN1561478A CNA028193202A CN02819320A CN1561478A CN 1561478 A CN1561478 A CN 1561478A CN A028193202 A CNA028193202 A CN A028193202A CN 02819320 A CN02819320 A CN 02819320A CN 1561478 A CN1561478 A CN 1561478A
Authority
CN
China
Prior art keywords
multiplier
circuit
compensation vector
totalizer
multiplication
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA028193202A
Other languages
English (en)
Inventor
G·F·布尔恩斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of CN1561478A publication Critical patent/CN1561478A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/38Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
    • G06F7/48Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
    • G06F7/52Multiplying; Dividing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/38Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
    • G06F7/48Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
    • G06F7/52Multiplying; Dividing
    • G06F7/523Multiplying only
    • G06F7/53Multiplying only in parallel-parallel fashion, i.e. both operands being entered in parallel
    • G06F7/5324Multiplying only in parallel-parallel fashion, i.e. both operands being entered in parallel partitioned, i.e. using repetitively a smaller parallel parallel multiplier or using an array of such smaller multipliers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2207/00Indexing scheme relating to methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F2207/38Indexing scheme relating to groups G06F7/38 - G06F7/575
    • G06F2207/3804Details
    • G06F2207/3808Details concerning the type of numbers or the way they are handled
    • G06F2207/3812Devices capable of handling different types of numbers
    • G06F2207/382Reconfigurable for different fixed word lengths
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2207/00Indexing scheme relating to methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F2207/38Indexing scheme relating to groups G06F7/38 - G06F7/575
    • G06F2207/3804Details
    • G06F2207/3808Details concerning the type of numbers or the way they are handled
    • G06F2207/3828Multigauge devices, i.e. capable of handling packed numbers without unpacking them

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Complex Calculations (AREA)

Abstract

给出了一种方法和结构,可利用该方法和结构来获得用于乘法资源有效的子字并行。在一个优选实施例中给出了一个双二元补码乘法器,这样n位操作数B可以被分割,并且该操作数B的每一部分并行地与另一操作数A相乘。其中间乘积和补偿向量在加法器中组合,以校正来自该乘法器的二元补码子积的任何错误负号,处理分割操作数B的最低有效位或者较低的p位,或者说B[p-1:0],其中p=n/2。补偿向量C是使用简单电路从A和B操作数中获得的。该技术可以被轻易扩展到3个或者更多个并行乘法器,在其上可分割n位操作数D,并且并行地与操作数A相乘。以和双二元补码乘法器实施例相似的方式,补偿向量C’可以从操作数D和A中相似地获得。

Description

用于有效的混和精度DSP的分割乘法器
技术领域
本发明涉及数字信号处理器(“DSP”),并且更具体地涉及在数字信号处理ASIC实施方案中优化乘法运算。
发明背景
众所周知,对于混和了信号处理变量的定点精度的算法实施方案来说,可编程数字信号处理系统在资源和功耗方面的效率都很低。这种低效是因为需要使运算精度不同的所有共享硬件都适应最大的精度而造成的。换而言之,共享的硬件必须支持最大的必要精度。因而,当使用这种硬件来执行精度要求较低的运算时,会导致低效。
在固定的ASIC实施方案中,经常使精度最小化,以便提高硬件效率。最普遍的例子是用于数字地面电视接收(“ATSC8-VSB”)应用之残留边带的判决反馈均衡器,其中数据运算数是由4位判决符号组成的。对于该均衡器的前馈部分使用完全的12位软符号精度。前馈均衡器通常由16位系数的64个前向抽头组成,而反馈均衡器通常由16位系数的128个抽头组成。因此,当在ASIC的硬件中进行优化时,反馈计算需要128个4×16的乘法,而前馈计算需要64个12×16的乘法。因而需要映射到不同乘法器。然而,如果均衡器被映射到共享硬件的可编程系统,则需要把包括128个4×16乘法在内的所有运算都映射到同一12×16乘法器,因为它是唯一可用的乘法器。后一种情形将引入128个映射实例,而这比固定的ASIC中的映射实例多三倍,在每个反馈乘法运算期间,实际上浪费了可用硬件中的三分之二。
理论上,为了弥补这样的低效率,在某种程度上可以利用算术和存储资源中的子字并行来弥补这种低效映射。子字并行允许并行地提取多个操作数并对之运算,并且取决于可用的并行算术资源。例如,如果共享硬件被设计成用于实施12×16个乘法,则很容易将其改成同时实现3个并行的4×16乘法。或者,对于涉及一个全精度12位字的完全的12×16乘法,将该字分割到3个4×16乘法器上,并组合它们的中间结果。然而,在本例中,如果字被组合到一个全精度运算中,则算数资源应当可以被组合成一个全精度运算。尽管对于存储器和诸如加法器的简单单元来说,对于资源精度的分割和组合都非常简单,但是对于二元补码乘法器(two’s complement multiplier)来说却十分困难。诸如Booth或者Baugh-Wooley的标准的双补码乘法器把出现在最左边(MSB)的非零比特或符号、位置解释为表示一个负数。因此,在两个或者三个二元补码乘法器中的宽操作数分布(如图2中的结构所示)无法产生正确乘积。
因而,在本领域中所需要的是一种能够使用共享硬件来有效地实现不同精度的二元补码乘法的装置。
进一步,还需要一种装置,用于在二元补码乘法中,当把较大操作数映射到多个较小的并行乘法器上时能够获得正确结果。
发明概述
本发明寻求通过提出一种用于实现二元补码乘法分割的方法和结构来弥补现有技术的上述缺陷。因而,利用本发明所提供的方法和结构,就可以获得用于乘法资源的有效的子字并行程度。
在优选实施例中提出了一种双二元补码乘法器,这样可以分割n比特操作数B,并且操作数B的每一部分并行地同另一操作数A相乘。在一个加法器中将中间乘积与补偿向量组合,以便校正来自该乘法器的二元补码子积的任何错误负号,处理分割操作数B的最低有效的p位或者较低的p位,或者B[p-1:0],其中p=n/2。该补偿向量C是利用简单电路从A和B操作数中获得的。
本发明的技术很容易扩展到3个或者多个并行乘法器,在这些乘法器上分割n位操作数D,并使其并行地和操作数A相乘。以类似于双二元补码乘法器实施例的方式从D和A操作数中获得补偿向量C’。
附图简介
图1示出了并行运算并且共享一个操作数的两个m乘p的二元补码乘法器;
图2将一个操作数分配到两个m乘p的双补码乘法器中并且在输出加法器中组合子积;
图3示出了依照本发明优选实施例对图2的传统结构的改进;
图4更详细地示出了图3的系统;以及
图5示出了依照本发明用户获得补偿向量的示例电路。
优选实施例详述
本发明讨论了用于实现分割二元补码乘法器的方法,以便为乘法资源提供有效的子字并行程度。作为示例,希望双乘法器的配置可以实现如图1所示的较低精度的两个并行运算。并且希望这些相同的乘法器能够支持一个全精度运算,如图2中所示。
对于以上讨论的VSB DFE实例,三个4×16乘法器阵列可以提供3个同时的乘法,或者一个12×16的乘法。因此,这种分割乘法器是实现资源和功耗有效的共享硬件的可编程资源的重要工具。
以下将就两个单独的二元补码乘法器的情形来讨论分割乘法器的实现方法。参照图1,两个m乘p的二元补码乘法器101和102使用单个共享的m位系数A来实现并行乘法,并行地将A同B和C相乘,产生B×A的乘积P1和C×A的乘积P0。这种乘法可用于以上讨论的情形中的两个较低精度的乘法。
图2示例了在两个乘法器上分割更高精度乘法的情形。图2示出了试图将单个n位操作数分布于两个相同的m×p乘法器201和202上,然后在输出加法器203中组合子积,从而组成乘积。在所描述的情形中,因为操作数B的第p-1位被解释为更低阶乘法器201中的二元补码符号位,因此不能得到正确的乘积。
正确的方法是如图3中所示的那样地、在两个乘法器上分割操作数B。在图3中,通过把补偿向量310和两个乘法子积320以及321一起添加到最终的乘积相加中来获得正确结果。该补偿向量是使用简单电路而从操作数A和B中获得的。在图5中描述了一个这样的电路例子。以下将就两个和三个乘法器的情形来解释操作数A和B以及补偿向量C之间的解析关系,并且也可以按照希望而容易地从这种情形扩展到更多的乘法器。
补偿向量可以用如下的方式添加到乘积上:(1)子积组合加法器之后的附加加法器(未示出);(2)子积组合加法器303中的附加端口(图3所示的实施方式);或者(3)每一个二元补码乘法器面板的一个附加行(未示出)。
进而,分割乘法器可以被实施为两个独立的二元补码乘法器面板(panel),其具有单个分割加法器用以形成最终的结果。通过利用任意一种所述的设计选择,在此所示的分割乘法器结构都不会产生明显的门延时损失。
对于VSB DFE中所期望的3到1乘法器情形,如下所述地类似得出,由于两个乘法器的情形可以确定用于将这3个二元补码乘法器合并为一个组合乘法器所需的补偿向量。为了示例的目的,接下来描述用于将两个单独的乘法器合并为一个而获得补偿向量的方式。
在双补码格式中的操作数被表示如下:
A = - a m - 1 2 m - 1 + Σ i = 0 m - i a i 2 i
等式1
注意最高有效位(符号)是负值。
m乘n个乘数am和bn的乘积被表示为:
P ab = [ - a m - 1 2 m - 1 + Σ i = 0 m - 2 a i 2 i ] × [ - b n - 1 2 n - 1 + Σ j = 0 n - 2 b j 2 j ]
= a m - 1 b n - 1 2 m + n - 2 - a m - 1 Σ j = 0 n - 2 b j 2 m + j - 1 - b n - 1 Σ i = 0 m - 2 a i 2 m + i - 1 + Σ i = 0 m - 2 Σ j = 0 n - 2 a i b j 2 i + j
= ( 1 ) + ( 2 ) + ( 3 ) + ( 4 )
等式2
下面解释分割的n位乘数B,低阶乘法器中的双m乘p的补码乘法器将该段的最高有效位解释为符号位,如下:
B = - b n - 1 2 n - 1 + Σ j = p n - 2 b j 2 j + Σ k = 0 p - 1 b k 2 k ⇒ - b n - 1 2 n - 1 + Σ j = p n - 2 b j 2 j - b p - 1 2 p - 1 + Σ k = 0 p - 2 b k 2 k
等式3
用3来置换2得到等式4,如下:
P ab ′ = [ - a m - 1 2 m - 1 + Σ i = 0 m - 2 a i 2 i ] × [ - b n - 1 2 n - 1 + Σ j = p n - 2 b j 2 j - b p - 1 2 p - 1 + Σ k = 0 p - 2 b k 2 k ]
= a m - 1 b n - 1 2 m + n - 2
- a m - 1 { Σ j = p n - 2 b j 2 m + j - 1 - b p - 1 2 m + p - 2 + Σ j = 0 p - 2 b k 2 m + j - 1 }
- b n - 1 Σ i = 0 m - 2 a i 2 n + i - 1
+ Σ i = 0 m - 2 Σ j = p n - 2 a i b j 2 i + j + Σ i = 0 m - 2 Σ j = 0 p - 2 a i b j 2 i + j - b p - 1 Σ i = 0 m - 2 a i 2 p + i - 1
等式4
比较4与2,可以得到补偿项,如等式5中所示:
P ab ′ = ( 1 ) + ( 3 )
+ ( 2 ) + 2 a m - 1 b p - 1 2 m + p - 2
+ ( 4 ) - 2 b p - 1 Σ i = 0 m - 2 a i 2 p + i - 1
= P ab + a m - 1 b p - 1 2 m + p - 1 - b p - 1 Σ i = 0 m - 2 a i 2 p + i
= P ab - compensation
等式5
其中的compensation(补偿)由等式6给出。
compensation = b p - 1 [ - a m - 1 2 m + p - 1 + Σ i = 0 m - 2 a i 2 p + i ]
等式6
如果乘数B的MSB(bp-1)等于0,则只是简单地等于0,或者说如果bp-1=0,则compensation=0。
使用正项来替换6中的负项可以获得
- a m - 1 2 m + p - 1 = a m - 1 { ( Σ m + p m + n - 2 2 i ) + 0 * 2 m + p - 1 + ( Σ 0 m + p - 2 2 i ) + 1 } .
= a m - 1 ( Σ m + p - 1 m + 1 - 2 2 i )
等式7
最后,补偿向量是符号扩展的A乘数,左移p位(子乘法器的宽度),如等式8所示。补偿向量只是被施加到非零的错误符号bp-1。因而,必须使用硬件对p-1位置上的非零位进行简单检查。如果该位是1,则补偿向量被添加到最终的加法器。
P ab = P ab ′ + b p - 1 { a m - 1 Σ m + p - 1 m + n - 2 2 i + Σ 0 m + p - 2 a i 2 p + i }
等式8
图4因而示出了本发明完整的两个加法器的实施方式,示出了(如前)两个乘法器401和402以及加法器。乘数B被分割到两个乘法器401和402上,在加法器403中,中间乘积411和412被加在一起获得正确的乘积450。如上所述,如果乘数B的第p-1位是0,则补偿向量也是0。
接下来,为了完整起见,给出了3个操作数情形下的补偿向量的取得方式。
B = - b n - 1 2 n - 1 + Σ j = p n - 2 b j 2 j + Σ k = 0 p - 1 b k 2 k + Σ l = 0 q - 1 b l 2 l
⇒ - b n - 1 2 n - 1 + Σ j = p n - 2 b j 2 j - b p - 1 2 p - 1 + Σ k = 0 p - 2 b k 2 k - b q - 1 2 q - 1 + Σ l = 0 q - 2 b l 2 l
等式9
使用和2路分割取得相似的方式,用以上的等式1乘以等式9来获得扩展乘积。比较该等式的12项得到合并的乘法器(等式2),以获得:
P ab ′ = ( 1 ) + ( 3 )
+ ( 2 ) + 2 a m - 1 b p - 1 2 m + p - 2 + 2 a m - 1 b q - 1 2 m + q - 2
+ ( 4 ) - 2 b p - 1 Σ i = 0 m - 2 a i 2 p + i - 1 - 2 b q - 1 Σ i = 0 m - 2 a i 2 q + i - 1
= P ab + a m - 1 b p - 1 2 m + p - 1 - b p - 1 Σ i = 0 m - 2 a i 2 p + i + a m - 1 b q - 1 2 m + q - 1 - b q - 1 Σ i = 0 m - 2 a i 2 q + i
= P ab - compensation ( p ) - compensation ( q )
等式10
其中对于每个补偿项:
compensation ( x ) = b x - 1 [ - a m - 1 2 m + x - 1 + Σ i = 0 m - 2 a i 2 x + i ]
= b x - 1 { a m - 1 Σ m + x - 1 m + n - 2 2 i + Σ 0 m + x - 2 a i 2 x + i }
= b x - 1 2 x sext ( A )
等式11
一般来说,为了为每个操作数在二元补码乘法器面板中引入分割,我们必须增加一个校正项(等式11)到来自每一个面板的部分和的相加中。该校正项只是正交于该分割的乘数(操作数不被分割),经过符号扩展、在分割的操作数中与错误符号位相乘,然后移位,使得校正值的LSB被添加到由面板的上半部分所引入的部分和中。这种分割可以被分别沿每个操作数引入,从而允许乘法器的任意划分。操作数的每个分割都需要一个补偿向量,以用于校正最后乘积。
一般来说,沿着一个轴,对于乘法器的每个划分都有一个补偿向量。例如,如果每个乘数被分割一次(构成4个面板的乘法器),则需要两个补偿向量。
尽管以上描述了本发明的优选实施例,但是本领域技术人员可以利用各种修改和变化,诸如,将本发明扩展为在许多乘法器上分割乘数,因而允许在同样的共享硬件中以各种级别的精度来实现乘法。此外,也可以很容易地实现把补偿向量加到最终加法器中的该示例方法的变体的使用。这些修改被预定由附加的权利要求所覆盖。

Claims (16)

1.一种利用子字并行来实现二元补码乘法的方法,包括:
在多个乘法器(401,402)之间分割第一操作数B,并且将它们中的每一个与第二乘数A相乘;以及
把中间乘积(411,412)和补偿向量(410)相加(403)以获得最终乘积。
2.权利要求1的方法,其中乘法器(401,402)具有相等的宽度。
3.权利要求2的方法,其中补偿向量(410)是:
零,其前提是如果没有错误符号位被引入到该分割操作数B的给定片断的MSB;以及
符号扩展的第二乘数A,其左移了该较低分割乘法器(410)的宽度。
4.权利要求1的方法,其中补偿向量按照以下方式之一添加:
不同于中间乘积相加的其他加法;
与中间乘积相加(403)同时;或者
与并行乘法同时。
5.权利要求1-4中任意一个的方法,该方法被用于在相同的共享硬件上实施不同精度的乘法。
6.权利要求5的方法,其中乘法器(401,402)的数目是2或者3。
7. 一种能够实现多精度二元补码乘法的集成电路,包括:
两个子乘法器(401,402);
加法器(403),以及
用于产生补偿向量的电路(图5)。
8.权利要求7的电路,还附加包括一个用于测试子乘法器的乘数的MSB中的非零符号位的电路。
9.权利要求8的电路,其中附加的电路控制补偿向量的值。
10.权利要求7-9中任意一个的电路,其中补偿向量(410)通过以下方式之一添加:
不同于中间乘积加法器的附加加法器;
中间乘积加法器(403)中的附加端口;或者
在二元补码乘法面板中的附加行。
11.一种能够实现多精度二元补码乘法的集成电路,包括:
N个子乘法器(401,402);
加法器(403);以及
用于产生补偿向量的电路(图5)。
12.权利要求11的电路,还附加包括用于测试每个子乘法器(401)的一个乘数的MSB中的非零符号位的电路。
13.权利要求12的电路,其中附加的电路控制补偿向量的值。
14.权利要求11-13中任意一个的电路,其中补偿向量通过以下方式之一添加:
不同于中间乘积加法器的附加加法器;
中间乘积加法器(403)中的附加端口;或者
在二元补码乘法面板中的附加行。
15.权利要求14的电路,其中沿一个轴对于该乘法器的每一分区都有一个补偿向量(410)。
16.权利要求5的方法,其中沿一个轴对于该乘法器的每一分区都有一个补偿向量(410)。
CNA028193202A 2001-10-01 2002-09-30 用于有效的混和精度dsp的分割乘法器 Pending CN1561478A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/968,120 US20030065699A1 (en) 2001-10-01 2001-10-01 Split multiplier for efficient mixed-precision DSP
US09/968,120 2001-10-01

Publications (1)

Publication Number Publication Date
CN1561478A true CN1561478A (zh) 2005-01-05

Family

ID=25513763

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA028193202A Pending CN1561478A (zh) 2001-10-01 2002-09-30 用于有效的混和精度dsp的分割乘法器

Country Status (6)

Country Link
US (1) US20030065699A1 (zh)
EP (1) EP1454229A2 (zh)
JP (1) JP2005504389A (zh)
KR (1) KR20040039470A (zh)
CN (1) CN1561478A (zh)
WO (1) WO2003029954A2 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110780845A (zh) * 2019-10-17 2020-02-11 浙江大学 一种用于量化卷积神经网络的可配置近似乘法器及其实现方法
RU2753184C1 (ru) * 2020-12-26 2021-08-12 Акционерное общество Научно-производственный центр «Электронные вычислительно-информационные системы» (АО НПЦ «ЭЛВИС») Параметризуемый однотактный умножитель двоичных чисел с фиксированной точкой в прямом и дополнительном коде

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7366826B2 (en) * 2004-12-16 2008-04-29 Sandisk Corporation Non-volatile memory and method with multi-stream update tracking
US7386655B2 (en) 2004-12-16 2008-06-10 Sandisk Corporation Non-volatile memory and method with improved indexing for scratch pad and update blocks
US7412560B2 (en) * 2004-12-16 2008-08-12 Sandisk Corporation Non-volatile memory and method with multi-stream updating
US8073892B2 (en) * 2005-12-30 2011-12-06 Intel Corporation Cryptographic system, method and multiplier
US8650231B1 (en) 2007-01-22 2014-02-11 Altera Corporation Configuring floating point operations in a programmable device
US8214418B2 (en) * 2007-11-20 2012-07-03 Harris Corporation Method for combining binary numbers in environments having limited bit widths and apparatus therefor
US8706790B1 (en) * 2009-03-03 2014-04-22 Altera Corporation Implementing mixed-precision floating-point operations in a programmable integrated circuit device
US8645449B1 (en) 2009-03-03 2014-02-04 Altera Corporation Combined floating point adder and subtractor
US8918446B2 (en) * 2010-12-14 2014-12-23 Intel Corporation Reducing power consumption in multi-precision floating point multipliers
US9600278B1 (en) 2011-05-09 2017-03-21 Altera Corporation Programmable device using fixed and configurable logic to implement recursive trees
US9098332B1 (en) 2012-06-01 2015-08-04 Altera Corporation Specialized processing block with fixed- and floating-point structures
US8996600B1 (en) 2012-08-03 2015-03-31 Altera Corporation Specialized processing block for implementing floating-point multiplier with subnormal operation support
US9189200B1 (en) 2013-03-14 2015-11-17 Altera Corporation Multiple-precision processing block in a programmable integrated circuit device
US9348795B1 (en) 2013-07-03 2016-05-24 Altera Corporation Programmable device using fixed and configurable logic to implement floating-point rounding
US9933998B2 (en) * 2013-12-02 2018-04-03 Kuo-Tseng Tseng Methods and apparatuses for performing multiplication
US9875083B2 (en) 2014-08-05 2018-01-23 Imagination Technologies Limited Performing a comparison computation in a computer system
US9684488B2 (en) 2015-03-26 2017-06-20 Altera Corporation Combined adder and pre-adder for high-radix multiplier circuit
CN109815456A (zh) * 2019-02-13 2019-05-28 北京航空航天大学 一种基于字符对编码的词向量存储空间压缩的方法
CN113408716A (zh) * 2020-03-17 2021-09-17 安徽寒武纪信息科技有限公司 计算装置、方法、板卡和计算机可读存储介质
CN113408717A (zh) * 2020-03-17 2021-09-17 安徽寒武纪信息科技有限公司 计算装置、方法、板卡和计算机可读存储介质
KR102762717B1 (ko) * 2023-04-07 2025-02-07 한국과학기술원 범용 기계 학습 가속을 위한 혼합 정밀도 벡터 프로세서 시스템

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU573246B2 (en) * 1983-08-24 1988-06-02 Amdahl Corporation Signed multiplier
US4910701A (en) * 1987-09-24 1990-03-20 Advanced Micro Devices Split array binary multiplication
JPH04367933A (ja) * 1991-06-17 1992-12-21 Oki Electric Ind Co Ltd 倍精度乗算方法
JPH0720778A (ja) * 1993-07-02 1995-01-24 Fujitsu Ltd 剰余計算装置、テーブル作成装置および乗算剰余計算装置
US5446651A (en) * 1993-11-30 1995-08-29 Texas Instruments Incorporated Split multiply operation
US6223198B1 (en) * 1998-08-14 2001-04-24 Advanced Micro Devices, Inc. Method and apparatus for multi-function arithmetic
US6421698B1 (en) * 1998-11-04 2002-07-16 Teleman Multimedia, Inc. Multipurpose processor for motion estimation, pixel processing, and general processing
US6523055B1 (en) * 1999-01-20 2003-02-18 Lsi Logic Corporation Circuit and method for multiplying and accumulating the sum of two products in a single cycle

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110780845A (zh) * 2019-10-17 2020-02-11 浙江大学 一种用于量化卷积神经网络的可配置近似乘法器及其实现方法
RU2753184C1 (ru) * 2020-12-26 2021-08-12 Акционерное общество Научно-производственный центр «Электронные вычислительно-информационные системы» (АО НПЦ «ЭЛВИС») Параметризуемый однотактный умножитель двоичных чисел с фиксированной точкой в прямом и дополнительном коде

Also Published As

Publication number Publication date
EP1454229A2 (en) 2004-09-08
WO2003029954A2 (en) 2003-04-10
JP2005504389A (ja) 2005-02-10
KR20040039470A (ko) 2004-05-10
WO2003029954A3 (en) 2004-05-21
US20030065699A1 (en) 2003-04-03

Similar Documents

Publication Publication Date Title
CN1561478A (zh) 用于有效的混和精度dsp的分割乘法器
JP5215433B2 (ja) ブース乗算方法及びシステムのための電力効率の良い符号拡張
US20210349692A1 (en) Multiplier and multiplication method
JP3891997B2 (ja) 可変幅の符号付きおよび符号なしオペランドのためのモジュラ2進乗算器
CN1735880A (zh) 用于执行计算操作的系统、方法及设备
CN1117763A (zh) 整数除法运算装置及整数除法运算方法
CN117170623B (zh) 面向神经网络计算的多位宽重构近似张量乘加方法与系统
CN1781076A (zh) 组合多项式和自然乘法的乘法器架构
JPH0520030A (ja) 跳躍配列と修正形ワラストリーとを使用する並列乗算器
US20030163504A1 (en) Addition circuit for accumulating redundant binary numbers
WO1995005633A2 (en) Carry-look-ahead adder with reduces number of stages
CN1265281C (zh) 浮点数的对数运算方法和装置
CN102253822A (zh) 一种模(2n-3)乘法器
CN116090513A (zh) 矩阵乘法的运算方法及装置
CN103699729B (zh) 模乘法器
Mohan et al. Evaluation of Mixed-Radix Digit Computation Techniques for the Three Moduli RNS {2 n− 1, 2 n, 2 n+ 1− 1}
CN113672196B (zh) 一种基于单数字信号处理单元的双乘法计算装置和方法
Spagnolo et al. Efficient implementation of signed multipliers on FPGAs
US12197888B2 (en) Rank-based dot product circuitry
CN102955682B (zh) 一种模(23n-2n)乘法器
JP2645422B2 (ja) 浮動小数点演算処理装置
JPH05173761A (ja) 2進整数乗算器
JPH0793134A (ja) 乗算器
Sathiyanarayanan et al. A Hybrid Approximate Multiplier for Energy Efficient Image Processing
US5416733A (en) Apparatus for finding quotient in a digital system

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication