RU2677363C1 - Reconfigurable computing system - Google Patents
Reconfigurable computing system Download PDFInfo
- Publication number
- RU2677363C1 RU2677363C1 RU2018104582A RU2018104582A RU2677363C1 RU 2677363 C1 RU2677363 C1 RU 2677363C1 RU 2018104582 A RU2018104582 A RU 2018104582A RU 2018104582 A RU2018104582 A RU 2018104582A RU 2677363 C1 RU2677363 C1 RU 2677363C1
- Authority
- RU
- Russia
- Prior art keywords
- computing
- pci
- express
- group
- switch
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/16—Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
- G06F15/177—Initialisation or configuration control
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/76—Architectures of general purpose stored program computers
- G06F15/78—Architectures of general purpose stored program computers comprising a single central processing unit
- G06F15/7828—Architectures of general purpose stored program computers comprising a single central processing unit without memory
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/76—Architectures of general purpose stored program computers
- G06F15/78—Architectures of general purpose stored program computers comprising a single central processing unit
- G06F15/7867—Architectures of general purpose stored program computers comprising a single central processing unit with reconfigurable architecture
Landscapes
- Engineering & Computer Science (AREA)
- Computer Hardware Design (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Multi Processors (AREA)
- Stored Programmes (AREA)
Abstract
Description
Изобретение относится к области вычислительной техники, в частности к реконфигурируемым высокопроизводительным вычислительным системам кластерного типа, предназначенным для решения трудоемких задач, обработки больших информационных массивов и потоков, с использованием распараллеливания и конвейеризации вычислительных процессов.The invention relates to the field of computer technology, in particular to reconfigurable high-performance computing systems of a cluster type, designed to solve labor-intensive tasks, process large information arrays and streams using parallelization and pipelining of computing processes.
Реконфигурируемая вычислительная система кластерного типа представляет собой множество ведомых вычислительных узлов, работающих под управлением ведущего сервера, объединенных коммуникационной средой. Коммуникационная среда обеспечивает взаимодействие как между ведущим сервером и ведомыми вычислительными узлами, так и непосредственно между ведомыми вычислительными узлами.A reconfigurable cluster-type computing system is a set of slave computing nodes operating under the control of a master server, united by a communication environment. The communication environment provides interaction between the master server and the slave computing nodes, as well as directly between the slave computing nodes.
Вычислительные узлы реконфигурируемых вычислительных систем кластерного типа включают универсальное вычислительное средство (компьютер), реконфигурируемые вычислительные устройства, интерфейсы взаимодействия и средства их коммутации.Computing nodes of reconfigurable cluster-type computing systems include a universal computing tool (computer), reconfigurable computing devices, interaction interfaces, and means for switching them.
Реконфигурируемые вычислительные устройства - это подключаемые к универсальному вычислительному средству с помощью внешнего интерфейса ввода-вывода PCI-Express и работающие под его управлением высокопроизводительные вычислители, которые содержат ПЛИС и специализированные вычислительные процессоры, выполненные на заказных СБИС.Reconfigurable computing devices are those connected to the universal computing facility using an external PCI-Express I / O interface and operating under its control high-performance computers that contain FPGAs and specialized computing processors made on custom VLSI.
Реконфигурация - это процесс изменения взаимодействий в вычислительной системе программным способом, с целью организации различных схем последовательной (конвейерной), параллельной и/или последовательно-параллельной обработки данных внутри заданной группы вычислительных средств, для реализации требуемых алгоритмов обработки.Reconfiguration is a process of changing interactions in a computer system programmatically, with the aim of organizing various schemes of sequential (conveyor), parallel and / or sequentially parallel data processing within a given group of computing tools, to implement the required processing algorithms.
ПЛИС - это программируемые логические интегральные схемы, имеющие в своем составе большое количество логических и запоминающих элементов, которые могут динамически программироваться как устройства, предназначенные как для организации требуемых вычислений, так и для поддержки требуемых интерфейсов взаимодействия.FPGAs are programmable logic integrated circuits that incorporate a large number of logical and memory elements that can be dynamically programmed as devices designed to organize the required calculations, as well as to support the required interaction interfaces.
Заказные СБИС - это специализированные интегральные схемы, предназначенные для схемотехнической реализации конкретных трудоемких алгоритмов вычислительно сложных вариантных задач дискретной математики.Custom VLSIs are specialized integrated circuits designed for circuitry implementation of specific labor-intensive algorithms for computationally complex variant problems of discrete mathematics.
Известен реконфигурируемый вычислительный модуль (RU №168565 U1, МПК G06F 15/177, заявлено 21.11.2016, опубликовано 08.02.2017), который может быть использован в реконфигурируемых вычислительных блоках многопроцессорных вычислительных систем, содержащий внешний порт для обмена информацией, коммутатор PCI-Express, интерфейсную и N вычислительных ПЛИС, каждая из которых содержит высокоскоростной последовательный интерфейс PCI-Express, причем порты коммутатора PCI-Express соединены с внешними портами модуля и с интерфейсами PCI-Express интерфейсной ПЛИС и N вычислительных ПЛИС, группу из N вычислительных СБИС, причем каждая СБИС из N вычислительных СБИС соединена индивидуальными двунаправленными информационными шинами с соответствующими вычислительными ПЛИС, блок оперативного реконфигурирования памятей стартовых конфигураций вычислительных ПЛИС, соединенный с интерфейсной ПЛИС, каждая ПЛИС из группы N вычислительных ПЛИС соединена с соответствующими памятями стартовых конфигураций вычислительных ПЛИС, которые шиной оперативного реконфигурирования также соединены между собой и с блоком оперативного реконфигурирования памятей стартовых конфигураций вычислительных ПЛИС, блок контроля и управления питанием и блок мониторинга, соединенные двунаправленными шинами с интерфейсной ПЛИС, порт контроля и управления JTAG и память конфигурации интерфейсной ПЛИС, соединенные с блоком оперативного конфигурирования интерфейсной ПЛИС, причем интерфейсная ПЛИС соединена двунаправленной общей шиной с N вычислительными ПЛИС, каждая ПЛИС из группы N вычислительных ПЛИС и каждая СБИС из группы N вычислительных СБИС соединены двунаправленной шиной мониторинга с блоком мониторинга, блок синхронизации, соединенным двунаправленной шиной с интерфейсной ПЛИС, причем каждая СБИС из группы N вычислительных СБИС соединена шиной синхронизации с блоком синхронизации.Known reconfigurable computing module (RU No. 168565 U1, IPC G06F 15/177, announced 11/21/2016, published 02/08/2017), which can be used in reconfigurable computing units of multiprocessor computing systems, containing an external port for exchanging information, PCI-Express switch , interface and N computing FPGAs, each of which contains a high-speed serial PCI-Express interface, and the ports of the PCI-Express switch are connected to the external ports of the module and to the PCI-Express interfaces of the interface FPGA and N computing FPGAs , a group of N computational VLSIs, each VLSI of N computational VLSIs connected by individual bi-directional data buses to the corresponding computing FPGAs, an operational reconfiguration unit for memory starting configurations of computing FPGAs connected to the interface FPGAs, each FPGA from a group of N computing FPGAs connected to corresponding starting memories configurations of computing FPGAs, which are also interconnected with the operational reconfiguration bus and with the operational river block configuration memories of the starting configurations of the FPGAs, the power monitoring and control unit and the monitoring unit connected by bi-directional buses to the interface FPGA, the JTAG monitoring and control port and the interface FPGA configuration memory connected to the on-board FPGA configuration module, the interface FPGA connected by a bi-directional common bus to N computing FPGAs, each FPGA from the group N computing FPGAs and each VLSI from the group N computing VLSIs are connected by a bi-directional moni bus Oring with the monitoring unit, a synchronization unit coupled bidirectional bus interface to the FPGA, VLSI each group of N computers connected VLSI bus synchronization with the synchronization block.
Недостатками данного модуля являются невысокая средняя скорость обмена информацией вычислительных ПЛИС по внешнему порту и неравномерное энергопотребление модуля, в зависимости от характера решаемых им задач, при использовании данного модуля в многопользовательских (многозадачных) системах.The disadvantages of this module are the low average speed of information exchange of computing FPGAs on the external port and the uneven power consumption of the module, depending on the nature of the tasks it solves, when using this module in multi-user (multitasking) systems.
Причиной, препятствующей достижению указанного ниже технического результата, является распределение вычислительных ресурсов между пользователями реконфигурируемых вычислительных систем, построенных на базе данных модулей, при котором минимальной единицей ресурса для пользователя является вычислительный модуль в целом, состоящий из N вычислительных ПЛИС и N вычислительных СБИС, что связано с единой системой управления питанием, синхронизацией и оперативного реконфигурирования вычислительных ПЛИС, при которой все вычислительные ПЛИС и СБИС модуля могут работать в текущем временном интервале только над выполнением однотипных задач, которые могут требовать либо высокой интенсивности обмена, либо высокого энергопотребления.The reason that impedes the achievement of the technical result indicated below is the distribution of computing resources between users of reconfigurable computing systems built on the basis of modules, in which the minimum resource unit for the user is the computing module as a whole, consisting of N computing FPGAs and N computing VLSIs, which is associated with with a unified power management system, synchronization and operational reconfiguration of computing FPGAs, in which all computing submarines C and VLSI module can operate in the current time interval only over performing similar tasks that may require a high metabolic rate or high power consumption.
Наиболее близкой вычислительной системой того же назначения, к заявленному изобретению, по совокупности признаков, принятой за прототип, является реконфигурируемая вычислительная система (RU №156778 U1, МПК G06F 15/16, заявлено 10.04.2015, опубликовано 20.11.2015 Бюл. №32), содержащая ведущий сервер 2, соединенный по сетевому интерфейсу 3 с коммутатором EtherNet 1 управления вычислительной системы, который соединен по сетевым интерфейсам EtherNet 71, …, 7К с группой из К ведомых вычислительных узлов 41, …, 4К, каждый из которых содержит коммутатор PCI-Express 11, компьютер 8 и группу из N реконфигурируемых вычислительных устройств 131, …, 13N, каждое из которых содержит коммутатор PCI-Express 19, группу из М вычислительных ПЛИС 201, …, 20М, интерфейсную ПЛИС 22, блок конфигурирования и мониторинга 23, блок управления режимом коммутатора PCI-Express 30 и память 24 конфигураций ПЛИС, причем интерфейсная ПЛИС 22 соединена с блоком управления режимом коммутатора PCI-Express 30, памятью конфигураций ПЛИС 24 и блоком конфигурирования и мониторинга 23, который по общей шине конфигурирования и мониторинга вычислительных ПЛИС 25 соединен с группой из М вычислительных ПЛИС 201, …, 20М, а также каждый коммутатор PCI-Express 19 соединен с блоком управления режимом 30 коммутатора PCI-Express, интерфейсной ПЛИС 22 по высокоскоростному последовательному интерфейсу PCI-Express 17 и с вычислительными ПЛИС 201, …, 20M, по высокоскоростным последовательным интерфейсам PCI-Express 211, …, 21М.The closest computing system of the same purpose to the claimed invention, by the totality of features adopted as a prototype, is a reconfigurable computing system (RU No. 156778 U1, IPC G06F 15/16, announced April 10, 2015, published November 20, 2015 Bull. No. 32) containing a master server 2 connected via a
Недостатком данной вычислительной системы является невысокая вычислительная мощность при относительно высокой мощности энергопотребления при реализации трудоемких вычислительных алгоритмов.The disadvantage of this computing system is the low computing power with a relatively high power consumption when implementing laborious computational algorithms.
Причиной, препятствующей достижению указанного ниже технического результата, является то, что при реализации трудоемких вычислительных алгоритмов на вычислительных ПЛИС имеет место большой процент накладных расходов, что уменьшает эффективность использования вычислительных ресурсов, а также невысокие рабочие частоты выполнения операций, что связанно со спецификой внутренней структуры ПЛИС, на основе которых реализована данная реконфигурируемая вычислительная система.The reason that impedes the achievement of the technical result indicated below is that when implementing labor-intensive computational algorithms on computing FPGAs, there is a large percentage of overhead that reduces the efficiency of using computing resources, as well as low operating frequencies of operations, which is associated with the specifics of the internal structure of FPGAs on the basis of which this reconfigurable computing system is implemented.
Задача, на решение которой направлено предлагаемое изобретение, заключается в создании высокопроизводительной реконфигурируемой вычислительной системы.The problem to which the invention is directed, is to create a high-performance reconfigurable computing system.
Техническим результатом предлагаемого изобретения является повышение вычислительной мощности и снижение удельной мощности энергопотребления вычислительной системы.The technical result of the invention is to increase computing power and reduce the specific power consumption of a computer system.
Для решения данной задачи в реконфигурируемую вычислительную систему содержащую ведущий сервер 2 соединенный по сетевому интерфейсу 3 с коммутатором EtherNet 1 управления вычислительной системы, который соединен и по сетевым интерфейсам EtherNet 71, …, 7K с группой из K ведомых вычислительных узлов 41, …, 4К, каждый из которых содержит коммутатор PCI-Express 11, компьютер 8 и группу из N реконфигурируемых вычислительных устройств 131, …, 13N, каждое из которых содержит коммутатор PCI-Express 19, группу из М вычислительных ПЛИС 201, …, 20М, интерфейсную ПЛИС 22, блок конфигурирования и мониторинга 23, блок управления режимом коммутатора PCI-Express 30 и память 24 конфигураций ПЛИС, причем интерфейсная ПЛИС 22 соединена с блоком управления режимом коммутатора PCI-Express 30, памятью конфигураций ПЛИС 24 и блоком конфигурирования и мониторинга 23, который по общей шине конфигурирования и мониторинга вычислительных ПЛИС 25 соединен с группой из М вычислительных ПЛИС 201, …, 20М, а также каждый коммутатор PCI-Express 19 соединен с блоком управления режимом 30 коммутатора PCI-Express по шине управления 12, интерфейсной ПЛИС 22 по высокоскоростному последовательному интерфейсу PCI-Express 17 и с вычислительными ПЛИС 201, …, 20М, по высокоскоростным последовательным интерфейсам PCI-Express 211, …, 21М,To solve this problem, a reconfigurable computer system containing a master server 2 connected via a
дополнительно введены двухпортовая интерфейсная плата 5, коммутатор PCI-Express 31 объединения реконфигурируемых вычислительных устройств 131, …, 13N ведомых вычислительных узлов 41, …, 4К, в каждый из которых введена группа из N памятей состояния 91, …, 9N реконфигурируемых вычислительных устройств 131, …, 13N, в каждое из которых введены группа из М вычислительных СБИС 331, …, 33M, единый радиатор прямоугольной формы 27, установленный над вычислительными СБИС 331, …, 33M, группа из М блоков индивидуального мониторинга и управления 151, …, 15M и группа из М памятей стартовых конфигураций 351, …, 35M соответствующих вычислительных ПЛИС 201, …, 20М,additionally introduced a two-
причем в каждом ведомом вычислительном узле 41, …, 4К компьютер 8 подключен к соответствующему сетевому интерфейсу EtherNet 71, …, 7К, соединен с N памятями состояния 91, …, 9N реконфигурируемых вычислительных устройств 131, …, 13N и соединен высокоскоростным последовательным интерфейсом PCI-Express 10 с коммутатором PCI-Express 11, который группой из N высокоскоростных последовательных интерфейсов PCI-Express 161, …, 16N соединен с портами NT/US соответствующих коммутаторов PCI-Express 19 группы из N реконфигурируемых вычислительных устройств 131, …, 13N, в каждом из которых вычислительные ПЛИС 201, …, 20М подключены к соответствующим одноименным памятям 351, …, 35M конфигураций вычислительных ПЛИС по индивидуальным шинам 361, …, 36M реконфигурации вычислительных ПЛИС и по индивидуальным шинам 321, …, 32M оперативной реконфигурации памятей стартовых конфигураций, а также подключены к одноименным вычислительным СБИС 331, …, 33M по индивидуальным шинам обмена данными 341, …, 34M и по индивидуальным шинам управления мониторингом 261, …, 26M к индивидуальным блокам мониторинга 151, …, 15M, которые подключены к соответствующим вычислительным СБИС 331, …, 33M по шинам мониторинга 141, …, 14M,moreover, in each slave computing node 4 1 , ..., 4 K,
кроме того порты NT/DS/US коммутаторов PCI-Express 19 реконфигурируемых вычислительных устройств 131, …, 13N подключены к соответствующему интерфейсу из группы из N высокоскоростных последовательных интерфейсов объединения PCI-Express 281, …, 28N, которые объединены в K групп 291, …, 29K по N высокоскоростных последовательных интерфейсов объединения PCI-Express ведомых вычислительных устройств 41, …, 4К и подключены к соответствующим портам DS коммутатора PCI-Express 31, порт US которого подключен к порту DS двухпортовой интерфейсной платы 5 по высокоскоростному последовательному интерфейсу PCI-Express 18, а порт US двухпортовой интерфейсной платы 5 подключен по высокоскоростному последовательному интерфейсу PCI-Express 6 к ведущему серверу 2.in addition, the NT / DS / US ports of the PCI-
На фиг. 1 приведена функциональная схема предлагаемой реконфигурируемой вычислительной системы.In FIG. 1 shows a functional diagram of the proposed reconfigurable computing system.
На фиг. 1 и в тексте приняты следующие сокращения:In FIG. 1 and the following abbreviations are adopted in the text:
ВУ - вычислительный узел;VU - computing node;
РВУ - реконфигурируемое вычислительное устройство;RVU - reconfigurable computing device;
ИП - интерфейсная плата с шиной PCI-Express;IP - interface board with PCI-Express bus;
КП - компьютер с шиной PCI-Express на материнской плате;KP - a computer with a PCI-Express bus on the motherboard;
DS - выходной «прозрачный» порт коммутатора PCI-Express;DS - output "transparent" port of the PCI-Express switch;
US - входной «прозрачный» порт коммутатора PCI-Express;US - input "transparent" port of the PCI-Express switch;
NT - «непрозрачный» порт коммутатора PCI-Express;NT - “non-transparent” port of the PCI-Express switch;
К - количество ведомых ВУ вычислительной системы;To - the number of slave WU computing system;
N - количество реконфигурируемых вычислительных устройств в каждом ведомом ВУ;N is the number of reconfigurable computing devices in each slave slave;
М - количество вычислительных ПЛИС и вычислительных СБИС в каждом РВУ;M - the number of computing FPGAs and computing VLSI in each RVU;
i, j - счетные переменные.i, j are counting variables.
1 - коммутатор EtherNet управления вычислительной системы;1 - EtherNet control switch computing system;
2 - ведущий сервер вычислительной системы;2 - leading server computing system;
3 - сетевой интерфейс EtherNet между коммутатором управления EtherNet 1 и ведущим сервером 2;3 - EtherNet network interface between the EtherNet 1 management switch and master 2;
41, …, 4К - группа их К ведомых ВУ;4 1 , ..., 4 K - a group of them K slave WU;
5 - двухпортовая интерфейсная плата;5 - dual port interface board;
6 - высокоскоростной последовательный интерфейс PCI-Express между ведущим сервером 2 и ИП 5;6 - high-speed serial PCI-Express interface between the leading server 2 and
71, …, 7К - группа из К сетевых интерфейсов EtherNet между коммутатором управления EtherNet 1 и группой из К ведомых ВУ 41, …, 4К;7 1 , ..., 7 K - a group of K EtherNet network interfaces between the EtherNet 1 control switch and a group of K slave slaves 4 1 , ..., 4 K ;
8 - компьютер ведомых ВУ 41, …, 4К;8 - computer slave WU 4 1 , ..., 4 K ;
91, …, 9N - группа из N памятей состояния реконфигурируемых вычислительных устройств 131, …, 13N;9 1 , ..., 9 N is a group of N state memories of reconfigurable computing devices 13 1 , ..., 13 N ;
10 - высокоскоростной последовательный интерфейс PCI-Express между КП 8 ведомого ВУ и коммутатором 11;10 - high-speed serial PCI-Express interface between
11 - коммутатор PCI-Express ведомых ВУ 41, …, 4К;11 - PCI-Express switch slave VU 4 1 , ..., 4 K ;
12 - шина управления режимом коммутатора PCI-Express 19 в реконфигурируемых вычислительных устройствах 131, …, 13N;12 - PCI-Express 19 switch mode control bus in reconfigurable computing devices 13 1 , ..., 13 N ;
131, …, 13N - группа из N реконфигурируемых вычислительных устройств в ведомых ВУ 41, …, 4К;13 1 , ..., 13 N - a group of N reconfigurable computing devices in the slave WU 4 1 , ..., 4 K ;
141, …, 14M - группа из М шин мониторинга вычислительных СБИС 311, …, 31M;14 1 , ..., 14 M - a group of M buses for monitoring
151, …, 15M - группа из М индивидуальных блоков мониторинга вычислительных СБИС 311, …, 31M;15 1 , ..., 15 M - a group of M individual monitoring units for
161, …, 16N - группа из N высокоскоростных последовательных интерфейсов PCI-Express между коммутатором PCI-Express 11 и реконфигурируемыми вычислительными устройствами 131, …, 13N ведомых ВУ;16 1 , ..., 16 N - a group of N high-speed serial PCI-Express interfaces between the PCI-Express 11 switch and reconfigurable computing devices 13 1 , ..., 13 N slave slaves;
17 - высокоскоростной последовательный интерфейс PCI-Express между коммутатором PCI-Express 19 и интерфейсной ПЛИС 22 реконфигурируемых вычислительных устройств 131, …, 13N;17 - high-speed serial PCI-Express interface between the PCI-
18 - высокоскоростной последовательный интерфейс PCI-Express между ИП 5 и коммутатором PCI-Express 31;18 - high-speed serial PCI-Express interface between
19 - коммутатор PCI-Express реконфигурируемых вычислительных устройств 131, …, 13N; 201, …, 20M - группа из М вычислительных ПЛИС реконфигурируемых вычислительных устройств 131, …, 13N;19 - PCI-Express switchboard of reconfigurable computing devices 13 1 , ..., 13 N ; 20 1 , ..., 20 M - a group of M computing FPGAs of reconfigurable computing devices 13 1 , ..., 13 N ;
211, …, 21M - группа из М высокоскоростных последовательных интерфейсов PCI-Express между коммутатором PCI-Express 19 и вычислительными ПЛИС 201, …, 20M в реконфигурируемых вычислительных устройствах 131, …, 13N;21 1 , ..., 21 M is a group of M high-speed serial PCI-Express interfaces between the PCI-
22 - интерфейсная ПЛИС реконфигурируемых вычислительных устройств 131, …, 13N;22 - interface FPGA reconfigurable computing devices 13 1 , ..., 13 N ;
23 - блок конфигурирования и мониторинга реконфигурируемых вычислительных устройств 131, …, 13N;23 is a block configuration and monitoring reconfigurable computing devices 13 1 , ..., 13 N ;
24 - память конфигураций ПЛИС реконфигурируемых вычислительных устройств 131, …, 13N;24 - memory configurations FPGA reconfigurable computing devices 13 1 , ..., 13 N ;
25 - общая шина конфигурирования и мониторинга вычислительных ПЛИС реконфигурируемых вычислительных устройств 131, …, 13N;25 - a common bus for configuring and monitoring computing FPGAs of reconfigurable computing devices 13 1 , ..., 13 N ;
261, …, 26M - группа из М индивидуальных шин управления мониторингом;26 1 , ..., 26 M - a group of M individual monitoring control buses;
27 - единый радиатор прямоугольной формы, установленный над вычислительными СБИС 331, …, 33M;27 - a single radiator of a rectangular shape mounted above the computing VLSI 33 1 , ..., 33 M ;
281, …, 28N - группа из N высокоскоростных последовательных интерфейсов PCI-Express объединения реконфигурируемых вычислительных устройств 131, …, 13N;28 1 , ..., 28 N - a group of N high-speed serial PCI-Express interfaces combining reconfigurable computing devices 13 1 , ..., 13 N ;
291, …, 29K - K групп из N высокоскоростных последовательных интерфейсов объединения PCI-Express ведомых ВУ 41, …, 4K;29 1 , ..., 29 K - K groups of N high-speed serial interfaces for combining PCI-Express slaves WU 4 1 , ..., 4 K ;
30 - блок управления режимом коммутатора PCI-Express 19 в реконфигурируемых вычислительных устройствах 131, …, 13N;30 - control unit mode switch PCI-Express 19 in reconfigurable computing devices 13 1 , ..., 13 N ;
31 - коммутатор PCI-Express объединения реконфигурируемых вычислительных устройств 131, …, 13N ведомых вычислительных узлов 41, …, 4K по высокоскоростным последовательным интерфейсам PCI-Express;31 - PCI-Express switch for combining reconfigurable computing devices 13 1 , ..., 13 N slave computing nodes 4 1 , ..., 4 K via high-speed serial PCI-Express interfaces;
321, …, 32M - группа из М индивидуальных шин оперативной реконфигурации памятей стартовых конфигураций вычислительных ПЛИС 201, …, 20M;32 1 , ..., 32 M - a group of M individual buses for operational reconfiguration of the memory of the starting configurations of computing FPGAs 20 1 , ..., 20 M ;
331, …, 33M - группа из М вычислительных СБИС реконфигурируемых вычислительных устройств 131, …, 13N;33 1 , ..., 33 M - a group of M computing VLSI reconfigurable computing devices 13 1 , ..., 13 N ;
341, …, 34M - группа из М индивидуальных шин обмена данными одноименных вычислительных СБИС 331, …, 33M и вычислительных ПЛИС 201, …, 20M;34 1 , ..., 34 M - a group of M individual data buses of the same name computing VLSI 33 1 , ..., 33 M and computing FPGAs 20 1 , ..., 20 M ;
351, …, 35M - группа из М памятей конфигураций вычислительных ПЛИС 201, …, 20M в реконфигурируемых вычислительных устройствах 131, …, 13N;35 1 , ..., 35 M - a group of M memories of configurations of computing FPGAs 20 1 , ..., 20 M in reconfigurable computing devices 13 1 , ..., 13 N ;
361, …, 36M - группа из М индивидуальных шин реконфигурации вычислительных ПЛИС 201, …, 20M.36 1 , ..., 36 M - a group of M individual buses for reconfiguration of computing FPGAs 20 1 , ..., 20 M.
Предлагаемая реконфигурируемая вычислительная система содержит ведущий сервер 2, двухпортовую интерфейсную плату 5, группу из К ведомых ВУ 41, …, 4К, коммутатор EtherNet 1 управления вычислительной системы и коммутатор 31 PCI-Express объединения реконфигурируемых вычислительных устройств ведомых вычислительных узлов 41, …, 4K.The proposed reconfigurable computer system comprises a master server 2, a two-
Каждое из ведомых ВУ 41, …, 4К содержит компьютер ПК 8 с коммутатором PCI-Express 11 и группой из N памятей состояния 91, …, 9N на материнской плате, а также группу из N реконфигурируемых вычислительных устройств 131, …, 13N.Each of the slave slaves 4 1 , ..., 4 K contains a
Каждое из N реконфигурируемых вычислительных устройств 131, …, 13N содержит коммутатор PCI-Express 19, группу из М вычислительных ПЛИС 201, …, 20M, группу из М вычислительных СБИС 331, …, 33M, единый радиатор прямоугольной формы 27, установленный над вычислительными СБИС 331, …, 33M, интерфейсную ПЛИС 22, блок конфигурирования и мониторинга 23, блок 30 управления режимом коммутатора PCI-Express 19, память 24 конфигураций ПЛИС, группу из М блоков индивидуального мониторинга и управления 151, …, 15M и группу из М памятей стартовых конфигураций 351, …, 35M вычислительных ПЛИС 201, …, 20M.Each of N reconfigurable computing devices 13 1 , ..., 13 N contains a PCI-
Ведущий сервер 2 предназначен для организации управления потоками задач для ведомых ВУ 41, …, 4К через коммутатор EtherNet 1 управления вычислительной системы по сетевому интерфейсу EtherNet 3, загрузки операционных систем в КП 8 ведомых ВУ 41, …, 4К и организации управления ведомыми ВУ 41, …, 4К при решении трудоемких вычислительных задач, а также для организации мониторинга состояния технических средств вычислительной системы, управления включением и выключением питания КП 8 реконфигурируемых вычислительных устройств 131, …, 13N, сбора и анализа телеметрической информации о температурном режиме и режиме питания ведомых ВУ 41, …, 4К.The master server 2 is intended for the organization of task flow control for the slave WU 4 1 , ..., 4 K through the
Двухпортовая ИП 5 предназначена для обеспечения взаимодействия ведущего сервера 2 по высокоскоростному последовательному интерфейсу PCI-Express 18 с коммутатором PCI-Express 31, который предназначен для обеспечения взаимодействия как ведущего сервера 2 с КП 8 ведомых ВУ 41, …, 4К, так и управления взаимодействием КП 8 ведомых ВУ 41, …, 4К по высокоскоростным последовательным интерфейсам PCI-Express 291, …, 29К.The dual-
Ведомые ВУ 41, …, 4К предназначены для высокоскоростной обработки информации и решения трудоемких вычислительных задач.The driven VU 4 1 , ..., 4 K are designed for high-speed information processing and solving labor-intensive computational problems.
КП 8 ведомых ВУ 41, …, 4К предназначены для управления включением и выключением питания, организации сбора, анализа и записи в соответствующие памяти состояния 91, …, 9M реконфигурируемых вычислительных устройствах 131, …, 13N телеметрической информации о температурном режиме и режиме питания компонент, а также организации управления реконфигурируемыми вычислительными устройствами 131, …, 13N при решении трудоемких вычислительных задач и обеспечения обмена данными между с ведущим сервером 2 как по высокоскоростным последовательным интерфейсам PCI-Express 291, …, 29К, так и по сети EtherNet через коммутатор 1.
Коммутатор PCI-Express 11 предназначен для обеспечения взаимодействия по высокоскоростным последовательным интерфейсам PCI-Express 161, …, 16N между реконфигурируемыми вычислительными устройствами 131, …, 13N и с КП 8 по высокоскоростному последовательному интерфейсу PCI-Express 10.The PCI-
Реконфигурируемые вычислительные устройства 131, …, 13N ведомых ВУ 41, …, 4К предназначены для непосредственного решения трудоемких задач и обработки больших информационных массивов и потоков, с использованием распараллеливания и конвейеризации вычислительных процессов.Reconfigurable computing devices 13 1 , ..., 13 N slave VU 4 1 , ..., 4 K are intended for the direct solution of labor-intensive tasks and processing large information arrays and streams using parallelization and pipelining of computing processes.
Коммутатор PCI-Express 19 реконфигурируемых вычислительных устройств 131, …, 13N предназначен для организации обмена информацией интерфейсной ПЛИС 22 по высокоскоростному последовательному интерфейсу PCI-Express 17 и вычислительных ПЛИС 201, …, 20M по высокоскоростным последовательным интерфейсам PCI-Express 211, …, 21M между собой и по высокоскоростному последовательному интерфейсу PCI-Express 16 через коммутатор PCI-Express 11 с КП 8 ведомых ВУ с ведущим сервером 2.The PCI-
Вычислительные ПЛИС 201, …, 20M предназначены для осуществления высокопроизводительной предварительной обработки поступающих входных данных, последующей дообработки результатов работы вычислительных СБИС 331, …, 33M, а также обеспечивают обмен данными и результатами с вычислительными СБИС 331, …, 33M по индивидуальным шинам обмена данными 341, …, 34M, с индивидуальными блоками мониторинга 151, …, 15M, по индивидуальным шинам управления мониторингом 261, …, 26M, управляют питанием и настройкой рабочих частот вычислительных СБИС 331, …, 33M, осуществляют автореконфигурирование новой программой по индивидуальным шинам реконфигурации 361, …, 36M путем перепрограммирования из собственных памятей конфигураций 351, …, 35M. по индивидуальным шинам 321, …, 32M.Computing FPGAs 20 1 , ..., 20 M are designed for high-performance pre-processing of incoming input data, subsequent processing of the results of computational VLSI 33 1 , ..., 33 M , as well as providing data and results exchange with computational VLSI 33 1 , ..., 33 M on individual data exchange buses 34 1 , ..., 34 M , with individual monitoring units 15 1 , ..., 15 M , on individual monitoring control buses 26 1 , ..., 26 M , control the power and adjust the operating frequencies of computational VLSI 33 1 , ... , 33 M, wasp estvlyayut avtorekonfigurirovanie new program for individual tires the reconfiguration of 36 1, ..., 36 M by reprogramming from its own configuration memory 35 1, ..., 35 M. on individual tires 32 1 , ..., 32 M.
Вычислительные СБИС 331, …, 33M предназначены для прямой схемотехнической реализации критических участков трудоемких фрагментов вычислительных алгоритмов. Вычислительные СБИС 331, …, 33M реализуются как заказные СБИС для выполнения требуемых алгоритмов.Computational VLSI 33 1 , ..., 33 M are intended for direct circuit implementation of critical sections of labor-intensive fragments of computational algorithms. Computational VLSI 33 1 , ..., 33 M are implemented as custom VLSI to perform the required algorithms.
Интерфейсная ПЛИС 22 предназначена для организации обмена информацией с КП 8 по высокоскоростному последовательному интерфейсу PCI-Express 17 для обеспечения взаимодействия с блоками конфигурирования и мониторинга 23 реконфигурируемых устройств и памятью конфигураций ПЛИС 24.The
Память конфигураций ПЛИС 24 предназначена для хранения конфигурации для интерфейсной ПЛИС 22 и стартовой конфигурации для вычислительных ПЛИС 201, …, 20M.
Блок 30 управления режимом коммутатора 19 PCI-Express предназначен для управления режимом работы портов NT/DS/US и NT/ US коммутатора PCI-Express 19 по шине 12 управления коммутатора.The
Блок конфигурирования и мониторинга реконфигурируемых устройств 23 предназначен для организации конфигурирования вычислительных ПЛИС 201, …, 20M по интерфейсу PCI-Express 17 с использованием ресурсов интерфейсной ПЛИС 22 и из памяти конфигураций ПЛИС 24 при включении питания, осуществления контроля температурного режима и управления режимами питания вычислительных ПЛИС 201, …, 20M по шине конфигурирования и мониторинга 25, с использованием термодатчиков, встроенных в вычислительные ПЛИС 201, …, 20M.The configuration and monitoring unit for
Индивидуальные блоки мониторинга и управления 151, …, 15M предназначены для независимого (без использования ресурсов интерфейсной ПЛИС 22) контроля температурного режима, управления питанием и обеспечения требуемыми рабочими частотами вычислительные СБИС 331, …, 33M по индивидуальным шинам мониторинга 141, …, 14M Individual monitoring and control units 15 1 , ..., 15 M are designed for independent (without using the resources of the interface FPGA 22) temperature control, power management and providing the required operating frequencies computing VLSI 33 1 , ..., 33 M on individual monitoring buses 14 1 , ..., 14 M
Памяти 351, …, 35M конфигураций вычислительных ПЛИС 201, …, 20M предназначены для хранения индивидуальных стартовых конфигураций вычислительных ПЛИС 201, …, 20M, которые в общем случае могут быть как одинаковыми, так и различными.The memory 35 1 , ..., 35 M configurations of computing FPGAs 20 1 , ..., 20 M are designed to store individual starting configurations of computing FPGAs 20 1 , ..., 20 M , which in the general case can be the same or different.
Единый радиатор прямоугольной формы 27, установленный над вычислительными СБИС 331, …, 33M, предназначен для улучшения теплоотвода кристаллов вычислительных СБИС 331, …, 33M и усреднения рабочей температуры вычислительных СБИС 331, …, 33M с большим и меньшим энергопотреблением, что уменьшает вероятность отказа, обусловленного перегревом кристаллов вычислительных СБИС 331, …, 33M.A single rectangular-shaped
Предлагаемая реконфигурируемая вычислительная система работает следующим образом.The proposed reconfigurable computer system operates as follows.
Ведущий сервер 2 совместно с коммутаторами EtherNet 1, включаются первыми. После первичной загрузки операционной системы (ОС) ведущий сервер 2 сначала осуществляет включение питания и загрузку операционных систем в КП 8 ведомых ВУ 41, …, 4К по сети EtherNet, которые в свою очередь осуществляет включение питания реконфигурируемых вычислительных устройств 131, …, 13N, и после загрузки интерфейсной ПЛИС 22 и вычислительных ПЛИС 201, …, 20M из памяти конфигурации ПЛИС 24, осуществляют настройку порогов срабатывания температурной защиты вычислительных ПЛИС 201, …, 20M и вычислительных СБИС 331, …, 33M и режима работы коммутатора PCI-Express 19 и перезагрузку ОС КП 8 ведомых ВУ 41, …, 4K. После перезагрузки ОС в КП 8, которая может осуществляться в общем случае с автономных дисков или по сети EtherNet, ведущий сервер 2 также перезагружается и запускает программы, осуществляющие независимое переконфигурирование вычислительных ПЛИС 201, …, 20M реконфигурируемых вычислительных устройств 131, …, 13N в ведомых ВУ 41, …, 4К, в соответствии с текущими требованиями к архитектуре реконфигурируемой вычислительной системы. Далее осуществляется проверка напряжений питания интерфейсной ПЛИС 22, вычислительных ПЛИС 201, …, 20M и вычислительных СБИС 331, …, 33M, а также наличия связей всех вычислительных ПЛИС 201, …, 20M с коммутаторами PCI-Express ведомых ВУ 41, …, 4К по интерфейсам PCI-Express.The master server 2, in conjunction with the
Так как при стартовом конфигурировании вычислительных ПЛИС 201, …, 20M они инициализируются как агенты сети PCI-Express, в формате, заведомо перекрывающем потребности пользователей в ресурсах (за исключением отдельных, единичных случаев), и распределяются в памяти КП 8 на этапе их загрузки, то после переконфигурирования вычислительных ПЛИС 201, …, 20M рабочими программами перезагрузки ОС ведомых ВУ, как правило, не требуется. Вычислительные ПЛИС 201, …, 20M инициализируются как агенты сети PCI-Express и распределяются в трех областях памяти КП 8 по одному мегабайту каждый.Since at the initial configuration of computing FPGAs 20 1 , ..., 20 M, they are initialized as agents of the PCI-Express network, in a format that obviously covers the resource needs of users (except for individual, isolated cases), and are allocated in memory of
Одна из областей (BAR2) предназначена для взаимодействия КП 8 ведомого ВУ 4 с регистрами управления и состояния, в том числе с регистрами управления каналом прямого доступа в память (DMA), который имеется в каждой из вычислительных ПЛИС 20 как агентов сети PCI-Express.One of the areas (BAR2) is designed for the interaction of
Другая область (BAR1) предназначена для обмена данными с процессором КП 8 ведомого ВУ 4 по внутренним интерфейсам вычислительных ПЛИС 20. К ним относятся интерфейсы работы через внутренние памяти ПЛИС произвольного доступа (BRAM) и последовательного доступа (FIFO), а также прямой командный интерфейс работы с аппаратными устройствами пользователей.Another area (BAR1) is intended for data exchange with the
Третья область (BAR0) предназначена для обмена данными между агентами сети PCI-Express, находящимися в одном и том же адресном пространстве, т.е. между вычислительными ПЛИС 20, которые расположены внутри одного ведомого ВУ 4. Обмен между вычислительными ПЛИС 20 поддерживается на программно-аппаратном уровне.The third area (BAR0) is intended for data exchange between PCI-Express network agents located in the same address space, i.e. between computing FPGAs 20, which are located within the same slave VU 4. The exchange between computing FPGAs 20 is supported at the software and hardware level.
При использовании обмена данными между вычислительными ПЛИС 20 в пределах одного ведомого ВУ 4 для всех реконфигурируемого вычислительного устройства 13 в режиме передачи данных по интерфейсам PCI-Express можно получить объединение всех вычислительных ПЛИС 201, …, 20M в единое вычислительное поле ВУ 4.When using data exchange between computing FPGAs 20 within the same slave VU 4 for all reconfigurable computing devices 13 in the data transfer mode via PCI-Express interfaces, one can obtain the union of all computing FPGAs 20 1 , ..., 20 M into a single computing field of VU 4.
При использовании обмена данными между вычислительными ПЛИС 20 различных ВУ 4 по интерфейсам PCI-Express 28 через группы портов NT/DS/US коммутаторов 19 и портов DS 29 коммутатора 31 возможно получить объединение всех вычислительных ПЛИС 20 в единое вычислительное поле в пределах вычислительной системы в целом. Обмен данными между вычислительными ПЛИС 20, находящимися в различных ВУ 4, осуществляется через NT порты, фактически являющимися «непрозрачными» мостами, разделяющими адресные пространства вычислительных узлов 4, и позволяющие вычислительным ПЛИС 20 взаимодействовать через установленные адресные окна. Для организации связи между ВУ достаточно задействовать один из N портов 28 вычислительных устройств 13.When using data exchange between computing FPGAs of 20 different WUs 4 via PCI-
С целью перераспределения ресурса вычислительных ПЛИС 20 между различными ВУ 4, на этапе настройки порогов срабатывания температурной защиты и режима работы коммутатора PCI-Express 19, настройки портов NT/US коммутатора 19, осуществляется подключение вычислительных ПЛИС 20 к КП 8 ВУ 4 со стороны порта US, тогда как с помощью порта NT осуществляется разделение адресных пространств ВУ 4 в памяти ведущего сервера 2.In order to redistribute the resource of computing FPGAs 20 between different WUs 4, at the stage of setting thresholds for temperature protection and the operating mode of the PCI-
При решении трудоемких задач и обработки больших информационных массивов и потоков, с использованием распараллеливания и конвейеризации вычислительных процессов, для ускорения вычислений осуществляется декомпозиция вычислительных процессов на функциональные фрагменты, исполняемые универсальными и специализированными устройствами, которые объединяются в определенные конфигурации, изменяемые динамически или статически. При этом на универсальные устройства возлагаются задачи выполнения не трудоемких алгоритмов, а функции предварительной обработки и подготовки данных для трудоемких алгоритмов и обмен данными и результатами с внешними устройствами. Архитектура специализированных устройств адаптируется к особенностям исполняемых вычислительных процессов.When solving labor-intensive tasks and processing large information arrays and streams, using parallelization and pipelining of computational processes, to speed up computations, the computational processes are decomposed into functional fragments executed by universal and specialized devices that are combined into specific configurations that can be changed dynamically or statically. At the same time, universal devices are entrusted with the task of executing not labor-intensive algorithms, but functions of preprocessing and preparing data for labor-intensive algorithms and exchange data and results with external devices. The architecture of specialized devices adapts to the characteristics of executable computing processes.
В предлагаемой вычислительной системе вычислительные ПЛИС 20 выполняют не только функции универсальных устройств по предварительной обработке и обмену данными, а также сервисные функции по контролю и управлению конфигурированием, питанием и настройке рабочих частот вычислительных СБИС 33, обеспечивая, таким образом, независимое функционирование вычислительных СБИС 33 как внутри реконфигурируемых вычислительных устройств ведомых ВУ 4, так и вычислительной системы в целом. При этом функции специализированных устройств выполняют вычислительные СБИС 33, которые реализуются на заказных СБИС и предназначены для прямой схемотехнической реализации конкретных критических фрагментов алгоритмов, которые могут присутствовать в различных вычислительных задачах. Причем у заказных СБИС в сравнении с универсальными ПЛИС снижены накладные расходы: на организацию соединений между элементами, которые состоят из совокупности сегментов трассировочных каналов, соединяемых друг с другом матрицами программируемых переключателей (ключей), на долю которых приходится до 90% площади кристалла, а также увеличенной задержкой при передачи данных между элементами, на долю которых приходится до 70% от времени выполнения операций, и избыточность на реализацию схем за счет высокого уровня универсализации.In the proposed computing system, computing FPGAs 20 perform not only the functions of universal devices for pre-processing and data exchange, but also service functions for monitoring and controlling the configuration, power and tuning of the operating frequencies of computing VLSI 33, thus ensuring the independent functioning of computing VLSI 33 as inside reconfigurable computing devices of slave WU 4, and the computing system as a whole. In this case, the functions of specialized devices are performed by computational VLSI 33, which are implemented on custom VLSI and are intended for direct circuitry implementation of specific critical fragments of algorithms that may be present in various computing problems. Moreover, overhead VLSI compared to universal FPGAs have reduced overhead: for the organization of connections between elements that consist of a set of segments of the trace channels connected to each other by matrices of programmable switches (keys), which account for up to 90% of the crystal area, as well increased delay in the transfer of data between elements, which account for up to 70% of the operation time, and redundancy in the implementation of schemes due to the high level of universalization.
Система мониторинга состояния компонент системы позволяет не только осуществлять непрерывный независимый контроль состояния основных параметров вычислительной системы (напряжение питания, текущие температуры вычислительных ПЛИС 20 и вычислительных СБИС 33), а также своевременно отключать питание от перегревающихся вычислительных ПЛИС 20 и вычислительных СБИС 33, с целью уменьшения риска их безвозвратного выхода из строя.The monitoring system of the state of the system components allows not only continuous independent monitoring of the state of the main parameters of the computing system (supply voltage, current temperatures of computing FPGAs 20 and computing VLSI 33), as well as timely disconnecting power from overheating computing FPGAs 20 and computing VLSI 33, in order to reduce risk of their irreparable failure.
Предлагаемая реконфигурируемая вычислительная система обеспечивает многопользовательский и многозадачный режим работы с минимальной единицей ресурса для пользователя один вычислительный ПЛИС 20 с соответствующим вычислительным СБИС 33, так как все вычислительные ПЛИС 201, …, 20M имеют независимые интерфейсы взаимодействия с ПК 8 и могут независимо конфигурироваться различными задачами, используя соответствующие памяти конфигураций 351, …, 35M одноименных вычислительных ПЛИС 201, …, 20M.The proposed reconfigurable computing system provides a multi-user and multi-tasking mode of operation with a minimum resource unit for a user one computing FPGA 20 with the corresponding computing VLSI 33, since all computing FPGAs 20 1 , ..., 20 M have independent interfaces for interaction with
В предлагаемой реконфигурируемой вычислительной системе при распределении выполняемых задач на всем поле вычислительных ПЛИС 20 и СБИС 33 осуществляется распределение задач с интенсивным обменом данными по портам NT/US и с высоким энергопотреблением, совместно с задачами не требующими интенсивного обмена или высокого энергопотребления, что достигается за счет реализации в предлагаемом вычислительном модуле независимой реконфигурации соответствующих рабочих ПЛИС 20 из одноименных индивидуальных памятей стартовых конфигураций 35, а также раздельной индивидуальной настройки рабочих частот и раздельным индивидуальным управлением питания для каждой вычислительной ПЛИС 20 с соответствующим одноименным вычислительным СБИС 33, а также индивидуальным мониторингом для каждой из вычислительных ПЛИС 20 со СБИС 33.In the proposed reconfigurable computer system, when tasks are distributed across the entire field of computing FPGAs 20 and VLSI 33, tasks are distributed with intensive data exchange over NT / US ports and with high power consumption, together with tasks that do not require intensive exchange or high power consumption, which is achieved by the implementation in the proposed computing module of an independent reconfiguration of the corresponding working FPGAs 20 of the same individual memory starting configurations 35, as well as separate individual adjustment of operating frequencies and separate individual power control for each FPGA computer 20 with appropriate computing eponymous VLSI 33, and individual monitoring of computing for each FPGA 20 to 33 VLSI.
Предлагаемая реконфигурируемая вычислительная система может быть реализована на следующих элементах:The proposed reconfigurable computing system can be implemented on the following elements:
В качестве ведущего сервера 2 может быть использован сервер фирмы Kraftway на базе платформы ED25: процессор Intel(R) Xeon(R) E2620V4 2.10 GHz 8 cores; оперативная память 64 Gb; жесткий диск 1 Tb; коммутатор 1 как GigabitEthernet; интерфейсная плата 5 ведущего сервера - АВЕ-2010 на базе микросхемы коммутатора РЕХ8619 фирмы PLX Technology.As a leading server 2, a Kraftway server based on the ED25 platform can be used: Intel (R) Xeon (R) E2620V4 processor 2.10
Ведомые ВУ 4: процессор Intel(R) Xeon(R) E2620V4 2.10 GHz 8 cores; оперативная память 64 Gb; жесткий диск 1 Tb; восемь реконфигурируемых вычислительных устройств 13 содержащих по четыре реконфигурируемых вычислительных ПЛИС 20 и четыре вычислительных СБИС 33 в каждом.Slave WU 4: Intel (R) Xeon (R) E2620V4 2.10
Реконфигурируемые вычислительные устройства 13: интерфейсная ПЛИС 22 и реконфигурируемые вычислительные ПЛИС 20 - на микросхемах фирмы Xilinx типа XC7A75T-FGG484; коммутатор PCI-Express 19 - на микросхеме коммутатора РЕХ8732 фирмы PLX Technology; блок конфигурирования и мониторинга 23 - на микросхемах CPLD ХС2С64А, МАХ6656, TMP461AIRUNT; индивидуальные блоки управления и мониторинга 38 - на микросхемах МАХ1239 и si570, память стартовых конфигураций 24 и памяти конфигураций 35 - на микросхемах SPI-памяти М25Р64.Reconfigurable computing devices 13:
Таким образом, в предлагаемой реконфигурируемой вычислительной системе, вычисления на СБИС выполняются на более высоких частотах, индивидуально настраиваемых для каждой СБИС, следовательно, в сравнении с прототипом, данная система обладает более высокими быстродействием, вычислительной мощностью и меньшим удельным энергопотреблением за счет использования вычислительных СБИС для прямой схемотехнической реализации критических участков трудоемких фрагментов вычислительных алгоритмов, которые обладают лучшими частотными характеристиками и имеют меньший процент накладных расходов на реализацию алгоритмов, по отношению к ПЛИС. Кроме того, за счет использования единых радиаторов и перераспределения вычислительных ресурсов системы между задачами с высоким и невысоким энергопотреблением, уменьшается средняя рабочая температура вычислительных СБИС и вероятность их перегрева, а за счет перераспределения вычислительных ресурсов системы между задачами с высокой и невысокой интенсивностью обмена, уменьшаются очереди на обслуживание в системе, тем самым повышается средняя скорость обмена данными вычислительных ПЛИС по внешним портам.Thus, in the proposed reconfigurable computer system, VLSI calculations are performed at higher frequencies individually configured for each VLSI, therefore, in comparison with the prototype, this system has higher speed, computing power and lower specific energy consumption due to the use of VLSI computing for direct circuit implementation of critical sections of labor-intensive fragments of computational algorithms that have the best frequency characteristics tics and have a lower percentage of overhead for the implementation of algorithms in relation to FPGAs. In addition, due to the use of unified radiators and the redistribution of system computing resources between tasks with high and low power consumption, the average operating temperature of computational VLSI systems and the probability of their overheating are reduced, and due to the redistribution of system computing resources between tasks with high and low exchange rates, the queues are reduced service in the system, thereby increasing the average speed of data exchange computing FPGAs on external ports.
Вышеизложенные сведения позволяют сделать вывод, что предлагаемая реконфигурируемая вычислительная система решает поставленную задачу и соответствует заявляемому техническому результату - обладает большей вычислительной мощностью и меньшим удельным энергопотреблением.The above information allows us to conclude that the proposed reconfigurable computing system solves the problem and corresponds to the claimed technical result - it has more computing power and less specific energy consumption.
Claims (1)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2018104582A RU2677363C1 (en) | 2017-07-24 | 2017-07-24 | Reconfigurable computing system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2018104582A RU2677363C1 (en) | 2017-07-24 | 2017-07-24 | Reconfigurable computing system |
Publications (1)
Publication Number | Publication Date |
---|---|
RU2677363C1 true RU2677363C1 (en) | 2019-01-16 |
Family
ID=65024985
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2018104582A RU2677363C1 (en) | 2017-07-24 | 2017-07-24 | Reconfigurable computing system |
Country Status (1)
Country | Link |
---|---|
RU (1) | RU2677363C1 (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2748299C1 (en) * | 2020-10-02 | 2021-05-21 | Федеральное государственное унитарное предприятие "Научно-исследовательский институт "Квант" | Autonomous computing module with submodules |
RU207176U1 (en) * | 2021-06-25 | 2021-10-15 | федеральное государственное бюджетное образовательное учреждение высшего образования "Российский государственный университет им. А.Н. Косыгина (Технологии. Дизайн. Искусство)" | COMPUTER SYSTEM CONFIGURATION CONTROL DEVICE |
RU2780169C1 (en) * | 2021-11-29 | 2022-09-20 | Федеральное государственное унитарное предприятие "Научно-исследовательский институт "Квант" | Computing module for multitasking computing systems |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120084483A1 (en) * | 2010-09-30 | 2012-04-05 | Agarwala Sanjive | Die expansion bus |
RU2502126C1 (en) * | 2012-05-04 | 2013-12-20 | Федеральное государственное автономное образовательное учреждение высшего профессионального образования Южный федеральный университет | Multiprocessor computer system |
RU156778U1 (en) * | 2015-04-10 | 2015-11-20 | Федеральное государственное унитарное предприятие "Научно-исследовательский институт "Квант" | RECONFIGURABLE COMPUTER SYSTEM |
RU168565U1 (en) * | 2016-11-21 | 2017-02-08 | Федеральное государственное унитарное предприятие "Научно-исследовательский институт "Квант" | RECONFIGURABLE COMPUTER MODULE |
-
2017
- 2017-07-24 RU RU2018104582A patent/RU2677363C1/en active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120084483A1 (en) * | 2010-09-30 | 2012-04-05 | Agarwala Sanjive | Die expansion bus |
RU2502126C1 (en) * | 2012-05-04 | 2013-12-20 | Федеральное государственное автономное образовательное учреждение высшего профессионального образования Южный федеральный университет | Multiprocessor computer system |
RU156778U1 (en) * | 2015-04-10 | 2015-11-20 | Федеральное государственное унитарное предприятие "Научно-исследовательский институт "Квант" | RECONFIGURABLE COMPUTER SYSTEM |
RU168565U1 (en) * | 2016-11-21 | 2017-02-08 | Федеральное государственное унитарное предприятие "Научно-исследовательский институт "Квант" | RECONFIGURABLE COMPUTER MODULE |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2748299C1 (en) * | 2020-10-02 | 2021-05-21 | Федеральное государственное унитарное предприятие "Научно-исследовательский институт "Квант" | Autonomous computing module with submodules |
RU207176U1 (en) * | 2021-06-25 | 2021-10-15 | федеральное государственное бюджетное образовательное учреждение высшего образования "Российский государственный университет им. А.Н. Косыгина (Технологии. Дизайн. Искусство)" | COMPUTER SYSTEM CONFIGURATION CONTROL DEVICE |
RU2780169C1 (en) * | 2021-11-29 | 2022-09-20 | Федеральное государственное унитарное предприятие "Научно-исследовательский институт "Квант" | Computing module for multitasking computing systems |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU168565U1 (en) | RECONFIGURABLE COMPUTER MODULE | |
Hilton et al. | PNoC: a flexible circuit-switched NoC for FPGA-based systems | |
Huebner et al. | Real-time LUT-based network topologies for dynamic and partial FPGA self-reconfiguration | |
RU156778U1 (en) | RECONFIGURABLE COMPUTER SYSTEM | |
EP2680155A1 (en) | Hybrid computing system | |
US10404800B2 (en) | Caching network fabric for high performance computing | |
CN103827773A (en) | Method and system for building low power computer system | |
BRPI0617882A2 (en) | modular aviation system of an aircraft | |
US10656911B2 (en) | Power control for a dataflow processor | |
US11853787B2 (en) | Dynamic platform feature tuning based on virtual machine runtime requirements | |
US7076671B2 (en) | Managing an operating frequency of processors in a multi-processor computer system | |
RU2677363C1 (en) | Reconfigurable computing system | |
US10521260B2 (en) | Workload management system and process | |
Nguyen et al. | PR-HMPSoC: A versatile partially reconfigurable heterogeneous Multiprocessor System-on-Chip for dynamic FPGA-based embedded systems | |
JP2004078947A (en) | Method for meeting capacity in compliance with request in computer system | |
CN103580975A (en) | On-line reconfigurable generalized bus data conversion method | |
RU174347U1 (en) | COMPUTER MODULE | |
RU2686004C1 (en) | Computing module | |
RU2720556C1 (en) | Autonomous computing module | |
US11256648B1 (en) | Virtual hot plug system and method for PCIe devices | |
RU166961U1 (en) | COMPUTER MODULE | |
US9250826B2 (en) | Enhanced performance monitoring method and apparatus | |
RU2713757C1 (en) | Reconfigurable computing system | |
RU2699254C1 (en) | Reconfigurable computer system with a multilevel monitoring and control subsystem | |
RU2202123C2 (en) | Programmable-architecture parallel computer system |