[go: up one dir, main page]

DE69424370T2 - Befehlscachespeicher mit Kreuzschienenschalter - Google Patents

Befehlscachespeicher mit Kreuzschienenschalter

Info

Publication number
DE69424370T2
DE69424370T2 DE69424370T DE69424370T DE69424370T2 DE 69424370 T2 DE69424370 T2 DE 69424370T2 DE 69424370 T DE69424370 T DE 69424370T DE 69424370 T DE69424370 T DE 69424370T DE 69424370 T2 DE69424370 T2 DE 69424370T2
Authority
DE
Germany
Prior art keywords
pipeline
instruction
instructions
connectors
parallel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69424370T
Other languages
English (en)
Other versions
DE69424370D1 (de
Inventor
Howard G. Sachs
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Intergraph Corp
Original Assignee
Intergraph Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=22522934&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=DE69424370(T2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Intergraph Corp filed Critical Intergraph Corp
Application granted granted Critical
Publication of DE69424370D1 publication Critical patent/DE69424370D1/de
Publication of DE69424370T2 publication Critical patent/DE69424370T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/38Concurrent instruction execution, e.g. pipeline or look ahead
    • G06F9/3818Decoding for concurrent execution
    • G06F9/382Pipelined decoding, e.g. using predecoding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/38Concurrent instruction execution, e.g. pipeline or look ahead
    • G06F9/3802Instruction prefetching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/38Concurrent instruction execution, e.g. pipeline or look ahead
    • G06F9/3802Instruction prefetching
    • G06F9/3814Implementation provisions of instruction buffers, e.g. prefetch buffer; banks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/38Concurrent instruction execution, e.g. pipeline or look ahead
    • G06F9/3836Instruction issuing, e.g. dynamic instruction scheduling or out of order instruction execution
    • G06F9/3853Instruction issuing, e.g. dynamic instruction scheduling or out of order instruction execution of compound instructions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/38Concurrent instruction execution, e.g. pipeline or look ahead
    • G06F9/3885Concurrent instruction execution, e.g. pipeline or look ahead using a plurality of independent parallel functional units

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Advance Control (AREA)
  • Memory System Of A Hierarchy Structure (AREA)

Description

  • Die Erfindung bezieht sich auf ein Computersystem gemäß dem Oberbegriff von Anspruch 1 und auf ein Verfahren zum parallelen Ausführen von Gruppen einzelner Befehle gemäß dem Oberbegriff von Anspruch 5.
  • Ein gemeinsames Ziel bei der Konstruktion von Computerarchitekturen besteht in der Erhöhung der Ausführungsgeschwindigkeit einer gegebenen Menge von Befehlen. Ein Zugang zur Erhöhung der Befehlausführungsraten besteht in der Ausgabe mehr als eines Befehls pro Taktzyklus, mit anderen Worten, in der parallelen Ausgabe von Befehlen. Dies ermöglicht, daß die Befehlsausführungsrate die Taktrate übersteigt. Computersysteme, die während jedes Taktzyklus mehrere unabhängige Befehle ausgeben, müssen das Problem lösen, die einzelnen parallel abgesendeten Befehle an ihre jeweiligen Ausführungseinheiten zu lenken. Ein zum Erreichen dieses parallelen Lenkens der Befehle verwendeter Mechanismus wird allgemein "Kreuzschienenschalter" ("crossbar switch") genannt.
  • In Computern des derzeitigen Standes der Technik, z. B. in dem Digital Equipment Alpha, in dem Sun Microsystems SuperSparc und in dem Intel Pentium, ist der Kreuzschienenschalter als Teil der Befehlspipeline verwirklicht. In diesen Maschinen ist die Kreuzschiene zwischen der Befehlsdecodierungs- und der Befehlsausführungsstufe angeordnet. Dies liegt daran, daß der herkömmliche Zugang erfordert, daß die Befehle decodiert werden, bevor die Pipeline bestimmt werden kann, an die sie abgesendet werden sollten. Leider verlangsamt das Decodieren auf diese Weise die Systemgeschwindigkeit und erfordert eine zusätzliche Oberfläche auf der integrierten Schaltung, auf der der Prozessor ausgebildet ist. Diese Nachteile sind weiter unten erläutert.
  • Aus IEEE PACIFIC RIM CONFERENCE ON COMMUNICATIONS, COMPUTERS AND SIGNAL PROCESSING, 9. Mai 1991, Victoria, CA., S. 21-24, MINAGAWA, u. a., Pre-decoding mechanism for superscalar architecture, ist eine Superskalararchitektur bekannt, die einen Vordecodierer, der bestimmt, welche Funktionseinheit einen Befehl ausführen sollte, wobei sie ihn mit einem jedem Befehl zugeordneten ldentifizierungskennzeichen registriert, eine Registeranzeigetafel, die Abhängigkeiten erfaßt, und einen Befehls-Kreuzschienenschalter, der die Befehle zu den Pipelines lenkt, durch die sie parallel ausgeführt werden, umfaßt.
  • Die Aufgabe der Erfindung es, eine Computersystemarchitektur zu schaffen, die ermöglicht, die Befehle schneller, mit weniger Leistung und mit einer einfacheren Schaltungsanordnung, als es zuvor möglich war, zu einer richtigen Pipeline zu lenken.
  • Diese Aufgabe wird gemäß den Ansprüchen 1 und 5 dadurch gelöst, daß der in einer Gruppe einzelner Befehle jedem Befehl zugeordnete Pipeline-Identifikator durch Software zur Kompilierungszeit bestimmt wird.
  • Der Kreuzschienenschalter ist früher in der Pipeline angeordnet, was ihn zu einem Teil der Anfangs-Befehlsholoperation macht. Dies ermöglicht, daß die Kreuzschiene anstelle einer Stufe in der Befehlspipeline ein Teil des Caches selbst ist. Außerdem ermöglicht es, daß die Kreuzschiene Schaltungskonstruktionsparameter nutzt, die anstatt für die zufällige Logik typisch für reguläre Speicherstrukturen sind. Solche Vorteile umfassen: niedrigere Schaltspannungen (200-300 Millivolt anstatt 3-5 Volt), eine kompaktere Konstruktion und höhere Schaltgeschwindigkeiten. Außerdem wird beim Anordnen der Kreuzschiene in dem Cache die Notwendigkeit vieler Leseverstärker beseitigt, was die in dem System als Ganzes erforderliche Schaltungsanordnung verringert.
  • Zum Verwirklichen des Kreuzschienenschalters müssen die von dem Cache kommenden oder anderweitig bei dem Schalter eintreffenden Befehle gekennzeichnet oder ihnen anderweitig ein Pipeline-Identifikator zugeordnet werden, um die Befehle zur Ausführung an die richtige Pipeline zu leiten. Mit anderen Worten, die Pipeline-Zusendeinformationen müssen zur Befehlsholzeit, bevor die herkömmliche Befehlsdecodierung stattgefunden hat, bei dem Kreuzschienenschalter verfügbar sein. Es gibt mehrere Möglichkeiten, wie diese Fähigkeit erfüllt werden kann: In einer Ausführungsform enthält dieses System einen Mechanismus, der jeden Befehl in einer Reihe von parallel in einer richtigen Pipeline auszuführenden Befehlen in der Weise lenkt, wie es durch ein während der Kompilierung jedem Befehl zugewiesenes oder in einem den ursprünglichen Befehl begleitenden getrennten Identifizierungsbefehl angeordnetes Pipeline-Identifizierungskennzeichen bestimmt ist. Alternativ kann die Pipeline-Zugehörigkeit nach der Kompilierung zu dem Zeitpunkt, zu dem die Befehle aus dem Speicher in den Cache geholt werden, mit einer Spezial-Vordecodierereinheit bestimmt werden.
  • In einer Verwirklichung enthält dieses System somit ein Register oder eine andere Einrichtung zum Halten von parallel auszuführenden Befehlen, z. B. die Speicherzellen, die die Speicherung einer Linie in dem Cache schaffen. Jedem Befehl ist ein Pipeline-Identifikator zugeordnet, der die Pipeline angibt, an die dieser Befehl auszugeben ist. Es ist ein Kreuzschienenschalter vorgesehen, der eine erste Menge von Verbindern besitzt, die zum Empfang der Befehle gekoppelt sind, während er eine zweite Menge von Verbindern besitzt, die an die Verarbeitungspipelines, an die die Befehle zur Ausführung abgesendet werden sollen, gekoppelt sind. Es wird eine Einrichtung geschaffen, die auf die Pipeline-Identifikatoren der der ersten Menge von Verbindern zugeführten einzelnen Befehle in der Gruppe anspricht, um diese einzelnen Befehle an die richtigen Pfade der zweiten Menge von Verbindern zu lenken, wobei somit jeder parallel auszuführende Befehl in der Gruppe der richtigen Pipeline zugeführt wird.
  • In einer bevorzugten Ausführungsform dieser Erfindung ist die Assoziativ- Kreuzschiene in dem Befehls-Cache verwirklicht. Durch Anordnen der Kreuzschiene in dem Cache erfolgt das gesamte Schalten bei niedrigen Signalpegeln (ungefähr 200-300 Millivolt). Das Schalten bei diesen niedrigen Pegeln ist wesentlich schneller als das Schalten bei höheren Pegeln (5 Volt) nach den Leseverstärkern. Außerdem beseitigt die niedrigere Leistung den Bedarf an großen Ansteuerschaltungen, wobei sie zahlreiche Leseverstärker beseitigt. Außerdem ist durch Verwirklichen der Kreuzschiene in dem Cache der Entwurfsabstand der Kreuzschienenleitungen an den Abstand des Entwurfs des Caches angepaßt.
  • Fig. 1 ist ein Blockschaltplan, der eine typische Umgebung für eine bevorzugte Verwirklichung dieser Erfindung zeigt;
  • Fig. 2 ist ein Diagramm, das die Gesamtstruktur des Befehls-Caches aus Fig. 1 zeigt;
  • Fig. 3 ist ein Diagramm, das eine Ausführungsform der Assoziativ-Kreuzschiene zeigt;
  • Fig. 4 ist ein Diagramm, das eine weitere Ausführungsform der Assoziativ- Kreuzschiene zeigt; und
  • Fig. 5 ist ein Diagramm, das eine weitere Ausführungsform der Assoziativ- Kreuzschiene zeigt.
  • Fig. 1 zeigt die Organisation der integrierten Schaltungschips, durch die das Computersystem gebildet wird. Wie gezeigt ist, enthält das System eine erste integrierte Schaltung 10, die eine Zentraleinheit, eine Gleitkommaeinheit und einen Befehls-Cache enthält.
  • In der bevorzugten Ausführungsform ist der Befehls-Cache ein 16 Kilobyte-Zweiwege-Mengenassoziativ-32 Bytes-Linien-Cache. Ein Mengenassoziativ-Cache ist ein Cache, in dem die Linien (oder Blöcke) nur an einer begrenzten Menge von Stellen angeordnet werden können. Die Linie wird zunächst in eine Menge abgebildet, wobei sie aber irgendwo in dieser Menge angeordnet werden kann. In einem Zweiwege-Mengenassoziativ-Cache werden zwei Mengen oder Abteile bereitgestellt, wobei jede Linie in einem Abteil oder in dem anderen angeordnet werden kann.
  • Außerdem enthält das System einen Daten-Cache-Chip 20, der einen 32 Kilobytes-Vierwege-Mengenassoziativ-32 Bytes-Linien-Cache umfaßt. Der dritte Chip 30 des Systems enthält einen Vordecodierer, einen Cache-Controller und einen Speicher-Controller. Der Vordecodierer und der Befehls-Cache werden weiter unten erläutert. Für die Zwecke dieser Erfindung können die CPU, die FPU, der Daten-Cache, der Cache-Controller und der Speicher-Controller sämtlich als herkömmlich konstruiert betrachtet werden.
  • Die Kommunikationspfade zwischen den Chips sind in Fig. 1 durch Pfeile gezeigt. Wie gezeigt ist, kommunizieren die CPU/FPU und der Befehls-Cache- Chip über einen 32 Bits breiten Bus 12 mit dem Vordecodiererchip 30. Der Stern wird verwendet, um zu zeigen, daß diese Kommunikationen multiplexiert werden, so daß ein 64 Bits-Wort in zwei Zyklen kommuniziert wird. Außerdem empfängt der Chip 10 über die 64 Bits breiten Busse 14, 16 Informationen von dem Daten- Cache 20, während er dem Daten-Gache 20 über die drei 32 Bits breiten Busse 18 Informationen zuführt. Der Vordecodierer decodiert einen von dem Sekundär- Cache empfangenen 32 Bits-Befehl in ein 64 Bits-Wort und führt dieses 64 Bits- Wort dem Befehls-Gache in dem Chip 10 zu.
  • Jedes Mal, wenn ein Nichttreffer des Caches der ersten Ebene auftritt, wird der Cache-Controller im Chip 30 aktiviert. Hierauf geht der Cache-Controller entweder zum Hauptspeicher oder zu dem Sekundär-Gache, um die erforderlichen Informationen zu holen. In der bevorzugten Ausführungsform sind die Sekundär- Cache-Linien 32 Bytes-Linien, während der Cache eine Seitengröße von 8 Kilobytes besitzt.
  • Der Daten-Cache-Chip 20 kommuniziert mit dem Cache-Controller-Chip 30 über einen weiteren 32 Bits breiten Bus. Außerdem kommuniziert der Cache- Controller-Chip 30 über einen 64 Bits breiten Bus 32 mit dem DRAM-Speicher, über einen 128 Bits breiten Bus 34 mit einem Sekundär-Cache und über einen 64 Bits breiten Bus 36 mit den Eingabe/Ausgabe-Vorrichtungen.
  • Wie weiter unten beschrieben wird, enthält das in Fig. 1 gezeigte System mehrere Pipelines, die an diese parallelen Pipelines gleichzeitig abgesendete getrennte Befehle parallel verarbeiten können. In einer Ausführungsform werden die parallelen Befehle durch den Compiler identifiziert und mit einem Pipeline- Identifizierungskennzeichen gekennzeichnet, das die spezifische Pipeline angibt, an die dieser Befehl abgesendet werden sollte.
  • In diesem System können eine beliebige Anzahl von Befehlen parallel ausgeführt werden. In einer Ausführungsform dieses Systems enthält die Zentraleinheit acht Funktionseinheiten, wobei sie acht Befehle parallel ausführen kann. Diese Pipelines sind mit den Ziffern 0 bis 7 bezeichnet. Außerdem wird für diese Erläuterung angenommen, daß jedes Befehlswort 32 Bits (4 Bytes) lang ist.
  • Wie oben kurz erläutert wurde, werden in der bevorzugten Ausführungsform während der Kompilierung einzelnen Befehlen in einer Menge von Befehlen Pipeline-Identifikatoren zugeordnet. In der bevorzugten Ausführungsform wird dies durch Kompilieren der auszuführenden Befehle mit einer wohlbekannten Compilertechnik erreicht. Während der Kompilierung werden die Befehl auf Datenabhängigkeiten, auf eine Abhängigkeit von früheren Verzweigungsbefehlen oder auf andere Bedingungen, die ihre Ausführung parallel zu anderen Befehlen ausschließen, geprüft. Das Ergebnis der Kompilierung ist die Identifizierung einer Menge oder Gruppe von Befehlen, die parallel ausgeführt werden können. Außerdem bestimmt der Compiler in der bevorzugten Ausführungsform die richtige Pipeline zur Ausführung eines einzelnen Befehls. Diese Bestimmung ist im wesentlichen eine Bestimmung des Typs des zugeführten Befehls. Zum Beispiel werden Ladebefehle an die Ladepipeline, Speicherbefehle an die Speicherpipeline usw. gesendet. Die Zuordnung des Befehls zu der gegebenen Pipeline kann entweder durch den Compiler oder durch spätere Untersuchung des Befehls selbst, z. B. während der Vordecodierung, erreicht werden.
  • Wieder mit Bezug auf Fig. 1 führt die CPU im Normalbetrieb Befehle aus dem Befehls-Cache gemäß wohlbekannten Prinzipien aus. Bei einem Befehls- Cache-Nichttreffer wird jedoch eine Menge von Befehlen, die den nicht getroffenen Befehl enthält, aus dem Hauptspeicher in den Sekundär-Cache und hierauf in den Primär-Befehls-Cache oder aus dem Sekundär-Cache in den Primär-Befehls- Cache übertragen, wo sie eine Linie des Befehls-Cache-Speichers belegt. Da die Befehle nur aus dem Befehls-Cache ausgeführt werden, unterliegen sämtliche Befehle schließlich dem folgenden Verfahren.
  • Zu dem Zeitpunkt, zu dem eine Gruppe von Befehlen in den Befehls-Cache übertragen wird, werden die Befehlswörter durch den Vordecodierer 30 vordecodiert. Als Teil des Vordecodierungsprozesses wird ausgehend von einem durch den Compiler zu dem Befehl hinzugefügten Identifizierungskennzeichen zu jedem Befehl ein Mehrbitfeld-Dateianfangsetikett hinzugefügt. Dieses Dateianfangsetikett gibt die explizite Pipeline-Abschnitt-Nummer der Pipeline, an die dieser Befehl gelenkt wird, an. Zu dem Zeitpunkt, zu dem ein Befehl aus dem Vordecodierer dem Befehls-Cache zugeführt wird, besitzt somit jeder Befehl einen Pipeline-Identifikator.
  • Es kann wünschenswert sein, das System dieser Erfindung in Computersystemen zu verwirklichen, die bereits existieren und somit Befehlsstrukturen besitzen, die bereits ohne verfügbare Leerfelder für die Pipeline-Informationen definiert wurden. In diesem Fall werden die Pipeline-Identifikator-Informationen in einer anderen Ausführung dieser Erfindung in einem anderen Taktzyklus zugeführt, wobei sie hierauf mit den Befehlen in dem Cache vereinigt oder in einem getrennten; kleineren Cache angeordnet werden. Ein solcher Zugang kann dadurch erreicht werden, daß zu Feldern, die die Pipeline zur Ausführung des Befehls identifizieren, ein "No-op"-Befehls hinzugefügt wird, oder dadurch, daß die Informationen, die sich auf die parallelen Befehle beziehen, auf andere Weise zugeführt werden. Somit ist klar, daß die Art, in der der Befehls- und Pipeline- Identifikator zur Verarbeitung an der Kreuzschiene eintrifft, etwas beliebig ist. Zur Bezeichnung des Konzepts, daß die Pipeline-Identifikatoren keine feste Beziehung zu den Befehlswörtern zu haben brauchen, wird hier das Wort "zugeordnet" verwendet. Das heißt, die Pipeline-Identifikatoren brauchen nicht selbst durch den Compiler in die Befehle eingebettet zu werden. Statt dessen können sie von einer anderen Einrichtung oder in einem anderen Zyklus eintreffen.
  • Fig. 2 ist ein vereinfachtes Diagramm, das den Sekundär-Cache, den Vordecodierer und den Befehls-Cache zeigt. Diese Figur sowie die Fig. 3, 4 und 5 werden zur Erläuterung der Art verwendet, in der die mit dem Pipeline-Identifikator bezeichneten Befehle zu ihren bestimmten Befehlspipelines gelenkt werden.
  • In Fig. 2 wird zur Erläuterung angenommen, daß die Gruppen von parallel auszuführenden Befehlen in einer einzigen Übertragung über einen 256 Bits (32 Bytes) breiten Pfad aus einem Sekundär-Cache 50 in den Vordecodierer 60 geholt werden. Wie oben erläutert wurde, versieht der Vordecodierer den Befehl mit dem Pipelinefeld "P" als Dateianfangsetikett. Nach dem Vordecodieren wird die resultierende Menge von Befehlen in den Primär-Befehls-Cache 70 übertragen. Gleichzeitig wird in dem Identifizierungskennzeichenfeld 74 für diese Linie ein Identifizierungskennzeichen angeordnet.
  • In der bevorzugten Ausführungsform arbeitet der Befehls-Cache als herkömmlicher physikalisch adressierter Befehls-Cache. In dem in Fig. 2 gezeigten Beispiel enthält der Befehls-Cache 512 Bitmengen von Anweisungen zu jeweils acht Befehlen, die in zwei Abteilen zu 256 Linien organisiert sind.
  • Die Adressierungsquellen für den Befehls-Cache treffen bei einem Multiplexer 80 ein, der die nächste zu holende Adresse auswählt. Da die Befehle bevorzugt immer Maschinenwörter sind, werden die dem Multiplexer 80 zugeführten zwei Adressenbits < 1 : 0> niedriger Ordnung des 32 Bits Adressenfelds verworfen. Diese zwei Bits bezeichnen Byte- und Halbwortgrenzen. Von den verbleibenden 30 Bits werden die nächsten drei Adressenbits < 4 : 2> niedriger Ordnung, die ein einzelnes Befehlswort in der Menge bezeichnen, über den Bus 81 direkt an die Assoziativ-Kreuzschiene gesendet. Die nächstniedrigen acht Adressenbits < 12 : 5> werden über den Bus 82 dem Befehls-Cache 70 zugeführt, wo sie zum Wählen einer der 256 Linien in dem Befehls-Cache verwendet werden. Schließlich werden die verbleibenden 19 Bits der virtuellen Adresse < 31 : 13> an den Übersetzungs-Look-Aside-Puffer (TLB) 90 gesendet. Der TLB übersetzt diese Bits in die hohen 19 Bits der physikalischen Adresse. Hierauf führt sie der TLB über den Bus 84 dem Befehls-Cache zu. In dem Cache werden sie mit dem Identifizierungskennzeichen der ausgewählten Linie verglichen, um zu bestimmen, ob es in dem Befehls-Cache einen "Treffer" oder "Nichttreffer" gibt.
  • Falls es in dem Befehls-Cache einen Treffer gibt, was angibt, daß der adressierte Befehl in dem Cache vorhanden ist, wird die ausgewählte Menge von Befehlen über den 512 Bits breiten Bus 73 an die Assoziativ-Kreuzschiene 100 übertragen. Die Assoziativ-Kreuzschiene 100 sendet hierauf die adressierten Befehle über die Busse 110, 111, ..., 117 an die richtigen Pipelines ab. Bevorzugt sind die Bitleitungen von den Speicherzellen, die die Bits des Befehls speichern, selbst an die Assoziativ-Kreuzschiene gekoppelt. Dies beseitigt die Notwendigkeit zahlreicher Leseverstärker und ermöglicht, daß die Kreuzschiene ohne die normalerweise dazwischenliegende Treiberschaltungsanordnung, die den Systembetrieb verlangsamt, direkt die Hub-Informationen von der Cache-Linie mit niedrigerer Spannung bearbeitet.
  • Fig. 3 zeigt ausführlicher eine Ausführungsform der Assoziativ-Kreuzschiene. Ein 512 Bits breites Register 130, das die Speicherzellen in einer Linie des Caches darstellt (oder das ein physikalisch getrenntes Register sein kann), enthält wenigstens die Menge der Befehle, die ausgegeben werden können. Für Erläuterungszwecke ist das Register 130 in der Weise gezeigt, daß es bis zu acht Befehlswörter W0 bis W7 enthält. Mit einer in der obenerwähnten gleichzeitig anhängigen Anmeldung beschriebenen Einrichtung wurden die Befehle zur parallelen Ausführung in Gruppen sortiert. Zur Erläuterung wird hier angenommen, daß die Befehle in der Gruppe 1 an die Pipelines 1, 2 und 3; die Befehle in der Gruppe 2 an die Pipelines 1, 3 und 6; und die Befehle in der Gruppe 3 an die Pipelines 1 und 6 abgesendet werden sollen. Das Decodiererwählsignal ermöglicht, daß lediglich die richtige Menge von Befehlen parallel ausgeführt wird, wobei es im wesentlichen ermöglicht, daß das Register 130 mehr als nur eine Menge von Befehlen enthält. Wenn nur das Register 130 nur für eine Menge paralleler Befehle gleichzeitig verwendet werden soll, ist das Decodiererwählsignal natürlich nicht erforderlich.
  • Wie in Fig. 3 gezeigt ist, enthält der Kreuzschienenschalter selbst zwei Mengen gekreuzter Parallelpfade. In horizontaler Richtung befinden sich die Pipeline-Parallelpfade 180, 181, ..., 187. In vertikaler Richtung befinden sich die Befehlswortpfade 190, 191, ..., 197. Jeder dieser Pipeline- und Befehlsparallelpfade ist selbst ein Bus zur Übertragung des Befehlsworts. Jeder horizontale Pipeline- Parallelpfad ist an eine Pipeline-Ausführungseinheit 200, 201, 202, ..., 207 gekoppelt. Jeder der vertikalen Befehlswort-Parallelpfade 190, 191, ..., 197 ist an einen richtigen Abschnitt des Registers oder der Cache-Linie 130 gekoppelt.
  • Die jedem Befehlswort-Parallelpfad zugeordneten Decodierer 170, 171, ..., 177 empfangen den 4 Bits-Pipeline-Code von dem Befehl. Jeder Decodierer, z. B. der Decodierer 170, liefert acht 1 Bits-Steuerleitungen als Ausgang. Jeder Pipeline-Parallelpfad-Kreuzung dieses Befehlswort-Parallelpfads ist eine dieser Steuerleitungen zugeordnet. Das wie mit Bezug auf Fig. 3 beschriebene Wählen eines Decodierers aktiviert die dieser Eingangs-Pipeline-Abschnitt-Nummer entsprechende Ausgangs-Bitsteuerleitung. Dies signalisiert der Kreuzschiene, daß sie den Schalter zwischen dem diesem Decodierer zugeordneten Wortpfad und dem durch diese Bitleitung ausgewählten Pipeline-Abschnitt-Pfad schließen soll. Das Herstellen der Kreuzverbindung zwischen diesen zwei Parallelpfaden bewirkt, daß ein ausgewähltes Befehlswort in die ausgewählte Pipeline fließt. Zum Beispiel hat der Decodierer 173 die Pipeline-Bits für das Wort W3 empfangen. Dem Wort W3 ist der Pipeline-Pfad 1 zugeordnet. Die Bits des Pipeline-Pfads 1 werden decodiert, um den Schalter 213 zu aktivieren, so daß er das Befehlswort W3 über den Pipeline-Pfad 181 der Pipeline-Ausführungseinheit 201 zuführt. Auf ähnliche Weise aktiviert die Identifizierung des Pipeline-Pfads 3 für den Decodierer D4 den Schalter 234, so daß er das Befehlsworts W4 dem Pipeline-Pfad 3 zuführt. Schließlich aktiviert die Identifizierung der Pipeline 6 für das Wort W5 im Decodierer D5 den Schalter 265 zum Übertragen des Befehlsworts W5 für den Pipeline- Parallelpfad 186 an die Pipeline-Ausführungseinheit 206. Somit werden die Befehle W3, W4 und W5 durch die Pipeline-Abschnitte 201, 203 bzw. 206 ausgeführt.
  • Die in Fig. 3 gezeigten Pipeline-Verarbeitungseinheiten 200, 201, ..., 207 können gewünschte Operationen ausführen. In einer bevorzugten Ausführungsform der Erfindung enthält jede der acht Pipelines zunächst einen Leseverstärker, um den Zustand des Signals auf den Bitleitungen von der Kreuzschiene zu erfassen. In einer Ausführungsform enthalten die Pipelines erste und zweite Arithmetik- Logik-Einheiten; erste und zweite Gleitkommaeinheiten; erste und zweite Ladeeinheiten; eine Speichereinheit und eine Steuereinheit. Die besondere Pipeline, an die ein gegebenes Befehlswort abgesendet wird, hängt von Hardware-Nebenbedingungen sowie von Datenabhängigkeiten ab.
  • Fig. 4 ist ein Diagramm, das eine weitere Ausführungsform der Assoziativ- Kreuzschiene zeigt. In Fig. 4 sind neun an die Kreuzschiene gekoppelte Pipelines 0-8 gezeigt. Genau wie in dem System aus Fig. 3 wird die Decodierungsauswahl verwendet, um eine Teilmenge der Befehle in dem Register 130 zur Ausführung freizugeben.
  • Hierauf werden die Ausführungsports ausgewählt, die mit den durch die Pipeline-Identifikationsbits der freigegebenen Befehle spezifizierten Pipelines verbinden, um die richtigen Befehle aus dem Inhalt des Registers herauszumultiplexieren. Falls eine oder mehrere Pipelines nicht zum Empfang eines neuen Befehls bereit sind, verhindert eine Menge von Haltezwischenspeichern am Ausgang der Ausführungsports, daß irgendeiner der freigegebenen Befehle ausgegeben wird, bis die "beschäftigte" Pipeline frei ist. Andernfalls werden die Befehle transparent über die Haltezwischenspeicher in ihre jeweiligen Pipelines übergeben. Das Ausgangssignal jedes Ports wird von einem "Portgültigkeits"-Signal begleitet, das angibt, ob der Port gültige Informationen zur Ausgabe an den Halte zwischenspeicher besitzt.
  • Fig. 5 zeigt eine alternative Ausführungsform für die Erfindung, bei der die Pipeline-Identifizierungskennzeichen nicht mit dem Befehl enthalten sind, sondern getrennt zugeführt werden, oder bei der die Cache-Linie selbst als das Register für die Kreuzschiene verwendet wird. In diesen Situationen können die Pipeline-Identifizierungskennzeichen in einem getrennten schnellen Cache-Speicher 200 angeordnet werden. Das Ausgangssignal von diesem Speicher kann dann die Kreuzschiene ebenso wie in Verbindung mit Fig. 3 beschrieben steuern. Dieser Zugang beseitigt die Notwendigkeit von Leseverstärkern zwischen dem Befehls-Cache und der Kreuzschiene. Dies ermöglicht, daß die Kreuzschiene Signale mit sehr niedriger Spannung schneller als Signale mit hohem Pegel schaltet, wobei die Notwendigkeit von Hunderten von Leseverstärkern beseitigt wird. Um zur Steuerung der Kreuzschiene ein Signal mit höherem Pegel zuzuführen, ist zwischen dem Pipeline-Identifizierungskennzeichen-Cache 200 und der Kreuzschiene 100 der Leseverstärker 205 angeordnet. Da der Pipeline-Identifizierungskennzeichen- Cache ein verhältnismäßig kleiner Speicher ist, kann er jedoch schneller als der Befehls-Cache-Speicher arbeiten, wobei die Identifizierungskennzeichen somit trotz des Leseverstärkers zwischen dem Cache 200 und der Kreuzschiene 100 rechtzeitig zur Steuerung der Kreuzschiene verfügbar sind. Sobald das Schalten an der Kreuzschiene stattfindet, werden die Signale, bevor sie den verschiedenen Pipelines zur Ausführung zugeführt werden, durch die Leseverstärker 210 verstärkt.
  • Die obenbeschriebene Architektur schafft viele einzigartige Vorteile für ein System mit dieser Kreuzschiene. Die beschriebene Kreuzschiene ist äußerst flexibel, wobei sie ganz je nach "Intelligenz" des Compilers die sequentielle oder parallele Ausführung von Befehlen ermöglicht. Es ist wichtig, daß die Assoziativ- Kreuzschiene auf den Inhalt der decodierten Nachricht aufbaut und nicht auf eine externe Steuerschaltung, die unabhängig von den ausgeführten Befehlen wirkt. Im wesentlichen ist die Assoziativ-Kreuzschiene selbststeuernd.
  • Ein weiterer wichtiger Vorteil dieses Systems besteht darin, daß es intelligentere Compiler ermöglicht. Bei zwei Befehlen, die gegenüber einem Hardware- Decodierer (wie etwa in dem obenbeschriebenen Stand der Technik) voneinander abhängig zu sein scheinen, kann der Compiler bestimmen, daß sie nicht voneinander abhängig sind. Zum Beispiel würde ein Hardware-Decodierer die parallele Ausführung der zwei Befehle R1 + R2 = R3 und R3 + R5 = R6 nicht zulassen. Ein Compiler kann jedoch "intelligent" genug sein, um zu bestimmen, daß das zweite R3 ein früherer Wert von R3 und nicht der durch R1 + R2 berechnete ist, wobei er somit die gleichzeitige Ausgabe beider Befehle ermöglichen kann. Dies ermöglicht, daß die Software flexibler und schneller ist.
  • Obgleich im Vorstehenden die bevorzugte Ausführungsform der Erfindung beschrieben wurde, ist für den Fachmann auf dem Gebiet offensichtlich, daß an der Erfindung zahlreiche Abwandlungen und Änderungen vorgenommen werden können, ohne vom hier beschriebenen Umfang abzuweichen. Zum Beispiel können beliebige Anzahlen von Pipelines, beliebige Anzahlen von Decodierern und verschiedene Architekturen verwendet werden, die dennoch auf dem hier entwickelten System beruhen.

Claims (6)

1. Computersystem, das einen Compiler zum Bilden von Gruppen von Befehlen enthält und in welchem Gruppen einzelner Befehle durch Verarbeitungspipelines parallel ausführbar sind, mit einer Einrichtung zum Lenken jedes parallel auszuführenden Befehls in einer Gruppe an eine geeignete Befehlspipeline (0, ..., 7), wobei die Einrichtung umfaßt:
- einen Speicher (70) zum parallelen Halten wenigstens zweier solcher Gruppen von Befehlen, wobei jedem darin befindlichen Befehl ein Pipeline- Identifikator zugeordnet ist, der die Pipeline (0, ..., 7) für die Ausführung dieses Befehls angibt,
- eine Kreuzschiene (100) mit einer ersten Menge von Verbindern (73), die mit dem Speicher (70) gekoppelt sind, um von diesem einzelne Befehle zu empfangen, und einer zweiten Menge von Verbindern (110, ..., 117), die mit der Verarbeitungspipeline (0, ..., 7) gekoppelt sind, und
eine Einrichtung, die auf den Pipeline-Identifikator der einzelnen Befehle in der Gruppe anspricht, zum Lenken einzelner Befehle zu geeigneten der zweiten Menge von Verbindern (110, ..., 117), um dadurch jeden Befehl in einer solchen Gruppe der geeigneten Pipeline (0, ..., 7) zuzuführen, dadurch gekennzeichnet, daß
der Pipeline-Identifikator, der jedem Befehl in einer solchen Gruppe zugeordnet ist, zum Kompilierungszeitpunkt durch Software bestimmt wird.
2. Computersystem nach Anspruch 1, dadurch gekennzeichnet, daß
die erste Menge von Verbindern (73) aus einer Menge erster Kommunikationsbusse, einer für jeden Befehl im Speicher (70), besteht;
die zweite Menge von Verbindern (110, ..., 117) aus einer Menge zweiter Kommunikationsbusse (180, ..., 187), einer für jede Pipeline (0, ..., 7), besteht; und
die Einrichtung, die auf den Pipeline-Identifikator anspricht, umfaßt:
eine Menge von Decodierern (170, ..., 177), die mit dem Speicher (70) gekoppelt sind, um als erste Eingangssignale die Pipeline-Identifikatoren zu empfangen und als Antwort darauf als Ausgangssignale ein Schaltsteuersignal zu liefern; und
eine Menge von Schaltern (213, 234, 265), die mit den Decodierern gekoppelt sind, wobei sich am Schnittpunkt jedes der ersten Menge von Verbindern (73) mit der zweiten Menge von Verbindern (110, ..., 117) ein Schalter befindet, wobei die Schalter als Antwort auf den Empfang des Schaltsteuersignals Verbindungen schaffen, um dadurch jeden parallel auszuführenden Befehl in der Gruppe der geeigneten Pipeline (0, ..., 7) zuzuführen.
3. Computersystem nach Anspruch 1, gekennzeichnet durch
Wähleinrichtungen, die so angeschlossen sind, daß sie die Menge von Befehlen empfangen und Informationen über jene Befehle, die als nächstes parallel auszuführen sind, empfangen, um als Antwort darauf ein Ausgangssignal zu liefern, das die nächste Menge von parallel auszuführenden Befehlen angibt; und
Decodierer (170, ..., 177), die so angeschlossen sind, daß sie das Ausgangssignal und jeden der Pipeline-Identifikatoren der Befehle im Speicher (70) empfangen, um selektiv einige der ersten Menge von Verbindern (73) mit einigen der zweiten Menge von Verbindern (110, ..., 117) zu verbinden, um dadurch jeden parallel auszuführenden Befehl in der Menge der geeigneten Pipeline (0, ..., 7) zuzuführen.
4. Computersystem nach Anspruch 3, dadurch gekennzeichnet, daß ein Multiplexer ein Ausgangssignal an die Decodierer (170, ..., 177) liefert, um die nächste Gruppe von Befehlen zu wählen, die den Pipelines (0, ..., 7) zuzuführen ist.
5. Verfahren zum parallelen Ausführen von Gruppen einzelner Befehle durch Verarbeitungspipelines (0, ..., 7) eines Computersystems, gemäß welchem jeder auszuführende Befehl in einer Gruppe über einen Kreuzschienenschalter mit einer ersten Menge von Verbindern (73), die mit einem Speicher (70) gekoppelt sind, um von diesem Befehle zu empfangen, und mit einer zweiten Menge von Verbindern (110,.., 117), die mit den Verarbeitungspipelines (0, ..., 7) gekoppelt sind, übertragen wird,
wobei im Speicher (70) wenigstens eine Gruppe von parallel auszuführenden Befehlen gespeichert wird, wobei jedem Befehl in der Gruppe ein Pipeline-Identifikator zugeordnet ist, der die Pipeline angibt, die diesen Befehl ausführt; und
wobei die Pipeline-Identifikatoren der einzelnen Befehle in der wenigstens einen Gruppe von Befehlen, die auszuführen sind, anschließend zum Steuern von Schaltern (213, 234, 265) zwischen der ersten Menge von Verbindern und der zweiten Menge von Verbindern verwendet wird, um dadurch jeden parallel auszuführenden Befehl in der Gruppe der geeigneten Pipeline zuzuführen, dadurch gekennzeichnet, daß der jedem Befehl in einer solchen Gruppe zugeordnete Pipeline-Identifikator zum Kompilierungszeitpunkt durch Software bestimmt wird.
6. Verfahren nach Anspruch 5, dadurch gekennzeichnet, daß
die Pipeline-Identifikatoren der einzelnen Befehle in der wenigstens einen Gruppe von Befehlen einer entsprechenden Anzahl von Decodierern (170, ..., 177) zugeführt werden, wobei jeder der Decodierer (170, ..., 177) ein die Pipeline- Identifikatoren angebendes Ausgangssignal erzeugt; und
die Decodierer-Ausgangssignale zum Steuern der Schalter zwischen der ersten Menge von Verbindern und der zweiten Menge von Verbindern verwendet werden, um dadurch jeden parallel auszuführenden Befehl in der Gruppe der geeigneten Pipeline (0, ..., 7) zuzuführen.
DE69424370T 1993-11-05 1994-10-27 Befehlscachespeicher mit Kreuzschienenschalter Expired - Lifetime DE69424370T2 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US14779793A 1993-11-05 1993-11-05

Publications (2)

Publication Number Publication Date
DE69424370D1 DE69424370D1 (de) 2000-06-15
DE69424370T2 true DE69424370T2 (de) 2001-02-15

Family

ID=22522934

Family Applications (3)

Application Number Title Priority Date Filing Date
DE69424370T Expired - Lifetime DE69424370T2 (de) 1993-11-05 1994-10-27 Befehlscachespeicher mit Kreuzschienenschalter
DE69433124T Expired - Lifetime DE69433124T2 (de) 1993-11-05 1994-10-27 Befehlsspeicher mit assoziativem Kreuzschienenschalter
DE69430018T Expired - Lifetime DE69430018T2 (de) 1993-11-05 1994-10-27 Befehlscachespeicher mit assoziativem Kreuzschienenschalter

Family Applications After (2)

Application Number Title Priority Date Filing Date
DE69433124T Expired - Lifetime DE69433124T2 (de) 1993-11-05 1994-10-27 Befehlsspeicher mit assoziativem Kreuzschienenschalter
DE69430018T Expired - Lifetime DE69430018T2 (de) 1993-11-05 1994-10-27 Befehlscachespeicher mit assoziativem Kreuzschienenschalter

Country Status (4)

Country Link
US (3) US5794003A (de)
EP (4) EP1369775A1 (de)
DE (3) DE69424370T2 (de)
HK (1) HK1044056B (de)

Families Citing this family (57)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5742840A (en) * 1995-08-16 1998-04-21 Microunity Systems Engineering, Inc. General purpose, multiple precision parallel operation, programmable media processor
US6643765B1 (en) * 1995-08-16 2003-11-04 Microunity Systems Engineering, Inc. Programmable processor with group floating point operations
KR19980032776A (ko) * 1996-10-16 1998-07-25 가나이 츠토무 데이타 프로세서 및 데이타 처리시스템
US5819058A (en) * 1997-02-28 1998-10-06 Vm Labs, Inc. Instruction compression and decompression system and method for a processor
US6418478B1 (en) * 1997-10-30 2002-07-09 Commvault Systems, Inc. Pipelined high speed data transfer mechanism
US7581077B2 (en) 1997-10-30 2009-08-25 Commvault Systems, Inc. Method and system for transferring data in a storage operation
EP0924603A3 (de) * 1997-12-16 2001-02-07 Lucent Technologies Inc. Compilergesteuerte dynamische Ablauffolgeplanung von Programmbefehlen
US6178500B1 (en) * 1998-06-25 2001-01-23 International Business Machines Corporation Vector packing and saturation detection in the vector permute unit
US6128094A (en) * 1998-07-08 2000-10-03 Hewlett-Packard Company Printer having processor with instruction cache and compressed program store
US6378060B1 (en) 1998-08-24 2002-04-23 Microunity Systems Engineering, Inc. System to implement a cross-bar switch of a broadband processor
US6742110B2 (en) * 1998-10-06 2004-05-25 Texas Instruments Incorporated Preventing the execution of a set of instructions in parallel based on an indication that the instructions were erroneously pre-coded for parallel execution
US6418527B1 (en) * 1998-10-13 2002-07-09 Motorola, Inc. Data processor instruction system for grouping instructions with or without a common prefix and data processing system that uses two or more instruction grouping methods
EP1236090A4 (de) * 1999-02-12 2002-09-04 Microunity Systems Eng System und verfahren zum implementieren eines cross-barschalters eines breitbandprozessors
US6748589B1 (en) 1999-10-20 2004-06-08 Transmeta Corporation Method for increasing the speed of speculative execution
US6351802B1 (en) * 1999-12-03 2002-02-26 Intel Corporation Method and apparatus for constructing a pre-scheduled instruction cache
US6591343B1 (en) * 2000-02-22 2003-07-08 Ip-First, Llc Predecode in parallel with TLB compare
DE10043003A1 (de) * 2000-09-01 2002-03-14 Infineon Technologies Ag Programmgesteuerte Einheit
GB2370380B (en) 2000-12-19 2003-12-31 Picochip Designs Ltd Processor architecture
US7181484B2 (en) 2001-02-21 2007-02-20 Mips Technologies, Inc. Extended-precision accumulation of multiplier output
US7711763B2 (en) 2001-02-21 2010-05-04 Mips Technologies, Inc. Microprocessor instructions for performing polynomial arithmetic operations
US7162621B2 (en) 2001-02-21 2007-01-09 Mips Technologies, Inc. Virtual instruction expansion based on template and parameter selector information specifying sign-extension or concentration
US7599981B2 (en) 2001-02-21 2009-10-06 Mips Technologies, Inc. Binary polynomial multiplier
US6763421B2 (en) * 2001-10-11 2004-07-13 International Business Machines Corporation Instruction pair detection and pseudo ports for cache array
WO2003046712A2 (en) * 2001-11-26 2003-06-05 Koninklijke Philips Electronics N.V. Wlim architecture with power down instruction
EP1367484B1 (de) * 2002-05-31 2013-07-24 STMicroelectronics Limited Instruktionssteuerung
US7877435B2 (en) * 2002-06-20 2011-01-25 International Business Machines Corporation Method and system for transaction pipeline decomposition
EP1378824A1 (de) * 2002-07-02 2004-01-07 STMicroelectronics S.r.l. Verfahren zur Ausführung von Programmen in einem Mehrprozessorsystem, und entsprechenes Prozessorsystem
WO2004025483A1 (en) 2002-09-16 2004-03-25 Commvault Systems, Inc. System and method for optimizing storage operations
US7315923B2 (en) 2003-11-13 2008-01-01 Commvault Systems, Inc. System and method for combining data streams in pipelined storage operations in a storage network
US7401328B2 (en) * 2003-12-18 2008-07-15 Lsi Corporation Software-implemented grouping techniques for use in a superscalar data processing system
US7580914B2 (en) * 2003-12-24 2009-08-25 Intel Corporation Method and apparatus to improve execution of a stored program
AT501213B1 (de) * 2004-12-03 2006-10-15 On Demand Microelectronics Gmb Verfahren zum steuern der zyklischen zuführung von instruktionswörtern zu rechenelementen und datenverarbeitungseinrichtung mit einer solchen steuerung
GB2420884B (en) * 2004-12-03 2009-04-15 Picochip Designs Ltd Processor architecture
US7673119B2 (en) * 2005-05-13 2010-03-02 Texas Instruments Incorporated VLIW optional fetch packet header extends instruction set space
US7454597B2 (en) * 2007-01-02 2008-11-18 International Business Machines Corporation Computer processing system employing an instruction schedule cache
TW200910195A (en) * 2007-08-20 2009-03-01 Sunplus Technology Co Ltd A device of using serial bits to determine instruction length at a multi-mode processor and the method thereof
GB2454865B (en) * 2007-11-05 2012-06-13 Picochip Designs Ltd Power control
GB2466661B (en) * 2009-01-05 2014-11-26 Intel Corp Rake receiver
JP2010257199A (ja) * 2009-04-24 2010-11-11 Renesas Electronics Corp プロセッサ及びプロセッサにおける命令発行の制御方法
GB2470037B (en) 2009-05-07 2013-07-10 Picochip Designs Ltd Methods and devices for reducing interference in an uplink
GB2470771B (en) 2009-06-05 2012-07-18 Picochip Designs Ltd A method and device in a communication network
GB2470891B (en) 2009-06-05 2013-11-27 Picochip Designs Ltd A method and device in a communication network
GB2474071B (en) 2009-10-05 2013-08-07 Picochip Designs Ltd Femtocell base station
GB2482869B (en) 2010-08-16 2013-11-06 Picochip Designs Ltd Femtocell access control
GB2483903A (en) 2010-09-24 2012-03-28 Advanced Risc Mach Ltd Instruction which specifies the type of the next instruction to be executed
US8787368B2 (en) * 2010-12-07 2014-07-22 Advanced Micro Devices, Inc. Crossbar switch with primary and secondary pickers
GB2489716B (en) 2011-04-05 2015-06-24 Intel Corp Multimode base system
GB2489919B (en) 2011-04-05 2018-02-14 Intel Corp Filter
GB2491098B (en) 2011-05-16 2015-05-20 Intel Corp Accessing a base station
WO2013080289A1 (ja) * 2011-11-28 2013-06-06 富士通株式会社 信号処理装置及び信号処理方法
US8898433B2 (en) * 2012-04-26 2014-11-25 Avago Technologies General Ip (Singapore) Pte. Ltd. Efficient extraction of execution sets from fetch sets
US9830164B2 (en) 2013-01-29 2017-11-28 Advanced Micro Devices, Inc. Hardware and software solutions to divergent branches in a parallel pipeline
US9904481B2 (en) 2015-01-23 2018-02-27 Commvault Systems, Inc. Scalable auxiliary copy processing in a storage management system using media agent resources
US9898213B2 (en) 2015-01-23 2018-02-20 Commvault Systems, Inc. Scalable auxiliary copy processing using media agent resources
GB2544814B (en) * 2015-11-30 2019-06-19 Imagination Tech Ltd Modulo hardware generator
US11010261B2 (en) 2017-03-31 2021-05-18 Commvault Systems, Inc. Dynamically allocating streams during restoration of data
CN110413536B (zh) * 2019-06-12 2021-12-31 北京空间飞行器总体设计部 一种多数据格式高速并行NandFlash存储装置

Family Cites Families (125)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4295193A (en) * 1979-06-29 1981-10-13 International Business Machines Corporation Machine for multiple instruction execution
US4437149A (en) * 1980-11-17 1984-03-13 International Business Machines Corporation Cache memory architecture with decoding
US4434149A (en) * 1982-08-30 1984-02-28 Atlantic Richfield Company Acid melt treatment to activate carbon for use as reductant
JPH0799515B2 (ja) 1984-11-05 1995-10-25 ヒユ−ズ・エアクラフト・カンパニ− 命令フロ−コンピュ−タ
US4847755A (en) * 1985-10-31 1989-07-11 Mcc Development, Ltd. Parallel processing method and apparatus for increasing processing throughout by parallel processing low level instructions having natural concurrencies
US5021945A (en) * 1985-10-31 1991-06-04 Mcc Development, Ltd. Parallel processor system for processing natural concurrencies and method therefor
US5051940A (en) * 1990-04-04 1991-09-24 International Business Machines Corporation Data dependency collapsing hardware apparatus
US4933837A (en) * 1986-12-01 1990-06-12 Advanced Micro Devices, Inc. Methods and apparatus for optimizing instruction processing in computer systems employing a combination of instruction cache and high speed consecutive transfer memories
US4833599A (en) * 1987-04-20 1989-05-23 Multiflow Computer, Inc. Hierarchical priority branch handling for parallel execution in a parallel processor
US4920477A (en) * 1987-04-20 1990-04-24 Multiflow Computer, Inc. Virtual address table look aside buffer miss recovery method and apparatus
US5057837A (en) * 1987-04-20 1991-10-15 Digital Equipment Corporation Instruction storage method with a compressed format using a mask word
US5179680A (en) * 1987-04-20 1993-01-12 Digital Equipment Corporation Instruction storage and cache miss recovery in a high speed multiprocessing parallel processing apparatus
WO1988008568A1 (en) 1987-05-01 1988-11-03 Cydrome, Inc. Parallel-processing system employing a horizontal architecture comprising multiple processing elements and interconnect circuit with delay memory elements to provide data paths between the processing elements
US5276819A (en) * 1987-05-01 1994-01-04 Hewlett-Packard Company Horizontal computer having register multiconnect for operand address generation during execution of iterations of a loop of program code
US5297255A (en) * 1987-07-28 1994-03-22 Hitachi, Ltd. Parallel computer comprised of processor elements having a local memory and an enhanced data transfer mechanism
US5081575A (en) * 1987-11-06 1992-01-14 Oryx Corporation Highly parallel computer architecture employing crossbar switch with selectable pipeline delay
US4888679A (en) 1988-01-11 1989-12-19 Digital Equipment Corporation Method and apparatus using a cache and main memory for both vector processing and scalar processing by prefetching cache blocks including vector data elements
US5692139A (en) 1988-01-11 1997-11-25 North American Philips Corporation, Signetics Div. VLIW processing device including improved memory for avoiding collisions without an excessive number of ports
NL8800071A (nl) * 1988-01-13 1989-08-01 Philips Nv Dataprocessorsysteem en videoprocessorsysteem, voorzien van een dergelijk dataprocessorsysteem.
US5101341A (en) * 1988-08-25 1992-03-31 Edgcore Technology, Inc. Pipelined system for reducing instruction access time by accumulating predecoded instruction bits a FIFO
US5051885A (en) * 1988-10-07 1991-09-24 Hewlett-Packard Company Data processing system for concurrent dispatch of instructions to multiple functional units
US5226169A (en) * 1988-12-30 1993-07-06 International Business Machines Corp. System for execution of storage-immediate and storage-storage instructions within cache buffer storage
DE69030931T2 (de) * 1989-04-24 1998-01-15 Ibm Mehrfachsequenzprozessorsystem
US5129067A (en) * 1989-06-06 1992-07-07 Advanced Micro Devices, Inc. Multiple instruction decoder for minimizing register port requirements
US5197137A (en) * 1989-07-28 1993-03-23 International Business Machines Corporation Computer architecture for the concurrent execution of sequential programs
EP0415366B1 (de) * 1989-08-28 1997-06-11 Nec Corporation Mikroprozessor mit Pipeline-Predecodereinheit und -Hauptdecodereinheit
WO1991004536A1 (en) * 1989-09-20 1991-04-04 Dolphin Server Technology A/S Instruction cache architecture for parallel issuing of multiple instructions
JP2835103B2 (ja) * 1989-11-01 1998-12-14 富士通株式会社 命令指定方法及び命令実行方式
JP2839590B2 (ja) * 1989-11-10 1998-12-16 株式会社東芝 命令割り当て装置及び命令割り当て方法
US5239654A (en) * 1989-11-17 1993-08-24 Texas Instruments Incorporated Dual mode SIMD/MIMD processor providing reuse of MIMD instruction memories as data memories when operating in SIMD mode
US5471593A (en) 1989-12-11 1995-11-28 Branigin; Michael H. Computer processor with an efficient means of executing many instructions simultaneously
US5121502A (en) * 1989-12-20 1992-06-09 Hewlett-Packard Company System for selectively communicating instructions from memory locations simultaneously or from the same memory locations sequentially to plurality of processing
US5203002A (en) * 1989-12-27 1993-04-13 Wetzel Glen F System with a multiport memory and N processing units for concurrently/individually executing 2N-multi-instruction-words at first/second transitions of a single clock cycle
US5506974A (en) * 1990-03-23 1996-04-09 Unisys Corporation Method and means for concatenating multiple instructions
JP2818249B2 (ja) 1990-03-30 1998-10-30 株式会社東芝 電子計算機
US5333280A (en) * 1990-04-06 1994-07-26 Nec Corporation Parallel pipelined instruction processing system for very long instruction word
US5303356A (en) * 1990-05-04 1994-04-12 International Business Machines Corporation System for issuing instructions for parallel execution subsequent to branch into a group of member instructions with compoundability in dictation tag
US5214763A (en) 1990-05-10 1993-05-25 International Business Machines Corporation Digital computer system capable of processing two or more instructions in parallel and having a coche and instruction compounding mechanism
US5295249A (en) * 1990-05-04 1994-03-15 International Business Machines Corporation Compounding preprocessor for cache for identifying multiple instructions which may be executed in parallel
CA2037708C (en) * 1990-05-04 1998-01-20 Richard J. Eickemeyer General purpose compound apparatus for instruction-level parallel processors
US5448746A (en) * 1990-05-04 1995-09-05 International Business Machines Corporation System for comounding instructions in a byte stream prior to fetching and identifying the instructions for execution
US5504932A (en) * 1990-05-04 1996-04-02 International Business Machines Corporation System for executing scalar instructions in parallel based on control bits appended by compounding decoder
US5197135A (en) 1990-06-26 1993-03-23 International Business Machines Corporation Memory management for scalable compound instruction set machines with in-memory compounding
DE69123629T2 (de) * 1990-05-04 1997-06-12 International Business Machines Corp., Armonk, N.Y. Maschinenarchitektur für skalaren Verbundbefehlssatz
CA2038264C (en) * 1990-06-26 1995-06-27 Richard James Eickemeyer In-memory preprocessor for a scalable compound instruction set machine processor
US5151981A (en) * 1990-07-13 1992-09-29 International Business Machines Corporation Instruction sampling instrumentation
JPH04111127A (ja) * 1990-08-31 1992-04-13 Toshiba Corp 演算処理装置
US5689428A (en) * 1990-09-28 1997-11-18 Texas Instruments Incorporated Integrated circuits, transistors, data processing systems, printed wiring boards, digital computers, smart power devices, and processes of manufacture
JP2532300B2 (ja) * 1990-10-17 1996-09-11 三菱電機株式会社 並列処理装置における命令供給装置
US5778219A (en) * 1990-12-14 1998-07-07 Hewlett-Packard Company Method and system for propagating exception status in data registers and for detecting exceptions from speculative operations with non-speculative operations
US5692169A (en) 1990-12-14 1997-11-25 Hewlett Packard Company Method and system for deferring exceptions generated during speculative execution
US5299321A (en) * 1990-12-18 1994-03-29 Oki Electric Industry Co., Ltd. Parallel processing device to operate with parallel execute instructions
US5446850A (en) 1991-01-15 1995-08-29 International Business Machines Corporation Cross-cache-line compounding algorithm for scism processors
JP2874351B2 (ja) 1991-01-23 1999-03-24 日本電気株式会社 並列パイプライン命令処理装置
EP0498067A2 (de) * 1991-02-08 1992-08-12 International Business Machines Corporation Mikrokodeerzeugung für eine Maschine mit skalierbarem Verbundbefehlssatz
EP0499661B1 (de) * 1991-02-19 1995-08-23 Inoue Seisakusho (Mfg) Co., Ltd. Planetenmischer
US5287467A (en) * 1991-04-18 1994-02-15 International Business Machines Corporation Pipeline for removing and concurrently executing two or more branch instructions in synchronization with other instructions executing in the execution unit
US5386531A (en) * 1991-05-15 1995-01-31 International Business Machines Corporation Computer system accelerator for multi-word cross-boundary storage access
US5404469A (en) * 1992-02-25 1995-04-04 Industrial Technology Research Institute Multi-threaded microprocessor architecture utilizing static interleaving
US5337415A (en) * 1992-12-04 1994-08-09 Hewlett-Packard Company Predecoding instructions for supercalar dependency indicating simultaneous execution for increased operating frequency
US5819088A (en) * 1993-03-25 1998-10-06 Intel Corporation Method and apparatus for scheduling instructions for execution on a multi-issue architecture computer
EP1102166B1 (de) * 1993-11-05 2003-05-21 Intergraph Corporation Superskalare Rechnerarchitektur mit Softwarescheduling
DE4430195B4 (de) * 1993-12-13 2004-09-23 Hewlett-Packard Co. (N.D.Ges.D.Staates Delaware), Palo Alto Verfahren zur Auswertung von Booleschen Ausdrücken
US5513363A (en) * 1994-08-22 1996-04-30 Hewlett-Packard Company Scalable register file organization for a computer architecture having multiple functional units or a large register file
GB2293670A (en) * 1994-08-31 1996-04-03 Hewlett Packard Co Instruction cache
US5664135A (en) * 1994-09-28 1997-09-02 Hewlett-Packard Company Apparatus and method for reducing delays due to branches
US5689653A (en) 1995-02-06 1997-11-18 Hewlett-Packard Company Vector memory operations
JP2931890B2 (ja) * 1995-07-12 1999-08-09 三菱電機株式会社 データ処理装置
US6179489B1 (en) * 1997-04-04 2001-01-30 Texas Instruments Incorporated Devices, methods, systems and software products for coordination of computer main microprocessor and second microprocessor coupled thereto
US5901318A (en) * 1996-05-06 1999-05-04 Hewlett-Packard Company Method and system for optimizing code
US5748936A (en) * 1996-05-30 1998-05-05 Hewlett-Packard Company Method and system for supporting speculative execution using a speculative look-aside table
US5999738A (en) 1996-11-27 1999-12-07 Hewlett-Packard Company Flexible scheduling of non-speculative instructions
US5943499A (en) * 1996-11-27 1999-08-24 Hewlett-Packard Company System and method for solving general global data flow predicated code problems
US5870576A (en) * 1996-12-16 1999-02-09 Hewlett-Packard Company Method and apparatus for storing and expanding variable-length program instructions upon detection of a miss condition within an instruction cache containing pointers to compressed instructions for wide instruction word processor architectures
US5864692A (en) * 1996-12-16 1999-01-26 Hewlett-Packard Company Method and apparatus for protecting memory-mapped devices from side effects of speculative instructions
US6065106A (en) * 1996-12-20 2000-05-16 Texas Instruments Incorporated Resuming normal execution by restoring without refetching instructions in multi-word instruction register interrupted by debug instructions loading and processing
US6081885A (en) * 1996-12-20 2000-06-27 Texas Instruments Incorporated Method and apparatus for halting a processor and providing state visibility on a pipeline phase basis
US6112298A (en) * 1996-12-20 2000-08-29 Texas Instruments Incorporated Method for managing an instruction execution pipeline during debugging of a data processing system
US6055628A (en) * 1997-01-24 2000-04-25 Texas Instruments Incorporated Microprocessor with a nestable delayed branch instruction without branch related pipeline interlocks
US6058474A (en) * 1997-01-24 2000-05-02 Texas Instruments Incorporated Method and apparatus for DMA boot loading a microprocessor without an internal ROM
US6128725A (en) 1997-01-24 2000-10-03 Texas Instruments Incorporated Microprocessor with an instruction for setting or clearing a bit field
US6078940A (en) * 1997-01-24 2000-06-20 Texas Instruments Incorporated Microprocessor with an instruction for multiply and left shift with saturate
US6374346B1 (en) * 1997-01-24 2002-04-16 Texas Instruments Incorporated Processor with conditional execution of every instruction
US6182203B1 (en) * 1997-01-24 2001-01-30 Texas Instruments Incorporated Microprocessor
US5958044A (en) * 1997-01-24 1999-09-28 Texas Instruments Incorporated Multicycle NOP
US6112291A (en) * 1997-01-24 2000-08-29 Texas Instruments Incorporated Method and apparatus for performing a shift instruction with saturate by examination of an operand prior to shifting
US6061780A (en) * 1997-01-24 2000-05-09 Texas Instruments Incorporated Execution unit chaining for single cycle extract instruction having one serial shift left and one serial shift right execution units
US5819058A (en) * 1997-02-28 1998-10-06 Vm Labs, Inc. Instruction compression and decompression system and method for a processor
US6298370B1 (en) 1997-04-04 2001-10-02 Texas Instruments Incorporated Computer operating process allocating tasks between first and second processors at run time based upon current processor load
US6105119A (en) * 1997-04-04 2000-08-15 Texas Instruments Incorporated Data transfer circuitry, DSP wrapper circuitry and improved processor devices, methods and systems
US5909559A (en) * 1997-04-04 1999-06-01 Texas Instruments Incorporated Bus bridge device including data bus of first width for a first processor, memory controller, arbiter circuit and second processor having a different second data width
US6125334A (en) * 1997-05-02 2000-09-26 Texas Instruments Incorporated Module-configurable full-chip power profiler
US5999739A (en) 1997-05-29 1999-12-07 Hewlett-Packard Company Method and apparatus for elimination of redundant branch instructions from a program
US5941983A (en) * 1997-06-24 1999-08-24 Hewlett-Packard Company Out-of-order execution using encoded dependencies between instructions in queues to determine stall values that control issurance of instructions from the queues
US6145027A (en) 1997-07-09 2000-11-07 Texas Instruments Incorporated DMA controller with split channel transfer capability and FIFO buffering allowing transmit channel to get ahead of corresponding receive channel by preselected number of elements
US6167466A (en) 1997-07-09 2000-12-26 Texas Instruments Incorporated Multi-channel serial port with programmable features
US5881280A (en) * 1997-07-25 1999-03-09 Hewlett-Packard Company Method and system for selecting instructions for re-execution for in-line exception recovery in a speculative execution processor
US5922065A (en) * 1997-10-13 1999-07-13 Institute For The Development Of Emerging Architectures, L.L.C. Processor utilizing a template field for encoding instruction sequences in a wide-word format
US6016555A (en) * 1997-11-19 2000-01-18 Texas Instruments Incorporated Non-intrusive software breakpoints in a processor instruction execution pipeline
US6055649A (en) * 1997-11-19 2000-04-25 Texas Instruments Incorporated Processor test port with scan chains and data streaming
US5970241A (en) * 1997-11-19 1999-10-19 Texas Instruments Incorporated Maintaining synchronism between a processor pipeline and subsystem pipelines during debugging of a data processing system
DE69737750T2 (de) * 1997-12-17 2008-03-06 Hewlett-Packard Development Co., L.P., Houston Erst- und Zweitprozessoren verwendetes Verfahren
US6376109B1 (en) * 1997-12-22 2002-04-23 Matsushita Electric Industrial Co., Ltd. Method and device for mounting cell
EP0926596B1 (de) * 1997-12-23 2007-09-05 Texas Instruments Inc. Prozessor und Verfahren zum Verringern von dessen Energieverbrauch
US6219796B1 (en) * 1997-12-23 2001-04-17 Texas Instruments Incorporated Power reduction for processors by software control of functional units
US6055828A (en) * 1997-12-30 2000-05-02 Closure Medical Corporation Treatment methods for glass medical adhesive applicators
US6321318B1 (en) 1997-12-31 2001-11-20 Texas Instruments Incorporated User-configurable on-chip program memory system
US6253359B1 (en) * 1998-01-29 2001-06-26 Texas Instruments Incorporated Method for analyzing circuit delays caused by capacitive coupling in digital circuits
US6381704B1 (en) * 1998-01-29 2002-04-30 Texas Instruments Incorporated Method and apparatus for altering timing relationships of non-overlapping clock signals in a microprocessor
US6263470B1 (en) * 1998-02-03 2001-07-17 Texas Instruments Incorporated Efficient look-up table methods for Reed-Solomon decoding
US5881260A (en) * 1998-02-09 1999-03-09 Hewlett-Packard Company Method and apparatus for sequencing and decoding variable length instructions with an instruction boundary marker within each instruction
US6173248B1 (en) * 1998-02-09 2001-01-09 Hewlett-Packard Company Method and apparatus for handling masked exceptions in an instruction interpreter
US6105123A (en) * 1998-03-10 2000-08-15 Hewlett-Packard Company High speed register file organization for a pipelined computer architecture
US6026479A (en) * 1998-04-22 2000-02-15 Hewlett-Packard Company Apparatus and method for efficient switching of CPU mode between regions of high instruction level parallism and low instruction level parallism in computer programs
US6317820B1 (en) 1998-06-05 2001-11-13 Texas Instruments Incorporated Dual-mode VLIW architecture providing a software-controlled varying mix of instruction-level and task-level parallelism
US6247172B1 (en) 1998-07-02 2001-06-12 Hewlett-Packard Company Method for a translation system that aggressively optimizes and preserves full synchronous exception state
US6260190B1 (en) * 1998-08-11 2001-07-10 Hewlett-Packard Company Unified compiler framework for control and data speculation with recovery code
US6442701B1 (en) * 1998-11-25 2002-08-27 Texas Instruments Incorporated Power saving by disabling memory block access for aligned NOP slots during fetch of multiple instruction words
US6378109B1 (en) * 1999-07-15 2002-04-23 Texas Instruments Incorporated Method of simulation for gate oxide integrity check on an entire IC
US6438747B1 (en) * 1999-08-20 2002-08-20 Hewlett-Packard Company Programmatic iteration scheduling for parallel processors
US6374403B1 (en) * 1999-08-20 2002-04-16 Hewlett-Packard Company Programmatic method for reducing cost of control in parallel processes
US6385757B1 (en) * 1999-08-20 2002-05-07 Hewlett-Packard Company Auto design of VLIW processors
US6408428B1 (en) * 1999-08-20 2002-06-18 Hewlett-Packard Company Automated design of processor systems using feedback from internal measurements of candidate systems
US6314431B1 (en) 1999-09-02 2001-11-06 Hewlett-Packard Company Method, system, and apparatus to improve instruction pre-fetching on computer systems
US6363516B1 (en) * 1999-11-12 2002-03-26 Texas Instruments Incorporated Method for hierarchical parasitic extraction of a CMOS design

Also Published As

Publication number Publication date
EP0652509A1 (de) 1995-05-10
DE69430018T2 (de) 2002-11-21
US7039791B2 (en) 2006-05-02
EP0974894B1 (de) 2002-02-27
HK1044056A1 (en) 2002-10-04
EP1369775A1 (de) 2003-12-10
DE69433124T2 (de) 2004-05-27
DE69433124D1 (de) 2003-10-09
HK1044056B (zh) 2004-04-16
EP1186995B1 (de) 2003-09-03
EP1186995A1 (de) 2002-03-13
EP0974894A3 (de) 2000-08-02
EP0974894A2 (de) 2000-01-26
US20030079112A1 (en) 2003-04-24
US5794003A (en) 1998-08-11
US20030191923A1 (en) 2003-10-09
DE69430018D1 (de) 2002-04-04
DE69424370D1 (de) 2000-06-15
EP0652509B1 (de) 2000-05-10
US6892293B2 (en) 2005-05-10

Similar Documents

Publication Publication Date Title
DE69424370T2 (de) Befehlscachespeicher mit Kreuzschienenschalter
DE69431998T2 (de) Superskalare Rechnerarchitektur mit Softwarescheduling
DE69433339T2 (de) Lade-/Speicherfunktionseinheiten und Datencachespeicher für Mikroprozessoren
DE69033065T2 (de) Mehrfachbefehlsdecoder
DE69327688T2 (de) Befehlsdecoder
DE3685913T2 (de) Vektorenverarbeitung.
DE69132495T2 (de) Verteilter Verarbeitungsspeicher
DE2542740C2 (de) Datenverarbeitungsanlage mit einer Mikroprogrammsteuerung
DE69017178T2 (de) Datenverarbeitungssystem mit Vorrichtung zur Befehlskennzeichnung.
DE19526007C2 (de) Horizontal partitionierter Befehls-Cache-Speicher
DE3486399T2 (de) Zentrale Verarbeitungseinheit mit der Fähigkeit, Befehle mit variablen Längen zu unterstützen.
DE68928727T2 (de) Cachespeicheranlage zum Versorgen eines Festworts eines Befehlscodes mit variabler Länge und Befehlsabrufanlage
DE3716229A1 (de) Mikroprozessorchip mit einem stapelrahmen-cache
DE4137515A1 (de) Integrierte halbleiterschaltungsvorrichtung mit darin integriertem speicher und operationseinheit
EP0010185B1 (de) Virtuell-Adressiervorrichtung für einen Computer
DE69710503T2 (de) Verzweigungsvorhersagemechanismus mit auswahlschaltern zum auswählen einer verzweigungsvorhersage
DE60006021T2 (de) VLIW-Prozessor und Programmkomprimierungsgerät and -verfahren
DE3741850A1 (de) Ausfuehrungseinheit fuer einen i/o-prozessor
DE2856680C2 (de)
DE60009496T2 (de) Mikroprozessor mit reduziertem kontextumschaltungsaufwand und verfahren
DE2556617C2 (de) Schiebe- und Rotierschaltung
DE19526008A1 (de) Vertikal partitionierter, primärer Befehls-Cache-Speicher
DE3114921A1 (de) Datenverarbeitungssystem
DE2906685C2 (de)
DE3852432T2 (de) Befehlssteuerungsvorrichtung für ein Computersystem.

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8327 Change in the person/name/address of the patent owner

Owner name: INTERGRAPH HARDWARE TECHNOLOGIES CO., LAS VEGAS, N