DE68926059T2 - Organization of an integrated cache unit for flexible use in the design of cache systems - Google Patents
Organization of an integrated cache unit for flexible use in the design of cache systemsInfo
- Publication number
- DE68926059T2 DE68926059T2 DE68926059T DE68926059T DE68926059T2 DE 68926059 T2 DE68926059 T2 DE 68926059T2 DE 68926059 T DE68926059 T DE 68926059T DE 68926059 T DE68926059 T DE 68926059T DE 68926059 T2 DE68926059 T2 DE 68926059T2
- Authority
- DE
- Germany
- Prior art keywords
- cache
- icu
- memory
- bus
- write
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 230000008520 organization Effects 0.000 title claims description 25
- 238000013461 design Methods 0.000 title abstract description 11
- 230000015654 memory Effects 0.000 claims abstract description 632
- 238000000034 method Methods 0.000 claims abstract description 33
- 230000006870 function Effects 0.000 claims description 73
- 239000000872 buffer Substances 0.000 claims description 69
- 238000013507 mapping Methods 0.000 claims description 30
- 238000004891 communication Methods 0.000 claims description 8
- 238000012545 processing Methods 0.000 claims description 7
- 230000003139 buffering effect Effects 0.000 claims 2
- 230000005540 biological transmission Effects 0.000 claims 1
- 238000013459 approach Methods 0.000 abstract description 3
- 230000001360 synchronised effect Effects 0.000 description 46
- 238000012546 transfer Methods 0.000 description 45
- 230000036316 preload Effects 0.000 description 16
- 230000002457 bidirectional effect Effects 0.000 description 14
- 238000012360 testing method Methods 0.000 description 14
- 238000012544 monitoring process Methods 0.000 description 11
- 230000000694 effects Effects 0.000 description 10
- 230000004044 response Effects 0.000 description 9
- 230000014509 gene expression Effects 0.000 description 8
- 230000004048 modification Effects 0.000 description 7
- 238000012986 modification Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 6
- 230000001343 mnemonic effect Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000003491 array Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 241000254158 Lampyridae Species 0.000 description 3
- 230000009471 action Effects 0.000 description 3
- 238000004513 sizing Methods 0.000 description 3
- 230000003213 activating effect Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 208000019300 CLIPPERS Diseases 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000004026 adhesive bonding Methods 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 208000021930 chronic lymphocytic inflammation with pontine perivascular enhancement responsive to steroids Diseases 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000008571 general function Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000006386 memory function Effects 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000009131 signaling function Effects 0.000 description 1
- 210000000225 synapse Anatomy 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F12/00—Accessing, addressing or allocating within memory systems or architectures
- G06F12/02—Addressing or allocation; Relocation
- G06F12/08—Addressing or allocation; Relocation in hierarchically structured memory systems, e.g. virtual memory systems
- G06F12/0802—Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches
- G06F12/0893—Caches characterised by their organisation or structure
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F12/00—Accessing, addressing or allocating within memory systems or architectures
- G06F12/02—Addressing or allocation; Relocation
- G06F12/08—Addressing or allocation; Relocation in hierarchically structured memory systems, e.g. virtual memory systems
- G06F12/0802—Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches
- G06F12/0862—Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches with prefetch
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2212/00—Indexing scheme relating to accessing, addressing or allocation within memory systems or architectures
- G06F2212/60—Details of cache memory
- G06F2212/601—Reconfiguration of cache memory
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Memory System Of A Hierarchy Structure (AREA)
- Advance Control (AREA)
Abstract
Description
Die Erfindung betrifft generell eine Vorrichtung zum Organisieren von Cache-Speichern, und insbesondere eine Vorrichtung zum Organisieren einer integrierten Cache-Speicher-Einheit, die ein flexibles Design eines Cache-Speicher-Systems ermöglicht. Die resultierende Cache-Speicher-Einheit ist programmierbar und zusätzlich zum Unterstützen von Ein-Prozessor- Operationen in der Lage, Mehrprozessor-Operationen z.B. durch die Implementierung von Copy-back- und Eigentümerschaftsschemata zu unterstützen; eine Hochgeschwindigkeits-Instruktionsund Daten-Verarbeitung in einer Umgebung eines Rechners mit vermindertem Befehlsvorrat (RISC) zu unterstützen; und sämtliche genannten Funktionen mit einer Architektur zu unterstützen, die zur Integration auf einem Einzelchip geeignet ist.The invention relates generally to an apparatus for organizing cache memories, and more particularly to an apparatus for organizing an integrated cache memory unit that enables flexible design of a cache memory system. The resulting cache memory unit is programmable and, in addition to supporting single-processor operations, is capable of supporting multiprocessor operations, e.g., by implementing copy-back and ownership schemes; supporting high-speed instruction and data processing in a reduced-instruction-set computing (RISC) environment; and supporting all of the foregoing functions with an architecture suitable for integration on a single chip.
Cache-Speicher und Steuereinrichtungen für Cache-Speicher sind weithin bekannt. Ferner sind Einrichtungen bekannt, bei denen sowohl die Speicher- als auch die Steuerfunktionen auf einem Einzelchip integriert sind. Zu diesen zählt die handelsübliche Einrichtung 43608, die von NEC hergestellt wird. Derartige Einrichtungen werden im folgenden als "integrierte" Cache- Speicher-Einheiten (Integrated Cache Units ICUs) bezeichnet.Cache memories and cache memory controllers are widely known. Devices are also known in which both the memory and control functions are integrated on a single chip. One such device is the commercially available 43608 device manufactured by NEC. Such devices are referred to below as "integrated" cache memory units (ICUs).
Bei herkömmlichen ICU-Einrichtungen werden bestimmte Algorithmen zum Cache-Speichern von Daten und Instruktionen verwendet, d.h. die Einrichtungen sind nicht programmierbar. Bisher ist es nicht gelungen, einen Cache-Speicher, eine Cache-Speicher- Steuereinrichtung und Programmierbarkeitsmerkmale auf einem Einzelchip zu integrieren, und zwar teilweise aufgrund der Schaltungsdichte und der Anforderungen an die Datenwege. Abgesehen von der fehlenden Programmierbarkeit hat keine bekannte ICU-Architektur die durch die Schaltungsdichte und die Anforderungen an den Datenweg verursachten Probleme überwinden können, die beim Unterstützen von Hochgeschwindigkeits-RISC- Verarbeitungssystemen, insbesondere von Hochgeschwindigkeits- RISC-Systemen mit Mehrprozessoreigenschaften auftreten.Conventional ICU devices use specific algorithms to cache data and instructions, meaning that the devices are not programmable. So far, it has not been possible to implement a cache memory, a cache memory It is difficult to integrate controller and programmability features on a single chip, in part because of circuit density and data path requirements. In addition to the lack of programmability, no known ICU architecture has been able to overcome the problems caused by circuit density and data path requirements that arise when supporting high-speed RISC processing systems, particularly high-speed RISC systems with multiprocessor capabilities.
Es wäre eine programmierbare integrierte Cache-Einheit wünschenswert, da sie die inhärente Flexibilität aufwiese, um die Wahl und/oder Modifikation von Cache-Algorithmen zu ermöglichen.A programmable integrated cache unit would be desirable as it would have the inherent flexibility to allow the choice and/or modification of cache algorithms.
Eine Einzelchip-ICU-Architektur mit dem genannten Programmierbarkeits-Merkmal wäre ferner wünschenswert, um den Platzbedarf und die Anforderungen an die Einheitsleistung zu minimieren. Zudem wäre es wünschenswert, in der Lage zu sein, eine derartige integrierte Cache-Speicher-Einheit zum Unterstützen von Hochgeschwindigkeits-Verarbeitungs-Operationen sowohl in der Ein- als auch der Mehrprozessor-Betriebsart zu verwenden, und zwar sowohl für RISC und Nicht-RISC-Umgebungen.A single-chip ICU architecture with the above-mentioned programmability feature would be further desirable to minimize area and unit power requirements. In addition, it would be desirable to be able to use such an integrated cache memory unit to support high-speed processing operations in both single- and multiprocessor modes, for both RISC and non-RISC environments.
Ein Artikel von D. Bursby in Electronic Design, Vol 35, Nr. 5 mit dem Titel "Intelligent cache-memory chip speeds access to most CPU's" beschreibt eine Architektur für integrierte Cache- Einheiten (ICU), bei der die Cache-Funktionen in einem Rechensystem implementiert sind. Das System weist eine zentrale Verarbeitungseinheit (CPU), einen Prozessorbus zur Komunikation zwischen der CPU und der ICU, und einen Speicherbus zur Kommunikation zwischen einem Speicher und der ICU auf. Eine mit dem Prozessorbus verbundene Prozessorbuseinheit steuert ein ICU/Prozessorbus-Interface, und eine mit dem Speicherbus verbundene Speicherbuseinheit steuert ein ICU/Speicherbus- Interface. Eine Cache-Einheit, die sowohl mit der Prozessorbuseinheit als auch mit der Speicherbuseinheit verbunden ist, weist eine Tag-Array-Einrichtung und eine Gültig-Array-Einrichtung mit einer zugehörigen Speicher-Array-Einrichtung auf. Die Tag-Array-Einrichtung, die Gültig-Array-Einrichtung und die Speicher-Array-Einrichtung sind als eine 4-Weg-satz-assoziative Cache-Einrichtung organisiert.An article by D. Bursby in Electronic Design, Vol 35, No. 5 entitled "Intelligent cache-memory chip speeds access to most CPU's" describes an integrated cache unit (ICU) architecture in which the cache functions are implemented in a computing system. The system includes a central processing unit (CPU), a processor bus for communication between the CPU and the ICU, and a memory bus for communication between a memory and the ICU. A processor bus unit connected to the processor bus controls an ICU/processor bus interface, and a memory bus unit connected to the memory bus controls an ICU/memory bus interface. A cache unit connected to both the processor bus unit and connected to the memory bus unit, comprises a tag array device and a valid array device with an associated memory array device. The tag array device, the valid array device and the memory array device are organized as a 4-way set associative cache device.
In einem Artikel von C.J. Conti in Computer Group News, März 1969, S. 10-13, mit dem Titel "Concepts for buffer storage" wird unter anderem ein satz-assoziatives Puffer-Design diskutiert, bei dem zur Puffer-Speicherung vorgesehene Blöcke, die jeweils mit einem zugehörigen Tag versehen sind, in Sätze gruppiert sind.In an article by C.J. Conti in Computer Group News, March 1969, pp. 10-13, entitled "Concepts for buffer storage," a set-associative buffer design is discussed, in which blocks intended for buffer storage, each of which is provided with an associated tag, are grouped into sets.
Ein Artikel von 1. Wilson in New Electronics, Vol 20, Nr. 7, 31. März 1987, S. 30,32,33, mit dem Titel "Extending 80386 performance" wird ein Cache-Speicher-System mit einem externen Speicher beschrieben.An article by 1. Wilson in New Electronics, Vol 20, No. 7, 31 March 1987, pp. 30,32,33, entitled "Extending 80386 performance" describes a cache memory system with an external memory.
In WESCON PROCEEDINGS, San Francisco, CA, 19-22. November 1985, Vol 29, 1985, Sitzung 6/5, Seiten 1-6, New York, US; H/ SACHS: "The fairchild dipper microprocessor family - A high- performance 32-bit processor" wird die Architektur der Familie der CLIPPER-Mikroprossoren beschrieben. Insbesondere wird in dem Dokument der separate Instruktions- und Daten-Cache-Speicher beschrieben, und es wird gezeigt, daß mittels des Betriebssystems die Cache-Strategie (Durchschreiben oder Rückkopieren) jeder Seite in dem Speicher zugewiesen werden kann. Der Seiten-Tabelleneintrag enthält ein Feld, um die Cache- Strategie für jede Seite zu definieren.In WESCON PROCEEDINGS, San Francisco, CA, 19-22 November 1985, Vol 29, 1985, Session 6/5, pages 1-6, New York, US; H/ SACHS: "The fairchild dipper microprocessor family - A high- performance 32-bit processor" the architecture of the CLIPPER microprocessor family is described. In particular, the document describes the separate instruction and data cache memory and shows that the operating system can assign the cache strategy (write through or copy back) to each page in the memory. The page table entry contains a field to define the cache strategy for each page.
Gemäß der Erfindung wird eine generell gemäß dem oben genannten Artikel von Bursby ausgestaltete ICU-Architektur geschaffen, die dadurch gekennzeichnet ist, daß die Cache-Speicher- Einheit ferner einen Satz spezieller Register aufweist, die mit einem Adress-Bus und einem Daten-Bus gekoppelt sind, wobei der Adress-Bus und der Daten-Bus mit der Prozessorbuseinheit und mit der Speicherbuseinheit gekoppelt sind, und mindestens eines der Register ein programmierbares Register ist, mittels dessen der Benutzer bestimmte ICU-Optionen und Verfahrensweisen wählt.According to the invention, an ICU architecture is provided generally as described in the above-mentioned article by Bursby, characterized in that the cache memory unit further comprises a set of special registers coupled to an address bus and a data bus, wherein the address bus and the data bus are coupled to the processor bus unit and to the memory bus unit, and at least one of the registers is a programmable register by means of which the user selects certain ICU options and procedures.
In der vorliegenden Beschreibung werden Verfahren und Vorrichtungen zur Realisierung einer integrierten Cache-Speicher- Einheit beschrieben, die in flexibler Weise für ein Cache- Speicher-System-Design verwendbar ist. Die bevorzugte Ausführungsform der Erfindung weist sowohl einen Cache-Speicher als auch eine Cache-Speicher-Steuereinrichtung auf einem einzelnen Chip auf, ist programmierbar und hat auch die anderen oben aufgeführten gewünschten Eigenschaften.In the present specification, methods and apparatus are described for implementing an integrated cache memory unit that is flexible for use in a cache memory system design. The preferred embodiment of the invention has both a cache memory and a cache memory controller on a single chip, is programmable, and also has the other desired properties listed above.
Gemäß der bevorzugten Ausführungsform der Erfindung wird das flexible Cache-Speicher-System-Design durch Verfahren und Vorrichtungen erzielt, die die vom Benutzer durchgeführte Spezifizierung gewünschter Cache-Speicher-Eigenschaften durch Setzen geeigneter Cache-Options-Bits erleichtern. Dies kann unter Software-Steuerung erfolgen und ermöglicht ein Hochleistungs-Cache-Speicher-System, das mit einer geringen Anzahl von Komponenten und mit niedrigen Kosten konzipiert werden und mit hoher Effizienz arbeiten kann.According to the preferred embodiment of the invention, flexible cache memory system design is achieved by methods and apparatus that facilitate user specification of desired cache memory characteristics by setting appropriate cache option bits. This can be done under software control and enables a high performance cache memory system that can be designed with a small number of components and at low cost and can operate with high efficiency.
Die bevorzugte Ausführungsform der Erfindung wird beschrieben im Kontext einer integrierten Cache-Speicher-Einheit (ICU), die 8 K-Byte von Daten, 512-20 Bit umfassende Wörter von Tags und die erforderliche Steuerung aufweist, um die Cache-Speicher-Funktionen sowohl in RISC- als auch in Nicht-RISC-Umgebungen voll zu implementieren. Die bevorzugte Ausführungsform der ICU weist zwei Busse auf, einen für das Prozessor-Interface und den anderen für ein Speicher-Interface. Ein Beispiel eines Prozessors und eines von der ICU unterstützten Hochgeschwindigkeits-Interface ist beschrieben in EP-A-0283115.The preferred embodiment of the invention is described in the context of an integrated cache unit (ICU) having 8K bytes of data, 512-20 bit words of tags and the necessary control to fully implement the cache functions in both RISC and non-RISC environments. The preferred embodiment of the ICU has two buses, one for the processor interface and the other for a memory interface. An example of a processor and a high speed interface supported by the ICU is described in EP-A-0283115.
Für die Zwecke dieser Beschriebung wird angenommen, daß die Prozessorbuseinrichtung ein nichtgemultiplexter 32 Bit-Adressund Daten-Bus ist. Der Prozessorbus unterstützt Burst- und Pipeline-Zugriffe gemäß der Lehre von EP-A-0283115. Ferner wird für die Zwecke dieser Beschreibung angenommen, daß der Speicherbus das Interface zu dem Hauptspeicher bildet und die Mehrprozessor-Organisationen aufnimmt.For the purposes of this description, it is assumed that the processor bus means is a non-multiplexed 32-bit address and data bus. The processor bus supports burst and pipeline accesses in accordance with the teaching of EP-A-0283115. Furthermore, for the purposes of this description, it is assumed that the memory bus forms the interface to the main memory and accommodates the multiprocessor organizations.
Gemäß der bevorzugten Ausführungsform der Erfindung ist die ICU in der Lage, mit Frequenzen oberhalb 25 Megahertz zu arbeiten, Prozessor-Zugriffszeiten von zwei Zyklen für den ersten Zugriff in einer Sequenz, und eines Zyklus für die Burst- Betriebsart oder Pipeline-Zugriffe zu erzielen. Die Erfindung kann entweder als Instruktions-Cache-Speicher oder als Daten- Cache-Speicher mit flexibler interner Cache-Speicher-Organisation verwendet werden. Ein RISC-Prozessor und zwei ICUs (für Instruktions-Cache-Speicherung und Daten-Cache-Speicherung) ergeben einen hoch leistungsfähigen Prozessor mit 16k Cache- Speicher-Bytes. Größere Cache-Speicher können durch Verwendung zusätzlicher ICUs konzipiert werden.According to the preferred embodiment of the invention, the ICU is capable of operating at frequencies above 25 megahertz, achieving processor access times of two cycles for the first access in a sequence, and one cycle for burst mode or pipelined accesses. The invention can be used either as an instruction cache or as a data cache with flexible internal cache organization. A RISC processor and two ICUs (for instruction caching and data caching) result in a high performance processor with 16k cache bytes. Larger caches can be designed by using additional ICUs.
Es werden Verfahren und Vorrichtungen zur Realisierung einer programmierbaren integrierten Cache-Speicher-Einheit beschrieben, die einen weiten Bereich von benutzerbestimmten Optionen aufweist, die z.B. zum Spezifizieren von Ersetzungs-Algorithmen, Cache-Speicher-Organisationen und Mehr-Prozessor-Unterstützungsschemata verwendet werden können.Methods and apparatus are described for implementing a programmable integrated cache memory unit having a wide range of user-defined options that can be used, for example, to specify replacement algorithms, cache memory organizations, and multi-processor support schemes.
Es werden Verfahren und Vorrichtungen zur Realisierung einer programmierbaren integrierten Cache-Speicher-Einheit beschrieben, die in der Lage ist, Hochgeschwindigkeits-Daten und Instruktions-Verarbeitungsvorgänge in Umgebungen sowohl mit RISC- als auch mit Nicht-RISC-Architektur zu unterstützen. Die Cache-Speicher-Einheit kann auf einem einzelnen Chip integriert ein, und die beschriebene ICU kann entweder als Daten- Cache-Speicher oder Instruktions-Cache-Speicher verwendet werden.Methods and apparatus are described for implementing a programmable integrated cache memory unit capable of supporting high speed data and instruction processing operations in both RISC and non-RISC architecture environments. The cache memory unit can be integrated on a single chip and the described ICU can be implemented either as a data Cache memory or instruction cache memory can be used.
Im folgenden werden die Zeichnungen, die lediglich als Beispiel zu verstehen sind, kurz erläutert.The drawings, which are intended only as examples, are briefly explained below.
Fig. 1 zeigt ein Blockschaltbild eines Rechensystems, das zwei der ICUs gemäß der Erfindung enthält.Fig. 1 shows a block diagram of a computing system containing two of the ICUs according to the invention.
Fig. 2 zeigt das Stift-Paket und die verschiedenen Eingänge und Ausgänge in/aus der erfindungsgemäßen ICU.Fig. 2 shows the pin package and the various inputs and outputs in/out of the ICU according to the invention.
Fig. 3 zeigt ein Daten-Flußdiagramm zur Veranschaulichung des über die ICU erfolgenden Datenflusses zwischen der Prozessorbuseinheit und der Speicherbuseinheit von Fig. 1.Fig. 3 shows a data flow diagram to illustrate the data flow via the ICU between the processor bus unit and the memory bus unit of Fig. 1.
Fig. 4 zeigt in vereinfachter Weise ein mit geteiltem Bus versehenes Mehrprozessorsystem mit zwei ICUs pro Prozessor, wobei die eine ICU als Instruktions-Cache- Speicher und die andere als Daten-Cache-Speicher verwendet wird.Fig. 4 shows a simplified split-bus multiprocessor system with two ICUs per processor, where one ICU is used as an instruction cache and the other as a data cache.
Fig. 1 zeigt eine typische Konfiguration eines Rechensystems, die die neuartige ICU enthalten kann.Fig. 1 shows a typical configuration of a computing system that can contain the novel ICU.
Aus rein illustrativen Zwecken wird die Erfindung im Zusammenhang mit einem RISC-Verarbeitungssystem beschrieben, das sowohl Ein- als auch Mehrprozessor-Betriebsarten aufweist. Dem Fachmann ist ersichtlich, daß die ICU, die im folgenden detailliert beschrieben wird, auch in Nicht-RISC-Umgebungen verwendet werden kann.For illustrative purposes only, the invention will be described in the context of a RISC processing system having both single and multiprocessor modes of operation. Those skilled in the art will appreciate that the ICU, which is described in detail below, can also be used in non-RISC environments.
Fig. 1 zeigt zwei der neuartigen ICUs. Die ICU 101 ist bei Verwendung als Instruktions-Cache-Speicher gezeigt, und die ICU 102 ist bei Verwendung als Daten-Cache-Speicher gezeigt.Figure 1 shows two of the novel ICUs. The ICU 101 is shown in use as an instruction cache, and the ICU 102 is shown in use as a data cache.
Ein Beispiel des gezeigten geeigneten Hochgeschwindigkeits- Interface, das den RISC-Stromlinien-Instruktionsprozessor (SIP) mit den Cache-Speichern verbindet, ist in EP-A-0283115 detailliert beschrieben.An example of the shown suitable high-speed interface connecting the RISC streamlined instruction processor (SIP) to the cache memories is described in detail in EP-A-0283115.
Diese hier einbezogene Anmeldung lehrt ferner die verschiedenen Betriebsarten des SIP, der Prozessor-Eingänge und -Ausgänge etc., auf die hier bezug genommen wird und die hinsichtlich der Weise, in der sie durch die neuartige ICU unterstützt werden, erläutert werden.This application, incorporated herein, further teaches the various modes of operation of the SIP, processor inputs and outputs, etc. referred to herein and explained in terms of the manner in which they are supported by the novel ICU.
Fig. 1 zeigt ferner den Prozessorbus, der aus dem Adressenbus 120 und dem Datenbus 121 besteht. Der Prozessor 110 greift auf die Instruktionen in dem Instruktions-ROM 150 und dem Instruktions-Cache-Speicher, der ICU 101, über den Adressenbus 120 zu. Wie gezeigt, werden die erfaßten Instruktionen über den Bus 125 an den Prozessor 110 übermittelt.Fig. 1 also shows the processor bus, which consists of the address bus 120 and the data bus 121. The processor 110 accesses the instructions in the instruction ROM 150 and the instruction cache memory, the ICU 101, via the address bus 120. As shown, the captured instructions are transmitted to the processor 110 via the bus 125.
Über den Adressenbus 120 erfolgt ferner ein Zugriff auf den Daten-Cache-Speicher, die ICU 102. Der bidirektionale Datenfluß zwischen dem Prozessor 110 und der ICU 102 kann in der gezeigten Weise über den Datenbus 121 erfolgen.The address bus 120 also provides access to the data cache memory, the ICU 102. The bidirectional data flow between the processor 110 and the ICU 102 can take place in the manner shown via the data bus 121.
Ein Speicherbus 175 ist als ein Bus gezeigt, der den Hauptspeicher 190 mit der ICU 101 und der ICU 102 verbindet. Um der Vollständigkeit willen ist ein arithmetischer Beschleuniger 195, der Teil einer typischen RISC-System-Konfiguration wäre, in Ankopplung an die Busse 120 und 121 gezeigt. Auch die Datent ransfersteuereinrichtungen (Data Transfer Controllers DTCS), die als DTC 198 gezeigt sind, können als Teil einer typischen Systemkonfiguration verwendet werden, z.B. um handelsübliche Peripherieeinrichtungen, deren Geschwindigkeiten wesentlich geringer sind als diejenige des Hochgeschwindigkeitsprozessors, an das System ankoppeln zu können, ohne die Leistungsfähigkeit des Prozessors, der Cache-Speicher-Einheiten etc. zu beschränken.A memory bus 175 is shown as a bus connecting main memory 190 to ICU 101 and ICU 102. For completeness, an arithmetic accelerator 195, which would be part of a typical RISC system configuration, is shown coupled to buses 120 and 121. Data transfer controllers (DTCS) shown as DTC 198 may also be used as part of a typical system configuration, e.g., to allow commercially available peripherals having speeds significantly lower than the high-speed processor to be coupled to the system without limiting the performance of the processor, cache memory units, etc.
Ein typischer arithmetischer Beschleuniger ist beschrieben in EP-A-0214775.A typical arithmetic accelerator is described in EP-A-0214775.
Bevor die detaillierte Beschreibung fortgesetzt wird, wird zunächst die neuartige integrierte Cache-Speicher-Architektur beschrieben, wobei der Klarheit halber die verwendeten generellen Cache-Speicher-Ausdrücke und Mehrprozessor-Cache-Speicher-Ausdrücke ihrerseits zunächst definiert werden müssen. Die hier verwendeten generellen Cache-Speicher-Ausdrücke sind wie folgt definiert:Before continuing with the detailed description, the novel integrated cache memory architecture is first described, whereby for the sake of clarity the general cache memory expressions and multiprocessor cache memory expressions used must first be defined. The general cache memory expressions used here are defined as follows:
Block - Ein Cache-Speicher-Block ist eine Gruppe sequentieller Wörter, die einem Tag zugeordnet sind. Ein Cache-Speicher- Block wird als Gruppe zugeordnet und ersetzt, wann immer es erforderlich ist. Bei der bevorzugten Ausführungsform der ICU besteht die Block-Größe aus vier Wörtern (ein Tag pro vier Wörter).Block - A cache block is a group of sequential words associated with a tag. A cache block is allocated as a group and replaced whenever necessary. In the preferred embodiment of the ICU, the block size is four words (one tag per four words).
Blockstatus - Status-Bits, die einem Cache-Speicher-Block zugeordnet sind. Gemäß der bevorzugten Ausführungsform der ICU existieren zwei Status-Bits pro Block. Diese spezifizieren den modifizierten und geteilten Status eines Blocks.Block Status - Status bits associated with a cache memory block. According to the preferred embodiment of the ICU, there are two status bits per block. These specify the modified and shared status of a block.
Blockstatusarray - Ein chipintegriertes Direktzugriffsspeicher-Array, das die Blockstatus-Bits enthält.Block status array - An on-chip random access memory array that contains the block status bits.
Rückkodieren (Copy-back) - Eine Schreibweise, bei der für den Fall eines Treffers ein Schreib-Zugriff nur in dem Cache-Speicher durchgeführt wird. Der Block, der die geschriebenen Daten enthält, wird als modifiziert markiert. Die Daten werden nur dann, wenn der modifizierte Block ersetzt wird, in den Hauptspeicher geschrieben (zurückkopiert).Copy-back - A writing technique in which, in the event of a hit, a write access is only performed in the cache memory. The block containing the written data is marked as modified. The data is only written (copied back) to main memory when the modified block is replaced.
Daten-Cache-Speicher - Ein Cache-Speicher, der zum Cache-Speichern häufig verwendeter Prozessordatenvariablen verwendet wird.Data Cache - A cache memory used to cache frequently used processor data variables.
Direkt abgebildet - Dies ist ein alternativer Ausdruck für eine Assoziativ-Organisation mit Einwege-Setzung. Eine bestimmte Adresse kann in dem Cache-Speicher nur an einer bestimmten Stelle cache-gespeichert (mittels der Adresse direkt abgebildet) werden.Directly mapped - This is an alternative term for a one-way associative organization. A given address can only be cached (directly mapped) at a specific location in the cache memory.
Treffer - Das durch die Zugriffsadresse bestimmte Wort ist in dem Cache-Speicher-Array vorhanden. Es wird eine Adressen- Übereinstimmung in dem Tag-Array festgestellt, und das entsprechende gültige Bit wird gesetzt.Hit - The word specified by the access address is present in the cache memory array. An address match is detected in the tag array and the corresponding valid bit is set.
Invalidieren - Eine Operation, die gültige Daten aus dem Cache-Speicher entfernt. Ein oder mehrere gültige Bits werden rückgesetzt, so daß die entsprechenden Wörter ungültig werden.Invalidate - An operation that removes valid data from the cache memory. One or more valid bits are reset, making the corresponding words invalid.
Instruktions-Cache-Speicher - Ein Cache-Speicher, dem zum Cache-Speichern häufig benutzter Prozessor-Instruktionen verwendet wird.Instruction Cache - A cache memory used to cach frequently used processor instructions.
Am weitesten zurückliegend verwendet (least recently used LRU) - Ein Ersetzungs-Algorithmus, bei dem der zu ersetzende Block entsprechend der Geschichte seiner Verwendung gewählt wird. Der Block, dessen Verwendung am weitesten zurückliegt, wird ersetzt.Least recently used (LRU) - A replacement algorithm in which the block to be replaced is chosen according to the history of its use. The block that has been used the furthest in the past is replaced.
Verriegelung im Cache-Speicher - Datenvariablen oder Instruktionen können in dem Cache-Speicher verriegelt werden. Sie werden nicht ersetzt, selbst wenn sie durch den Ersetzungs- Algorithmus gewählt werden. Es ist zu beachten, daß das noch zu beschreibende *LOCK-Eingangssignal zu der ICU Interlock- Verriegelungs-Operationen bestimmt und nicht für Operationen zur Verriegelung im Cache-Speicher verwendet wird. Jedem Block ist ein Verriegelungs-Bit zugeordnet, um die Verriegelung des Blocks zu erleichtern.Cache Locking - Data variables or instructions can be locked in cache. They will not be replaced even if they are selected by the replacement algorithm. Note that the *LOCK input signal, to be described later, is intended for ICU interlock locking operations and is not used for cache locking operations. Each block has a lock bit associated with it to facilitate block locking.
Sdeicher-Arrav - Chipintegriertes Direktzugriffsspeicher-Array, das die cache-gespeicherten Daten oder Instruktionen enthält.Cache Array - On-chip random access memory array that contains cached data or instructions.
Speicherbus - Der Bus, der den Cache-Speicher mit dem Hauptspeicher verbindet.Memory bus - The bus that connects cache memory to main memory.
Fehlgänger - Das durch die Zugriffsadresse bestimmte Wort ist in dem Cache-Speicher-Array nicht vorhanden.Miss - The word specified by the access address is not present in the cache memory array.
Modifizierter Block - Ein Block wird als modifiziert markiert, wenn er in einer Copy-back-Schreibweise geschrieben wird. Dies zeigt an, daß der Block relativ zu dem Hauptspeicher modifiziert ist und die aktuellere Version der Daten enthält.Modified Block - A block is marked as modified if it is written in a copy-back notation. This indicates that the block is modified relative to main memory and contains the more recent version of the data.
Nicht cache-speicherbar - Eine Instruktion oder Datenvariable, die nicht cache-gespeichert werden kann. Eine nicht cachespeicherbare Operation wird durch die ICU zu dem Speicherbus übertragen. Der Cache-Speicher wird nicht nach ihr abgesucht, und es wird kein Cache-Speicher-Block zugeordnet.Non-cacheable - An instruction or data variable that cannot be cached. A non-cacheable operation is transferred to the memory bus by the ICU. The cache is not searched for it, and no cache block is allocated.
Vorabruf - Die Operation zum Abrufen von Datenvariablen oder Instruktionen in den Cache-Speicher, bevor sie angefordert werden.Prefetch - The operation of retrieving data variables or instructions into cache memory before they are requested.
Vorabruf-Puffer - Ein Puffer, der aus dem Speicherpuffer ausgelesene vorabgerufene Datenvariablen oder Instruktionen hält, bevor sie in den Cache-Speicher geschrieben werden. In der ICU wird der Lesepuffer in der Funktion eines Vorabruf-Puffers verwendet.Prefetch Buffer - A buffer that holds prefetched data variables or instructions read from the store buffer before they are written to cache memory. In the ICU, the read buffer is used in the function of a prefetch buffer.
Vorladen - Eine spezielle Vorabruf-Operation, die den Cache- Speicher mit spezifischen Datenvariablen oder Instruktionen lädt. Die Adressen für die Vorlade-Operation werden von dem Benutzer bestimmt, im Gegensatz zu anderen Vorabruf-Operationen, bei denen die vorabgerufenen Adressen von dem Cache- Speicher bestimmt werden.Preload - A special prefetch operation that loads the cache memory with specific data variables or instructions. The addresses for the preload operation are specified by the user, unlike other prefetch operations, where the prefetched addresses are determined from the cache memory.
Prozessorbus - Der Bus, der den Cache-Speicher mit dem Prozessor verbindet.Processor bus - The bus that connects the cache memory to the processor.
Beliebiges Ersetzen - Ein Ersetzungs-Algorithmus, bei dem der zu ersetzende Block beliebig gewählt wird.Arbitrary Replacement - A replacement algorithm in which the block to be replaced is chosen arbitrarily.
Lesepuffer - Ein Puffer, der die aus dem Speicherbus ausgelesenen Datenvariablen oder Instruktionen hält, bevor sie in den Cache-Speicher geschrieben werden. Bei der bevorzugten Ausführungsform der ICU weist der Lesepuffer eine Tiefe von vier Wörtern auf, und er wird auch in der Funktion eines Vorabrufpuffers verwendet.Read Buffer - A buffer that holds the data variables or instructions read from the memory bus before they are written to the cache. In the preferred embodiment of the ICU, the read buffer is four words deep and is also used in the function of a prefetch buffer.
Durch-Lesen - Im Fall eines Cache-Speicher-Fehlgängers werden die erforderlichen Daten oder Instruktionen an den Prozessor übermittelt, sobald sie von dem Speicher akzeptiert sind. Die Neulade-Operation wird parallel dazu abgeschlossen. In einem Cache-Speicher ohne Durch-Lesen wird die Neulade-Operation abgeschlossen, bevor die angeforderten Daten oder Instruktionen an den Prozessor übermittelt werden.Read-through - In the event of a cache miss, the required data or instructions are delivered to the processor as soon as they are accepted by the memory. The reload operation completes in parallel. In a cache without read-through, the reload operation completes before the requested data or instructions are delivered to the processor.
Neuladen - Die Operation, die im Fall eines Daten-Speicher- Fehlgängers durchgeführt wird, um die angeforderten Daten oder Instruktionen aus dem Hauptspeicher abzurufen.Reload - The operation performed in the event of a data-memory miss to retrieve the requested data or instructions from main memory.
Ersetzungs-Algorithmus - Der Algorithmus, der den zu ersetzenden Block bestimmt, wenn ein neuer Block in dem Cache-Speicher plaziert wird. Es wird ein Block aus dem die erforderliche neue Adresse enthaltenden Satz gewählt.Replacement algorithm - The algorithm that determines the block to be replaced when a new block is placed in the cache. A block is chosen from the set containing the required new address.
Umfang - Dieser Ausdruck wird im Zusammenhang mit Cache-Instruktionen gewählt, um den Umfang des Effektes der Instruktion zu definieren. Die Instruktion kann eine bestimmte ICU, mehrere Instruktions-Cache-Speicher, mehrere Daten-Cache-Speicher oder mehrere Instruktions-und Daten-Cache-Speicher beinflussen.Scope - This term is used in the context of cache instructions to define the scope of the instruction's effect. The instruction can specify a specific ICU, affect multiple instruction caches, multiple data caches, or multiple instruction and data caches.
Satz - Eine Gruppe von Tags und der zugeordneten Cache-Blocks, die gelesen und gleichzeitig mit den erforderlichen Adresssen verglichen werden. Es kann eine Übereinstimmung mit jedem der Tags des Satzes festgestellt werden. Der Satz wird entsprechend einiger der Adressenbits bestimmt. Die Anzahl der Tags in dem Satz gleicht der Anzahl von "Wegen" (die im folgenden definiert werden) in der Cache-Organisation.Set - A group of tags and their associated cache blocks that are read and compared simultaneously with the required addresses. A match can be found with any of the tags in the set. The set is determined according to some of the address bits. The number of tags in the set equals the number of "ways" (defined below) in the cache organization.
Satz-assoziativ - Eine Cache-Organisation, die die Cache-Speicherung einer bestimmten Adresse in einer Anzahl möglicher Stellen in dem Cache-Speicher erlaubt. Diese Anzahl wird als der Grad der Assoziativität bezeichnet. Sie bestimmt die Anzahl von "Wegen" in der Cache-Organisation und die Anzahl von Tags, die gelesen und gleichzeitig verglichen werden. Die offenbarte ICU unterstützt Zwei-Wege- und Ein-Weg-satz-assoziative Organisationen.Set-associative - A cache organization that allows a given address to be cached in a number of possible locations in the cache memory. This number is called the degree of associativity. It determines the number of "ways" in the cache organization and the number of tags that are read and compared simultaneously. The disclosed ICU supports two-way and one-way set-associative organizations.
Unterblock - Eine Gruppe von einem oder mehreren Wörtern, die zusammen mit dem verlangten Wort für die Neulade-Operation aus dem Hauptspeicher abgerufen werden. Die Bemessung des Unterblocks definiert die maximale Anzahl von Wörtern, die abgerufen werden. Die Bemessung des Unterblocks ist kleiner als die Bemessung des Blocks oder dieser gleich.Subblock - A group of one or more words that are fetched from main memory along with the requested word for the reload operation. The size of the subblock defines the maximum number of words that will be fetched. The size of the subblock is less than or equal to the size of the block.
Tag - Das Tag identifiziert die Adresse der Daten oder Instruktionen, die momentan in dem Cache-Speicher vorhanden sind. Jedem Cache-Speicher-Block ist ein Cache-Speicher-Tag zugeordnet, und dieses ist in dem Tag-Speicher-Array gespeichert. Bei der bevorzugten Ausführungsform der ICU entspricht jedes Tag einem Vier-Wort-Block.Tag - The tag identifies the address of the data or instructions currently present in the cache memory. Each cache memory block is associated with a cache memory tag and is stored in the tag memory array. In the preferred embodiment of the ICU, each tag corresponds to a four-word block.
Tag-Array - Chipintegriertes Direktzugriffsspeicher-Array, das die Adressen-Tags für die cache-gespeicherten Daten oder Instruktionen enthält.Tag Array - On-chip random access memory array that contains the address tags for the cached data or instructions.
Aktualisierung des Speichers - Eine Operation, die die Aktualisierung des Hauptspeichers von dem Cache-Speicher her veranlaßt. Ein modifizierter Block wird von dem Cache-Speicher in den Hauptspeicher geschrieben, so daß der Speicher mit der aktuellsten Version der Daten aktualisiert wird.Refresh memory - An operation that causes the update of main memory from cache memory. A modified block is written from cache memory to main memory so that memory is updated with the most recent version of the data.
Gültiges Array - Chipintegriertes Direktzugriffsspeicher-Array, das die gültigen Bits enthält.Valid Array - On-chip random access memory array that contains the valid bits.
Gültiges Bit - Ein Bit, das die Gültigkeit der cache-gespeicherten Daten angibt. Bei der bevorzugten Ausführungsform der ICU ist jedem cache-gespeicherten Wort ein gültiges Bit zugeordnet.Valid Bit - A bit that indicates the validity of the cached data. In the preferred embodiment of the ICU, each cached word has a valid bit associated with it.
Weg - Eine Gruppe von Tags, die einem Tag-Array-Modul zugeordnet sind. Von jedem Weg wird nur ein Tag, das von dem Adressendekodierer des Moduls bestimmt wird, gelesen und verglichen. Bei der bevorzugten Ausführungsform der ICU existieren zwei Wege, von denen jeder 256 Tags aufweist.Way - A group of tags associated with a tag array module. From each way, only one tag, determined by the module's address decoder, is read and compared. In the preferred embodiment of the ICU, there are two ways, each with 256 tags.
Schreib-Zuordnen - Im Fall eines Cache-Speicher-Fehlgängers für die Schreib-Operation wird für den Block, der die geschriebene Adresse enthält, ein Cache-Speicher-Block zugeordnet. Für den verlangten Block wird eine Neulade-Operation durchgeführt. Für das Nicht-Schreib-Zuordnen wird kein Cache- Speicher-Block zugeordnet, und das Schreiben wird nur in dem Speicher durchgeführt.Write Mapping - In case of a cache miss for the write operation, a cache block is allocated for the block containing the written address. A reload operation is performed for the requested block. For non-write mapping, no cache block is allocated and the write is performed only in the memory.
Schreibduffer - Ein Puffer, der die Schreibzugriffsinformation (Adressen, Daten und Steuerung) hält, bis der Schreib-Zugriff für den Speicherbus durchgeführt wird. Die bevorzugte Ausführungsform der ICU enthält einen vierfach tiefen Schreibpuffer, der bis zu vier Schreib-Zugriffe halten kann.Write buffer - A buffer that holds the write access information (address, data and control) until the write access is performed for the memory bus. The preferred embodiment The ICU contains a quad-deep write buffer that can hold up to four write accesses.
Durch-Schreiben - Ein Schreibweise, bei der jeder Schreib- Zugriff in den Hauptspeicher hinein durchgeführt wird. Im Fall eines Cache-Speicher-Treffers werden die Daten auch in den Cache-Speicher geschrieben.Write-through - A write style in which every write access is made into main memory. In the event of a cache hit, the data is also written to the cache.
Die hier verwendeten Mehrprozessor-Cache-Speicher-Termini sind wie folgt definiert:The multiprocessor cache memory terms used here are defined as follows:
Bus-Überwachung - Der Speicherbus wird von den Slave-Cache- Speichern überwacht (beobachtet). Diese vergleichen die übertragenen Adressen mit den Pufferadressen. Falls eine Übereinstimmung festgestellt wird, kann eine spezielle Operation durchgeführt werden. Die Ausdrücke "Bus-Schnüffeln" oder "Cache-Speicher-Schnüffeln" sind Äquivalente.Bus monitoring - The memory bus is monitored (observed) by the slave caches. These compare the transmitted addresses with the buffer addresses. If a match is found, a special operation can be performed. The terms "bus sniffing" or "cache sniffing" are equivalent.
Cache-Speicher-Konsistenz - Dies ist ein anderer Ausdruck zur Beschreibung der Datenkonsistenz in einem Mehrprozessor-Cache- Speicher-System.Cache consistency - This is another term to describe data consistency in a multiprocessor cache system.
Datenkonsistenz - Diese ist das Hauptproblem in Mehrprozessor- Cache-Speicher-Systemen. Falls eine Variable von mehreren Prozessoren gemeinsam benutzt wird, kann sie in mehreren Cache-Speichern gespeichert werden. Die aktuellste Version der Variablen muß zugeführt werden, wann immer ein Zugriff auf die Variabale erfolgt. Dies gewährleistet die Konsistenz der Datenvariablen über das gesamte System hinweg.Data Consistency - This is the main problem in multiprocessor cache systems. If a variable is shared by multiple processors, it can be stored in multiple caches. The most recent version of the variable must be supplied whenever the variable is accessed. This ensures consistency of the data variables across the entire system.
Datenintervention - Eine Operation, die von einem Slave-Cache- Speicher durchgeführt werden kann, wenn bei einem Speicherbus- Lese-Zugriff eine Übereinstimmung festgestellt wird. Falls der Slave-Cache-Speicher modifizierte Daten (die aktuellste Version der Daten) enthält, greift er in den Zugriff ein und führt die Daten zu. In diesem Fall darf der Hauptspeicher die Daten nicht zuführen.Data Intervention - An operation that can be performed by a slave cache when a match is detected on a memory bus read access. If the slave cache contains modified data (the most recent version of the data), it intervenes in the access and supplies the data. In this case, the main memory must not supply the data.
Exklusiv - Gibt an, daß eine Variable oder ein Cache-Speicher- Block exklusiv in einem Cache-Speicher vorhanden ist. Die Variable oder der Cache-Speicher-Block kann exklusiv von einem einzigen Prozessor benutzt werden, oder sie können von mehreren Prozessoren benutzt werden, existieren jedoch nur in einem einzigen Cache-Speicher. Bei der bevorzugten Ausführungsform der ICU zeigt ein LOW in dem gemeinsam benutzten Blockstatus-Bit einen exklusiven Block an. Der Block kann entweder exklusiv unmodifiziert oder exklusiv modifiziert sein.Exclusive - Indicates that a variable or cache block exists exclusively in a cache. The variable or cache block may be used exclusively by a single processor, or it may be used by multiple processors but only exists in a single cache. In the preferred implementation of the ICU, a LOW in the shared block status bit indicates an exclusive block. The block may be either exclusively unmodified or exclusively modified.
Verriegelung - Verriegelungs-Operationen werden benutzt, um eine Variable (Verriegelungsvariable) zeitweilig zur exklusiven Verwendung durch einen Prozessor zu verriegeln. Keine anderen Prozessoren oder Cache-Speicher dürfen die Variable verwenden, während sie verriegelt ist. Das * LOCK-Eingangssignal in die ICU zeigt, wie noch erläutert wird, eine Verriegelungs-Operation an.Locking - Locking operations are used to temporarily lock a variable (lock variable) for exclusive use by a processor. No other processors or caches are allowed to use the variable while it is locked. The * LOCK input to the ICU indicates a locking operation, as explained below.
Master-Cache-Speicher - Ein Cache-Speicher, der ein Master des Speicherbusses ist. Er gibt die Anforderung aus und erwartet eine Reaktion.Master Cache - A cache that is a master of the memory bus. It issues the request and awaits a response.
Übereinstimmung - Die Adresse des Speicherbus-Zugriffs stimmt mit einer der Adressen überein, die in dem Tag-Puffer vorhanden sind, und das entsprechende Wort ist gültig. Der Ausdruck wird für den Speicherbusadressenvergleich verwendet und ist dem Ausdruck "Treffer" äquivalent, der für den Prozesorbus verwendet wird.Match - The memory bus access address matches one of the addresses present in the tag buffer and the corresponding word is valid. The expression is used for memory bus address comparison and is equivalent to the "hit" expression used for the processor bus.
Eigentümerschaft - Dabei handelt es sich um ein Schema zum Garantieren von Datenkonsistenz. Der aktuellste Wert der Variablen ist Eigentum eines Cache-Speichers oder des Hauptspeichers. Es unterliegt der Verantwortung des Eigentümers, die Konsistenz der Variablen aufrechtzuerhalten. Es gibt verschiedene Eigentümerschaftsschemata, die sich hinsichtlich der Anzahl von Zuständen, die einer Variablen zugeteilt sind, und der Algorithmen für Eigentümerschafts- und Zustandsübergänge unterscheiden.Ownership - This is a scheme to guarantee data consistency. The most recent value of the variable is owned by a cache or main memory. It is the responsibility of the owner to maintain the consistency of the variable. There are several ownership schemes that differ in the number of states assigned to a variable and the algorithms for ownership and state transitions.
Gemeinsam benutzt - Dieser Ausdruck gibt an, daß eine Variable oder ein Cache-Speicher-Block von mehr als einem Prozessor gemeinsam benutzt wird. Eine gemeinsam benutzte Variable kann in mehr als einem Cache-Speicher vorhanden sein. Bei der bevorzugten Ausführungsform der ICU zeigt ein HIGH in dem gemeinsam benutzten Blockstatus-Bit einen gemeinsam benutzen Block an. Der Block kann entweder bei gemeinsamer Benutzung unmodifiziert oder bei gemeinsamer Benutzung modifiziert sein.Shared - This term indicates that a variable or cache block is shared by more than one processor. A shared variable can be present in more than one cache. In the preferred embodiment of the ICU, a HIGH in the shared block status bit indicates a shared block. The block can be either unmodified when shared or modified when shared.
Bei gemeinsamer Benutzunq modifiziert - Ein Blockstatus in der ICU, der angibt, daß ein Cache-Speicher-Block gemeinsam benutzt und modifiziert ist. Der Ausdruck gibt ferner an, daß der Block Eigentum des Cache-Speichers ist, und daß es sich um den aktuellsten Wert des Blocks in dem System handelt.Shared Modified - A block state in the ICU that indicates that a cache block is shared and modified. The expression also indicates that the block is owned by the cache and that it is the most recent value of the block in the system.
Slave-Cache-Speicher - Ein Cache-Speicher, der nicht der Master des Speicherbusses ist. Zur Erzielung von Datenkonsistenz kann ein Slave-Cache-Speicher den Speicherbus überwachen.Slave cache - A cache that is not the master of the memory bus. To achieve data consistency, a slave cache can monitor the memory bus.
Schnüffeln - Ein anderer Ausdruck für "Bus-Überwachung". Die Ausdrücke "Bus-Schnüffeln" oder "Cache-Speicher-Schnüffeln" sind weitere Äquivalente.Sniffing - Another term for "bus monitoring". The terms "bus sniffing" or "cache memory sniffing" are other equivalents.
Nach der vorstehenden Definition der hier verwendeten Ausdrücke wird die bevorzugte Ausführungsform der neuartigen ICU im folgenden detailliert beschrieben, und zwar hinsichtlich ihrer Stiftelemente und ihrer funktionellen Organisation.Having defined the terms used herein above, the preferred embodiment of the novel ICU is described in detail below with respect to its pin elements and functional organization.
Was die Beschreibung der Stifte anbelangt, ist anzumerken, daß der Ausdruck "Dreizustand" verwendet wird, um Signale zu beschreiben, die während des normalen Betriebs in den Hochimpedanzzustand gebracht werden können. Sämtliche Ausgangssignale (außer MSERR, das noch zu beschreiben ist) können durch das *TEST-Eingangssignal (das ebenfalls noch zu beschreiben ist) in den Hochimpedanzzustand gebracht werden.Regarding the description of the pins, it should be noted that the term "tri-state" is used to describe signals that can be driven to the high impedance state during normal operation. All output signals (except MSERR, which is to be described) can be driven to the high impedance state by the *TEST input signal (which is also to be described).
Bei der bevorzugten Ausführungsform der neuartigen ICU handelt es sich um einen CMOS mit einem 169 Pin Grid Array-Paket, wie Fig. 2 zeigt.The preferred embodiment of the novel ICU is a CMOS with a 169 pin grid array package, as shown in Fig. 2.
Das Prozessorbus-Interface, das zuerst beschrieben wird, weist die folgenden Merkmale auf:The processor bus interface, which is described first, has the following features:
Der Adressenbus, die Stifte A0-A31 von Fig. 2, ist ein ICU-Eingang, ist synchron ausgelegt und übermittelt die Byte-Adresse für den Cache-Speicher-Zugriff auf den Prozessorbus.The address bus, pins A0-A31 of Fig. 2, is an ICU input, is synchronous, and carries the byte address for cache memory access to the processor bus.
Die Zugriffsstatussteuersignale (Access Status Control- Signale), gezeigt als ASTC0 und ASTC1 in Fig. 2), sind synchrone Eingangssignale, die die einem Zugriff zugeordnete Statussteuerung bestimmen. Gemäß der bevorzugten Ausführungsform der Erfindung sind sie wie folgt kodiert: Bedeutung Exklusives Durch-Schreiben Exklusives Copy-back Gemeinsam benutzt Nicht cache-speicherbarThe Access Status Control signals (shown as ASTC0 and ASTC1 in Fig. 2) are synchronous input signals that determine the status control associated with an access. According to the preferred embodiment of the invention, they are encoded as follows: Meaning Exclusive write-through Exclusive copy-back Shared Not cacheable
Diese Eingangssignale sind normalerweise mit den Ausgängen MPGMo-MPGM1 des Prozessors 110 gekoppelt, wie in der hier einbezogenen Anmeldung, in der Prozessorausgänge beschrieben sind, erläutert ist.These input signals are normally coupled to the outputs MPGMo-MPGM1 of the processor 110, as shown in the incorporated application describing processor outputs.
*BINV (Bus Invalid), Bus ungültig, ist ein synchrones ICU- Eingangssignal im aktiven LOW-Zustand, das anzeigt, daß der Adressenbus und die damit zusammenhängenden Steuerungen ungültig sind. Das Signal definiert einen Leerlaufzyklus in dem Prozessorbus 120.*BINV (Bus Invalid) is an active LOW synchronous ICU input signal indicating that the address bus and associated controls are invalid. The signal defines an idle cycle in the processor bus 120.
*CBACK (Cache Burst Acknowledge), Cache-Speicher-Burst- Bestätigung, ist ein ICU-Ausgangssignal, das synchron und im aktiven LOW-Zustand ist. Dieses Ausgangssignal wird jedes Mal geltend gemacht, wenn auf dem Prozessorbus 120 ein in der Burst-Betriebsart erfolgender Cache-Speicher- Zugriff durchgeführt worden ist.*CBACK (Cache Burst Acknowledge) is an ICU output signal that is synchronous and active LOW. This output signal is asserted each time a burst mode cache access has been made on processor bus 120.
*CBREQ (Cache Burst Request), Cache-Speicher-Burst-Anforderung, ist ein ICU-Eingangssignal, das synchron und im aktiven LOW-Zustand ist. Dieses Eingangssignal wird verwendet, um einen Burst-Betriebsart-Cache-Speicher-Zugriff auf den Prozessorbus durchzuführen und während eines Burst-Betriebsart-Cache-Speicher-Zugriffs den nächsten Transfer anzufordern. Dieses Signal kann im Vergleich zu *DREQ oder *IREQ, die noch beschrieben werden, spät in dem Zyklus gültig werden.*CBREQ (Cache Burst Request) is an ICU input signal that is synchronous and in the active LOW state. This input signal is used to perform a burst mode cache access on the processor bus and to request the next transfer during a burst mode cache access. This signal may become valid late in the cycle compared to *DREQ or *IREQ, which will be described later.
*CERR (Cache Error), Cache-Speicher-Fehler, ist ein ICU- Ausgangssignal, das synchron und im aktiven LOW-Zustand ist. Dieses Ausgangssignal zeigt an, daß während des aktuellen Cache-Speicher-Zugriffs ein Fehler aufgetreten ist.*CERR (Cache Error) is an ICU output signal that is synchronous and in the active LOW state. This output signal indicates that an error has occurred during the current cache access.
*CRDY (Cache Ready), Cache Speicher bereit, ist ein ICU- Ausgangssignal, das synchron und im aktiven LOW-Zustand ist. Bei Prozessorbus-Cache-Speicher-Lesevorgängen zeigt dieses Signal an, daß sich auf dem Cache-Speicher-Bus gültige Daten befinden. Bei Cache-Speicher-Schreibvorgängen zeigt das Signal an, daß Daten auf dem Cache-Speicher-Bus nicht angesteuert werden müssen.*CRDY (Cache Ready) is an ICU output signal that is synchronous and active LOW. During processor bus cache reads, this signal indicates that there is valid data on the cache bus. During cache writes, The signal indicates that data on the cache memory bus does not need to be accessed.
CREQT0-CREQT1 (Cache Request Type), Cache-Speicher-Anforderungstyp, ist ein synchrones Eingangssignal. Diese Signale spezifizieren den Adressenraum auf dem Prozessorbus wie folgt: Daten-Cache-Speicher-Verwendung Bedeutung Speicher-Zugriff Eingangs/Ausgangs-Zugriff Koprozessor-Transfer(von der ICU ignoriert) Instruktions-Cache-Speicher-Verwendung Bedeutung Speicher-Zugriff Instruktions-Nurlesespeicher-ZugriffCREQT0-CREQT1 (Cache Request Type) is a synchronous input signal. These signals specify the address space on the processor bus as follows: Data Cache Memory Usage Meaning Memory Access Input/Output Access Coprocessor Transfer (ignored by the ICU) Instruction Cache Memory Usage Meaning Memory Access Instruction Read Only Memory Access
Für die Instruktions-Cache-Speicher-Verwendung weist CREQT1 eine spezielle Funktion auf. Es wird während RESET abgetastet, und falls der Abtastwert HIGH ist, reagiert die ICU auf Instruktions-ROM-Zugriffe. Falls der Abtastwert LOW ist, reagiert die ICU nicht auf Instruktions-ROM- Zugriffe. Nach RESET wird das CREQT1-Eingangssignal bei der Instruktions-Cache-Speicher-Verwendung ignoriert.For instruction cache usage, CREQT1 has a special function. It is sampled during RESET, and if the sample value is HIGH, the ICU responds to instruction ROM accesses. If the sample value is LOW, the ICU does not respond to instruction ROM accesses. After RESET, the CREQT1 input is ignored during instruction cache usage.
*CSEL (Chip Select), Chip-Wahl, ist ein synchrones Eingangssignal, das im aktiven LOW-Zustand ist. Ein aktiver Pegel am *CSEL-Eingang wählt die ICU für Prozessorbus- Cache-Speicher-Instruktions-Zugriffe. Es wird nicht für normale Speicher-Zugriffe verwendet. Der *CSEL-Eingang kann über das Chipwahlabbildungsregister, einen noch zu beschreibenden Teil der ICU, deaktiviert werden. Wenn *CSEL aktiviert und nicht geltend gemacht wird, reagiert die ICU nicht auf Prozessorbus-Cache-Speicher-Instruktions-Zugriffe.*CSEL (Chip Select) is a synchronous input signal that is in the active LOW state. An active level at the *CSEL input selects the ICU for processor bus Cache memory instruction accesses. It is not used for normal memory accesses. The *CSEL input can be disabled via the chip select map register, a part of the ICU to be described later. If *CSEL is enabled and not asserted, the ICU does not respond to processor bus cache memory instruction accesses.
*CSM (Chip Select for Memory access), Chip-Wahl für Speicher-Zugriff, ist ein synchrones ICU-Eingangssignal, das im aktiven LOW-Zustand ist. Ein aktiver Pegel am *CSM Eingang wählt die ICU für Speicher-Zugriffe. Das Signal kann für Cache-Speicher-Erweiterungen und Cache-Speicher- Adressenraum-Wahl verwendet werden. Der *CSM-Eingang kann über das Chipwahlabbildungsregister aktiviert werden. Wenn *CSM aktiviert ist, reagiert die ICU auf Speicher-Zugriffe nur, falls *CSM geltend gemacht wird und die Adresse mit entsprechenden aktivierten Bits in dem vorgewählten Feld des (noch detailliert zu beschreibenden) Chipwahlabbildungsregisters übereinstimmt.*CSM (Chip Select for Memory access) is a synchronous ICU input signal that is active LOW. An active level on the *CSM input selects the ICU for memory accesses. The signal can be used for cache memory extensions and cache memory address space selection. The *CSM input can be enabled via the chip select mapping register. When *CSM is enabled, the ICU responds to memory accesses only if *CSM is asserted and the address matches corresponding enabled bits in the preselected field of the chip select mapping register (to be described in detail).
CB0-CB31, der Cache-Speicher-Bus, ist bidirektional, synchron und für drei Zustände ausgelegt. Der Cache-Speicher- Bus überträgt Instruktionen oder Daten auf dem Prozessorbus zu und von der ICU.CB0-CB31, the cache memory bus, is bidirectional, synchronous and tri-state. The cache memory bus transfers instructions or data on the processor bus to and from the ICU.
*DREQ (Data Request), Datenanforderung, ist ein synchrones ICU-Eingangssignal, das im aktiven LOW-Zustand ist. Dieses Eingangssignal fordert einen Daten-Zugriff auf den Prozessorbus an. Wenn es aktiv ist, erscheint die Adresse für den Zugriff auf den Adressenbus. bei der Instruktions- Cache-Speicher-Verwendung der ICU wird *DREQ für Prozessorbus-Cache-Speicher-Instruktions-Transfers benutzt.*DREQ (Data Request) is a synchronous ICU input signal that is active LOW. This input signal requests data access to the processor bus. When active, the address for access appears on the address bus. In the instruction cache usage of the ICU, *DREQ is used for processor bus cache instruction transfers.
*IREQ (Instruktion Request), Instruktionsanforderung, ist ein synchrones ICU-Eingangssignal, das im aktiven LOW- Zustand ist. Dieses Eingangssignal fordert einen Instruktions-Cache-Speicher-Zugriff auf den Prozessorbus an. Wenn es aktiv ist, erscheint die Adresse für den Zugriff auf den Adressenbus. Dieses Eingangssignal hat während der Rücksetz-Operation der ICU eine spezielle Funktion. Es wird durch die Anstiegsflanke von SYSCLK abgetastet, wenn RESET (das noch zu beschreiben ist) aktiv ist. Der zuletzt abgetastete Wert bestimmt die ICU-Operation als Daten- Cache (*IREQ LOW) oder als Instruktions-Cache (*IREQ HIGH). Für eine Daten-Cache-Operation muß *IREQ auf LOW gebunden sein (es wird während der normalen Operation ignoriert). Für eine Instruktions-Cache-Operation muß es mit dem Prozessor-*IREQ-Ausgang gekoppelt sein, der während RESET ungültig gemacht wird. Es ist anzumerken, daß, wenn der Prozessor während RESET in die Test-Betriebsart versetzt wird, die externe Logik den Prozessor das IREQ- Signal in den HIGH-Zustand treiben muß. (Der in der mitanhängigen Anmeldung hinsichtlich des Hochleistungs-Interface beschriebene Prozessor treibt IREQ in seiner Test- Betriebsart nicht in den HIGH-Zustand.)*IREQ (Instruction Request) is a synchronous ICU input signal that is in the active LOW state. This input signal requests an instruction cache memory access on the processor bus. When active, the address for access appears on the address bus. This input signal has a special function during the ICU reset operation. It is sampled by the rising edge of SYSCLK when RESET (to be described later) is active. The last sampled value determines the ICU operation as a data cache (*IREQ LOW) or an instruction cache (*IREQ HIGH). For a data cache operation, *IREQ must be tied LOW (it is ignored during normal operation). For an instruction cache operation, it must be coupled to the processor *IREQ output, which is invalidated during RESET. Note that if the processor is placed in test mode during RESET, external logic must drive the processor's IREQ signal HIGH. (The processor described in the copending application with respect to the high performance interface does not drive IREQ to the HIGH state in its test mode.)
*LOCK, Verriegelung, ist ein ICU-Eingangssignal, das synchron und im aktiven LOW-Zustand ist. Dieses Eingangssignal zeigt an, daß der Prozessor-Cache-Speicher-Zugriff auf eine verriegelte Variable erfolgt. Die ICU handhabt diesen Zugriff auf eine spezielle Weise, die im Zusammenhang mit der noch detailliert zu beschreibenden Verriegelungsfunktion erläutert wird.*LOCK is an ICU input that is synchronous and active LOW. This input indicates that the processor cache memory access is to a locked variable. The ICU handles this access in a special way that will be explained in connection with the locking function, which will be described in detail later.
MSERR (Master/Slave Error), Master/Slave-Fehler, ist ein synchrones ICU-Ausgangssignal, das im aktiven HIGH-Zustand ist. Dieses Ausgangssignal zeigt das Ergebnis des Vergleiches der ICU-Ausgangssignale mit den extern an die chipexternen Treiber angelegten Signale. Falls für irgendeinen der aktivierten Treiber ein Unterschied besteht, wird dieses Signal geltend gemacht.MSERR (Master/Slave Error) is a synchronous ICU output signal that is in the active HIGH state. This output signal shows the result of comparing the ICU output signals with the signals applied externally to the off-chip drivers. If there is a difference for any of the activated drivers, this signal is asserted.
OPT0-OPT2 (Option Control), Optionssteuerung, ist ein synchrones ICU-Eingangssignal. Diese Signale repräsentieren die Optionssteuerungsbits, die einem Cache-Speicher- Zugriff zugeordnet sind. Sie werden verwendet zur Spezifizierung der Datenlänge sowie von spezieller Zugriffsinformation. Die Interpretation dieser Signale hängt von der Verwendung der ICU als Daten- oder Instruktions-Cache- Speicher ab. Die Kodierung und Interpretation dieser Eingangssignale erfolgt gemäß der bevorzugten Ausführungsform der Erfindung wie folgt: OPT2-0-WERT Bedeutung Daten-Cache-Speicher Bedeutung Instruktions-Cache-Speicher Bit-Zugriff kein Zugriff Instruktions-speicher-Zugriff (als Daten) Cache-Operanden Transfer Entstörungsmodul-Zugriff reserviertOPT0-OPT2 (Option Control) is a synchronous ICU input signal. These signals represent the option control bits associated with a cache memory access. They are used to specify the data length and special access information. The interpretation of these signals depends on the use of the ICU as a data or instruction cache memory. The encoding and interpretation of these input signals is carried out according to the preferred embodiment of the invention as follows: OPT2-0-VALUE Meaning Data cache memory Meaning Instruction cache memory Bit access no access Instruction memory access (as data) Cache operand transfer Debug module access reserved
Die OPT-Eingangssignale werden ignoriert, falls sich DREQT1 im HIGH-Zustand befindet (behandelt als Nicht-Zugriff) . Die Codes 100,101 werden als Nicht-Zugriff behandelt, falls sich DREQT0 im HIGH-Zustand befindet. Der Code 100 wird verwendet, um das Instruktions-ROM als Daten auszulesen. Ein Daten-Cache-Speicher reagiert auf diesen Code nur dann, wenn das ROM-Aktivierungs-Bit in dem noch zu beschreibenden Moda-Register HIGH ist. In diesem Fall wird die Anforderung als nicht cache-speicherbarer-Zugriff behandelt. Der Code 101 zeigt einen Operandentransfer für die ICU-Prozessorbus-Cache-Speicher-Instruktionen an. Gemäß dem bevorzugten Ausführungsbeispiel der Erfindung wird der Code 101 fr einen speziellen Entstörungsmodul-Zugriff verwendet. Ein Daten-Cache-Speicher regiert mit *CRDY HIGH für vier Zyklen, und dann wird *CRDY für einen Zyklus geltend gemacht.The OPT input signals are ignored if DREQT1 is in the HIGH state (treated as non-access). The codes 100,101 are treated as non-access if DREQT0 is in the HIGH state. The code 100 is used to access the instruction ROM as data A data cache responds to this code only if the ROM enable bit in the Moda register, to be described later, is HIGH. In this case, the request is treated as a non-cacheable access. Code 101 indicates an operand transfer for the ICU processor bus cache instructions. In accordance with the preferred embodiment of the invention, code 101 is used for a special debug module access. A data cache responds with *CRDY HIGH for four cycles, and then *CRDY is asserted for one cycle.
*PCA (Pipelined Cache Access), Pipeline-Cache-Speicher- Zugriff, ist ein synchrones ICU-Eingangssignal, das im aktiven LOW-Zustand ist. Falls *DREQ für den Daten-Cache- Speicher oder *IREQ für den Instruktions-Cache-Speicher nicht aktiv ist, zeigt dieses Eingangssignal an, daß der Cache-Speicher-Zugriff mit einem anderen gerade ablaufenden Cache-Speicher-Zugriff gepipelinet ist. Der Pipeline- Zugriff kann nicht abgeschlossen werden, bis der erste Zugriff abgeschlossen ist. Der Abschluß des ersten Zugriffs wird durch die Geltendmachung von *DREQ für den Daten-Cache-Speicher und *IREQ für den Instruktions-Cache- Speicher signalisiert.*PCA (Pipelined Cache Access) is a synchronous ICU input that is active LOW. If *DREQ for the data cache or *IREQ for the instruction cache is not active, this input indicates that the cache access is pipelined with another cache access in progress. The pipeline access cannot complete until the first access is complete. Completion of the first access is signaled by the assertion of *DREQ for the data cache and *IREQ for the instruction cache.
*RESET, Rücksetzen, ist ein asynchrones Eingangssignal, das im aktiven LOW-Zustand ist. Dieses Eingangssignal setzt die ICU zurück.*RESET is an asynchronous input signal that is in the active LOW state. This input signal resets the ICU.
R/*W (Read/Write), Lesen/Schreiben, ist ein synchrones Eingangssignal. Dieses Eingangssignal zeigt an, ob der Cache-Speicher-Zugriff ein Transfer von der ICU zu dem Prozessor (R/*W High) oder von dem Prozessor zu der ICU (R/*W Low) ist.R/*W (Read/Write) is a synchronous input signal. This input signal indicates whether the cache memory access is a transfer from the ICU to the processor (R/*W High) or from the processor to the ICU (R/*W Low).
SUP/*US (Supervisor/User Mode), Überwachungs-/Benutzer- Betriebsart, ist ein synchrones Eingangssignal. Dieses Eingangssignal gibt während des Zugriffs die Programm- Betriebsart des gezeigten Prozessors (Überwachungs-Betriebsart oder Benutzer-Betriebsart) an. Die internen Register der ICU und die Ausführung der Cache-Speicher- Instruktionen sind vor Benutzer-Betriebsart-Zugriffen geschützt.SUP/*US (Supervisor/User Mode) is a synchronous input signal. This input signal indicates the program mode of the processor shown (supervisory mode or user mode) during access. The ICU's internal registers and the execution of cache memory instructions are protected from user mode accesses.
SYSCLK (System Clock), Systemtakt, ist ein externes Takt- Eingangssignal mit der Betriebsfrequenz der ICU.SYSCLK (System Clock) is an external clock input signal with the operating frequency of the ICU.
*TEST, Test-Betriebsart, ist ein asynchrones Eingangssignal, das im aktiven LOW-Zustand ist. Wenn dieses Eingangssignal aktiv ist, befindet sich die ICU in der Test- Betriebsart. Sämtliche Ausgänge und bidirektionalen Leitungen mit Ausnahme von MSERR, werden in den Hochimpedanzzustand gezwungen.*TEST, test mode, is an asynchronous input signal that is in the active LOW state. When this input signal is active, the ICU is in test mode. All outputs and bidirectional lines, except MSERR, are forced into the high impedance state.
WREP (Way for Replacement), Weg zum Ersatz, ist ein synchrones Eingangssignal. Dieses Eingangssignal erzwingt die Weg-Nummer für den Ersatz im Fall eines Cache-Speicher- Fehlgängers. Es wird während des ersten Zyklus eines gültigen Cache-Speicher-Zugriffs abgetastet. Ein Fehlgänger in einer gesetzten Zwei-Wege-Zuordnungsorganisation (falls die Ersatz-Betriebsart extern ist) veranlaßt einen Ersatz, der durch WREP bestimmt ist: WREP LOW erzwingt einen Ersatz des Weges 0, WREP HIGH erzwingt einen Ersatz des Weges 1.WREP (Way for Replacement) is a synchronous input. This input forces the way number for replacement in case of a cache miss. It is sampled during the first cycle of a valid cache access. A miss in a set two-way mapping organization (if the replacement mode is external) causes a replacement determined by WREP: WREP LOW forces a way 0 replacement, WREP HIGH forces a way 1 replacement.
Im folgenden wird, weiterhin im Zusammenhang mit Fig. 2, das Speicherbus-Interface beschrieben. Der Speicherbus kann die folgenden Merkmale aufweisen:The following describes the memory bus interface, still in connection with Fig. 2. The memory bus can have the following features:
BSTC0-BSTC1 (Block Status Control), Blockstatussteuerung, sind bidirektional, synchron und für drei Zustände ausgelegt. Diese Signale werden verwendet, um die Cache-Blockstatus-Information zu inspizieren und zu aktualisieren£ Wenn es durch eine Speicherbus-Instruktion verlangt wird, benutzt die ICU diese Signale, um die den zugeführten Adressen zugeordneten Blockstatus-Bits anzuzeigen. Diese Signale werden ferner verwendet, um den Blockstatus aus dem Speicherbus für eine Schreib-Blockstatus-Instruktion zuzuführen. Die Kodierung dieses Signals für beide der genannten Funktionen erfolgt in dieser Weise: Bedeutung exklusiv unmodifiziert exklusiv modifiziert gemeinsam benutzt unmodifiziert gemeinsam benutzt modifiziertBSTC0-BSTC1 (Block Status Control) are bidirectional, synchronous and designed for three states. These signals are used to inspect and update the cache block status information. When requested by a memory bus instruction, the ICU uses these signals to indicate the block status bits associated with the addresses supplied. These signals are also used to supply the block status from the memory bus for a write block status instruction. The encoding of this signal for both of the above functions is as follows: Meaning exclusive unmodified exclusive modified shared unmodified shared modified
*DI (Data Intervention) 1 Datenintervention, ist ein synchrones Ausgangssignal, das für drei Zustände ausgelegt ist und sich im aktiven LOW-Zustand befindet. Dieses Ausgangssignal wird zum Anzeigen einer Dateninterventions-Operation auf dem Speicherbus verwendet. Die Dateninterventions-Operation wird bei einigen Mehrprozessor-Konfigurationen verwendet, um die aktuellste Version der Variablen aus dem entsprechenden Cache-Speicher (im Gegensatz zum Hauptspeicher) zuzuführen. Der ICU-Master lädt das *DI- Signal während des Adressenzyklus eines Speicherbus-Lese- Zugriffs vor. Dann versetzt er das Signal in die Drei-Zustands-Betriebsart. Die ICUs, die nicht die Bus-Master sind, geben das *DI-Signal ab, falls sie mit einer Datenintervention reagieren.*DI (Data Intervention) 1 Data Intervention is a synchronous output signal that is tri-state and in the active LOW state. This output signal is used to indicate a data intervention operation on the memory bus. The data intervention operation is used in some multiprocessor configurations to fetch the most current version of the variable from the appropriate cache memory (as opposed to main memory). The ICU master preloads the *DI signal during the address cycle of a memory bus read access. It then places the signal in tri-state mode. The ICUs that are not the bus masters assert the *DI signal if they respond with a data intervention.
*GRT (Memory Bus Grant), Speicherbus-Gewährung, ist ein synchrones Eingangssignal, das im aktiven LOW-Zustand ist.*GRT (Memory Bus Grant) is a synchronous input signal that is in the active LOW state.
Dieses Eingangssignal zeigt an, daß der Speicherbus für die ICU-Verwendung zulässig ist.This input signal indicates that the memory bus is allowed for ICU use.
*HIT, Treffer, ist bidirektional, synchron, für drei Zustände ausgelegt und im aktiven LOW-Zustand. Dieses Signal kann derart programmiert werden, daß es entweder ein Ausgangssignal oder ein Eingangs-/Ausgangs-Signal ist. Als Ausgangssignal wird es zur Treffer-Anzeige verwendet. Das Signal wird geltend gemacht, wenn ein Treffer in dem Tag- Puffer für die auf dem Speicherbus anliegende Adresse detektiert wird. Es wird ferner bei einigen der Speicherbus-Instruktionen verwendet, um die Gültigkeit eines Wortes oder Blocks anzuzeigen.*HIT is bidirectional, synchronous, tri-state, and active LOW. This signal can be programmed to be either an output signal or an input/output signal. As an output signal, it is used to indicate a hit. The signal is asserted when a hit is detected in the tag buffer for the address present on the memory bus. It is also used in some of the memory bus instructions to indicate the validity of a word or block.
Wenn das Signal als Eingangs-/Ausgangs-Signal programmiert ist, kann es zusätzlich zu den genannten Ausgangssignal- Funktionen als Signal zur Detektion eines Treffers in irgendeinem anderen Cache-Speicher verwendet werden. Der ICU-Master lädt das *HIT-Signal während des Adressenzyklus vor und versetzt es dann in die Eingangssignal-Dreizustands-Betriebsart. Die ICUs, die nicht die Bus-Master sind, geben das *HIT-Signal nur ab, wenn ein Treffer in ihrem Tag-Puffer detektiert wird.When programmed as an input/output signal, it can be used as a hit detection signal in any other cache memory in addition to the output signal functions mentioned. The ICU master preloads the *HIT signal during the address cycle and then places it in the input signal tri-state mode. The ICUs that are not the bus masters only assert the *HIT signal when a hit is detected in their tag buffer.
*MASTB (Memory Address Strobe), Speicheradressen-Strobe- Signal, ist bidirektional, synchron, für drei Zustände ausgelegt und im aktiv LOW. Wenn die ICU der Speicherbus- Master ist, wird dieses Signal von der ICU geltend gemacht, um anzuzeigen, daß eine Byte-Adresse auf dem Speicherbus vorhanden ist. Wenn die ICU kein Master ist, zeit dieses Signal an, daß eine Byte-Adresse von einem anderen Bus-Master auf dem Speicherbus vorhanden ist. Es ist anzumerken, daß, falls sowohl der Instruktions-Cache-Speicher als auch der Daten-Cache-Speicher in dem System vorhanden ist, zwei *MASTB-Signale verfügbar sind. Die beiden Signale können verwendet werden, um zwischen Instruktions- und Daten-Zugriffen zu unterscheiden.*MASTB (Memory Address Strobe) is bidirectional, synchronous, tri-state, and active LOW. When the ICU is the memory bus master, this signal is asserted by the ICU to indicate that a byte address is present on the memory bus. When the ICU is not a master, this signal indicates that a byte address from another bus master is present on the memory bus. Note that if both the instruction cache and the data cache are present in the system, two *MASTB signals are available. The two signals can be used to distinguish between instruction and data accesses.
*MBACK (Memory Burst Acknowledge), Speicher-Burst-Bestätigung, ist ein synchrones Eingangssignal, das im aktiven LOW-Zustand ist. Dieses Eingangssignal ist immer dann aktiv, wenn auf dem Speicherbus ein Burst-Betriebsart- Cache-Speicher-Zugriff hergestellt worden ist.*MBACK (Memory Burst Acknowledge) is a synchronous input signal that is active LOW. This input signal is active whenever a burst mode cache access has been established on the memory bus.
MBPO-MBP3 (Memory Byte Parity), Speicher-Byte-Parität, ist bidirektional, synchron und für drei Zustände ausgelegt. Es handelt sich hierbei um den Byte-Paritäts-Bus für Transfers auf dem Speicherbus. Es kann eine geradzahlige oder eine ungeradzahlige Parität spezifiziert werden. MBP0 bedeutet Byte-Parität für MEMAD0-MEMAD7, MBPL bedeutet Byte-Parität für MEMAD9-MEMAD15 usw. Bei Transfers von der ICU zu dem Speicher erzeugt die ICU Parität. Bei Transfers zu der ICU überprüft sie die Byte-Parität.MBPO-MBP3 (Memory Byte Parity) is bidirectional, synchronous and tri-state. It is the byte parity bus for transfers on the memory bus. Even or odd parity can be specified. MBP0 means byte parity for MEMAD0-MEMAD7, MBPL means byte parity for MEMAD9-MEMAD15, etc. For transfers from the ICU to memory, the ICU generates parity. For transfers to the ICU, it checks the byte parity.
Falls ein Paritätsfehler detektiert wird und Daten auf dem Prozessorbus übertragen werden sollen, wird das *CERR- Signal geltend gemacht. Falls die Daten nicht auf den Prozessorbus übertragen zu werden brauchen (z.B. bei Block-Neuladen), wird ein Fehler-Bit in dem (noch zu beschreibenden) Statusregister gesetzt, und die Daten werden ignoriert. Die Paritätserzeugung und -überprüfung können deaktiviert werden. Falls die Paritätserzeugung und -überprüfung deaktiviert sind, wird die Speicherbusdaten-Zeitgebung relaxiert.If a parity error is detected and data is to be transferred on the processor bus, the *CERR signal is asserted. If the data does not need to be transferred on the processor bus (e.g., during a block reload), an error bit is set in the status register (to be described later) and the data is ignored. Parity generation and checking can be disabled. If parity generation and checking are disabled, the memory bus data timing is relaxed.
*MBREQ (Memory Burst Request), Memory-Burst-Anforderung, ist bidirektional, synchron, für drei Zustände ausgelegt und aktiv LOW. Dieses Signal wird verwendet, um einen Burst-Betriebsart-Zugriff auf den Speicherbus herzustellen und während des Burst-Betriebsart-Zugriffs den nächsten Transfer anzufordern. Wenn die ICU der Bus-Master ist, ist dieses Signal ein Ausgangssignal. Wenn die ICU kein Master ist, ist das Signal ein Eingangssignal, das von der ICU für Datenkonsistenz-Operationen verwendet wird.*MBREQ (Memory Burst Request) is bidirectional, synchronous, tri-state, and active LOW. This signal is used to establish a burst mode access to the memory bus and to request the next transfer during the burst mode access. When the ICU is the bus master, this signal is an output signal. If the ICU is not a master, the signal is an input signal used by the ICU for data consistency operations.
MDLNO-MDLNI (Memory Data Length), Speicherdatenlänge, sind bidirektional, synchron und für drei Zustände ausgelegt. Diese Signale reflektieren die Datenlänge für die Speicherbusdaten-Zugriffe. Sie werden bei Instruktions-Zugriffen ignoriert. Für eine Daten-Cache-Speicher-Verwendung unterstützt die ICU 8, 16 und 32 Bit-Transfers. Das Kodieren dieser Signale erfolgt gemäß der bevorzugten Ausführungsform der Erfindung wie folgt: Bedeutung Bit-Zugriff ungültigMDLNO-MDLNI (Memory Data Length) are bidirectional, synchronous and designed for three states. These signals reflect the data length for the memory bus data accesses. They are ignored for instruction accesses. For data cache use, the ICU supports 8, 16 and 32 bit transfers. The encoding of these signals is carried out according to the preferred embodiment of the invention as follows: Meaning Bit access invalid
Es ist anzumerken, daß die MDLN0- und MDLN1-Kodierung derjenigen für OPT0 und OPT1 bei dem Prozessor entspricht, welcher bei der als Beispiel erläuterten Ausführungsform der Erfindung verwendet wird.It should be noted that the MDLN0 and MDLN1 encoding corresponds to that for OPT0 and OPT1 in the processor used in the exemplary embodiment of the invention.
MEMAD0-MEMAD31 (Memory Address/Data Bus), Speicher-Adressen-/Daten-Bus, ist bidirektional, synchron und für drei Zustände ausgelegt. Der Speicherbus ist ein gemultiplexter Adressen-/Daten-Bus, der für das Speicher-Interface verwendet wird. Wenn *MASTB geltend gemacht wird, hält dieser Bus die Byte-Adresse des Speicherbus-Zugriffs. Wenn die ICU der Bus-Master ist, gibt sie die Adresse aus. Wenn die ICU nicht der Bus-Master ist, ist der Bus ein Eingang, und die Adresse wird von der ICU zu deren interner Verwendung gehalten. Wenn MASTB nicht geltend gemacht wird, wird der Speicherbus zum Transfer von Daten zu und von der ICU verwendet.MEMAD0-MEMAD31 (Memory Address/Data Bus) is bidirectional, synchronous, and tri-state. The memory bus is a multiplexed address/data bus used for the memory interface. When *MASTB is asserted, this bus holds the byte address of the memory bus access. If the ICU is the bus master, it outputs the address. If the ICU is not the bus master, the bus is an input, and the address is used by the ICU for its internal use. When MASTB is not asserted, the memory bus is used to transfer data to and from the ICU.
*MERR (Memory Error), Speicherfehler, ist ein synchrones ICU-Eingangssignal und aktiv LOW. Dieses Eingangssignal zeigt an, daß bei dem aktuellen Speicher-Zugriff ein Fehler aufgetreten ist. Die ICU verwendet dieses Signal auch für Datenkonsistenz-Operationen.*MERR (Memory Error) is a synchronous ICU input signal and is actively LOW. This input signal indicates that an error has occurred during the current memory access. The ICU also uses this signal for data consistency operations.
*MLOCK (Memory Lock), Speicherverriegelung, ist bidirektional, synchron, für drei Zustände ausgelegt und aktiv LOW. Dieses Signal zeigt an, daß der Speicher-Zugriff ein verriegelter Zugriff ist. Der ICU-Master macht dieses Ausgangssignal geltend, wenn ein verriegelter Zugriff auf den Speicherbus erfolgt. Wenn die ICU nicht der Bus-Master ist, wird dieses Signal als Eingangssignal verwendet. Falls bei einem Schreib-Zugriff unter Geltendmachung von *MLOCK eine Übereinstimmung festgestellt wird, wird das zugehörige Wort ungültig gemacht. Dieses Merkmal wird für Schemata verwendet, die die Cache-Speicherung von Veriegelungsvariablen aktivieren.*MLOCK (Memory Lock) is bidirectional, synchronous, tri-state, and active LOW. This signal indicates that the memory access is a locked access. The ICU master asserts this output when a locked access is made to the memory bus. If the ICU is not the bus master, this signal is used as an input. If a match is found on a write access while asserting *MLOCK, the associated word is invalidated. This feature is used for schemes that enable caching of lock variables.
*MRDY (Memory Ready), Speicher bereit, ist bidirektional, synchron und aktiv LOW. Wenn die ICU der Bus-Master ist, wird dieses Signal als Eingangssignal verwendet. Bei Speicherbus-Lesevorgängen zeigt dieses Eingangssignal an, daß auf dem Speicherbus gültige Daten vorhanden sind. Bei Speicherbus-Schreibvorgängen zeigt das Signal an, daß die Daten nicht weiter auf dem Speicherbus angesteuert zu werden brauchen. Wenn die ICU nicht der Bus-Master ist, wird dieses Signal als Eingangssignal für Datenkonsistenz- Operationen verwendet. Es wird als Ausgangssignal zur Datenintervention und Speicherbus-Spezialoperationen benutzt. Die ICU macht *MRDY geltend, um anzuzeigen, daß auf dem Speicherbus gültige Daten vorhanden sind. MREQT0-MREQT1 (Memory Request Type), Speicheranforderungstyp, sind bidirektional, synchron und für drei Zustände ausgelegt. Diese Signale spezifizieren den Adressenraum für den Zugriff auf den Speicherbus. Wenn die ICU der Bus- Master ist, verwendet sie diese Signale als Ausgangssignale. Wenn sie nicht der Bus-Master ist, werden die MREQT- Signale als Eingangssignale für Datenkonsistenz-Operationen verwendet. Das Kodieren erfolgt gemäß der bevorzugten Ausführungsform der Erfindung wie folgt: Bedeutung Datenspeicher-Zugriff Daten-Eingangs-/Ausgangs-Zugriff Instruktionsspeicher-Zugriff Instruktions-ROM-Zugriff*MRDY (Memory Ready) is bidirectional, synchronous, and actively LOW. When the ICU is the bus master, this signal is used as an input. For memory bus reads, this input indicates that valid data is present on the memory bus. For memory bus writes, this signal indicates that the data does not need to be driven further on the memory bus. When the ICU is not the bus master, this signal is used as an input for data consistency operations. It is used as an output for data intervention and memory bus special operations. The ICU asserts *MRDY to indicate that valid data is present on the memory bus. MREQT0-MREQT1 (Memory Request Type) are bidirectional, synchronous and tri-state. These signals specify the address space for accessing the memory bus. If the ICU is the bus master, it uses these signals as output signals. If it is not the bus master, the MREQT signals are used as input signals for data consistency operations. The encoding is done according to the preferred embodiment of the invention as follows: Meaning Data memory access Data input/output access Instruction memory access Instruction ROM access
Wenn die ICU kein Bus-Master ist, werden die MREQT-Signale auch (zusammen mit den MRW-Signalen) zum Spezifizieren einer Speicherbus-Cache-Instruktion für die ICU verwendet.When the ICU is not a bus master, the MREQT signals are also used (along with the MRW signals) to specify a memory bus cache instruction for the ICU.
MRWO-MRWL (Memory Read Write), Speicher-Lesen/Schreiben, sind bidirektional, synchron und für drei Zustände ausgelegt. Diese Signale werden verwendet, um den Typ von Leseund Schreib-Operationen auf dem Speicherbus zu bestimmen. Wenn die ICU der Bus-Master ist, verwendet sie diese Signale, um die verlangte Operation anzuzeigen. Wenn die ICU nicht der Bus-Master ist, sind diese Signale Eingangssignale, die für Datenkonsistenz-Operationen verwendet werden. Das Kodieren dieser Signale erfolgt gemäß der bevorzugten Ausführungsform der Erfindung wie folgt: Bedeutung Schreiben Lesen Schreiben broadcast Lesen zum ModifizierenMRWO-MRWL (Memory Read Write) are bidirectional, synchronous and tri-state. These signals are used to determine the type of read and write operations on the memory bus. When the ICU is the bus master, it uses these signals to indicate the requested operation. When the ICU is not the bus master, these signals are input signals used for data consistency operations. The encoding of these signals is done according to the preferred embodiment of the invention as follows: Meaning Write Read Write broadcast Read to modify
Die vorstehend erwähnten Lese- und Schreib-Operationen erfolgen in bezug auf die ICU, z.B. erfolgt das Lesen aus dem Speicher in die ICU.The above-mentioned read and write operations are performed with respect to the ICU, e.g. reading from the memory into the ICU.
Wenn die ICU nicht der Bus-Master ist, werden die MRW-Signale auch (zusammen mit den MREQT-Signalen) verwendet, um die Speicherbus-Cache-Instruktion für die ICU zu spezifizieren. Eine detaillierte Beschreibung eines Speicherbus-Instruktionssatzes, der für die Verwendung bei der hier beschriebenen ICU geeignet ist, wird noch gegeben.When the ICU is not the bus master, the MRW signals are also used (along with the MREQT signals) to specify the memory bus cache instruction for the ICU. A detailed description of a memory bus instruction set suitable for use with the ICU described here will be given later.
MS/*MU (Memory Supervisor/User Mode), Speicher-Überwachungs-/Benutzer-Betriebsart, ist ein synchrones ICU-Ausgangssignal und für drei Zustände ausgelegt. Dieses Ausgangssignal zeigt während des Speicher-Zugriffs die Programm-Betriebsart für den Prozessor an (Überwachungs-Betriebsart oder Benutzer-Betriebsart). Die ICU überträgt für die entsprechenden Transaktionen den auf dem Prozessorbus vorliegenden SUP/*US-Wert auf den auf dem Speicherbus vorliegenden MS/*MU-Wert.MS/*MU (Memory Supervisor/User Mode) is a synchronous ICU output signal and is designed for three states. This output signal indicates the program mode for the processor during memory access (supervisor mode or user mode). The ICU transfers the SUP/*US value present on the processor bus to the MS/*MU value present on the memory bus for the corresponding transactions.
*REQ (Memory Bus Request), Speicherbusanforderung, ist ein synchrones ICU-Ausgangssignal und im aktiven LOW-Zustand. Dieses Ausgangssignal wird von der ICU zur Anforderung des Speicherbusses verwendet.*REQ (Memory Bus Request) is a synchronous ICU output signal and is in the active LOW state. This output signal is used by the ICU to request the memory bus.
*VSI (Valid Status or Instruction), gültiger Status oder Instruktion, ist ein synchrones ICU-Ausgangssignal und im aktiven LOW-Zustand. Wenn die ICU der Bus-Slave ist, zeigt ein gültig gemachtes *VSI einen Speicherbus-Cache-Instruktions-Zugriff an. Wenn die ICU der Bus-Master ist und eine Lese-Anforderung für eine Neulade-Operation ausgibt, zeigt die Geltendmachung von *VSI an, daß eine spezielle Schreib-Blockstatus-Instruktion ausgeführt werden soll. Eine detaillierte Beschreibung eines geeigneten Speicherbus-Cache-Instruktionssatzes und der Verwendung von *VSI erfolgt anschließend.*VSI (Valid Status or Instruction) is a synchronous ICU output signal and is in the active LOW state. When the ICU is the bus slave, a validated *VSI indicates a memory bus cache instruction access. When the ICU is the bus master and issues a read request for a reload operation, the assertion of *VSI indicates that a special write block status instruction is to be executed. A detailed description of a suitable memory bus cache instruction set and the use of *VSI follows.
Nach der Beschreibung der verschiedenen Eingänge und Ausgänge in die und aus der neuartigen ICU anhand des Stiftanschluß- Schaubildes von Fig. 2 wird zum tieferen Verständnis der neuartigen Verfahren und Vorrichtungen die funktionelle Organisation der ICU detailliert beschrieben. Diese Beschreibung ist in mehrere Teile untergliedert. Zunächst erfolgt ein Überblick der Art und Weise, wie sich die ICU in ein Computersystem einfügt, insbesondere in das als Beispiel angeführte RISC- System, das zur Veranschaulichung der Anwendbarkeit und des Betriebes der Erfindung benutzt wird. Zweitens wird der Datenfluß durch die ICU detailliert beschrieben. Drittens erfolgt eine Erläuterung der Registerebenen eines Registersatzes, der für die Implementierung der Erfindung geeignet ist. Ferner werden ein geeigneter Cache-Instruktionssatz, Daten-Formate und -Handhabung, Cache-Speicher-Zugriffe und Vorabruf-Operationen beschrieben.After describing the various inputs and outputs into and from the novel ICU using the pin connection diagram of Fig. 2, the functional organization of the ICU is described in detail for a deeper understanding of the novel methods and devices. This description is divided into several parts. First, an overview is given of the way the ICU fits into a computer system, in particular the example RISC system used to illustrate the applicability and operation of the invention. Second, the data flow through the ICU is described in detail. Third, an explanation is given of the register levels of a register set suitable for implementing the invention. Also described are a suitable cache instruction set, data formats and handling, cache memory accesses and prefetch operations.
Es werden ferner weitere Details der Verwendung eines ICU- Schreib-Puffers, der Initialisierung und der Rücksetz-Operation erläutert.Further details of the use of an ICU write buffer, initialization and reset operation are also explained.
Zudem werden zum Abschluß der detaillierten Beschreibung der Erfindung die durch die ICU geleistete Mehrprozessor-Unterstützung und die spezielle ICU-Verriegelungsfunktion beschrieben.In addition, to conclude the detailed description of the invention, the multiprocessor support provided by the ICU and the special ICU locking function are described.
Wie bereits erwähnt, wird die neuartige ICU im Zusammenhang mit einer RISC-Architektur, die einen SIP enthält, erläutert. Die bevorzugte Ausführungsform der Erfindung wird bei Anwendung zur Unterstützung dieser Architektur beschrieben. Dem Fachmann wird problemlos ersichtlich sein, daß an der bevorzugten Ausführungsform der neuartigen ICU Modifikationen vorgenommen werden können, ohne vom Umfang des Erfindungsgedankens abzuweichen, z.B. zum Unterstützen von Nicht-RISC-Prozessoren. Die folgende Beschreibung verfolgt somit lediglich illustrative Zwecke.As previously mentioned, the novel ICU is explained in the context of a RISC architecture containing a SIP. The preferred embodiment of the invention is described as used to support this architecture. Those skilled in the art will readily appreciate that modifications can be made to the preferred embodiment of the novel ICU without departing from the scope of the inventive concept, e.g., to support non-RISC processors. The following description is therefore for illustrative purposes only.
Der Kern der bevorzugten Ausführungsform der ICU besteht in einem 9k Byte Speicher-Array mit den zugehörigen Tags und gültigen Arrays. Die Arrays sind als setzungsassoziativer Zweiwege-Cache-Speicher mit 4 Wörtern pro Tag (Blockbemessung = 4 Wörter) und einem gültigen Bit pro Wort organisiert. Diese grundlegende Organisation unterstützt ferner einen direkt abgebildeten Cache-Speicher, variable Block- und Unterblock- Bemessung sowie ein flexibles Neuladeschema. Ferner sind ein Blockstatus-Array und ein LRU-Array vorgesehen. Diese werden zum Cache-Speicher-Ersatz, zum Verriegeln von Daten in dem Cache-Speicher und für Zwecke der Datenkonsistenz verwendet. Die ICU enthält die gesamte Steuerlogik für die unterschiedlichen Cache-Speicher-Funktionen, Algorithmen und Instruktionen. Spezielle Register werden für die programmierbare Optionsselektion, die Cache-Instruktions-Implementierung und den Status-Report verwendet.The core of the preferred embodiment of the ICU consists of a 9k byte memory array with the associated tags and valid arrays. The arrays are organized as a two-way set-associative cache with 4 words per tag (block size = 4 words) and one valid bit per word. This basic organization further supports a direct-mapped cache, variable block and sub-block size, and a flexible reload scheme. A block status array and an LRU array are also provided. These are used for cache replacement, locking data in the cache, and for data consistency purposes. The ICU contains all the control logic for the various cache functions, algorithms, and instructions. Special registers are used for programmable option selection, cache instruction implementation, and status reporting.
Die Cache-Speicher-Funktionen können unter Verwendung programmierbarer Optionen gewählt werden. Die Cache-Speicher-Schreib- Funktion kann als Durch-Schreiben, Rückkopieren oder flexibel auf einer Pro-Zugriff-Basis gewählt werden. Es kann eine Schreib-Zuordnungs- oder eine Nicht-Schreib-Zuordnungs-Option gewählt werden. Ein Vier-Wort-Schreibpuffer ist zur effizienten Durchführung der Schreib-Zugriffe vorgesehen. Der Schreibpuffer kann aktiviert oder deaktiviert werden. Der Ersetzungs- Algorithmus kann als LRU-, direkte oder externe Einrichtung programmiert werden. Es kann eine flexible Vorabruf-Funktion gewählt werden. Die Durch-Lese-Option kann aktiviert werden. Ein Vier-Wort-Lesepuffer ist vorgesehen, um effiziente Vorabruf- und Lese-Operationen zu unterstützen.The cache functions can be selected using programmable options. The cache write function can be selected as write-through, copy-back, or flexibly on a per-access basis. A write-mapping or non-write-mapping option can be selected. can be selected. A four-word write buffer is provided to efficiently perform the write accesses. The write buffer can be enabled or disabled. The replacement algorithm can be programmed as LRU, direct or external facility. A flexible prefetch function can be selected. The read-through option can be enabled. A four-word read buffer is provided to support efficient prefetch and read operations.
Die Mehrprozessor-Unterstützungsfunktion kann auf das System zugeschnitten werden. Die Ebene der Mehrprozessor-Unterstützung kann von einer simplen softwaregesteuerten Organisation bis zu einem extensiven Eigentümerschafts-Schema variieren. Eine Busüberwachungsfunktion kann aktiviert oder deaktiviert werden. Der Eigentümerschafts-Algorithmus kann derart gesteuert werden, daß er das angeforderte Schema unterstützt. Die Cache-Speicherung der Verriegelungsvariablen kann aktiviert oder deaktiviert werden.The multiprocessor support function can be tailored to the system. The level of multiprocessor support can vary from a simple software-controlled organization to an extensive ownership scheme. A bus monitor function can be enabled or disabled. The ownership algorithm can be controlled to support the requested scheme. Caching of locking variables can be enabled or disabled.
Zwei-Chip-Wahleingänge und ein Chipwahl-Abbildungsregister erlauben problemlose Cache-Speicher-Erweiterungen sowie Mehrfach-Cache-Speicher-Organisationen. Die Neuladefunktion kann auf das System zugeschnitten werden, indem die geeigneten - Zugriffssteueroptionen gewählt werden, etwa Neulade-Bemessung, Start- und Stopp-Adressen, Burst und zyklische Folge (wraparound)Two-chip select inputs and a chip select mapping register allow easy cache memory expansions as well as multiple cache memory organizations. The reload function can be tailored to the system by choosing the appropriate access control options, such as reload sizing, start and stop addresses, burst and wraparound
Die bevorzugte Ausführungsform der ICU arbeitet mit der gleichen Frequenz wie der RISC-Prozessor in dem angeführten illustrativen Beispiel, d.h. mit einer Nennfrequenz von 25 MHZ und möglichen höheren Frequenzen. Die Ausführungsform erzielt - Zugriffszeiten von zwei Zyklen für den ersten Treffer-Zugriff und von einem Zyklus für die nächsten Burst-Betriebsart- oder Pipeline-Treffer-Zugriffe.The preferred embodiment of the ICU operates at the same frequency as the RISC processor in the illustrative example given, i.e., at a nominal frequency of 25 MHz and possibly higher frequencies. The embodiment achieves access times of two cycles for the first hit access and of one cycle for the next burst mode or pipeline hit accesses.
Eine Drei-IC-Konfiguration, von denen eine den RISC-Prozesssor enthält und zwei für die ICUs vorgesehen sind (eine für einen Instruktions-Cache-Speicher und eine für einen Daten-Cache- Speicher) bildet ein hoch leistungsfähiges Cache-Speicher- System mit 16k Cache-Bytes.A three-IC configuration, one containing the RISC processor and two dedicated to the ICUs (one for an instruction cache and one for a data cache), forms a high-performance cache memory system with 16k cache bytes.
Wie bereits im Zusammenhang mit Fig. 1 erläutert, weist die ICU zwei Interface-Busse auf, den Prozessorbus und den Speicherbus. Sie kann ohne irgendeine Interface-Logik direkt mit dem RISC-Prozessor verbunden werden. Der ICU-Cache-Speicher- Bus ist mit dem Daten- oder Instruktionsbus des Prozessors verbunden, und zwar für Daten- bzw. Instruktions-Cache-Speicherung. Pipeline- und Burst-Betriebsart-Zugriffe werden derart unterstützt, daß der Prozessorkanal maximal ausgenutzt wird. Der Speicherbus ist ein separates Interface zu dem Speicher, weiteren Prozessoren und dem Systembus. Er ist ein gemultiplexter Adressen- und Datenbus mit Unterstützung für Burst-Betriebsart-Zugriffe£ Ferner weist er Mehrprozessor- Unterstützungsfunktionen auf. In Mehrprozessor-Umgebungen mit gemeinsam benutztem Speicher kann der Speicherbus effektiv als gemeinsam benutzter Mehrprozessorbus verwendet werden. Bei Ein-Prozessor-Systemen kann er als Systembus oder lokaler Bus verwendet werden.As already explained in connection with Fig. 1, the ICU has two interface buses, the processor bus and the memory bus. It can be connected directly to the RISC processor without any interface logic. The ICU cache memory bus is connected to the processor's data or instruction bus for data or instruction cache storage, respectively. Pipeline and burst mode accesses are supported in such a way that the processor channel is maximally utilized. The memory bus is a separate interface to the memory, other processors, and the system bus. It is a multiplexed address and data bus with support for burst mode accesses. It also has multiprocessor support functions. In multiprocessor environments with shared memory, the memory bus can effectively be used as a shared multiprocessor bus. In single-processor systems it can be used as a system bus or a local bus.
Die bevorzugte Ausführungsform der ICU enthit spezielle Hardware zur Fehlertoleranzunterstützung. Die Hardware unterstützt die Master/Slave-Überprüfung und die Byte-Paritäts-Erzeugung und -Überprüfung auf dem Speicherbus. Zur Master/Slave-Überprüfung werden eine oder mehr ICUs parallel mit einem oder mehreren Cache-Speichern (den Slaves) verbunden, um die Ausgänge des Masters zu überprüfen. Die Byte-Paritäts-Erzeugung und -Überprüfung kann auf dem Speicherbus für zuverlässige Busübertragungen verwendet werden.The preferred embodiment of the ICU includes special hardware to support fault tolerance. The hardware supports master/slave checking and byte parity generation and checking on the memory bus. For master/slave checking, one or more ICUs are connected in parallel to one or more caches (the slaves) to check the outputs of the master. Byte parity generation and checking can be used on the memory bus for reliable bus transfers.
Wie bereits erwähnt, ist die bevorzugte Ausführungsform der Erfindung in CMOS-Technik ausgelegt und weist einen maximalen Leistungsverbrauch von 1,5 W auf.As already mentioned, the preferred embodiment of the invention is designed in CMOS technology and has a maximum power consumption of 1.5 W.
Die interne Datenflußorganisation der ICU ist in Fig. 3 gezeigt. Die folgende Beschreibung bezieht sich auf die funktionellen Komponenten dieses Datenflußdiagramms. Die ICU ist in drei funktionelle Haupteinheiten unterteilt: Prozessorbuseinheit, Speicherbuseinheit und Cache-Speicher-Einheit, die sämtlich in Fig. 3 gezeigt sind. Die folgende Beschreibung nimmt teilweise Bezug auf bestimmte Bit-Stellen und Felder verschiedener Wörter, die für irgendeine Anzahl von Zwecken verwendet werden. Dem Fachmann wird leicht ersichtlich sein, daß diese bestimmte Bezugnahme keinen einschränkenden Charakter haben und derart modifiziert werden können, daß sie einem gewünschten Anwendungsfall entsprechen. Die jeweilige Bezugnahme erfolgt um der Klarheit willen und soll lediglich eine praktikable, illustrative, bevorzugte Ausführungsform der Erfindung erläutern.The internal data flow organization of the ICU is shown in Fig. 3. The following description refers to the functional components of this data flow diagram. The ICU is divided into three main functional units: processor bus unit, memory bus unit, and cache memory unit, all of which are shown in Fig. 3. The following description refers in part to specific bit locations and fields of various words used for any number of purposes. Those skilled in the art will readily appreciate that these specific references are not limiting and may be modified to suit a desired application. Each reference is made for clarity and is intended to describe only a practical, illustrative, preferred embodiment of the invention.
Die Prozessorbuseinheit steuert die gesamte Aktivität des Prozessorbusses. Sie unterstützt sämtliche RISC/SIP-Kanal- Protokolle; einfach, geburstet und gepipelinet. Sie enthält den Adresseninkrementierer, den Datenschieber und die Prozessorbussteuerungseinrichtung, die sämtlich anschließend beschrieben werden.The processor bus unit controls all activity of the processor bus. It supports all RISC/SIP channel protocols; simple, bursted and pipelined. It contains the address incrementer, the data shifter and the processor bus control device, all of which are described below.
Der Adresseninkrementierer (AI) verriegelt den Adressenbuseingang. Er kann bei jedem Zyklus inkrementiert werden. Der AI-Ausgang ist die Adresse für einen Cache-Speicher-Zugriff. Der AI ist in Fig. 3 als Einheit 301 gezeigt.The address incrementer (AI) latches the address bus input. It can be incremented every cycle. The AI output is the address for a cache memory access. The AI is shown in Fig. 3 as unit 301.
Der Datenschieber (DSH) wird zur Datenausrichtung verwendet.The data shifter (DSH) is used for data alignment.
Er verschiebt Bytes und Halbwörter und hält die Daten für Schreib-Zugriffe. Ferner wird er beim Byte- und Halbwort-Lesen für die entsprechende Byte- und Halbwort-Schiebe-Operation verwendet. Der DSH ist in Fig. 3 als Einheit 302 gezeigt.It shifts bytes and halfwords and holds the data for write access. It is also used for byte and halfword reading used for the corresponding byte and halfword shift operation. The DSH is shown in Fig. 3 as unit 302.
Die Prozessorbussteuerungseinrichtung (PBC) steuert die verschiedenen Prozessorbus-Operationen. Die PBC ist in Fig. 3 als Einheit 303 gezeigt.The processor bus controller (PBC) controls the various processor bus operations. The PBC is shown in Figure 3 as unit 303.
Die Speicherbuseinheit steuert die Aktivität des Speicherbusses. Sie enthält den Schreibpuffer, die Speicheradressenlogik, den Speicherlesepuffer und die Speicherbussteuereinrichtung, die sämtlich im folgenden beschrieben werden.The memory bus unit controls the activity of the memory bus. It contains the write buffer, the memory address logic, the memory read buffer and the memory bus controller, all of which are described below.
Der bei der bevorzugten Ausführungsform der Erfindung verwendete Schreibpuffer (WB) enthält zwei Vier-Wort-First-in-firstout (FIFO)-Puffer (einen für Adressen und einen für Daten). Der WB kann sämtlich ICU-Schreib-Operationen puffern. Für Durch- Schreib-Operationen puffert er bis zu 4 Byte, Halbwort- oder Wort-Schreibvorgänge. Für Rückkopiervorgänge puffert er einen Vier-Wort-Block. Der WB ist in Fig. 3 als Einheit 304 gezeigt.The write buffer (WB) used in the preferred embodiment of the invention contains two four-word first-in-first-out (FIFO) buffers (one for address and one for data). The WB can buffer all ICU write operations. For write-through operations, it buffers up to 4 bytes, half-word or word writes. For copy-back operations, it buffers a four-word block. The WB is shown in Figure 3 as unit 304.
Die Speicheradressenlogik (MAL) weist zwei Adresseninkrementierer auf. Der erste verriegelt und inkrementiert die Speicherbusadressen für -Operationen von dem Bus zu der ICU. Der zweite verriegelt und inkrementiert die Adressen für von der ICU inituerte Lese-Operationen. Die MAL ist in Fig. 3 als Einheit 305 gezeigt.The memory address logic (MAL) has two address incrementers. The first latches and increments the memory bus addresses for operations from the bus to the ICU. The second latches and increments the addresses for read operations initiated by the ICU. The MAL is shown in Figure 3 as unit 305.
Der Speicherlesepuffer (MRB) ist ein Vier-Wort-Daten-Puffer. Er puffert die Daten aus dem Speicherbus, bis der Cache-Speicher für die Aktualisierungs-Operation zur Verfügung steht. Der MRB wird als Vorabruf speicher verwendet, wenn ein Vorabrufen aktiviert ist. Der MRB ist in Fig. 3 als Einheit 306 gezeigtThe memory read buffer (MRB) is a four-word data buffer. It buffers the data from the memory bus until the cache memory is available for the update operation. The MRB is used as a prefetch memory when prefetching is enabled. The MRB is shown in Fig. 3 as unit 306
Die Speicherbussteuereinrichtung (MBC), die die Speicherbus- Operationen steuert, ist in Fig. 3 als Einheit 307 gezeigt.The memory bus controller (MBC), which controls the memory bus operations, is shown in Figure 3 as unit 307.
Die Cache-Speicher-Einheit führt sämtliche Cache-Speicher- Funktionen aus. Sie enthält das Speicher-Array, das Tag-Array, das Gültigkeits-Array, das Blockstatus-Array, das LRU-Array, Spezialregister, und die Cache-Speicher-Steuerung, die sämtlich anschließend beschrieben werden.The cache memory unit performs all cache memory functions. It contains the memory array, the tag array, the validity array, the block status array, the LRU array, special registers, and the cache memory controller, all of which are described below.
Das Speicher-Array ist ein 64k Bit-Speicher-Array für cachegespeicherte Instruktionen oder Daten. Es ist in Form zweier Wege von 1024 Wörtern organisiert. Für Lese-Operationen wird gemäß der bevorzugten Ausführungsform der Erfindung mittels der Bits 11-2 der Adresse gleichzeitig auf die zwei Wege zugegriffen. Das betreffende Wort wird entsprechend den Treffer- Signalen von dem Tag-Array gewählt. Bei Schreib-Operationen wird das korrekte Wort in dem Array geschrieben, nachdem der Tag-Zugriff abgeschlossen und die Treffer-Signale erzeugt worden ist. Das Speicher-Array ist in Fig. 3 als Einheit 310 gezeigt.The memory array is a 64k bit memory array for cached instructions or data. It is organized as two ways of 1024 words. For read operations, the two ways are accessed simultaneously using bits 11-2 of the address, according to the preferred embodiment of the invention. The word in question is selected according to the hit signals from the tag array. For write operations, the correct word is written to the array after the tag access is complete and the hit signals are generated. The memory array is shown in Figure 3 as unit 310.
Das Tag-Array speichert die Cache-Speicher-Tags in einer zwei Wege aufweisenden, gesetzten, assoziativen Organisation. Jeder Weg ist in Form von 256 x 20 Bits organisiert. Jedes Tag entspricht einem Block von 4 aufeinanderfolgenden cache-gespeicherten Wörtern. Für jeden Cache-Speicher-Zugriff wird mittels der Bits 11-4 der Adresse gleichzeitig auf zwei Tags zugegriffen. Die Tags werden (bei einer Ausführungsform der Erfindung) mit den Bits 31-12 der Adresse verglichen. Die Treffer-Signale werden aus den Vergleichsergebnisssen und den Konfigurations- Bits erzeugt. Das Tag-Array wird jedes Mal geschrieben, wenn ein Fehlgänger auftritt und ein Cache-Speicher-Block zugeordnet wird. Das Tag wird gemäß den Bits 11-4 der Adresse und dem Ersatz-Algorithmus gewählt. Die Adressenbits 31-12 werden in das Tag-Array geschrieben. Das Tag-Array ist in Fig. 3 als Einheit 311 gezeigt.The tag array stores the cache tags in a two-way, seeded, associative organization. Each way is organized as 256 x 20 bits. Each tag corresponds to a block of 4 consecutive cached words. For each cache access, two tags are accessed simultaneously using bits 11-4 of the address. The tags are compared (in one embodiment of the invention) to bits 31-12 of the address. The hit signals are generated from the comparison results and the configuration bits. The tag array is written each time a miss occurs and a cache block is allocated. The tag is chosen according to bits 11-4 of the address and the replacement algorithm. Address bits 31-12 are written to the tag array. The tag array is shown in Fig. 3 as unit 311.
Das Gültigkeits-Array, die Einheit 312 von Fig. 3, ist ein 2k Bit-Array, das ein gültiges Bit für jedes cache-gespeichertes Wort speichert. Es ist in Form zweier 1024 x 1-Arrays organisiert. Es wird ein gültiges Bit für jedes Wort gesetzt, während es in den Cache-Speicher geschrieben wird. Das gültige Bit wird durch die Adressenbits 11-2 (wie bei dem Speicher- Array) und den Entsprechungs-Weg gewählt. Bei jedem Cache- Speicher-Zugriff werden zwei gültige Bits, die den beiden Wegen entsprechen, überprüft. Ein Treffer-Signal nur dann erzeugt, wenn das entsprechende gültige Bit gesetzt ist.The validity array, unit 312 of Fig. 3, is a 2k bit array containing one valid bit for each cached word. It is organized as two 1024 x 1 arrays. A valid bit is set for each word as it is written to the cache memory. The valid bit is chosen by the address bits 11-2 (as in the memory array) and the correspondence path. On each cache memory access, two valid bits corresponding to the two paths are checked. A hit signal is generated only if the corresponding valid bit is set.
Das Blockstatus-Array, die Einheit 313 in Fig. 3, ist ein 1536 Bit-Array, das 3 Blockstatus-Bits für jeden Cache-Speicher- Block enthält. Es ist in Form von zwei 256 x 3-Arrays Organsiert (dies entspricht der Tag-Array-Organisation}. Die drei Bits sind die folgenden: Modifiziert, Gemeinsam Benutzt und Verriegelt. Das Modifiziert-Bit zeigt an, daß der Block modifiziert ist und vor dem Ersetzen in den Speicher rückgeschneben werden soll£ Es wird für Rückkopier-Operationen und Datenkonsistenz-Operationen verwendet. Das Gemeinsam-Benutzungs-Bit zeigt an, daß der Block gemeinsam benutzt wird. Es wird für Datenkonsistenz-Operationen verwendet. Das Verriegelungs-Bit zeigt an, daß der Block verriegelt ist und nicht ersetzt werden kann£ Es wird verwendet, um wichtige Daten oder Instruktionen in dem Cache-Speicher zu verriegeln.The block status array, unit 313 in Figure 3, is a 1536-bit array containing 3 block status bits for each cache memory block. It is organized as two 256 x 3 arrays (this corresponds to the tag array organization). The three bits are as follows: Modified, Shared and Locked. The Modified bit indicates that the block is modified and should be flushed back into memory before being replaced. It is used for copyback operations and data consistency operations. The Shared bit indicates that the block is shared. It is used for data consistency operations. The Lock bit indicates that the block is locked and cannot be replaced. It is used to lock important data or instructions in the cache memory.
Das LRU-Array, die Einheit 314 in Fig. 31 ist ein 356 Bit- Array, das die LRU-Bits speichert. Es ist in Form eines 256 x 1-Arrays organisiert. Jedes LRU-Bit entspricht einem Satz von zwei Tags. Das LRU-Array wird verwendet, wenn der Ersetzungsalgorithmus für die am längsten zurückliegende Verwendung gewählt ist. Das entsprechende LRU-Bit wird derart aktualisiert, daß es den am längsten zuvor verwendeten Block der beiden Blocks in einem Satz reflektiert. Falls erforderlich, bestimmt das LRU-Bit, welcher Block aus dem Satz ersetzt wird.The LRU array, unit 314 in Fig. 31, is a 356 bit array that stores the LRU bits. It is organized as a 256 x 1 array. Each LRU bit corresponds to a set of two tags. The LRU array is used when the least recently used replacement algorithm is selected. The corresponding LRU bit is updated to reflect the least recently used block of the two blocks in a set. If necessary, the LRU bit determines which block from the set is replaced.
Der Spezialregister-Block, der in Fig. 3 als Einheit 315 gezeigt ist, enthält sämtliche Spezialregister der ICU. Diese werden verwendet zum Programmieren der ICU-Optionen, zum Steuern von Spezial-Operationen und zum Halten von Statusinformation.The special register block, shown in Fig. 3 as unit 315, contains all the special registers of the ICU. These are used to program ICU options, control special operations, and hold status information.
Der Cache-Speicher-Steuer-Block, die Einheit 316 in Fig. 3, enthält die Steuer-Logik für die Cache-Speicher-Operationen.The cache control block, unit 316 in Figure 3, contains the control logic for the cache operations.
Nach der anhand Fig. 3 vorgenommenen Auflistung und Beschreibung des Datenflusses durch die neuartige ICU wird im folgenden die Registerstruktur zum Unterstützen des Datenflusses und der Steuerung der ICU erläutert.After listing and describing the data flow through the novel ICU based on Fig. 3, the register structure for supporting the data flow and control of the ICU is explained below.
Die bevorzugte Ausführungsform der ICU enthält 8 Spezialregister. Diese Register wählen programmierbare Optionen, unterstützen Cache-Speicher-Steuer-Operationen und zeigen Cache- Speicher-Status-Information an. Jedes Register kann von dem Prozessor über den Prozessorbus oder den Speicherbus gelesen oder beschrieben werden. Eine Register-Lese- oder Register- Schreib-Instruktion des Cache-Speichers wird der ICU mittels des geeigneten Cache-Speicher-Instruktions-Protokolls auf einem der Busse übermittelt. Für die Prozessorbus-Instruktion wird die Registernummer durch die drei am wenigsten signifikanten Bits des Op-Code bestimmt. Das Instruktionstransferprotokoll und die ICU-Reaktion werden durch die Register-Lese- Steuerung und die Instruktions-Transfer-Protokoll-Steuerung jeweils in dem Modb-Register gesteuert. Für die Speicherbus- Instruktion ist die Registernummer durch die drei am wenigsten signifikanten Bits der Adresse bestimmt. Im folgenden wird eine detaillierte Beschreibung dieser drei als Beispiel angeführten Protokolle und Reaktionen gegeben.The preferred embodiment of the ICU contains 8 special purpose registers. These registers select programmable options, support cache control operations, and indicate cache status information. Each register can be read or written by the processor via the processor bus or the memory bus. A cache register read or register write instruction is communicated to the ICU via the appropriate cache instruction protocol on either bus. For the processor bus instruction, the register number is determined by the three least significant bits of the opcode. The instruction transfer protocol and the ICU response are controlled by the register read control and the instruction transfer protocol control, respectively, in the Modb register. For the memory bus instruction, the register number is determined by the three least significant bits of the address. Below, a detailed description of these three example protocols and reactions is given.
Bei Prozessorbus-Zugriffen werden sämtliche ICU-Spezialregister geschützt. Auf sie kann nur dann zugegriffen werden, wenn das SUP/*US-Eingangssignal HIGH ist. Benutzerbetriebsart-Zugriffe werden nicht durchgeführt. Eine *CERR-Reaktion gibt einen ungültigen Benutzerbetriebsart-Zugriff an. Die Register sind für die Speicherbus-Cache-Instruktion nicht geschützt.During processor bus accesses, all ICU special registers are protected. They can only be accessed when the SUP/*US input signal is HIGH. User mode accesses are not performed. A *CERR response gives an invalid user mode access. The registers are not protected for the memory bus cache instruction.
Gemäß der bevorzugten Ausführungsform der Erfindung wird jedem Register wie folgt eine Nummer zugeteilt:According to the preferred embodiment of the invention, each register is assigned a number as follows:
Reg.-Nr. Reg.-NameReg. No. Reg. Name
0 Chip-Wahl-Abbildung0 Chip selection image
1 Instruktion1 Instruction
2 Adressen-Operand2 Address operand
3 Zählstand3 Counting status
4 Fehler-Adresse4 Error address
5 Status5 Status
6 Mod a6 Mod a
7 Mod b7 Mod b
Im folgenden wird nur die generelle Funktion jedes Registers beschrieben, da dem Fachmann ersichtlich ist, daß für anwendungsspezifische Zwecke besondere Bit-Zuordnungen vorgenommen werden können.In the following, only the general function of each register is described, since it is clear to those skilled in the art that special bit assignments can be made for application-specific purposes.
Das Chipwahlabbildungsregister ist ein spezielles Register 0.The chip select mapping register is a special register 0.
Es bestimmt die Adresse und die Bedingungen für die ICU-Chip- Wahl-Funktionen. Die ICU weist zwei unabhängige Chip-Wahl- Funktionen auf: für normale Cache-Speicher-Zugriffe und für Cache-Speicher-Instruktions-Zugriffe.It determines the address and conditions for the ICU chip select functions. The ICU has two independent chip select functions: for normal cache memory accesses and for cache memory instruction accesses.
Für normale Cache-Speicher-Zugriffe kann die Chip-Wahl-Funktion für Cache-Speicher-Erweiterungen, Cache-Speicher-Adressen-Raum-Zuordnungen und Mehrfach-Cache-Speicher-Konfiguratio nen verwendet werden. Bei der bevorzugten Ausführungsform der Erfindung können bis zu 32 ICUs (16 Instruktions-Cache-Speicher und 16 Daten-Cache-Speicher) ohne externe Chip-Wahl-Hardware verwendet werden. Die Speicher-Zugriff(MA)-Wahl wird ferner durch das *CSM-Eingangssignal und ein Speicherbitaktivierungs-Feld des Moda-Registers beeinflußt. Falls das * CSM-Eingangssignal aktiviert ist, muß es geltend gemacht werden, um einen Speicher-Zugriff zu ermöglichen. Falls das * CSM-Eingangssignal deaktiviert ist, wird es ignoriert. Das Speicherbitaktivierungs-Feld kann den Vergleich eines geeigneten Adressenbits mit einem entsprechenden (MA) Feld-Bit in dem Chip-Wahl-Speicher-Register selektiv aktivieren. Falls ein Bit zum Vergleich deaktiviert ist, wird es ignoriert. Falls sämtliche Bits deaktiviert sind, wird eine Übereinstimmung erzwungen. Es ist anzumerken, daß, wenn *CSM aktiviert ist, dieses geltend gemacht werden muß und eine MA-Feld-Vergleichs-Übereinstimmung vorliegen muß, damit der Speicher-Zugriff geleistet werden kann.For normal cache accesses, the chip select function can be used for cache extensions, cache address space mappings, and multiple cache configurations. In the preferred embodiment of the invention, up to 32 ICUs (16 instruction caches and 16 data caches) can be used without external chip select hardware. be used. The memory access (MA) selection is further affected by the *CSM input signal and a memory bit enable field of the Moda register. If the *CSM input signal is enabled, it must be asserted to enable a memory access. If the *CSM input signal is disabled, it is ignored. The memory bit enable field can selectively enable the comparison of an appropriate address bit with a corresponding (MA) field bit in the chip select memory register. If a bit for comparison is disabled, it is ignored. If all bits are disabled, a match is forced. Note that if *CSM is enabled, it must be asserted and an MA field comparison match must exist for the memory access to be accomplished.
Bei Cache-Speicher-Instruktions-Zugriffen wird die Chip-Wahl- Funktion verwendet, um die korrekte ICU für den Zugriff zu wählen. Ein Cache-Speicher-Instruktions-Zugriff wird geltend gemacht, wenn *CSEL geltend gemacht und aktiviert ist, oder wenn die Adressen-Eingangssignale A31-A14 und CREQTO mit den Cache-Speicher-Instruktions-Adressen und den Cache-Speicher- Instruktions-Adressen-Raum-Feldern in dem Chipwahlabbildungsregister übereinstimmen. In dem zweiten Fall werden sämtliche Cache-Speicher, bei denen eine Übereinstimmung vorliegt, gewählt. Falls der Instruktions-Umfang mehrere Cache-Speicher umfaßt, reagieren sämtliche gewählten Cache-Speicher. Falls der Instruktions-Umfang nur einen Cache-Speicher umfaßt, reagiert nur derjenige Cache-Speicher, bei dem die Adressen-Eingangssignale A13-A8 einem bestimmten Cache-Speicher-Nummer- Feld des Chipwahlabbildungsregisters entsprechen.For cache instruction accesses, the chip select function is used to select the correct ICU for access. A cache instruction access is asserted when *CSEL is asserted and enabled, or when the address inputs A31-A14 and CREQTO match the cache instruction addresses and cache instruction address space fields in the chip select map register. In the second case, all caches that match are selected. If the instruction scope includes multiple caches, all selected caches respond. If the instruction scope includes only one cache, only the cache whose address inputs A13-A8 correspond to a particular cache number field of the chip select mapping register will respond.
Während der Initialisierung wird das *CSEL-Eingangssignal verwendet, um die Chipwahlabbildungsregister einer gegebenen ICU zu programmieren. Bei einer typischen Konfiguration kann ein anderes Adressenbit mit dem *CSEL-Signal unterschiedlicher ICUs gekoppelt werden. Wenn *CSEL geltend gemacht und aktiviert wird, behandelt die ICU Daten-Zugriffe als Cache-Speicher-Instruktions-Zugriffe. Nachdem das Chipwahlabbildungsregister programmiert worden ist, kann das * CSEL-Eingangssignal deaktiviert werden, und die durch das Chipwahlabbildungsregister bestimmte Abbildung wird angewandt.During initialization, the *CSEL input signal is used to program the chip select map registers of a given ICU. In a typical configuration, a different address bit can be assigned to the *CSEL signal of different ICUs. When *CSEL is asserted and enabled, the ICU treats data accesses as cache memory instruction accesses. After the chip select mapping register has been programmed, the *CSEL input signal can be deasserted and the mapping determined by the chip select mapping register is applied.
Das Instruktionsregister ist ein spezielles Register 1. Es wird verwendet zur Spezifizierung einer Instruktion für die ICU. Das Instruktionsregister ist wie jedes andere spezielile Register für Lese- und Schreibvorgänge verwendbar, jedoch wird es für eine Gültig-Cache-Instruktion automatisch geladen. Eine Gültig-Cache-Instruktion wird detektiert, wenn der * CSEL-Eingang angesteuert und aktiviert wird, oder wenn die Adressen- Eingangssignale A31-A14 und CREQT0 mit den Cache-Speicher- Instruktions-Adressen und den Cache-Speicher-Instruktions- Adressen-Raum-Feldern in dem Chipwahlabbildungsregister übereinstimmen. In diesen Fällen wird die Instruktion aus den Adress-Eingängen A7-A0 kopiert.The instruction register is a special register 1. It is used to specify an instruction for the ICU. The instruction register is usable for reads and writes like any other special register, but it is automatically loaded for a valid cache instruction. A valid cache instruction is detected when the *CSEL input is driven and activated, or when the address inputs A31-A14 and CREQT0 match the cache instruction addresses and cache instruction address space fields in the chip select map register. In these cases, the instruction is copied from the address inputs A7-A0.
Auf das Instruktionsregister kann als spezielles Register zugegriffen werden, um den ICU-Zustand zu retten und wiederherzustellen, falls während des Instruktionstransferprotokolls ein Prozessor-Interrupt erfolgt oder falls eine Mehrfach-Cache-Speicher-Instruktion unterbrochen wird. Wenn auf das Instruktionsregister als Spezialregister zugegriffen wird, wird der ICU eine Lese- oder Register-Schreib-Cache-Speicher-Instruktion übermittelt. Es sind Schattenregister vorgesehen, um in der Lage zu sein, die Register-Lese-Instruktion und den optionalen Operanden zu verriegeln, ohne die erforderlichen alten Inhalte des Instruktions- und Operanden-Registers zu zerstören. Das Schatten-Instruktionsregister wird zunächst mit einer Instruktion geladen. Für sämtliche Instruktionen außer den Register-Lese- und den Register-Schreib-Instruktionen wird das Instruktionsregister aktualisiert, wenn die Instruktionsausführungs beginnt. Für die Register-Lese- und die Register-Schreib-Instruktionen wird das Instruktionsregister nur aktualisiert, falls keine andere gültige Instruktion in dem Instruktionsregister vorhanden ist. Falls eine gültige Instruktion in dem Instruktionsregister vorhanden ist, wird die Register-Lese-Instruktion ausgeführt, ohne die Instruktions- und Operanden-Register zu beeinflussen. Dieses Merkmal wird ferner verwendet, um den Status der ICU zu überprüfen, ohne die Ausführung einer Cache-Speicher-Instruktion zu beeinträchtigen.The instruction register can be accessed as a special register to save and restore the ICU state in the event of a processor interrupt during the instruction transfer protocol or in the event of a multiple cache instruction being interrupted. When the instruction register is accessed as a special register, a read or register write cache instruction is submitted to the ICU. Shadow registers are provided to be able to latch the register read instruction and optional operand without destroying the required old contents of the instruction and operand registers. The shadow instruction register is initially loaded with an instruction. For all instructions except the register read and register write instructions, the instruction register is updated when instruction execution begins. For the register read and register write instructions the instruction register is updated only if no other valid instruction is present in the instruction register. If a valid instruction is present in the instruction register, the register read instruction is executed without affecting the instruction and operand registers. This feature is also used to check the status of the ICU without affecting the execution of a cache memory instruction.
Es wird jedes Mal eine Instruktion von der ICU ausgeführt, wenn sämtliche erforderlichen Operanden gültig sind. Es folgt eine detaillierte Beschreibung von Beispielen von Instruktionen, erforderlichen Operanden und Cache-Speicher-Instruktions- Zugriffen.An instruction is executed by the ICU every time if all required operands are valid. A detailed description of examples of instructions, required operands and cache memory instruction accesses follows.
Das Operanden-Register ist ein Spezialregister 2. Es bestimmt einen Operanden für bestimmte ICU-Instruktionen. Das Register enthält ein Bit (OV-Bit), um die Gültigkeit des Operanden- Registerwertes anzuzeigen. In der ICU ist ein Schatten-Operanden-Register enthalten, das zur korrekten Ausführung der Register-Lese- und der Register-Schreib-Instruktionen dient. Das Schatten-Operanden-Register wird zunächst mit einem Operanden geladen. Für sämtliche Instruktionen mit Ausnahme der Register-Lese- und der Register-Schreib-Instruktionen wird das Operanden-Register aktualisiert, falls das Gültigkeits-Bit rückgesetzt wird. Falls das OV-Bit gesetzt ist, verzögert die ICU die *CRDY-Reaktion, bis das OV-Bit rückgesetzt ist (Komplettierung der vorherigen Instruktion), und lädt dann das Register. Für Register-Lese- und der Register-Schreib-Instruktionen wird das Operanden-Register nur aktualisiert, falls in dem Instruktionsregister keine weitere gültige Instruktion existiert. Falls in dem Instruktionsregister eine weitere gültige Instruktion existiert, werden die Register-Lese- und die Register-Schreib-Instruktionen ausgeführt, ohne die Instruktions- und Operanden-Register zu beinflussen. Dies ermöglicht es, das Operanden-Register zu retten und wiederherzustellen, falls es erforderlich ist. Bei Bedarf kann das Operanden-Register mittels der Register-Lese- oder der Register- Schreib-Instruktionen gelesen werden.The operand register is a special register 2. It specifies an operand for certain ICU instructions. The register contains a bit (OV bit) to indicate the validity of the operand register value. A shadow operand register is included in the ICU, which is used to correctly execute the register read and register write instructions. The shadow operand register is initially loaded with an operand. For all instructions except the register read and register write instructions, the operand register is updated if the validity bit is reset. If the OV bit is set, the ICU delays the *CRDY response until the OV bit is reset (completion of the previous instruction) and then loads the register. For register read and register write instructions, the operand register is only updated if no other valid instruction exists in the instruction register. If another valid instruction exists in the instruction register, the register read and register write instructions are executed without affecting the instruction and operand registers. This makes it possible to save and restore the operand register, if necessary. If necessary, the operand register can be read using the register read or register write instructions.
Das Zählstandsregister ist ein Spezialregister 3. Es bestimmt die Anzahl von Wörtern, die mittels bestimmter ICU-Instruktionen bearbeitet werden sollen. Das Zählstandsregister wird nicht durch die Instruktionsausführung beeinflußt.The count register is a special register 3. It determines the number of words to be processed using certain ICU instructions. The count register is not affected by instruction execution.
Das Ausnahme-Adressen-Register ist ein Spezialregister 4. Es wird verwendet, um die einigen Ausnahmefällen zugehörige Adresse zu melden. Das Ausnahme-Adressen-Register wird mit der Ausnahme-Adresse geladen. Der Ausnahme-Typ kann in dem Statusregister aufgefunden werden.The exception address register is a special register 4. It is used to report the address associated with some exception cases. The exception address register is loaded with the exception address. The exception type can be found in the status register.
Das Statusregister ist ein Spezialregister 5. Es wird verwendet zur Meldung des Status der ICU und für den Informationstransfer zwischen der ICU und dem Prozessor in den Lese-Tagund Schreib-Tag-Instruktionen (die noch erläutert werden). Es sind Bits reserviert, um den Tag-Wert für die Lese-Tag-Instruktion zu melden und das Tag für die Schreib-Tag-Instruktion zu übermitteln; um das WAY-Signal für cache-gespeicherte Daten zu melden; um die gültigen Bits für einen Block zu melden und die gültigen Bits für die Schreib-Tag-Instruktion zu übermitteln; um das Verriegelungs-Bit für den Block zu melden und das Verriegelungs-Bit für die Schreib-Tag-Instruktion zu übermitteln; um das gemeinsam benutzte Bit für den Block zu melden und das gemeinsam benutzte Bit für die Schreib-Tag- Instruktion zu übermitteln; um das modifizierte Bit für den Block zu melden und das modifizierte Bit für die Schreib-Tag- Instruktion zu übermitteln; um anzuzeigen, ob ein Treffer in dem Cache-Speicher ermittelt wurde; und um Schutz-Verletzungen, unzulässige Instruktionen, Speicher-Fehler und Paritäts- Fehler anzuzeigen.The status register is a special register 5. It is used to report the status of the ICU and to transfer information between the ICU and the processor in the read tag and write tag instructions (which will be discussed later). Bits are reserved to report the tag value for the read tag instruction and to transmit the tag for the write tag instruction; to report the WAY signal for cached data; to report the valid bits for a block and to transmit the valid bits for the write tag instruction; to report the lock bit for the block and to transmit the lock bit for the write tag instruction; to report the shared bit for the block and to transmit the shared bit for the write tag instruction; to report the modified bit for the block and to transmit the modified bit for the write tag instruction; to indicate whether a hit was detected in the cache; and to indicate protection violations, illegal instructions, memory errors, and parity errors.
Das Moda-Register ist ein Spezialregister 6. Es wird zum Wählen verschiedener ICU-Optionen verwendet. Das Moda-Register wird während der Initialisierung rückgesetzt.The Moda register is a special register 6. It is used to select various ICU options. The Moda register is reset during initialization.
Es sind Felder vorgemerkt, um: die globale Cache-Speicher- Operation zu steuern; um sämtliche Cache-Speicher-Stellen zu verriegeln; um den Schreib-Puffer zu deaktivieren; und um die Durch-Lese-Option zu deaktivieren.Fields are reserved to: control the global cache operation; to lock all cache locations; to disable the write buffer; and to disable the read-through option.
In diesem Register ist ein ROM-Aktivierungs-Bit enthalten, das für Instruktions-Cache-Speicher- und Daten-Cache-Speicher- Verwendung verschiedene Funktionen hat ("ROME"-Bit).This register contains a ROM enable bit that has different functions for instruction cache and data cache use ("ROME" bit).
Wenn bei der Instruktions-Cache-Speicher-Verwendung dieses Bit gesetzt ist, reagiert die ICU auf ROM-Zugriffe und cache-speichert diese. Wenn es auf 0 ist, werden ROM-Zugriffe ignoriert.When using instruction cache, if this bit is set, the ICU responds to ROM accesses and caches them. If it is 0, ROM accesses are ignored.
Wenn dieses Bit bei der Daten-Cache-Speicher-Verwendung gesetzt ist, wird der Daten-Cache-Speicher für Instruktions- Speicher-Zugriffe (als Daten) aktiviert. Wenn die OPT-Eingangssignale einen Instruktions-Speicher-Zugriff anzeigen, wird dies von der ICU als nicht-cache-speicherbare Transaktion behandelt. Die spezifizierte Adresse wird auf dem Speicherbus gelesen und zu dem Prozessor übertragen, ohne daß sie in den Cache-Speicher geladen wird. Wenn das ROME-Bit 0 ist, ignoriert die ICU diesen Typ von Instruktion.When this bit is set in data cache use, the data cache is enabled for instruction memory accesses (as data). When the OPT inputs indicate an instruction memory access, the ICU treats this as a non-cacheable transaction. The specified address is read on the memory bus and transferred to the processor without being loaded into the cache. If the ROME bit is 0, the ICU ignores this type of instruction.
In dem Register sind weitere Felder vorgesehen, um die Vorabruf-Option für Einfach-Zugriffe zu aktivieren; um eine Adressen-Umlauf-Option zu deaktivieren; um die ICU-Behandlung eines Einfach-Zugriffsfehlgängers zu steuern; um die ICU-Operation zu steuern, wenn der Prozessor eine Burst-Betriebsart- Lese-Anforderung beendet; um die Vorabruf-Option für Burst- Zugriffe zu aktivieren; und um die Unterblock-Bemessung (SBS) zu wählen.Additional fields are provided in the register to enable the prefetch option for single accesses; to disable an address wraparound option; to control ICU handling of a single access miss; to control ICU operation when the processor completes a burst mode read request; to enable the prefetch option for burst accesses; and to select the sub-block sizing (SBS).
Es sei darauf hingewiesen, daß die Unterblock-Bemessung bei der Steuerung von Cache-Speicher-Neulade-Operationen verwendet wird. Die Anzahl der Wörter, die bei einem einzigen Cache- Speicher-Fehlgänger in den Cache-Speicher neugeladen werden sollen, wird bestimmt durch die definierte Unterblock-Bemessung und die Information, die in der Feldsteuerungs-ICU-Operation für einen Zugriffs-Fehlgänger gespeichert wird (z.B. Steuerinformation wie etwa Start und Stopp bei einer Unterblockgrenze). Ferner wird das SBS-Feld zusammen mit der Burst- Betriebsart-Steuer-Information bei der Burst-Endsteuerung verwendet. Die inhärente Block-Bemessung der ICU beträgt 4 Wörter, wobei ein Tag vier Datenwörtern zugeordnet ist. Die Unterblock-Bemessung beträgt entweder 1, 2 oder 4 Wörter.Note that the subblock size is used in controlling cache reload operations. The number of words to be reloaded into the cache on a single cache miss is determined by the defined subblock size and the information stored in the field control ICU operation for an access miss (e.g., control information such as start and stop at a subblock boundary). Furthermore, the SBS field is used along with the burst mode control information in burst termination control. The inherent block size of the ICU is 4 words, with one tag associated with four data words. The subblock size is either 1, 2, or 4 words.
Ferner enthält das Moda-Register Felder, um die Erweiterung der Speicherbus-Adressen-Transfers zu steuern; um anzuzeigen, ob eine Schreib-Zuordnungs-Option eingeschaltet ist; und um die Schreib-Funktions-Optionen auf globaler Basis zu wählen.The Moda register also contains fields to control the expansion of memory bus address transfers; to indicate whether a write mapping option is enabled; and to select the write function options on a global basis.
Gemäß der bevorzugten Ausführungsform der Erfindung sind die Schreib-Funktionen die folgenden: die flexible, die Durch- Schreib- oder die Rückkopier-Funktion.According to the preferred embodiment of the invention, the writing functions are the following: the flexible, the write-through or the copy-back function.
Wenn eine Durch-Schreib-Funktion gewählt ist, wird jeder Prozessor-Schreibinhalt in die ICU auch in den Speicher eingeschrieben. Wenn ein Rückkopieren gewählt ist, wird jeder Prozessor-Schreib-Treffer in den Cache-Speicher geschrieben, und das modifizierte Bit wird gesetzt. Der Block wird nur dann in den Speicher rückkopiert, wenn der Block ersetzt wird. Wenn die flexible Funktion gewählt ist, kann eine Durch-Schreiboder Rückkopier-Operation für einen Zugriff auf Zugriffs-Basis gewählt werden. Die Schreib-Funktion für einen Zugriff wird ferner beeinflußt durch die ASTC-Eingangssignale, die gemeinsam benutzte Blockstatus-Information und die Schreib-Gemeinsambenutzungs-Treffer-Steuerung und die Prozessorstatusbitsteuerungs-Felder des Modb-Registers (die noch erläutert werden).If a write-through function is selected, each processor write to the ICU is also written to memory. If a copy-back is selected, each processor write hit is written to cache memory and the modified bit is set. The block is copied back to memory only if the block is replaced. If the flexible function is selected, a write-through or copy-back operation for an access can be selected on a per-access basis. The write function for an access is further influenced by the ASTC input signals, the shared block status information, and the write share hit control and the processor status bit control fields. of the Modb register (which will be explained later).
Das Moda-Register enthält ferner ein Feld, das verwendet wird, um die Block-Ersatz-Funktion zu wählen. Diese Wahl wird nicht zur Direktabbildungsorganisation verwendet. Falls bei einer setzungsassoziativen Zweiwege-Organisation einer der Blöcke nicht gültig ist, wird er als neuer Block gewählt. Gemäß der bevorzugten Ausführungsform der Erfindung sind die Optionen für die Ersetzungsfunktion die folgenden: am weitesten zurückliegend verwendet (LRU), direkt, oder extern.The Moda register also contains a field used to select the block replacement function. This selection is not used for direct mapping organization. In a two-way set-associative organization, if one of the blocks is not valid, it is selected as the new block. According to the preferred embodiment of the invention, the options for the replacement function are: least recently used (LRU), direct, or external.
Wenn die LRU-Funktion gewählt ist, wird das LRU-Array für die Wahl des zu ersetzenden Blocks verwendet. Das LRU-Array wird für jeden Cache-Speicher-Zugriff aktualisiert Jedem Satz wird ein Bit zugeordnet. Es verweist auf dem am längsten zuvor verwendeten Block aus den zwei Blöcken in einem Satz.When the LRU feature is selected, the LRU array is used to select the block to be replaced. The LRU array is updated for each cache memory access. Each set is allocated to one bit. It points to the least recently used block out of the two blocks in a set.
Wenn die Direkt-Zugriffsfunktion gewählt ist, wählt eine Pseudo-Direkt-Zugriffslogik den zu ersetzenden Block. Diese Logik ist ein einfaches Flip-flop, das den Status bei jedem Blockzyklus ändert und für sämtliche Sätze verwendet wird.When the direct access function is selected, a pseudo-direct access logic selects the block to be replaced. This logic is a simple flip-flop that changes state at each block cycle and is used for all sets.
Wenn die externe Funktion gewählt ist, wird das WREP-Eingangssignal mit der Prozessoradresse verriegelt. Der verriegelte Wert erzwingt die Wahl des versetzten Blocks. Diese Option kann zum Cache-Speicher-Testen und zur Mehrebenen-Cache-Speicher-Organisation verwendet werden.When the external function is selected, the WREP input signal is latched to the processor address. The latched value forces the selection of the offset block. This option can be used for cache memory testing and multi-level cache memory organization.
Das Moda-Register enthält Felder für das Wählen der Cache- Speicher-Organisation (zweiwege-setzungsassoziativ oder direkt abgebildet); zum Wählen der Cache-Speicher-Operation als Instruktions-Cache oder Daten-Cache; zum Steuern der Paritätserzeugung und Prüfen von Optionen und Speicherbitaktivierungsinformation für die Aktivierung der entsprechenden MA-Bits in dem Chipwahlabbildungsregister zum Adressenvergleich bei Speicher-Zugriffen.The Moda register contains fields for selecting the cache memory organization (two-way set associative or direct mapped); for selecting the cache memory operation as instruction cache or data cache; for controlling parity generation and checking options and memory bit activation information for activating the corresponding MA bits in the chip selection mapping register for address comparison during memory accesses.
Das Modb-Register ist ein Spezialregister 7. Es wird verwendet zur Wahl verschiedener ICU-Optionen. Ein Feld in dem Modb- Register ist Mehrprozessor-Organisationen zugeordnet. Eine detaillierte Beschreibung von Mehrprozessor-Organisationen und der Verwendung dieses Feldes wird noch erfolgen.The Modb register is a special register 7. It is used to select various ICU options. A field in the Modb register is allocated to multiprocessor organizations. A detailed description of multiprocessor organizations and the use of this field will follow.
Das Modb-Register enthält ferner ein Bit zum Steuern der ICU für Eingangs-/Ausgangs-Daten-Zugriffe auf den Prozessorbus (es wird bei Instruktions-Cache-Speicher-Verwendung ignoriert); ein Bit, das die Betriebsart des Lesens der ICU-Register spezifiziert; ein Bit, das das Protokoll für den Cache-Speicher- Instruktions-Transfer auf dem Prozessorbus spezifiziert; und ein Bit, das für die relevanten ICU-Operationen das Byte und die Halbwort-Anforderung innerhalb eines Worts steuert.The Modb register also contains a bit for controlling the ICU for input/output data accesses on the processor bus (it is ignored when instruction cache is used); a bit specifying the mode of operation for reading the ICU registers; a bit specifying the protocol for cache instruction transfer on the processor bus; and a bit controlling the byte and half-word requirement within a word for the relevant ICU operations.
Die mehrprozessororientierte Information in dem Modb-Register enthält: ein cache-speicher-verriegeltes Aktivierungsbit; ein Bus-Lese-Überwachungs-Aktivierungsbit; ein Schreib-Bus-Überwachungs-Aktivierungsbit; ein Feld, das die Operation der ICU im Falle einer Übereinstimmung beim Speicherbus-Lesen durch einen anderen Master steuert; ein Feld, das bei Übereinstimmung die Operation für die Speicherbus-Schreib-Operation durch einen anderen Master steuert; eine Schreib-Fehlgänger-Zugriffs-Steuerung, die die Speicherbus-Operation für einen Rückkopier-Schreib-Fehlgänger bei Schreib-Zuordnung steuert; ein Schreib-Gemeinsambenutzungs-Treffer-Steuer-Feld, das die Operation für ein Schreib-Bit bei einem gemeinsam benutzten Block steuert; eine Prozessor-Gemeisambenutzungs-Bit-Steuerung, die für jeden Prozesssor-Zugriff, falls gesetzt, eine Modifizierung des Blockstatus-Gemeisambenutzungs-Bit veranlaßt; und eine externe Gemeisambenutzungs-Bit-Steuerung, die die Zuordnung des Gemeisambenutzungs-Blockstatus mittels externer Steuerung steuert. Bei der externen gemeinsam benutzten Steuerung wird das *HIT-Signal als Eingangssignal für Speicherbus-Lese- und/oder Schreib-Zugriffe verwendet. Falls es geltend gemacht wird, sind die Daten auch in anderen Cache- Speichern vorhanden, und dem Block wird ein Gemeinsambenutzungsstatus zugeteilt. Falls das *HIT-Eingangssignal nicht geltend gemacht wird, ist die Variable in keinem Cache-Speicher vorhanden, und dem Block wird ein exklusiver Status zugeteilt. Es folgt eine detaillierte Beschreibung dieses Merkmals im Zusammenhang mit einer ICU-Mehrprozessor-Unterstützung.The multiprocessor-oriented information in the Modb register includes: a cache-locked enable bit; a bus read monitor enable bit; a write bus monitor enable bit; a field that controls operation of the ICU in the event of a memory bus read match by another master; a field that controls operation for memory bus write operation by another master in the event of a match; a write miss access control that controls memory bus operation for a copyback write miss on write allocation; a write share hit control field that controls operation for a write bit on a shared block; a processor share bit control that, for each processor access, if set, causes a modification of the block status share bit; and an external sharing bit control that controls the allocation of the shared block status by external control. In the external shared Control uses the *HIT signal as an input for memory bus read and/or write accesses. If it is asserted, the data is also present in other caches and the block is given a shared status. If the *HIT input is not asserted, the variable is not present in any cache and the block is given an exclusive status. A detailed description of this feature in the context of ICU multiprocessor support follows.
Zunächst wird der ICU-Instruktionssatz erläutert.First, the ICU instruction set is explained.
Bei der bevorzugten Ausführungsform der ICU werden 20 Prozessorbus-Cache-Speicher-Instruktionen und 9 Speicherbus-Cache- Speicher-Instruktionen verwendet. Die Prozessorbus-Instruktionen werden von dem Prozessor für spezielle Register-Zugriffe und für spezielle Cache-Speicher-Operations-Anforderungen verwendet. Die Speicherbus-Instruktionen werden von einer speziellen Logik auf dem Speicherbus für spezielle Cache-Speicher-Operations-Anforderungen ausgegeben. In diesem Abschnitt werden Beispiele für unterschiedliche Instruktions-Transfer- Protokolle und ein Beispiel für eine typische Prozessorbus- Instruktion und einen Speicherbus-Instruktionssatz detailliert erläutert.In the preferred embodiment of the ICU, 20 processor bus cache instructions and 9 memory bus cache instructions are used. The processor bus instructions are used by the processor for special register accesses and for special cache operation requests. The memory bus instructions are issued by special logic on the memory bus for special cache operation requests. In this section, examples of different instruction transfer protocols and an example of a typical processor bus instruction and memory bus instruction set are explained in detail.
Die Prozessorbus-Cache-Speicher-Instruktionen und -Operanden werden aus dem Prozessor durch eine spezielle Sequen zvon Prozessorbus-Transaktionen an die ICU übermittelt. Die Instruktion wird jedes Mal ausgeführt, wenn die erforderlichen Operanden zu der ICU übertragen werden.The processor bus cache instructions and operands are transferred from the processor to the ICU through a special sequence of processor bus transactions. The instruction is executed each time the required operands are transferred to the ICU.
Einige Prozessorbus-Cache-Speicher-Instruktionen weisen vier wahlweise Operationsbereiche auf. Der Instruktionsbereich spezifiziert die Anzahl der ICUs, die durch eine Cache-Speicher-Instruktion beeinflußt werden. Der Bereich ist in der Instruktionstabelle mit (s) bezeichnet. Die Instruktionen ohne die (s)-Bezeichnung können nur für eine bestimmte ICU ausgeführt werden. Der Instruktionsbereich kann wie folgt ausgelegt sein: spezifiziert (s) Op-Code signifikante Bits Bedeutung eine bestimmte ICU beeinflußt sämtliche Instruktions- Cache-Speicher beeinflußt sämtliche Daten-Cache-Speicher beeinflußt sämtliche Cache-Speicher beeinflußtSome processor bus cache instructions have four optional operation ranges. The instruction range specifies the number of ICUs affected by a cache instruction. The range is defined in the Instruction table designated with (s). Instructions without the (s) designation can only be executed for a specific ICU. The instruction area can be designed as follows: specified (s) Op-Code significant bits Meaning a specific ICU affects all instruction caches affects all data caches affects all caches affects
Diese Flexibilität erlaubt es einem System-Designer, Cache- Speicher-Instruktionen vorzusehen, die die gewünschten Adressen in den entsprechenden Cache-Speichern bearbeiten. In einer Mehrfach-ICU-Umgebung ist es effizienter, eine einzige Instruktion auszugeben, die für sämtliche Cache-Speicher gleichzeitig ausgeführt wird. Beispielsweise macht die Block-Invalidierungs-Instruktion mit (s) = A (INVBA) den spezifizierten Block in sämtlichen ICUs (in denen der Block gültig ist) parallel ungültig.This flexibility allows a system designer to provide cache instructions that operate on the desired addresses in the appropriate caches. In a multiple ICU environment, it is more efficient to issue a single instruction that executes on all caches simultaneously. For example, the block invalidation instruction with (s) = A (INVBA) invalidates the specified block in all ICUs (in which the block is valid) in parallel.
Die meisten Instruktionen werden in zwei Zyklen ausgeführt. Es können jedoch Ausnahmen existieren, wie im folgenden ausgeführt wird. Während der Ausführung der Prozessorbus-Cache- Speicher-Instruktion kann die ICU weitere Prozessor-Transaktionen akzeptieren (einschließlich neuer Instruktions-Transfers), aber in den meisten Fällen werden sie (falls in der Instruktionsbeschreibung nicht anders bestimmt) nur ausgeführt, nachdem die Prozessorbus-Cache-Speicher-Instruktion abgeschlossen ist. Speicherbus-Transaktionen werden während der Ausführung der Prozessorbus-Cache-Speicher-Instruktion ausgeführt. Da sie jedoch nicht zur Instruktionsausführung synchronisiert sind, reflektiert die ICU-Operation den aktuellen Stand des Cache-Speichers.Most instructions are executed in two cycles. However, exceptions may exist, as explained below. During the execution of the processor bus cache instruction, the ICU may accept additional processor transactions (including new instruction transfers), but in most cases they will be (if specified in the Instruction descriptions do not specify otherwise) are only executed after the processor bus cache instruction is complete. Memory bus transactions are executed during the execution of the processor bus cache instruction. However, because they are not synchronized to instruction execution, the ICU operation reflects the current state of the cache.
Sämtliche Prozessorbus-Cache-Speicher-Instruktion sind privilegiert. Falls das SUP/*US-Eingangssignal LOW ist, wird es während der Ausführung des Prozessorbus-Cache-Speicher-Instruktions-Zugriffs ignoriert, und *CERR als Reaktion geltend macht. Das Statusregister wird mit Statusinformation für die relevanten Instruktionen aktualisiert. Im Fall einer Ausnahme werden das Ausnahmeadressenregister und das Statusregister mit Ausnahmeinformation aktualisiert.All processor bus cache instructions are privileged. If the SUP/*US input is LOW, it is ignored during the execution of the processor bus cache instruction access, and *CERR is asserted in response. The status register is updated with status information for the relevant instructions. In case of an exception, the exception address register and the status register are updated with exception information.
Für die Kommunikation zwischen den ICU und dem Prozessor während der Ausführung der Cache-Speicher-Instruktion existieren mehrere Optionen. Die Definierung des Protokolls erfolgt entsprechend den Instruktionstransferprotokollsteuerungs (ITPC)- und den Register-Lese-Steuerungs(RRC)-Bits des Modb-Registers sowie dem Typ und Umfang der Cache-Speicher-Instruktion. Sämtliche Instruktionen mit Ausnahme von Register-Lesen werden durch eine Schreib-Operation übermittelt. Die Register-Lese- Instruktion wird mittels einer Lese- und Schreib-Operation übermittelt, wie in dem Register-Lese-Steuer-Bit des Modb- Registers definiert ist. Eine Beschreibung dieser Optionen findet sich in der später aufgeführten Erläuterung der Register-Lese- Instruktion.There are several options for communication between the ICU and the processor during execution of the cache instruction. The protocol is defined according to the instruction transfer protocol control (ITPC) and register read control (RRC) bits of the Modb register, as well as the type and size of the cache instruction. All instructions except register reads are transmitted using a write operation. The register read instruction is transmitted using a read and write operation as defined in the register read control bit of the Modb register. A description of these options can be found in the explanation of the register read instruction given later.
Der erste Teil jeder Instruktion ist die Detektion einer Prozessorbus-Cache-Speicher-Instruktions-Anforderung. Eine Prozessorbus-Cache-Speicher-Instruktions-Anforderung kann entweder eine Lese- oder ein Schreib-Prozessorbus-Zugriff sein. Sie wird von der ICU in zwei Fällen detektiert: 1) *CSEL ist geltend gemacht und aktiviert oder 2) die Adressen-Eingangssignale und CREQT0 stimmen mit der Cache-Speicher-Instruktions- Adresse und den Cache-Speicher-Instruktions-Adressen-Raum- Feldern in dem Chipwahlabbildungsregister überein.The first part of every instruction is the detection of a processor bus cache instruction request. A processor bus cache instruction request can be either a read or a write processor bus access. It is detected by the ICU in two cases: 1) *CSEL is asserted made and activated or 2) the address inputs CREQT0 and CREQT0 match the cache instruction address and cache instruction address space fields in the chip select mapping register.
Wenn kein Operand für die Instruktionsausführung erforderlich ist, wird der Transfer in einem einzigen Zyklus abgeschlossen. In diesem Fall ist der Wert auf dem Cache-Speicherbus irrelevant, und die Ausführung der Instruktion startet unmittelbar.If no operand is required for instruction execution, the transfer is completed in a single cycle. In this case, the value on the cache bus is irrelevant and instruction execution starts immediately.
Falls Operanden erforderlich sind, existieren zwei optionale Transfer-Protokolle, die von der ICU unterstützt werden. Das Protokoll wird entsprechend dem Instruktions-Transfer-Protokoll-Steuer-Bit des Modb-Registers gewählt.If operands are required, there are two optional transfer protocols supported by the ICU. The protocol is selected according to the instruction transfer protocol control bit of the Modb register.
Wenn ITPC 1 ist, wird der Cache-Speicher-Bus für den Operanden-Transfer verwendet. Der Prozessorbus benutzt eine normale Schreib-Operation, und die Prozessoradresse und die Datenbusse werden beide verwendet. Die ICU verriegelt den Operandenwert von dem Cache-Speicher-Bus. Bei einer als Instruktions-Cache- Speicher verwendeten ICU sind externe Transceiver erforderlich, um die Daten aus dem ICU-Daten-Bus an den Cache-Speicher-Bus zu übermitteln. Bei dieser Option handelt es sich um die natürliche Wahl für die als Daten-Cache-Speicher verwendete ICU. Für eine als Instruktions-Cache-Speicher verwendete ICU in Verbindung mit externen Transceivern wird ebenfalls ein effizienteres Protokoll erzielt.When ITPC is 1, the cache bus is used for operand transfer. The processor bus uses a normal write operation, and the processor address and data buses are both used. The ICU latches the operand value from the cache bus. For an ICU used as an instruction cache, external transceivers are required to transfer the data from the ICU data bus to the cache bus. This option is the natural choice for the ICU used as a data cache. For an ICU used as an instruction cache, using external transceivers also provides a more efficient protocol.
Wenn ITPC 0 ist, wird der Cache-Speicher-Bus nicht verwendet. Die Operanden werden auf dem Prozessor-Adressenbus übermittelt. Für den Instruktions- und Operanden-Transfer ist ein spezielles Zwei-Zyklus-Protokoll erforderlich. Nachdem eine gültige Information verriegelt ist, erwartet die ICU eine spezielle Daten-Transaktion auf dem Prozessorbus. Die CREQT- Eingangssignale müssen eine Speicher-Daten-Transaktion spezifizieren, die Options-Eingangssignale müssen einen Cache-Speicher-Operanden-Transfer spezifizieren, und der Adressenbus enthält den Operanden. Diese spezielle Schreib-Transaktion wird von der ICU detektiert, und der Operand auf dem Adressenbus wird verriegelt. Es ist anzumerken, daß die obige Transaktion von sämtlichen anderen mit dem Prozessorbus gekoppelten Elementen ignoriert werden muß. Diese Option ist weniger effizient als die andere, aber sie erfordert keine Transceiver für die als Instruktions-Cache-Speicher verwendete ICU.If ITPC is 0, the cache memory bus is not used. The operands are transferred on the processor address bus. A special two-cycle protocol is required for instruction and operand transfer. After valid information is latched, the ICU awaits a special data transaction on the processor bus. The CREQT input signals must specify a memory data transaction, the option input signals must specify a cache memory operand transfer. and the address bus contains the operand. This special write transaction is detected by the ICU and the operand on the address bus is latched. Note that the above transaction must be ignored by all other elements coupled to the processor bus. This option is less efficient than the other, but it does not require any transceivers for the ICU used as an instruction cache.
Beide Optionen können unabhängig fur eine als Daten-Cache- Speicher oder für eine als Instruktions-Cache-Speicher benutzte ICU gewählt werden. Vom Standpunkt der Systemprogrammierung jedoch kann es wünschenswert sein, auf beide Cache-Speicher in ähnlicher Weise zuzugreifen. Falls dies der Fall ist, können beide Cache-Speicher derart programmiert werden, daß sie auf das gleiche Protokoll reagieren.Both options can be chosen independently for an ICU used as a data cache or for an ICU used as an instruction cache. However, from a system programming standpoint, it may be desirable to access both caches in a similar manner. If this is the case, both caches can be programmed to respond to the same protocol.
Falls für die Ausführung der Instruktion ein Zähl-Operand erforderlich ist, muß eine Register-Schreib-Instruktion ausgeführt werden, um ihn in das Zählstandsregister einzuschreiben, bevor die Ausführung der Instruktion beginnt. Die Instruktion wird jedes Mal von der ICU ausgeführt, wenn die Instruktion und sämtliche erforderlichen Operanden gültig sind.If a count operand is required for the instruction to execute, a register write instruction must be executed to write it into the count register before instruction execution begins. The instruction is executed by the ICU every time the instruction and all required operands are valid.
Während des Cache-Speicher-Instruktions-Transfer-Protokolls können Prozessorinterrupts auftreten. Die bevorzugte Ausführungsform der ICU enthält eine Logik zur Behebung derartiger Fälle. Das Instruktionsregister, das Operandenregister und das Zählstandsregister können derart gelesen werden, daß ihr Inhalt unbeeinflußt gerettet wird, wobei die Register-Schreib- Instruktion verwendet wird. Die Instruktions-Gültig-, Operand- Gültig- und Zählstand-Gültig-Bits zeigen die Gültigkeit für das entsprechende Register an. Die Rettungs- und Wiederherstellungs-Operationen erlauben eine Fortführung des Instruktions-Transfer-Protokolls vom Punkt der Unterbrechung an.Processor interrupts may occur during the cache instruction transfer protocol. The preferred embodiment of the ICU includes logic to handle such cases. The instruction register, operand register, and count register can be read in such a way that their contents are saved unaffected using the register write instruction. The instruction valid, operand valid, and count valid bits indicate the validity for the corresponding register. The rescue and recovery operations allow the instruction transfer protocol to continue from the point of interruption.
Im folgenden wird ein für eine Ausführungsform der Erfindung zweckmäßiger Satz von Prozessorbus-Cache-Speicher-Instruktionen mnemonisch und mit kurzer Zweckbeschreibung als Tabelle aufgeführt: Mnemonischer Ausdruck Beschreibung keine Operation Wort invalidieren Block invalidieren Mehrfaches invalidieren alles invalidieren Wort übermitteln, falls modifiziert Block übermitteln, falls modifiziert Aktualisieren des Speichers und Invalidieren Aktualisieren des Speichers und Invalidierendes Mehrfachwertes Verriegeln des Blocks Entriegeln des Blocks Lesen Blockstatus Schreiben Blockstatus Wort übermitteln, falls Treffer Lesen Tag Schreiben Tag Vorladen Cache-Speicher Rücksetzen Lesen Register Schreiben RegisterIn the following, a set of processor bus cache instructions useful for an embodiment of the invention is listed mnemonic and with a brief description of their purpose in a table: Mnemonic Description no operation invalidate word invalidate block invalidate multiple invalidate all commit word if modified commit block if modified update memory and invalidate update memory and invalidate multiple value lock block unlock block read block status write block status commit word if match read tag write tag preload cache memory reset read register write register
Es ist anzumerken, daß das Symbol (s) in dem mnemonischen Instruktions-Ausdruck den Instruktionsumfang als zuvor definiert angibt und das Symbol (i) in den RDR und WRR-Instruktionen die Registernummer angibt, die durch die 3 am wenigsten signifikanten Bits des Op-Code spezifiziert ist.It should be noted that the symbol (s) in the mnemonic instruction expression indicates the instruction scope as previously defined and the symbol (i) in the RDR and WRR instructions indicates the register number specified by the 3 least significant bits of the op-code.
Ferner ist anzumerken, daß bestimmte Operanden (obwohl sie hier nicht erläutert werden) entsprechend Instruktions-Anforderungen spezifiziert werden. Falls mehr als ein Operand spezifiziert werden soll, ist für das Laden des zweiten spezifizierten Operanden eine WRR-Instruktion erforderlich.It should also be noted that certain operands (although not discussed here) are specified according to instruction requirements. If more than one operand is to be specified, a WRR instruction is required to load the second specified operand.
Auf der funktionalen Ebene ergeben sich bei der Ausführung der Instruktionen die folgenden Aktionen:At the functional level, the following actions occur when the instructions are executed:
Keine Operation (NOP) - Für diese Instruktion wird von der ICU keine Operation ausgeführt.No Operation (NOP) - The ICU will not perform any operation for this instruction.
Wort invalidieren (INVWO, INVWI, INWWD, INVWA) (die unterschiedlichen Bereiche sind zu beachten) - Das durch einen Adressenoperanden spezifizierte Wort wird invalidiert (das entsprechende gültige Bit wird rückgesetzt).Invalidate word (INVWO, INVWI, INWWD, INVWA) (note the different ranges) - The word specified by an address operand is invalidated (the corresponding valid bit is reset).
Block invalidieren (INVBO, INVBI, INVBD, INVBA) - Der durch den Adressenoperanden spezifizierte Vier-Wort-Block wird invalidiert (sämtliche entsprechenden gültigen Bits werden rückgesetzt).Invalidate Block (INVBO, INVBI, INVBD, INVBA) - The four-word block specified by the address operand is invalidated (all corresponding valid bits are reset).
Mehrfaches invalidieren (INVMO, INVMI, INVMD, INVMA) - Sequentielle Mehrfach-Vier-Block-Wörter werden von der ICU invahdiert. Jede einzelne Operation ist der INVB-Instruktion ähnlich.Multiple Invalidate (INVMO, INVMI, INVMD, INVMA) - Sequential multiple four-block words are invaded by the ICU. Each individual operation is similar to the INVB instruction.
Die Instruktion wird in mehreren Zyklen ausgeführt (zwei Zyklen für die Initialisierung + ein Zyklus pro Vier-Wort- Block). Für diese Instruktion muß das Zählstandsregister einen gültigen Zählstand enthalten. Das Zählstandsregister wird mittels der Register-Schreib-Instruktion geladen. Das Zählstand-Gültig-Bit bleibt nach der Ausführung der Instruktion gesetzt. Zur Gewährleistung einer korrekten Ausführung muß das Zählstandsregister entweder vor der Anforderung der INVM-Instruktion geladen werden, oder es muß den korrekten Wert aus einer vorherigen Operation enthalten. Diese Instruktion kann verwendet werden, um einen Seitenrahmen zu invalidieren. Das Zählstandsregister muß eine Anzahl von Vier-Wort-Blöcken in einer Seite enthalten (Seiten-Bemessung in Byte dividiert durch 16).The instruction is executed in several cycles (two cycles for initialization + one cycle per four-word block). For this instruction, the count register must contain a valid count. The count register is loaded using the register write instruction. The count valid bit remains after the instruction is executed. set. To ensure correct execution, the count register must either be loaded before the INVM instruction is requested, or it must contain the correct value from a previous operation. This instruction can be used to invalidate a page frame. The count register must contain a number of four-word blocks in a page (page size in bytes divided by 16).
Alles invalidieren (INVAO, INVAI, INVAD, INVAA) - Diese Instruktion invalidiert sämtliche Wörter in dem Cache-Speicher. Sämtliche gültigen Bits werden rückgesetztInvalidate All (INVAO, INVAI, INVAD, INVAA) - This instruction invalidates all words in the cache memory. All valid bits are reset
Wort übermitteln, falls modifiziert (SWMO, SWMI, SWMD, SWMA) - Falls das durch den Adressenoperanden spezifizierte Wort in dem Cache-Speicher vorhanden ist und das modifizierte Bit für den Block gesetzt ist, wird es in die entsprechende Adresse in dem Speicher geschrieben.Transmit Word If Modified (SWMO, SWMI, SWMD, SWMA) - If the word specified by the address operand is present in the cache and the modified bit for the block is set, it is written to the corresponding address in the memory.
Block übermitteln, falls modifiziert (SBMO, SBMI, SBMD, SBMA) - Falls der durch den Adressenoperanden spezifizierte Vier- Wort-Block modifiziert ist, werden sämtliche gültigen Wörter in die entsprechenden Adressen in dem Speicher geschrieben.Transmit Block If Modified (SBMO, SBMI, SBMD, SBMA) - If the four-word block specified by the address operand is modified, all valid words are written to the corresponding addresses in memory.
Aktualisieren des Speichers und Invalidieren (UPMIO, UPMII, UPMID, UPMIA) - Falls der durch den Adressenoperanden spezifizierte Vier-Wort-Block modifiziert ist, werden sämtliche gültigen Wörter in die entsprechenden Adressen in dem Speicher geschrieben. Dann werden sämtliche gültigen Bits rückgesetzt Die Schreib-Operation wird mittels einer Burst-Betriebsart oder eines Einfach-Speicherbus-Schreib-Zugriffs (in Abhängigkeit von der Anzahl der gültigen Wörter) durchgeführt, nachdem der Speicherbus für die ICU zugelassen worden ist.Refresh Memory and Invalidate (UPMIO, UPMII, UPMID, UPMIA) - If the four-word block specified by the address operand is modified, all valid words are written to the corresponding addresses in memory. Then all valid bits are reset. The write operation is performed using a burst mode or a single memory bus write access (depending on the number of valid words) after the memory bus has been granted access to the ICU.
Aktualisieren des Speichers und Invalidieren des Mehrfachwertes (UPIMO, UPIMI, UPIMD, UPIMA) - Mehrere sequentielle Speicheraktualisierungs- und Invalidierungs-Operationen werden von der ICU durchgeführt. Jede einzelne Operation ist in ähnlicher Weise ausgelegt wie die Instruktion zum Aktualisieren des Speichers und Invalidieren. Die Instruktion wird in mehreren Zyklen ausgeführt (zwei Zyklen für die Initialisierung plus ein Zyklus pro Vier-Wort-Block). Für diese Instruktion muß das Zählstandsregister einen gültigen Zählstand enthalten. Das Zählstandsregister wird mittels der Register-Schreib-Instruktion geladen. Das Zählstand-Gültig-Bit bleibt nach der Ausführung der Instruktion gesetzt. Zur Gewährleistung einer korrekten Ausführung muß das Zählstandsregister entweder vor der Anforderung der INVM-Instruktion geladen werden, oder es muß den korrekten Wert aus einer vorherigen Operation enthalten. Diese Instruktion kann verwendet werden, um den Speicher zu aktualisieren und einen Seitenrahmen zu invalidieren. Das Zählstandsregister muß eine Anzahl von Vier-Wort-Blöcken in einer Seite enthalten (Seiten-Bemessung in Byte dividiert durch 16).Updating Memory and Invalidating Multiple Values (UPIMO, UPIMI, UPIMD, UPIMA) - Multiple sequential memory update and invalidate operations are performed by the ICU. Each individual operation is designed in a similar manner to the update memory and invalidate instruction. The instruction is executed in multiple cycles (two cycles for initialization plus one cycle per four-word block). For this instruction, the count register must contain a valid count. The count register is loaded using the register write instruction. The count valid bit remains set after the instruction is executed. To ensure correct execution, the count register must either be loaded before the INVM instruction is requested, or it must contain the correct value from a previous operation. This instruction can be used to update memory and invalidate a page frame. The count register must contain a number of four-word blocks in a page (page size in bytes divided by 16).
Verriegeln des Blocks (LCKO, LCKI, LCKD, LCKA) - Falls der durch den Adressenoperanden bestimmte Vier-Wort-Block (oder ein Teil dieses Blocks) in dem Cache-Speicher vorhanden ist, wird das entsprechende Blockstatus-Verriegelungs-Bit gesetzt.Locking the block (LCKO, LCKI, LCKD, LCKA) - If the four-word block specified by the address operand (or a portion of that block) is present in the cache, the corresponding block status lock bit is set.
Entriegeln des Blocks (ULCKO, ULCKI, ULCKD, ULCKA) - Falls der durch den Adressenoperanden bestimmte Vier-Wort-Block (oder ein Teil dieses Blocks) in dem Cache-Speicher vorhanden ist, wird das entsprechende Blockstatus-Verriegelungs-Bit rückgesetzt.Unlock Block (ULCKO, ULCKI, ULCKD, ULCKA) - If the four-word block specified by the address operand (or a portion of that block) is present in the cache, the corresponding block status lock bit is reset.
Lesen Blockstatus (RBST0, RBSTI, RBSTD, RBSTA) - Die spezifizierte Wortadresse wird auf ihr Vorhandensein in dem Cache- Speicher hin überprüft, und das Statusregister wird entsprechend aktualisiert.Read Block Status (RBST0, RBSTI, RBSTD, RBSTA) - The specified word address is checked for its presence in the cache memory and the status register is updated accordingly.
Schreiben Blockstatus (WBSTO, WBSTI, WBSTD, WBSTA) - Der Block, der die spezifizierte Wortadresse enthält, wird auf sein Vorhandensein in dem Cache-Speicher hin überprüft, und die Blockstatus-Bits werden basierend auf dem Wert der Bits in dem Statusregister aktualisiert.Write Block Status (WBSTO, WBSTI, WBSTD, WBSTA) - The block containing the specified word address is checked for its presence in the cache memory and the block status bits are updated based on the value of the bits in the status register.
Wort übermitteln, falls Treffer (SWH) - Falls das durch den Adressenoperanden bestimmte Wort in dem Cache-Speicher vorhanden ist, wird es in die entsprechende Adresse in dem Speicher geschrieben.Send Word If Hit (SWH) - If the word specified by the address operand is present in the cache memory, it is written to the corresponding address in the memory.
Lesen Tag (RTAG) - Diese Instruktion wird zum Lesen eines bestimmten Tag in dem Cache-Speicher verwendet.Read Tag (RTAG) - This instruction is used to read a specific tag in the cache memory.
Schreiben Tag (WTAG) - Diese Instruktion wird zum Schreiben eines bestimmten Tag in dem Cache-Speicher verwendet.Write Tag (WTAG) - This instruction is used to write a specific tag in the cache memory.
Vorladen (PRLD) - Das Vorladen ist eine spezielle Operation, die durchgeführt werden kann, um einen Cache-Speicher mit bestimmten Datenvariablen oder Instruktionen zu laden, bevor sie benötigt werden. Die Operation erfolgt unter Software- Steuerung. Die Adressen der erforderlichen Variablen oder Instruktionen werden vom Benutzer zugeführt. Es ist anzumerken, daß die sich Vorlade-Operation von simplen Vorabruf-Operationen unterscheidet. Ein Vorabruf erfolgt normalerweise unter Hardware-Steuerung, und die vorabgerufenen Adressen befinden sich in enger Nachbarschaft zu der Adresse der ursprünglichen Speicher-Anforderung.Preload (PRLD) - Preload is a special operation that can be performed to load a cache with certain data variables or instructions before they are needed. The operation is performed under software control. The addresses of the required variables or instructions are supplied by the user. It should be noted that the preload operation is different from simple prefetch operations. A prefetch is usually performed under hardware control, and the prefetched addresses are in close proximity to the address of the original memory request.
Das Benutzer- und Kompiler-Wissen des Programms sollte verwendet werden, um die am meisten nützlichen Instruktionen oder Datenvariablen vorauszusagen. Die entsprechenden Adressen werden in die Instruktions- und Daten-Cache-Speicher vorgeladen, bevor die Ausführung des Programms gestartet wird. Die Operation kann unter Cache-Speicher-Steuerung ohne Eingreifen des Prozessors durchgeführt werden. Dies gestattet eine bessere Ausnutzung des Cache-Speichers und eine größere Gesamtleistung.The user and compiler knowledge of the program should be used to predict the most useful instructions or data variables. The corresponding addresses are preloaded into the instruction and data caches before the program execution is started. The operation can be performed under cache control without processor intervention. This allows for better Utilization of cache memory and greater overall performance.
Die Vorlade-Operation, die an sich neu ist, wird im Zusammenhang mit der hierin aufgenommenen RISC/SIP-Architektur beschrieben. Sie kann auch in anderen Cache-Speicher-Systemen verwendet werden.The prefetch operation, which is novel in itself, is described in the context of the RISC/SIP architecture included here. It can also be used in other cache memory systems.
Die Instruktion wird durch den Prozessor initiiert, indem der Opcode und die Operanden an die geeignete Cache-Speicher-Einheit übermittelt werden. Es sind zwei Operanden erforderlich: ein Adressenoperand und ein Zählstandsoperand. Mehrere sequentielle Wörter werden mittels der Speicherbus-Lese-Burst- Transaktion unter ICU-Steuerung in den Cache-Speicher geladen. Der Adressenoperand spezifiziert die Startwortadresse. Das Zählstandsregister spezifiziert die Anzahl von Vier-Wort- Blöcken. Wenn die höchstmögliche Adresse erreicht ist, wird ein Umlauf durchgeführt.The instruction is initiated by the processor by sending the opcode and operands to the appropriate cache unit. Two operands are required: an address operand and a count operand. Multiple sequential words are loaded into the cache using the memory bus read burst transaction under ICU control. The address operand specifies the starting word address. The count register specifies the number of four-word blocks. When the highest possible address is reached, a wraparound is performed.
Die Instruktion wird in mehreren Zyklen ausgeführt (zwei Zyklen für die Initialisierung plus ein Speicherbus-Burst-Lese- Zugriff pro Wort). Für diese Instruktion muß das Zählstandsregister ferner einen gültigen Zählstand enthalten. Die Vorlade-Instruktion kann auf verschiedene Weise durchgeführt werden. Die grundlegenden Optionen sind die folgenden:The instruction is executed in multiple cycles (two cycles for initialization plus one memory bus burst read access per word). This instruction also requires the count register to contain a valid count. The precharge instruction can be performed in several ways. The basic options are the following:
Ein einfaches Verfahren zum Verwenden der Vorlade-Instruktion verlangt keine spezielle Cache-Speicher-Konfiguration und kann bei jedem beliebigen Cache-Speicher-System verwendet werden. Bei diesem Verfahren wird die Vorlade-Instruktion unter Software-Steuerung ausgeführt, bevor das Programm durchgeführt wird. Die Instruktion kann als Teil des kontextuellen Schaltvorgangs ausgegeben werden. Da die Cache-Speicher vorgeladen sind, ist der Kaltstarteffekt minimiert. Der Hauptnachteil dieses Verfahrens liegt darin, daß die Vorlade-Operation andere Cache-Speicher-Operationen, die von dem Prozessor verlangt sind, beeinträchtigen kann.A simple method of using the preload instruction does not require any special cache configuration and can be used with any cache system. In this method, the preload instruction is executed under software control before the program is executed. The instruction can be issued as part of the contextual switch. Since the caches are preloaded, the cold start effect is minimized. The main disadvantage of this method is that the preload operation induces other may interfere with cache memory operations required by the processor.
Diese Einschränkung kann mittels einer komplexeren Cache-Speicher-Konfiguration überwunden werden. Diese Konfiguration (als schaltbare Cache-Speicher bezeichnet) verlangt mehr als einen Cache-Speicher für jeden Prozessor und ein Verfahren zum Schalten zwischen den Cache-Speichern. Die schaltbare Cache- Speicher aufweisende Konfiguration erlaubt den Betrieb mehrerer Cache-Speicher in dem gleichen Adressenraum. Zwei oder mehr Cache-Speicher sind parallel angeordnet, jedoch ist nur einer der Cache-Speicher für Prozessor-Speicher-Zugriff-Reaktionen ausgelegt. Der andere Cache-Speicher oder die anderen Cache-Speicher können derart programmiert werden, daß sie die Variablen oder Instruktionen, die für das nächste Programm (oder den nächsten Ablauf) erforderlich sind, vorladen. Bevor die Ausführung des nächsten Programms startet, wird der korrekte Cache-Speicher (der die vorgeladenen Daten enthält) aktiviert, und die anderen Cache-Speicher werden deaktiviert.This limitation can be overcome by using a more complex cache configuration. This configuration (called switchable caches) requires more than one cache for each processor and a method for switching between caches. The switchable cache configuration allows multiple caches to operate in the same address space. Two or more caches are arranged in parallel, but only one of the caches is designed for processor memory access responses. The other cache or caches can be programmed to preload the variables or instructions required for the next program (or execution). Before execution of the next program starts, the correct cache (containing the preloaded data) is activated and the other caches are deactivated.
Die Implementierung dieses Schemas wird von der ICU voll unterstützt. Die gesamte erforderliche Unterstützung ist auf dem Einzelchip implementiert. Die Deaktivierung oder Aktivierung einer einzelnen ICU kann durch Programmieren eines Betriebszustandsregisters erfolgen. Die Vorlade-Instruktion wird derart implementiert, daß dieses Schema unterstützt ist. Insbesondere kann die ICU die Vorlade-Instruktion selbst dann ausführen, wenn sie für normale Cache-Speicher-Operationen deaktiviert ist. Es können zwei oder mehr ICUs parallel plaziert werden, und nur eine kann für normale Cache-Speicher-Operationen aktiviert werden, während die andere Vorlade-Operationen durchführt. (Es ist keine Verleimungs-Logik erforderlich).The implementation of this scheme is fully supported by the ICU. All required support is implemented on the single chip. Disabling or enabling an individual ICU can be done by programming an operating state register. The precharge instruction is implemented to support this scheme. In particular, the ICU can execute the precharge instruction even if it is disabled for normal cache operations. Two or more ICUs can be placed in parallel, and only one can be enabled for normal cache operations while the other performs precharge operations. (No gluing logic is required).
Diese Konfiguration kann einen beträchtlichen Leistungsvorteil erbringen, da die Vorlade-Operationen mit minimaler Auswirkung auf die Ausführung des aktuellen Programms erfolgen.This configuration can provide a significant performance benefit because the preload operations occur with minimal impact on the execution of the current program.
Rücksetzen (RST) - Die Rücksetz-Instruktion führt die gleiche Funktion durch, wie sie durch die Geltendmachung des *RESET- Eingangssignals durchgeführt wird. Die ICU wird initialisiert. Die RST-Instruktion wird unmittelbar, nachdem sie akzeptiert ist, ausgeführt. Eine Mehrfach-Instruktion (INVM, UPIM, PRLD) wird beendet.Reset (RST) - The reset instruction performs the same function as performed by asserting the *RESET input signal. The ICU is initialized. The RST instruction is executed immediately after it is accepted. A multiple instruction (INVM, UPIM, PRLD) is terminated.
Lesen Register (RDR) - Die Register-Lese-Instruktion wird zum Lesen der speziellen Register der ICU verwendet. Die Nummer des speziellen Registers wird durch den Op-Code bestimmt. Die ICU reagiert auf verschiedene Weise auf diese Instruktion, und zwar in Abhängigkeit von dem Zustand eines Register-Lese-Steuerungs(RRC) -Bits in dem Modb-Register. Wenn RRC 1 ist, bewirkt eine Lese-Instruktion mit der Instruktion auf dem Adressenbus die Inituerung der Instruktion. Wenn RRC 0 ist, wird der Hauptspeicher zum Lesen der Register verwendet.Read Register (RDR) - The Read Register instruction is used to read the ICU's special registers. The number of the special register is determined by the opcode. The ICU responds to this instruction in different ways, depending on the state of a Register Read Control (RRC) bit in the Modb register. If RRC is 1, a Read instruction with the instruction on the address bus causes the instruction to be initiated. If RRC is 0, main memory is used to read the registers.
Schreiben Register (WRR) - Die Register-Schreib-Instruktion wird zum Schreiben in die speziellen Register der ICU verwendet. Die Nummer des speziellen Registers wird durch den Op- Code bestimmt. Die Daten werden als Instruktionsoperand spezifiziert. Die WRR-Instruktion wird unmittelbar, nachdem sie akzeptiert ist, ausgeführt. Falls eine gültige Instruktion und ein Operand in den Instruktions- und Operanden-Registern vorhanden sind, wird diese ausgeführt, ohne deren Inhalt zu beeinträchtigen. Dieses Merkmal kann verwendet werden, um die ICU-Register wiederherzustellen.Write Register (WRR) - The Write Register instruction is used to write to the ICU's special registers. The number of the special register is determined by the op-code. The data is specified as an instruction operand. The WRR instruction is executed immediately after it is accepted. If a valid instruction and operand are present in the instruction and operand registers, it is executed without affecting their contents. This feature can be used to restore the ICU registers.
Wie bereits erwähnt, werden die Speicherbus-Cache-Instruktionen durch eine spezielle Logik auf dem Speicherbus ausgeführt. Diese Logik muß in der Lage sein, die Instruktion an die geeignete ICU zu leiten. Sämtliche ICUs in dem System, die eine gültige Instruktion an ihren Eingängen erkennen, führen diese aus. Es existieren keine äquivalenten Konzepte hinsichtlich des Prozessorbus-Instruktions-Umfangs und der privilegierten Instruktionen auf dem Speicherbus.As mentioned earlier, the memory bus cache instructions are executed by special logic on the memory bus. This logic must be able to route the instruction to the appropriate ICU. All ICUs in the system that detect a valid instruction on their inputs will execute it. There are no equivalent concepts regarding processor bus instruction scope and privileged instructions on the memory bus.
Sämtliche Speicherbus-Cache-Instruktionen können an die ICU übermittelt werden, falls diese der Bus-Slave ist, indem eine bestimmte Cache-Speicher-Instruktions-Transfer-Speicherbus- Transaktion verwendet wird. Die Blockstatus-Schreib-Instruktion kann ebenfalls übermittelt werden, falls die ICU der Bus- Master ist, indem das *VSI-Eingangssignal geltend gemacht wird. Die Instruktion wird jedes Mal ausgeführt, wenn die erforderlichen Cache-Speicher-Betriebsmittel verfügbar sind, nachdem die Instruktion und die Operanden akzeptiert sind. Sämtliche Instruktionen werden intern in zwei Zyklen ausgeführt. Falls eine Speicherbus-Operation für die Ausführung der Instruktion erforderlich ist, muß die Zyklus-Zahl für die Bus- Operation hinzuaddiert werden.All memory bus cache instructions can be sent to the ICU if it is the bus slave using a specific cache instruction transfer memory bus transaction. The block state write instruction can also be sent if the ICU is the bus master by asserting the *VSI input. The instruction is executed whenever the required cache resources are available after the instruction and operands are accepted. All instructions are executed internally in two cycles. If a memory bus operation is required to execute the instruction, the cycle number for the bus operation must be added.
Die Speicherbus-Cache-Instruktionen werden unabhängig von anderen auf dem Prozessorbus erfolgenden ICU-Operationen (einschließlich der Prozessorbus-Cache-Speicher-Instruktionen) durchgeführt. Die Speicherbus-Instruktionen und die Prozessorbus-Operationen werden entsprechend der Reihenfolge, in der sie empfangen werden, durchgeführt. Das Ergebnis der Speicherbus-Instruktion reflektiert den aktuellen Zustand des Cache- Speichers. Falls eine Speicherbus-Cache-Instruktion während der Ausführung einer Mehrfach-Prozessorbus-Cache-Speicher- Instruktion akzeptiert wird, wird sie ohne eine Beeinträchtigung der Ausführung der Mehrfach-Instruktion ausgeführt.The memory bus cache instructions are executed independently of other ICU operations occurring on the processor bus (including the processor bus cache instructions). The memory bus instructions and the processor bus operations are executed according to the order in which they are received. The result of the memory bus instruction reflects the current state of the cache. If a memory bus cache instruction is accepted during the execution of a multiple processor bus cache instruction, it is executed without affecting the execution of the multiple instruction.
Sämtliche Speicherbus-Cache-Instruktionen mit Ausnahme des Schreibens eines Wortes in den Cache-Speicher weisen eine äquivalente Prozessorbus-Cache-Speicher-Instruktion mit einem gleichartigen Namen auf. Diese Instruktionen haben einen ähnlichen Effekt auf dem internen Cache-Speicher, jedoch sind die Operationen des Prozessorbusses und des Speicherbusses unterschiedlich.All memory bus cache instructions, except for writing a word to cache, have an equivalent processor bus cache instruction with a similar name. These instructions have a similar effect on the internal cache, but the processor bus and memory bus operations are different.
Sämtliche Speicherbus-Cache-Instruktionen werden mittels einer einzigen Cache-Speicher-Instruktions-Transfer-Speicherbus Transaktion übermittelt. Wenn die ICU nicht der Bus-Master ist, verursacht die Geltendmachung von *VSI eine Cache-Speicher-Instruktions-Transaktion auf dem Speicherbus. Während des ersten Zyklus der Transaktion werden die MRW-, MREQT-, BSTC- Signale und die Adresse verriegelt. Die MRW- und MREQT-Signale spezifizieren die Instruktion. Die BSTC-Signale spezifizieren den Blockstatus für die relevanten Instruktionen Die Adresse wird als Adressenoperand für die relevante Instruktion verwendet. Falls die Instruktion einen Datenoperanden erfordert, werden die Daten während des zweiten Zyklus verriegelt.All memory bus cache instructions are transferred via a single cache memory instruction transfer memory bus Transaction committed. If the ICU is not the bus master, the assertion of *VSI causes a cache instruction transaction on the memory bus. During the first cycle of the transaction, the MRW, MREQT, BSTC signals and the address are latched. The MRW and MREQT signals specify the instruction. The BSTC signals specify the block status for the relevant instructions. The address is used as the address operand for the relevant instruction. If the instruction requires a data operand, the data is latched during the second cycle.
Wenn die ICU der Bus-Master ist und eine Lese-Anforderung für eine Neulade-Operation ausgibt, hat das *VSI-Eingangssignal eine spezielle Funktion. Falls es geltend gemacht wird, bevor die Transaktion abgeschlossen ist (das letzte *MRDY-Signal ist nicht akzeptiert worden), dann werden die BSTC-Signale verriegelt, und eine Schreib-Blockstatus-Instruktion wird ausgeführt. Der Adressenoperand ist die Blockadresse, die derjenigen Adresse entspricht, die von der ICU für die Neulade-Operation übermittelt wurde.When the ICU is the bus master and issues a read request for a reload operation, the *VSI input signal has a special function. If it is asserted before the transaction is complete (the last *MRDY signal has not been accepted), then the BSTC signals are latched and a write block status instruction is executed. The address operand is the block address corresponding to the address passed by the ICU for the reload operation.
Im folgenden wird ein für eine Ausführungsform der Erfindung zweckmäßiger Satz von Speicherbus-Cache-Speicher-Instruktionen mnemonisch und mit kurzer Zweckbeschreibung als Tabelle aufgeführt: Mnemonischer Ausdruck Beschreibung keine Operation Wort übermitteln, falls Treffer Wort übermitteln, falls modifi-ziert Mnemonischer Ausdruck Beschreibung Block übermitteln, falls modifi-ziert Wort invalidieren Block invalidieren Schreiben Blockstatus Schreiben Register Aktualisieren des Speichers und Invalidieren Lesen Blockstatus Lesen Register Wort in Cache-Speicher schreibenIn the following, a set of memory bus cache instructions useful for an embodiment of the invention is listed mnemonic and with a brief description of their purpose in a table: Mnemonic expression Description no operation Submit word if match Submit word if modified Mnemonic Description Submit block if modified Invalidate word Invalidate block Write block status Write register Update memory and invalidate Read block status Read register Write word to cache
Es ist anzumerken, daß die Instruktions-Codes derart ausgelegt sind, daß MRWO mit anderen Speicherbus-Operationen konsistent ist. Falls MRWO im LOW-Zustand ist, verläuft die Richtung von der ICU zu dem Speicherbus, und Falls MRWO im HIGH-Zustand ist, verläuft die Richtung von dem Speicherbus zu der ICU.Note that the instruction codes are designed so that MRWO is consistent with other memory bus operations. If MRWO is LOW, the direction is from the ICU to the memory bus, and if MRWO is HIGH, the direction is from the memory bus to the ICU.
Auf der funktionalen Ebene ergeben sich bei der Ausführung der Instruktionen die folgenden Aktionen:At the functional level, the following actions occur when the instructions are executed:
Keine Operation (NOP) - Diese Aktion hat keine Auswirkung auf die ICU. Das Speicherbus-Cache-Instruktions-Transaktions-Protokoll wird wie für jede Instruktion ausgeführt.No Operation (NOP) - This action has no effect on the ICU. The memory bus cache instruction transaction protocol is executed as for any instruction.
Wort übermitteln, falls Treffer (SWH) - Falls das von dem Adressenoperanden bestimmte Wort in dem Cache-Speicher vorhanden ist, wird das *HIT-Signal geltend gemacht. Das Wort wird auf dem Speicheradressenbus angesteuert, die mit gemeinsamem Blockstatus benutzten und modifizierten Bits werden auf die BSTC-Signale angesteuert, und *MRDY wird geltend gemacht.Send Word If Hit (SWH) - If the word specified by the address operand is present in the cache memory, the *HIT signal is asserted. The word is addressed on the memory address bus, which is shared by Block status used and modified bits are driven to the BSTC signals and *MRDY is asserted.
Wort übermitteln, falls modifiziert (SWM) - Falls das von dem Adressenoperanden bestimmte Wort in dem Cache-Speicher vorhanden ist und das modifizierte Bit für den Block gesetzt ist, werden die *HIT und die *MRDY-Signale geltend gemacht, und die mit gemeinsamem Blockstatus benutzten und modifizierten Bits werden auf die BSTC-Signale angesteuert. Dann wird das Wort in die entsprechende Adresse in dem Speicher geschrieben.Send Word If Modified (SWM) - If the word specified by the address operand is present in the cache memory and the modified bit for the block is set, the *HIT and *MRDY signals are asserted and the shared block status and modified bits are driven to the BSTC signals. Then the word is written to the corresponding address in memory.
Block übermitteln, falls modifiziert (SBM) - Falls der von dem Adressenoperanden bestimmte Vier-Wort-Block modifiziert ist, werden die *HIT und die *MRDY-Signale geltend gemacht, und die mit gemeinsamem Blockstatus benutzten und modifizierten Bits werden auf die BSTC-Signale angesteuert. Dann werden sämtliche gültigen Wörter in die entsprechenden Adressen in dem Speicher geschrieben.Transmit Block If Modified (SBM) - If the four-word block specified by the address operand is modified, the *HIT and *MRDY signals are asserted and the bits used with shared block status and modified are driven to the BSTC signals. Then all valid words are written to the corresponding addresses in memory.
Wort invalidieren (INVW) - Das von dem Adressenoperanden bestimmte Wort wird invalidiert (das entsprechende gültige Bit wird rückgesetzt). Das *HIT-Signal wird entsprechend den Hitoder Miss-Bedingungen gesteuert und *MRDY geltend gemacht, nachdem die Ausführung der Instruktion abgeschlossen ist.Invalidate Word (INVW) - The word specified by the address operand is invalidated (the corresponding valid bit is reset). The *HIT signal is driven according to the hit or miss conditions and *MRDY is asserted after instruction execution is complete.
Block invalidieren (INVB) - Der von dem Adressenoperanden bestimmte Vier-Wort-Block wird invalidiert (sämtliche entsprechenden gültigen Bits werden rückgesetzt). Das *HIT-Signal wird entsprechend den Hit- oder Miss-Bedingungen gesteuert und *MRDY geltend gemacht, nachdem die Ausführung der Instruktion abgeschlossen ist.Invalidate Block (INVB) - The four-word block specified by the address operand is invalidated (all corresponding valid bits are reset). The *HIT signal is driven according to the hit or miss conditions and *MRDY is asserted after instruction execution is complete.
Schreiben Blockstatus (WBST) - Diese Instruktion kann ausgeführt werden, wenn die ICU der Bus-Slave oder der Bus-Master ist. Wenn die ICU der Slave ist, wird der Adressenoperand durch die Speicherbus-Transaktion spezifiziert. In diesem Fall wird der Block, der die spezifizierte Wortadresse enthält, auf das Vorhandensein in dem Cache-Speicher geprüft. Falls der Block vorhanden ist, werden die *HIT und *MRDY-Signale geltend gemacht, und die Blockstatus-Bits werden aus den BSTC- Signalen kopiert. Falls der Block nicht vorhanden ist, wird die Hit-Signal deaktiviert, und *MRDY wird geltend gemacht. Die Hit- und Gültigkeits-Bits des Statusregisters werden rückgesetzt.Write Block Status (WBST) - This instruction can be executed when the ICU is the bus slave or the bus master. If the ICU is the slave, the address operand is specified by the memory bus transaction. In this case the block containing the specified word address is checked for presence in the cache memory. If the block is present, the *HIT and *MRDY signals are asserted and the block status bits are copied from the BSTC signals. If the block is not present, the Hit signal is deasserted and *MRDY is asserted. The Hit and Valid bits of the status register are reset.
Wenn die ICU der Bus-Master ist und eine Lese-Anforderung für eine Neulade-Operation ausgibt, hat das *VSI-Eingangssignal eine spezielle Funktion. Falls es geltend gemacht wird, bevor die Transaktion abgeschlossen ist (das letzte *MRDY ist nicht akzeptiert worden), werden die BSTC-Signale verriegelt, und die Blockstatus-Schreib-Instruktion wird ausgeführt. Der Adressenoperand ist die Adresse, die von der ICU für die Neulade-Operation übermittelt wurde. In diesem Fall ist der Block, der die spezifizierte Wortadresse enthält, stets in dem Cache-Speicher vorhanden (da er neugeladen wird). Die Blockstatus-Bits dieses Blocks werden aus den BSTC-Signalen kopiert. Das Statusregister wird nicht beeinflußt.When the ICU is the bus master and issues a read request for a reload operation, the *VSI input signal has a special function. If it is asserted before the transaction is complete (the last *MRDY has not been accepted), the BSTC signals are latched and the block status write instruction is executed. The address operand is the address passed by the ICU for the reload operation. In this case, the block containing the specified word address is always present in the cache (since it is being reloaded). The block status bits of this block are copied from the BSTC signals. The status register is not affected.
Schreiben Register (WRR) - Die Register-Schreib-Instruktion wird zum Schreiben der speziellen Register der ICU verwendet.Write Register (WRR) - The Write Register instruction is used to write the special registers of the ICU.
Aktualisieren des Speichers und Invalidieren (UPMI) - Falls das von dem Adressenoperanden bestimmte Vier-Wort-Block modifiziert wird, werden die *HIT- und *MRDY-Signale geltend gemacht, und die mit gemeinsamem Blockstatus benutzten und modifizierten Bits werden auf die BSTC-Signale angesteuert. Dann werden sämtliche gültigen Wörter in die entsprechenden Adressen in dem Speicher geschrieben, und anschließend werden die gültigen Bits rückgesetztUpdate Memory and Invalidate (UPMI) - If the four-word block specified by the address operand is modified, the *HIT and *MRDY signals are asserted and the bits used and modified with shared block status are driven to the BSTC signals. Then all valid words are written to the corresponding addresses in memory and then the valid bits are reset
Lesen Blockstatus (RBST) - Die spezifizierte Wortadresse wird auf ihr Vorhandensein in dem Cache-Speicher geprüft. Die Blockstatus-Bits werden auf die BSTC-Signale angesteuert. Die *HIT- und *MRDY-Signale werden ebenfalls entsprechend gesteuert.Read Block Status (RBST) - The specified word address is checked for its presence in the cache memory. The Block status bits are driven on the BSTC signals. The *HIT and *MRDY signals are also driven accordingly.
Lesen Register (RDR) - Die Register-Lese-Instruktion wird zum Lesen der speziellen Register der ICU verwendet.Read Register (RDR) - The Read Register instruction is used to read the special registers of the ICU.
Wort in Cache-Speicher schreiben (WRW) - Falls das von dem Adressenoperanden spezifizierte Wort in dem Cache-Speicher vorhanden ist, wird das *HIT-Signal geltend gemacht, und die zugeführten Daten werden in den Cache-Speicher geschrieben. Die beiden am wenigsten signifikanten Bits der Adresse werden ignoriert. Es ist anzumerken, daß der Adressenzyklus durch das *VSI-Eingangssignal und nicht durch das *MASTB-Signal spezifiziert wird. Die Daten werden durch den Wert auf dem Speicherbus während des auf den Adressenzyklus folgenden Zyklus spezifiziert. Falls das Wort nicht in dem Cache-Speicher vorhanden ist, wird das *HIT-Signal ungültig gemacht, und die Trefferund Gültigkeits-Bits des Statusregisters werden rückgesetzt£ Das *MRDY-Signal wird geltend gemacht, wenn die ICU die Daten aus dem Speicherbus verriegelt.Write Word to Cache (WRW) - If the word specified by the address operand is present in cache, the *HIT signal is asserted and the supplied data is written to cache. The two least significant bits of the address are ignored. Note that the address cycle is specified by the *VSI input signal and not by the *MASTB signal. The data is specified by the value on the memory bus during the cycle following the address cycle. If the word is not present in cache, the *HIT signal is invalidated and the hit and valid bits of the status register are reset. The *MRDY signal is asserted when the ICU latches the data from the memory bus.
Nach dem Abschluß dieser Beschreibung eines zweckmäßigen und praktikablen Instruktionssatzes zur Verwendung mit der bevorzugten Ausführungsform der Erfindung folgt eine kurze Beschreibung der Datenformate und der Datenmanipulationsmechanismen, die von der neuen ICU unterstützt werden.Having concluded this description of a convenient and practical instruction set for use with the preferred embodiment of the invention, there follows a brief description of the data formats and data manipulation mechanisms supported by the new ICU.
Wie bereits erläutert, wird ein Wort durch 32 Datenbite definiert. Ein halbes Wort besteht aus 16 Bits. Ein Byte besteht aus 8 Bits. Die ICU bietet direkte Unterstützung für Wort-, Halbwort- und Byte-Zugriffe. Auf dem Prozessorbus wird die Zugriffslänge entsprechend den OPT-Eingangssignalen definiert. Die Zugriffslänge ist nur für Einfachdaten-Speicher-Zugriffe effektiv. Bei sämtlichen anderen Prozessorbus-Zugriffen (einschließlich der Burst-Betriebsart-Speicher-Zugriffe) wird sie ignoriert und eine Speicherlänge angenommen. Auf dem Speicherbus wird die Zugriffslänge entsprechend den MDLN-Signalen definiert.As previously explained, a word is defined by 32 data bits. A half word consists of 16 bits. A byte consists of 8 bits. The ICU provides direct support for word, half word and byte accesses. On the processor bus, the access length is defined according to the OPT input signals. The access length is only effective for simple data memory accesses. For all other processor bus accesses (including burst mode memory accesses) it is ignored and a memory length is assumed. On the memory bus, the access length is defined according to the MDLN signals.
Die Numerierungs-Konventionen für Dateneinheiten innerhalb eines Wortes bei der bevorzugten Ausführungsform der Erfindung stimmen mit den RISC/SIP-Definitionen überein, die in der einen RISC-Prozessor beschreibenden, hierin eingeschlossenen Anmeldung aufgeführt sind. Bits werden mit ansteigender Reihenfolge von rechts nach links numeriert. Bytes und halbe Wörter können entweder von rechts nach links oder von links nach rechts arrangiert werden, und zwar gemäß der Steuerung durch das Byte-Reihenfolge-Bit des Modb-Registers.The numbering conventions for data units within a word in the preferred embodiment of the invention conform to the RISC/SIP definitions set forth in the application describing a RISC processor, incorporated herein. Bits are numbered in increasing order from right to left. Bytes and half words may be arranged either right to left or left to right, as controlled by the byte order bit of the Modb register.
Die bevorzugte Ausführungsform der ICU enthält die notwendige Hardware zur vollen Unterstützung von Byte-, Halbwort- und Wort-Zugriffen. Die unterschiedlichen Datentypen müssen an ihren natürlichen Adressengrenzen ausgerichtet werden. Zugriffe, die nicht an ihren natürlichen Adressengrenzen erfolgen, werden an den Fehler- und Status-Registern gemeldet; der Zugriff wird jedoch durchgeführt, als ob er korrekt ausgerichtet wäre (d.h. die entsprechenden Adressenbits werden ignoriert).The preferred embodiment of the ICU contains the necessary hardware to fully support byte, half-word and word accesses. The different data types must be aligned on their natural address boundaries. Accesses that do not occur on their natural address boundaries are reported to the error and status registers; however, the access is performed as if it were correctly aligned (i.e., the corresponding address bits are ignored).
Bei Speicher-Byte-Lese-Operationen auf dem Prozessorbus verschiebt die Ausrichtungs-Hardware das Byte auf die niedrigstrangige (ganz rechte) Stelle innerhalb eines Wortes.During memory byte read operations on the processor bus, the alignment hardware moves the byte to the lowest order (rightmost) location within a word.
Bei Speicher-Halbwort-Lese-Operationen auf dem Prozessorbus verschiebt die Ausrichtungs-Hardware das Halbwort auf die niedrigrangige (ganz rechte) Stelle innerhalb eines Wortes.During memory halfword read operations on the processor bus, the alignment hardware moves the halfword to the lowest order (rightmost) location within a word.
Im Fall eines Fehlgängers bei der Speicher-Lese-Operation benutzt die ICU Wort-Zugriffe auf den Speicherbus für die Neulade-Operation. Byte- und Halbwort-Zugriffe werden für nicht cache-speicherbare Lese-Zugriffe verwendet. Das Byte oder das halbe Wort werden ausgerichtet, bevor sie dem Prozessor zugeführt werden. Die Zugriffslänge wird aus dem Prozessorbus (OPT-Eingangssignale) an den Speicherbus (MDLN-Signale) übermittelt.In case of a memory read miss, the ICU uses word accesses to the memory bus for the reload operation. Byte and half-word accesses are used for non-cacheable read accesses. The byte or half-word is aligned before being given to the processor. The access length is transmitted from the processor bus (OPT input signals) to the memory bus (MDLN signals).
Für Speicher-Schreib-Operationen schreibt die ICU Bytes und halbe Wörter in die entsprechenden Cache-Speicher-Stellen. Für einen Byte-Schreibvorgang wird das Byte aus der niedrigrangigen Byte-Stelle zu allen anderen Byte-Stellen innerhalb eines Wortes dupliziert. Das entsprechende Byte-Schreib-Aktivierungssignal wird aktiviert, um das korrekte Byte in den Cache- Speicher zu schreiben. Für einen Halbwort-Schreibvorgang wird das halbe Wort aus dem niedrigrangigen zu dem hochrangigen Halbwort dupliziert. Dann wird es in den Cache-Speicher geschrieben, indem die entsprechenden Halbwörter aktiviert werden.For memory write operations, the ICU writes bytes and half-words to the appropriate cache locations. For a byte write, the byte from the low-order byte location is duplicated to all other byte locations within a word. The appropriate byte write enable signal is activated to write the correct byte to the cache. For a half-word write, the half-word is duplicated from the low-order to the high-order half-word. It is then written to the cache by activating the appropriate half-words.
Für Durch-Schreib- und nicht cache-speicherbare Schreib-Zugriffe wird die Zugriffslänge aus dem Prozessorbus (OPT-Eingangssignale) an den Speicherbus (MDLN-Signale) übermittelt. Die duplizierten Bytes oder Halbwörter werden auf dem Speicherbus plaziert. Die Speichersteuereinrichtung dekodiert die Adresse und die Länge und aktiviert die korrekten Schreib- Freigabe-Signale.For write-through and non-cacheable write accesses, the access length is communicated from the processor bus (OPT input signals) to the memory bus (MDLN signals). The duplicated bytes or halfwords are placed on the memory bus. The memory controller decodes the address and length and asserts the correct write enable signals.
Es ist anzumerken, daß, obwohl die ICU Byte- und Halbwort-Zugriffe unterstützt, der Benutzer entscheiden kann, ob das System diese unterstützt. Falls die Entscheidung darin besteht, daß nur Wort-Zugriffe unterstützt werden, müssen die OPT- und MDLN-Eingangssignale stets Wort-Zugriffe spezifizieren.It should be noted that although the ICU supports byte and half-word accesses, the user can decide whether the system supports them. If the decision is to support only word accesses, the OPT and MDLN inputs must always specify word accesses.
In dem direkt anschließend folgenden Abschnitt der detaillierten Beschreibung wird die ICU-Operation für die unterschiedlichen Fälle von Cache-Speicher-Zugriffen auf den Prozessor- und Speicher-Bussen erläutert.In the directly following section of the detailed description, the ICU operation is explained for the different cases of cache memory accesses on the processor and memory buses.
Bei den Prozessorbus-Zugriffen handelt es sich entweder und Einfach-, Pipeline- oder Burst-Betriebsart-Zugriffe.The processor bus accesses are either single, pipeline or burst mode accesses.
Sämtliche Zugriffe auf den Prozessorbus werden von dem Prozessor initiiert. Die ICU unterstützt die drei Zugriffsprotokolle, wie in den mitanhängigen, zuvor durch Verweis eingeschlossenen Anmeldungen definiert.All accesses to the processor bus are initiated by the processor. The ICU supports the three access protocols as defined in the accompanying applications previously incorporated by reference.
Einfach-Zugriffe werden für Einfacli-Daten-Lese- und Schreib- Zugriffe sowie für spezielle Instruktions-Zugriffe verwendet.Single accesses are used for simple data read and write accesses as well as for special instruction accesses.
Pipeline-Zugriffe werden von der ICU unterstützt. Die ICU verriegelt die Adresse. (*PEN sollte von externer Logik gesteuert werden). Der Prozessor kann den Adressenbus zum Starten eines weiteren ICU-Zugriffs verwenden. Die Adresse eines Pipeline-Zugriffs wird von der ICU für die Tag-Vergleichs- Funktion verwendet, und zwar in Pipeline-Verbindung mit dem vorherigen Zugriff. Im Fall eines Cache-Speicher-Treffers ist ein Zyklus zur Beendigung des Pipeline-Zugriffs erforderlich, nachdem der erste Zugriff beendet worden ist. Im Fall eines Cache-Speicher-Fehlgängers startet der Speicherbus-Zugriff einen Zyklus früher.Pipeline accesses are supported by the ICU. The ICU locks the address. (*PEN should be controlled by external logic). The processor can use the address bus to start another ICU access. The address of a pipeline access is used by the ICU for the tag comparison function, pipelined with the previous access. In the case of a cache hit, a cycle is required to complete the pipeline access after the first access has completed. In the case of a cache miss, the memory bus access starts one cycle earlier.
Burst-Betriebsart-Zugriffe werden für Instruktions-Zugriffe und Mehrfach-Daten-Zugriffe verwendet. Bei diesen Zugriffen wird die Adresse für das erste Wort übertragen, und dann werden für die folgenden Wörter sequentielle Adressen angenommen. Burst-Betriebsart-Lese- und Schreib-Zugriffe werden von der ICU voll unterstützt. Die maximale Rate von einem Wort pro Zyklus wird bei Cache-Speicher-Treffern erzielt.Burst mode accesses are used for instruction accesses and multiple data accesses. In these accesses, the address for the first word is transferred, and then sequential addresses are assumed for the following words. Burst mode read and write accesses are fully supported by the ICU. The maximum rate of one word per cycle is achieved with cache hits.
Ein Einfach-Speicher-Lese-Zugriff wird zum Lesen von Datenvariablen aus einem Daten-Cache-Speicher verwendet. (Der hierin eingeschlossene RISC-Prozessor führt sämtliche Instruktions-Lese-Protokolle mittels des Burst-Betriebsart -Lese-Protokolls aus.) Die Adresse wird zum Suchen des Cache-Speichers für das verlangte Wort verwendet. Falls das Wort gefunden wird (Treffer), werden die Daten dem Prozessor zugeführt und das *CRDY-Ausgangssignal geltend gemacht. Die Ausrichtung wird für Byte- und Halbwort-Zugriffe durchgeführt. Für Einfach-Speicher-Lese-Zugriffe reagiert die ICU in zwei Zyklen.A single-memory read access is used to read data variables from a data cache. (The RISC processor included here executes all instruction read protocols using the burst mode read protocol.) The address is used to find the cache memory for the requested word. If the word is found (hit), the data is fed to the processor and the *CRDY output signal is asserted. Alignment is performed for byte and half-word accesses. For simple memory read accesses, the ICU responds in two cycles.
Falls das verlangte Wort in dem Cache-Speicher nicht gefunden wird (Fehlgänger), initiiert die ICU einen bestimmten Fehlgängerhandhabungsvorgang. Das Gemeinsambenutzungs-Blockstatus -Bit wird bei jedem Fehlgänger aktualisiert. Ferner wird das dem Satz zugeordnete LRU-Bit bei jedem Zugriff aktualisiert, damit es den am weitesten zurückliegend verwendeten Block reflektiert.If the requested word is not found in the cache (miss), the ICU initiates a specific miss handling procedure. The shared block status bit is updated on each miss. Furthermore, the LRU bit associated with the set is updated on each access to reflect the most recently used block.
Ein Burst-Betriebsart-Speicher-Lese-Zugriff wird von der ICU als Serie sequentieller Speicher-Lese-Zugriffe behandelt. In dem ersten Zyklus eines Burst-Betriebsart-Lese-Zugriffs wird die Adresse für das erste Wort von dem Prozessor übermittelt. Wenn die ICU einen Burst-Betriebsart-Lese-Zugriff detektiert, verriegelt sie die Adresse und macht das *CBACK-Signal gültig. Die Adresse wird verglichen und für jedes Wort in dem Burst automatisch inkrementiert. Im Fall eines Cache-Speicher-Treffers reagiert die ICU mit dem ersten Wort in zwei Zyklen. Eine Adresse kann mit einer maximalen Rate von einem Mal pro Zyklus inkrementiert und verglichen werden. Dadurch wird es möglich, im Fall von Cache-Speicher-Treffern eine Rate von einem Zyklus pro Wort zu erzielen. Es ist anzumerken, daß ein Ein-Zyklus- Zugriff auch im Fall einer Blockgrenzenüberschreitung beibehalten wird.A burst mode memory read access is treated by the ICU as a series of sequential memory read accesses. In the first cycle of a burst mode read access, the address for the first word is transmitted from the processor. When the ICU detects a burst mode read access, it latches the address and asserts the *CBACK signal. The address is compared and automatically incremented for each word in the burst. In the case of a cache hit, the ICU responds with the first word in two cycles. An address can be incremented and compared at a maximum rate of once per cycle. This makes it possible to achieve a rate of one cycle per word in the case of cache hits. Note that a one-cycle access is maintained even in the case of a block boundary violation.
Falls ein Fehlgänger an irgendeinem Punkt während des Burst- Betriebsart-Zugriffs erkannt wird, wird ein bestimmter Burstfehlgängerhandhabungsvorgang initiiert.If a miss is detected at any point during the burst mode access, a specific burst miss handling procedure is initiated.
Während des Speicherbus-Burst-Betriebsart-Zugriffs wird die nächste Wortadresse (aktuelles Wort plus 1) in dem Cache-Speicher geprüft. Falls während der Speicherbus-Burst-Betriebsarts-Operation ein Treffer erkannt wird, wird der Speicherbus- Zugriff beendet, und der Datentransfer wird aus dem Cache- Speicher fortgesetzt. Die Miss- und Hit-Fälle und die Transfers von einem zu dem anderen sind dem Prozessor transparent (nur die Zugriffszeit wird beeinträchtigt).During the memory bus burst mode access, the next word address (current word plus 1) in the cache memory checked. If a hit is detected during the memory bus burst mode operation, the memory bus access is terminated and the data transfer is continued from the cache memory. The miss and hit cases and the transfers from one to the other are transparent to the processor (only the access time is affected).
Ein Burst-Betriebsart-Lese-Zugriff kann von dem Prozessor an jedem beliebigen Punkt beendet werden, indem *BREQ deaktiviert wird. Es wird ein weiteres Wort bearbeitet, wie in dem Protokoll für die Burst-Betriebsart des hierin eingeschlossenen RISC-Prozessors definiert ist.A burst mode read access may be terminated by the processor at any point by disabling *BREQ. Another word is processed as defined in the burst mode protocol of the RISC processor included herewith.
Ein Einfach-Speicher-Schreib-Zugriff wird zum Schreiben von Datenvariablen in den Cache-Speicher verwendet. Die Adressen und die Daten werden von der ICU in dem ersten Zyklus des - Zugriffs verriegelt, und das *CRDY-Signal wird während dieses Zyklus geltend gemacht (Einfach-Zyklus-Schreibvorgänge). Es ist anzumerken, daß das *CRDY-Signal unabhängig von den Hitoder Miss-Bedingungen geltend gemacht wird.A single-cycle memory write access is used to write data variables into the cache memory. The addresses and data are latched by the ICU in the first cycle of the access, and the *CRDY signal is asserted during this cycle (single-cycle writes). Note that the *CRDY signal is asserted regardless of the hit or miss conditions.
Im Fall eines Cache-Speicher-Treffers werden die Daten in dem zweiten Zyklus in den Cache-Speicher geschrieben. Die Schreib- Funktion wird bestimmt entsprechend den ASTC-Eingangssignalen, dem Schreib-Funktions-Feld des Moda-Registers, den Schreib- Gemeinsambenutzungs-Treffer-Steuerungs- und Prozessor-Gemeinsambenutzungs-Bit-Steuerungs-Feldern in dem Modb-Registern, und dem Blockstatus-Gemeinsambenutzungs-Bit. Es existieren drei mögliche Schreib-Funktionen: exklusives Durch-Schreiben, exklusives Rückkopieren und Gemeinsambenutzung.In case of a cache hit, the data is written to the cache in the second cycle. The write function is determined according to the ASTC inputs, the write function field of the Moda register, the write share hit control and processor share bit control fields in the Modb registers, and the block status share bit. There are three possible write functions: exclusive write-through, exclusive copy-back, and sharing.
Für einen Exklusiv-Durch-Schreib-Schreib-Zugriff werden die Daten auch in den Speicher geschrieben. Falls der Schreib-Puffer aktiviert ist, werden die Daten in den Schreib-Puffer geschrieben. Wenn er deaktiviert ist, wird die Schreib-Operation nicht gepuffert, wie im folgenden im Zusammenhang mit der Beschreibung der Schreib-Puffers erläutert wird. In beiden Fällen wird der Speicherbus-Zugriff gestartet, wenn keine anderen Speicherbus-Operationen existieren, die früher ausgeführt werden müssen, und wenn der Speicherbus verfügbar ist.For an exclusive write-through access, the data is also written to memory. If the write buffer is enabled, the data is written to the write buffer. If it is disabled, the write operation is not buffered, as described below in connection with the description of the write buffer. In both cases, the memory bus access is started when there are no other memory bus operations that must be executed earlier and when the memory bus is available.
Für einen Exklusiv-Rückkopier-Schreib-Zugriff werden die Daten nur in den Cache-Speicher geschrieben, und das modifizierte Bit wird gesetzt. Die Daten werden in den Speicher geschrieben, wenn der Block ersetzt wird.For an exclusive copyback write access, the data is written only to the cache memory and the modified bit is set. The data is written to memory when the block is replaced.
Im Fall eines Gemeinsambenutzungs-Schreib-Zugriffs wird stets ein Durch-Schreib- oder Schreib-Broadcast-Zugriff auf dem Speicherbus ausgeführt. In diesem Fall steuert das Schreib- Gemeinsambenutzungs-Treffer-Steuer-Feld des Modb-Registers und nicht das Schreib-Funktions-Feld die ICU-Operation.In the case of a shared write access, a write-through or write broadcast access is always performed on the memory bus. In this case, the write shared hit control field of the Modb register, and not the write function field, controls the ICU operation.
Im Fall eines Cache-Speicher-Fehlgängers wird die ICU-Operation entsprechend dem Schreib-Zuordnungs-Bit des Moda-Registers bestimmt. Falls die Schreib-Zuordnung aktiviert ist, wird ein Cache-Speicher-Block für den verfehlten Block zugeteilt, und ein Fehlgänger-Ablauf wird initiiert. Der Fehlgänger-Ablauf gleicht dem Speicher-Lese-Fehlgänger-Ablauf. Nachdem der Fehlgänger-Ablauf abgeschlossen ist, wird die Cache- Speicher-Operation fortgesetzt, wie zuvor für den Fall des Schreib-Treffers beschrieben wurde.In the case of a cache miss, the ICU operation is determined according to the write allocation bit of the Moda register. If write allocation is enabled, a cache block is allocated for the missed block and a miss procedure is initiated. The miss procedure is similar to the memory read miss procedure. After the miss procedure is completed, the cache operation continues as previously described for the write hit case.
Falls die Schreib-Zuordnung deaktiviert ist, wird kein Block in dem Cache-Speicher zugeteilt. Die Daten werden nur in den Speicher geschrieben, wie für die Durch-Schreib-Operation erläutert. Es ist anzumerken, daß für diesen Fall ein Rückkopier-Schreibvorgang als Durch-Schreib-Zugriff behandelt wird.If write mapping is disabled, no block is allocated in the cache. The data is just written to memory as explained for the write-through operation. Note that in this case, a copy-back write is treated as a write-through access.
Das Gemeinsambenutzungs-Blockstatus-Bit wird bei jedem Fehlgänger aktualisiert. Es kann auch bei einem Cache-Speicher- Treffer aktualisiert werden, falls das entsprechende Bit des Modb-Registers gesetzt ist.The shared block status bit is updated on every miss. It can also be updated on a cache hit if the corresponding bit of the modb register is set.
Das dem Satz zugeordnete LRU-Bit wird bei jedem Zugriff derart aktualisiert, daß es den am weitesten zurückliegend verwendeten Block reflektiert.The LRU bit associated with the set is updated on each access so that it reflects the most recently used block.
Ein Burst-Betriebsart-Speicher-Schreib-Zugriff wird von der ICU als Serie sequentieller Speicher-Schreib-Zugriffe behandelt. In dem ersten Zyklus eines Burst-Betriebsart-Schreib- Zugriffs werden die Adresse und die Daten für das erste Wort von dem Prozessor übermittelt. Wenn ein Burst-Betriebsart- Schreib-Zugriff von der ICU detektiert wird, verriegelt sie die Adresse und die Daten und macht die *CRDY- und die *CBACK- Signale geltend. Die Adresse wird verglichen und für jedes Wort in dem Burst automatisch inkrementiert.A burst mode memory write access is treated by the ICU as a series of sequential memory write accesses. In the first cycle of a burst mode write access, the address and data for the first word are transmitted by the processor. When a burst mode write access is detected by the ICU, it latches the address and data and asserts the *CRDY and *CBACK signals. The address is compared and automatically incremented for each word in the burst.
Im Fall eines Cache-Speicher-Treffers schreibt die ICU während des zweiten Zyklus das erste Wort in den Cache-Speicher. Eine Adresse kann mit einer maximalen Rate von einem Mal pro Zyklus inkrementiert und verglichen werden. Dadurch wird es möglich, im Fall von Cache-Speicher-Treffern eine Rate von einem Zyklus pro Wort zu erzielen. Es ist anzumerken, daß ein Ein-Zyklus- Zugriff auch im Fall einer Blockgrenzenüberschreitung beibehalten wird. Es kann auch eine Speicherbus-Schreib-Operation unter den gleichen Bedingungen wie für Einfach-Speicher- Schreibvorgänge gestartet werden. Falls der Schreib-Puffer aktiviert ist, wird er zum Puffern von bis zu vier Schreibvorgängen verwendet. Der Speicherbus-Zugriff ist ein Burst-Betriebsart-Schreibvorgang. Die Bedingungen für die Speicherbus- Operation werden für jedes Wort in dem Burst überprüft, und die Speicherbus-Operation wird entsprechend beeinflußt.In the case of a cache hit, the ICU writes the first word into the cache during the second cycle. An address can be incremented and compared at a maximum rate of once per cycle. This makes it possible to achieve a rate of one cycle per word in the case of cache hits. Note that a one-cycle access is maintained even in the case of a block boundary violation. A memory bus write operation can also be started under the same conditions as for single-memory writes. If the write buffer is enabled, it is used to buffer up to four writes. The memory bus access is a burst mode write. The conditions for the memory bus operation are checked for each word in the burst and the memory bus operation is affected accordingly.
Falls ein Fehlgänger an irgendeinem Punkt während des Burst- Betriebsart-Zugriffs erkannt wird, wird die ICU-Operation entsprechend dem Schreib-Zuordnungs-Bit des Moda-Registers bestimmt. Falls die Schreib-Zuordnung aktiviert ist, wird ein Cache-Speicher-Block für den verfehlten Block zugeteilt, und es wird ein Fehlgängerhandhabungsvorgang initiiert. Der Speicherbus-Zugriff besteht entweder aus Lesen oder Lesen zum Modifizieren, und zwar in Abhängigkeit davon, ob das Schreib- Fehlgänger-Speicher-Zugriffs-Steuer-Bit des Modb-Registers HIGH bzw. LOW ist. Nachdem der Fehlgängerhandhabungsvorgang abgeschlossen ist, wird die Cache-Speicher-Operation in der für den Treffer-Fall beschriebenen Weise fortgesetzt. Es ist anzumerken, daß in diesem Fall jeder verfehlte Unter-Block zuerst in den Cache-Speicher gelesen und dann geschrieben wird. Die Speicherbus-Operation ist kein kontinuierliches Burst.If a miss is detected at any point during the burst mode access, the ICU operation is determined according to the write allocation bit of the Moda register. If write allocation is enabled, a cache block is allocated for the missed block and a miss handling procedure is initiated. The memory bus access consists of either read or read to modify, depending on whether the write miss memory access control bit of the Modb register is HIGH or LOW, respectively. After the miss handling procedure is completed, the cache operation continues in the manner described for the hit case. Note that in this case, each missed sub-block is first read into the cache and then written. The memory bus operation is not a continuous burst.
Falls die Schreib-Zuordnung deaktiviert ist, wird kein Block in dem Cache-Speicher zugewiesen. Die Daten werden mittels einer Burst-Betriebsart-Schreib-Operation nur in den Speicher geschrieben. Die Bedingungen für die Speicherbus-Operation werden für jedes Wort in dem Burst überprüft, und die Speicherbus-Operation wird entsprechend beeinflußt.If write mapping is disabled, no block is allocated in the cache. The data is written to memory only using a burst mode write operation. The conditions for the memory bus operation are checked for each word in the burst and the memory bus operation is affected accordingly.
Die nächste Wortadresse (aktuelle Wortadresse plus 1) wird in dem Cache-Speicher für jeden Wort-Schreibvorgang überprüft. Falls nach einem oder mehreren Fehlgängern ein Treffer gefunden wird, setzt die ICU ihren Betrieb in der für den Fall des Treffers beschriebenen Weise fort. Die Miss- und Hit-Fälle und die Transfers von einem zum anderen sind dem Prozessor transparent (nur die Zugriffszeit wird beeinflußt)The next word address (current word address plus 1) is checked in the cache for each word write. If a hit is found after one or more misses, the ICU continues its operation in the manner described for the hit case. The miss and hit cases and the transfers from one to the other are transparent to the processor (only the access time is affected)
Ein Burst-Betriebsart-Schreib-Zugriff kann von dem Prozessor an jedem beliebigen Punkt beendet werden, indem *BREQ deaktiviert wird. Die ICU bearbeitet den letzten Wort-Schreibvorgang und beendet den Speicherbus-Burst-Betriebsart-Zugriff, falls erforderlich.A burst mode write access can be terminated by the processor at any point by disabling *BREQ. The ICU processes the last word write and terminates the memory bus burst mode access if necessary.
Im folgenden wird eine Vielzahl anderer Zugriffsvorgänge beschrieben, die von der bevorzugten Ausführungsform der Erfindung unterstützt werden.A variety of other access operations supported by the preferred embodiment of the invention are described below.
Ein nicht cache-speicherbarer Speicher-Zugriff wird unterstützt. Er dient zum Umgehen des Cache-Speichers für spezielle variable Zugriffe. Bei diesem Zugriff wird der Cache-Speicher nicht nach den verlangten Daten abgesucht. Ein Speicher-Zugriff wird gestartet, um die Daten in dem Speicher zu lesen oder in diesen zu schreiben. In dem Cache-Speicher wird kein Block für diese Daten zugewiesen.A non-cacheable memory access is supported. It is used to bypass the cache memory for special variable accesses. During this access, the cache memory is not searched for the requested data. A memory access is started to read the data in the memory or write it to it. No block is allocated in the cache memory for this data.
Instruktions-ROM-Zugriffe können wahlweise unterstützt werden. Diese Zugriffe werden von einem Instruktions-Cache-Speicher als regulärer Speicher-Lese-Zugriff betrieben. Im Fall eines Fehlgängers wird der Speicherbus-Zugriff als ROM-Zugriff bezeichnet. Die ICU kann derart programmiert werden, daß sie ROM- Zugriffe ignoriert.Instruction ROM accesses can optionally be supported. These accesses are operated by an instruction cache as a regular memory read access. In the case of a miss, the memory bus access is referred to as a ROM access. The ICU can be programmed to ignore ROM accesses.
Eingangs-/Ausgangs-Zugriffe können von einem Daten-Cache-Speicher optional als nicht cache-speicherbare Zugriffe unterstützt und behandelt werden. Die ICU überträgt den Zugriff auf den Speicherbus mit I/O-Angabe. Die ICU kann derart programmiert werden, daß sie Eingangs-/Ausgangs-Zugriffe ignoriert.Input/output accesses can optionally be supported and treated as non-cacheable accesses by a data cache. The ICU transfers the access to the memory bus with I/O information. The ICU can be programmed to ignore input/output accesses.
Kcprozessor-Transfers werden von dem Daten-Cache-Speicher ignoriert.Kcprocessor transfers are ignored by the data cache.
Ferner wird ein Speicher-Zugriff unterstützt, der als Verriegelungs-Zugriff spezifiziert sein kann. Dies erfolgt durch Setzen des *LOCK-Eingangssignals. Ein Verriegelungs-Zugriff kann verwendet werden, um auf Semaphoren und andere synchronisierte gemeinsam benutzten Variablen zuzugreifen. Verriegelungs-Zugriffe werden von dem Modb-Register gesteuert.Furthermore, a memory access is supported, which can be specified as a lock access. This is done by setting the *LOCK input signal. A lock access can be used to access semaphores and other synchronized shared variables. Lock accesses are controlled by the Modb register.
Es wird ein Instruktions-Speicher-Zugriff als Daten unterstützt. Dies ist ein spezieller Daten-Zugriff, der zum Lesen und Schreiben des Inhaltes eines Instruktions-Speichers verwendet wird. Er wird durch einen speziellen Code an den OPT- Eingangssignalen angezeigt.Instruction memory access as data is supported. This is a special data access used to read and write the contents of an instruction memory. It is indicated by a special code on the OPT input signals.
Ferner wird ein Fehlerbeseitigungs-Modul-Zugriff unterstützt. Dies ist ein spezieller Daten-Zugriff, der zum Zugreifen auf das RISC/SIP-Fehlerbeseitigungs-Modul verwendet wird. Er wird durch einen speziellen Code an den OPT-Eingängen angezeigt. Die ICU steuert das *CRDY-Signal für diesen Zugriff. *CRDY wird für vier Zyklen in den HIGH-Zustand gesteuert und dann fur einen Zyklus geltend gemacht. Dies erfolgt, um die Einführung des Fehlerbeseitigungs-Moduls in das Cache-Speicher- System zu ermöglichen, ohne die *RDY-Logik des Prozessors zu beeinflussen.A debug module access is also supported. This is a special data access used to access the RISC/SIP debug module. It is indicated by a special code on the OPT inputs. The ICU drives the *CRDY signal for this access. *CRDY is driven HIGH for four cycles and then asserted for one cycle. This is done to allow the introduction of the debug module into the cache memory system without affecting the *RDY logic of the processor.
Zusätzlich zu den oben genannten Eigenschaften wird ein Cache- Speicher-Instruktions-Zugriff unterstützt. Dieser Zugriff wird benutzt, um Prozesssorbus-Cache-Speicher-Instruktionen zu der ICU zu übermitteln.In addition to the above features, a cache instruction access is supported. This access is used to communicate process bus cache instructions to the ICU.
In Hinblick auf Speicherbus-Zugriffe ist zu betonen, daß der Speicherbus sowohl für den Master-Cache-Speicher und für die Slave-Cache-Speicher der ICU verwendet wird. Auf den Speicher wird durch einen ICU-Bus-Master zugegriffen, indem ein Speicherbus-Zugriff ausgegeben wird. Die ICU erhält die Bus-Master-Eigenschaft durch Geltendmachen des *MBUSR (Bus-Anforderungs) -Ausgangssignals und Warten auf *MBGRT (Bus-Gewährung). Ein ICU-Bus-Slave kann die Speicherbus-Zugriffe für Cache- Speicher-Konsistenz-Zwecke überwachen. Cache-Speicher-Instruktionen können durch spezielle Zugriffe auf den Speicherbus aktiviert werden.With regard to memory bus accesses, it is important to emphasize that the memory bus is used for both the ICU's master cache and slave caches. Memory is accessed by an ICU bus master by issuing a memory bus access. The ICU acquires bus master status by asserting the *MBUSR (bus request) output and waiting for *MBGRT (bus grant). An ICU bus slave can monitor memory bus accesses for cache consistency purposes. Cache instructions can be activated by special accesses to the memory bus.
Im folgenden werden Lese-Zugriffe, Schreib-Zugriffe und Lesen für Modifikations-Zugriffe, die mit Unterstützung durch die ICU erfolgen, erläutert.The following explains read accesses, write accesses and read for modification accesses that are carried out with the support of the ICU.
Ein Speicherbus-Lese-Zugriff wird durch einen Cache-Speicher- Master für eine Neulade-Operation und für nicht cache-speicherbare Zugriffe initiiert. Sämtliche Neulade-Operationen benutzen die Zugriffslänge von Wörtern. Für nicht cache-speicherbare Zugriffe werden der Zugriffs-Typ und die angemessene Länge aus dem Prozessorbus an die MDLN-, MREQT- und *MLOCK- Speicherbus-Signale übermittelt. Für die Neulade-Operation wird ein Burst-Betriebsart-Zugriff verwendet, falls mehr als ein Wort verlangt ist. In sämtlichen anderen Fällen wird eine Einfach-Zugriff verwendet.A memory bus read access is initiated by a cache master for a reload operation and for non-cacheable accesses. All reload operations use the access length of words. For non-cacheable For accesses, the access type and appropriate length are conveyed from the processor bus to the MDLN, MREQT, and *MLOCK memory bus signals. For the reload operation, a burst mode access is used if more than one word is required. In all other cases, a single access is used.
Die Neulade-Operation hängt von der Original-Prozessorbus- Operation ab. Sie unterscheidet sich bei Einfach-Zugriffen und Burst-Betriebsart-Zugriffen£The reload operation depends on the original processor bus operation. It differs for single accesses and burst mode accesses£
Für den Fall eines Cache-Speicher-Fehlgängers bei einer Prozessorbus-Einfach-Speicher-Lese-Operation werden die Startund End-Adressen sowie Adressen-Umlauf oder -Nicht-Umlauf von den Einfach-Fehlgänger-Steuerungs (SMC) - und Unter-Block-Bemessungs (SBS) -Feldern des Moda-Registers gesteuert.In the event of a cache miss during a processor bus single-memory read operation, the start and end addresses and address wraparound or non-wraparound are controlled by the single-miss control (SMC) and sub-block sizing (SBS) fields of the Moda register.
Für den Fall eines Cache-Speicher-Fehlgängers bei einem -Prozessorbus-Burst-Betriebsart-Lese-Zugriff wird für die Neulade- Operation ein Burst-Betriebsart-Zugriff auf den Speicherbus gestartet. Die Neulade-Start-Adresse ist stets diejenige des vermißten Wortes. Die Burst-End-Adresse wird von dem Moda- Register gesteuert.In the event of a cache miss during a processor bus burst mode read access, a burst mode access to the memory bus is started for the reload operation. The reload start address is always that of the missed word. The burst end address is controlled by the Moda register.
Wenn die ICU der Bus-Master-Speicher ist und eine Lese-Anforderung für eine Neulade-Operation ausgibt, hat das * VSI-Eingangssignal eine spezielle Funktion. Falls es geltend gemacht wird, bevor die Transaktion abgeschlossen ist (das letzte *MRDY ist nicht akzeptiert worden), dann werden die BSTC-Signale verriegelt, und eine spezielle Blockstatus-Schreib-instruktion wird ausgeführt.When the ICU is the bus master memory and issues a read request for a reload operation, the * VSI input signal has a special function. If it is asserted before the transaction is complete (the last *MRDY has not been accepted), then the BSTC signals are latched and a special block state write instruction is executed.
Im folgenden wird die Arbeitsweise eines Slave-Cache-Speichers für Speicherbus-Lese-Zugriffe im Zusammenhang mit der ICU- Mehrprozessor-Unterstützung beschrieben.The following describes the operation of a slave cache memory for memory bus read accesses in connection with the ICU multiprocessor support.
Zunächst werden die Schreib-Zugriffe erläutert. Eine Initiierung einer Schreib-Operation erfolgt durch den Cache-Master- Speicher für Durch-Schreib- und nicht cache-speicherbare Zugriffe, Modifizierungs-Block-Rückkopier-an-Speicher- und Gemeinsambenutzungs-Block-Schreib-Treffer-Operationen. Ein Burst-Betriebsart-Zugriff wird für die Modifizierungs-Block- Rückkopier-Operation und für Burst-Betriebsart-Schreib-Zugriffe auf den Prozessorbus initiiert. In sämtlichen anderen Fällen wird ein Einfach-Zugriff initiiert. Für Einfach-Zugriffe werden Zugriffs-Typ und -Länge aus dem Prozessorbus an die MDLN-, MREQT- und *MLOCK-Speicherbu-Signale übermittelt.First, write accesses are explained. A write operation is initiated by the cache master memory for write-through and non-cacheable accesses, modify block copy-back to memory and shared block write hit operations. A burst mode access is initiated for the modify block copy-back operation and for burst mode write accesses to the processor bus. In all other cases, a single access is initiated. For single accesses, access type and length are communicated from the processor bus to the MDLN, MREQT and *MLOCK memory bus signals.
Ein Burst-Betriebsart-Schreib-Zugriff auf den Speicherbus beginnt an der verlangten Anfangs-Wort-Adresse und stoppt an dem letzten Wort, das in den Speicher geschrieben werden soll. Er wird nicht von den Moda-Optionen wie im Fall der Burst-Betriebsart-Lese-Zugriffe beeinflußt.A burst mode write access to the memory bus starts at the requested starting word address and stops at the last word to be written to memory. It is not affected by the Moda options as in the case of burst mode read accesses.
Im Fall eines Treffers auf einen gemeinsam benutzten Block wird eine Durch-Schreib-Operation unter Steuerung des Modb- Registers initiiert, und zwar in Abhängigkeit von dem Wert des Schreib-Gemeinsambenutzungs-Treffer-Steuer-Feld des Registers.In case of a hit on a shared block, a write-through operation is initiated under control of the Modb register, depending on the value of the write-sharing-hit-control field of the register.
Im folgenden wird die Arbeitsweise eines Siaves für Speicherbus-Schreib-Zugriffe im Zusammenhang mit der ICU-Mehrprozessor-Unterstützung beschrieben.The following describes the operation of a Siave for memory bus write accesses in connection with the ICU multiprocessor support.
Ein Lesevorgang zum Modifizieren ist eine spezielle Lese-Operation. Er wird von der ICU im Fall eines Fehlgängers bei einer Rückkopier-Schreib-Operation unter Steuerung des Modb- Registers verwendet. Der Master-Cache-Speicher zeigt an, daß der Block modifiziert werden wird, nachdem das Lesen beendet ist. In jeder anderen Hinsicht ist die Master-Operation dem Lese-Zugriff gleichartig.A read to modify is a special read operation. It is used by the ICU in the event of a miss in a copyback write operation under the control of the Modb register. The master cache indicates that the block will be modified after the read is completed. In all other respects, the master operation is similar to the read access.
Wenn die ICU der Bus-Master ist und eine Lesen-zum-Modifizieren-Anforderung für die Neulade-Operation ausgibt, hat das *VSI-Eingangssignal eine spezielle Funktion. Falls es geltend gemacht wird, bevor die Transaktion abgeschlossen ist (das letzte *MRDY ist nicht akzeptiert worden), dann werden die BSTC-Signale verriegelt, und eine spezielle Blockstatus- Schreib-Instruktion wird ausgeführt.When the ICU is the bus master and issues a read-to-modify request for the reload operation, the *VSI input signal has a special function. If it is asserted before the transaction is complete (the last *MRDY has not been accepted), then the BSTC signals are latched and a special block state write instruction is executed.
Im folgenden wird die Arbeitsweise eines Slave-Cache-Speichers für Modifizierungs-Zugriffe im Zusammenhang mit der ICU-Mehrprozessor-Unterstützung beschrieben.The following describes the operation of a slave cache memory for modification accesses in connection with the ICU multiprocessor support.
Es werden zwei weitere Operationen von der bevorzugten Ausführungsform der ICU unterstützt, und zwar eine Schreib-Broadcast-Operation und ein Speicherbus-Cache-Instruktions-Zugriff.Two additional operations are supported by the preferred embodiment of the ICU, namely a write broadcast operation and a memory bus cache instruction access.
Eine Schreib-Broadcast-Operation wird von der ICU nur im Fall eines Schreib-Treffers auf einem gemeinsam benutzten Block initiiert, und zwar unter Steuerung durch das Modb-Register. Der Unterschied zwischen einem Schreib-Broadcast und einem regulären Schreibvorgang besteht darin, daß bei einem Schreib- Broadcast der Speicher nicht aktualisiert wird. In jeder anderen Hinsicht ist die Operation dem Schreib-Zugriff gleichartig.A write broadcast operation is initiated by the ICU only in the event of a write hit on a shared block, under the control of the modb register. The difference between a write broadcast and a regular write is that a write broadcast does not update memory. In all other respects, the operation is similar to a write access.
Ein Speicherbus-Cache-Speicher-Instruktions-Zugriff kann von dem Speicherbus durch externe Logik geltend gemacht werden. Wenn die ICU nicht der Bus-Master ist, verursacht die Geltendmachung von *VSI eine Cache-Speicher-Instruktions-Transaktion auf dem Speicherbus. Während des ersten Zyklus der Transaktion werden die MWR-, MREQT- und BSTC-Signale und die Adresse verriegel. Die MWR- und MREQT-Signale spezifizieren die Instruktion. Die BSTC-Signale spezifizieren den Blockstatus für die relevanten Instruktionen. Die Adresse wird als Adressenoperand für die relevante Instruktion verwendet. Falls die Instruktion einen Datenoperanden erfordert, werden die Daten während des zweiten Zyklus verriegelt.A memory bus cache instruction access can be asserted from the memory bus by external logic. If the ICU is not the bus master, the assertion of *VSI causes a cache instruction transaction on the memory bus. During the first cycle of the transaction, the MWR, MREQT, and BSTC signals and the address are latched. The MWR and MREQT signals specify the instruction. The BSTC signals specify the block status for the relevant instructions. The address is used as the address operand for the relevant instruction. If the instruction requires a data operand, the data is locked during the second cycle.
Die bevorzugte Ausführungsform der ICU folgt den nachstehend aufgeführten Prioritätsregeln hinsichtlich der verschiedenen Cache-Speicher-Zugriffe:The preferred embodiment of the ICU follows the following priority rules regarding the various cache memory accesses:
1. Sämtliche Zugriffe werden auf der Basis des Prinzips "Zuerst gekommen, zuerst bedient" gehandhabt.1. All access is handled on a first come, first served basis.
2. Ein zweiter Zugriff kann in Pipeline-Weise gestartet werden, während der erste Zugriff abgeschlossen wird. Die Tagund die Speicher-Arrays können in jedem Zyklus einen unterschiedlichen Zugriff handhaben.2. A second access can be started in a pipelined manner while the first access is completing. The tag and the memory arrays can handle a different access in each cycle.
3. Falls zwei Zugriffe, von denen einer auf den Prozessorbus und einer auf den Speicherbus erfolgt, zur gleichen Zeit einen Tag-Array-Zugriff verlangen, hat der Prozessorbus nur dann die Priorität, falls er ein primärer (nicht gepipelineter oder mit fortlaufendem Burst erfolgender) Speicher-Zugriff ist. Der Speicherbus-Zugriff hat die Prioritat in allen anderen Fällen.3. If two accesses, one to the processor bus and one to the memory bus, require a tag array access at the same time, the processor bus has priority only if it is a primary (non-pipelined or continuous burst) memory access. The memory bus access has priority in all other cases.
4. Die Reaktionen auf die Prozessorbus-Zugriffe erfolgen stets in der Reihenfolge des Empfangs. Falls in dem Cache-Speicher hinsichtlich eines gepipelineten oder mit fortlaufendem Burst erfolgenden Zugriffs ein Treffer erfolgt, wird die Reaktion verzögert, bis der Primär-Zugriff abgeschlossen ist. Es ist anzumerken, daß der gepipelinete oder mit fortlaufendem Burst erfolgende Zugriff abgeschlossen werden kann, nachdem die Antwort auf den Primär-Zugriff ausgegeben worden ist, jedoch bevor sie voll abgeschlossen ist. Dies geschieht bei Primär- Schreib-Zugriffen, bevor der Schreib-Vorgang auf dem Speicherbus ausgeführt worden ist, bei Neulade-Operationen, nachdem die erforderlichen Daten an den Prozessor ausgegeben worden sind, und bei der Ausführung einiger der speziellen Instruktionen.4. Responses to processor bus accesses are always in the order they are received. If a hit occurs in the cache for a pipelined or continuous burst access, the response is delayed until the primary access is completed. Note that the pipelined or continuous burst access may complete after the response to the primary access has been issued, but before it is fully completed. This occurs for primary write accesses, before the write has been executed on the memory bus, for reload operations, after the required data has been issued to the processor. and in executing some of the special instructions.
Dem Fachmann auf dem Gebiet wird ersichtlich sein, daß die Spezialregister der ICU programmierbare Optionswahl und Status-Meldung aufnehmen können. Die Cache-Speicher-Funktionen können durch Verwendung programmierbarer Optionen gewählt werden. Die Cache-Speicher-Funktionen können unter Verwendung programmierbarer Optionen gewählt werden. Die Cache-Speicher- Schreib-Funktion kann als Durch-Schreiben, Rückkopieren oder flexibel auf einer Pro-Zugriff-Basis gewählt werden. Es kann eine Schreib-Zuordnungs- oder eine Nicht-Schreib- Zuordnungs- Option gewählt werden. Der Ersetzungs-Algorithmus kann als LRU-, direkte oder externe Einrichtung programmiert werden. Es kann eine flexible Vorabruf-Funktion gewählt werden. Die Durch-Lese-Option kann aktiviert werden. Ein Vier-Wort-Lesepuffer ist vorgesehen, um effiziente Vorabruf- und Lese-Operationen zu unterstützen.Those skilled in the art will appreciate that the ICU's special purpose registers can accommodate programmable option selection and status reporting. The cache functions can be selected using programmable options. The cache write function can be selected as write-through, copy-back, or flexibly on a per-access basis. A write-mapping or non-write-mapping option can be selected. The replacement algorithm can be programmed as LRU, direct, or external device. A flexible prefetch function can be selected. The read-through option can be enabled. A four-word read buffer is provided to support efficient prefetch and read operations.
Wie bereits erläutert, sind die Options-Bits zur Options-Wahl definiert und in dem Moda-Register gespeichert.As already explained, the option bits for option selection are defined and stored in the Moda register.
Wie zuvor angeführt, wird durch Vergleich mit der Vorlade- Operation eine Vorabruf-Operation definiert als das Abrufen von Variablen oder einer Instruktion, bevor diese angefordert wird. Die ICU enthält die Hardware zum Unterstützen mehrerer programmierbarer Vorabruf-Optionen. Sie enthält ferner einen Speicher-Lese-Puffer, der als Vorabruf-Puffer verwendet wird. Vorabgerufene Wörter können in dem Vorabruf-Puffer gerettet werden, falls das Cache-Speicher-Array nicht für die Aktualisierung zur Verfügung steht. Jede der folgenden Vorabruf-Optionen kann unabhängig oder in jeder Kombination verwendet werden.As previously stated, by comparison with the prefetch operation, a prefetch operation is defined as the fetching of variables or an instruction before it is requested. The ICU contains the hardware to support several programmable prefetch options. It also contains a memory read buffer that is used as a prefetch buffer. Prefetched words can be saved in the prefetch buffer if the cache array is not available for updating. Any of the following prefetch options can be used independently or in any combination.
Die einfachste Form des Vorabrufens kann durch Verwendung einer Unter-Block-Bemessung, die größer ist als ein Wort, erzielt werden. Die ICU lädt den Unter-Block im Fall eines Fehlgängers neu. Die Wörter in dem gleichen Unter-Block des verlangten Worts werden vorabgerufen.The simplest form of prefetching can be achieved by using a sub-block size larger than one word, The ICU reloads the sub-block in case of a miss. The words in the same sub-block as the requested word are prefetched.
Das Moda-Register steuert den Betrieb der ICU für Einfach- Zugriffs-Fehlgänger.The Moda register controls the operation of the ICU for single-access misses.
Das Moda-Register steuert ferner den Detrieb der ICU für einen Fehlgänger bei einem Burst-Betriebsart-Zugriff. Falls das Burst von dem Prozessor ausgesetzt wird, kann der Cache- Speicher mehr Wörter vorabruf en, bevor das Speicherbus-Burst gestoppt wird, In diesem Fall kann das Vorabrufen bis zum Ende des gleichen Unter-Blocks oder des nächsten Unter-Blocks vorrücken.The Moda register also controls the ICU's operation for a miss on a burst mode access. If the burst is suspended by the processor, the cache can prefetch more words before the memory bus burst is stopped. In this case, the prefetch can advance to the end of the same sub-block or the next sub-block.
Das Moda-Register aktiviert ferner die Vorabruf-Option für Einfach-Zugriff-Cache-Speicher-Treffer und Durst-Zugriff-Cache-Speicher-Treffer.The Moda register also enables the prefetch option for single-access cache hits and thirsty-access cache hits.
Zusätzlich zu dem Vorabrufen wird eine Neulade-Operation unter Steuerung des programmierbaren Moda-Registers definiert.In addition to the prefetch, a reload operation is defined under control of the programmable Moda register.
Die Neulade-Operation hängt von der Original-Prozessorbus- Operation ab. Sie ist bei Einfach-Zugriffen und Burst-Betriebsart-Zugriffen unterschiedlich.The reload operation depends on the original processor bus operation. It is different for single accesses and burst mode accesses.
Für den Fall eines Cache-Speicher-Fehlgängers bei einer Prozessorbus-Einfach-Speicher-Lese-Operation werden die Startund End-Adressen sowie Adressen-Umlauf oder -Nicht-Umlauf von dem Moda-Register gesteuert.In the event of a cache miss during a processor bus single-memory read operation, the start and end addresses as well as address wraparound or non-wraparound are controlled by the Moda register.
Für den Fall eines Cache-Speicher-Fehlgängers bei einem Prozessorbus-Burst-Betriebsart-Lese-Zugriff wird für die Neulade- Operation ein Burst-Betriebsart-Zugriff auf den Speicherbus gestartet. Die Neulade-Start-Adresse ist stets diejenige des vermißten Wortes. Die Burst-End-Adresse wird ebenfalls von dem Moda-Register gesteuert.In the event of a cache miss during a processor bus burst mode read access, a burst mode access to the memory bus is started for the reload operation. The reload start address is always that of the missing word. The burst end address is also controlled by the Moda register.
Vor einer detaillierten Beschreibung der Weise, in der die ICU die Mehrprozessor-Operationen unterstützt, werden die Kriterien für den ICU-Schreib-Puffer und das ICU-Initialisieren und Rücksetzen aufgeführt.Before describing in detail how the ICU supports multiprocessor operations, the criteria for the ICU write buffer and ICU initialization and reset are listed.
Die ICU enthält einen 4 Stellen-Schreib-Puffer. Sie kann bis zu vier Schreib-Adressen (Adressen, Steuerung und Daten) puffern. Der Schreib-Puffer kann deaktiviert werden, indem ein Bit in dem Moda-Register gesetzt wird.The ICU contains a 4 location write buffer. It can buffer up to four write addresses (address, control and data). The write buffer can be disabled by setting a bit in the Moda register.
Im aktivierten Zustand wird der Schreib-Puffer zum Puffern von Schreib-Zugriffen auf den Speicherbus verwendet. Für Durch- Schreib- und Schreib-Broadcast-Zugriffe können vier individuelle Schreib-Zugriffe gepuffert werden. Die Schreibinhalte warten in dem Schreib-Puffer, bis der Bus zur Verfügung steht. Dadurch kann bei einem Durch-Schreib-Cache-Speicher oder beim Vorhandensein zahlreicher Schreib-Broadcast-Operationen eine beträchtliche Leistungsverbesserung erzielt werden.When enabled, the write buffer is used to buffer write accesses to the memory bus. For write-through and write-broadcast accesses, four individual write accesses can be buffered. The write contents wait in the write buffer until the bus is available. This can provide a significant performance improvement when using a write-through cache or when there are numerous write-broadcast operations.
Der Schreib-Puffer wird ferner verwendet, um einen modifizierten Block zu puffern, bevor er in den Speicher geschrieben wird. Im Fall eines Fehlgängers wird, falls ein modifizierter Block als Ersatz gewählt wird, dieser in dem Schreib-Puffer plaziert. Der Lesevorgang für den verfehlten Unter-Block wird vor dem Schreiben gestartet. Dieses Merkmal erlaubt der ICU eine schnellere Reaktion auf die Prozessor-Anforderung.The write buffer is also used to buffer a modified block before it is written to memory. In the event of a miss, if a modified block is chosen as a replacement, it is placed in the write buffer. The read operation for the missed sub-block is started before the write. This feature allows the ICU to respond more quickly to the processor request.
Wenn der Schreib-Puffer voll ist, kann die ICU noch einen weiteren Cache-Speicher-Zugriff bearbeiten, solange der Speicherbus nicht verlangt wird (Lese-Treffer oder Rückkopier- Schreib-Treffer). Falls der Speicherbus für eine weitere Schreib-Operation verlangt wird, wartet der Cache-Speicher, bis für das Schreiben ein verfügbarer Raum in dem Schreib- Puffer vorhanden ist. Sämtliche weiteren Anforderungen werden erst bearbeitet, nachdem der Schreib-Puffer leer ist. Dies ist erforderlich, um eine korrekte Folgesteuerung von Anforderungen zu gewährleisten, d.h. ein Fehlgänger bei einem Speicher- Auslesevorgang wartet, bis sämtliche Schreibvorgänge ausgeführt sind, damit ein aktualisierter Speicher gelesen wird.If the write buffer is full, the ICU can still process another cache access as long as the memory bus is not requested (read hit or copyback write hit). If the memory bus is requested for another write operation, the cache waits until there is available space in the write buffer for the write. buffer is present. All further requests are only processed after the write buffer is empty. This is necessary to ensure correct sequencing of requests, ie a miss in a memory read operation waits until all writes have been completed so that an updated memory is read.
Wenn der Schreib-Puffer deaktiviert ist, werden keine Schreib- Zugriffe gepuffert. Die Schreib-Operation auf dem Speicherbus wird gestartet, sobald der Bus verfügbar ist. Die ICU kann noch einen weiteren Cache-Speicher-Zugriff bearbeiten, solange der Speicherbus nicht verlangt wird (Lese-Treffer oder Rückkopier-Schreib-Treffer). Falls der Speicherbus verlangt wird, wartet der Cache-Speicher, bis die vorherige Schreib-Operation abgeschlossen ist.When the write buffer is disabled, no write accesses are buffered. The write operation on the memory bus is started as soon as the bus is available. The ICU can still process another cache access as long as the memory bus is not requested (read hit or copyback write hit). If the memory bus is requested, the cache waits until the previous write operation is completed.
Was die Initialisierung anbelangt, so muß die ICU initiahsiert werden, wenn zum ersten Mal Strom zugeführt wird. Falls erforderlich, kann sie auch zu einem späteren Zeitpunkt initialisiert werden.As for initialization, the ICU must be initialized when power is first applied. If necessary, it can be initialized at a later time.
Es existieren zwei Verfahren zum Initialisieren der ICU, das Geltendmachen eines *RESET-Eingangssignals oder das Ausgeben einer Rücksetz-Instruktion. Die beiden Verfahren haben exakt die gleichen Auswirkungen auf die ICU. Gemäß der bevorzugten Ausführungsform der Erfindung wird eine spezielle Initialisierungsabfolge in der folgenden Weise durchgeführt:There are two methods for initializing the ICU, asserting a *RESET input signal or issuing a reset instruction. The two methods have exactly the same effect on the ICU. According to the preferred embodiment of the invention, a special initialization sequence is performed in the following manner:
1. Jede gerade ablaufende Cache-Speicher-Operation oder Cache- Speicher-Instruktion wird ausgesetzt.1. Any cache operation or cache instruction currently in progress is suspended.
2. Jede Speicherbus-Operation wird ausgesetzt.2. Any memory bus operation is suspended.
3. Die Chip-Wahl-Deaktivierungs- und Chip-Wahl-für-Speicherzugriff-Aktivierungs-Bits, die in dem Chipwahlabbildungsregister gespeichert sind, werden rückgesetzt3. The chip select disable and chip select for memory access enable bits stored in the chip select mapping register are reset
4. Die eine Instruktions- und Operanden-Gültigkeit anzeigenden Bits, die in dem Instruktionsregister gespeichert sind, werden rückgesetzt4. The instruction and operand validity bits stored in the instruction register are reset
5. Ein Instruktions-Zählstands-Gültigkeit anzeigendes Bit, das in dem Zählstands-Register gespeichert ist, wird rückgesetzt5. An instruction count validity bit stored in the count register is reset
6. Die Paritäts-Fehler-, Speicher-Fehler, Illegal-Instruktions- und Schutz-Verletzungs-Bits des Statusregisters werden rückgesetzt.6. The parity error, memory error, illegal instruction and protection violation bits of the status register are reset.
7. Sämtliche Moda-Register-Bits mit Ausnahme des Nurlesespeicher-Aktivierungs-Bits (ROME) und des Bits, das angibt, ob der Cache-Speicher ein Instruktions-Cache-Speicher oder ein Daten- Cache-Speicher ist (ID-Bit), werden rückgesetzt7. All Moda register bits except the read-only memory enable bit (ROME) and the bit that indicates whether the cache is an instruction cache or a data cache (ID bit) are reset
8. Sämtliche Modb-Register werden rückgesetzt.8. All modb registers are reset.
9. Sämtliche gültigen Bits werden rückgesetzt9. All valid bits are reset
Für eine korrekte Rücksetz-Operation sollten die folgenden Bedingungen eingehalten werden:For a correct reset operation, the following conditions should be met:
1. Das *IREQ-Eingangssignal sämtlicher ICU-Daten-Cache-Speicher in dem System muß mit LOW-Pegel gekoppelt sein. Das *IREQ-Signal sämtlicher Instruktions-Cache-Speicher muß mit dem *IREQ-Ausgangssignal des Prozessors verbunden sein.1. The *IREQ input of all ICU data caches in the system must be tied LOW. The *IREQ signal of all instruction caches must be tied to the *IREQ output of the processor.
2. Das CREQT1-Signal nur eines Instruktions-Cache-Speichers muß mit HIGH-Pegel gekoppelt sein, falls das Rücksetz-ROM auf dem Speicherbus plaziert ist. Sämtliche CREQT1-Signale müssen mit LOW-Pegel gekoppelt sein, falls das Rücksetz-ROM auf dem Prozessorbus plaziert ist.2. The CREQT1 signal of only one instruction cache must be tied to HIGH if the reset ROM is placed on the memory bus. All CREQT1 signals must be tied to LOW if the reset ROM is placed on the processor bus.
3. Das Chipwahlabbildungsregister verschiedener ICUs muß derart programmiert sein, daß es auf verschiedene Adressen für Speicher-Zugriffe und Cache-Speicher-Instruktions-Zugriffe reagiert. Dies kann durch Verwendung des *CSEL-Eingangssignals erfolgen. Es ist eine einfache Konfiguration möglich, die keine externe Hardware verlangt. Das *CSEL-Eingangssignal verschiedener Cache-Speicher kann mit unterschiedlichen Adressen-Bits gekoppelt werden und die entsprechenden Adressen benutzen. Nachdem die Anfangs-Registerprogrammierung abgeschlossen ist, kann das *CSEL-Eingangssignal deaktiviert werden.3. The chip select mapping register of different ICUs must be programmed to point to different addresses for memory accesses and cache memory instruction accesses. This can be done by using the *CSEL input signal. A simple configuration is possible that does not require any external hardware. The *CSEL input signal of different cache memories can be coupled to different address bits and use the corresponding addresses. After the initial register programming is completed, the *CSEL input signal can be disabled.
4. Das Programmieren der ICU-Register muß die erste Sequenz von Operationen nach dem Rücksetzen sein. Es dürfen keine Speicher-Zugriffe (mit Ausnahme von Instruktions-ROM-Zugriffen), I/O- oder Koprozessor-Zugriffe durchgeführt werden, bevor die ICUs entsprechende dem bestimmten System konfiguriert sind.4. Programming the ICU registers must be the first sequence of operations after reset. No memory accesses (except instruction ROM accesses), I/O or coprocessor accesses may be performed until the ICUs are configured appropriately for the particular system.
5. Falls eine Datentransfer-Steuereinrichtung (DTC), die in der hier einbezogenen mitanhängigen Anmeldung im Zusammenhang mit der DTC erläutert ist, in dem System vorhanden ist, muß das Modb-Register programmiert werden, bevor ein DTC-Zugriff durchgeführt wird&sub4; Falls die DTC auf dem Prozessorbus plaziert ist, muß sie derart programmiert werden, daß sie auf I/O- Adressen reagiert. (Die ICUs müssen derart programmiert werden, daß die 1/0-Zugriffe ignorieren.)5. If a data transfer controller (DTC), which is discussed in the co-pending application incorporated herein in connection with the DTC, is present in the system, the Modb register must be programmed before a DTC access is made. If the DTC is placed on the processor bus, it must be programmed to respond to I/O addresses. (The ICUs must be programmed to ignore the 1/0 accesses.)
Im folgenden werden die Mehrprozessor-Unterstützungs-Merkmale der ICU erläutert.The multiprocessor support features of the ICU are explained below.
Vom Aspekt der Cache-Speicherung besteht das Hauptproblem von Mehrprozessor-Organisationen in der Daten-Konsistenz. Dieses Problem tritt auf, falls mehr als ein Cache-Speicher eine Kopie der gleichen Speicherstelle enthält und in einem der Cache-Speicher durch seinen Prozessor modifiziert wird. Dann enthalten die anderen Cache-Speicher eine veraltete (nicht aktualisierte) Kopie der Daten. Die neuartige ICU-Architektur trägt diesem Problem Rechnung. Dem Fachmann auf dem Gebiet wird ersichtlich sein, daß die in der neuartigen ICU enthaltenen Mehrprozessor-Unterstützungs-Konstruktionen auch in anderen Mehrprozessor-Cache-Speicher-Umgebungen verwendet werden können.From a caching perspective, the main problem of multiprocessor organizations is data consistency. This problem occurs when more than one cache contains a copy of the same memory location and one of the caches is modified by its processor. Then the other caches contain an outdated (not updated) copy of the data. The novel ICU architecture addresses this problem. Those skilled in the art will appreciate that the multiprocessor support structures included in the novel ICU can also be used in other multiprocessor cache memory environments.
Der der ICU-Mehrprozessor-Unterstützung zugrundeliegende Kerngedanke besteht darin, daß aufwendige Merkmale vermieden werden, um ein Mehrprozessor-Cache-Speicher-System mit hoher Betriebsleistung und hoher Effizienz zu versehen. Die Merkmale weisen hinreichende Flexibilität auf, so daß die ICU der Mehrprozessor-System-Organisation nur minimale Restriktionen auferlegt. Die Wahl der geeigneten Art und Weise zur Verwendung der Merkmale des Mehrprozessor-Systems ist einfach. Sie erfolgt unter Software-Steuerung durch Programmierung von Options-Bits in den chipinternen Spezialregistern.The core idea behind ICU multiprocessor support is to avoid expensive features in order to provide a high performance, high efficiency multiprocessor cache memory system. The features have sufficient flexibility so that the ICU imposes minimal restrictions on the multiprocessor system organization. Choosing the appropriate way to use the multiprocessor system features is simple. It is done under software control by programming option bits in the on-chip special registers.
Im folgenden wird Fig. 4 erläutert.Fig. 4 is explained below.
Fig. 4 zeigt ein typisches Schaubild eines mit gemeinsam benutzern Bus verwendeten Mehrprozessor-Systems. Zwei oder mehr Prozessor-Gruppen können sich den gleichen Bus teilen (in der Figur sind zwei gezeigt). Jede Prozessor-Gruppe besteht aus einem Prozessor und zwei ICUs. Eine ICU wird als Instruktions- Cache-Speicher und die andere als Daten-Cache-Speicher verwendet. Der Prozessor-Adressenbus (A) ist mit dem Adressenbus (A) der beiden ICUs gekoppelt gezeigt. Der Prozessor-Instruktionsbus (I) ist mit dem Cache-Speicher-Bus (CB) des Instruktions-Cache-Speichers gekoppelt. Der Prozessor-Datenbus (D) ist mit dem Cache-Speicher-Bus (CB) des Daten-Cache-Speichers gekoppelt. Die Speicherbusse (MEMAD) der ICUs sind beide mit dem Gemeinsambenutzungs-Speicher-Bus gekoppelt. Es sind viele Variationen dieser Grund-Anordnung möglich.Figure 4 shows a typical diagram of a multiprocessor system using a shared bus. Two or more processor groups can share the same bus (two are shown in the figure). Each processor group consists of one processor and two ICUs. One ICU is used as an instruction cache and the other as a data cache. The processor address bus (A) is shown coupled to the address bus (A) of the two ICUs. The processor instruction bus (I) is coupled to the instruction cache cache bus (CB). The processor data bus (D) is coupled to the data cache cache bus (CB). The ICUs' memory buses (MEMAD) are both coupled to the shared memory bus. Many variations of this basic arrangement are possible.
Es sei daran erinnert, daß gemäß der bevorzugten Ausführungsform der Erfindung jedem Cache-Speicher-Block zwei Blockstatus-Bits und vier Gültigkeits-Bits zugeordnet sind. Die Gültigkeits-Bits zeigen die Gültigkeit der Wörter in dem Block an. Jedes Gültigkeits-Bit entspricht einem Wort. Falls mindestens ein Gültigkeits-Bit gesetzt ist, ist der Block gültig, und die Blockstatus-Bits zeigen einen Gültigkeits-Status an. Falls sämtliche Gültigkeits-Bits rückgesetzt sind, befindet sich der Block in einem Nicht-Gültigkeits-Status, und die Blockstatus-Bits sind irrelevant. Die Blockstatus-Bits sind als Gemeinsambenutzungs- und Modifizierungs-Bits bezeichnet. Das Gemeinsambenutzungs-Bit zeigt an, ob der Block von mehr als einem Prozessor gemeinsam benutzt wird oder in mehr als einem Cache-Speicher vorhanden ist. Das Modifizierungs-Bit zeigt an, ob der Block relativ zu dem Hauptspeicher modifiziert ist. Die beiden Bits sind unabhängig, und einem gültigen Block kann in der folgenden Weise ein Status zugewiesen werden: Blockstatus-Bits Wert (gemeinsam benutzt, modifiziert) Bedeutung exklusiv nicht modifiziert oexklusiv modifiziert gemeinsam benutzt nicht modifiziert gemeinsam benutzt modifiziertIt should be recalled that according to the preferred embodiment of the invention, each cache memory block is assigned two block status bits and four validity bits. The validity bits indicate the validity of the words in the block. Each validity bit corresponds to one word. If at least one validity bit is set, the block is valid, and the block status bits indicate a valid status. If all validity bits are reset, the block is in a non-valid state, and the block status bits are irrelevant. The block status bits are referred to as the sharing and modifying bits. The sharing bit indicates whether the block is shared by more than one processor or is present in more than one cache. The modifying bit indicates whether the block is modified relative to main memory. The two bits are independent, and a valid block can be assigned a status in the following way: Block status bits Value (shared, modified) Meaning exclusive not modified oexclusive modified shared not modified shared modified
Ferner sei daran erinnert, daß nicht cache-speicherbare Daten Datenvariablen sind, die nicht cache-gespeichert sind. Ein cache-speicherbarer Prozessorbus-Zugriff wird an den ICU-, ASTC-Eingängen angezeigt. Bei diesem Zugriff wird der Cache- Speicher nicht nach den verlangten Daten abgesucht. Ein Speicher-Zugriff wird zum Lesen oder Schreiben der Daten aus oder in den Speicher angezeigt. Für diese Daten wird in dem Cache- Speicher kein Block zugewiesen. Nicht cache-speicherbare Daten können auf Zugriffs-um-Zugriffs-Basis zugewiesen werden. Gewöhnlich sind die ASTC-Eingangssignale mit den MMU-programmierbaren (MPGM) Ausgängen des Prozessors gekoppelt. In diesem Fall werden die nicht cache-speicherbaren Daten auf MMU-Seiten-Basis zugewiesen. Die nicht cache-speicherbaren Daten müssen an einer Stelle plaziert werden, die das System als nicht cache-speicherbar zugewiesen hat. Ein Weg zur Lösung des Datenkonsistenz-Problems besteht darin, gemeinsam benutzte Variablen als nicht cache-speicherbar zuzuweisen.Furthermore, it should be remembered that non-cacheable data are data variables that are not cached. A cacheable processor bus access is indicated at the ICU, ASTC inputs. In this access, the cache memory is not searched for the requested data. A memory access is indicated to read or write the data from or to the memory. For this data, a cache memory is used. No block is allocated in memory. Non-cacheable data can be allocated on a per-access basis. Usually, the ASTC inputs are coupled to the processor's MMU programmable (MPGM) outputs. In this case, the non-cacheable data is allocated on an MMU page basis. The non-cacheable data must be placed in a location that the system has designated as non-cacheable. One way to solve the data consistency problem is to designate shared variables as non-cacheable.
Ein Prozessorbus-Speicher-Zugriff kann auch als Verriegelungs- Zugriff spezifiziert werden. Dies erfolgt durch Setzen des ICU-*LOCK-Eingangssignals. Verriegelungs-Zugriffe werden von dem Modb-Register gesteuert und können als cache-speicherbare und nicht cache-speicherbare Zugriffe bezeichnet werden.A processor bus memory access can also be specified as a locking access. This is done by setting the ICU *LOCK input signal. Locking accesses are controlled by the Modb register and can be referred to as cacheable and non-cacheable accesses.
In einer Mehrprozessor-Umgebung können Verriegelungsvariablen für die Synchronisation und für synchronisierte Kommunikation verwendet werden. Auf diese Variablen wird in synchronsierter Weise zugegriffen. Sie können von nur einem Prozessor zu jeder gegebenen Zeit geschrieben werden. Ein detaillierte Beschreibung der ICU-Unterstützung für Verriegelungs-Zugriffe wird im folgenden gegeben.In a multiprocessor environment, locking variables can be used for synchronization and synchronized communication. These variables are accessed in a synchronized manner. They can be written by only one processor at any given time. A detailed description of the ICU support for locking accesses is given below.
Die ICU unterstützt flexible Durch-Schreib- und Rückkopier- Schreib-Funktionen. Die Schreib-Funktionen können entweder global oder auf Zugriff-um-Zugriff-Basis zugeteilt werden. Das Moda-Register steuert die globale Schreib-Funktion. Es kann die flexible Durch-Schreib- oder Rückkopier-Funktion spezifizieren. Die ASTCEingangssignale definieren die Schreib-Funktion auf Zugriff-um-Zugriff-Basis. Der Zugriff kann als exklusiver Durch-Schreib-, exklusiver Rückkopier- oder Gemeinsambenutzungs-Zugriff zugewiesen werden. Falls bei einem Cache-Speicher-Treffer ein Konflikt zwischen der für die ASTC- Eingangssignale erfolgenden Gemeinsambenutzungs-Bit-Zuordnung und dem Blockstatus-Gemeinsambenutzungs-Bit in dem Cache-Speicher besteht, wird die Schreiboperation durch den Wert eines Prozessor-Gemeinsambenutzungs-Bit-Steuersignals (PSBC) in dem Modb-Register gesteuert. Falls PSBC gleich 0 ist, wird das mit gemeinsamem Blockstatus benutzte Bit nicht beeinträchtigt, und die Schreibfunktion wird entsprechend dem Blockstatus bestimmt. Falls PSBC gleich 1 ist, wird das mit gemeinsamem Blockstatus benutzte Bit entsprechend den ASTC-Eingangssignalen zugeordnet, und die Schreibfunktion wird entsprechend bestimmt.The ICU supports flexible write-through and copy-back write functions. The write functions can be allocated either globally or on a per-access basis. The Moda register controls the global write function. It can specify the flexible write-through or copy-back function. The ASTC inputs define the write function on a per-access basis. The access can be allocated as exclusive write-through, exclusive copy-back, or shared access. If a cache hit conflicts between the sharing bit allocation made for the ASTC inputs and the shared bit allocation made for the ASTC inputs, the ICU will resolve the conflict. and the block status sharing bit in the cache memory, the write operation is controlled by the value of a processor sharing bit control signal (PSBC) in the Modb register. If PSBC is 0, the bit used with shared block status is not affected and the write function is determined according to the block status. If PSBC is 1, the bit used with shared block status is assigned according to the ASTC inputs and the write function is determined accordingly.
Im Fall eines Gemeinsambenutzungs-Schreib-Zugriffs wird stets ein Durch-Schreib oder ein Schreib-Broadcast-Zugriff auf den Speicherbus durchgeführt. In diesem Fall steuert ein Schreib- Gemeinsambenutzungs-Treffer-Steuer (WSHC) -Feld in dem Modb- Register und nicht das Schreibfunktionsfeld die ICU-Operation.In the case of a shared write access, a write-through or write broadcast access to the memory bus is always performed. In this case, a write sharing hit control (WSHC) field in the Modb register, and not the write function field, controls the ICU operation.
In einer Mehrprozessor-Cache-Speicher-Umgebung ist die Durch- Schreib-Funktion weniger problematisch als die Rückkopierfunktion. Falls die Durch-Schreib-Funktion verwendet wird, enthält der Speicher stets eine aktualisierte Version der Daten. Der Durch-Schreib-Zugriff kann auch von anderen Cache-Speichern verwendet werden, um deren eigene Kopie zu invalidieren.In a multiprocessor cache environment, the write-through feature is less problematic than the copy-back feature. If the write-through feature is used, the memory always contains an updated version of the data. The write-through access can also be used by other caches to invalidate their own copy.
Die Prozessorbus-Cache-Speicher-Instruktionen können von dem System zum Steuern des Cache-Speichers in einer Mehrprozessor- Umgebung verwendet werden. Invalidierungs-Instruktionen können zum Invalidieren veralteter Daten verwendet werden. Andere Instruktionen können in komplexeren sof twaregesteuerten Mehrprozessor-Cache-Speicher-Umgebungen verwendet werden, um den Blockstatus und die Speicheraktualisierungen aus dem bzw. auf dem Speicherbus zu lesen und zu schreiben und cache-gespeicherte Daten auf dem Speicherbus auszugeben.The processor bus cache instructions can be used by the system to control the cache in a multiprocessor environment. Invalidation instructions can be used to invalidate stale data. Other instructions can be used in more complex software-controlled multiprocessor cache environments to read and write block status and memory updates to and from the memory bus and to output cached data to the memory bus.
Ein weiteres Mehrprozessor-Unterstützungs-Merkmal der ICU ist die "Bus-Überwachung". Die neuartige ICU ist in der Lage, die Speicherbusadressen zu überwachen und zu prüfen, ob sie zu einer Adresse in dem Tag-Array passen. Dies erfolgt unter Transparenz zu dem Prozessorbus-Cache-Speicher-Zugriffen. Die Bus-Lese-Überwachungs-Aktivierungs-Information in dem Modb- Register steuert (aktiviert oder deaktiviert) die Busüberwachungsfähigkeit für Speicherbus-Lese-Zugriffe. Die Bus-Lese- Überwachungs-Aktivierungs-Information in dem Modb-Register leistet die gleiche Funktion für Speicherbus-Schreibzugriffe. Bei Aktivierung wird der Bus nur dann überwacht, wenn die ICU der Bus-Slave ist. Im Fall einer Adressenübereinstimmung führt die ICU Operationen durch, wie sie von der Lese-Übereinstimmungs-Steuer- und der Schreib-Übereinstimmungs-Steuer-Information in dem Modb-Register gesteuert werden.Another multiprocessor support feature of the ICU is the "bus monitoring". The new ICU is able to To monitor memory bus addresses and check if they match an address in the tag array. This is done with transparency to the processor bus cache memory accesses. The bus read monitor enable information in the Modb register controls (enables or disables) the bus monitoring capability for memory bus read accesses. The bus read monitor enable information in the Modb register performs the same function for memory bus write accesses. When enabled, the bus is monitored only when the ICU is the bus slave. In the event of an address match, the ICU performs operations as controlled by the read match control and write match control information in the Modb register.
Im Fall einer Übereinstimmung beim Speicherbuslesen wird das *HIT-Signal von der ICU geltend gemacht. Es wird das mit gemeinsamem Blockstatus benutzte Bit gesetzt, da der Block potentiell von einem anderen Cache-Speicher beansprucht ist. Das Modb-Register steuert die Dateninterventionsoperation und die Blockstatus-Modifizierungsbit-Zuordnung. Die Optionen sind: keine Datenintervention, Datenintervention (modifiziertes Bit unverändert) und Datenintervention (modifiziertes Bit rückgesetzt).In case of a memory bus read match, the *HIT signal is asserted by the ICU. The bit used with shared block state is set because the block is potentially claimed by another cache. The modb register controls the data intervention operation and the block state modification bit mapping. The options are: no data intervention, data intervention (modified bit unchanged), and data intervention (modified bit reset).
Wenn die Datenintervention deaktiviert ist und falls dabei eine Übereinstimmung mit dem von einem anderen Master gelesenen Speicherbusleseinhalt existiert, macht die ICU das *HIT- Signal geltend, steuert die Daten jedoch nicht an. Die blockstatusmodifizierte Information wird nicht geändert. Wenn die Datenintervention aktiviert ist und falls dabei eine Übereinstimmung mit dem von einem anderen Master gelesenen Speicherbusleseinhalt festgestellt wird und der Block modifiziert ist, macht die ICU das *DI-Ausgangssignal geltend und führt die erforderlichen Daten auf dem Speicherbus zu. Das blockstatusmodifizierte Bit wird entweder nicht geändert oder rückgesetzt.When data intervention is disabled, if there is a match with the memory bus read content read by another master, the ICU asserts the *HIT signal but does not drive the data. The block status modified information is not changed. When data intervention is enabled, if there is a match with the memory bus read content read by another master and the block is modified, the ICU asserts the *DI output signal and drives the required data on the memory bus. The block status modified bit is either not changed or is reset.
Im Fall einer Übereinstimmung bei einem Lese-zum-Modifizieren- Zugriff wird das entsprechende Wort von den Slave-Cache-Speichern invalidiert. In jeder anderen Hinsicht ist die Cache- Speicher-Operation dem Fall einer Übereinstimmung bei einem regelmäßigen Lese-Zugriff ähnlich.In case of a match on a read-to-modify access, the corresponding word is invalidated by the slave caches. In all other respects, the cache operation is similar to the case of a match on a regular read access.
Für Speicherbus-Burst-Betriebsart-Zugriffe werden die Anfangs- Adressen verriegelt. Die Adresse wird inkrementiert und in dem Slave-Cache-Speicher für jeden einzelnen Transfer überprüft.For memory bus burst mode accesses, the initial addresses are latched. The address is incremented and checked in the slave cache for each individual transfer.
Die Slave-Cache-Speicher-Operation im Fall einer Übereinstimmung ist der Einfach-Adressen-Übereinstimmung ähnlich.The slave cache operation in case of a match is similar to the single address match.
Die Bus-Überwachung zum Lesen ist wesentlich für die Unterstützung der Datenkonsistenz-Eigentümerschafts-Schemata, die im folgenden detailliert beschrieben werden.Bus monitoring for reading is essential to supporting the data consistency ownership schemes, which are described in detail below.
Die Dateninterventions-Option wird von einigen der Eigentümerschafts-Schemata verlangt. Bei diesem Schemata muß der Speicher derart ausgelegt sein, daß er diese unterstützt. Das *DI- Signal wird von dem Master-Cache-Speicher während des ersten Zyklus des Zugriffs vorgeladen. Ein externer Pull-up-Widerstand muß an das *DI-Signal gelegt sein, um den vorgeladenen HIGH-Wert zu halten. Das *DI-Signal wird von den Slave-Cache- Speichern entladen, falls die Dateninterventions-Operation durchgeführt wird. In diesem Fall dürfen die Daten nicht von dem Speicher zugeführt sein, und der Lese-Zugriff muß in dem Speicher gelöscht werden. Es ist anzumerken, daß das * DI-Ausgangssignal für zwei Zyklen gültig ist, nachdem die Adresse auf dem Speicherbus erscheint. Der Speicher kann während dieser Zyklen nicht reagieren.The data intervention option is required by some of the ownership schemes. In these schemes, the memory must be designed to support it. The *DI signal is precharged by the master cache during the first cycle of the access. An external pull-up resistor must be connected to the *DI signal to hold the precharged HIGH value. The *DI signal is discharged by the slave caches if the data intervention operation is performed. In this case, the data must not be supplied from the memory and the read access must be cleared in the memory. Note that the *DI output signal is valid for two cycles after the address appears on the memory bus. The memory may not respond during these cycles.
Im Fall einer Übereinstimmung bei einem Speicherbus-Schreiboder Schreib-Broadcast-Signal wird das *HIT-Signal geltend gemacht.In case of a match on a memory bus write or write broadcast signal, the *HIT signal is asserted.
Bei Burst-Betriebsart-Schreib-Zugriffen wird die Anfangs- Adresse verriegelt. Die Adresse wird für jeden einzelnen Datentransfer inkrementiert und in dem Slave-Cache-Speicher überprüft. Im Fall einer Übereinstimmung ist die Slave-Cache- Speicher-Operation der Einzel-Zugriffs-Übereinstimmung ähnlich.For burst mode write accesses, the starting address is latched. The address is incremented for each individual data transfer and checked in the slave cache. In case of a match, the slave cache operation is similar to the single access match.
Die Bus-Überwachung zum Schreiben ist für das Unterstützen der meisten Datenkonsistenz-Schemata wesentlich.Write bus monitoring is essential to supporting most data consistency schemes.
Im folgenden wird beschrieben, wie die mit gemeinsamem Blockstatus benutzten Bits zugeordnet werden.The following describes how the bits used with shared block status are assigned.
Das mit gemeinsamem Blockstatus benutzte Bit kann entweder durch Software- oder durch Hardware-Steuerung zugewiesen werden. Bei der Software-Steuerung kann der Prozessor das gemeinsam benutzte Bit durch Verwendung der ASTC-Eingangssignale zuweisen. Diese Eingangssignale definieren die Zuteilung des gemeinsam benutzten Bits auf einer Zugriff-um-Zugriff-Basis. Der Zugriff kann als exklusiver Durch-Schreib-Zugriff, exklusiver Rückkopier-Zugriff oder gemeinsamer Zugriff zugewiesen werden. Normalerweise werden die ASTC-Eingangssignale mit den MPGM-Signalen gekoppelt, die entsprechend den benutzerprogrammierbaren MMU-Bits gesteuert werden. Die gemeinsamen und exklusiven Variablen werden auf gemeinsam benutzte oder exklusive Seiten plaziert, und die benutzerprogrammierbaren Bits für die Seiten werden entsprechend zugewiesen. In Abhängigkeit von dem Zustand des PSBC-Bits des Modb-Registers (das bereits erwähnt wurde), kann das gemeinsame Bit für jeden Prozessorzugriff (PSBC=1) oder nur für den Fall eines Cache-Speicher- Fehlgängers (PSBC=0) modifiziert werden.The bit used with shared block status can be assigned either by software or hardware control. Under software control, the processor can assign the shared bit using the ASTC input signals. These input signals define the allocation of the shared bit on an access-by-access basis. The access can be assigned as exclusive write-through access, exclusive copy-back access, or shared access. Typically, the ASTC input signals are coupled to the MPGM signals, which are controlled according to the user-programmable MMU bits. The shared and exclusive variables are placed on shared or exclusive pages, and the user-programmable bits for the pages are assigned accordingly. Depending on the state of the PSBC bit of the Modb register (mentioned earlier), the common bit can be modified for every processor access (PSBC=1) or only in case of a cache miss (PSBC=0).
Bei der Hardware-Steuerung kann das gemeinsam benutzte Bit durch Verwendung des *HIT-Signals oder durch Verwendung einer für einen speziellen Zweck vorgesehenen Logik für den Speicherbus und die Schreib-Blockstatus-Speicherbus-Cache-Instruktion zugewiesen werden. Die *HITSiignal-Verwendung bei den Lese- und Schreib-Zugriffen wird von einem externen Gemeinsambenutzungs-Bit-Steuerungs (ESBC)-Feld des Modb-Registers gesteuert.In hardware control, the shared bit can be set by using the *HIT signal or by using special purpose logic for the memory bus and the write block status memory bus cache instruction *HITSiignal usage in read and write accesses is controlled by an external sharing bit control (ESBC) field of the Modb register.
In dem Fall, in dem ein Master-Cache-Speicher das *HIT-Signal benutzt, lädt er dieses während des ersten Zyklus des Speicherbus-Zugriffs vor. Dann wird das *HIT-Signal in den Dreifach-Zustand versetzt. An das *HIT-Signal muß ein externer Pull-up-Widerstand angelegt werden, um den vorgeladenen HIGH- Wert zu halten. Der Slave-Cache-Speicher entlädt das Signal, falls eine Übereinstimmung in dem Tag-Puffer gefunden wird. Das *HIT-Signal wird von dem Master-Cache-Speicher verriegelt, wenn *MRDY geltend gemacht wird, oder zwei Zyklen nach dem Speicherbus-Adressen-Zyklus, je nachdem, was später erfolgt. Falls das *HIT-Signal geltend gemacht wird, dann ist die Variable auch in anderen Cache-Speichern vorhanden, und dem Block wird ein gemeinsamer Status zugewiesen. Falls das *HIT- Signal nicht geltend gemacht wird, ist die Variable in keinem Cache-Speicher vorhanden, und dem Block wird ein exklusiver Status zugewiesen.In the case where a master cache uses the *HIT signal, it precharges it during the first cycle of the memory bus access. Then the *HIT signal is tripled. An external pull-up resistor must be applied to the *HIT signal to keep the precharged HIGH value. The slave cache discharges the signal if a match is found in the tag buffer. The *HIT signal is latched by the master cache when *MRDY is asserted or two cycles after the memory bus address cycle, whichever is later. If the *HIT signal is asserted, then the variable is also present in other caches and the block is assigned a common state. If the *HIT signal is not asserted, the variable is not present in any cache and the block is assigned an exclusive status.
Dieses Verfahren wird bei einigen der Eigentümerschafts-Schemata verwendet. Es garantiert, daß der gemeinsame Status den exakten Zustand der Variablen reflektiert. Er ist nur dann gemeinsam, falls er in einem weiteren Cache-Speicher vorhanden ist. Es ist anzumerken, daß mit der Verwendung des * HIT-Signals ein Leistungs-Preis verbunden ist. Die ICU muß zwei Zyklen warten, bis sämtliche weiteren Cache-Speicher reagieren. Ferner ist ein spezieller interner Cache-Speicher-Array- Zugriff erforderlich, falls das gemeinsame Bit modifiziert werden muß. Bevor man diese Option wählt, sollte man sich dieses Sachverhaltes gegenüber den Vorteilen bewußt sein.This technique is used in some of the ownership schemes. It guarantees that the shared state reflects the exact state of the variable. It is shared only if it is present in another cache. Note that there is a performance cost associated with using the *HIT signal. The ICU must wait two cycles for all other caches to respond. Also, a special internal cache array access is required if the shared bit needs to be modified. Before choosing this option, one should be aware of this versus the benefits.
Die bereits beschriebene Schreib-Blockstatus-Speicherbus-Cache-Instruktion kann verwendet werden, um dem mit gemeinsamem Blockstatus benutzten Bit einen bestimmten Status zuzuschreiben. Diese Instruktion kann von einer externen Logik zur flexiblen Steuerung des gemeinsamen Bit verwendet werden.The previously described write block status memory bus cache instruction can be used to Block status to assign a specific status to the bit used. This instruction can be used by external logic to flexibly control the common bit.
Im Fall eines bei der Zuweisung des gemeinsamen Blocks auftretenden Konfliktes zwischen den genannten drei Verfahren wird bei der bevorzugten Ausführungsform der Erfindung die Operation entsprechend der folgenden Priorität durchgeführt:In the event of a conflict occurring between the three methods mentioned during the allocation of the common block, in the preferred embodiment of the invention the operation is carried out according to the following priority:
1. Blockstatus-Schreib-Instruktion.1. Block state write instruction.
2. *HIT-Eingangssignal-Steuerung.2. *HIT input signal control.
3. ASTC-Eingangssignal-Steuerung.3. ASTC input signal control.
Falls beispielsweise der Block von den ASTC-Eingangssignalen als exklusiv zugewiesen wird, jedoch ein Speicherbus-Zugriff verlangt ist, wird die Benutzung des *HIT-Eingangssignals aktiviert, und es wird angegeben, daß der Block exklusiv ist. Die Blockstatus-Schreib-Instruktion wird ferner während des Speicher-Zugriffs verwendet, und es wird ihr ein gemeinsamer Status zugewiesen. Der Block endet in dem gemeinsamen Status.For example, if the block is designated as exclusive by the ASTC inputs, but a memory bus access is required, use of the *HIT input is enabled and the block is indicated to be exclusive. The block state write instruction is also used during the memory access and is assigned a shared state. The block ends in the shared state.
Die verschiedenen Verfahren der Zuweisungen gemeinsam benutzter Blöcke und ihre Kombinationen werden zur Implementierung sämtlicher von der neuartigen ICU unterstützten Mehrprozessor- Cache-Speicher-Systeme verwendet.The various shared block allocation schemes and their combinations are used to implement all multiprocessor cache memory systems supported by the novel ICU.
Im folgenden wird die ICU-Operation für den Fall beschrieben, daß ein Schreib-Treffer bei einem gemeinsam benutzten Block auftritt.The following describes the ICU operation in the case that a write hit occurs on a shared block.
Wenn ein Schreib-Zugriff auf einen gemeinsamen Block gerichtet ist und diesen in dem Cache-Speicher trifft, muß eine spezielle Operation auf dem Speicherbus durchgeführt werden. Die anderen Cache-Speicher in dem System müssen auf die Tatsache angestimmt sein, daß eine geteilte Datenvariable modifiziert worden ist. Ihre Kopie muß entweder invalidiert oder derart aktualisiert sein, daß sie die aktuelle Version der gemeinsamen Variablen reflektiert. Der Hauptspeicher kann entweder beschrieben werden oder nicht. Der Blockstatus des Master- Cache-Speichers wird entsprechend beeinflußt. Die ICU-Operation für einen Schreib-Treffer bei einem gemeinsamen Block wird durch ein Schreib-Gemeinsambenutzungs-Treffer-Steuer(WSHC)-Feld in dem Modb-Register gesteuert. Ein Kodierschema lautet wie folgt: WSHC-Wert Master-Cache-Speicher-Operation Slave-Cache-Speicher-Operation Neuer Blockstatus Durch-Schreiben Schreiben Broadcast Invalidieren Aktualisieren exclusiv modifiziert unmodifiziert gemeinsam benutztWhen a write access is directed to a shared block and hits it in the cache, a special operation must be performed on the memory bus. The other caches in the system must be aware of the fact that a shared data variable has been modified. Their copy must either be invalidated or updated to reflect the current version of the shared variable. Main memory may be written to or not. The block state of the master cache is affected accordingly. The ICU operation for a write hit on a shared block is controlled by a Write Share Hit Control (WSHC) field in the Modb register. One coding scheme is as follows: WSHC Value Master Cache Operation Slave Cache Operation New Block State Write-Through Write Broadcast Invalidate Update Exclusive Modified Unmodified Shared
Wenn WSHC = 00, schreibt die ICU jeden Schreib-Treffer auf einen gemeinsam benutzten Block durch. Der Speicher wird aktualisiert, und andere Cache-Speicher werden invalidiert. Dem Block wird der exklusive unmodifizierte Status zugewiesen. Da der Block exklusiv wird, können weitere Schreibinhalte für den gleichen Block nur in den Cache-Speicher geschrieben werden. Dieses Schema ist effektiv, falls eine gemeinsame Variable viele Male von einem bestimmten Prozessor geschrieben wird, bevor sie von anderen Prozessoren benotigt wird.When WSHC = 00, the ICU writes through every write hit to a shared block. The memory is updated and other caches are invalidated. The block is assigned the exclusive unmodified status. Since the block becomes exclusive, further writes for the same block can only be written to the cache. This scheme is effective if a shared variable is written many times by a particular processor before it is needed by other processors.
Wenn WSHC = 1, verwendet die ICU eine Schreib-Broadcast-Transaktion auf dem Speicherbus. Der Speicher wird nicht aktualisiert, und die anderen Cache-Speicher werden invalidiert. Dem Block wird der exklusive modifizierte Status zugewiesen. Da der Block exklusiv wird, können weitere Schreibinhalte für den gleichen Block nur in den Cache-Speicher geschrieben werden. Da der Speicher nicht aktualisiert wird, wird das modifizierte Bit gesetzt. Diese Daten-Interventions-Option sollte aktiviert werden, um den aktuellsten Wert zu unterstützen, wenn ein anderer Master diesen Block zu lesen versucht.If WSHC = 1, the ICU uses a write broadcast transaction on the memory bus. The memory is not updated and the other caches are invalidated. The block is assigned the exclusive modified status. Since the block becomes exclusive, further writes for the same block can only be written to the cache. Since the memory is not updated, the modified bit is set. This data intervention option should be enabled to support the most current value when another master attempts to read this block.
Wenn WSHC = 10, schreibt die ICU jeden Schreib-Treffer auf einen gemeinsamen Block durch. Der Speicher wird aktualisiert, und andere Cache-Speicher werden ebenfalls aktualisiert. Falls ESBC nicht für Schreib-Zugriffe aktiviert wird, wird dem Block der gemeinsame unmodifizierte Status zugewiesen. Falls ESBC für Schreib-Zugriffe aktiviert wird, wird dem Block entsprechend dem *HIT-Eingangssignal der exklusive unmodifizierte oder der gemeinsame unmodifizierte Status zugewiesen. In diesem Schema werden sämtliche Cache-Speicher synchronisiert gehalten, und zwar auf Kosten der Speicherbus-Schreib-Transaktion für jeden Schreibvorgang für einen gemeinsamen Block. Es ist effektiv, falls eine gemeinsame Variabale nicht viele Male von einem bestimmten Prozessor geschrieben wird, bevor sie von anderen Prozessoren verlangt wird.If WSHC = 10, the ICU writes out every write hit to a shared block. The memory is updated, and other caches are also updated. If ESBC is not enabled for writes, the block is assigned to the shared unmodified state. If ESBC is enabled for writes, the block is assigned to the exclusive unmodified or shared unmodified state according to the *HIT input. In this scheme, all caches are kept synchronized at the expense of the memory bus write transaction for each shared block write. It is effective if a shared variable is not written many times by a particular processor before it is requested by other processors.
Wenn WSHC = 11, schreibt die ICU jeden Schreib-Treffer auf Broadcast-Weise in einen gemeinsamen Block. Der Speicher wird nicht aktualisiert, und andere Cache-Speicher werden aktualisiert. Falls ESBC nicht für Schreib-Zugriffe aktiviert wird, wird dem Block der gemeinsame modifizierte Status zugewiesen. Falls ESBC für Schreib-Zugriffe aktiviert wird, wird dem Block entsprechend dem *HIT-Eingangssignal der exklusive modifizierte oder der gemeinsame modifizierte Status zugewiesen. In diesem Schema werden sämtliche Cache-Speicher synchronisiert gehalten, und zwar auf Kosten der Speicherbus-Schreib-Transaktion für jeden Schreibvorgang für einen gemeinsamen Block. Es ist effektiv, falls eine gemeinsame Variabale nicht viele Male von einem bestimmten Prozessor geschrieben wird, bevor sie von anderen Prozessoren verlangt wird. Da der Speicher nicht aktualisiert wird, wird das modifizierte Bit gesetzt. Die Daten-Interventions-Option sollte aktiviert werden, um den aktuellsten Wert zu unterstützen, wenn ein anderer Master diesen Block zu lesen versucht.If WSHC = 11, the ICU writes each write hit to a shared block in a broadcast manner. The memory is not updated and other caches are updated. If ESBC is not enabled for writes, the block is assigned the shared modified state. If ESBC is enabled for writes, the block is assigned the exclusive modified or shared modified state according to the *HIT input. In this scheme, all caches are kept synchronized at the expense of the memory bus write transaction. for each write to a shared block. It is effective if a shared variable is not written many times by a particular processor before it is requested by other processors. Since the memory is not updated, the modified bit is set. The data intervention option should be enabled to support the most recent value when another master tries to read this block.
Die WSHC-Optionen werden für die verschiedenen Eigentümerschafts-Schemata verwendet. Sie können auch für andere Mehrprozessor-Cache-Speicher-Systeme verwendet werden.The WSHC options are used for the different ownership schemes. They can also be used for other multiprocessor cache memory systems.
Die ICU-Speicherbus-Operation für einen Rückkopier-Schreib- Fehlgänger bei Schreib-Zuordnung wird von einem Schreib-Fehlgänger-Speicherzugriffs-Steuer(WMMC)-Bit in dem Modb-Register gesteuert. Es hat keine Auswirkung auf Durch-Schreib-Zugriffe oder Rückkopier-Zugriffe ohne Schreib-Zuordnung. Wenn WMMC = 1, verwendet die ICU einen Lese-Zugriff auf den Speicherbus, um den verlangten Unterblock herauszugreifen, gefolgt von einem Cache-Speicher-Schreib-Zugriff. Dieser Zugriff wird als separate Cache-Speicher-Schreib-Operation behandelt. Stets trifft sie und wird in den Cache-Speicher geschrieben. Falls der Block gemeinsam benutzt wird, wird eine Speicherbus-Operation entsprechend dem WSHC-Feld des Modb-Registers durchgeführt. Wenn WMMC = 0, wird die Lesen-zum-Modifizieren-Transaktion für den Speicherbus verwendet, um den verlangten Unterblock abzuruf en. Slave-Cache-Speicher invalidieren ihre Kopie des Blocks im Fall einer Übereinstimmung. Der Schreibvorgang erfolgt in den Cache-Speicher ohne irgendeine Speicherbus- Operation.The ICU memory bus operation for a copyback write miss on write map is controlled by a write miss memory access control (WMMC) bit in the Modb register. It has no effect on write-through accesses or copyback accesses without write map. If WMMC = 1, the ICU uses a read access to the memory bus to fetch the requested sub-block, followed by a cache write access. This access is treated as a separate cache write operation. It always hits and is written to cache. If the block is shared, a memory bus operation is performed according to the WSHC field of the Modb register. If WMMC = 0, the read-to-modify transaction on the memory bus is used to fetch the requested sub-block. Slave caches invalidate their copy of the block in case of a match. The write is performed to the cache without any memory bus operation.
Die WMMC-Optionen werden für die verschiedenen Eigentümerschafts-Schemata verwendet. Sie können auch für andere Mehrprozessor-Cache-Speicher-Systeme verwendet werden.The WMMC options are used for the different ownership schemes. They can also be used for other multiprocessor cache memory systems.
Die Speicherbus-Cache-Instruktionen werden von einer speziellen Logik auf dem Speicherbus ausgegeben. Sie erlauben eine flexible Steuerung des Cache-Speichers. Cache-gespeicherte Daten können invalidiert, gelesen und geschrieben werden. Der Blockstatus kann gelesen und geschrieben werden. Eine detaillierte Beschreibung der Speicherbus-Cache-Instruktionen ist bereits weiter oben aufgeführt.The memory bus cache instructions are issued by a special logic on the memory bus. They allow flexible control of the cache memory. Cached data can be invalidated, read and written. The block status can be read and written. A detailed description of the memory bus cache instructions is already given above.
In der Mehrprozessor-Umgebung muß die spezielle Steuer-Logik in der Lage sein, die Instruktion an die korrekte ICU weiterzuleiten. Die Logik kann für jedes erforderliche Mehrprozessorsystem konzipiert sein. Insbesondere muß dieses Verfahren bei Systemen ohne einen gemeinsamen Bus verwendet werden (Kreuzbalken-Schaltungs- oder Mehrfachbus-Konfigurationen). Bei diesen Systemen ist die Bus-Überwachungs-Funktion nicht effektiv, und somit sollte eine spezielle Logik die Speicher- Zugriffe überwachen und dementsprechend Befehle an die unterschiedlichen ICUs ausgeben. Die Steuerlogik kann auch derart konzipiert sein, daß ein bestimmtes Mehrprozessor-Schema implementiert wird, das nicht direkt von der ICU unterstützt wird.In the multiprocessor environment, the special control logic must be able to route the instruction to the correct ICU. The logic can be designed for any multiprocessor system required. In particular, this method must be used in systems without a common bus (crossbar circuit or multiple bus configurations). In these systems, the bus monitoring function is not effective and thus special logic should monitor the memory accesses and issue commands to the different ICUs accordingly. The control logic can also be designed to implement a specific multiprocessor scheme that is not directly supported by the ICU.
Es existieren viele Möglichkeiten für Mehrprozessor-Cache- Speicher-Organisationen. Die ICU ist zur Unterstützung verschiedenartiger Gemeinsambenutzungs -Speicher-Mehrprozessor- Cache-Organisationen ausgelegt. Die ICU kann auch in einer Nicht-Gemeinsambenutzungs-Speicher-Organisation verwendet werden, enthält jedoch keine spezielle Hardware-Unterstützung für diese Systeme. In der folgenden detaillierten Beschreibung werden die hauptsächlichen Gemeinsambenutzungs-Speicher-Organisation erläutert, die von der ICU unterstützt werden. Es sind auch Abwandlungen, Kombinationen oder andere Systeme als die beschriebenen Systeme möglich.There are many possibilities for multiprocessor cache memory organizations. The ICU is designed to support various shared memory multiprocessor cache organizations. The ICU can also be used in a non-shared memory organization, but does not include any special hardware support for these systems. The following detailed description explains the main shared memory organizations supported by the ICU. Variations, combinations, or systems other than those described are also possible.
Die hauptsächlichen Gemeinsambenutzungs-Speicher-Organisationen, die unterstützt werden, sind die folgenden: Organisationen mit software-gesteuertem Cache-Speicher, mit Durch- Schreib-Cache-Speicher, mit Rückkopier-Cache-Speicher bei gemeinsam benutzten Durch-Schreib-Variablen, mit Eigentümerschafts-Schemata und gemeinsam benutztem Speicher bei nicht gemeinsam benutztem Bus.The main shared storage organizations supported are the following: Organizations with software-controlled cache, with write-through cache, with copy-back cache with shared write-through variables, with ownership schemes, and shared memory with non-shared bus.
Für software-gesteuerte Cache-Speicher wird sämtliche Mehrprozessor-Kommunikation und -Synchronisation unter Software- Steuerung. Die Cache-Speicher-Konsistenz wird durch Software aufrechterhalten. Dies kann mittels einer Kombination nichtcache-speicherbarer Variablen, durch (im folgenden detailliert beschriebene) Verriegelungs-Operationen und die Verwendung von Cache-Speicher-Instruktionen (z.B. Invalidieren) erfolgen. Gemeinsame Variablen können entweder als nicht-cache-speicherbar zugeteilt oder aus den entsprechenden Cache-Speichern heraus invalidiert werden, wenn sie von einem anderen Prozessor modifiziert werden können. Verriegelungs-Operationen werden zur Synchronisation verwendet. Gemeinsame Puffer oder Mailboxes werden zur Kommunikation verwendet.For software-controlled caches, all multiprocessor communication and synchronization is under software control. Cache consistency is maintained by software. This can be done using a combination of non-cacheable variables, locking operations (described in detail below), and the use of cache instructions (e.g., invalidate). Shared variables can either be allocated as non-cacheable or invalidated from the corresponding caches if they can be modified by another processor. Locking operations are used for synchronization. Shared buffers or mailboxes are used for communication.
Dies ist ein sehr flexibles Schema ohne spezielle Hardware- Erfordernisse oder Restriktionen. Es kann erfolgreich in Systemen mit geringem Aufkommen an Gemeinsambenutzung verwendet werden. Falls jedoch der Anteil an Gemeinsambenutzung hoch ist, kann bei diesem Schema möglicherweise die Systemleistung massiv beeinträchtigt werden. Viele Variablen können nicht cache-gespeichert werden, oder die Aufrechterhaltung der Cache-Speicher-Konsistenz macht einen großen Aufwand erforderlich. Ein weiterer Nachteil bei diesem Schema besteht darin, daß der Cache-Speicher für die Software nicht transparent ist, und daß die Information, zu der die Variablen gemeinsam benutzt werden müssen, bekannt sein muß. Die Software-Steuerung kann in Kombination mit irgendeinem der anderen Mehrprozessor- Schemata verwendet werden.This is a very flexible scheme with no special hardware requirements or restrictions. It can be used successfully in systems with a low level of sharing. However, if the level of sharing is high, this scheme can potentially have a massive impact on system performance. Many variables cannot be cached, or it requires a lot of effort to maintain cache consistency. Another disadvantage of this scheme is that the cache is not transparent to the software, and the information to which the variables must be shared must be known. Software control can be used in combination with any of the other multiprocessor schemes.
Für diese Konfiguration existieren keine besonderen Anforderungen an programmierbare Optionen. Das Modb-Register kann auf programmiert werden.There are no special requirements for programmable options for this configuration. The Modb register can be programmed to .
Für Durch-Schreib-Cache-Speicher benutzen die Prozessoren den gleichen Bus und Speicher gemeinsam, und sämtliche Cache-Speicher benutzen die Durch-Schreib-Funktion. Ein Master-Cache- Speicher übermittelt sämtliche Prozessor-Schrieb-Information an den Speicherbus. Die Cache-Speicher-Konsistenz wird aufrechterhalten, indem für Schreibvorgänge die Bus-Überwachung durchgeführt wird. Jede Schreib-Operation auf dem gemeinsamen Speicherbus wird in sämtlichen Slave-Cache-Speichern überprüft. Falls eine Übereinstimmung festgestellt wird, wird die entsprechende Adresse invalidiert. Dabei handelt es sich um ein einfaches Datenkonsistenz-Schema. Sein Hauptnachteil liegt darin, daß jeder Schreibvorgang eine Speicherbusoperation verursacht. Die Leistung kann dadurch beträchtlich verringert werden. Die Speicherbusbenutzung kann sehr viel höher ausfallen, so daß nur eine geringe Anzahl von Prozessoren in dem System untergebracht werden kann. Der Schreibpuffer kann dazu beitragen, diese nachteiligen Effekte zu reduzieren.For write-through caches, processors share the same bus and memory, and all caches use the write-through feature. A master cache communicates all processor write information to the memory bus. Cache consistency is maintained by performing bus sensing for writes. Each write on the shared memory bus is checked in all slave caches. If a match is found, the corresponding address is invalidated. This is a simple data consistency scheme. Its main disadvantage is that each write causes a memory bus operation. This can significantly reduce performance. Memory bus usage can be much higher, so only a small number of processors can be accommodated in the system. The write buffer can help reduce these adverse effects.
Für diese Option sollten sämtliche Blöcke aus exklusive Durch- Schreib-Blöcke ausgewiesen werden, die Schreib-Funktion sollte als Durch-Schreib-Funktion programmiert werden, die Bus-Überwachung sollte für Schreib-Zugriffe aktiviert werden, und das Modb-Register sollte das Invalidieren von Wörtern spezifizieren.For this option, all blocks should be designated as exclusive write-through blocks, the write function should be programmed as a write-through function, the bus monitor should be enabled for write accesses, and the modb register should specify word invalidation.
Für Rückkopier-Cache-Speicher mit gemeinsam benutzten Durch- Schreib-Variablen teilen sich die Prozessoren den gleichen Bus und Speicher, und die Cache-Speicher verwenden eine flexible Schreib-Funktion. Die exklusiven Variablen benutzen eine Rückkopier-Option (die auf einer für exklusives Rückkopieren ausgewiesenen Seite plaziert ist). Es obliegt der Verantwortlichkeit des Systems, zu gewährleisten, daß nur die Variablen-, die ausschließlich von einem einzigen Prozessor verwendet werden, für exklusives Rückkopieren ausgewiesen sind. Es ist anzumerken, daß, falls eine Prozeßmigration erlaubt ist, in dem Cache-Speicher des alten Prozessors ein exklusive Variable invalidiert werden muß.For copyback caches with shared write-through variables, the processors share the same bus and memory, and the caches use a flexible write function. The exclusive variables use a copyback option (placed on a page designated for exclusive copyback). It is the responsibility of the system to ensure that only the variables that used exclusively by a single processor are designated for exclusive copyback. Note that if process migration is allowed, an exclusive variable must be invalidated in the cache of the old processor.
Die gemeinsamen Variablen verwenden eine Durch-Schreib-Option (die auf einer für exklusives Durch-Schreiben ausgewiesenen Seite plaziert ist). Es obliegt der Verantwortlichkeit des Systems, diesen Status jeder Variablen zuzuweisen, die gemeinsam benutzt werden könnte (einschließlich Gemeinsambenutzung mit I/O, oder Prozessoren ohne Cache-Speicher). Einige Variablen, wie I/O, müssen noch als nicht cache-speicherbar zugewiesen werden. Eine Bus-Überwachung für Schreib-Schemata (ähnlich der für die Durch-Schrieb-Cache-Speicher beschriebenen) wird zum Aufrechterhalten der Daten-Konsistenz verwendet. Im Fall einer Übereinstimmung invalidieren Slave-Cache-Speicher ihre Kopie. Eine mögliche Variation mit besserer Leistung besteht darin, daß die Slave-Cache-Speicher ihre Kopie aktualisieren, statt sie zu invalidieren.The shared variables use a write-through option (placed on a page designated for exclusive write-through). It is the responsibility of the system to assign this status to any variable that could be shared (including sharing with I/O, or processors without caches). Some variables, such as I/O, have yet to be designated as non-cacheable. A bus monitor for write schemes (similar to that described for the write-through caches) is used to maintain data consistency. In the event of a match, slave caches invalidate their copy. A possible variation with better performance is for slave caches to update their copy rather than invalidate it.
Dieses Schema basiert auf der Annahme, daß sämtliche gemeinsam benutzten Variablen bekannt sind und auf Durch-Schreib- oder gemeinsam benutzten Seiten plaziert sind. Falls dies der Fall ist, kann verglichen dem Durch-Schreib-Schema eine bessere Leistung erreicht werden. Falls jedoch der Anteil an Gemeinsambenutzung hoch ist, werden die Nachteile der Durch-Schreib- Operationen der gemeinsamen Daten massiver, und die Leistung verschlechtert sich.This scheme is based on the assumption that all shared variables are known and placed on write-through or shared pages. If this is the case, better performance can be achieved compared to the write-through scheme. However, if the amount of sharing is high, the penalties of write-through operations of the shared data become more severe and performance degrades.
Außer den Zuweisungen für die gemeinsamen und exklusiven Variablen sollte die Bus-Überwachung für Schreib-Zugriffe aktiviert werden, und das Modb-Register sollte die Invalidierung von Wörtern spezifizieren. Falls die Slave-Speicher-Aktualisierungs-Variation gewünscht ist, sollte das Modb-Register entsprechend programmiert werden.In addition to the assignments for the shared and exclusive variables, the bus monitor for write accesses should be enabled and the Modb register should specify the invalidation of words. If the slave memory update variation is desired, the Modb register should be programmed accordingly.
Im folgenden werden die Eigentümerschafts-Schemata erläutert. Diese Schemata basieren auf Organisationen mit gemeinsam benutztem Speicher und gemeinsam benutztem Bus bei Bus-Überwachung zum Aufrechterhalten von Daten-Konsistenz. Das Grundprinzip der Eigentümerschafts-Schemata besteht darin, daß eine Variable sich im Eigentum nur eines einzigen Cache-Speichers befindet. Der Eigentümer-Cache-Speicher enthält die aktuellste Version der Variablen und ist verantwortlich für die Aufrechterhaltung ihrer Konsistenz. Falls eine Variable nicht Eigentum irgendeines Cache-Speichers ist, enthält der Speicher einen aktualisierten Wert. Bei sämtlichen Eigentümerschafts- Schemata kann sich eine Variable in einem von mehreren (maximal 5) Zuständen in einem Cache-Speicher befinden. Die fünf möglichen Zustände (Blockstatus), die von der bevorzugten Ausführungsform der ICU unterstützt werden, sind die folgenden:The following are the ownership schemes. These schemes are based on shared memory and shared bus organizations with bus monitoring to maintain data consistency. The basic principle of ownership schemes is that a variable is owned by only one cache. The owner cache contains the most recent version of the variable and is responsible for maintaining its consistency. If a variable is not owned by any cache, the cache contains an updated value. In all ownership schemes, a variable can be in one of several (maximum 5) states in a cache. The five possible states (block states) supported by the preferred embodiment of the ICU are as follows:
1. Exklusiv Durch-Schreiben1. Exclusive writing
2. Exklusiv Rückkopieren2. Exclusive copying back
3. Gemeinsam benutzt ummodifiziert3. Used together and modified
4. Gemeinsam benutzt modifiziert4. Shared modified
5. Nicht gültig5. Not valid
Jedes Eigentümerschafts-Schema wird von einer hardware-implementierten Zustandsmachine gesteuert, die die Zustandsübergänge steuert. Die verschiedenen Eigentümerschafts-Schemata erfordern unterschiedliche Operation für die Fälle: Übereinstimmungs-Lesen, Übereinstimmungs-Schreiben, Treffer-Schreiben und Fehlgänger-Schreiben. Somit sind verschiedene Ausmaße von Hardware-Unterstützung in den Cache-Speichern und generell in dem System erforderlich.Each ownership scheme is controlled by a hardware-implemented state machine that controls the state transitions. The different ownership schemes require different operations for the cases: match read, match write, hit write, and miss write. Thus, different levels of hardware support are required in the caches and in the system in general.
Keines der Eigentümerschafts-Schemata verlangt Software- Steuerung des Cache-Speichers. Sie erlauben höhere Leistung unter Inkaufnahme komplizierterer Hardware-Anforderungen.None of the ownership schemes require software control of the cache memory. They allow higher performance at the expense of more complicated hardware requirements.
Es existieren sechs Eigentümerschafts-Schemata, die dem Fachmann gut bekannt sind:There are six ownership schemes that are well known to the expert:
1. Write Once1. Write Once
2. Berkeley2. Berkeley
3. Illinois3. Illinois
4. Firefly4. Firefly
5. Dragon5. Dragon
6. Futurebus6. Futurebus
Ein weiteres Schema, das als Synapse-Schema bekannt ist, ist dem Write Once-Schema sehr ähnlich, basiert jedoch auf einem einzelnen Bit-Tag, das für jeden Cache-Speicher-Block in dem Haupt-Speicher vorhanden ist. Dieses Schema wird nicht direkt von der ICU unterstützt, jedoch kann es durch Verwendung der Write Once-Optionen und einiger externer Logik implementiert werden.Another scheme, known as the Synapse scheme, is very similar to the Write Once scheme, but is based on a single bit tag present for each cache block in main memory. This scheme is not directly supported by the ICU, but it can be implemented using the Write Once options and some external logic.
Obwohl die Einzelheiten der verschiedenen Eigentümerschafts- Schemata weithin bekannt und in Veröffentlichungen beschrieben sind, werden anschließend aus Gründen der Vollständigkeit und zur Erleichterung der Erklärung der Weise, in der diese Schemata von der ICU unterstützt werden, die Hauptmerkmale jedes Schemas erläutert.Although the details of the various ownership schemes are widely known and described in publications, for the sake of completeness and to facilitate the explanation of the manner in which these schemes are supported by the ICU, the main features of each scheme are explained below.
Sämtliche Eigentümerschafts-Schemata und möglicherweise andere Schemata, die auftreten können, werden von der ICU direkt unterstützt. Dies erfolgt durch Wählen der erforderlichen programmierbaren Optionen. Bei sämtlichen Eigentümerschafts- Schemata ist die Schreib-Funktion als flexibel programmiert. Die meisten der Schreib-Zugriffe können eine Rückkopier-Funktion verwenden. Die Bus-Überwachung wird sowohl für das Lesen als auch für das Schreiben aktiviert. Das Modb-Register mit den bereits definierten verschiedenartigen Steuer-Feldern kann zur Implementierung der verschiedenen Eigentümerschafts-Schemata verwendet werden.All ownership schemes and possibly other schemes that may occur are directly supported by the ICU. This is done by selecting the required programmable options. For all ownership schemes, the write function is programmed to be flexible. Most of the write accesses can use a copyback function. Bus monitoring is enabled for both reading and writing. The Modb register with the various control fields already defined can be used to implement the various ownership schemes.
Bei dem Write Once-Schema werden lediglich die folgenden Zustände definiert: exklusiv unmodifiziert, exklusiv modifiziert, gemeinsam benutzt und unmodifiziert, und ungültig. Der Zustand "gemeinsam benutzt und modifiziert" wird nicht verwendet. Das Grundprinzip dieses Schemas liegt darin, daß jeder Schreibvorgang, der bei ersten Mal in dem Cache-Speicher einen Treffer erzielt (Schreiben auf gemeinsame Seite) eine Durch- Schreib-Operation veranlaßt. Dann wird der Block als exklusiv modifiziert zugewiesen, und weitere Schreibvorgänge können nur in den Cache-Speicher erfolgen. Die Slave-Cache-Speicher invalidieren ihre eigene Kopie des Blocks. Ein Rückkopier-Schreibvorgang in einen exklusiven Block setzt das modifizierte Bit. Ein exklusiv modifizierter Block befindet sich im Eigentum des Cache-Speichers, und eine Daten-Intervention wird in dem Fall verwendet, daß ein weiterer Cache-Speicher versucht, ihn zu lesen. (Ferner wird der Speicher aktualisiert, und der Block wird dann als gemeinsam unmodifiziert ausgewiesen). Bei diesem Schema sollten sämtliche Prozessor-Zugriffe als gemeinsam benutzt ausgewiesen werden. Es ist anzumerken, daß ein exklusiver Blockstatus Vorrang vor der Gemeinsambenutzungs-Anzeige durch die ASTC-Eingangssignale hat.The write-once scheme defines only the following states: exclusive unmodified, exclusive modified, shared and unmodified, and invalid. The shared and modified state is not used. The basic principle of this scheme is that any write that hits the cache the first time (write to shared page) causes a write-through. Then the block is designated as exclusive modified, and further writes can only be made to the cache. The slave caches invalidate their own copy of the block. A copy-back write to an exclusive block sets the modified bit. An exclusive modified block is owned by the cache, and data intervention is used in the event that another cache attempts to read it. (Furthermore, the cache is updated, and the block is then designated as shared unmodified). In this scheme, all processor accesses should be indicated as shared. Note that an exclusive block state takes precedence over the shared indication by the ASTC inputs.
Bei dem Berkeley-Schema werden nur die folgenden Zustände definiert: exklusiv modifiziert, gemeinsam benutzt und unmodifiziert, gemeinsam benutzt und modifiziert, und ungültig. Der Zustand "exklusiv unmodifiziert" wird nicht benutzt. Ein Cache-Speicher, der den exklusiv modifizierten oder den gemeinsam benutzten und modifizierten Block enthält, ist dessen Eigentümer. Im Fall eines Fehlgängers beim Lesen wird der Block als gemeinsam benutzt und unmodifiziert ausgewiesen. Im Fall eines Schreib-Treffers bei einem Gemeinsambenutzungs- Block wird eine Broadcast-Schreib-Operation durchgeführt, und der Block wird als exklusiv modifiziert ausgewiesen. Andere Cache-Speicher invalidieren ihre Kopie des Blocks. Im Fall einer Lese-Übereinstimmung wird von dem Eigentümer eine Datenintervention durchgeführt. Für dieses Schema sollten sämtliche Prozessor-Zugriffe als gemeinsam ausgewiesen werden.In the Berkeley scheme, only the following states are defined: exclusive modified, shared and unmodified, shared and modified, and invalid. The exclusive unmodified state is not used. A cache that contains the exclusively modified or the shared and modified block owns it. In case of a read miss, the block is reported as shared and unmodified. In case of a write hit on a shared block, a broadcast write is performed and the block is reported as exclusively modified. Other caches invalidate their copy of the block. In case of a read match, a data intervention is issued by the owner. For this scheme, all processor accesses should be reported as shared.
Bei dem Illinois-Schema werden lediglich die folgenden Zustände definiert: exklusiv unmodifiziert, exklusiv modifiziert, gemeinsam benutzt und unmodifiziert, und ungültig. Der Zustand "gemeinsam benutzt und modifiziert" wird nicht verwendet. Ein Cache-Speicher, der den exklusiven modifizierten Block enthält, ist dessen Eigentümer. Im Fall eines Fehlgängers beim Lesen wird der Block in Abhängigkeit von dem * HIT-Eingangssignal als gemeinsam benutzt und unmodifiziert oder als exklusiv und unmodifiziert ausgewiesen. Im Fall eines Schreib- Treffers bei einem Gemeinsambenutzungs-Block wird eine Broadcast-Schreib-Operation durchgeführt, und der Block wird als exklusiv modifiziert ausgewiesen. Andere Cache-Speicher invalidieren ihre Kopie des Blocks. Im Fall einer Lese-Übereinstimmung wird von dem Eigentümer eine Datenintervention durchgeführt. Es ist anzumerken, daß die Dateninterventions-Operation sich von der ursprünglichen Definition bei dem Illinois- Schema unterscheidet, wobei jedoch die Endergebnisse gleich sind. Bei der ursprünglichen Definition versuchen sämtliche Cache-Speicher, die eine Kopie der verlangten Daten enthalten, zu intervenieren. Im vorliegenden Fall wird eine Daten-Intervention nur durchgeführt, falls der Block modifiziert ist. Falls der Block gemeinsam benutzt und unmodifiziert ist, werden die Daten aus dem Speicher zugeführt. Für dieses Schema ist die Prozessorzugriffs-Gemeinsambenutzungs-Bit-Zuordnung irrelevant, da das *HIT-Signal für diesen Zweck verwendet wird.In the Illinois scheme, only the following states are defined: exclusive unmodified, exclusive modified, shared and unmodified, and invalid. The shared and modified state is not used. A cache that contains the exclusive modified block owns it. In the case of a read miss, the block is declared shared and unmodified or exclusive and unmodified depending on the *HIT input. In the case of a write hit on a shared block, a broadcast write is performed and the block is declared exclusively modified. Other caches invalidate their copy of the block. In the case of a read match, a data intervention is performed by the owner. Note that the data intervention operation is different from the original definition in the Illinois scheme, but the end results are the same. In the original definition, all caches that contain a copy of the requested data attempt to intervene. In this case, data intervention is only performed if the block is modified. If the block is shared and unmodified, the data is supplied from memory. For this scheme, the processor access sharing bit mapping is irrelevant, since the *HIT signal is used for this purpose.
Bei dem Firefly-Schema werden lediglich die folgenden Zustände definiert: exklusiv unmodifiziert, exklusiv modifiziert, gemeinsam benutzt und unmodifiziert, und ungültig. Der Zustand "gemeinsam benutzt und modifiziert" wird nicht verwendet. Ein Cache-Speicher, der den exklusiven modifizierten Block enthält, ist dessen Eigentümer. Im Fall eines Fehlgängers beim Lesen wird der Block in Abhängigkeit von dem *HIT-Eingangs- signal als gemeinsam benutzt und unmodifiziert oder als exklusiv und unmodifiziert ausgewiesen. Im Fall eines Schreib- Treffers bei einem Gemeinsambenutzungs-Block wird eine Durch- Schreib-Operation durchgeführt, und der Block wird entsprechend dem *HIT-Eingangssignal als gemeinsam benutzt und unmodifiziert oder exklusiv modifiziert ausgewiesen. Im Fall einer Lese-Übereinstimmung führt der Eigentümer eine Daten-Intervention durch. Es ist anzumerken, daß die Dateninterventions- Operation sich von der ursprünglichen Definition bei dem Firefly-Schema unterscheidet, wobei jedoch die Endergebnisse gleich sind. Bei der ursprünglichen Definition versuchen sämtliche Cache-Speicher, die eine Kopie der verlangten Daten enthalten, zu intervenieren. Im vorliegenden Fall wird eine Daten-Intervention nur durchgeführt, falls der Block modifiziert ist. Falls der Block gemeinsam benutzt und unmodifiziert ist, werden die Daten aus dem Speicher zugeführt. Für dieses Schema ist die Prozessorzugriffs-Gemeinsambenutzungs-Bit-Zuordnung irrelevant, da das *HIT-Signal für diesen Zweck verwendet wird.In the Firefly scheme, only the following states are defined: exclusive unmodified, exclusive modified, shared and unmodified, and invalid. The shared and modified state is not used. A cache that contains the exclusive modified block is its owner. In case of a miss in the When read, the block is declared as shared and unmodified or exclusive and unmodified depending on the *HIT input. In the case of a write hit on a shared block, a write-through operation is performed and the block is declared as shared and unmodified or exclusively modified according to the *HIT input. In the case of a read match, the owner performs a data intervention. Note that the data intervention operation is different from the original definition in the Firefly scheme, but the end results are the same. In the original definition, all caches that contain a copy of the requested data attempt to intervene. In this case, data intervention is performed only if the block is modified. If the block is shared and unmodified, the data is supplied from memory. For this scheme, the processor access sharing bit mapping is irrelevant because the *HIT signal is used for this purpose.
Bei dem Dragon-Schema werden sämtliche der fünf Block-Status- Möglichkeiten verwendet. Im Fall eines Fehlgängers beim Lesen wird der Block in Abhängigkeit von dem *HIT-Eingangssignal als gemeinsam benutzt und unmodifiziert oder als exklusiv und unmodifiziert ausgewiesen. Im Fall eines Schreib-Treffers bei einem Gemeinsambenutzungs-Block wird eine Broadcast-Schreib- Operation durchgeführt (der Speicher wird nicht aktualisiert), und der Block wird entsprechend dem *HIT-Eingangssignal als gemeinsam benutzt und unmodifiziert oder exklusiv unmodifiziert ausgewiesen. Andere Cache-Speicher aktualisieren ihre Kopie des Blocks. Im Fall einer Lese-Übereinstimmung führt der Eigentümer eine Daten-Intervention durch. Für dieses Schema ist die Prozessorzugriffs-Gemeinsambenutzungs-Bit-Zuordnung irrelevant, da das *HIT-Signal für diesen Zweck verwendet wird.The Dragon scheme uses all five block state possibilities. In the case of a read miss, the block is declared as shared and unmodified or exclusive and unmodified depending on the *HIT input. In the case of a write hit on a shared block, a broadcast write is performed (memory is not updated), and the block is declared as shared and unmodified or exclusive and unmodified depending on the *HIT input. Other caches update their copy of the block. In the case of a read match, the owner performs data intervention. For this scheme, the processor access sharing bit mapping is irrelevant since the *HIT signal is used for that purpose.
Bei dem Futurebus-Schema werden sämtliche der fünf Block-Status-Möglichkeiten verwendet. Dieses Schema ist ein flexibles Schema, das (bei einigen leichten Modifikationen) die Implementierung sämtlicher anderer Eigentümerschafts-Schemata erlaubt. Die Cache-Speicher-Operation im Fall von Lese- und Schreib-Übereinstimmungen sowie von Schreib-Treffern und Leseund Schreib-Fehlgängern sind mit genügender Flexibilität für die Implementierung der verschiedenen Eigentümerschafts-Schemata definiert. Ferner ist die Verwendung des *HIT-Signals optional. Das Futurebus-Schema ist durch die Flexibilität der ICU voll unterstützt. Die ICU weist mehr Flexibilität auf, als das Futurebus-Schema verlangt, so daß einige der Einschränkungen, etwa die Speicheraktualisierung bei der Daten-Intervention und der Broadcast-Schreib-Unterstützung, entfallen. Für dieses Schema kann die Prozessorzugriffs-Gemeinsambenutzungs- Bit-Zuordnung entweder durch Software-Zuordnung oder mittels des *HIT-Signals durchgeführt werden.The Futurebus scheme uses all five block state possibilities. This scheme is a flexible scheme that allows (with some slight modifications) the implementation of any other ownership scheme. The cache operations in the case of read and write matches, as well as write hits and read and write misses, are defined with enough flexibility to implement the various ownership schemes. Furthermore, the use of the *HIT signal is optional. The Futurebus scheme is fully supported by the flexibility of the ICU. The ICU has more flexibility than the Futurebus scheme requires, so some of the limitations, such as memory refreshing during data intervention and broadcast write support, are eliminated. For this scheme, processor access sharing bit mapping can be done either by software mapping or by using the *HIT signal.
Abschließend soll der gemeinsam benutzte Speicher ohne Gemeinsambenutzungs-Bus-Organisationen erläutert werden. Zunächst ist anzumerken, daß die Bus-Überwachungs-Funktion nur bei einer Mehrprozessor-Organisation mit gemeinsam benutztem Bus zweckmäßig ist. Andere Gemeinsambenutzungs-Speicher-Organisationen, die mehrere Busse oder einen Kreuzbalken-Schalter enthalten, werden auch durch die ICU unterstützt. Diese Organisationen sind erforderlich, wenn der gemeinsam benutzte Bus einen Engpaß in dem System bildet. In diesem Fall ermöglichen sie eine größere Anzahl von Prozessoren und bessere Leistung.Finally, shared memory without shared bus organizations will be discussed. First, it should be noted that the bus monitoring function is only useful in a multiprocessor organization with a shared bus. Other shared memory organizations that include multiple buses or a crossbar switch are also supported by the ICU. These organizations are required when the shared bus is a bottleneck in the system. In this case, they allow for a larger number of processors and better performance.
Die Grund-Unterstützung für diese Organisationen wird durch die Speicher-Bus-Cache-Instruktionen gebildet. Eine detaillierte Beschreibung der Speicher-Bus-Cache-Instruktionen ist bereits erfolgt. Es ist eine externe Steuer-Logik erforderlich, um die Speicher-Zugriffe zu überwachen und die Cache- Speicher-Instruktionen an die korrekte ICU zu leiten. Diese Logik kann entsprechend der speziellen System-Organisation konzipiert sein. Sie sollte in der Lage sein, sämtliche Hauptspeicherzugriffe zu überwachen. (Diese Funktion kann in der Speichersteuereinrichtung untergebracht werden.) Dann kann entsprechend der globalen Information eine Speicherbus-Cache- Instruktion zu dem korrekten Cache-Speicher geleitet werden. Die Details einer solchen Implementierung sind systemabhangig und nicht Teil der Erfindung, und es sind viele Variationen möglich. Zur Veranschaulichung der ICU-Unterstützung für diese Organisationen werden nun einige grundlegende Funktionen beschrieben.The basic support for these organizations is provided by the memory bus cache instructions. A detailed description of the memory bus cache instructions has already been given. An external control logic is required to monitor the memory accesses and to route the cache memory instructions to the correct ICU. This logic can be customized according to the specific system organization. It should be able to monitor all main memory accesses. (This function can be placed in the memory controller.) Then, according to the global information, a memory bus cache instruction can be routed to the correct cache memory. The details of such an implementation are system dependent and not part of the invention, and many variations are possible. To illustrate ICU support for these organizations, some basic functions are now described.
Wenn ein Cache-Speicher einen Block aus dem Speicher zu lesen versucht, kann die Steuer-Logik die Blockstatus-Schreib-Instruktion verwenden, um den Block als gemeinsam oder exklusiv zu bezeichnen. Falls die aktualisierte Version der erforderlichen Variablen nicht in dem Speicher, sondern in einem der Cache-Speicher vorhanden ist, können zum Empfang der aktualisierten Version "Wort übermitteln", "Wort übermitteln, falls modifiziert" oder "Block übermitteln, falls modifiziert" verwendet werden.When a cache attempts to read a block from memory, the control logic can use the block state write instruction to designate the block as shared or exclusive. If the updated version of the required variable is not in memory but in one of the caches, "Commit Word," "Commit Word If Modified," or "Commit Block If Modified" can be used to receive the updated version.
Wenn eine gemeinsame Variable, die in einigen der Cache-Speicher vorhanden ist, von einem der Prozessoren geschrieben wird, kann die ICU derart programmiert werden, daß sie die Schreib-Information entweder durch-schreibt oder broadcastschreibt. Eine Wort-invalidieren-, Block-invalidieren- oder In-Cache-Speicher-Schreiben-Instruktion kann verwendet werden, um die Kopie der anderen Cache-Speicher zu invalidieren oder zu aktualisieren.When a shared variable present in some of the caches is written by one of the processors, the ICU can be programmed to either write through or broadcast the write information. An invalidate word, invalidate block, or write to cache instruction can be used to invalidate or update the copy of the other caches.
Der Blockstatus jedes Cache-Speicher-Blocks kann jedes Mal gelesen oder geschrieben werden, wenn es erforderlich ist, und zwar mittels der Blockstatus-Lese- und Blockstatus-Schreib- Instruktion. Dies kann von der Steuer-Logik durchgeführt werden, um Information über Cache-Speicher-Inhalte zu erhalten oder den Block-Status zu bestimmen.The block state of each cache block can be read or written whenever required using the read block state and write block state instructions. This can be done by the control logic to obtain information about cache contents or to determine the block state.
Einige der programmierbaren Optionen können auch für diese Organisationen verwendet werden, um die ICU-Operation im Fall eines gemeinsamen Treffers, eines Lese- oder Schreib-Fehlgängers zu spezifizieren. Die Bus-Überwachung kann verwendet werden, falls die spezielle Logik zur Durchführung von Leseund Schreib-Operationen auf dem ICU-Speicherbus, statt von Speicherbus-Cache-Instruktionen, vorgesehen ist.Some of the programmable options can also be used for these organizations to specify the ICU operation in the event of a common hit, read or write miss. Bus monitoring can be used if special logic is provided to perform read and write operations on the ICU memory bus, rather than memory bus cache instructions.
Bei einer Mehr-Bus-Organisation kann eine Kombination aus der Bus-Überwachungs- und der Speicherbus-Cache-Speicher-Instruktion verwendet werden. Die Bus-Überwachung kann die Daten- Konsistenz der Cache-Speicher, die den gleichen Bus gemeinsam benutzen, abdecken. Eine spezielle Logik ist erforderlich, um die relevanten Zugriffe zu transferieren oder eine Speicherbus-Instruktion an die entsprechenden Cache-Speicher auszugeben, um eine Inter-Bus-Datenkonsistenz zu erzielen, d.h. eine Operation auf einem Bus, die die Daten in einem Cache- Speicher, der auf einem anderen Bus plaziert ist, beeinflußt. Das Design dieser speziellen Logik ist Teil der Fertigkeiten des Fachmanns und liegt außerhalb des Umfangs der Erfindung.In a multiple-bus organization, a combination of the bus monitor and the memory bus cache instruction may be used. The bus monitor may cover the data consistency of the caches sharing the same bus. Special logic is required to transfer the relevant accesses or issue a memory bus instruction to the corresponding caches to achieve inter-bus data consistency, i.e., an operation on one bus that affects the data in a cache located on another bus. The design of this special logic is within the skill of the person skilled in the art and is outside the scope of the invention.
Zur Vervollständigung der Beschreibung der neuartigen ICU wird die Verriegelungsfunktion detailliert beschrieben. In einem mehr generellen Sinn als im Kontext der ICU ist dem Fachmann bekannt, daß Verriegelungsvariablen für Semaphoren und andere Synchronisationsvariablen in einer Mehrprozessor- oder Mehrzweck-Umgebung verwendet werden. Synchronisationsvariablen können auch als Schutz-Schlüssel für einen gemeinsamen Speicherbereich verwendet werden. Die Zugriffe auf die Verriegelungsvariablen sollten synchronisiert sein. Zu jedem gegebenen Zeitpunkt darf nur ein einziger Prozessor auf Verriegelungsvariablen zugreifen. Jedes Lesen von Verriegelungsvariablen sollte zum Rückübermitteln des aktuellsten Wertes der Variablen führen.To complete the description of the novel ICU, the locking function is described in detail. In a more general sense than in the context of the ICU, it is known to those skilled in the art that locking variables are used for semaphores and other synchronization variables in a multiprocessor or general-purpose environment. Synchronization variables can also be used as protection keys for a shared memory area. Accesses to the locking variables should be synchronized. At any given time, only a single processor may access locking variables. Each reading of locking variables should result in the return of the most current value of the variable.
Zur Unterstützung der Verriegelungsvariablen-Zugriffe sollte der Prozessor irgendeinen Typ einer atomischen Lese-Modifizier-Schreib-Operation enthalten. Dies erlaubt das in atomischer Weise erfolgende Überprüfen und Beeinflussen einer Variablen mittels eines Prozessors, während kein anderer Prozessor sich einmischen kann. In einem System, das Cache-Speicher enthält, verursachen die Verriegelungsvariablen ein spezielles Problem, da ihr Zugriff unabhängig von dem Cache-Speicher synchronisiert sein sollte.To support locking variable accesses, the processor should include some type of atomic read-modify-write operation. This allows a variable to be checked and manipulated atomically by one processor, while no other processor can interfere. In a system that includes cache memory, locking variables cause a special problem because their access should be synchronized independently of the cache memory.
Eine einfache Lösung dieses Problems besteht darin, sämtliche Verriegelungsvariablen als nicht cache-speicherbar auszuweisen. In diesem Fall ist ein Cache-Speichern der Verriegelungsvariablen nicht erlaubt, und sämtliche Verriegelungsvariablen- Zugriffe werden an den Speicher übermittelt. Dieses Verfahren wird bei den meisten der bekannten Cache-Speicher-Systeme verwendet. Der Hauptnachteil liegt in der niedrigeren Leistung und der verstärkten Bus-Beanspruchung, die durch den Verriegelungsvariablen-Zugriff auf den Speicher verursacht wird. Wenn die Anzahl der Verriegelungsvariablen-Zugriffe ansteigt, kann die Beeinträchtigung der Leistung beträchtlich sein.A simple solution to this problem is to designate all locking variables as non-cacheable. In this case, caching of locking variables is not allowed and all locking variable accesses are forwarded to memory. This approach is used in most of the known cache memory systems. The main disadvantage is the lower performance and increased bus overhead caused by locking variable accesses to memory. As the number of locking variable accesses increases, the performance impact can be significant.
Die neuartige ICU und die im folgenden beschriebene Verriegelungsfunktion, die für sich genommen neuartig ist, erlauben die Cache-Speicherung von Verriegelungsvariablen. Dadurch können eine bessere Leistung und eine geringere Bus-Beanspruchung erzielt werden. Die meisten der Verriegelungsvariablen- Zugriffe sind schneller und erscheinen nicht auf dem Speicherbus, da der Zugriff nur in dem Cache-Speicher erfolgt. Das Schema ist einfach und kann auf der Einzelchip-ICU implementiert werden.The novel ICU and the locking function described below, which is novel in itself, allow locking variables to be cached. This allows better performance and lower bus usage. Most of the locking variable accesses are faster and do not appear on the memory bus because the access occurs only in the cache memory. The scheme is simple and can be implemented on the single-chip ICU.
Es existieren verschiedene Ansätze zur Gewährleistung der im Zusammenhang mit Verriegelungsvariablen erfolgenden Synchronisation. Der Prozessor, der bei der als Beispiel angeführten Ausführungsform der Erfindung verwendet wird, enthält die für eine effiziente Verriegelung erforderlichen Grundoperationen. Diese sind in der hierin einbezogenen mitanhängigen Anmeldung, die sich mit dem Prozessor befaßt, erläutert, und es handelt sich dabei insbesondere um die LOADSET-, LOADL- und STOREL- Instruktionen, das LK-Bit in dem Register für den aktuellen Prozessorstatus und das *LOCK-Ausgangssignal. Die ICU implementiert zwei Schemata zur Handhabung von Verriegelungsvariablen. Das gewünschte Schema kann gewählt werden, indem das Cache-Speicher-Verriegelungs-Aktivierungs (CILE)-Bit des Modb- Registers programmiert wird.There are various approaches to ensuring synchronization associated with locking variables. The processor used in the exemplary embodiment of the invention contains the These are explained in the copending application dealing with the processor, which is incorporated herein, and are in particular the LOADSET, LOADL and STOREL instructions, the LK bit in the current processor status register and the *LOCK output signal. The ICU implements two schemes for handling locking variables. The desired scheme can be selected by programming the cache lock enable (CILE) bit of the Modb register.
Wenn sich das CILE-Bit im LOW-Zustand befindet, werden die Cache-Speicher-Verriegelungs-Variablen deaktiviert. Verriegelungsvariablen (*LOCK-Bit geltend gemacht) werden als nicht cache-speicherbare Zugriffe behandelt. Der Cache-Speicher wird nicht nach einem Treffer abgesucht, und der Zugriff wird mit der Verriegelungs-Angabe (*MLOCK geltend gemacht) an den Speicherbus übermittelt. Bei dieser Option untersteht die Handhabung der Verriegelungsvariablen der Kontrolle durch den Speicher. Der Speicher muß jeden Zugriff auf die Verriegelungsvariable deaktivieren, während das *MLOCK-Signal geltend gemacht wird. Eine LOADSET-Instruktion kann verwendet werden, um die Verriegelungsvariable in dem Speicher zu testen und zu setzen.When the CILE bit is LOW, the cache lock variables are disabled. Lock variables (*LOCK bit asserted) are treated as non- cacheable accesses. The cache is not checked for a hit, and the access is communicated to the memory bus with the lock indication (*MLOCK asserted). With this option, the handling of the lock variables is under the control of the memory. The memory must disable any access to the lock variable while the *MLOCK signal is asserted. A LOADSET instruction can be used to test and set the lock variable in the memory.
Wenn sich das CILE-BIT im HIGH-Zustand befindet, wird die Funktion zum Cache-Speichern von Verriegelungsvariablen aktiviert. Dies ist eine spezielle Funktion, die in die ICU eingebaut ist, um eine effizientere Handhabung von Verriegelungsvariablen zu ermöglichen. Sie ist mit dem Prozessor kompatibel und macht sich die verschiedenen Verriegelungs-Grundfunktionen des Prozessors zunutze.When the CILE BIT is HIGH, the locking variable caching feature is enabled. This is a special feature built into the ICU to allow more efficient handling of locking variables. It is compatible with the processor and takes advantage of the various locking primitives of the processor.
Die verriegelten Lese- und Schreib-Operationen (*LOCK wird geltend gemacht) werden in einer speziellen Weise behandelt. Ein verriegelter Lesevorgang (der von dem Prozessor für die LOADL- und LOADSET-Instruktionen erzeugt wird) wird als Fehlgänger behandelt, falls er nicht in einem gemeinsamen Block einen Treffer erzielt. Auf dem Speicheradressenbus wird eine Neulade-Operation gestartet, wobei *MLOCK geltend gemacht wird. Diese Lese-Daten werden in dem Cache-Speicher gespeichert, und der Block wird als gemeinsam ausgewiesen. Bei einem gemeinsamen Block-Treffer werden die Daten dem Cache-Speicher ohne Speicheradressenbus-Zugriff zugeführt.The locked read and write operations (*LOCK is asserted) are handled in a special way. A locked read operation (which is used by the processor for the LOADL and LOADSET instructions) is treated as a miss if it does not hit in a shared block. A reload operation is started on the memory address bus, asserting *MLOCK. This read data is stored in the cache and the block is designated as shared. On a shared block hit, the data is fed into the cache without memory address bus access.
Eine verriegelte Schreib-Operation wird für die Prozessor- STOREL-Instruktion anders behandelt als das Schreiben der LOADSET-Instruktionen. Entsprechend dem Zustand des *LOCK- Eingangssignals in dem dem Schreib-Zyklus vorausgehenden Zyklus kann die ICU zwischen zwei Typen von Verriegelungs- Schreibvorgängen unterscheiden. Falls das *LOCK-Bit gesetzt wurde, bedeutet dies, daß der Verriegelungs-Schreibvorgang das Schreiben einer LOADSET-Instruktion ist. Falls es nicht gesetzt wurde, handelt es sich um das Schreiben einer STOREL- Instruktion.A locked write operation is treated differently for the processor STOREL instruction than the LOADSET instruction write. According to the state of the *LOCK input signal in the cycle preceding the write cycle, the ICU can distinguish between two types of locked writes. If the *LOCK bit is set, it means that the locked write is the LOADSET instruction write. If it is not set, it is the STOREL instruction write.
Im Fall eines verriegelten STOREL-Schreibvorgangs initiiert die ICU eine Durch-Schreib-Operation in den Speicher. Im Fall eines Verriegelungs-Treffers wird der Block invalidiert.In case of a locked STOREL write, the ICU initiates a write-through to memory. In case of a lock hit, the block is invalidated.
Im Fall eines verriegelten LOADSET-Schreibvorgangs werden die Daten in den Cache-Speicher geschrieben. Nur falls der Lese- Zugriff der LOADSET-Instruktion einen Fehlgänger erzeugte, werden die Daten auch in den Speicher geschrieben. Dies gewährleistet, daß der Speicher nur beim ersten Mal beschrieben wird, bei dem die verriegelte Variable gelesen wird.In the case of a locked LOADSET write, the data is written to the cache memory. Only if the LOADSET instruction's read access generated a miss will the data be written to memory. This ensures that memory is only written to the first time the locked variable is read.
In beiden Fällen wird das *MLOCK-Ausgangssignal während der Speicher-Schreib-Operation geltend gemacht. Sämtliche anderen Cache-Speicher invalidieren ihre eigene Kopie, wenn ein anderer Master einen Schreibvorgang einen Schreibvorgang bei Geltendmachung von *MLOCK durchführt.In both cases, the *MLOCK output is asserted during the memory write operation. All other caches invalidate their own copy when another master performs a write while *MLOCK is asserted.
Es ist eine spezielle Art vorgesehen, in der der Prozessor auf Verriegelungsvariablen zugreifen sollte, falls die Verriegelungs-Funktion aktiviert ist. (Variationen könnten möglich sein.) Die LOADSET-Instruktion wird verwendet, um eine Verriegelungsvariable zu testen und zu setzen. Falls der Wert der Variablen 0 ist, ist sie nicht aktiv und kann von dem Prozessor (oder dem Prozeß) verwendet werden. Es ist anzumerken, daß als Ergebnis der LOADSET-Instruktion ein Unterblock in den Cache-Speicher geladen wird. Dieser Unterblock enthält die Verriegelungsvariable (Wort) und möglicherweise einige andere Wörter, falls die Unterblock-Bemessung größer als eins ist. Der Benutzer kann diese Tatsache ausnutzen und relevante Information in den gleichen Unterblock der verriegelten Variablen plazieren.There is a special way in which the processor should access locking variables if the locking feature is enabled. (Variations may be possible.) The LOADSET instruction is used to test and set a locking variable. If the value of the variable is 0, it is not active and can be used by the processor (or process). Note that as a result of the LOADSET instruction, a sub-block is loaded into the cache. This sub-block contains the locking variable (word) and possibly some other words if the sub-block size is greater than one. The user can take advantage of this fact and place relevant information in the same sub-block of the locked variables.
Falls der Wert der Variablen 1 ist, ist sie aktiv, und sie (oder der Bereich, den sie schützt) kann nicht verwendet werden. Das Programm kann entweder ein Besetzt-Warte-Schema verwenden und das Testen fortsetzen, bis die Variable frei ist, oder andere Operationen (oder Aufgaben) durchführen und die Variable später prüfen. Das Testen der Variablen wird unter Verwendung der LOADSET-Instruktion ausgeführt.If the value of the variable is 1, it is active and it (or the area it protects) cannot be used. The program can either use a busy-wait scheme and continue testing until the variable is free, or perform other operations (or tasks) and test the variable later. Testing of the variable is performed using the LOADSET instruction.
Die Master-ICU benutzt den Speicheradressenbus nur für die erste LOADSET-Instruktion. Die Variable wird aus dem Speicher gelesen und in dem Cache-Speicher mit dem Gemeinsambenutzungs- Blockstatus plaziert. Der erste Schreibinhalt von LOADSET wird auch in den Speicher geschrieben. Die nächsten LOADSET-Instruktionen erzielen (in den meisten Fällen) Treffer in dem Cache-Speicher und benutzen den Speicheradressenbus nicht. Im Fall einer Übereinstimmung bei einem Schreibvorgang bei Geltung von *MLOCK invalidieren andere Cache-Speicher ihre eigene Kopie.The master ICU uses the memory address bus only for the first LOADSET instruction. The variable is read from memory and placed in the cache with the shared block state. The first LOADSET write is also written to memory. The next LOADSET instructions (in most cases) hit the cache and do not use the memory address bus. In the event of a match on a write when *MLOCK is in effect, other caches invalidate their own copy.
Die STOREL-Instruktion wird für die Freigabe einer verriegelten Variablen verwendet. Auf die STOREL-Instruktion hin wird von dem Master-Cache-Speicher ein Schreib-Zugriff mit geltend gemachtem *MLOCK auf dem Speicheradressenbus initiiert, und die Variable wird in sämtlichen anderen Cache-Speichern invalidiert. Falls sich die Variable noch in dem Master-Cache- Speicher befindet, wird sie auch invalidiert. Dies erfolgt, um zu gewährleisten, daß der nächste Zugriff des Prozessors auf diese Variable ein Fehlgänger wird. Die Variable wird aus dem Speicher ausgelesen, um den aktuellsten Wert zu erhalten. Es ist anzumerken, daß während der Master-Cache-Speicher eine Verriegelungsvariable benutzt, in dem Fall, daß ein anderer Prozessor die gleiche Variable beim ersten Mal (unter Verwendung von LOADSET) zu testen versucht, das Schreiben von LOADSET auf dem Speicherbus durchgeführt wird und die Variablen in sämtlichen anderen Cache-Speichern (einschließlich des Master- Cache-Speichers) invalidiert werden.The STOREL instruction is used to release a locked variable. The STOREL instruction is followed by from the master cache, a write access with *MLOCK asserted is initiated on the memory address bus, and the variable is invalidated in all other caches. If the variable is still in the master cache, it is also invalidated. This is done to ensure that the next time the processor accesses that variable, it is read from memory to obtain the most current value. Note that while the master cache uses a locking variable, if another processor attempts to test the same variable for the first time (using LOADSET), the LOADSET write is performed on the memory bus and the variables in all other caches (including the master cache) are invalidated.
Sämtliche anderen Prozessoren, die auf die Variable gewartet haben, müssen auf den Speicher zugreifen, wenn sie diese als nächstes testen. Nur der eine Cache-Speicher, der in der Bus- Einstufung gewinnt, erhält die freie verriegelte Variable.All other processors that have been waiting for the variable must access the memory when they next test it. Only the one cache that wins the bus ranking gets the free locked variable.
Der Hauptvorteil der Verwendung der Verriegelungs-Funktion liegt in der besseren Leistung und der geringeren Bus-Beanspruchung. Bei einem Mehrprozessor-System mit vielen Verriegelungsvariablen-Zugriffen kann durch Verwendung der Verriegelungs-Funktion eine beträchliche Leistungsverbesserung erreicht werden. Ein weiterer Vorteil besteht darin, daß die Speichersteuereinrichtung Verriegelungs-Zugriffe als reguläre Zugriffe behandeln kann.The main advantage of using the locking function is better performance and less bus overhead. In a multiprocessor system with many locking variable accesses, a significant performance improvement can be achieved by using the locking function. Another advantage is that the memory controller can treat locking accesses as regular accesses.
Ferner ist zu beachten, daß die Verriegelungs-Funktion auch in anderen Geräten als dem RISC/SIP-Prozessor, der in der hier herangezogenen relevanten mitanhängigen Anmeldung beschrieben ist, implementiert werden kann.It should also be noted that the locking function can also be implemented in devices other than the RISC/SIP processor described in the relevant copending application cited here.
Die vorliegende Beschreibung umfaßt die neuartige ICU an sich, zusammen mit der neuartigen Organisation der ICU für ein flexibles Design für ein Cache-Speicher-System, eine neuartige Cache-Speicher-Verriegelungs-Funktion, ein neuartiges und flexibles Mehrprozessor-Unterstützungsschema und ein Vorladeschema für integrierte Cache-Speicher. Die Einzelheiten dazu sind anhand der Funktion, der internen Register, der Eingänge und Ausgänge, der Abtast-Instruktions-Sätze, der Datenformate, der Programmierbarkeit, der Typen von unterstützten Systemen und anderen Aspekten der neuartigen ICU erläutert worden.The present description covers the novel ICU itself, together with the novel organization of the ICU for a flexible design for a cache memory system, a novel cache memory locking function, a novel and flexible multiprocessor support scheme, and a preload scheme for integrated cache memories. The details of these have been explained in terms of the function, internal registers, inputs and outputs, scan instruction sets, data formats, programmability, types of systems supported and other aspects of the novel ICU.
Claims (30)
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US07/146,009 US5025366A (en) | 1988-01-20 | 1988-01-20 | Organization of an integrated cache unit for flexible usage in cache system design |
Publications (2)
Publication Number | Publication Date |
---|---|
DE68926059D1 DE68926059D1 (en) | 1996-05-02 |
DE68926059T2 true DE68926059T2 (en) | 1996-10-17 |
Family
ID=22515521
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE68926059T Expired - Lifetime DE68926059T2 (en) | 1988-01-20 | 1989-01-18 | Organization of an integrated cache unit for flexible use in the design of cache systems |
Country Status (5)
Country | Link |
---|---|
US (1) | US5025366A (en) |
EP (1) | EP0325420B1 (en) |
JP (1) | JP3218317B2 (en) |
AT (1) | ATE136136T1 (en) |
DE (1) | DE68926059T2 (en) |
Families Citing this family (139)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5513353A (en) * | 1987-09-30 | 1996-04-30 | Kabushiki Kaisha Toshiba | Cache control system which permanently inhibits local but not global parameter data writes to main memory |
US5761413A (en) * | 1987-12-22 | 1998-06-02 | Sun Microsystems, Inc. | Fault containment system for multiprocessor with shared memory |
US5282201A (en) * | 1987-12-22 | 1994-01-25 | Kendall Square Research Corporation | Dynamic packet routing network |
US5055999A (en) | 1987-12-22 | 1991-10-08 | Kendall Square Research Corporation | Multiprocessor digital data processing system |
US5822578A (en) * | 1987-12-22 | 1998-10-13 | Sun Microsystems, Inc. | System for inserting instructions into processor instruction stream in order to perform interrupt processing |
US5251308A (en) * | 1987-12-22 | 1993-10-05 | Kendall Square Research Corporation | Shared memory multiprocessor with data hiding and post-store |
ATE109910T1 (en) * | 1988-01-20 | 1994-08-15 | Advanced Micro Devices Inc | ORGANIZATION OF AN INTEGRATED CACHE FOR FLEXIBLE APPLICATION TO SUPPORT MULTIPROCESSOR OPERATIONS. |
DE68926466T2 (en) * | 1988-01-20 | 1996-10-17 | Advanced Micro Devices Inc | Integrated cache memory unit |
US5136691A (en) * | 1988-01-20 | 1992-08-04 | Advanced Micro Devices, Inc. | Methods and apparatus for caching interlock variables in an integrated cache memory |
JPH01217530A (en) * | 1988-02-26 | 1989-08-31 | Hitachi Ltd | Cache memory |
JP2818415B2 (en) * | 1988-05-18 | 1998-10-30 | 日本電気株式会社 | Buffer storage device |
GB8814077D0 (en) * | 1988-06-14 | 1988-07-20 | Int Computers Ltd | Data memory system |
JP2776841B2 (en) * | 1988-09-28 | 1998-07-16 | 株式会社日立製作所 | Disk access control method in disk control device |
US5193166A (en) * | 1989-04-21 | 1993-03-09 | Bell-Northern Research Ltd. | Cache-memory architecture comprising a single address tag for each cache memory |
JPH0348951A (en) * | 1989-07-18 | 1991-03-01 | Fujitsu Ltd | Address monitor device |
JP2509344B2 (en) * | 1989-09-19 | 1996-06-19 | 富士通株式会社 | Data processing device |
US5265227A (en) * | 1989-11-14 | 1993-11-23 | Intel Corporation | Parallel protection checking in an address translation look-aside buffer |
JP2826857B2 (en) * | 1989-12-13 | 1998-11-18 | 株式会社日立製作所 | Cache control method and control device |
JPH03188546A (en) * | 1989-12-18 | 1991-08-16 | Fujitsu Ltd | Bus interface control system |
DE69025302T2 (en) * | 1989-12-22 | 1996-10-02 | Digital Equipment Corp | Heavy duty grid buffer and cache array |
JP2820752B2 (en) * | 1990-01-19 | 1998-11-05 | 日本電信電話株式会社 | Cache Memory Coincidence Control Method in Tightly Coupled Multiprocessor System |
EP0440243A3 (en) * | 1990-01-31 | 1993-12-15 | Nec Corp | Memory controller for sub-memory unit such as disk drives |
US5226143A (en) * | 1990-03-14 | 1993-07-06 | International Business Machines Corporation | Multiprocessor system includes operating system for notifying only those cache managers who are holders of shared locks on a designated page by global lock manager |
DE69129872T2 (en) * | 1990-03-27 | 1999-03-04 | Philips Electronics N.V., Eindhoven | Data processing system with a performance-enhancing instruction cache |
US5197139A (en) * | 1990-04-05 | 1993-03-23 | International Business Machines Corporation | Cache management for multi-processor systems utilizing bulk cross-invalidate |
US5261067A (en) * | 1990-04-17 | 1993-11-09 | North American Philips Corp. | Method and apparatus for providing synchronized data cache operation for processors in a parallel processing system |
US5611070A (en) * | 1990-05-10 | 1997-03-11 | Heidelberger; Philip | Methods and apparatus for performing a write/load cache protocol |
US5193167A (en) * | 1990-06-29 | 1993-03-09 | Digital Equipment Corporation | Ensuring data integrity by locked-load and conditional-store operations in a multiprocessor system |
US5276833A (en) * | 1990-07-02 | 1994-01-04 | Chips And Technologies, Inc. | Data cache management system with test mode using index registers and CAS disable and posted write disable |
US5835945A (en) * | 1990-08-06 | 1998-11-10 | Ncr Corporation | Memory system with write buffer, prefetch and internal caches |
US5530941A (en) * | 1990-08-06 | 1996-06-25 | Ncr Corporation | System and method for prefetching data from a main computer memory into a cache memory |
GB9019023D0 (en) * | 1990-08-31 | 1990-10-17 | Ncr Co | Work station having multiplexing and burst mode capabilities |
US5295259A (en) * | 1991-02-05 | 1994-03-15 | Advanced Micro Devices, Inc. | Data cache and method for handling memory errors during copy-back |
US5293603A (en) * | 1991-06-04 | 1994-03-08 | Intel Corporation | Cache subsystem for microprocessor based computer system with synchronous and asynchronous data path |
US5228134A (en) * | 1991-06-04 | 1993-07-13 | Intel Corporation | Cache memory integrated circuit for use with a synchronous central processor bus and an asynchronous memory bus |
US5193180A (en) * | 1991-06-21 | 1993-03-09 | Pure Software Inc. | System for modifying relocatable object code files to monitor accesses to dynamically allocated memory |
US5396604A (en) * | 1991-07-12 | 1995-03-07 | Hewlett-Packard Company | System and method for reducing the penalty associated with data cache misses |
GB9118312D0 (en) * | 1991-08-24 | 1991-10-09 | Motorola Inc | Real time cache implemented by dual purpose on-chip memory |
CA2078310A1 (en) * | 1991-09-20 | 1993-03-21 | Mark A. Kaufman | Digital processor with distributed memory system |
CA2078312A1 (en) | 1991-09-20 | 1993-03-21 | Mark A. Kaufman | Digital data processor with improved paging |
US5313647A (en) * | 1991-09-20 | 1994-05-17 | Kendall Square Research Corporation | Digital data processor with improved checkpointing and forking |
GB2260429B (en) * | 1991-10-11 | 1995-05-24 | Intel Corp | Versatile cache memory |
US5301298A (en) * | 1991-10-11 | 1994-04-05 | Intel Corporation | Processor for multiple cache coherent protocols |
US5802548A (en) * | 1991-10-25 | 1998-09-01 | Chips And Technologies, Inc. | Software programmable edge delay for SRAM write enable signals on dual purpose cache controllers |
US5875464A (en) * | 1991-12-10 | 1999-02-23 | International Business Machines Corporation | Computer system with private and shared partitions in cache |
US5367653A (en) * | 1991-12-26 | 1994-11-22 | International Business Machines Corporation | Reconfigurable multi-way associative cache memory |
US5423016A (en) * | 1992-02-24 | 1995-06-06 | Unisys Corporation | Block buffer for instruction/operand caches |
US5555382A (en) * | 1992-04-24 | 1996-09-10 | Digital Equipment Corporation | Intelligent snoopy bus arbiter |
DE69323790T2 (en) * | 1992-04-29 | 1999-10-07 | Sun Microsystems, Inc. | Method and apparatus for multiple pending operations in a cache coherent multiprocessor system |
US5809531A (en) * | 1992-09-21 | 1998-09-15 | Intel Corporation | Computer system for executing programs using an internal cache without accessing external RAM |
GB2271202B (en) * | 1992-10-01 | 1995-12-13 | Digital Equipment Int | Dynamic non-coherent cache memory resizing mechanism |
EP0597729A1 (en) * | 1992-11-13 | 1994-05-18 | Cyrix Corporation | Method of allowing write-back caching in a write-through environment |
JPH07168763A (en) * | 1992-11-13 | 1995-07-04 | Cyrix Corp | Coherency of write-back cache in system of write-through cache design |
US6356989B1 (en) * | 1992-12-21 | 2002-03-12 | Intel Corporation | Translation lookaside buffer (TLB) arrangement wherein the TLB contents retained for a task as swapped out and reloaded when a task is rescheduled |
US5465342A (en) * | 1992-12-22 | 1995-11-07 | International Business Machines Corporation | Dynamically adaptive set associativity for cache memories |
US5455924A (en) * | 1993-02-09 | 1995-10-03 | Intel Corporation | Apparatus and method for partial execution blocking of instructions following a data cache miss |
US5809525A (en) * | 1993-09-17 | 1998-09-15 | International Business Machines Corporation | Multi-level computer cache system providing plural cache controllers associated with memory address ranges and having cache directories |
GB2282248B (en) * | 1993-09-27 | 1997-10-15 | Advanced Risc Mach Ltd | Data memory |
US5835934A (en) * | 1993-10-12 | 1998-11-10 | Texas Instruments Incorporated | Method and apparatus of low power cache operation with a tag hit enablement |
GB2284911A (en) * | 1993-12-16 | 1995-06-21 | Plessey Semiconductors Ltd | Flexible lock-down cache. |
US5832534A (en) * | 1994-01-04 | 1998-11-03 | Intel Corporation | Method and apparatus for maintaining cache coherency using a single controller for multiple cache memories |
KR970010368B1 (en) * | 1994-01-18 | 1997-06-25 | 삼성전자 주식회사 | Cache line replace apparatus and method |
US5603007A (en) * | 1994-03-14 | 1997-02-11 | Apple Computer, Inc. | Methods and apparatus for controlling back-to-back burst reads in a cache system |
US5577226A (en) * | 1994-05-06 | 1996-11-19 | Eec Systems, Inc. | Method and system for coherently caching I/O devices across a network |
US5539895A (en) * | 1994-05-12 | 1996-07-23 | International Business Machines Corporation | Hierarchical computer cache system |
US5604889A (en) * | 1994-06-15 | 1997-02-18 | Texas Instruments Incorporated | Memory management system for checkpointed logic simulator with increased locality of data |
US5613125A (en) * | 1994-06-17 | 1997-03-18 | Motorola, Inc. | Method and system for selectively defining hardware parameters in an executable operating system program |
US5692152A (en) * | 1994-06-29 | 1997-11-25 | Exponential Technology, Inc. | Master-slave cache system with de-coupled data and tag pipelines and loop-back |
US5784590A (en) * | 1994-06-29 | 1998-07-21 | Exponential Technology, Inc. | Slave cache having sub-line valid bits updated by a master cache |
KR100391727B1 (en) * | 1994-11-09 | 2003-11-01 | 소니 일렉트로닉스 인코포레이티드 | Memory Systems and Memory Access Methods |
US6509927B1 (en) * | 1994-12-16 | 2003-01-21 | Hyundai Electronics America Inc. | Programmably addressable image sensor |
US5603005A (en) * | 1994-12-27 | 1997-02-11 | Unisys Corporation | Cache coherency scheme for XBAR storage structure with delayed invalidates until associated write request is executed |
US5717942A (en) * | 1994-12-27 | 1998-02-10 | Unisys Corporation | Reset for independent partitions within a computer system |
US6223255B1 (en) * | 1995-02-03 | 2001-04-24 | Lucent Technologies | Microprocessor with an instruction level reconfigurable n-way cache |
US5694567A (en) * | 1995-02-09 | 1997-12-02 | Integrated Device Technology, Inc. | Direct-mapped cache with cache locking allowing expanded contiguous memory storage by swapping one or more tag bits with one or more index bits |
US5652915A (en) * | 1995-02-21 | 1997-07-29 | Northern Telecom Limited | System for controlling mode of operation of a data cache based on storing the DMA state of blocks by setting the DMA state to stall |
US5701313A (en) * | 1995-02-24 | 1997-12-23 | Unisys Corporation | Method and apparatus for removing soft errors from a memory |
US5511164A (en) * | 1995-03-01 | 1996-04-23 | Unisys Corporation | Method and apparatus for determining the source and nature of an error within a computer system |
US6412045B1 (en) * | 1995-05-23 | 2002-06-25 | Lsi Logic Corporation | Method for transferring data from a host computer to a storage media using selectable caching strategies |
US5699548A (en) * | 1995-06-01 | 1997-12-16 | Intel Corporation | Method and apparatus for selecting a mode for updating external memory |
US5761709A (en) * | 1995-06-05 | 1998-06-02 | Advanced Micro Devices, Inc. | Write cache for servicing write requests within a predetermined address range |
JP3451595B2 (en) * | 1995-06-07 | 2003-09-29 | インターナショナル・ビジネス・マシーンズ・コーポレーション | Microprocessor with architectural mode control capable of supporting extension to two distinct instruction set architectures |
US5815648A (en) * | 1995-11-14 | 1998-09-29 | Eccs, Inc. | Apparatus and method for changing the cache mode dynamically in a storage array system |
US5724533A (en) * | 1995-11-17 | 1998-03-03 | Unisys Corporation | High performance instruction data path |
US5793941A (en) * | 1995-12-04 | 1998-08-11 | Advanced Micro Devices, Inc. | On-chip primary cache testing circuit and test method |
US5774682A (en) * | 1995-12-11 | 1998-06-30 | International Business Machines Corporation | System for concurrent cache data access by maintaining and selectively merging multiple ranked part copies |
US5778428A (en) * | 1995-12-22 | 1998-07-07 | International Business Machines Corporation | Programmable high performance mode for multi-way associative cache/memory designs |
US5781923A (en) * | 1996-05-28 | 1998-07-14 | Hewlett-Packard Company | Adding a field to the cache tag in a computer system to indicate byte ordering |
US5734849A (en) * | 1996-07-01 | 1998-03-31 | Sun Microsystems, Inc. | Dual bus memory transactions using address bus for data transfer |
US5915262A (en) * | 1996-07-22 | 1999-06-22 | Advanced Micro Devices, Inc. | Cache system and method using tagged cache lines for matching cache strategy to I/O application |
US5867699A (en) * | 1996-07-25 | 1999-02-02 | Unisys Corporation | Instruction flow control for an instruction processor |
US6167486A (en) * | 1996-11-18 | 2000-12-26 | Nec Electronics, Inc. | Parallel access virtual channel memory system with cacheable channels |
US5822759A (en) * | 1996-11-22 | 1998-10-13 | Versant Object Technology | Cache system |
US6202125B1 (en) | 1996-11-25 | 2001-03-13 | Intel Corporation | Processor-cache protocol using simple commands to implement a range of cache configurations |
US6279098B1 (en) | 1996-12-16 | 2001-08-21 | Unisys Corporation | Method of and apparatus for serial dynamic system partitioning |
US5960455A (en) * | 1996-12-30 | 1999-09-28 | Unisys Corporation | Scalable cross bar type storage controller |
US5875201A (en) * | 1996-12-30 | 1999-02-23 | Unisys Corporation | Second level cache having instruction cache parity error control |
US5822766A (en) * | 1997-01-09 | 1998-10-13 | Unisys Corporation | Main memory interface for high speed data transfer |
US5970253A (en) * | 1997-01-09 | 1999-10-19 | Unisys Corporation | Priority logic for selecting and stacking data |
US5860093A (en) * | 1997-01-21 | 1999-01-12 | Unisys Corporation | Reduced instruction processor/storage controller interface |
US6026470A (en) * | 1997-04-14 | 2000-02-15 | International Business Machines Corporation | Software-managed programmable associativity caching mechanism monitoring cache misses to selectively implement multiple associativity levels |
US6058456A (en) * | 1997-04-14 | 2000-05-02 | International Business Machines Corporation | Software-managed programmable unified/split caching mechanism for instructions and data |
US5974507A (en) * | 1997-04-14 | 1999-10-26 | International Business Machines Corporation | Optimizing a cache eviction mechanism by selectively introducing different levels of randomness into a replacement algorithm |
US5978888A (en) * | 1997-04-14 | 1999-11-02 | International Business Machines Corporation | Hardware-managed programmable associativity caching mechanism monitoring cache misses to selectively implement multiple associativity levels |
US6061755A (en) * | 1997-04-14 | 2000-05-09 | International Business Machines Corporation | Method of layering cache and architectural specific functions to promote operation symmetry |
US6061762A (en) * | 1997-04-14 | 2000-05-09 | International Business Machines Corporation | Apparatus and method for separately layering cache and architectural specific functions in different operational controllers |
US6209072B1 (en) | 1997-05-06 | 2001-03-27 | Intel Corporation | Source synchronous interface between master and slave using a deskew latch |
US6175899B1 (en) * | 1997-05-19 | 2001-01-16 | International Business Machines Corporation | Method for providing virtual atomicity in multi processor environment having access to multilevel caches |
US6678790B1 (en) * | 1997-06-09 | 2004-01-13 | Hewlett-Packard Development Company, L.P. | Microprocessor chip having a memory that is reconfigurable to function as on-chip main memory or an on-chip cache |
US6223256B1 (en) * | 1997-07-22 | 2001-04-24 | Hewlett-Packard Company | Computer cache memory with classes and dynamic selection of replacement algorithms |
US6092159A (en) * | 1998-05-05 | 2000-07-18 | Lsi Logic Corporation | Implementation of configurable on-chip fast memory using the data cache RAM |
US6240490B1 (en) | 1998-07-20 | 2001-05-29 | International Business Machines Corporation | Comprehensive multilevel cache preloading mechanism in a multiprocessing simulation environment |
US6560677B1 (en) | 1999-05-04 | 2003-05-06 | International Business Machines Corporation | Methods, cache memories, systems and computer program products for storing transient, normal, and locked entries in an associative cache memory |
US6282617B1 (en) | 1999-10-01 | 2001-08-28 | Sun Microsystems, Inc. | Multiple variable cache replacement policy |
US6708254B2 (en) | 1999-11-10 | 2004-03-16 | Nec Electronics America, Inc. | Parallel access virtual channel memory system |
US6748492B1 (en) * | 2000-08-07 | 2004-06-08 | Broadcom Corporation | Deterministic setting of replacement policy in a cache through way selection |
US6848024B1 (en) | 2000-08-07 | 2005-01-25 | Broadcom Corporation | Programmably disabling one or more cache entries |
US6732234B1 (en) | 2000-08-07 | 2004-05-04 | Broadcom Corporation | Direct access mode for a cache |
US6633969B1 (en) | 2000-08-11 | 2003-10-14 | Lsi Logic Corporation | Instruction translation system and method achieving single-cycle translation of variable-length MIPS16 instructions |
US6928517B1 (en) | 2000-08-30 | 2005-08-09 | Unisys Corporation | Method for avoiding delays during snoop requests |
US6857049B1 (en) | 2000-08-30 | 2005-02-15 | Unisys Corporation | Method for managing flushes with the cache |
US7069391B1 (en) | 2000-08-30 | 2006-06-27 | Unisys Corporation | Method for improved first level cache coherency |
US6697925B1 (en) | 2000-12-22 | 2004-02-24 | Unisys Corporation | Use of a cache ownership mechanism to synchronize multiple dayclocks |
US6748495B2 (en) | 2001-05-15 | 2004-06-08 | Broadcom Corporation | Random generator |
US6516387B1 (en) * | 2001-07-30 | 2003-02-04 | Lsi Logic Corporation | Set-associative cache having a configurable split and unified mode |
US6785775B1 (en) | 2002-03-19 | 2004-08-31 | Unisys Corporation | Use of a cache coherency mechanism as a doorbell indicator for input/output hardware queues |
US6877046B2 (en) * | 2002-03-29 | 2005-04-05 | International Business Machines Corporation | Method and apparatus for memory with embedded processor |
US7266587B2 (en) | 2002-05-15 | 2007-09-04 | Broadcom Corporation | System having interfaces, switch, and memory bridge for CC-NUMA operation |
US6961877B2 (en) | 2002-07-19 | 2005-11-01 | Qlogic Corporation | System and method for in-line error correction for storage systems |
US6961807B1 (en) | 2002-08-27 | 2005-11-01 | Cypress Semiconductor Corporation | Device, system and method for an integrated circuit adaptable for use in computing systems of differing memory requirements |
US6978349B1 (en) * | 2003-01-09 | 2005-12-20 | Hewlett-Packard Development Company, L.P. | Adaptive cache memory management |
US7848332B2 (en) * | 2004-11-15 | 2010-12-07 | Cisco Technology, Inc. | Method and apparatus for classifying a network protocol and aligning a network protocol header relative to cache line boundary |
US7752354B2 (en) * | 2005-02-11 | 2010-07-06 | International Business Machines Corporation | Auxiliary mechanism to manage instruction restart and restart coming in a lookahead processor |
US7406568B2 (en) * | 2005-06-20 | 2008-07-29 | Intel Corporation | Buffer allocation for split data messages |
US8458404B1 (en) * | 2008-08-14 | 2013-06-04 | Marvell International Ltd. | Programmable cache access protocol to optimize power consumption and performance |
US8839025B2 (en) * | 2011-09-30 | 2014-09-16 | Oracle International Corporation | Systems and methods for retiring and unretiring cache lines |
US9176856B2 (en) * | 2013-07-08 | 2015-11-03 | Arm Limited | Data store and method of allocating data to the data store |
US10282302B2 (en) * | 2016-06-30 | 2019-05-07 | Hewlett Packard Enterprise Development Lp | Programmable memory-side cache management for different applications |
GB2560336B (en) * | 2017-03-07 | 2020-05-06 | Imagination Tech Ltd | Address generators for verifying integrated circuit hardware designs for cache memory |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3898624A (en) * | 1973-06-14 | 1975-08-05 | Amdahl Corp | Data processing system with variable prefetch and replacement algorithms |
US4156906A (en) * | 1977-11-22 | 1979-05-29 | Honeywell Information Systems Inc. | Buffer store including control apparatus which facilitates the concurrent processing of a plurality of commands |
US4228503A (en) * | 1978-10-02 | 1980-10-14 | Sperry Corporation | Multiplexed directory for dedicated cache memory system |
US4315312A (en) * | 1979-12-19 | 1982-02-09 | Ncr Corporation | Cache memory having a variable data block size |
US4437149A (en) * | 1980-11-17 | 1984-03-13 | International Business Machines Corporation | Cache memory architecture with decoding |
US4513367A (en) * | 1981-03-23 | 1985-04-23 | International Business Machines Corporation | Cache locking controls in a multiprocessor |
DE3138972A1 (en) * | 1981-09-30 | 1983-04-14 | Siemens AG, 1000 Berlin und 8000 München | ONCHIP MICROPROCESSORCHACHE MEMORY SYSTEM AND METHOD FOR ITS OPERATION |
US4506323A (en) * | 1982-03-03 | 1985-03-19 | Sperry Corporation | Cache/disk file status indicator with data protection feature |
US4464717A (en) * | 1982-03-31 | 1984-08-07 | Honeywell Information Systems Inc. | Multilevel cache system with graceful degradation capability |
US4775955A (en) * | 1985-10-30 | 1988-10-04 | International Business Machines Corporation | Cache coherence mechanism based on locking |
JPS62145340A (en) * | 1985-12-20 | 1987-06-29 | Toshiba Corp | Cache memory control system |
US4758982A (en) * | 1986-01-08 | 1988-07-19 | Advanced Micro Devices, Inc. | Quasi content addressable memory |
US4811208A (en) * | 1986-05-16 | 1989-03-07 | Intel Corporation | Stack frame cache on a microprocessor chip |
US4811209A (en) * | 1986-07-31 | 1989-03-07 | Hewlett-Packard Company | Cache memory with multiple valid bits for each data indication the validity within different contents |
US5136691A (en) * | 1988-01-20 | 1992-08-04 | Advanced Micro Devices, Inc. | Methods and apparatus for caching interlock variables in an integrated cache memory |
DE68926466T2 (en) * | 1988-01-20 | 1996-10-17 | Advanced Micro Devices Inc | Integrated cache memory unit |
ATE109910T1 (en) * | 1988-01-20 | 1994-08-15 | Advanced Micro Devices Inc | ORGANIZATION OF AN INTEGRATED CACHE FOR FLEXIBLE APPLICATION TO SUPPORT MULTIPROCESSOR OPERATIONS. |
-
1988
- 1988-01-20 US US07/146,009 patent/US5025366A/en not_active Expired - Lifetime
-
1989
- 1989-01-18 AT AT89300433T patent/ATE136136T1/en not_active IP Right Cessation
- 1989-01-18 EP EP89300433A patent/EP0325420B1/en not_active Expired - Lifetime
- 1989-01-18 DE DE68926059T patent/DE68926059T2/en not_active Expired - Lifetime
- 1989-01-19 JP JP01093689A patent/JP3218317B2/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
EP0325420B1 (en) | 1996-03-27 |
JPH01237836A (en) | 1989-09-22 |
ATE136136T1 (en) | 1996-04-15 |
US5025366A (en) | 1991-06-18 |
JP3218317B2 (en) | 2001-10-15 |
DE68926059D1 (en) | 1996-05-02 |
EP0325420A2 (en) | 1989-07-26 |
EP0325420A3 (en) | 1991-01-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE68926059T2 (en) | Organization of an integrated cache unit for flexible use in the design of cache systems | |
DE68917326T2 (en) | Organization of an integrated cache memory for flexible use to support multiprocessor operations. | |
DE68917325T2 (en) | Method and apparatus for writing interlocked variables to an integrated cache. | |
DE3856552T2 (en) | Multiprocessor digital data processing system and method for operating this system | |
DE69031433T2 (en) | Memory access exception handling for pre-read command words in the command line of a computer with virtual memory | |
DE69331448T2 (en) | Data processor with a cache memory | |
DE3688978T2 (en) | PAGE STORAGE MANAGEMENT UNIT WITH THE ABILITY TO SUPPORT MULTIPLE ADDRESSES. | |
DE69822534T2 (en) | Shared memory usage with variable block sizes for symmetric multiprocessor groups | |
DE69633166T2 (en) | INTEGRATED CIRCUIT WITH MULTIPLE FUNCTIONS AND THE COMMON USE OF SEVERAL INTERNAL SIGNAL BUSS TO DISTRIBUTE THE CONTROL OF BUS ACCESS AND ARBITRATION | |
DE4218003C2 (en) | Cache controller for a secondary cache memory system | |
DE69029173T2 (en) | microprocessor | |
DE69130086T2 (en) | Multi-level inclusion in multi-level cache hierarchies | |
US5185878A (en) | Programmable cache memory as well as system incorporating same and method of operating programmable cache memory | |
DE69130495T2 (en) | Conversion of commands from internal processor registers into I / O address space | |
DE69432133T2 (en) | Data processor with cache memory | |
DE112013000889B4 (en) | Forwarding progress mechanism for stores in the presence of load conflicts in a load favoring system | |
DE69902392T2 (en) | USE ECC / PARITY BITS TO STORE PRE-DECODING INFORMATION | |
DE68926466T2 (en) | Integrated cache memory unit | |
DE112016007516T5 (en) | DEVICES AND METHOD FOR A PROCESSOR ARCHITECTURE | |
DE4335475A1 (en) | Data processing device with cache memory | |
DE3854369T2 (en) | CENTRAL PROCESSOR UNIT FOR DIGITAL DATA PROCESSING ARRANGEMENT WITH CACHE STORAGE MANAGEMENT DEVICE. | |
DE10045188B4 (en) | Cache device address conflict | |
DE102018001537A1 (en) | SYSTEM, DEVICE AND METHOD FOR SELECTIVELY RELEASING A LOCALITY-BASED INSTRUCTION HANDLING | |
DE69530720T2 (en) | Delayed cache write of a save command | |
DE112016005863T5 (en) | Minimize snoop traffic locally and across cores on a multi-core chip fabric |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8364 | No opposition during term of opposition |