WO2013027297A1 - 半導体装置、管理装置、及びデータ処理装置 - Google Patents
半導体装置、管理装置、及びデータ処理装置 Download PDFInfo
- Publication number
- WO2013027297A1 WO2013027297A1 PCT/JP2011/069221 JP2011069221W WO2013027297A1 WO 2013027297 A1 WO2013027297 A1 WO 2013027297A1 JP 2011069221 W JP2011069221 W JP 2011069221W WO 2013027297 A1 WO2013027297 A1 WO 2013027297A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- error
- signal
- data
- notification
- interrupt
- Prior art date
Links
- 239000004065 semiconductor Substances 0.000 title claims abstract description 22
- 238000004891 communication Methods 0.000 claims abstract description 29
- 238000012545 processing Methods 0.000 claims description 174
- 238000000034 method Methods 0.000 claims description 14
- 230000005540 biological transmission Effects 0.000 claims description 6
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 claims 1
- 230000006870 function Effects 0.000 abstract description 15
- 230000008054 signal transmission Effects 0.000 description 18
- CMMIGIRGSXYBDN-UHFFFAOYSA-P oxo-[[1-[[4-(oxoazaniumylmethylidene)pyridin-1-yl]methyl]pyridin-4-ylidene]methyl]azanium Chemical compound C1=CC(=C[NH+]=O)C=CN1CN1C=CC(=C[NH+]=O)C=C1 CMMIGIRGSXYBDN-UHFFFAOYSA-P 0.000 description 9
- 230000004044 response Effects 0.000 description 7
- 238000013341 scale-up Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 238000012544 monitoring process Methods 0.000 description 4
- 230000009977 dual effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F13/00—Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F13/14—Handling requests for interconnection or transfer
- G06F13/20—Handling requests for interconnection or transfer for access to input/output bus
- G06F13/24—Handling requests for interconnection or transfer for access to input/output bus using interrupt
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0721—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment within a central processing unit [CPU]
- G06F11/0724—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment within a central processing unit [CPU] in a multiprocessor or a multi-core unit
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0766—Error or fault reporting or storing
- G06F11/0772—Means for error signaling, e.g. using interrupts, exception flags, dedicated error registers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0793—Remedial or corrective actions
Definitions
- the present invention relates to a technology for realizing resource expansion of a data processing device such as a computer.
- a scale-up type computer components necessary as a computer are collected as one device (hereinafter referred to as “module device”), and one or more module devices are mounted on the computer.
- the module device for example, a CPU (Central Processing Unit) or a memory-mounted device (hereinafter referred to as “system board” or “SB”), a hard disk device or a PCI (Peripheral Component Interconnect Bus) slot, etc.
- a device hereinafter referred to as “IO unit”) equipped with an IO (Input / Output) device is prepared.
- FIG. 1 is a diagram illustrating a configuration example of a scale-up computer.
- the computer shown in FIG. 1 has a plurality of system boards 1 mounted with two CPUs 11 (11-1 to 11-2).
- Each system board 1 is connected to a signal transmission path 2 such as a crossbar, and transmission / reception of signals between the system boards 1 (indicated as “inter-SB transmission signal” in FIG. 1) is performed via the signal transmission path 2.
- resource expansion that is, scale-up can be performed by adding a module device connected to the signal transmission path 2.
- the system board 1 may be connected to the signal transmission path 2.
- an unillustrated IO unit may be connected to the signal transmission path 2.
- the module device that is, the system board 1 or the IO unit is a unit for adding resources.
- Each system board 1 includes two CPUs 11 (11-1 and 11-2), an FWH (FirmWare Hub) 12, a memory module (indicated as “DIMM” (Dual Inline Memory Module) in FIG. 1) 13, A memory controller (MC) 14, an ICH (I / O controller Hub) 15, an IO slot 16, and a BMC (Baseboard Management Controller) 17 are provided.
- the FWH 12 is a memory storing a BIOS (Basic Input / Output System) code. This BIOS code is read and executed by the CPU 11-1 connected to the FWH 12. The BIOS code read by the CPU 11-1 is output to the CPU 11-2. For this reason, the CPU 11-2 also executes the BIOS code stored in the FWH 12.
- BIOS Basic Input / Output System
- the ICH 15 includes various controllers, for example, and transmits / receives data to / from a device inserted / connected to the IO slot 16.
- a PCI Express (Exp) card 18 is shown as a device connected (inserted) to the IO slot 16.
- the MMC 14 transmits / receives a signal via another system board 1 and the signal transmission path 2 and transmits / receives a signal to / from the ICH 15.
- the MMC 14 issues an error notification and an interrupt notification to the BMC 17.
- a signal for notifying an interruption is called an AS (Active Status) signal. Error notification is performed when a hardware error occurs.
- the CPU 11 on the plurality of system boards 1 can share the memory module 13 on one system board 1 by transmitting and receiving signals with other system boards 1 through the signal transmission path 2.
- the AS signal is output from the MC 14 to the BMC 17 in response to a request from the CPU 11.
- Each CPU 11 and MC 14 notifies the BMC 17 of an error when a hardware error occurs.
- Each CPU 11 and MC 14 are provided with a register for storing data representing details of an error, although not particularly shown.
- the CPU 11 and the MC 14 sends an error notification to the BMC 17, the CPU 11 and the MC 14 store data representing details of the error in a register included in the CPU 11 and the MC 14.
- the BMC 17 reads the data of the register of the CPU 11 or MC 14 that has notified the error.
- Communication between the MC 14 and the BMC 17 for accessing the register is directly performed using, for example, I2C (Inter-Integrated Circuit). Communication between each CPU 11 and BMC 17 is performed via ICH 15 and MC 14.
- the BMC 17 is a management device for managing the system board 1.
- the BMC 17 constantly monitors error notifications from the CPUs 11 and 14, notifies the error notification to the MMB (ManageMent4Board) 4, reads out the data stored in the register of the MC 14 by the error notification, and transmits it to the MMB 4.
- the BMC 17 constantly monitors the AS signal output from the MC 14 and notifies the MMB 4 of an interrupt notification by the AS signal.
- the BMC 17 and MMB 4 of each system board 1 are connected by a signal transmission path 3.
- the MMB 4 is a device that performs control, monitoring, and various management of the entire computer system. Partition management, system initialization, and the like are performed under the control of the MMB 4.
- the MMB 4 communicates with the CPU 11 on the system board 1 via the BMC 17-ICH15-MC14, collects information on each system board 1, and manages the operation of the entire computer system.
- each CPU 11 on each system board 1 outputs an AS signal to the BMC 17 via the MC 14 when notifying the configuration of the memory module 13 or its configuration, or when an event occurs. Both insertion and removal of the PCI Express card 18 from the IO slot 16 correspond to the occurrence of an event.
- Each CPU 11 includes a register for notifying the configuration of the memory module 13, its own configuration, or an event. Therefore, each CPU 11 stores data to be notified to the MMB 4 in a register when outputting an AS signal via the MC 14. The data stored in the register is transmitted to the MMB 4 via the BMC 17-ICH 15-MC 14.
- the register is, for example, a register used for storing data representing details of errors. That is, the same register may be used for both storing data to be notified to the MMB 4 and data representing details of errors.
- the system board 1 used in the scale-up type computer as described above is equipped with a communication function (MC14) for communicating with other system boards 1 assuming scale-up.
- MC14 communication function
- MC14 communication function
- only one system board is sufficient. Assuming such users, inexpensive system boards that are not equipped with a communication function have been commercialized.
- FIG. 2 is a diagram for explaining a configuration example of a system board not equipped with a communication function. 2, the same reference numerals are given to the same or basically the same components as those in FIG. Accordingly, the configuration of the system board 1 ′ not equipped with a communication function will be described with a focus on a different part from FIG. 1.
- each CPU 11 is connected with a memory module 13.
- Each CPU 11 is connected to a BMC 17, an ICH 15 is further connected to the CPU 11-1, and an IO slot 19 is further connected to the CPU 11-2.
- Each of the CPUs 11-1 and 11-2 includes a register accessible by the BMC 17 as described above. This register is used for storing data representing details of errors. Accordingly, when an error is notified from any of the CPUs 11, the BMC 17 reads the data of the register of the CPU 11 that has notified the error.
- a resource can be expanded by newly connecting a module device as a resource addition unit, that is, the system board 1 or an IO unit.
- a module device as a resource addition unit
- the communication function is omitted in the system board 1 'shown in FIG. 2, it cannot be connected to other system boards 1, 1' or IO units.
- a user who desires expansion of computer resources may desire to continue using the system board 1 'that is being used in order to reduce the cost for expansion.
- the technology to which the present invention is applied aims to enable expansion of resources using a module device that omits a communication function with other module devices.
- a first communication means for communicating with the central processing unit and a second for communicating with another data processing unit through a slot connectable to the central processing unit.
- a communication device and an interrupt notification unit for notifying the management device of an interrupt from the central processing unit.
- resources can be expanded using a module device that omits a communication function with other module devices.
- FIG. 14 is a diagram illustrating a configuration example of a scale-up computer. It is a figure explaining the structural example of the system board which does not mount a communication function. It is a figure explaining the structural example of the computer (data processing apparatus) by this embodiment. It is a figure explaining the more detailed structure of CPU, BMC, and MC. It is a figure explaining the more detailed structure of CPU, BMC, and MC. It is a figure explaining the more detailed structure of CPU, BMC, and MC. It is a flowchart showing the example of the flow of operation
- FIG. 3 is a diagram illustrating a configuration example of the computer (data processing apparatus) according to the present embodiment.
- the computer includes a plurality of system boards 20 (20-1 to 20-3, etc.) and an MMB 30.
- An MMB (ManageMent Board) 30 is a device that performs control, monitoring, and various management of the entire computer system, and is connected to each system board 20 via a signal transmission path 41.
- Each system board 20 is a module device that functions as one computer, and the system boards 20 are connected to each other via a signal transmission path 42.
- each system board 20 includes one CPU 21, FWH (Firm Ware Hub) 22, memory module (indicated as “DIMM” (Dual Inline Memory Module) in FIG. 3) 23, ICH (I / O Controller Hub) 24, IO slots 25 and 28, BMC (Baseboard Management Controller) 26, and memory controller (MC: Memory27Controller) 27.
- FWH Firm Ware Hub
- DIMM Dual Inline Memory Module
- ICH I / O Controller Hub
- IO slots 25 and 28 IO slots
- BMC Baseboard Management Controller
- MC Memory27Controller
- the FWH 22 is a memory that stores a BIOS (Basic Input / Output System) code. This BIOS code is read and executed by the CPU 21 connected to the FWH 22. In addition, a memory module 23 is connected to the CPU 21.
- BIOS Basic Input / Output System
- the ICH 24 includes, for example, various controllers and is connected to the CPU 21, the IO slot 25, and the BMC 26.
- the ICH 24 transmits / receives data to / from a device inserted / connected to the IO slot 25.
- the CPU 27, the memory module 23, the BMC 26, and the IO slot 28 are connected to the MC 27.
- the MC 27 accesses the memory module 23.
- the MC 27 uses the IO slot 28 to enable communication with other module devices such as the system board 20 and sends an AS (Active Status) signal for notifying an interrupt in response to a request from the CPU 21. Output to the BMC 26. Communication with other module devices such as the system board 20 is performed via the signal transmission path 42.
- the MC 27 includes a register for storing data representing details of an error (hereinafter referred to as “error detailed data”).
- the CPU 21 includes a register for storing detailed error data to be transmitted to the MMB 30.
- the BMC 26 is a management device for managing the system board 20. The BMC 26 constantly monitors error notifications from the CPU 21 and the MC 27, notifies the MMB 30 of the error notification, reads out data stored in the CPU 21 or the register of the MC 27 by the error notification, and transmits the data to the MMB 30. Further, the BMC 26 constantly monitors the AS signal output from the MC 27 and notifies the MMB 30 of an interrupt notification by the AS signal.
- the BMC 26 and the MMB 30 of each system board 20 are connected by a signal transmission path 41.
- Each system board 20 of the present embodiment includes one CPU 21, FWH 22, memory module 23, ICH 24, IO slots 25 and 28, and BMC 26 as described above. Therefore, each system board 20 has a configuration in which the CPU 11-2 on the system board 1 'shown in FIG.
- the configurations of the CPU 21, the FWH 22, the memory module 23, the ICH 24, and the IO slots 25 and 28 on each system board 20 are basically the same as the CPU 11, the FWH 12, the memory module 13, the ICH 15, and the IO slots 16 and 19 shown in FIG. It is. From this point of view, the following description will be focused on MC27 and BMC26.
- MC27 is a semiconductor device that is assumed to be mounted on a system board instead of the CPU 11-2 in order to realize resource expansion.
- the MC is mounted on the system board instead of the CPU 11-2 on the printed circuit board (PCB: Printed Circuit Board) used for the system board 1 '(corresponding to one computer) as shown in FIG.
- PCB printed Circuit Board
- the MC 27 is socket compatible with the CPU 21 (CPU 11). By making the socket compatible, the MC 27 can be attached to a socket to which the CPU 21 can be attached.
- the MC 27 is assumed to be a socket to which the CPU 21 can be attached, and when it is connected to the socket, it can transmit and receive necessary signals through a plurality of pins (not shown). By preparing such an MC 27, a module device such as the system board 1 'shown in FIG. 2 can be used even when the resources are expanded.
- the signal transmission path 42 is connected to the dummy card 29 inserted into the IO slot 28 of each system board 20. No socket or the like for connecting to the signal transmission path 42 is provided on the printed circuit board used for the system board 1 ′ as shown in FIG. 2. Therefore, in the present embodiment, a dummy card 29 for connection to the signal transmission path 42 is prepared, and signals to and from the signal transmission path 42 are connected to the MC 27 via the IO slot 28 and the dummy card 29 (see FIG. 3 is described as “transmission signal between SB”).
- each CPU 11 can send an error notification to the BMC 17.
- the system board 1 ′ as shown in FIG. 2 is not assumed to be connected to another module device, it cannot transmit / receive AS signals. Therefore, in the present embodiment, the output of the AS signal from the MC 27 to the BMC 26 is enabled as follows.
- the error notification from each CPU 11 to the BMC 17 is performed by transmission / reception of an error signal via a different signal line for each assumed error level.
- one or a pair of signal lines is assigned to error notifications of a plurality of error levels from among a plurality of signal lines, and one or a pair of signal lines that are vacant by the assignment is assigned. It is used for outputting AS signals. In this way, even the system board 1 ′ as shown in FIG. 2 can output the error signal and AS signal from the MC 27 replaced with the CPU.
- the BMC 26 can access the CPU 21 and MC 27 registers.
- the error signal is, for example, an output signal from a register (error recording register) having bits corresponding to the number of error levels.
- the AS signal is an output signal from, for example, a register (AS factor register) having bits of the number of interrupt factors.
- the MC 27 includes an error recording register and an AS factor register, and the BMC 26 can access the error recording register and the AS factor register of the MC 27 via another signal line (for example, I2C) that is not for error notification.
- the BMC 26 accesses the error recording register or the AS factor register of the MC 27 to appropriately receive the error signal and the AS signal from the MC 27. Can be recognized. As a result, the BMC 26 can acquire configuration data or error detailed data from the CPU 21, and can acquire error detailed data from the MC 27.
- the configuration data and error detail data acquired by the BMC 26 are transmitted from the BMC 26 to the MMB 30 via the signal transmission line 41. Therefore, the MMB 30 can perform control reflecting the configuration data and error detailed data acquired via the BMC 26.
- the MMB 30 recognizes the configuration of the memory module 23, the configuration of the CPU 21, or an event that has occurred on the system board 20 from the received configuration data, and controls and monitors the entire computer system including the plurality of system boards 20. Perform management.
- the MC 27 that is socket-compatible with the CPU 11 (CPU 21) on the system board 1 ′ shown in FIG. 2 is used for resource expansion, that is, for other module devices to the existing module device such as the system board 1 ′. Make a connection. For this reason, by preparing a semiconductor device such as MC27, it is possible to meet a user's desire to expand resources while continuing to use an existing module device.
- the MC 27 has a function of outputting an error signal and an AS signal, and the BMC 26 constantly monitors the error signal and the AS signal to realize data transfer between the CPU 21 or the MC 27 and the MMB 30. Therefore, the MMB 30 can manage the entire system after expanding the resources.
- the BMC 26 processes only an error signal from the CPU 21 when the MC 27 is not connected. For this reason, the BMC 26 can be mounted on a system board 1 'as shown in FIG. Accordingly, when the BMC 26 is mounted as the BMC 17 of the system board 1 ′ as shown in FIG. 2, it is possible to cope with resource expansion by adding another module device by replacing the CPU 11-2 with the MC 27.
- FIGS. 4A to 4C are diagrams for explaining the detailed configuration of the CPU, BMC, and MC. Next, with reference to FIGS. 4A to 4C, more detailed configurations and operations of the CPU 21, the BMC 26, and the MC 27 will be described.
- the CPU 21 includes an error processing circuit 51, a register read / write processing circuit 52, a FWHF (interface) circuit 53, a DIMMif circuit 54, an inter-CPU if circuit 55, and a plurality of CPU cores. 56, a cache memory 57, and a configuration recording register 58.
- the FWHif circuit 53 of the CPU 21 reads out the BIOS code stored in the FWH 22 and supplies it to each CPU core 56.
- the DIMMif circuit 54 is a circuit for accessing the memory module 23.
- the inter-CPU if circuit 55 is a circuit for communicating with another CPU 21 or the MC 27.
- the plurality of CPU cores 56 perform processing using the data stored in the cache memory 57.
- the error processing circuit 51 of the CPU 21 is a circuit used for outputting an error signal to the BMC 26.
- the error processing circuit 51 includes an error recording register 51a having at least the same number of bits as the number of error levels, an error detail recording register 51b in which error detailed data is stored, and a write processing circuit 51c.
- Each bit of the error recording register 51a is assigned a different error level from 1 to N, and the value of each bit is an error signal of the corresponding error level ("ERROR [1] to ERROR [N]" in FIG. 4C). (Notation) is output to the BMC 26.
- the value of each bit, that is, the error signal of each error level is, for example, asserted when 1, and negated when 0.
- the FWHif circuit 53, the DIMMif circuit 54, the inter-CPU if circuit 55, the plurality of CPU cores 56, and the cache memory 57 all have a function of detecting an error and notifying the error processing circuit 51 of the detected error.
- the write processing circuit 51c receives 1 bit in the error recording register 51a in response to an error notification from the FWHif circuit 53, the DIMMif circuit 54, the inter-CPU if circuit 55, one of the CPU cores 56, or the cache memory 57. Rewrite the value of to 1.
- the write processing circuit 51c specifies an error level according to, for example, the component that made the error notification and the content of the error notification, and writes the error detail data in the error detail recording register 51b.
- the configuration record register 58 is used to store data to be transmitted to the MMB 30 in addition to the error detail data (hereinafter “configuration data”). As will be described later, the output of the AS signal in the MC 27 is performed under the control of the CPU core 56. Examples of the program that controls the CPU core 56 to output an AS signal include a BIOS code, an SMI handler (System Management Interrupt Handler), and various drivers.
- the SMI handler is a program that is called and executed for processing the associated event.
- the configuration data stored in the configuration recording register 58 is read by the BMC 26 as necessary when the AS signal is output from the MC 27.
- the register read / write processing circuit 52 accesses the error recording register 51a or the error detail recording register 51b in response to a request from the BMC 26.
- the BMC 26 can acquire the data stored in the error recording register 51a and the error detail recording register 51b via the register read / write processing circuit 52, respectively.
- the MC 27 includes an error processing circuit 61, an AS processing circuit 62, a register read / write processing circuit 63, an inter-CPU if circuit 64, an FW (Firm Ware) communication control circuit 65, a DIMMif circuit 66, and a memory control.
- a circuit 67 and an inter-SB if circuit 68 are provided.
- the inter-CPU if circuit 64 is a circuit for communicating with the CPU 21.
- the FW communication control circuit 65 is a circuit that processes a request received from the CPU 21 via the inter-CPU if circuit 64.
- the FW communication control circuit 65 processes the output request and issues an AS notification for causing the AS processing circuit 62 to output the AS signal. This AS notification designates a factor for performing an interrupt notification.
- the DIMMif circuit 66 is a circuit for accessing the memory module 23.
- the memory control circuit 67 controls access to the memory module 23 via the DIMMif circuit 66.
- the inter-SB if circuit 68 realizes communication with module devices including other system boards 20 via the dummy card 29 and the IO slot 28.
- the error processing circuit 61 is a circuit used for outputting an error signal to the BMC 26. Similar to the error processing circuit 51 of the CPU 21, the error processing circuit 61 includes an error recording register 61a having at least the same number of bits as the number of error levels, an error detailed recording register 61b in which error detailed data is stored, an OR gate 61c, A write processing circuit 61d is provided.
- a different error level is assigned to each bit of the error recording register 61a, and the value of each bit is the error signal of the corresponding error level (denoted as “ERROR [1] to ERROR [N]” in FIG. 4C). As described above, the value of each bit, that is, the error signal of each error level is asserted when, for example, 1 and negated when 0.
- the inter-CPU if circuit 64, the DIMMif circuit 66, the memory control circuit 67, and the inter-SB if circuit 68 each have a function of detecting an error and notifying the error processing circuit 61 of the detected error.
- the write processing circuit 61d rewrites the value of 1 bit in the error recording register 61a to 1 by an error notification from the inter-CPU if circuit 64, the DIMMif circuit 66, the memory control circuit 67, or the inter-SB if circuit 68, for example.
- the write processing circuit 61d specifies an error level according to, for example, the component that made the error notification and the content of the error notification, and writes the error detailed data in the error detail recording register 51b.
- the error level N-1 error signal and the error level N error signal are ORed by the OR gate 61c, and the OR output from the OR gate 61c is output to the BMC 26 as an error level N-1 error signal. .
- the error signal of the error level N-1 received by the BMC 26 is asserted when any one of the error signal of the error level N-1 and the error level N is asserted. Therefore, the BMC 26 can recognize from the error signal at the error level N-1 that either one of the error signal at the error level N-1 or the error level N is asserted.
- the number of error signals (signal lines) that are logically ORed by the OR gate 61c may be two or more, so the number is not limited to two.
- the AS processing circuit 62 is a circuit used for outputting an AS signal to the BMC 26.
- the AS processing circuit 62 includes an AS factor register 62a, an OR gate 62b, and a write processing circuit 62c having the same number of bits as the number of interrupt factors.
- a different interrupt factor is assigned to each bit of the AS factor register 62a, and the value of each bit corresponds to the AS signal of the corresponding interrupt factor.
- the value of each bit that is, the AS signal of each interrupt factor is asserted when it is 1, for example, and negated when it is 0.
- the write processing circuit 62c rewrites the 1-bit value in the AS factor register 62a to 1 in accordance with the AS notification from the FW communication control circuit 65.
- FIG. 4A shows a BIOS code, an SMI handler, and a driver as programs that cause the CPU core 56 of the CPU 21 to perform AS notification.
- the hardware makes an AS notification through, for example, an SMI handler.
- All values of each bit of the AS factor register 62a are output to the OR gate 62b.
- the OR gate 62b takes a logical sum of the values of the respective bits of the AS factor register 62a and outputs the logical sum.
- the logical sum output from the OR gate 62b is output to the BMC 26 as an error signal having an error level N. Since the logical sum output from the OR gate 62b is the logical sum of the AS signals of all interrupt factors, it will be referred to as an “AS logical sum signal” hereinafter.
- the register read / write processing circuit 63 accesses the error recording register 61a of the error processing circuit 61, the error detail recording register 61b, or the AS factor register 62a of the AS processing circuit 62 in response to a request from the BMC 26.
- the BMC 26 acquires the data stored in the error recording register 61a and the error detail recording register 61b of the error processing circuit 61 and the AS factor register 62a of the AS processing circuit 62 via the register read / write processing circuit 63, respectively. be able to.
- the BMC 26 includes an error processing circuit 71, an MC interrupt processing circuit 72, a register read / write processing circuit 73, and an SB management circuit 74.
- the MMB 30 includes a BMC information processing circuit 31.
- the error processing circuit 71 of the BMC 26 is a processing circuit for constantly monitoring error notification and responding to the error notification.
- the MC interrupt processing circuit 72 is a processing circuit for constantly monitoring the interrupt notification by the AS signal and responding to the interrupt notification.
- the register read / write processing circuit 73 is a circuit for reading data from the CPU 21 or the MC 27.
- the SB management circuit 74 constantly monitors the occurrence of an error and an interrupt notification, and notifies the MMB 30 of the occurrence of an error and an interrupt notification.
- error signals of error levels 1 to N ⁇ 1 output from the error processing circuit 51 of the CPU 21 are error signals of error levels 1 to N ⁇ 1 from the error processing circuit 61 of the MC 27.
- the signal is input to the BMC 26 through the same signal line from which the signal is output.
- the error signal of the error level N output from the error processing circuit 51 of the CPU 21 is input to the BMC 26 through the same signal line as the AS OR signal output as the error signal of the error level N from the AS processing circuit 62 of the MC 27.
- the BMC 26 cannot specify the output destination of the error signal regardless of the error level. Therefore, the BMC 26 performs the following access to the CPU 21 and the MC 27 in accordance with the error level of the error signal that has been asserted.
- the BMC 26 registers each register 51a, 51b of the error processing circuit 51 of the CPU 21 and each register 61a of the error processing circuit 61 of the MC 27. Each data of 61b is acquired. Thereby, the BMC 26 specifies the output destination of the asserted error signal and acquires error detailed data from the output destination. Such data acquisition is performed by the error processing circuit 71 controlling the register read / write processing circuit 73. The error processing circuit 71 outputs detailed error data obtained from the specified output destination to the SB management device 74. The SB management device 74 performs error processing using the error detail data input from the error processing circuit 71 and transmits the error detail data to the MMB 30.
- the error level N error signal is input to the MC interrupt processing circuit 72 in addition to the error processing circuit 71. Accordingly, when the error level of the asserted error signal is N, the error processing circuit 71 and the MC interrupt processing circuit 72 operate in parallel.
- the error processing circuit 71 controls the register read / write processing circuit 73 to acquire the data of the registers 51a, 51b, 61a, 61b from the error processing circuits 51, 61 of the CPU 21 and MC 27. Thereby, the error processing circuit 71 specifies the output destination of the asserted error signal, and acquires error detailed data from the CPU 21 if the output destination is the CPU 21. For example, in order to negate an error signal from the output destination of the error signal, the error processing circuit 71 passes through the register read / write processing circuit 73 to the error processing circuit 51 or 61 of the error recording register of the output destination. Data with a bit value of 0 is stored.
- the MC interrupt processing circuit 72 controls the register read / write processing circuit 73 to acquire the data of the AS factor register 62a of the AS processing circuit 62 of the MC 27, and any AS signal is obtained from the acquired data. Check if it is asserted.
- the CPU 21 stores configuration data to be transmitted to the MMB 30 in the configuration recording register 58.
- the MC interrupt processing circuit 72 that has confirmed that any AS signal is asserted next acquires configuration data as necessary.
- the acquisition of the configuration data stored in the configuration recording register 58 is performed by a request to the register read / write processing circuit 52 of the CPU 21 via the register read / write processing circuit 73, for example.
- the MC interrupt processing circuit 72 outputs the acquired configuration data to the SB management circuit 74 and causes the SB management circuit 74 to perform an interrupt process. For example, in order to negate the AS OR signal from the MC 27, the MC interrupt processing circuit 72 passes the value of each bit to the AS factor register 62a of the AS processing circuit 62 of the MC 27 via the register read / write processing circuit 73. 0 data is stored.
- the SB management circuit 74 transmits error detailed data or configuration data to the MMB 30 as needed by executing error processing by error notification and interrupt processing by interrupt notification. Thereby, the BMC information processing circuit 31 of the MMB 30 processes the detailed error data or the configuration data received from the BMC 26, and controls the entire computer system or notifies the operator.
- the operation of the BMC 26 when the CPU 21 is not replaced with the MC 27, that is, when the CPU 21 is mounted at the position of the MC 27, will be briefly described.
- the operation of the error processing circuit 71 in this case may be the same as described above. However, even if an error signal of error level N is asserted, since the AS processing circuit 62 does not exist in the CPU 21, the MC interrupt processing circuit 72 cannot identify the asserted AS signal and practically does not operate. . In a situation where the error signal at the error level N is asserted, one of the two CPUs 21 asserts the error signal at the error level N.
- the error processing circuit 71 identifies the CPU 21 outputting the asserted error signal, and outputs the detailed error data acquired from the identified CPU 21 to the SB management circuit 74.
- the BMC 26 operates properly regardless of which of the CPU 21 and the MC 27 is mounted. Therefore, the BMC 26 may be mounted as the BMC 17 of the existing system board 1 ′ as shown in FIG.
- 5A to 5C are flowcharts showing an example of the flow of operations of the CPU, MC, and BMC. This flowchart is based on the assumption that the CPU 21 or the MC 27 asserts an error signal of the error level N, and it is assumed that the BMC 26 recognizes the connection between the CPU 21 and the MC 27. Next, operations of the CPU 21, MC 27, and BMC 26 will be described with reference to FIGS. 5A to 5C.
- the CPU 21 When the CPU 21 detects the occurrence of an error level N error, the CPU 21 asserts an error level N error signal (SC1).
- the asserted error signal of error level N is input to and detected by the error processing circuit 71 and MC interrupt processing circuit 72 of the BMC 26 (SB1).
- the error processing circuit 71 controls the register read / write processing circuit 73 to make a data read request from each of the registers 51a and 51b of the error processing circuit 51 of the CPU 21 (SB2).
- the register read / write processing circuit 52 of the CPU 21 reads the data in the registers 51a and 51b of the error processing circuit 51 and transmits them to the BMC 26 (SC2).
- the error processing circuit 71 of the BMC 26 acquires data stored in the registers 51a and 51b of the error processing circuit 51 of the CPU 21 via the register read / write processing circuit 73, and whether there is an error from the data of the register 51a. It is determined whether or not (SB3). If the data in the register 51a indicates the presence of an error notification, the determination is yes, and the error processing circuit 71 outputs error detail data and the like, which is data in the register 51b, to the SB management circuit 74, and executes error processing. Request. As a result, the SB management circuit 74 executes error processing such as transmitting error detail data to the MMB 30 (SB21).
- the MC interrupt processing circuit 72 of the BMC 26 detects the error signal of the asserted error level N, the MC interrupt processing circuit 72 next controls the register read / write processing circuit 73 to read from the AS factor register 62a of the AS processing circuit 62 of the MC 27.
- a data read request is made (SB11).
- the register read / write processing circuit 63 of the MC 27 reads the data of the AS factor register 62a of the AS processing circuit 62 and transmits it to the BMC 26 (SM2).
- the MC interrupt processing circuit 72 of the BMC 26 acquires the data stored in the AS factor register 62a of the AS processing circuit 62 of the MC 27 via the register read / write processing circuit 73, and there is an interrupt notification from the acquired data. Whether or not (SB12). If the data in the AS factor register 62a indicates the presence of an interrupt notification, the determination is Yes, the MC interrupt processing circuit 72 is acquired by the SB management circuit 74, and the error processing circuit 71 is acquired by a read request (SB2) to the CPU 21. The configuration data and the like are output, and execution of interrupt processing is requested. As a result, the SB management circuit 74 executes an interrupt process such as transmitting configuration data to the MMB 30 (SB21).
- the determination result in SB3 by the data acquired from the CPU 21 of the error processing circuit 71 is Yes, and the determination result of SB12 by the data acquired from the MC 27 of the MC interrupt processing circuit 72 becomes No.
- the SB management circuit 74 executes error processing in SB21.
- the error processing circuit 71 stores data in which all bit values are 0 in the error recording register 51 a of the error processing circuit 51 of the CPU 21.
- the error processing circuit 71 and the MC interrupt processing circuit 72 execute the same processing as described above. However, in this case, the determination result in SB3 by the data acquired from the CPU 21 of the error processing circuit 71 is No, and the determination result of SB12 by the data acquired from the MC 27 of the MC interrupt processing circuit 72 is Yes. Therefore, the SB management circuit 74 executes an interrupt process at SB21. Although not specifically shown, the MC interrupt processing circuit 72 stores data in which all bit values are 0 in the AS factor register 62a of the AS processing circuit 62 of the MC 27.
- the existing system board 1 ′ as shown in FIG. 2 is changed to the system board 20 and a plurality of system boards 20 are connected to realize resource expansion. It is not limited to such a method.
- the resource expansion may be performed by connecting the system board 1 as shown in FIG.
- a device connected for resource expansion may be a computer (data processing device) having a communication function instead of the system board 20 or a module device such as 1.
- the configuration of the system board 20 is not limited to that shown in FIG.
- the system board 20 may be capable of mounting three or more CPUs 21.
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Debugging And Monitoring (AREA)
Abstract
本発明を適用した1システムは、中央処理装置と通信を行うための第1の通信手段と、中央処理装置と接続可能なスロットを介して、他のデータ処理装置と通信を行うための第2の通信手段と、管理装置に中央処理装置からの割り込みを通知する割込通知手段と、を具備する半導体装置を備える。それにより、半導体装置は、他のデータ処理装置と通信を行う通信機能を持たない1システムに適用した場合、他のデータ処理装置を接続可能にする。
Description
本発明は、コンピュータ等のデータ処理装置のリソース拡張を実現する技術に関する。
近年、サーバには、リソースを拡張可能なスケールアップ型のコンピュータ(データ処理装置)が広く採用されている。スケールアップ型のコンピュータでは、コンピュータとして必要な構成要素が1つの装置(以降「モジュール装置」と呼ぶ)としてまとめられ、モジュール装置が1つ以上、コンピュータに実装される。そのモジュール装置としては、例えばCPU(Central Processing Unit:中央処理装置)やメモリを搭載した装置(以降「システムボード」或いは「SB」と表記)と、ハードディスク装置やPCI(Peripheral Components Interconnect bus)スロットなどのIO(Input Output)デバイスを搭載した装置(以降「IOユニット」と表記)とが用意される。
図1は、スケールアップ型コンピュータの構成例を説明する図である。
図1のコンピュータは、2台のCPU11(11-1~11-2)を搭載したシステムボード1を複数実装している。各システムボード1は、クロスバ等の信号伝送路2に接続され、システムボード1間での信号(図1中「SB間伝送信号」と表記)の送受信は、信号伝送路2を介して行われる。そのような構成により、リソース拡張、つまりスケールアップは、信号伝送路2に接続させるモジュール装置を追加することで行えるようになっている。このことから、例えば3つのシステムボード1-1~1-3では処理能力が足りないような場合、システムボード1を信号伝送路2に接続すれば良い。また、IOデバイスを増やす場合には、不図示のIOユニットを信号伝送路2に接続すれば良い。このように、モジュール装置、つまりシステムボード1或いはIOユニットは、リソースを追加するうえで単位となる。
図1のコンピュータは、2台のCPU11(11-1~11-2)を搭載したシステムボード1を複数実装している。各システムボード1は、クロスバ等の信号伝送路2に接続され、システムボード1間での信号(図1中「SB間伝送信号」と表記)の送受信は、信号伝送路2を介して行われる。そのような構成により、リソース拡張、つまりスケールアップは、信号伝送路2に接続させるモジュール装置を追加することで行えるようになっている。このことから、例えば3つのシステムボード1-1~1-3では処理能力が足りないような場合、システムボード1を信号伝送路2に接続すれば良い。また、IOデバイスを増やす場合には、不図示のIOユニットを信号伝送路2に接続すれば良い。このように、モジュール装置、つまりシステムボード1或いはIOユニットは、リソースを追加するうえで単位となる。
各システムボード1は、2台のCPU11(11-1、11-2)の他に、FWH(FirmWare Hub)12、メモリモジュール(図1中「DIMM」(Dual Inline Memory Module)と表記)13、メモリコントローラ(MC:Memory Controller)14、ICH(I/O Controller Hub)15、IOスロット16、及びBMC(Baseboard Management Controller)17を備えている。
FWH12は、BIOS(Basic Input/Output System)コードを格納したメモリである。このBIOSコードは、FWH12に接続されたCPU11-1が読み出して実行する。CPU11-1によって読み出されたBIOSコードは、CPU11-2に出力される。このため、CPU11-2もFWH12に格納されたBIOSコードを実行する。
ICH15は、例えば各種コントローラを備え、IOスロット16に挿入・接続されたデバイスとの間でデータの送受信を行う。図1では、IOスロット16に接続(挿入)されたデバイスとしてPCIエクスプレス(Exp)カード18を表している。
MC14には、2台のCPU11、信号伝送路2、メモリモジュール13、ICH15、及びBMC17が接続されている。MC14は、メモリモジュール13へのアクセスを行う他に、他のシステムボード1と信号伝送路2を介した信号の送受信、ICH15との間の信号の送受信を行う。MMC14は、BMC17に対しては、エラー通知及び割り込み通知を行う。ここでは、割り込みを通知するための信号をAS(Active Status)信号と呼ぶことにする。エラー通知は、ハードウェア・エラーの発生により行われる。他のシステムボード1と信号伝送路2を介した信号の送受信により、複数のシステムボード1上のCPU11は、1つのシステムボード1上のメモリモジュール13を共有することができる。
AS信号のMC14からBMC17への出力は、CPU11の要求によって行われる。また、各CPU11及びMC14は、BMC17に対し、ハードウェア・エラーの発生によりエラー通知を行う。
各CPU11及びMC14は、特には図示していないが、エラーの詳細を表すデータを保存するためのレジスタを備えている。各CPU11及びMC14は、BMC17にエラー通知を行う場合、自身が備えるレジスタに、エラーの詳細を表すデータを保存させる。それにより、BMC17は、エラーが何れかのCPU11或いはMC14から通知された場合、エラーを通知したCPU11或いはMC14のレジスタのデータを読み出す。レジスタにアクセスするためのMC14とBMC17間の通信は、例えばI2C(Inter-Integrated Circuit)を用いて直接行われる。各CPU11とBMC17間の通信は、ICH15及びMC14を介して行われる。
BMC17は、システムボード1を管理するための管理装置である。BMC17は、各CPU11及びMC14からのエラー通知を常時監視して、エラー通知をMMB(ManageMent Board)4に通知し、そのエラー通知によりMC14のレジスタに保存されるデータを読み出してMMB4に送信する。また、BMC17は、MC14から出力されるAS信号を常時監視して、AS信号による割り込み通知をMMB4に通知する。各システムボード1のBMC17とMMB4は、信号伝送路3によって接続されている。
MMB4は、コンピュータシステム全体の制御、監視、及び各種管理を行う装置である。パーティション管理、システム初期化などは、MMB4の制御によって行われる。MMB4は、BMC17-ICH15-MC14を介してシステムボード1上のCPU11と通信を行い、各システムボード1の情報を収集し、コンピュータシステム全体の動作を管理する。
各システムボード1の情報の収集は、各CPU11によるAS信号の出力を契機に行われる。そのために、各システムボード1上の各CPU11は、メモリモジュール13の構成、若しくは自身の構成を通知する場合、或いはイベントが発生した場合、MC14を介してAS信号をBMC17に出力させる。IOスロット16へのPCIエクスプレスカード18の挿入、及び脱着は、何れもイベントの発生に相当する。
各CPU11は、メモリモジュール13の構成、自身の構成、或いはイベントを通知するためのレジスタを備えている。そのため、各CPU11は、MC14を介してAS信号を出力させる場合、MMB4に通知すべきデータをレジスタに保存する。レジスタに保存されたデータは、BMC17-ICH15-MC14を介してMMB4に送信される。そのレジスタは、例えばエラーの詳細を表すデータの保存に用いるレジスタである。つまり、MMB4に通知すべきデータ、及びエラーの詳細を表すデータの格納は共に同じレジスタを用いても良い。
上記のようなスケールアップ型コンピュータに用いられるシステムボード1では、スケールアップを想定し、他のシステムボード1と通信を行うための通信機能(MC14)が搭載されている。しかし、ユーザによっては、システムボードは一つだけで十分な場合がある。そのようなユーザを想定し、通信機能が搭載されない安価なシステムボードも製品化されている。
図2は、通信機能を搭載しないシステムボードの構成例を説明する図である。図2において、図1と同じ、或いは基本的に同じ構成要素には同一の符号を付している。それにより、図1から異なる部分に着目して、通信機能を搭載しないシステムボード1’の構成について説明する。
図2に表すシステムボード1’では、MC14を搭載しないことにより、図1に表すようなシステムボード1との通信機能が省かれている。MC14が搭載されていないことから、各CPU11にはそれぞれメモリモジュール13が接続されている。また、各CPU11には、BMC17が接続され、CPU11-1には更にICH15が、CPU11-2には更にIOスロット19が接続されている。
各CPU11-1、11-2は、上記のように、BMC17がアクセス可能なレジスタを備えている。このレジスタは、エラーの詳細を表すデータの保存に用いられる。それにより、BMC17は、エラーが何れかのCPU11から通知された場合、エラーを通知したCPU11のレジスタのデータを読み出す。
ユーザは、事業の拡大等に伴うデータ処理量の増大により、コンピュータのリソースを拡張する場合がある。図1に表すようなシステムボード1では、リソース追加の単位となるモジュール装置、つまりシステムボード1、或いはIOユニットを新たに接続させることでリソースを拡張させることができる。しかし、図2に表すようなシステムボード1’では、通信機能が省かれていることから、他のシステムボード1、1’、或いはIOユニットと接続させることはできない。
コンピュータのリソースの拡張を望むユーザは、拡張のためのコストを抑えるために、使用しているシステムボード1’を今後も使用し続けることを希望する場合がある。
本発明を適用した技術は、他のモジュール装置との通信機能を省いたモジュール装置を用いてリソースの拡張を可能にすることを目的とする。
本発明を適用した1システムでは、中央処理装置と通信を行うための第1の通信手段と、中央処理装置と接続可能なスロットを介して、他のデータ処理装置と通信を行うための第2の通信手段と、管理装置に中央処理装置からの割り込みを通知する割込通知手段と、を具備する半導体装置を備える。
本発明を適用した1システムでは、他のモジュール装置との通信機能を省いたモジュール装置を用いてリソースを拡張することができる。
以下、本発明の実施の形態について、図面を参照しながら詳細に説明する。
図3は、本実施形態によるコンピュータ(データ処理装置)の構成例を説明する図である。図3に示すように、コンピュータは、複数のシステムボード20(20-1~20-3等)、及びMMB30を備えている。MMB(ManageMent Board)30は、コンピュータシステム全体の制御、監視、及び各種管理を行う装置であり、各システムボード20と信号伝送路41を介して接続されている。各システムボード20は、それぞれ1台のコンピュータとして機能するモジュール装置であり、各システムボード20間は信号伝送路42を介して接続されている。
図3は、本実施形態によるコンピュータ(データ処理装置)の構成例を説明する図である。図3に示すように、コンピュータは、複数のシステムボード20(20-1~20-3等)、及びMMB30を備えている。MMB(ManageMent Board)30は、コンピュータシステム全体の制御、監視、及び各種管理を行う装置であり、各システムボード20と信号伝送路41を介して接続されている。各システムボード20は、それぞれ1台のコンピュータとして機能するモジュール装置であり、各システムボード20間は信号伝送路42を介して接続されている。
各システムボード20は、図3に表すように、1台のCPU21、FWH(Firm Ware Hub)22、メモリモジュール(図3中「DIMM」(Dual Inline Memory Module)と表記)23、ICH(I/O Controller Hub)24、IOスロット25、28、BMC(Baseboard Management Controller)26、メモリコントローラ(MC:Memory Controller)27を備えている。
FWH22は、BIOS(Basic Input/Output System)コードを格納したメモリである。このBIOSコードは、FWH22に接続されたCPU21が読み出して実行される。CPU21には他に、メモリモジュール23が接続されている。
ICH24は、例えば各種コントローラを備え、CPU21、IOスロット25、及びBMC26と接続されている。ICH24は、IOスロット25に挿入・接続されたデバイスとの間でデータの送受信を行う。
MC27には、CPU21、メモリモジュール23、BMC26、及びIOスロット28が接続されている。このMC27は、メモリモジュール23へのアクセス行う。また、MC27は、IOスロット28を用いて、他のシステムボード20等のモジュール装置との通信を可能にすると共に、割り込みを通知するためのAS(Active Status)信号をCPU21からの要求に応じてBMC26に出力する。他のシステムボード20等のモジュール装置との通信は、信号伝送路42を介して行われる。
MC27は、エラーの詳細を表すデータ(以降「エラー詳細データ」)の保存用のレジスタを備える。CPU21は、MMB30に送信すべきエラー詳細データの保存用のレジスタを備えている。BMC26は、システムボード20を管理するための管理装置である。BMC26は、CPU21及びMC27からのエラー通知を常時監視して、エラー通知をMMB30に通知し、そのエラー通知によりCPU21或いはMC27のレジスタに保存されるデータを読み出してMMB30に送信する。また、BMC26は、MC27から出力されるAS信号を常時監視して、AS信号による割り込み通知をMMB30に通知する。各システムボード20のBMC26とMMB30は、信号伝送路41によって接続されている。
本実施形態の各システムボード20は、上記のように、1台のCPU21、FWH22、メモリモジュール23、ICH24、IOスロット25、28、及びBMC26を備えている。このため、各システムボード20は、図2に表すシステムボード1’上のCPU11-2をMC27に置き換えた形の構成となっている。
各システムボード20上のCPU21、FWH22、メモリモジュール23、ICH24、IOスロット25、28の各構成は、基本的に図2に表すCPU11、FWH12、メモリモジュール13、ICH15、IOスロット16、19と同じである。このことから以降、MC27、及びBMC26に着目して説明を行う。
MC27は、リソースの拡張を実現させるためにCPU11-2の代わりにシステムボードに実装することを想定した半導体装置である。CPU11-2の代わりにMCをシステムボードに実装するのは、図2に表すようなシステムボード1’(1台のコンピュータに相当)に用いられるプリント基板(PCB:Printed Circuit Board)上には、MC27のような半導体装置を新たに実装するためのソケット等は設けられていないためである。そのために、MC27は、CPU21(CPU11)とソケット互換としている。ソケット互換とすることで、MC27は、CPU21が取り付け可能なソケットに取り付けることができる。MC27は、CPU21が取り付け可能なソケットを想定し、そのソケットに接続された場合に、不図示の複数のピンを介して、必要な信号の送受信を行えるものとして実現されている。このようなMC27を用意することにより、リソースを拡張する場合にも、図2のシステムボード1’のようなモジュール装置を使用し続けることができる。
信号伝送路42は、各システムボード20のIOスロット28に挿入されたダミーカード29と接続されている。図2に表すようなシステムボード1’に用いられるプリント基板上には、信号伝送路42と接続するためのソケット等は設けられていない。このことから、本実施形態では、信号伝送路42と接続させるためのダミーカード29を用意し、MC27に、IOスロット28及びダミーカード29を介して、信号伝送路42との間の信号(図3中「SB間伝送信号」と表記)の送受信を行わせるようにしている。
図2に表すようなシステムボード1’では、各CPU11からBMC17にエラー通知を行うことができる。しかし、図2に表すようなシステムボード1’は、他のモジュール装置との接続を想定していないために、AS信号の送受信を行えるようになっていない。このことから、本実施形態では、以下のようにして、MC27からBMC26へのAS信号の出力を可能にしている。
図2に表すようなシステムボード1’において、各CPU11からBMC17へのエラー通知は、想定するエラーレベル毎に異なる信号線を介したエラー信号の送受信により行われる。このことから、本実施形態では、複数の信号線の中から複数のエラーレベルのエラー通知に1本、或いは1対の信号線を割り当て、その割り当てによって空く1本、或いは1対の信号線をAS信号の出力に用いるようにしている。そのようにして、図2に表すようなシステムボード1’であっても、CPUと換装したMC27からのエラー信号及びAS信号の出力を行えるようにしている。
BMC26は、CPU21及びMC27のレジスタにアクセスすることができる。エラー信号は、例えばエラーレベル数のビットを有するレジスタ(エラー記録レジスタ)からの出力信号である。AS信号も同様に、例えば割り込みの要因数のビットを有するレジスタ(AS要因レジスタ)からの出力信号である。MC27は、エラー記録レジスタ及びAS要因レジスタを備え、BMC26は、エラー通知用でない別の信号線(例えばI2C)を介して、MC27のエラー記録レジスタ及びAS要因レジスタにそれぞれアクセス可能である。このため、エラー通知用の信号線の一部を割り込み通知に用いても、BMC26は、MC27のエラー記録レジスタ或いはAS要因レジスタにアクセスすることにより、MC27からのエラー信号、及びAS信号を適切に認識することができる。この結果、BMC26は、CPU21から構成データ、或いはエラー詳細データを取得することができ、MC27からエラー詳細データを取得することができる。
BMC26が取得した構成データ及びエラー詳細データは、BMC26から信号伝送線41を介してMMB30に送信される。このため、MMB30は、BMC26を介して取得される構成データ及びエラー詳細データを反映した制御を行うことができる。MMB30は、受信した構成データから、メモリモジュール23の構成、若しくはCPU21の構成、或いはシステムボード20上で発生したイベントを認識し、複数のシステムボード20を含むコンピュータシステム全体の制御、監視、及び各種管理を行う。
上記のようなことから、図2に表すシステムボード1’上のCPU11(CPU21)とソケット互換なMC27は、リソース拡張、つまりシステムボード1’のような既存のモジュール装置への他のモジュール装置の接続を実現させる。このため、MC27のような半導体装置を用意することにより、既存のモジュール装置を使用し続けつつリソースを拡張したいというユーザの要望に対応することができる。
また、MC27は、エラー信号及びAS信号を出力する機能を備え、BMC26は、エラー信号及びAS信号を常時監視し、CPU21或いはMC27とMMB30間のデータ転送を実現させる。このため、MMB30は、リソースを拡張した後のシステム全体の管理を行うことができる。BMC26は、詳細は後述するように、MC27が接続されていない場合、CPU21からのエラー信号のみを処理する。このため、BMC26は図2に表すようなシステムボード1’に実装することができる。それにより、図2に表すようなシステムボード1’のBMC17としてBMC26を実装した場合、CPU11-2をMC27に換装することで他のモジュール装置を追加するリソース拡張に対応できるようになる。
図4A~図4Cは、CPU、BMC及びMCのより詳細な構成を説明する図である。次に図4A~図4Cを参照して、CPU21、BMC26、及びMC27のより詳細な構成、及びそれぞれの動作について説明する。
図4Bに表すように、CPU21は、エラー処理回路51、レジスタリード(read)/ライト(write)処理回路52、FWHif(interface)回路53、DIMMif回路54、CPU間if回路55、複数のCPUコア56、キャッシュメモリ57、及び構成記録レジスタ58を備えている。
CPU21のFWHif回路53は、FWH22に格納されたBIOSコードを読み出し、各CPUコア56に供給する。DIMMif回路54はメモリモジュール23にアクセスを行うための回路である。CPU間if回路55は、他のCPU21、或いはMC27との間で通信を行うための回路である。複数のCPUコア56は、キャッシュメモリ57に格納されたデータを用いて処理を行う。
CPU21のエラー処理回路51は、BMC26へのエラー信号の出力等に用いられる回路である。エラー処理回路51は、エラーレベル数と同じ数のビットを少なくとも有するエラー記録レジスタ51a、エラー詳細データが格納されるエラー詳細記録レジスタ51b、及びライト処理回路51cを備えている。
エラー記録レジスタ51aの各ビットには、1からNまでの異なるエラーレベルが割り当てられ、各ビットの値は、対応するエラーレベルのエラー信号(図4C中「ERROR[1]~ERROR[N]と表記)としてBMC26に出力される。各ビットの値、つまり各エラーレベルのエラー信号は、例えば1のときにアサート、0のときにネゲートとなる。
FWHif回路53、DIMMif回路54、CPU間if回路55、複数のCPUコア56、及びキャッシュメモリ57は何れもエラーを検出し、検出したエラーをエラー処理回路51に通知する機能を備えている。ライト処理回路51cは、例えばFWHif回路53、DIMMif回路54、CPU間if回路55、複数のCPUコア56のうちの一つ、或いはキャッシュメモリ57からのエラー通知により、エラー記録レジスタ51a中の1ビットの値を1に書き換える。ライト処理回路51cは、例えばエラー通知を行った構成要素、及びそのエラー通知の内容に応じて、エラーレベルを特定し、エラー詳細記録レジスタ51bにエラー詳細データを書き込む。
構成記録レジスタ58は、エラー詳細データ以外にMMB30に送信すべきデータ(以降「構成データ」)の格納に用いられる。後述するように、MC27でのAS信号の出力は、CPUコア56の制御によって行われる。CPUコア56にAS信号を出力させる制御を行わせるプログラムは、例えばBIOSコード、SMIハンドラ(System Management Interrupt Handler)、及び各種ドライバ等である。SMIハンドラは、対応付けられたイベントの処理のために呼び出されて実行されるプログラムである。構成記録レジスタ58に格納された構成データは、MC27からAS信号が出力された場合、BMC26が必要に応じて読み出す。
レジスタリード/ライト処理回路52は、BMC26からの要求により、エラー記録レジスタ51a、或いはエラー詳細記録レジスタ51bにアクセスする。BMC26は、レジスタリード/ライト処理回路52を介して、エラー記録レジスタ51a、及びエラー詳細記録レジスタ51bにそれぞれ格納されたデータを取得することができる。
図4Aに表すように、MC27は、エラー処理回路61、AS処理回路62、レジスタリード/ライト処理回路63、CPU間if回路64、FW(Firm Ware)通信制御回路65、DIMMif回路66、メモリ制御回路67、及びSB間if回路68を備えている。
CPU間if回路64は、CPU21と通信を行うための回路である。FW通信制御回路65は、CPU間if回路64を介してCPU21から受信した要求を処理でする回路である。CPU21からのAS信号の出力要求をCPU間if回路64が受信した場合、FW通信制御回路65は、出力要求を処理し、AS処理回路62にAS信号を出力させるためのAS通知を行う。このAS通知は、割り込み通知を行う要因を指定する。
DIMMif回路66は、メモリモジュール23にアクセスするための回路である。メモリ制御回路67は、DIMMif回路66を介して、メモリモジュール23へのアクセスを制御する。SB間if回路68は、ダミーカード29及びIOスロット28を介して、他のシステムボード20を含むモジュール装置との通信を実現させる。
エラー処理回路61は、BMC26へのエラー信号の出力に用いられる回路である。エラー処理回路61は、上記CPU21のエラー処理回路51と同様に、エラーレベル数と同数のビットを少なくとも有するエラー記録レジスタ61a、エラー詳細データが格納されるエラー詳細記録レジスタ61b、ORゲート61c、及びライト処理回路61dを備えている。
エラー記録レジスタ61aの各ビットには、それぞれ異なるエラーレベルが割り当てられ、各ビットの値は、対応するエラーレベルのエラー信号(図4C中「ERROR[1]~ERROR[N]と表記)としてBMC26に出力される。各ビットの値、つまり各エラーレベルのエラー信号は、上記のように、例えば1のときにアサート、0のときにネゲートとなる。
CPU間if回路64、DIMMif回路66、メモリ制御回路67、及びSB間if回路68は、何れもエラーを検出し、検出したエラーをエラー処理回路61に通知する機能を備えている。ライト処理回路61dは、例えばCPU間if回路64、DIMMif回路66、メモリ制御回路67、或いはSB間if回路68からのエラー通知により、エラー記録レジスタ61a中の1ビットの値を1に書き換える。また、ライト処理回路61dは、例えばエラー通知を行った構成要素、及びそのエラー通知の内容に応じて、エラーレベルを特定し、エラー詳細記録レジスタ51bにエラー詳細データを書き込む。
エラーレベルN-1のエラー信号とエラーレベルNのエラー信号は、ORゲート61cによって論理和が取られ、ORゲート61cの出力する論理和がエラーレベルN-1のエラー信号としてBMC26に出力される。それにより、BMC26が受信するエラーレベルN-1のエラー信号は、エラーレベルN-1とエラーレベルNのエラー信号のうちの何れか1つがアサートとなった場合にアサートとなる。このため、BMC26は、エラーレベルN-1のエラー信号から、エラーレベルN-1とエラーレベルNのエラー信号のうちの何れかがアサートとなったことを認識することができる。ORゲート61cによって論理和を取るエラー信号(信号線)の数は、2つ以上であれば良いことから、その数は2つに限定されるものではない。
AS処理回路62は、BMC26へのAS信号の出力に用いられる回路である。AS処理回路62は、割り込みの要因数と同数のビットを有するAS要因レジスタ62a、ORゲート62b、及びライト処理回路62cを備えている。
AS要因レジスタ62aの各ビットには、それぞれ異なる割り込み要因が割り当てられ、各ビットの値は、対応する割り込み要因のAS信号に相当する。各ビットの値、つまり各割り込み要因のAS信号は、例えば1のときにアサート、0のときにネゲートとなる。ライト処理回路62cは、FW通信制御回路65からのAS通知に従い、AS要因レジスタ62a中の1ビットの値を1に書き換える。図4Aには、CPU21のCPUコア56にAS通知を行わせるプログラムとして、BIOSコード、SMIハンドラ、及びドライバを表記している。ハードウェアは、例えばSMIハンドラを介してAS通知を行わせる。
AS要因レジスタ62aの各ビットの値は全てORゲート62bに出力される。ORゲート62bは、AS要因レジスタ62aの各ビットの値の論理和を取り、その論理和を出力する。ORゲート62bの出力する論理和は、エラーレベルNのエラー信号としてBMC26に出力される。ORゲート62bの出力する論理和は、全ての割り込み要因のAS信号の論理和であることから、以降「AS論理和信号」と呼ぶこととする。
レジスタリード/ライト処理回路63は、BMC26からの要求により、エラー処理回路61のエラー記録レジスタ61a、若しくはエラー詳細記録レジスタ61b、或いはAS処理回路62のAS要因レジスタ62aにアクセスする。BMC26は、レジスタリード/ライト処理回路63を介して、エラー処理回路61のエラー記録レジスタ61a、及びエラー詳細記録レジスタ61b、並びにAS処理回路62のAS要因レジスタ62aにそれぞれ格納されたデータを取得することができる。
図4Cに表すように、BMC26は、エラー処理回路71、MC割込処理回路72、レジスタリード/ライト処理回路73、及びSB管理回路74を備えている。MMB30は、BMC情報処理回路31を備えている。
BMC26のエラー処理回路71は、エラー通知を常時監視し、エラー通知に対応するための処理回路である。MC割込処理回路72は、AS信号による割り込み通知を常時監視し、割り込み通知に対応するための処理回路である。レジスタリード/ライト処理回路73は、CPU21或いはMC27からデータを読み出すための回路である。SB管理回路74は、エラーの発生、及び割り込み通知を常時監視し、エラーの発生、及び割り込み通知をMMB30に通知する。
図4A~図4Cに表すように、CPU21のエラー処理回路51から出力される1~N-1のエラーレベルのエラー信号は、MC27のエラー処理回路61から1~N-1のエラーレベルのエラー信号が出力される同じ信号線を介してBMC26に入力される。CPU21のエラー処理回路51から出力されるエラーレベルNのエラー信号は、MC27のAS処理回路62からエラーレベルNのエラー信号として出力されるAS論理和信号と同じ信号線を介してBMC26に入力される。このため、BMC26は、エラーレベルに係わらず、エラー信号の出力先を特定することはできない。このことから、BMC26は、アサートとなったエラー信号のエラーレベルに応じて、以下のようなアクセスをCPU21及びMC27に対して行う。
アサートとなったエラー信号のエラーレベルが1~N-1の間であった場合、BMC26は、CPU21のエラー処理回路51の各レジスタ51a、51b、並びにMC27のエラー処理回路61の各レジスタ61a、61bのそれぞれのデータを取得する。それにより、BMC26は、アサートのエラー信号の出力先を特定すると共に、その出力先からエラー詳細データを取得する。このようなデータの取得は、エラー処理回路71がレジスタリード/ライト処理回路73を制御することで行われる。エラー処理回路71は、特定した出力先から得られたエラー詳細データをSB管理装置74に出力する。SB管理装置74は、エラー処理回路71から入力したエラー詳細データを用いてエラー処理を行い、そのエラー詳細データをMMB30に送信する。
エラーレベルNのエラー信号は、エラー処理回路71の他に、MC割込処理回路72にも入力する。それにより、アサートとなったエラー信号のエラーレベルがNであった場合、エラー処理回路71及びMC割込処理回路72は並行して動作する。
エラー処理回路71は、レジスタリード/ライト処理回路73を制御して、CPU21及びMC27の各エラー処理回路51、61から各レジスタ51a、51b、61a、61bのデータを取得する。それにより、エラー処理回路71は、アサートのエラー信号の出力先を特定すると共に、その出力先がCPU21であればエラー詳細データをCPU21から取得する。エラー処理回路71は、例えばエラー信号の出力先からのエラー信号をネゲートさせるために、レジスタリード/ライト処理回路73を介して、その出力先のエラー処理回路51、或いは61のエラー記録レジスタに各ビットの値が0のデータを格納させる。
一方、MC割込処理回路72は、レジスタリード/ライト処理回路73を制御して、MC27のAS処理回路62のAS要因レジスタ62aのデータを取得し、取得したデータから、何れかのAS信号がアサートとなっているか否か確認する。CPU21は、構成記録レジスタ58に、MMB30に送信すべき構成データを格納する。何れかのAS信号がアサートとなっているのを確認したMC割込処理回路72は、次に構成データを必要に応じて取得する。ここでは、構成記録レジスタ58に格納されている構成データの取得は、例えばレジスタリード/ライト処理回路73を介したCPU21のレジスタリード/ライト処理回路52への要求によって行われる。
MC割込処理回路72は、取得した構成データをSB管理回路74に出力し、SB管理回路74に割込処理を行わせる。MC割込処理回路72は、例えばMC27からのAS論理和信号をネゲートさせるために、レジスタリード/ライト処理回路73を介して、MC27のAS処理回路62のAS要因レジスタ62aに各ビットの値が0のデータを格納させる。
SB管理回路74は、エラー通知によるエラー処理、割り込み通知による割込処理をそれぞれ実行することにより、MMB30に対し、エラー詳細データ、或いは構成データを随時、送信する。それにより、MMB30のBMC情報処理回路31は、BMC26から受信したエラー詳細データ、或いは構成データを処理し、コンピュータシステム全体の制御、或いはオペレータへの通知等を行う。
ここで、CPU21がMC27に換装されていない場合、つまりMC27の位置にCPU21が実装されている場合のBMC26の動作について簡単に説明する。
この場合のエラー処理回路71の動作は、上記と同じものであっても良い。しかし、エラーレベルNのエラー信号がアサートとなっても、CPU21にはAS処理回路62が存在しないため、MC割込処理回路72はアサートとなったAS信号を特定できず、事実上、動作しない。エラーレベルNのエラー信号がアサートとなった状況では、2つのCPU21のうちの何れかがエラーレベルNのエラー信号をアサートにしている。このため、エラー処理回路71は、アサートのエラー信号を出力しているCPU21を特定し、特定したCPU21から取得されたエラー詳細データをSB管理回路74に出力することとなる。このようなことから、BMC26は、CPU21、及びMC27の何れが実装されていても、適切に動作することとなる。そのため、BMC26は、図2に表すような既存のシステムボード1’のBMC17として実装させても良い。
この場合のエラー処理回路71の動作は、上記と同じものであっても良い。しかし、エラーレベルNのエラー信号がアサートとなっても、CPU21にはAS処理回路62が存在しないため、MC割込処理回路72はアサートとなったAS信号を特定できず、事実上、動作しない。エラーレベルNのエラー信号がアサートとなった状況では、2つのCPU21のうちの何れかがエラーレベルNのエラー信号をアサートにしている。このため、エラー処理回路71は、アサートのエラー信号を出力しているCPU21を特定し、特定したCPU21から取得されたエラー詳細データをSB管理回路74に出力することとなる。このようなことから、BMC26は、CPU21、及びMC27の何れが実装されていても、適切に動作することとなる。そのため、BMC26は、図2に表すような既存のシステムボード1’のBMC17として実装させても良い。
図5A~図5Cは、CPU、MC及びBMCの動作の流れの例を表すフローチャートである。このフローチャートは、CPU21、或いはMC27がエラーレベルNのエラー信号をアサートする場合を想定したものであり、BMC26はCPU21とMC27の接続を認識していることを前提としている。次に図5A~図5Cを参照して、CPU21、MC27及びBMC26の動作を説明する。
初めに、CPU21がエラーレベルNのエラー信号をアサートした場合について説明する。
CPU21は、エラーレベルNのエラーの発生を検出すると、エラーレベルNのエラー信号をアサートする(SC1)。アサートされたエラーレベルNのエラー信号は、BMC26のエラー処理回路71、及びMC割込処理回路72にそれぞれ入力され検知される(SB1)。その結果、エラー処理回路71は、レジスタリード/ライト処理回路73を制御して、CPU21のエラー処理回路51の各レジスタ51a、51bからのデータの読み出し(read)要求を行う(SB2)。その読み出し要求により、CPU21のレジスタリード/ライト処理回路52は、エラー処理回路51の各レジスタ51a、51bのデータを読み出してBMC26に送信する(SC2)。
CPU21は、エラーレベルNのエラーの発生を検出すると、エラーレベルNのエラー信号をアサートする(SC1)。アサートされたエラーレベルNのエラー信号は、BMC26のエラー処理回路71、及びMC割込処理回路72にそれぞれ入力され検知される(SB1)。その結果、エラー処理回路71は、レジスタリード/ライト処理回路73を制御して、CPU21のエラー処理回路51の各レジスタ51a、51bからのデータの読み出し(read)要求を行う(SB2)。その読み出し要求により、CPU21のレジスタリード/ライト処理回路52は、エラー処理回路51の各レジスタ51a、51bのデータを読み出してBMC26に送信する(SC2)。
BMC26のエラー処理回路71は、レジスタリード/ライト処理回路73を介して、CPU21のエラー処理回路51の各レジスタ51a、51bに格納されているデータを取得し、レジスタ51aのデータからエラーが有るか否か判定する(SB3)。レジスタ51aのデータがエラー通知の存在を表していた場合、判定はYesとなり、エラー処理回路71はSB管理回路74に、レジスタ51bのデータであるエラー詳細データ等を出力し、エラー処理の実行を要求する。その結果、SB管理回路74は、エラー詳細データをMMB30に送信するといったエラー処理を実行する(SB21)。一方、レジスタ51aのデータがエラー通知の存在を表していない場合、判定はNoとなり、エラー処理回路71はエラー処理をSB管理回路74に要求することなく、検知されたエラーレベルNのエラー信号に対応する処理を終了する(SB4)。
BMC26のMC割込処理回路72は、アサートされたエラーレベルNのエラー信号を検知すると、次に、レジスタリード/ライト処理回路73を制御して、MC27のAS処理回路62のAS要因レジスタ62aからのデータの読み出し(read)要求を行う(SB11)。その読み出し要求により、MC27のレジスタリード/ライト処理回路63は、AS処理回路62のAS要因レジスタ62aのデータを読み出してBMC26に送信する(SM2)。
BMC26のMC割込処理回路72は、レジスタリード/ライト処理回路73を介して、MC27のAS処理回路62のAS要因レジスタ62aに格納されているデータを取得し、取得したデータから割り込み通知が有るか否か判定する(SB12)。AS要因レジスタ62aのデータが割り込み通知の存在を表していた場合、判定はYesとなり、MC割込処理回路72はSB管理回路74に、エラー処理回路71がCPU21へのリード要求(SB2)により取得した構成データ等を出力し、割込処理の実行を要求する。その結果、SB管理回路74は、構成データをMMB30に送信するといった割込処理を実行する(SB21)。一方、取得したデータが割り込み通知の存在を表していない場合、判定はNoとなり、MC割込処理回路72は割込処理をSB管理回路74に要求することなく、検知されたエラーレベルNのエラー信号に対応する処理を終了する(SB13)。
CPU21がエラーレベルNのエラー信号をアサートした場合、エラー処理回路71のCPU21から取得したデータによるSB3での判定結果はYesとなり、MC割込処理回路72のMC27から取得したデータによるSB12の判定結果はNoとなる。このため、SB管理回路74はSB21でエラー処理を実行することとなる。また、特には図示していないが、エラー処理回路71は、CPU21のエラー処理回路51のエラー記録レジスタ51aに全てのビットの値が0のデータを格納させることとなる。
MC27がエラーレベルNのエラー信号をアサートした場合、つまりMC27がAS論理和信号をアサートした場合、エラー処理回路71、及びMC割込処理回路72は上記と同様の処理を実行する。しかし、この場合、エラー処理回路71のCPU21から取得したデータによるSB3での判定結果はNoとなり、MC割込処理回路72のMC27から取得したデータによるSB12の判定結果はYesとなる。このため、SB管理回路74はSB21で割込処理を実行することとなる。また、特には図示していないが、MC割込処理回路72は、MC27のAS処理回路62のAS要因レジスタ62aに全てのビットの値が0のデータを格納させることとなる。
なお、本実施形態では、図2に表すような既存のシステムボード1’をシステムボード20に変更し、システムボード20を複数、接続することでリソース拡張を実現させているが、リソース拡張はこのような方法に限定されない。リソース拡張は、例えばシステムボード20に図1に表すようなシステムボード1を接続することで行っても良い。また、リソース拡張のために接続する装置は、システムボード20、或いは1のようなモジュール装置ではなく、通信機能を備えたコンピュータ(データ処理装置)であっても良い。システムボード20の構成も、図3に表すようなものに限定されるものではない。例えばシステムボード20は、3台以上のCPU21を搭載可能なものであっても良い。
Claims (9)
- 中央処理装置を備えたデータ処理装置に搭載される半導体装置であって、
前記中央処理装置と通信を行うための第1の通信手段と、
前記中央処理装置と接続可能なスロットを介して、他のデータ処理装置と通信を行うための第2の通信手段と、
前記データ処理装置を管理する管理装置に前記中央処理装置からの割り込みを通知する割込通知手段と、
を具備することを特徴とする半導体装置。 - 請求項1記載の半導体装置であって、
前記管理装置にエラーの発生を通知するためのエラー通知手段、を具備し、
前記割込通知手段、及び前記エラー通知手段はそれぞれ、前記管理装置に接続された複数の信号線のなかで割り当てられた異なる1つ以上の信号線を用いて、前記割り込み、及び前記エラーの通知を行う。 - 請求項2記載の半導体装置と接続される管理装置であって、
前記複数の信号線のうちの何れかを介して送信される第1の信号を入力し第1の処理を行う第1の処理手段と、
前記複数の信号線のうちで予め定められた1つ以上の信号線を介して送信される第2の信号を入力し第2の処理を行う第2の処理手段と、
を具備することを特徴とする管理装置。 - 請求項3記載の管理装置であって、
前記複数の信号線は、前記半導体装置の他に前記中央処理装置と接続され、該中央処理装置による前記第1の信号の送信に用いられ、
前記第1の処理手段は、前記1つ以上の信号線を介して送信された信号を受信した場合に、前記複数の信号線とは異なる他の信号線を介して、前記中央処理装置から前記第1の信号に係わる第1のデータを少なくとも取得し、該第1のデータにより該中央処理装置からの該第1の信号の送信が確認されることを条件に、前記第1の処理を行い、
前記第2の処理手段は、前記1つ以上の信号線を介して送信された信号を受信した場合に、前記他の信号線を介して、前記半導体装置から前記第2の信号に係わる第2のデータを少なくとも取得し、該第2のデータにより該半導体装置からの該第2の信号の送信が確認されることを条件に、前記第2の処理を行う。 - 中央処理装置を備えたデータ処理装置において、
前記データ処理装置は、1つ以上の前記中央処理装置と、該中央処理装置に接続された半導体装置と、該データ処理装置を管理する管理装置とを備え、
前記半導体装置は、
前記中央処理装置と通信を行うための第1の通信手段と、
前記中央処理装置と接続可能なスロットを介して、他のデータ処理装置と通信を行うための第2の通信手段と、
前記管理装置に前記中央処理装置からの割り込みを通知する割込通知手段と、
を具備することを特徴とするデータ処理装置。 - 請求項5記載のデータ処理装置であって、
前記半導体装置は、前記管理装置にエラーの発生を通知するためのエラー通知手段、を備え、
前記割込通知手段、及び前記エラー通知手段はそれぞれ、前記管理装置に接続された複数の信号線のなかで割り当てられた異なる1つ以上の信号線を用いて、前記割り込み、及び前記エラーの通知を行う。 - 請求項6記載のデータ処理装置であって、
前記複数の信号線は、前記半導体装置の他に前記中央処理装置と接続され、該中央処理装置による前記エラーの通知に用いられ、
前記管理装置は、
前記複数の信号線のうちの何れかを介した前記エラーの通知を処理する第1の処理手段と、
前記複数の信号線のうちで予め定められた1つ以上の信号線を介した前記割り込みの通知を処理する第2の処理手段と、
を具備する。 - 請求項7記載のデータ処理装置であって、
前記管理装置は、前記複数の信号線とは異なる他の信号線を介して、前記半導体装置、及び前記中央処理装置と接続され、
前記第1の処理手段は、前記1つ以上の信号線を介した通知が行われた場合に、前記他の信号線を介して、前記中央処理装置から前記エラーの通知に係わる第1のデータを少なくとも取得し、該第1のデータにより該中央処理装置からの該エラーの通知が確認されることを条件に、該エラーの通知を処理し、
前記第2の処理手段は、前記1つ以上の信号線を介した通知が行われた場合に、前記他の信号線を介して、前記半導体装置から前記割り込みの通知に係わる第2のデータを少なくとも取得し、該第2のデータにより該半導体装置からの該割り込みの通知が確認されることを条件に、該割り込みの通知を処理する。 - 接続されたソケットを介してエラー信号および割り込み信号を外部に送出する半導体装置であって、
前記エラー信号の出力に用いることが可能な信号線毎に、該エラー信号を生成する第1の生成手段と、
前記第1の生成手段が生成した2つ以上の信号線分の前記エラー信号の論理和を取る論理和手段と、
前記論理和手段が取った論理和、及び該論理和手段が論理和を取っていない前記エラー信号を、前記エラー信号の出力に用いることが可能な信号線を介して前記ソケットに出力する第1の出力手段と、
前記割り込み信号を生成する第2の信号生成手段と、
前記第2の信号生成手段が生成した前記割り込み信号を、前記エラー信号の出力に用いることが可能な信号線のうちの一つを介して前記ソケットに出力する第2の出力手段と、
を具備することを特徴とする半導体装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2011/069221 WO2013027297A1 (ja) | 2011-08-25 | 2011-08-25 | 半導体装置、管理装置、及びデータ処理装置 |
US14/184,749 US20140173365A1 (en) | 2011-08-25 | 2014-02-20 | Semiconductor apparatus, management apparatus, and data processing apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2011/069221 WO2013027297A1 (ja) | 2011-08-25 | 2011-08-25 | 半導体装置、管理装置、及びデータ処理装置 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
US14/184,749 Continuation US20140173365A1 (en) | 2011-08-25 | 2014-02-20 | Semiconductor apparatus, management apparatus, and data processing apparatus |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2013027297A1 true WO2013027297A1 (ja) | 2013-02-28 |
Family
ID=47746077
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/JP2011/069221 WO2013027297A1 (ja) | 2011-08-25 | 2011-08-25 | 半導体装置、管理装置、及びデータ処理装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20140173365A1 (ja) |
WO (1) | WO2013027297A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10642773B2 (en) * | 2018-03-28 | 2020-05-05 | Lenovo Enterprise Solutions (Singapore) Pte. Ltd | BMC coupled to an M.2 slot |
US11243859B2 (en) * | 2019-10-09 | 2022-02-08 | Microsoft Technology Licensing, Llc | Baseboard management controller that initiates a diagnostic operation to collect host information |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11175491A (ja) * | 1997-10-06 | 1999-07-02 | Internatl Business Mach Corp <Ibm> | Dspベースのマルチバス多重通信アダプタ |
JP2003256240A (ja) * | 2002-02-28 | 2003-09-10 | Toshiba Corp | 情報処理装置及びその障害回復方法 |
JP2006209456A (ja) * | 2005-01-28 | 2006-08-10 | Fujitsu Ltd | 複数の処理ノードをシリアルバスにより相互接続する装置 |
JP2008293342A (ja) * | 2007-05-25 | 2008-12-04 | Nikon Corp | 通信用拡張ボ−ド、マルチプロセッサシステム及びそれを用いた露光装置 |
JP2010124235A (ja) * | 2008-11-19 | 2010-06-03 | Hitachi Kokusai Electric Inc | 通信処理装置 |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB1574468A (en) * | 1976-09-30 | 1980-09-10 | Burroughs Corp | Input-output subsystem in a digital data processing system |
US4074352A (en) * | 1976-09-30 | 1978-02-14 | Burroughs Corporation | Modular block unit for input-output subsystem |
US4162520A (en) * | 1976-09-30 | 1979-07-24 | Burroughs Corporation | Intelligent input-output interface control unit for input-output subsystem |
GB1574469A (en) * | 1976-09-30 | 1980-09-10 | Borroughs Corp | Interface system providing interfaces to central processing unit and modular processor-controllers for an input-out-put subsystem |
US5943506A (en) * | 1996-03-25 | 1999-08-24 | Intel Corporation | System for facilitating data I/O between serial bus input device and non-serial bus cognition application by generating alternate interrupt and shutting off interrupt triggering activities |
US6397268B1 (en) * | 1996-10-01 | 2002-05-28 | Compaq Information Technologies Group, L.P. | Tracking PCI bus numbers that change during re-configuration |
US7162560B2 (en) * | 2003-12-31 | 2007-01-09 | Intel Corporation | Partitionable multiprocessor system having programmable interrupt controllers |
US7430673B2 (en) * | 2005-06-30 | 2008-09-30 | Intel Corporation | Power management system for computing platform |
US20070088988A1 (en) * | 2005-10-14 | 2007-04-19 | Dell Products L.P. | System and method for logging recoverable errors |
JP4827564B2 (ja) * | 2006-03-15 | 2011-11-30 | 株式会社日立製作所 | コピーペアのペア状態の表示方法 |
US8739035B2 (en) * | 2006-10-11 | 2014-05-27 | Intel Corporation | Controls and indicators with on-screen cognitive aids |
US7716515B2 (en) * | 2006-12-21 | 2010-05-11 | Inventec Corporation | Method for updating the timing of a baseboard management controller |
US20100205600A1 (en) * | 2009-02-06 | 2010-08-12 | Inventec Corporation | Simulation method for realizing large batches and different kinds of baseboard management controllers using a single server |
JP5093259B2 (ja) * | 2010-02-10 | 2012-12-12 | 日本電気株式会社 | Biosとbmcとの間の通信パス強化方法、その装置及びそのプログラム |
TW201220053A (en) * | 2010-11-04 | 2012-05-16 | Inventec Corp | Server system and method for processing power off |
CN102479166A (zh) * | 2010-11-26 | 2012-05-30 | 鸿富锦精密工业(深圳)有限公司 | 共享串口的系统及方法 |
US20130346584A1 (en) * | 2011-06-02 | 2013-12-26 | Hitachi, Ltd. | Control method for virtual computer, and virtual computer system |
US8499112B2 (en) * | 2011-08-16 | 2013-07-30 | Hitachi, Ltd. | Storage control apparatus |
CN103176883A (zh) * | 2011-12-20 | 2013-06-26 | 鸿富锦精密工业(深圳)有限公司 | 固态硬盘状态监控系统 |
US20130198578A1 (en) * | 2012-02-01 | 2013-08-01 | Texas Instruments Incorporated | Maximizing Re-Use of External Pins of an Integrated Circuit for Testing |
US9331899B2 (en) * | 2013-03-13 | 2016-05-03 | American Megatrends, Inc. | Scalable BMC management stacks using virtual networks on single physical network device |
US9880867B2 (en) * | 2013-12-06 | 2018-01-30 | Vmware, Inc. | Method and subsystem for data exchange between a guest operating system and a virtualization layer |
US9529750B2 (en) * | 2014-07-14 | 2016-12-27 | American Megatrends, Inc. | Service processor (SP) initiated data transaction with bios utilizing interrupt |
US10064304B2 (en) * | 2014-09-08 | 2018-08-28 | Quanta Computer Inc. | Separated server back plane |
-
2011
- 2011-08-25 WO PCT/JP2011/069221 patent/WO2013027297A1/ja active Application Filing
-
2014
- 2014-02-20 US US14/184,749 patent/US20140173365A1/en not_active Abandoned
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11175491A (ja) * | 1997-10-06 | 1999-07-02 | Internatl Business Mach Corp <Ibm> | Dspベースのマルチバス多重通信アダプタ |
JP2003256240A (ja) * | 2002-02-28 | 2003-09-10 | Toshiba Corp | 情報処理装置及びその障害回復方法 |
JP2006209456A (ja) * | 2005-01-28 | 2006-08-10 | Fujitsu Ltd | 複数の処理ノードをシリアルバスにより相互接続する装置 |
JP2008293342A (ja) * | 2007-05-25 | 2008-12-04 | Nikon Corp | 通信用拡張ボ−ド、マルチプロセッサシステム及びそれを用いた露光装置 |
JP2010124235A (ja) * | 2008-11-19 | 2010-06-03 | Hitachi Kokusai Electric Inc | 通信処理装置 |
Also Published As
Publication number | Publication date |
---|---|
US20140173365A1 (en) | 2014-06-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7565911B2 (ja) | 専用低レイテンシリンクを使用した複数のハードウェアアクセラレータのための統合されたアドレス空間 | |
CN107278299B (zh) | 经由可重配置的虚拟交换机实现次级总线功能性的方法、装置和系统 | |
EP3274861B1 (en) | Reliability, availability, and serviceability in multi-node systems with disaggregated memory | |
US10127170B2 (en) | High density serial over LAN management system | |
JP6225154B2 (ja) | 共有メモリリンクの低電力エントリ | |
CN107870882B (zh) | 用于管理外围设备的数据协议 | |
JP4855451B2 (ja) | 記憶装置のアクセス方法及び装置 | |
US10846256B2 (en) | Multi-endpoint device sideband communication system | |
CN104572517A (zh) | 提供被请求数据的方法、控制器以及计算机系统 | |
US11436182B2 (en) | System and method for handling in-band interrupts on inactive I3C channels | |
US20130166672A1 (en) | Physically Remote Shared Computer Memory | |
US10606784B1 (en) | Software filtering of redundant sideband device management bus communications | |
US10324888B2 (en) | Verifying a communication bus connection to a peripheral device | |
JPH11161625A (ja) | コンピュータ・システム | |
JP2011070655A (ja) | 情報処理装置、メモリダンプシステムおよびメモリダンプ方法 | |
CN103955441A (zh) | 一种设备管理系统、方法及一种io扩展接口 | |
CN108132910A (zh) | 系统互连以及具有系统互连的片上系统 | |
US10157005B2 (en) | Utilization of non-volatile random access memory for information storage in response to error conditions | |
US5951661A (en) | Bus protocol violation monitor systems and methods | |
US11953974B2 (en) | Method for PCIe fallback in a CXL system | |
WO2013027297A1 (ja) | 半導体装置、管理装置、及びデータ処理装置 | |
JPWO2012023183A1 (ja) | 計算機管理装置、計算機管理システム及び計算機システム | |
CN112612741A (zh) | 一种多路服务器 | |
CN107818061B (zh) | 关联外围设备的数据总线和管理总线 | |
KR20180023543A (ko) | 시리얼 통신으로 메모리를 제공하기 위한 장치 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 11871172 Country of ref document: EP Kind code of ref document: A1 |
|
ENP | Entry into the national phase |
Ref document number: 2013529829 Country of ref document: JP Kind code of ref document: A |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 11871172 Country of ref document: EP Kind code of ref document: A1 |