JPH07219796A - Information processor - Google Patents
Information processorInfo
- Publication number
- JPH07219796A JPH07219796A JP6012893A JP1289394A JPH07219796A JP H07219796 A JPH07219796 A JP H07219796A JP 6012893 A JP6012893 A JP 6012893A JP 1289394 A JP1289394 A JP 1289394A JP H07219796 A JPH07219796 A JP H07219796A
- Authority
- JP
- Japan
- Prior art keywords
- error
- group
- contents
- storage means
- processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 claims description 38
- 230000010365 information processing Effects 0.000 claims description 20
- 238000011084 recovery Methods 0.000 claims description 11
- 238000002360 preparation method Methods 0.000 claims 1
- 101100367235 Arabidopsis thaliana SVR3 gene Proteins 0.000 description 9
- 238000000034 method Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 4
- 230000003213 activating effect Effects 0.000 description 2
- 101100170106 Arabidopsis thaliana At5g55565 gene Proteins 0.000 description 1
- 101100331427 Arabidopsis thaliana DGP2 gene Proteins 0.000 description 1
- 101000935043 Homo sapiens Integrin beta-1 Proteins 0.000 description 1
- 102100025304 Integrin beta-1 Human genes 0.000 description 1
- 101150045663 WDR12 gene Proteins 0.000 description 1
- 239000013256 coordination polymer Substances 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Landscapes
- Retry When Errors Occur (AREA)
Abstract
Description
【0001】[0001]
【産業上の利用分野】本発明は、エラー復帰機構を有す
る情報処理装置に関し、特に、ソフトウェアに開放され
るレジスタ(ソフトウェアビジブルレジスタ、以下、S
VRという)のエラー復帰機構を有する情報処理装置に
関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an information processing device having an error recovery mechanism, and more particularly to a register opened to software (software visible register, hereinafter referred to as S
The present invention relates to an information processing device having an error recovery mechanism (referred to as VR).
【0002】[0002]
【従来の技術】従来の情報処理装置においては、中央処
理装置内で障害が発生した場合、障害の影響を受けたデ
ータを、SVRに書き込んでしまうと、障害発生時点か
らの命令の再試行が困難になる。なぜなら、障害の影響
を受けたデータをSVRに書き込むことにより、再試行
に必要なデータが上書きされて失われてしまうからであ
る。2. Description of the Related Art In a conventional information processing apparatus, when a failure occurs in the central processing unit, if the data affected by the failure is written to the SVR, the instruction is retried from the time when the failure occurred. It will be difficult. This is because the data required for the retry is overwritten and lost by writing the data affected by the failure in the SVR.
【0003】障害発生時にSVRに書き込まないように
することは理論的には可能であるが、実際には中央処理
装置内の各部からエラー発生信号を集めてSVRへの書
き込みを抑止しなければならず、この処理に時間がかか
ってしまう。特に、近年の情報処理装置は高速なクロッ
クの下で動作しており、SVRへの書込み抑止がさらに
困難になっている。It is theoretically possible not to write to the SVR when a failure occurs, but in reality, it is necessary to collect error occurrence signals from various parts in the central processing unit to suppress the writing to the SVR. However, this process takes time. In particular, recent information processing devices operate under a high-speed clock, and it is more difficult to suppress writing to the SVR.
【0004】この種の障害復帰機構は、例えば、米国特
許第4,996,687号に示されるように、中央処理装置とバ
スを介して接続しているメインメモリのメモリチップに
おけるソフトエラーからの復帰を目的とし、メインメモ
リと同一内容のバックアップメモリを設けて障害発生時
にこのバックアップメモリの内容をメインメモリに戻す
ように構成している。A failure recovery mechanism of this type is intended to recover from a soft error in a memory chip of a main memory connected to a central processing unit via a bus, as shown in US Pat. No. 4,996,687, for example. A backup memory having the same contents as the main memory is provided, and the contents of the backup memory are returned to the main memory when a failure occurs.
【0005】[0005]
【発明が解決しようとする課題】上述の従来技術では、
中央処理装置内の状態は適宜バックアップすることがで
きない。そのため、例えば演算器で発生したエラーによ
ってSVRに誤ったデータが上書きされてしまったよう
な場合等には対処することができない、といった問題が
ある。In the above-mentioned prior art,
The state in the central processing unit cannot be backed up appropriately. Therefore, for example, there is a problem that it is impossible to deal with a case where erroneous data is overwritten in the SVR due to an error occurring in the arithmetic unit.
【0006】また、上記エラー処理をする際に、ある命
令の処理途中に中央処理装置をリセットしてしまった場
合には、リセット後その命令の再試行をしても成功しな
いおそれがある。Further, if the central processing unit is reset during the processing of a certain instruction during the error processing, there is a possibility that the instruction may not be retried even after the reset.
【0007】一方、緊急性が要求され、再試行すること
よりも即座に割り込みを起こす必要がある場合もある。On the other hand, there is a case where urgency is required and it is necessary to generate an interrupt immediately rather than retrying.
【0008】本発明の目的は、上述のような問題を解消
し、中央処理装置内部のエラーによりSVRに誤ったデ
ータが上書きされてしまった場合でも、エラー発生時点
からの命令の再試行を可能とし、耐故障性の高い情報処
理装置を実現するためのエラー復帰機構を提供すること
にある。さらに、このエラー復帰機構を柔軟に実現する
ことを目的とする。The object of the present invention is to solve the above-mentioned problems, and even if incorrect data is overwritten in the SVR due to an internal error of the central processing unit, it is possible to retry the instruction from the time when the error occurs. Another object of the present invention is to provide an error recovery mechanism for realizing an information processing device with high fault tolerance. Furthermore, it aims at realizing this error recovery mechanism flexibly.
【0009】また、本発明の他の目的は、リセット後の
命令の再試行が成功する確率を高めるためにエラー処理
を起動するタイミングを調節することにある。さらに、
エラーの発生場所を特定して適切な状態から再試行させ
ることを目的とする。Another object of the present invention is to adjust the timing at which error processing is activated in order to increase the probability of successful retry of an instruction after reset. further,
The purpose is to identify the location of the error and retry from an appropriate state.
【0010】さらに、本発明の他の目的は、再試行を優
先するか、緊急性を優先するかを、モード設定により選
択することにある。Further, another object of the present invention is to select whether to give priority to retries or urgency by mode setting.
【0011】[0011]
【課題を解決するための手段】上記課題を解決するため
本願発明では、少なくとも1つのワードからなる一群の
記憶手段を含む中央処理装置を有する情報処理装置にお
けるエラー復帰機構であって、その一群の記憶手段と同
一の構成を有しその記憶手段に対してあるデータが書き
込まれた時点以降に当該データを書き込まれる一群の予
備記憶手段を含んでもよい。また、中央処理装置で発生
したエラーを検出するエラー検出手段を含んでもよい。
さらに、そのエラー検出手段からのエラー通知に応じ
て、中央処理装置におけるエラーの処理を行い、中央処
理装置を復帰させるエラー処理手段を含んでもよい。In order to solve the above problems, according to the present invention, there is provided an error recovery mechanism in an information processing apparatus having a central processing unit including a group of storage means composed of at least one word. It may include a group of auxiliary storage means having the same structure as the storage means and having the data written therein after a certain data is written in the storage means. It may also include error detection means for detecting an error that has occurred in the central processing unit.
Further, it may include an error processing unit that processes an error in the central processing unit and returns the central processing unit in response to the error notification from the error detection unit.
【0012】また、エラー処理手段は、中央処理装置に
おけるエラーの原因を解析して、記憶手段および予備記
憶手段の内容を退避領域に退避した後、中央処理装置を
リセットして、その退避領域の内容を記憶手段および予
備記憶手段にリストアするエラー処理プロセッサをさら
に含んでもよい。The error processing means analyzes the cause of the error in the central processing unit, saves the contents of the storage means and the preliminary storage means in the save area, and then resets the central processing unit to save the saved area. It may further include an error processing processor for restoring the contents to the storage means and the preliminary storage means.
【0013】また、エラー処理手段は、エラー検出手段
からのエラー報告についてエラー処理の前準備を行い、
エラー復帰に適したタイミングを生成してそのタイミン
グで前記エラー処理プロセッサに対してエラー処理を開
始させるエラー処理ファームウェアをさらに含んでもよ
い。The error processing means prepares for error processing from the error report from the error detection means,
It may further include error processing firmware that generates timing suitable for error recovery and causes the error processing processor to start error processing at the timing.
【0014】また、エラー検出手段は、前記一群の予備
記憶手段で発生したエラーを検出する予備記憶エラー検
出部を含んでもよい。さらにエラー処理手段は、その予
備記憶エラー検出部でエラーが発生したことを示す予備
記憶エラーフラグを含んでもよく、さらにエラー処理プ
ロセッサが、退避領域の内容を記憶手段および予備記憶
手段にリストアする際、予備記憶エラーフラグが”エラ
ー発生”を示していれば記憶手段に関する退避領域の内
容を記憶手段および予備記憶手段にリストアし、予備記
憶エラーフラグが”エラー未発生”を示していれば予備
記憶手段に関する退避領域の内容を記憶手段および予備
記憶手段にリストアしてもよい。Further, the error detecting means may include a preliminary storage error detecting section for detecting an error generated in the group of preliminary storage means. Further, the error processing means may include a preliminary storage error flag indicating that an error has occurred in the preliminary storage error detection unit, and when the error processing processor restores the contents of the save area to the storage means and the preliminary storage means. If the preliminary storage error flag indicates "error occurred", the contents of the save area relating to the storage means are restored to the storage means and the preliminary storage means, and if the preliminary storage error flag indicates "error not occurred", preliminary storage The contents of the save area relating to the means may be restored to the storage means and the preliminary storage means.
【0015】また、エラー処理手段は、エラー検出手段
で検出したエラーをエラー処理プロセッサに直接通知す
るモードと、エラー処理ファームウェアを介してエラー
処理プロセッサを起動するモードのいずれかを指定する
エラー処理モードフラグをさらに含んでもよい。Also, the error processing means specifies an error processing mode in which an error detected by the error detection means is directly notified to the error processing processor or a mode in which the error processing processor is activated via the error processing firmware. It may further include a flag.
【0016】また、上記一群の記憶手段は一群のレジス
タであり、さらに上記一群の予備記憶手段は一群のバッ
クアップレジスタであってもよい。The group of storage means may be a group of registers, and the group of preliminary storage means may be a group of backup registers.
【0017】また、上記一群の記憶手段はソフトウェア
から可視な一群のレジスタであってもよい。The group of storage means may be a group of registers visible to software.
【0018】[0018]
【実施例】次に本願発明のデータ送受信装置の一実施例
について図面を参照して詳細に説明する。DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment of the data transmitting / receiving apparatus of the present invention will be described in detail with reference to the drawings.
【0019】図1を参照すると、本願発明の一実施例で
ある情報処理装置は、パイプライン構成を採り、演算を
するための演算ステージ31と、演算結果をSVR3に
書き込む書込みステージ32と、演算結果をコピーSV
R(以下、CSVR)4に書き込むコピーステージ33
と、エラーの発生をチェックするエラーチェックステー
ジ34とを含んでなっている。Referring to FIG. 1, an information processing apparatus according to an embodiment of the present invention adopts a pipeline structure, an arithmetic stage 31 for performing an arithmetic operation, a writing stage 32 for writing an arithmetic result into an SVR 3, and an arithmetic operation. Copy result SV
Copy stage 33 for writing to R (hereinafter, CSVR) 4
And an error check stage 34 for checking the occurrence of an error.
【0020】演算ステージ31では、演算回路1が演算
を行なう。この演算の結果、エラー検出回路23は演算
回路1において障害が発生したか否かを検出する。In the arithmetic stage 31, the arithmetic circuit 1 performs an arithmetic operation. As a result of this calculation, the error detection circuit 23 detects whether or not a failure has occurred in the calculation circuit 1.
【0021】書込みステージ32では、SVR3に対し
て演算回路1による演算結果を書き込む。SVR3はソ
フトウェアから可視なレジスタであり、一般に複数バイ
トからなる1ワードを複数ワード有するように構成され
る。そのために書込みステージ32は、演算回路1から
の演算結果を保持する書込みデータレジスタ(WDR)
12と、SVR3の書込みアドレスを保持する書込みア
ドレスレジスタ(WAR)11と、SVR3に対し書込
みを指示する書込みフラグ(WF)17とを含んでい
る。また、エラー検出回路23により検出されたエラー
情報は、演算器内の部分毎にエラー検出フラグ群(E
F)5に保持される。書込みステージ32は、このエラ
ー検出フラグ群5に保持されたいずれかのエラー情報で
エラー発生を表示していることを検出するために、オア
回路6を含んでいる。In the write stage 32, the calculation result of the calculation circuit 1 is written in the SVR 3. The SVR3 is a software-visible register and is generally configured to have a plurality of words each having a plurality of bytes. Therefore, the write stage 32 has a write data register (WDR) that holds the calculation result from the calculation circuit 1.
12, a write address register (WAR) 11 that holds the write address of the SVR 3, and a write flag (WF) 17 that instructs the SVR 3 to write. Further, the error information detected by the error detection circuit 23 is the error detection flag group (E
F) Hold at 5. The writing stage 32 includes an OR circuit 6 to detect that any error information held in the error detection flag group 5 indicates that an error has occurred.
【0022】コピーステージ33では、SVR3のバッ
クアップ用のCSVR4を設け、このCSVR4に対し
て演算回路1による演算結果を書き込む。このCSVR
4はSVR3と同一の構成を有して、SVR3の1クロ
ック前の内容を有する。このCSVR4はソフトウェア
からは認識できず、すなわち命令セット上には表れな
い。このためにコピーステージ33は、書込みデータレ
ジスタ12の値を1クロック遅れで保持するコピーWD
R(CWDR)14と、CSVR4の書込みアドレスを
保持するコピー書込みアドレスレジスタ(CWAR)1
3と、CSVR4に対し書込みを指示するコピー書込み
フラグ(CWF)18とを含んでなっている。また、オ
ア回路6によって収集されたエラー情報を保持するエラ
ーフラグ(EF)19を含んでいる。さらに、CSVR
4におけるエラー発生の検出を目的としてCSVR4の
読出しを行う際の、読出しアドレスを保持するコピーリ
ードアドレスレジスタ(CRAR)15と、このコピー
リードアドレスレジスタ15の内容を1つ増加するため
のインクリメント回路27とを含んでいる。In the copy stage 33, a CSVR4 for backup of the SVR3 is provided, and the calculation result by the calculation circuit 1 is written in the CSVR4. This CSVR
4 has the same configuration as SVR3 and has the contents one clock before SVR3. This CSVR4 cannot be recognized by software, that is, it does not appear in the instruction set. Therefore, the copy stage 33 uses the copy WD that holds the value of the write data register 12 with a delay of one clock.
R (CWDR) 14 and copy write address register (CWAR) 1 that holds the write address of CSVR 4
3 and a copy write flag (CWF) 18 for instructing writing to the CSVR 4. It also includes an error flag (EF) 19 that holds the error information collected by the OR circuit 6. In addition, CSVR
4 for reading the CSVR 4 for the purpose of detecting the error occurrence, the copy read address register (CRAR) 15 for holding the read address and the increment circuit 27 for incrementing the content of the copy read address register 15 by one. Includes and.
【0023】エラーチェックステージ34では、CSV
R4におけるエラー発生を検出するためのエラー検出回
路2を設け、エラーフラグ19の情報と併せて、エラー
処理を起動するためのチェックを行う。そのためにエラ
ーチェックステージ34では、CSVR4からの読出し
データを保持するコピーデータ読出しレジスタ(CDR
R)16を含んでいる。また、後述するように、エラー
の発生をファームウェアから起動するか、ハードウェア
で直接起動するかを切り換えるためのモードフラグ(M
DF)20を含んでいる。そして、さらに、ファームウ
ェアを介すエラー処理が起動されたことを示すイベント
フラグ(EVF)22と、診断プロセッサ(DGP)2
4に対するエラー処理が起動されたことを示すエラー表
示フラグ(EIF)21とを含んでいる。このDGP2
4は情報処理装置の診断を行うプロセッサであり、DG
P専用のメモリとしてDGPメモリ(DGPM)26を
有している。In the error check stage 34, the CSV
An error detection circuit 2 for detecting the occurrence of an error in R4 is provided, and together with the information of the error flag 19, a check for activating error processing is performed. Therefore, in the error check stage 34, a copy data read register (CDR that holds read data from the CSVR 4 is stored.
R) 16 is included. As will be described later, a mode flag (M
DF) 20 is included. Further, an event flag (EVF) 22 indicating that error processing via the firmware has been started, and a diagnostic processor (DGP) 2
4 includes an error display flag (EIF) 21 indicating that the error processing for No. 4 has been started. This DGP2
Reference numeral 4 denotes a processor for diagnosing the information processing device,
It has a DGP memory (DGPM) 26 as a memory dedicated to P.
【0024】なお、この実施例の情報処理装置は、CP
Uファームウェア(CPU−FW)25のファームウェ
アにより制御されるものとしているが、これはハード結
線論理によるものとしても構わない。The information processing apparatus of this embodiment is a CP
Although it is assumed that the U firmware (CPU-FW) 25 controls the firmware, this may be based on hardware connection logic.
【0025】上記構成において、演算ステージ31の演
算回路1による演算結果はWDR12を介してSVR3
に書き込まれる。この際SVR3の書き込み先アドレス
はWAR11が保持するものが使用される。また、この
書き込みタイミングはWF17によって与えられる。こ
れらWAR11とWF17は、その書込みデータに対応
する命令に基づいて設定される。そして、この演算結果
は、SVR3に書き込まれた次のクロックでCWDR1
4を介してCSVR4に書き込まれる。この際CSVR
4の書き込み先アドレスはCWAR13が保持するもの
が使用される。また、この書き込みタイミングはCWF
18によって与えられる。すなわち、CSVR4は、S
VR3の1クロック前の状態を保持していることにな
る。In the above structure, the calculation result by the calculation circuit 1 of the calculation stage 31 is sent to the SVR 3 via the WDR 12.
Written in. At this time, the write destination address of the SVR 3 is the one held by the WAR 11. The write timing is given by the WF 17. These WAR11 and WF17 are set based on the command corresponding to the write data. The result of this calculation is CWDR1 at the next clock written in SVR3.
Written to CSVR4 via 4. In this case CSVR
As the write destination address of 4, the address held by the CWAR 13 is used. The write timing is CWF.
Given by 18. That is, CSVR4 is S
This means that the state of one clock before VR3 is held.
【0026】演算回路1においてエラーが発生した場合
は、演算ステージ31のエラー検出回路23によりその
エラーが検出され、エラー検出フラグ群5の該当するフ
ラグがアクティブになる。そして、オア回路6によりエ
ラー検出フラグ群5の全ビットの論理和が生成されて、
エラーフラグ19がアクティブになる。この場合、エラ
ーに関する演算結果は、SVR3には書き込まれてしま
うが、CSVR4には書き込まれない。これは、CSV
R4に書込みを指示するアンド回路8の入力として、エ
ラーフラグ19の否定論理が入力されることにより実現
される。すなわち、エラーフラグ19がアクティブにな
ることから、その否定論理はノンアクティブになって、
CWF18の値に拘わらずアンド回路8の出力をノンア
クティブにするからである。従って、演算回路1におい
てエラーが発生した場合は、SVR3にはエラー発生直
後の状態が保持され、一方CSVR4にはエラー発生直
前の状態が保持されることになる。When an error occurs in the arithmetic circuit 1, the error is detected by the error detection circuit 23 of the arithmetic stage 31, and the corresponding flag of the error detection flag group 5 becomes active. Then, the OR circuit 6 generates a logical sum of all bits of the error detection flag group 5,
The error flag 19 becomes active. In this case, the calculation result regarding the error is written in SVR3, but is not written in CSVR4. This is CSV
This is realized by inputting the negative logic of the error flag 19 as the input of the AND circuit 8 which instructs the writing to R4. That is, since the error flag 19 becomes active, its negative logic becomes inactive,
This is because the output of the AND circuit 8 is made inactive regardless of the value of the CWF 18. Therefore, when an error occurs in the arithmetic circuit 1, the state immediately after the error occurs is held in the SVR3, while the state immediately before the error occurs is held in the CSVR4.
【0027】CSVR4においてエラーが発生した場合
には、エラーチェックステージ34のエラー検出回路2
によりそのエラーが検出される。このCSVR4のエラ
ーは以下のようにして検出される。CSVR4には、C
WDR14から書込みデータが書き込まれるが、それと
並行してCDRR16にエラー検出用のデータ読出しが
行われる。このCDRR16への読出しは、CRAR1
5の指すアドレスに従って行われる。このCRAR15
は、インクリメント回路27により毎クロックインクリ
メントされて、各ワードを順番に指し示すことになる。
このCRAR15は、巡回的にインクリメントされ、最
後のワードを指した場合には、その次のクロックは最初
のワードを指す。エラー検出回路2では、パリティチェ
ックなどの方法によって、CDRR16に読み出された
データについてエラーの発生を検出する。When an error occurs in the CSVR 4, the error detection circuit 2 of the error check stage 34
Detects the error. This CSVR4 error is detected as follows. For CSVR4, C
Write data is written from the WDR 14, and in parallel with this, data reading for error detection is performed in the CDRR 16. Read-out to this CDR R16 is CRAR1
It is performed according to the address indicated by 5. This CRAR15
Is incremented every clock by the increment circuit 27 to sequentially point each word.
This CRAR15 is cyclically incremented so that if it points to the last word, the next clock will point to the first word. The error detection circuit 2 detects the occurrence of an error in the data read by the CDRR 16 by a method such as parity check.
【0028】エラー検出回路2またはエラー表示フラグ
19からの情報に従って、エラーチェックステージで
は、次のようにエラー処理の起動を行う。まず、エラー
検出回路2でエラーを検出した場合には、アンド回路9
およびアンド回路10の入力端子にその事象が入力され
る。一方、それらアンド回路の他の入力端子にはMDF
20に基づく信号が入力されて、それらアンド回路のい
ずれか一方のみの出力がアクティブになるように制御さ
れる。すなわち、エラー検出回路2の出力は、MDF2
0が”1”であればアンド回路9から出力され、MDF
20が”0”であればアンド回路10から出力される。
これにより、エラー検出回路2でエラーを検出すると、
MDF20が”1”であればEIF21がセットされ、
MDF20が”0”であればEVF22がセットされ
る。According to the information from the error detection circuit 2 or the error display flag 19, the error check stage starts the error processing as follows. First, when the error detection circuit 2 detects an error, the AND circuit 9
And the event is input to the input terminal of the AND circuit 10. On the other hand, MDF is connected to the other input terminals of those AND circuits.
A signal based on 20 is input, and the output of only one of the AND circuits is controlled to be active. That is, the output of the error detection circuit 2 is MDF2.
If 0 is "1", it is output from the AND circuit 9 and MDF
If 20 is "0", it is output from the AND circuit 10.
As a result, when the error detection circuit 2 detects an error,
If MDF20 is "1", EIF21 is set,
If the MDF 20 is "0", the EVF 22 is set.
【0029】EIF21がセットされると、DGP24
でエラー処理が開始する。また、EVF22がセットさ
れると、CPU−FW25でエラー処理開始のためのタ
イミングが生成された後、EIF21がセットされて、
上記と同様にDGP24でエラー処理が開始する。この
EIF21セットによる場合とEVFセットによる場合
との違いは、後述するようにエラー処理を開始するタイ
ミングに影響する。EIF21を介して直接DGP24
にエラーを通知する場合は、即座にエラー処理を開始で
きる。しかしその反面、処理中の命令の途中に割り込む
ようなタイミングとなる場合があり、その場合には障害
発生時点からの命令の再試行がうまくいかないおそれが
ある。一方、EVF22からCPU−FW25を介して
エラー処理を行う場合には、処理途中の命令の終了を待
ってからエラー処理を起動できるので、命令の再試行が
成功する確率が高くなる。従って、これらエラー処理の
開始方法は情報処理装置の諸状況に応じて設定されるべ
きであり、本実施例ではこの設定のためにMDF20が
設けられている。なお、このMDF20は、例えばスキ
ャンパスなどによりシステム立ち上げ時に設定すること
ができる。When EIF21 is set, DGP24
Error handling starts with. When the EVF 22 is set, the CPU-FW 25 generates the timing for starting the error processing, and then the EIF 21 is set,
Similar to the above, the DGP 24 starts error processing. The difference between the case of using the EIF21 set and the case of using the EVF set affects the timing at which error processing is started, as will be described later. DGP24 directly via EIF21
If the error is notified to, the error handling can be started immediately. However, on the other hand, the timing may be such that the instruction being processed is interrupted, and in that case, the retry of the instruction from the time when the failure occurs may not be successful. On the other hand, when error processing is performed from the EVF 22 via the CPU-FW 25, the error processing can be started after waiting for the end of the instruction in the middle of the processing, so that the probability of successful retry of the instruction increases. Therefore, the method of starting these error processes should be set according to various situations of the information processing apparatus, and the MDF 20 is provided for this setting in this embodiment. The MDF 20 can be set when the system is started up, for example, by a scan path.
【0030】エラー表示フラグ19から演算ユニットの
エラーが報告された場合には、オア回路7を介してEI
F21がセットされる。これにより、DGP24のエラ
ー処理が起動される。本実施例では、エラー表示フラグ
19からのエラーはEIF21に報告されるようにして
いるが、エラー検出回路2からの場合と同様にモードに
応じてファームウェアを介すようにしても構わない。When an error of the arithmetic unit is reported from the error display flag 19, the EI is sent via the OR circuit 7.
F21 is set. This activates the error processing of the DGP 24. In this embodiment, the error from the error display flag 19 is reported to the EIF 21, but the error detection circuit 2 may use the firmware depending on the mode as in the case of the error detection circuit 2.
【0031】次に、CPU−FW25における処理につ
いて図を参照しながら説明する。Next, the processing in the CPU-FW 25 will be described with reference to the drawings.
【0032】図2を参照すると、CPU−FW25は、
マイクロプログラムを格納する制御ストア54と、制御
ストア54の読出し位置を指示する制御メモリアドレス
レジスタ(CSAR)51と、制御ストア54からの読
出しデータを保持する制御ストア命令レジスタ(CSI
R)52とを含んでいる。また、マイクロプログラムの
エラー処理ルーチンの開始アドレスを保持する開始アド
レスレジスタ(SAR)50と、このSAR50または
次アドレスとを選択するためのセレクタ55と、このセ
レクタ55に制御信号を与えるアンド回路56とを含ん
でいる。次アドレスとは、制御ストア54のマイクロプ
ログラムにより指定されるアドレスで、一般に現在処理
されているマイクロプログラム命令の次に実行されるマ
イクロプログラム命令のアドレスを意味する。また、C
SIR52に読み出されたマイクロプログラム命令によ
って、信号線41,44および46に信号が転送され
る。Referring to FIG. 2, the CPU-FW 25 is
A control store 54 that stores a microprogram, a control memory address register (CSAR) 51 that indicates a read position of the control store 54, and a control store instruction register (CSI) that holds read data from the control store 54.
R) 52 and. Further, a start address register (SAR) 50 for holding the start address of the error processing routine of the microprogram, a selector 55 for selecting the SAR 50 or the next address, and an AND circuit 56 for giving a control signal to the selector 55. Is included. The next address is an address designated by the microprogram in the control store 54, and generally means the address of the microprogram instruction executed next to the microprogram instruction currently being processed. Also, C
A signal is transferred to the signal lines 41, 44 and 46 by the micro program instruction read by the SIR 52.
【0033】図3を参照すると、制御ストア54に格納
され、CSIR52に読み出されるマイクロプログラム
の命令フィールドは、マイクロ命令コードを示すOPC
521と、次アドレスを示すNEXT522と、機械語
命令レベルの命令終了を示すEOP527と、CSVR
4におけるエラー発生をCSVREF53に設定するた
めのCSVRE528と、エラーの発生をEIF21に
設定するためのEI529などを含んでいる。NEXT
522はセレクタ55の入力の一つとして入力される。
EOP527は信号線44に転送されてアンド回路56
によってEVF22の出力45との論理積がとられる。
CSVRE528は信号線46を介してCSVREF5
3をセットするために使用される。EI529は信号線
41を介してオア回路7に入力され、EIF21をセッ
トするために使用される。Referring to FIG. 3, the instruction field of the microprogram stored in the control store 54 and read by the CSIR 52 is an OPC indicating a microinstruction code.
521, NEXT 522 indicating the next address, EOP 527 indicating the end of the machine language instruction level instruction, and CSVR
4 includes a CSVRE 528 for setting the error occurrence in CSV4 in the CSVREF 53, an EI 529 for setting the error occurrence in the EIF 21, and the like. NEXT
522 is input as one of the inputs of the selector 55.
The EOP 527 is transferred to the signal line 44 and the AND circuit 56
Is ANDed with the output 45 of the EVF 22.
The CSVRE 528 is connected to the CSVREF 5 via the signal line 46.
Used to set 3. The EI 529 is input to the OR circuit 7 via the signal line 41 and used to set the EIF 21.
【0034】次にエラー検出回路2によってCSVR4
におけるエラーが検出された場合の、上記CPU−FW
25における動作例について図4および図5を参照して
説明する。Next, the error detection circuit 2 causes the CSVR 4
CPU-FW when an error is detected in
An example of operation in No. 25 will be described with reference to FIGS. 4 and 5.
【0035】図4を参照すると、第1サイクルにおいて
エラー検出回路2で検出されたエラーはEVF22に報
告される。これにより、次の第2サイクルでEVF22
の出力がアクティブになる。しかし、この第2サイクル
ではEOP527がアクティブでなく、すなわち機械語
命令レベルの命令が処理途中であるため、割り込み処理
の開始は待たされる。Referring to FIG. 4, the error detected by the error detection circuit 2 in the first cycle is reported to the EVF 22. As a result, in the next second cycle, the EVF22
Output becomes active. However, since the EOP 527 is not active in this second cycle, that is, the machine language instruction level instruction is being processed, the start of the interrupt processing is delayed.
【0036】第3サイクルでは、EOP527がアクテ
ィブになり機械語命令レベルの命令が終了する旨が判明
するので、アンド回路56の出力がセレクタ55によっ
てSAR50を選択するため、次の第4サイクルではエ
ラー処理が開始する。In the third cycle, since it is found that the EOP 527 becomes active and the machine language instruction level instruction is completed, the output of the AND circuit 56 selects the SAR 50 by the selector 55, so that an error occurs in the next fourth cycle. The process starts.
【0037】図5を参照すると、CPU−FW25にお
けるエラー処理の手順として、まずEVF22をリセッ
トする(ステップ72)。次のエラー受け付けのためで
ある。このEVF22のリセットは第4サイクルにおい
て指示され、次の第5サイクルでEVF22の出力がノ
ンアクティブとなる。Referring to FIG. 5, as a procedure for error processing in the CPU-FW 25, the EVF 22 is first reset (step 72). This is to accept the next error. The reset of the EVF 22 is instructed in the fourth cycle, and the output of the EVF 22 becomes non-active in the next fifth cycle.
【0038】そして、CSVR4でエラーが発生した旨
を示すCSVREF53をセットし(ステップ73)、
DGP26を起動するEIF21をセットする(ステッ
プ74)。これらのセット処理は第5サイクルで同時に
指示され、第6サイクルで両者共アクティブになる。E
IF21がアクティブになることによってDGP24に
おけるエラー処理が開始される(ステップ75)。Then, CSVREF 53 indicating that an error has occurred in CSVR 4 is set (step 73),
The EIF 21 that activates the DGP 26 is set (step 74). These setting processes are simultaneously instructed in the fifth cycle, and both become active in the sixth cycle. E
When the IF 21 becomes active, the error processing in the DGP 24 is started (step 75).
【0039】次に、DGP24におけるエラー処理の手
順について図を参照して説明する。Next, the procedure of error processing in the DGP 24 will be described with reference to the drawings.
【0040】図6を参照すると、まず、DGP24はS
VR3,CSVR4およびCSVREF53の内容をD
GPM26に退避する(ステップ76)。この退避は、
例えばスキャンパスなどにより行なうことができる。ま
た、CPU−FW25を介さず直接DGP24に報告さ
れた場合は、DGP24がCDRR16をチェックする
ことによりCSVR4のエラーを検出する。以下、この
ようにして検出されたCSVR4のエラーもCSVRE
Fとして退避されたものとして扱う。DGP24は、こ
の退避後CPUを一旦リセットする(ステップ77)。Referring to FIG. 6, first, the DGP 24 is S
D, contents of VR3, CSVR4 and CSVREF53
It is saved in the GPM 26 (step 76). This evacuation is
For example, the scan path can be used. Further, when it is directly reported to the DGP 24 without going through the CPU-FW 25, the DGP 24 checks the CDRR 16 to detect the error of the CSVR 4. Below, CSVRE4 error detected in this way is also CSVRE
It is treated as being saved as F. After this evacuation, the DGP 24 resets the CPU once (step 77).
【0041】CPUのリセット後、DGPM26に退避
されたCSVREFの値が”1”であればCSVR4で
エラーが発生したことを示しているので、DGPM26
に退避されたSVRの内容をSVR3およびCSVR4
に戻す(ステップ79)。DGPM26に退避されたC
SVREFの値が”0”であればCSVR4ではエラー
が発生していないため、DGPM26に退避されたCS
VRの内容をSVR3およびCSVR4に戻す(ステッ
プ80)。これらリストアの終了後、エラー発生時点の
命令からCPUの再試行を行う(ステップ81)。After the CPU is reset, if the value of CSVREF saved in the DGPM 26 is "1", it means that an error has occurred in the CSVR 4, so the DGPM 26
The contents of the SVR saved in the SVR3 and CSVR4
(Step 79). C saved in the DGPM 26
If the value of SVREF is "0", no error has occurred in CSVR4, so CS saved in DGPM26
The contents of VR are returned to SVR3 and CSVR4 (step 80). After these restorations are completed, the CPU is retried from the instruction at the time when the error occurred (step 81).
【0042】[0042]
【発明の効果】以上の説明で明らかなように、本発明に
よると、SVRの1クロック前の状態を保存するCSV
Rを設けることにより、CPU内部のエラーによりSV
Rに誤ったデータが上書きされてしまった場合でも、エ
ラー発生時点からの命令の再試行が可能となり、特に間
欠障害に対して高い耐故障性を維持することができる。
さらに、診断プロセッサを設けることにより、柔軟なエ
ラー処理を可能としている。As is apparent from the above description, according to the present invention, the CSV for saving the state of the SVR one clock before is stored.
By providing R, SV will be generated due to an error inside the CPU.
Even if erroneous data is overwritten in R, the instruction can be retried from the time when the error occurs, and high fault tolerance can be maintained especially against intermittent failures.
Furthermore, by providing a diagnostic processor, flexible error handling is possible.
【0043】また、本発明によると、エラー処理を起動
するタイミングを調節することができ、リセット後の命
令の再試行を可能とする。さらに、CSVRのエラー検
出回路を設けたことにより、エラーの発生箇所を特定し
て適切な状態から再試行させることを可能としている。Further, according to the present invention, the timing of activating the error processing can be adjusted, and the instruction can be retried after the reset. Further, by providing the CSVR error detection circuit, it is possible to specify the location where the error has occurred and retry from an appropriate state.
【0044】さらに、本発明によると、再試行を優先す
るかまたは緊急性を優先するかを設定するモードフラグ
を設けることにより、システムの要求に応じた運用を可
能とする。Further, according to the present invention, by providing a mode flag for setting whether to give priority to retry or priority to urgency, it is possible to operate according to the request of the system.
【図1】本発明の情報処理装置の一実施例の説明のため
の障害復帰機構を記したブロック図である。FIG. 1 is a block diagram showing a failure recovery mechanism for explaining an embodiment of an information processing apparatus of the present invention.
【図2】CPUファームウェアのブロック図である。FIG. 2 is a block diagram of CPU firmware.
【図3】CPUファームウェアのマイクロ命令のフォー
マットを表す図である。FIG. 3 is a diagram showing a format of a micro instruction of CPU firmware.
【図4】エラー発生からエラー処理が行われるまでのタ
イミングを表す図である。FIG. 4 is a diagram showing a timing from error occurrence to error processing.
【図5】CPUファームウェアがエラー処理のために診
断プロセッサを呼び出すまでの処理の流れ図である。FIG. 5 is a flow chart of processing until CPU firmware calls a diagnostic processor for error processing.
【図6】診断プロセッサにおけるエラー処理の流れ図で
ある。FIG. 6 is a flowchart of error processing in the diagnostic processor.
1 演算回路 2 エラー検出回路 3 ソフトウェア見えレジスタ(SVR) 4 コピーSVR(CSVR) 5 エラー検出フラグ群(EF) 6,7 オア回路 8〜10 アンド回路 11 書込みアドレスレジスタ(WAR) 12 書込みデータレジスタ(WDR) 13 コピーWAR(CWAR) 14 コピーWDR(CWDR) 15 CSVR読出しアドレスレジスタ(CRAR) 16 CSVR読出しデータレジスタ(CDRR) 17 書込みフラグ(WF) 18 コピーWF(CWF) 19 エラーフラグ(EF) 20 モードフラグ(MDF) 21 エラー表示フラグ(EIF) 22 イベントフラグ(EVF) 23 エラー検出回路 24 診断プロセッサ(DGP) 25 CPUファームウェア(CPU−FW) 26 DGPメモリ(DGPM) 50 開始アドレスレジスタ(SAR) 51 制御ストアアドレスレジスタ(CSAR) 52 制御ストア命令レジスタ(CSIR) 53 CSVRエラーフラグ(CSVREF) 54 制御ストア 521 命令コードフィールド(OPC) 522 次アドレスフィールド(NEXT) 527 オペレーション終了フィールド(EOP) 528 CSVRエラーフィールド(CSVRE) 529 エラー表示フィールド(EI) 1 Operation Circuit 2 Error Detection Circuit 3 Software Appearance Register (SVR) 4 Copy SVR (CSVR) 5 Error Detection Flag Group (EF) 6, 7 OR Circuit 8-10 AND Circuit 11 Write Address Register (WAR) 12 Write Data Register ( WDR) 13 copy WAR (CWAR) 14 copy WDR (CWDR) 15 CSVR read address register (CRAR) 16 CSVR read data register (CDRR) 17 write flag (WF) 18 copy WF (CWF) 19 error flag (EF) 20 mode Flag (MDF) 21 Error display flag (EIF) 22 Event flag (EVF) 23 Error detection circuit 24 Diagnostic processor (DGP) 25 CPU firmware (CPU-FW) 26 DGP memory (DGPM) 5 0 start address register (SAR) 51 control store address register (CSAR) 52 control store instruction register (CSIR) 53 CSVR error flag (CSVREF) 54 control store 521 instruction code field (OPC) 522 next address field (NEXT) 527 operation end Field (EOP) 528 CSVR error field (CSVRE) 529 Error display field (EI)
Claims (8)
記憶手段を含む中央処理装置を有する情報処理装置にお
けるエラー復帰機構であって、 前記一群の記憶手段と同一の構成を有し、前記一群の記
憶手段に対してあるデータが書き込まれた時点以降に当
該データを書き込まれる一群の予備記憶手段と;前記中
央処理装置で発生したエラーを検出するエラー検出手段
と;このエラー検出手段からのエラー通知に応じて、前
記中央処理装置におけるエラーの処理を行い、前記中央
処理装置を復帰させるエラー処理手段と;を含むことを
特徴とする情報処理装置。1. An error recovery mechanism in an information processing apparatus having a central processing unit including a group of storage means made up of at least one word, the error recovery mechanism having the same configuration as the group of storage means. A group of preliminary storage means to which the data is written after a certain data is written to the means; an error detection means for detecting an error generated in the central processing unit; and an error notification from the error detection means Accordingly, the information processing apparatus includes: an error processing unit that performs error processing in the central processing unit and restores the central processing unit.
置におけるエラーの原因を解析して、前記一群の記憶手
段および前記一群の予備記憶手段の内容を退避領域に退
避した後、前記中央処理装置をリセットして、前記退避
領域の内容を前記一群の記憶手段および前記一群の予備
記憶手段にリストアするエラー処理プロセッサ;をさら
に含むことを特徴とする請求項1記載の情報処理装置。2. The error processing means analyzes the cause of an error in the central processing unit, saves the contents of the one group of storage means and the one group of preliminary storage means in a save area, and then the central processing unit. The information processing apparatus according to claim 1, further comprising: an error processing processor that resets the contents of the save area to the group of storage units and the group of preliminary storage units;
手段からのエラー報告についてエラー処理の前準備を行
い、エラー復帰に適したタイミングを生成してそのタイ
ミングで前記エラー処理プロセッサに対してエラー処理
を開始させるエラー処理ファームウェア;をさらに含む
ことを特徴とする請求項2記載の情報処理装置。3. The error processing means makes preparations for error processing with respect to an error report from the error detection means, generates timing suitable for error recovery, and performs error processing on the error processing processor at that timing. 3. The information processing apparatus according to claim 2, further comprising: error processing firmware for starting.
記憶手段で発生したエラーを検出する予備記憶エラー検
出部を含み、 前記エラー処理手段は、前記予備記憶エラー検出部でエ
ラーが発生したことを示す予備記憶エラーフラグを含
み、さらに前記エラー処理プロセッサが、前記退避領域
の内容を前記一群の記憶手段および前記一群の予備記憶
手段にリストアする際、前記予備記憶エラーフラグが”
エラー発生”を示していれば前記一群の記憶手段に関す
る前記退避領域の内容を前記一群の記憶手段および前記
一群の予備記憶手段にリストアし、前記予備記憶エラー
フラグが”エラー未発生”を示していれば前記一群の予
備記憶手段に関する前記退避領域の内容を前記一群の記
憶手段および前記一群の予備記憶手段にリストアするこ
とを特徴とする請求項3記載の情報処理装置。4. The error detection means includes a preliminary storage error detection section that detects an error that has occurred in the group of preliminary storage means, and the error processing means includes that an error has occurred in the preliminary storage error detection section. And when the error processing processor restores the contents of the save area to the group of storage means and the group of spare storage means, the spare storage error flag is
If "error occurrence" is indicated, the contents of the save area relating to the one group of memory means are restored to the one group of memory means and the one group of spare memory means, and the reserve memory error flag indicates "error not occurred". 4. The information processing apparatus according to claim 3, wherein the contents of the save area relating to the group of preliminary storage units are restored to the group of storage units and the group of preliminary storage units.
手段で検出したエラーを前記エラー処理プロセッサに直
接通知するモードと、前記エラー処理ファームウェアを
介して前記エラー処理プロセッサを起動するモードのい
ずれかを指定するエラー処理モードフラグをさらに含む
ことを特徴とする請求項3記載の情報処理装置。5. The error processing means has one of a mode in which an error detected by the error detection means is directly notified to the error processing processor and a mode in which the error processing processor is activated via the error processing firmware. The information processing apparatus according to claim 3, further comprising a designated error processing mode flag.
記憶手段で発生したエラーを検出する予備記憶エラー検
出部を含み、 前記エラー処理手段は、前記予備記憶エラー検出部でエ
ラーが発生したことを示す予備記憶エラーフラグを含
み、さらに前記エラー処理プロセッサが、前記退避領域
の内容を前記一群の記憶手段および前記一群の予備記憶
手段にリストアする際、前記予備記憶エラーフラグが”
エラー発生”を示していれば前記一群の記憶手段に関す
る前記退避領域の内容を前記一群の記憶手段および前記
一群の予備記憶手段にリストアし、前記予備記憶エラー
フラグが”エラー未発生”を示していれば前記一群の予
備記憶手段に関する前記退避領域の内容を前記一群の記
憶手段および前記一群の予備記憶手段にリストアするこ
とを特徴とする請求項5記載の情報処理装置。6. The error detection means includes a preliminary storage error detection section that detects an error that has occurred in the group of preliminary storage means, and the error processing means includes that an error has occurred in the preliminary storage error detection section. And when the error processing processor restores the contents of the save area to the group of storage means and the group of spare storage means, the spare storage error flag is
If "error occurrence" is indicated, the contents of the save area relating to the one group of memory means are restored to the one group of memory means and the one group of spare memory means, and the reserve memory error flag indicates "error not occurred". 6. The information processing apparatus according to claim 5, wherein the contents of the save area relating to the group of preliminary storage units are restored to the group of storage units and the group of preliminary storage units.
あり、 前記一群の予備記憶手段は一群のバックアップレジスタ
であることを特徴とする請求項6記載の情報処理装置。7. The information processing apparatus according to claim 6, wherein the group of storage means is a group of registers, and the group of preliminary storage means is a group of backup registers.
可視な一群のレジスタであることを特徴とする請求項7
記載の情報処理装置。8. The group of storage means is a group of registers visible to software.
The information processing device described.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP6012893A JPH07219796A (en) | 1994-02-04 | 1994-02-04 | Information processor |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP6012893A JPH07219796A (en) | 1994-02-04 | 1994-02-04 | Information processor |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH07219796A true JPH07219796A (en) | 1995-08-18 |
Family
ID=11818078
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP6012893A Pending JPH07219796A (en) | 1994-02-04 | 1994-02-04 | Information processor |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH07219796A (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001005639A (en) * | 1999-06-21 | 2001-01-12 | Toshiba Corp | Floating-point arithmetic unit |
JP5579257B2 (en) * | 2010-03-30 | 2014-08-27 | 株式会社エルイーテック | Apparatus and method for restoring information in main memory |
US8954801B2 (en) | 2009-10-15 | 2015-02-10 | L E Tech Co., Ltd. | Microcomputer and method of operation thereof |
-
1994
- 1994-02-04 JP JP6012893A patent/JPH07219796A/en active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001005639A (en) * | 1999-06-21 | 2001-01-12 | Toshiba Corp | Floating-point arithmetic unit |
US8954801B2 (en) | 2009-10-15 | 2015-02-10 | L E Tech Co., Ltd. | Microcomputer and method of operation thereof |
JP5579257B2 (en) * | 2010-03-30 | 2014-08-27 | 株式会社エルイーテック | Apparatus and method for restoring information in main memory |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4912707A (en) | Checkpoint retry mechanism | |
US4852092A (en) | Error recovery system of a multiprocessor system for recovering an error in a processor by making the processor into a checking condition after completion of microprogram restart from a checkpoint | |
EP0032957B1 (en) | Information processing system for error processing, and error processing method | |
US6823476B2 (en) | Mechanism to improve fault isolation and diagnosis in computers | |
JPH04338849A (en) | Excessive error correction method | |
JPS638835A (en) | Trouble recovery device | |
JP3481737B2 (en) | Dump collection device and dump collection method | |
JPH07219796A (en) | Information processor | |
JP2751822B2 (en) | Memory control method for FIFO memory device | |
US6609219B1 (en) | Data corruption testing technique for a hierarchical storage system | |
EP0610856A1 (en) | Error recovery mechanism for software visible registers in computer systems | |
JP3450132B2 (en) | Cache control circuit | |
JP3281982B2 (en) | Data buffer | |
JPH04115339A (en) | Memory error processing system | |
JPS6130297B2 (en) | ||
JPS6156537B2 (en) | ||
JPS5850049A (en) | Multilogic device system | |
JPH05324487A (en) | Memory control system | |
JPH04239923A (en) | Error recovery system for soft visible register | |
JPH0981465A (en) | Main memory controller | |
JPH03191451A (en) | Error correction system | |
JPH05314017A (en) | Data recovering system | |
JPH03168839A (en) | Control memory one-bit error correcting system | |
JPH0529934B2 (en) | ||
JPH05289947A (en) | ECC check method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 19980714 |