[go: up one dir, main page]

JPH0240746A - Memory error processing system - Google Patents

Memory error processing system

Info

Publication number
JPH0240746A
JPH0240746A JP63191518A JP19151888A JPH0240746A JP H0240746 A JPH0240746 A JP H0240746A JP 63191518 A JP63191518 A JP 63191518A JP 19151888 A JP19151888 A JP 19151888A JP H0240746 A JPH0240746 A JP H0240746A
Authority
JP
Japan
Prior art keywords
error
register
address
bit error
memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63191518A
Other languages
Japanese (ja)
Inventor
Kunio Ono
大野 邦夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP63191518A priority Critical patent/JPH0240746A/en
Publication of JPH0240746A publication Critical patent/JPH0240746A/en
Pending legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)

Abstract

PURPOSE:To decide a software or hardware error by driving a shaft register by using a write and a read mode signal as shift-in data and then knowing the generation state of a 1-bit error from the contents of a shift register as information. CONSTITUTION:An error address register 8 holds the address of the 1-bit error when the error occurs. Then a comparing circuit 9 compares an access address with the held contents of an error address register 8 every time a memory is accessed. In this case, if the comparison value of the circuit 9 is coincident and the 1-bit error occurs or if the comparison value of the circuit 9 is coincident and write access is attained, a read mode signal for writing is used as the shift-in data to drive the shift register 13 and the contents of the register 13 are used as information to know the generation state of the 1-bit error. Consequently, it is decided whether the 1-bit error is a software error or hardware error.

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明はメモリエラー処理方式、特に記憶装置における
1ビットエラーに対するメモリエラー処理方式に関する
DETAILED DESCRIPTION OF THE INVENTION [Field of Industrial Application] The present invention relates to a memory error handling method, and particularly to a memory error handling method for one-bit errors in a storage device.

〔従来の技術−〕[Conventional technology-]

半導体メモリは、1971年IK(キロ)ダイナミック
型メモリが発表されてから今日に至るまで急速に進歩し
、1チツプにLM(メガ)ビットの記憶容量を持つもの
が量産されるようになった。しかし、1978年頃、集
積度の高くなったダイナミックメモリにおいて、電離性
放射線がメモリ中の蓄積データを逆転しソフトエラーを
起こすことがわかった。
Semiconductor memories have rapidly progressed since the introduction of IK (kilo) dynamic memory in 1971 until today, and devices with a memory capacity of LM (mega) bits per chip are now being mass-produced. However, around 1978, it was discovered that in highly integrated dynamic memories, ionizing radiation could reverse the stored data in the memory, causing soft errors.

ソフトエラーとは、メモリ素子中にランダムに発生し、
繰り返すことのない1ビットエラーであり故障とは異な
るメカニズムによって発生するので、次のサイクルで再
書き込みすれば完全に回復するものである。これはメモ
リ素子自身やケースに含まれる放射線源ウランやトリウ
ムから放射されるアルファ粒子の電荷によって、メモリ
素子のセルやビット線等の電荷が変化するために生じる
ものであることが知られている。
Soft errors occur randomly in memory elements.
Since this is a one-bit error that does not repeat and is caused by a mechanism different from a failure, it can be completely recovered by rewriting in the next cycle. It is known that this occurs because the charge of the cells and bit lines of the memory element changes due to the charge of alpha particles emitted from the radiation sources uranium and thorium contained in the memory element itself and its case. .

16にビットや64にビットのダイナミックRAMでは
メモリ素子のセルやビット線が有する電荷量が十分大き
いため、ソフトエラーは実用上はとんど問題とならなか
ったが、256にビットや、さらには1Mビットになり
そのデバイス構造が微細化されるに従ってアルファ素子
によるソフトエラーが問題化してきている。
In a dynamic RAM with 16 bits or 64 bits, the amount of charge held by the cells and bit lines of the memory element is sufficiently large, so soft errors are rarely a problem in practice, but with 256 bits or even As the device structure becomes smaller and becomes 1M bit, soft errors caused by alpha elements become a problem.

ソフトエラーは、ソフトエラーのみで考えた場合にはエ
ラー訂正回路を有する記憶装置では表面化しないが、ソ
フトエラー故障率がある程度に高くなると、メモリ素子
のハードエラーと重畳して訂正不可エラーとなり問題と
なる。
Soft errors do not surface in storage devices with error correction circuits when only soft errors are considered, but when the soft error failure rate increases to a certain extent, they overlap with hard errors in the memory element and become uncorrectable errors, which can become a problem. Become.

以上のような技術的環境において、従来のメモリエラー
処理方式は、1ビットエラー発生事実やエラーアドレス
等を、例えば診断プロセッサに登録しておき、同一アド
レスに複数回の1ビットエラーが発生していれば、該当
するパッケージを保守時に取替えるようにしている。
In the above-mentioned technical environment, conventional memory error handling methods register the fact that a 1-bit error has occurred, the error address, etc. in a diagnostic processor, and check if a 1-bit error has occurred multiple times at the same address. If so, the relevant package will be replaced during maintenance.

〔発明が解決しようとする課題〕 上述した従来のメモリエラー処理方式は、単に同一アド
レスにおける複数回の1ビットエラー発生という事実だ
けに基づいてパッケージ取替えを行っているが、読み出
しのみが続いた場合にはソフトエラーも固定故障である
かのようにみえるため、上記の事実だけからでは無用な
パッケージ取替えを行うことがあり、さらに取替えられ
たパッケージがソフトエラーを発生したものである場合
にはその修理作業が無駄になるという問題点がある。
[Problems to be Solved by the Invention] In the conventional memory error handling method described above, the package is replaced based solely on the fact that a 1-bit error occurs multiple times at the same address, but if only reading continues. Since soft errors appear to be fixed failures, it may be unnecessary to replace the package based on the above facts alone.Furthermore, if the replaced package is one that has caused a soft error, it may be necessary to replace the package. There is a problem that repair work is wasted.

本発明の目的は、1ビットエラーが発生したアドレスに
その後、リードアクセスが続けて発生したことにより1
ビットエラーが多発しているかどうかを判断するフラグ
を設け、このフラグの内容と1ビットエラー発生状況の
時系列情報とからソフトエラー、ハードエラーの切分け
の補助情報とし、保守運用の便宜を図ったメモリ処理方
式を提供することにある。
The purpose of the present invention is to solve the problem that the address where a 1-bit error has occurred is caused by a read access occurring in succession.
A flag is set up to determine whether bit errors occur frequently, and the contents of this flag and time-series information on the occurrence of single-bit errors are used as auxiliary information for distinguishing between soft errors and hard errors, facilitating maintenance and operation. The purpose of this invention is to provide a memory processing method with improved performance.

〔課題を解決するための手段〕[Means to solve the problem]

本発明は、1ビットエラー発生時のアドレスを保持する
エラーアドレスレジスタと、メモリアクセスの度にその
アクセスアドレスと前記エラーアドレスレジスタの保持
内容を比較する比較回路と、書き込み、読み出しモード
信号をシフトインデータとして、前記比較回路が一致し
かつ書き込みアクセスがあった時に前記シフトインデー
タとシフトするシフトレジスタとを有している。
The present invention includes an error address register that holds an address when a 1-bit error occurs, a comparison circuit that compares the access address with the contents held in the error address register each time a memory is accessed, and a shift-in of write and read mode signals. As data, it has a shift register that shifts with the shift-in data when the comparison circuit matches and there is a write access.

〔実施例〕〔Example〕

次に、本発明について図面を参照して説明する。 Next, the present invention will be explained with reference to the drawings.

第1図は本発明の一実施例を示すブロック図である。第
1図において、本実施例のアドレスレジスタ1はCPU
から送られてくるアドレス情報を保持するレジスタであ
り、メモリ2はRAM素子を配列したメモリである。メ
モリ読み出しデータレジスタ3はメモリアレイから読み
出したデータを保持するレジスタ、ECC回路4は読み
出しデータをエラーチエツクするための回路である。
FIG. 1 is a block diagram showing one embodiment of the present invention. In FIG. 1, address register 1 of this embodiment is CPU
The memory 2 is a register that holds address information sent from the memory 2, and the memory 2 is a memory in which RAM elements are arranged. The memory read data register 3 is a register that holds data read from the memory array, and the ECC circuit 4 is a circuit for error checking the read data.

訂正回路5は読み出しデータの訂正を行う回路であり、
読み出しデータレジスタ6は訂正後のデータを保持しC
PUに送るためのレジスタである。
The correction circuit 5 is a circuit that corrects read data,
The read data register 6 holds the corrected data and C
This is a register for sending data to the PU.

WRコントロール回路7はCPUからのWR制御信号に
より記憶装置内のリード(Write)。
The WR control circuit 7 reads (writes) the storage device in response to a WR control signal from the CPU.

ライト(Reaφ)を制御する回路であり、エラーアド
レスレジスタ8は1ビットエラー発生時のエラーアドレ
スを保持するレジスタである。比較回路9は1ビットエ
ラー発生時のエラーアドレスとその後のアクセスでのア
ドレスとを比較する比較回路である。なお、10.12
はANDゲート、11はORゲートである。シフトレジ
スタ13は1ビットエラー発生時又は1ビットエラーア
ドレスと現アクセスでのアドレスが一致した時データを
シフトするレジスタである。データはライト、リード制
御信号を入力する。
This is a circuit that controls write (Reaφ), and the error address register 8 is a register that holds an error address when a 1-bit error occurs. Comparison circuit 9 is a comparison circuit that compares the error address when a 1-bit error occurs and the address in subsequent access. In addition, 10.12
is an AND gate, and 11 is an OR gate. The shift register 13 is a register that shifts data when a 1-bit error occurs or when the 1-bit error address matches the address at the current access. For data, write and read control signals are input.

まず、CPUから転送されてきたアドレス情報はアドレ
スレジスタ1に保持され、メモリアレイ2に送られる。
First, address information transferred from the CPU is held in the address register 1 and sent to the memory array 2.

メモリアレイ2にはこのアドレス情報のみならず、メモ
リ素子を動作させるためのタイミング等も与えられるが
、その詳細説明は省略する。
The memory array 2 is given not only this address information but also timing for operating the memory elements, but a detailed explanation thereof will be omitted.

メモリアレイ2から読み出されたデータはメモリ読み出
しデータレジスタ3で保持され、ECC回路4にてエラ
ーチエツクされる。エラーチエツクの結果により、1ビ
ットエラーがあった場合には、データは訂正回路5によ
って訂正され読み出しデータレジスタ6に保持され、読
み出しデータレジスタ6の出力はCPUに送られる。
Data read from the memory array 2 is held in a memory read data register 3 and checked for errors in an ECC circuit 4. If the result of the error check is that there is a 1-bit error, the data is corrected by the correction circuit 5 and held in the read data register 6, and the output of the read data register 6 is sent to the CPU.

ECC回路4からは、同時にシンドロームと1ビットエ
ラー信号が発生され、パス102と介して診断プロセサ
に送られる。一方バス101を介してアドレスレジスタ
1からエラーアドレスレジスタ8に1ビットエラー発生
時のアドレス情報が送られ、ECC回路4からパス10
3を介して送られてくる1ビットエラー発生信号により
エラーアドレスレジスタ8にセットされる。レジスタの
内容をパス104によりホールドする0本実施例では最
初のエラーを保持する。エラーアドレスレジスタ8の内
容はパス105を介して診断プロセサに送出する。1ビ
ットエラーアドレスがエラーアドレスレジスタ8に保持
されている状態にて続いて発生するアクセスについて考
えた時、アクセスされたアドレスが先に発生した1ビッ
トエラー発生アドレスと同じ場合、比較回路9の結果が
一致状態を示す、一致状態になった特売に1ビットエラ
ーが発生した同一アドレスに対しアクセスがあったこと
になる。その場合比較回路9の出力はECC回路4から
の出力として1ビットエラーがあった場合アンドゲート
10.ORゲート11を介してシフトレジスタ13のシ
フトアップ信号としてシフトレジスタ13に入力される
。一方アドレスが一致しても1ビットエラーが発生しな
いケースすなわちライトモード時にはWRコントロール
回路7によりライト信号をパス107を介して、リクエ
スト信号(REQUEST)とともにゲート回路12に
与えられる。この場合にも、ORゲート11を介してシ
フトレジスタ13のシフトアップ信号として入力される
。以上のよう°にシフトレジスタ13はアドレス一致し
て1ビットエラーまたはライトアクセスがあった時にシ
フトアップされる。一方シフトデータはシフトレジスタ
の入力にWRコントロール回路7からのライト信号を入
力してやる。従ってライト時にはデータト、リード時に
はデータ0を入力しておく、初期値は全て′1′として
おくことで最初の1ビットエラーが読み出しで発生すれ
ば′0′が入力され、順次アクセスに従って′0′や′
1′がシフトインされる。シフトレジスタ13の出力を
診断プロセッサに送り、エラー情報として保存する。
ECC circuit 4 simultaneously generates a syndrome and a 1-bit error signal and sends them via path 102 to the diagnostic processor. On the other hand, address information when a 1-bit error occurs is sent from address register 1 to error address register 8 via bus 101, and from ECC circuit 4 to path 10.
3 is set in the error address register 8 by a 1-bit error occurrence signal sent through the address register 8. The contents of the register are held by path 104. In this embodiment, the first error is held. The contents of error address register 8 are sent via path 105 to the diagnostic processor. When considering a subsequent access in a state where a 1-bit error address is held in the error address register 8, if the accessed address is the same as the 1-bit error occurrence address that occurred earlier, the result of the comparator circuit 9 indicates a matching state, which means that the same address where a 1-bit error occurred was accessed in the bargain sale that was in a matching state. In that case, the output of the comparison circuit 9 is the output from the ECC circuit 4, and if there is a 1-bit error, the AND gate 10. The signal is input to the shift register 13 via the OR gate 11 as a shift-up signal for the shift register 13. On the other hand, in the case where a 1-bit error does not occur even if the addresses match, that is, in the write mode, the WR control circuit 7 provides the write signal to the gate circuit 12 via the path 107 together with the request signal (REQUEST). In this case as well, the signal is inputted as a shift up signal to the shift register 13 via the OR gate 11. As described above, the shift register 13 is shifted up when an address matches and there is a 1-bit error or write access. On the other hand, for shift data, a write signal from the WR control circuit 7 is input to the input of the shift register. Therefore, when writing, data 0 is input, and when reading, data 0 is input. By setting all initial values to '1', if the first 1-bit error occurs during reading, '0' will be input, and as the access progresses, '0' will be input. or'
1' is shifted in. The output of the shift register 13 is sent to the diagnostic processor and saved as error information.

診断プロセッサではシンドローム、エラーアドレス、シ
フトレジスタの内容を登録しており特にシフトレジスタ
の内容は1ビットエラーの発生したアドレスへのライト
、リードの時系列データを与えることになる。
The diagnostic processor registers syndromes, error addresses, and the contents of the shift register, and in particular, the contents of the shift register provide time-series data of writes and reads to the address where a 1-bit error has occurred.

本実施例の場合′O′がシフトインされていれば読み出
しがその数だけ行われエラーが発生したことを示す、ま
た′1′がシフトインされていれば途中で書き込みが行
われたことがわかる。この情報から当該1ビットエラー
がハード的にエラーしているのか、ソフトエラーのリー
ド連続で発生しているのか判断ができる。
In this embodiment, if 'O' is shifted in, it indicates that reading has been performed for that number of times and an error has occurred, and if '1' is shifted in, it indicates that writing was performed in the middle. Recognize. From this information, it can be determined whether the 1-bit error is caused by a hardware error or by continuous reading of a soft error.

〔発明の効果〕〔Effect of the invention〕

以上説明したように、本発明は、簡単なレジスタ、比較
回路、シフト、レジスタ、ゲート回路を設けることによ
り、発生した1ビットエラーの時系列的情報を得ること
ができ、ソフトエラー、ハードエラーの区別の判断材料
となる。その後の保守運用において交換対象カードの判
定を容易に行うことができる効果がある。
As explained above, by providing simple registers, comparison circuits, shift registers, and gate circuits, the present invention makes it possible to obtain time-series information on 1-bit errors that occur, and to prevent soft errors and hard errors. This serves as a basis for determining the distinction. This has the effect of making it easier to determine which cards are to be replaced during subsequent maintenance operations.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明の一実施例を示すブロック図である。 1・・・アドレスレジスタ、2・・・メモリアレイ、3
・・・メモリ読み出しデータレジスタ、4・・・FCC
回路、5・・・訂正回路、6・・・読み出しデータレジ
スタ、7・・・WRコントロール回路、8・・・エラー
アドレスレジスタ、9・・・比較回路、10・・・AN
Dゲート、11・・・ORゲート、12・・・ANDゲ
ート、3・・・シフトレジスタ。
FIG. 1 is a block diagram showing one embodiment of the present invention. 1...Address register, 2...Memory array, 3
...Memory read data register, 4...FCC
Circuit, 5... Correction circuit, 6... Read data register, 7... WR control circuit, 8... Error address register, 9... Comparison circuit, 10... AN
D gate, 11...OR gate, 12...AND gate, 3...shift register.

Claims (1)

【特許請求の範囲】[Claims]  1ビットエラーが発生するとその時のアドレスを保持
するエラーアドレスレジスタと、メモリアクセスの度に
そのアクセスアドレスと前記エラーアドレスレジスタの
保持内容を比較する比較回路と、前記比較回路が一致し
かつ1ビットエラーが発生した時、または前記比較回路
が一致しかつ書き込みアクセスがあった時、書き込みの
読み出しモード信号をシフトインデータとしてシフトレ
ジスタを駆動し、シフトレジスタの内容を情報として、
その内容から1ビットエラーの発生状況を知ることによ
り1ビットエラーのソフトエラー、ハードエラーの判定
を行うことを特徴とするメモリエラー処理方式。
When a 1-bit error occurs, there is an error address register that holds the address at that time, a comparison circuit that compares the access address with the contents held in the error address register each time a memory is accessed, and a comparison circuit that compares the access address and the contents held in the error address register when a 1-bit error occurs. occurs, or when the comparison circuit matches and there is a write access, the read mode signal of the write is used as shift-in data to drive the shift register, and the contents of the shift register are used as information,
A memory error processing method characterized by determining whether a 1-bit error is a soft error or a hard error by knowing the occurrence status of the 1-bit error from its contents.
JP63191518A 1988-07-29 1988-07-29 Memory error processing system Pending JPH0240746A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63191518A JPH0240746A (en) 1988-07-29 1988-07-29 Memory error processing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63191518A JPH0240746A (en) 1988-07-29 1988-07-29 Memory error processing system

Publications (1)

Publication Number Publication Date
JPH0240746A true JPH0240746A (en) 1990-02-09

Family

ID=16275990

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63191518A Pending JPH0240746A (en) 1988-07-29 1988-07-29 Memory error processing system

Country Status (1)

Country Link
JP (1) JPH0240746A (en)

Similar Documents

Publication Publication Date Title
KR920005297B1 (en) Fault tolerant computer memory system
US6715116B2 (en) Memory data verify operation
US5978952A (en) Time-distributed ECC scrubbing to correct memory errors
EP1255197B1 (en) System and method for correcting soft errors in random access memory devices
US7353438B2 (en) Transparent error correcting memory
EP0032957B1 (en) Information processing system for error processing, and error processing method
US8566669B2 (en) Memory system and method for generating and transferring parity information
JPS6061837A (en) Error corrector
US20170192843A1 (en) Error counters on a memory device
US4926426A (en) Error correction check during write cycles
US3735105A (en) Error correcting system and method for monolithic memories
JP2519286B2 (en) Address line test method
US4251863A (en) Apparatus for correction of memory errors
US6823424B2 (en) Rebuild bus utilization
JPS62214599A (en) Semiconductor memory device
KR920010972B1 (en) Fault tolerant computer memory systems
JPH1097471A (en) Method and system for error correction of memory data
JPH0240746A (en) Memory error processing system
WO2024198468A1 (en) Memory error correction method, memory module, memory controller, and processor
JPS62120557A (en) Storage system
JPS6161299A (en) Storage device
RU2062512C1 (en) Memory unit which detects errors and corrects single error
JPS63279348A (en) Check system for memory
JPS615500A (en) Memory integrated circuit
JPH11167497A (en) Device and method for detecting memory rewrite operation error