[go: up one dir, main page]

KR20010011204A - Method and apparatus for overcoming raid failure by cache mirroring - Google Patents

Method and apparatus for overcoming raid failure by cache mirroring Download PDF

Info

Publication number
KR20010011204A
KR20010011204A KR1019990030451A KR19990030451A KR20010011204A KR 20010011204 A KR20010011204 A KR 20010011204A KR 1019990030451 A KR1019990030451 A KR 1019990030451A KR 19990030451 A KR19990030451 A KR 19990030451A KR 20010011204 A KR20010011204 A KR 20010011204A
Authority
KR
South Korea
Prior art keywords
raid
cache
raid controller
redundant
controller
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
KR1019990030451A
Other languages
Korean (ko)
Inventor
오광수
Original Assignee
윤종용
삼성전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 윤종용, 삼성전자 주식회사 filed Critical 윤종용
Priority to KR1019990030451A priority Critical patent/KR20010011204A/en
Publication of KR20010011204A publication Critical patent/KR20010011204A/en
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1666Error detection or correction of the data by redundancy in hardware where the redundant component is memory or memory area
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1658Data re-synchronization of a redundant component, or initial sync of replacement, additional or spare unit
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2211/00Indexing scheme relating to details of data-processing equipment not covered by groups G06F3/00 - G06F13/00
    • G06F2211/10Indexing scheme relating to G06F11/10
    • G06F2211/1002Indexing scheme relating to G06F11/1076
    • G06F2211/1009Cache, i.e. caches used in RAID system with parity

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Memory System Of A Hierarchy Structure (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)

Abstract

본 발명은 RAID 디스크 어레이를 제어하기 위하여 각각 캐쉬를 가지는 이중화된 RAID 제어기를 가지는 RAID 시스템에 관한 것이다. 이중화된 두 개의 RAID 제어기는 각자의 캐쉬에 저장된 내용을 항시 비교하여 서로간에 일치시키며, RAID 디스크 어레이에 쓰기가 완료되면 각자의 캐쉬에 있는 데이터를 삭제함으로써, 서로의 캐쉬를 미러링한다. 만일 이중화된 두 개의 RAID 제어기 가운데, 활성화되어 있는 RAID 제어기에서 장애가 검출되거나 상기 RAID 제어기나 상기 RAID 디스크 어레이간의 연결부위에 장애가 검출되면 예비된 RAID 제어기는 자신의 캐쉬에 있는 데이터를 RAID 디스크 어레이에 기록하여, 활성화된 RAID 제어기의 장애로 인하여 데이터가 유실되는 것을 방지한다. 본 발명은 상기 캐쉬미러링은 IEEE1394를 사용함으로써 뛰어난 입출력 성능을 제공하여 호스트 서버의 속도 저하를 감소시킨다.The present invention relates to a RAID system having a redundant RAID controller each having a cache for controlling a RAID disk array. The two redundant RAID controllers always compare the contents of each cache and match each other, and mirror each other's cache by deleting data in each cache when writing to the RAID disk array is completed. If one of the two redundant RAID controllers detects a failure in the active RAID controller or a failure in the connection between the RAID controller and the RAID disk array, the reserved RAID controller writes the data in its cache to the RAID disk array. This prevents data loss due to an active RAID controller failure. According to the present invention, the cache mirroring provides an excellent input / output performance by using IEEE 1394, thereby reducing the degradation of the host server.

Description

캐쉬미러링을 통한 레이드 장애극복 방법 및 장치{METHOD AND APPARATUS FOR OVERCOMING RAID FAILURE BY CACHE MIRRORING}METHOD AND APPARATUS FOR OVERCOMING RAID FAILURE BY CACHE MIRRORING}

본 발명은 RAID(Redundant Array of Inexpensive Disk) 시스템에 관한 것으로서, 특히 RAID 제어기와 RAID 어레이 간의 장애 발생시, 고속 직렬통신 프로토콜을 통해서 RAID 제어기의 캐쉬에 남아있는 데이터를 저장하여 데이터의 일관성을 보장하는, 캐쉬미러링(Cache Mirroring)을 통한 RAID 장애극복 방법 및 장치에 관한 것이다.The present invention relates to a Redundant Array of Inexpensive Disk (RAID) system, in particular, in the event of a failure between a RAID controller and a RAID array, to ensure data consistency by storing data remaining in the cache of the RAID controller through a high speed serial communication protocol, The present invention relates to a RAID failover method and apparatus through cache mirroring.

RAID 시스템은 작고 값싼 드라이브를 다수개 연결해서 RAID 어레이를 구성함으로써, 크고 비싼 하나의 드라이브를 대신한다. RAID 시스템은 여러 드라이브의 집합을 하나의 저장장치처럼 다룰 수 있도록 하여 장애가 발생했을 때 데이터가 유실되지 않도록 하며, 각각의 드라이브가 독립적으로 동작할 수 있도록 한다. 따라서 RAID 시스템은 많은 데이터를 장애없이 안정적으로 저장할 수 있도록 한다.The RAID system replaces one large and expensive drive by forming a RAID array by connecting many small and inexpensive drives. RAID systems treat a set of drives as if they were a single storage device, so that in the event of a failure, data is not lost and each drive can operate independently. Therefore, RAID system can reliably store a lot of data without any trouble.

종래기술에 의한 RAID 시스템의 문제점을 도 1 및 도 2 를 참조하여 설명하면 다음과 같다.The problems of the prior art RAID system will be described with reference to FIGS. 1 and 2.

도 1 은 종래기술에 의한 RAID 시스템의 구성도이다. 도시된 바와 같이, RAID 제어기(100)는 RAID 어레이(200)와 연결되어 호스트 서버(300)의 입출력 요구를 처리하며, 호스트 서버(300)와의 사이에 전송되는 모든 데이터는 캐쉬를 통하도록 하여 입출력 기능을 향상시킨다.1 is a configuration diagram of a RAID system according to the prior art. As shown, the RAID controller 100 is connected to the RAID array 200 to process the input and output requests of the host server 300, all data transmitted between the host server 300 and the input and output through the cache through the cache Improve the function

상기된 바와 같이, 하나의 RAID 제어기(100)를 사용하여 RAID 어레이(200)와 호스트 서버(300)간을 연결하는 경우, 상기 RAID 제어기(100)나 그 연결부위에 장애가 발생하면, 상기 호스트 서버(300)는 상기 RAID 어레이(200)를 사용할 수 없게 된다. 이를 위하여 대기상태의 RAID 제어기(110)를 추가적으로 설치하고, 활성상태의 RAID 제어기(100)와 이중화 구조를 이루도록 한다.As described above, when connecting between the RAID array 200 and the host server 300 by using one RAID controller 100, if a failure occurs in the RAID controller 100 or its connection portion, the host server 300 may not use the RAID array 200. To this end, a standby RAID controller 110 is additionally installed, and a redundant structure is formed with the active RAID controller 100.

도 2 는 종래기술에 의한 이중화된 RAID 제어기의 구성도를 나타낸 것이다. 도시된 바와 같이, 두 개의 RAID 제어기(100)(110)는 동일한 구조를 가지며, 하나의 RAID 제어기, 예를 들어 RAID 제어기(100)가 활성화되면 그 캐쉬(101)가 지역 캐쉬(Local Cache)로 사용되고, 다른 RAID 제어기(110)의 캐쉬(111)는 원격 캐쉬(Remote Cache)로 사용된다.2 is a block diagram of a redundant RAID controller according to the prior art. As shown, the two RAID controllers 100 and 110 have the same structure, and when one RAID controller, for example, RAID controller 100 is activated, its cache 101 is converted into a local cache. The cache 111 of the other RAID controller 110 is used as a remote cache.

상기된 바와 같이 RAID 시스템과 호스트 서버 간에 경로를 이중화하면, RAID 제어기나 연결부위에 장애가 발생한 경우에 호스트 서버의 서비스 중단시간을 최소화할 수 있다. 그러나 이 경우, 호스트 서버의 명령에 의하여 활성화 RAID 제어기의 캐쉬에 기록된 데이터는, 유실된다. 그렇게 되면, 호스트 서버는 데이터 쓰기에 성공한 것으로 인식하지만, 실제로 캐쉬에 기록된 데이터는 RAID 디스크 어레이에 기록되지 않아서 호스트 서버와 RAID 디스크 어레이 간의 데이터의 불일치가 발생된다.As described above, if the path is redundant between the RAID system and the host server, service downtime of the host server may be minimized in the event of a failure of the RAID controller or the connection part. In this case, however, data written to the cache of the active RAID controller by the command of the host server is lost. If so, the host server recognizes that the data has been written successfully, but the data actually written to the cache is not written to the RAID disk array, resulting in data inconsistency between the host server and the RAID disk array.

그러나 이러한 데이터의 불일치를 방지하기 위하여 RAID 제어기에 캐쉬를 사용하지 않고 바로 RAID 디스크 어레이에 기록하는 write-through 모드를 사용하게 되면, 데이터 읽기/쓰기 상의 속도가 저하된다는 문제점이 발생한다.However, in order to prevent such data inconsistency, if the write-through mode of writing to the RAID disk array is used immediately without using a cache in the RAID controller, the data read / write speed may decrease.

즉, 종래기술에 의한 RAID 시스템은 버퍼 메모리에 기록된 데이터가 갑작스런 전원장애로 인하여 유실되는 것을 방지하는 수단은 제공하고 있으나, 장애 발생시 이중화된 RAID 제어기의 두 캐쉬간에 데이터를 일치시키기 위한 방법은 제공된 바가 없었다는 문제점이 있었다.That is, the conventional RAID system provides a means for preventing the data written to the buffer memory from being lost due to a sudden power failure, but a method for matching data between two caches of a redundant RAID controller in the event of a failure is provided. There was a problem that there was no bar.

따라서 상기한 바와 같이 동작되는 종래 기술의 문제점을 해결하기 위하여 창안된 본 발명의 목적은, 이중화된 RAID 제어기의 두 캐쉬간에 캐쉬미러링(Cache Mirroring)을 사용하여 데이터를 일치시킴으로써, 장애 발생시 활성화된 캐쉬내에 저장된 데이터가 유실되어도 대기상태의 캐쉬내에 저장된 데이터가 RAID 디스크 어레이에 대신 기록될 수 있도록 하기 위한, 캐쉬미러링을 통한 RAID 장애극복 방법 및 장치를 제공하는 것이다.Accordingly, an object of the present invention, which is designed to solve the problems of the prior art operating as described above, is to synchronize data using cache mirroring between two caches of a redundant RAID controller, thereby enabling the cache to be activated in the event of a failure. A method and apparatus for failover of a RAID through cache mirroring is provided so that data stored in a standby cache can be written to a RAID disk array even if data stored therein is lost.

도 1 은 종래기술에 의한 RAID 시스템의 구성도.1 is a block diagram of a RAID system according to the prior art.

도 2 는 종래기술에 의한 이중화된 RAID 제어기의 구성도.2 is a block diagram of a redundant RAID controller according to the prior art.

도 3 은 본 발명에 의한 RAID 시스템의 구성도.3 is a configuration diagram of a RAID system according to the present invention.

도 4 는 본 발명에 의한 RAID 장애극복 방법의 흐름도.4 is a flowchart of a RAID failover method according to the present invention;

도 5 는 본 발명에 의한 캐쉬미러링을 수행하기 위한 이중화된 RAID 제어기의 구성도.5 is a configuration diagram of a redundant RAID controller for performing cache mirroring according to the present invention.

도 6 은 본 발명에 의한 캐쉬블럭과 직렬 인터페이스 블럭간의 통신절차를 나타낸 메시지 흐름도.6 is a message flow diagram illustrating a communication procedure between a cache block and a serial interface block according to the present invention.

〈도면의 주요 부분에 대한 부호의 설명〉<Explanation of symbols for main parts of drawing>

100,110,400,410 : RAID 제어기100,110,400,410: RAID Controller

200,500 : RAID 디스크 어레이200,500: RAID disk array

300,600 : 호스트 서버300,600: host server

101,111,401,411 : 캐쉬101,111,401,411: Cash

102,112,402,412 : 캐쉬 블럭102,112,402,412: Cache Block

103,113,403,413 : RAID 관리 블럭103,113,403,413: RAID Management Block

104,114,405,415 : SCSI 인터페이스 블럭104,114,405,415: SCSI Interface Blocks

105,115,406,416 : 장애복구 블럭105,115,406,416: failover block

106,116,407,417 : DMA 블럭106,116,407,417: DMA block

107,117,408,418 : 구조 블럭107,117,408,418: Structural Blocks

108,118,409,419 : 초기화 블럭108,118,409,419: Initialization block

404,414 : 직렬 인터페이스 블럭404,414 serial interface block

1 : IEEE1394 케이블1: IEEE1394 cable

상기한 바와 같은 목적을 달성하기 위하여 창안된 본 발명에 따른 캐쉬미러링을 통한 RAID 장애극복 방법의 실시예는, 호스트 서버의 요구에 따라 RAID(Redundant Array of Inexpensive Disks) 디스크 어레이(Disk Array)를 제어하기 위하여 각각 캐쉬를 가지는 이중화된 RAID 제어기에 있어서,Embodiment of the RAID failover method through the cache mirroring in accordance with the present invention, which is invented to achieve the above object, controls a RAID (Redundant Array of Inexpensive Disks) disk array according to the needs of the host server In a redundant RAID controller each having a cache for

상기 이중화된 두 개의 RAID 제어기가 각자의 캐쉬에 저장된 내용을 항시 비교하여 서로간에 일치시키며, RAID 디스크 어레이에 쓰기가 완료되면 각자의 캐쉬에 있는 데이터를 삭제함으로써, 서로의 캐쉬를 미러링하는 단계(s10)와;The two redundant RAID controllers always compare the contents stored in the respective caches and match each other, and when writing to the RAID disk array is completed, deleting the data in the respective caches, thereby mirroring each other's cache (s10). )Wow;

상기 이중화된 두 개의 RAID 제어기 가운데, 활성화되어 있는 RAID 제어기에서 장애가 검출되거나 상기 RAID 제어기나 상기 RAID 디스크 어레이간의 연결부위에 장애가 검출되면, 예비된 RAID 제어기가 자신의 캐쉬에 있는 데이터를 RAID 디스크 어레이에 기록하는 단계(s20,s30)를 포함한다.Among the two redundant RAID controllers, if a failure is detected in an active RAID controller or a connection between the RAID controller and the RAID disk array is detected, the reserved RAID controller transfers the data in its cache to the RAID disk array. Recording step (s20, s30).

본 발명에 따른 캐쉬미러링을 통한 RAID 장애극복 장치의 실시예는,An embodiment of a RAID failover device through cache mirroring according to the present invention,

호스트 서버(600)와;A host server 600;

RAID 디스크 어레이(500);RAID disk array 500;

상기 호스트 서버의 요구에 의하여 상기 RAID 디스크 어레이를 제어하기 위한 캐쉬를 가지는 이중화된 RAID 제어기(400,410); 및A redundant RAID controller (400, 410) having a cache for controlling the RAID disk array at the request of the host server; And

상기 이중화된 RAID 간을 연결하며, 상기 이중화된 RAID 제어기내 캐쉬간에 데이터를 상호간에 복제하는 캐쉬미러링을 위한 인터페이스 수단(1)을 포함하며, 상기 각각의 RAID 제어기는,An interface means (1) for connecting the redundant RAID and for cache mirroring to mutually replicate data between caches in the redundant RAID controller, wherein each RAID controller comprises:

RAID 관리 블럭(403,413)과;RAID management blocks 403 and 413;

다른 RAID 제어기와 캐쉬미러링을 통해 데이터를 일치시키는 캐쉬(401,411);Caches 401 and 411 that match data with other RAID controllers through cache mirroring;

상기 RAID 관리 블럭의 제어에 의하여 상기 캐쉬를 제어하는 캐쉬 블럭(402)(412); 및A cache block (402) (412) for controlling the cache by controlling the RAID management block; And

상기 다른 RAID 제어기와 연결되며, 상기 캐쉬 블럭의 제어에 의하여 캐쉬미러링을 수행하는 인터페이스 블럭(404)(414)을 포함한다.It is connected to the other RAID controller, and includes interface blocks 404, 414 to perform cache mirroring under the control of the cache block.

본 발명에 따른 이중화된 두 개의 RAID 제어기는 각자의 캐쉬에 저장된 내용을 항시 비교하여 서로간에 일치시키며, RAID 디스크 어레이에 쓰기가 완료되면 각자의 캐쉬에 있는 데이터를 삭제함으로써, 서로의 캐쉬를 미러링(Mirroring)한다. 이를 위하여 상기 이중화된 두 개의 RAID 제어기는 캐쉬미러링을 위하여 별도의 인터페이스 수단, 즉 직렬 인터페이스 케이블을 통해 상호간에 연결된다.Two redundant RAID controllers according to the present invention always compare the contents stored in their respective caches and match each other, and when writing to the RAID disk array is completed, by deleting data in their caches, mirroring each other's cache ( Mirroring). To this end, the two redundant RAID controllers are connected to each other via a separate interface means, that is, a serial interface cable for cache mirroring.

활성화되어 있는 RAID 제어기에서 장애가 검출되거나 연결부위에 장애가 검출되면, 예비된 RAID 제어기는 즉시 활성화되는 동시에 자신의 캐쉬에 있는 데이터를 RAID 디스크 어레이에 쓰고 나서 RAID 디스크 어레이를 계속해서 제어한다.When a failure is detected in an active RAID controller or a connection failure is detected, the reserved RAID controller immediately activates and writes data in its cache to the RAID disk array and then continues to control the RAID disk array.

이하 첨부된 도면을 참조하여 본 발명의 바람직한 실시예에 대한 동작 원리를 상세히 설명한다.Hereinafter, with reference to the accompanying drawings will be described in detail the operating principle of the preferred embodiment of the present invention.

도 3 은 본 발명에 의한 RAID 시스템의 구성도이며, 도 4 는 본 발명에 의한 RAID 장애극복 방법의 흐름도이다. 도시된 바와 같이, 단계(s10)에서, RAID 디스크 어레이(500)와 연결되어 호스트 서버(600)의 입출력 요구를 처리하는 이중화된 RAID 제어기(400)(410)는, 캐쉬미러링을 통해 각자의 캐쉬에 있는 내용을 일치시킨다.3 is a block diagram of a RAID system according to the present invention, Figure 4 is a flowchart of a RAID failover method according to the present invention. As shown, in step s10, the redundant RAID controller 400, 410 connected to the RAID disk array 500 to process the input and output requests of the host server 600, each cache through a cache mirroring Match the contents in.

초기에 제 1 RAID 제어기(400)가 활성(Active)으로 설정되고 제 2 RAID 제어기(410)가 대기(Standby)로 설정되었다면, 제 1 RAID 제어기(400)의 캐쉬에 저장되는 데이터는 제 2 RAID 제어기(410)의 캐쉬에도 똑같이 저장된다. 제 1 RAID 제어기(400)의 캐쉬에 저장된 데이터가 RAID 디스크 어레이(500)에 기록되어 삭제되면, 제 2 RAID 제어기(400)의 캐쉬에 저장된 데이터도 삭제된다.If the first RAID controller 400 is initially set to Active and the second RAID controller 410 is set to Standby, the data stored in the cache of the first RAID controller 400 is stored in the second RAID. The same is stored in the cache of the controller 410. When data stored in the cache of the first RAID controller 400 is recorded and deleted in the RAID disk array 500, data stored in the cache of the second RAID controller 400 is also deleted.

단계(s20)에서, 정상적인 상태에서 상기와 같은 캐쉬미러링 동작을 수행하는 도중에, 제 1 RAID 제어기(400)에 이상이 발생하거나 제 1 RAID 제어기(400)와 상기 RAID 디스크 어레이(500) 사이의 연결부위에 이상이 발생한 경우, 단계(s30)에서 제 1 RAID 제어기(400)는 먼저 제 2 RAID 제어기(410)에게 캐쉬의 내용을 저장하라는 메시지를 보낸다. 그리고 이상이 발생하였음을 호스트 서버(600)에게 보고하여, 호스트 서버(600)가 제 2 RAID 제어기(410)로 동작을 전환시킬 수 있도록 한다.In operation S20, during the above-described cache mirroring operation in a normal state, an error occurs in the first RAID controller 400 or the connection between the first RAID controller 400 and the RAID disk array 500. In the case where an abnormality occurs in the site, in step S30, the first RAID controller 400 first sends a message to the second RAID controller 410 to store the contents of the cache. In addition, the host server 600 reports that the abnormality has occurred, so that the host server 600 can switch the operation to the second RAID controller 410.

대기하고 있던 제 2 RAID 제어기(410)에게 호스트 서버(600)로부터 활성으로 전환하라는 메시지가 수신되면, 제 2 RAID 제어기(410)는 정상적인 동작을 수행하기 전에 먼저 캐쉬에 저장되어 있는 내용을 저장한 다음, 활성 상태로 전환한다.When the second RAID controller 410 that is waiting to receive a message to switch to active from the host server 600, the second RAID controller 410 first stores the contents stored in the cache before performing the normal operation. Next, switch to the active state.

활성 상태로 전환한 제 2 RAID 제어기(410)는 자신의 캐쉬에 저장된 내용을 상기 RAID 디스크 어레이(500)에 기록한다. 따라서 캐쉬에 저장된 내용은 유실되지 않고, RAID 디스크 어레이에 기록된다.The second RAID controller 410 that is switched to the active state writes the contents stored in its cache to the RAID disk array 500. Therefore, the contents stored in the cache are not lost but are written to the RAID disk array.

이때 제 1 RAID 제어기(400)와 제 2 RAID 제어기(410)는 캐쉬미러링을 계속 수행함으로써 디스크 읽기/쓰기 속도가 저하되지 않도록 하기 위하여, 매우 빠른 직렬 인터페이스를 사용한다.In this case, the first RAID controller 400 and the second RAID controller 410 use a very fast serial interface in order not to degrade the disk read / write speed by continuing the cache mirroring.

이하 이중화된 RAID 제어기간에 캐쉬미러링을 위하여, 직렬버스의 규격인 IEEE1394(Institute of Electrical and Electronic Engineers 1394)를 데이터 전송매체로 사용하는 본 발명의 일 실시예의 동작에 대하여 설명한다.Hereinafter, an operation of an embodiment of the present invention using IEEE 1394 (Institute of Electrical and Electronic Engineers 1394), which is a standard of a serial bus, as a data transmission medium for cache mirroring in a redundant RAID control period will be described.

도 5 는 본 발명에 의한 캐쉬미러링을 수행하기 위한 이중화된 RAID 제어기의 구성도를 나타낸 것이다. 도시된 바와 같이, 활성화 상태의 제 1 RAID 제어기(400)에서, 캐쉬 블럭(402)은 RAID 관리블럭(403)의 제어에 의하여 캐쉬(401)를 제어하며, SCSI(Small Computers System Interface) 인터페이스 블럭(405)은 RAID 디스크 어레이(500)를 제어한다.5 is a block diagram of a redundant RAID controller for performing cache mirroring according to the present invention. As shown, in the first RAID controller 400 in an activated state, the cache block 402 controls the cache 401 under the control of the RAID management block 403, and the SCSI (Small Computers System Interface) interface block 405 controls the RAID disk array 500.

이때 캐쉬(401)에서 변경되는 내용은, IEEE1394를 지원하도록 하기 위하여 IEEE1394 블럭으로 구성된 직렬 인터페이스 블럭(404)에 의하여, 대기 상태의 제 2 RAID 제어기(410)의 캐쉬(411)로 전송된다.In this case, the contents changed in the cache 401 are transmitted to the cache 411 of the second RAID controller 410 in the standby state by the serial interface block 404 composed of the IEEE 1394 blocks in order to support the IEEE 1394.

즉, 캐쉬들(401)(411)간에 전송되는 데이터는 IEEE1384를 지원하는 직렬 인터페이스 블럭(404)(414)에 의하여 IEEE1394 케이블로 구성된 직렬 케이블(1)을 통해 전달된다.That is, data transmitted between the caches 401 and 411 is transmitted through the serial cable 1 composed of an IEEE 1394 cable by the serial interface blocks 404 and 414 supporting IEEE 1384.

캐쉬블럭과 IEEE1394 블럭은 도 6 에 도시된 바와 같은 메시지들을 이용하여 캐쉬미러링을 구현한다. 이하 캐쉬블럭과 IEEE1394 블럭간에 전송되는 메시지에 대하여 설명하면 다음과 같다.The cache block and the IEEE 1394 block implement cache mirroring using messages as shown in FIG. Hereinafter, a message transmitted between the cache block and the IEEE 1394 block will be described.

활성 RAID 제어기의 캐쉬블럭이 예비 RAID 제어기와 연결되기 위하여 활성 RAID 제어기의 IEEE1394 블럭으로 SrCacheSetup(s1)를 전송하면, IEEE1394 블럭은 SrCachePeerConnected(s2)로 응답하고 예비 RAID 제어기의 IEEE1394 블럭과 연결된다.When the cache block of the active RAID controller sends SrCacheSetup (s1) to the IEEE1394 block of the active RAID controller to be connected with the spare RAID controller, the IEEE1394 block responds with SrCachePeerConnected (s2) and is connected with the IEEE1394 block of the spare RAID controller.

호스트 서버의 지시에 의하여 새로운 데이터가 캐쉬에 추가되면, 활성 캐쉬블럭은 IEEE1394 블럭으로 SrCacheBlockCopyOut(s3)을 보내어 예비 RAID 제어기에 현재 추가된 캐쉬 데이터를 복사하도록 한다.When new data is added to the cache by the host server, the active cache block sends SrCacheBlockCopyOut (s3) to the IEEE1394 block to copy the currently added cache data to the spare RAID controller.

만일 활성 캐쉬 블럭으로부터 SrCacheBlockCopyIn(s4)가 수신되면, IEEE1394 블럭은 예비 RAID 제어기에게 수신된 캐쉬 데이터를 저장할 것을 요구하며, 수신된 캐쉬 데이터가 저장되면 SrCacheBlockCopyDone(s5)로 응답한다.If SrCacheBlockCopyIn (s4) is received from the active cache block, the IEEE1394 block requests the spare RAID controller to store the received cache data, and if the received cache data is stored, it responds with SrCacheBlockCopyDone (s5).

활성 RAID 제어기의 캐쉬에 저장된 캐쉬데이터가 RAID 디스크 어레이에 기록되면, 캐쉬블럭은 IEEE1394 블럭을 통해 SrCacheBlockInvalidate(s6)를 예비 RAID 제어기에게 전송한다. 그러면 예비 제어기는 캐쉬에 저장된 데이터를 삭제하며, IEEE1394 블럭은 SrCacheBlockPurge(s7)로 응답한다.When cache data stored in the cache of the active RAID controller is written to the RAID disk array, the cache block sends SrCacheBlockInvalidate (s6) to the spare RAID controller through the IEEE1394 block. The spare controller then deletes the data stored in the cache, and the IEEE 1394 block responds with SrCacheBlockPurge (s7).

또한 캐쉬블럭은 IEEE1394 블럭을 통해 SrCacheIsPeerAlive(s8)를 전송하여 예비 RAID 제어기가 정상적인지를 확인하면, 예비 RAID 제어기가 정상적이면 IEEE1394 블럭은 SrCachePeerAlive(s9)를 전송하여 응답한다.In addition, the cache block transmits SrCacheIsPeerAlive (s8) through the IEEE1394 block to check whether the spare RAID controller is normal. If the spare RAID controller is normal, the IEEE1394 block responds by transmitting SrCachePeerAlive (s9).

이상에서 상세히 설명한 바와 같이 동작하는 본 발명에 있어서, 개시되는 발명중 대표적인 것에 의하여 얻어지는 효과를 간단히 설명하면 다음과 같다.In the present invention operating as described in detail above, the effects obtained by the representative ones of the disclosed inventions will be briefly described as follows.

본 발명은, 이중화된 RAID 제어기를 사용하는 RAID 시스템에서 장애발생시에도 데이터의 일관성이 유지되도록 하여 신뢰성이 향상되도록 하며, 호스트 서버의 데이터와 RAID 디스크 어레이에 실제로 저장된 데이터간에 일관성을 유지할 수 있는 효과가 있다.According to the present invention, reliability is improved by maintaining the consistency of data even in the event of a failure in a RAID system using a redundant RAID controller, and the effect of maintaining the consistency between the data of the host server and the data actually stored in the RAID disk array is effective. have.

또한 현재의 직렬통신방법가운데 가장 빠른 속도를 제공하며 간단한 인터페이스로 구현이 가능한 IEEE1394를 이중화된 RAID 제어기간에 캐쉬미러링을 위한 데이터 전송매체로 선택함으로써, 뛰어난 입출력 성능을 제공하여 호스트 서버의 속도 저하를 감소시킬 수 있다.In addition, IEEE1394, which provides the fastest speed among current serial communication methods and can be implemented as a simple interface, is selected as a data transmission medium for cache mirroring in a redundant RAID control period, providing excellent I / O performance and reducing the speed of the host server. Can be reduced.

Claims (6)

호스트 서버의 요구에 따라 RAID(Redundant Array of Inexpensive Disks) 디스크 어레이(Disk Array)를 제어하기 위하여 각각 캐쉬를 가지며, 인터페이스 수단을 통해 상호간의 데이터를 전송하는 이중화된 RAID 제어기에 의한 장애 극복방법에 있어서,In the failover method of the redundant RAID controller which has a cache to control the Redundant Array of Inexpensive Disks (RAID) Disk Array according to the request of the host server, and transfers data to each other through the interface means. , 상기 이중화된 두 개의 RAID 제어기내 캐쉬간에 상기 인터페이스 수단을 통해 서로의 저장 데이터를 복제하는 미러링하는 단계와;Mirroring each other's stored data via the interface means between the caches in the two redundant RAID controllers; 상기 이중화된 두 개의 RAID 제어기 가운데 활성화되어 있는 RAID 제어기의 동작에 장애가 검출되면, 비활성화 상태의 RAID 제어기를 활성화 상태로 절체한 후 활성화 상태로 절체된 RAID 제어기내 캐쉬에 복제되어 있는 데이터를 상기 RAID 디스크 어레이에 기록하는 단계를 포함하는, 캐쉬미러링을 통한 RAID 장애극복 방법.If a failure is detected in an operation of an active RAID controller among two redundant RAID controllers, the RAID disk is transferred to an inactive state, and data copied to the cache in the RAID controller transferred to the active state is transferred to the RAID disk. A method for failover of RAID through cache mirroring, comprising writing to an array. 제 1 항에 있어서, 상기 비활성화 상태의 RAID 제어기가 활성화 상태로 절체되어 자신의 캐쉬에 있는 데이터를 RAID 디스크 어레이에 기록하는 단계는,The method of claim 1, wherein the inactive RAID controller is switched to an active state to write data in its cache to a RAID disk array. 상기 장애가 검출되면 상기 활성화 상태인 RAID 제어기가 상기 비활성화 RAID 제어기에게 캐쉬의 데이터를 저장하라는 메시지를 전송하는 단계와;When the failure is detected, sending the message to the inactive RAID controller to store the cache data to the inactive RAID controller; 상기 활성화 RAID 제어기가 상기 호스트 서버에게 상기 장애의 검출을 보고하는 단계;The active RAID controller reporting the detection of the failure to the host server; 상기 호스트 서버가 상기 비활성화 RAID 제어기에게 활성화 절체를 명령하는 단계;The host server instructing the inactive RAID controller to activate a switchover; 상기 명령에 의하여 상기 비활성화 RAID 제어기가 활성으로 절체된 후, 자신의 캐쉬에 저장된 내용을 상기 RAID 디스크 어레이에 기록하는 단계; 및Writing the contents stored in its cache to the RAID disk array after the inactive RAID controller is actively switched by the command; And 상기 활성으로 절체된 RAID 제어기가 상기 RAID 디스크 어레이를 제어하는 단계를 포함하는, 캐쉬미러링을 통한 RAID 장애극복 방법.And controlling the RAID disk array by the actively switched RAID controller. 제 1 항 또는 제 2 항에 있어서, 상기 인터페이스 수단은, IEEE1394 직렬 통신방법에 의해서 동작되는, 캐쉬미러링을 통한 RAID 장애극복 방법.The method of claim 1 or 2, wherein the interface means is operated by an IEEE 1394 serial communication method. 호스트 서버와;A host server; RAID(Redundant Array of Inexpensive Disks) 디스크 어레이;Redundant Array of Inexpensive Disks (RAID) disk arrays; 상기 호스트 서버의 요구에 의하여 상기 RAID 디스크 어레이를 제어하기 위한 캐쉬를 가지는 이중화된 RAID 제어기; 및A redundant RAID controller having a cache for controlling the RAID disk array at the request of the host server; And 상기 이중화된 RAID 간을 연결하며, 상기 이중화된 RAID 제어기내 캐쉬간에 데이터를 상호간에 복제하는 캐쉬미러링을 위한 인터페이스 수단을 포함하는, 캐쉬미러링을 통한 RAID 장애극복 장치.And means for interfacing the redundant RAID and cache mirroring to mutually replicate data between caches in the redundant RAID controller. 제 4 항에 있어서, 상기 인터페이스 수단은 IEEE1394에 의한 데이터 전송방식을 지원하는, 캐쉬미러링을 통한 RAID 장애극복 장치.5. The apparatus of claim 4, wherein the interface means supports a data transmission scheme according to IEEE1394. 제 4 항 또는 제 5 항에 있어서, 상기 각각의 RAID 제어기는,The method of claim 4 or 5, wherein each of the RAID controller, RAID 관리 블럭과;A RAID management block; 다른 RAID 제어기와 캐쉬미러링을 통해 데이터를 일치시키는 캐쉬;Cache matching data with other RAID controllers through cache mirroring; 상기 RAID 관리 블럭의 제어에 의하여 상기 캐쉬를 제어하는 캐쉬 블럭; 및A cache block controlling the cache by controlling the RAID management block; And 상기 인터페이스 수단을 통해 상기 다른 RAID 제어기와 연결되며, 상기 캐쉬 블럭의 제어에 의하여 상기 캐쉬미러링을 수행하는 인터페이스 블럭을 포함하는, 캐쉬미러링을 통한 RAID 장애극복 장치.And an interface block connected to the other RAID controller through the interface means, the interface block performing the cache mirroring under the control of the cache block.
KR1019990030451A 1999-07-26 1999-07-26 Method and apparatus for overcoming raid failure by cache mirroring Ceased KR20010011204A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019990030451A KR20010011204A (en) 1999-07-26 1999-07-26 Method and apparatus for overcoming raid failure by cache mirroring

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019990030451A KR20010011204A (en) 1999-07-26 1999-07-26 Method and apparatus for overcoming raid failure by cache mirroring

Publications (1)

Publication Number Publication Date
KR20010011204A true KR20010011204A (en) 2001-02-15

Family

ID=19604751

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019990030451A Ceased KR20010011204A (en) 1999-07-26 1999-07-26 Method and apparatus for overcoming raid failure by cache mirroring

Country Status (1)

Country Link
KR (1) KR20010011204A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100422929B1 (en) * 2001-12-29 2004-03-12 엘지전자 주식회사 RAID Duplexing Method
US6754770B2 (en) 2002-03-14 2004-06-22 Electronics And Telecommunications Research Institute Coherence preservation method of duplicated data in RAID subsystem
KR100786153B1 (en) * 2005-03-14 2007-12-18 후지쯔 가부시끼가이샤 Storage system, control method thereof, and program
KR100861691B1 (en) * 2005-12-22 2008-10-06 인터내셔널 비지네스 머신즈 코포레이션 Propagating data using mirrored lock caches

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07110788A (en) * 1993-10-14 1995-04-25 Fujitsu Ltd Disk cache device
JPH08328758A (en) * 1995-06-02 1996-12-13 Hitachi Ltd Disk array device
KR970071285A (en) * 1996-04-04 1997-11-07 베일리 웨인 피 Method and apparatus for maintaining cache continuity in RAID controller with redundant cache
KR19990051729A (en) * 1997-12-19 1999-07-05 정선종 Structure of Raid System with Dual Array Controllers

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07110788A (en) * 1993-10-14 1995-04-25 Fujitsu Ltd Disk cache device
JPH08328758A (en) * 1995-06-02 1996-12-13 Hitachi Ltd Disk array device
KR970071285A (en) * 1996-04-04 1997-11-07 베일리 웨인 피 Method and apparatus for maintaining cache continuity in RAID controller with redundant cache
KR19990051729A (en) * 1997-12-19 1999-07-05 정선종 Structure of Raid System with Dual Array Controllers

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100422929B1 (en) * 2001-12-29 2004-03-12 엘지전자 주식회사 RAID Duplexing Method
US6754770B2 (en) 2002-03-14 2004-06-22 Electronics And Telecommunications Research Institute Coherence preservation method of duplicated data in RAID subsystem
KR100786153B1 (en) * 2005-03-14 2007-12-18 후지쯔 가부시끼가이샤 Storage system, control method thereof, and program
KR100861691B1 (en) * 2005-12-22 2008-10-06 인터내셔널 비지네스 머신즈 코포레이션 Propagating data using mirrored lock caches

Similar Documents

Publication Publication Date Title
US6425049B1 (en) Disk array system and method of changing the configuration of the disk array system
JP2576847B2 (en) Storage control device and related method
US7444541B2 (en) Failover and failback of write cache data in dual active controllers
US6304980B1 (en) Peer-to-peer backup system with failure-triggered device switching honoring reservation of primary device
US8433862B2 (en) Storage system for adjusting asynchronous copy load based on cache activity rate
CN101174197A (en) Information system and data forwarding method of information system
JP4074072B2 (en) Remote copy system with data integrity
US20020103982A1 (en) Redundant backup device
US20030131068A1 (en) Distributed storage system, storage device and method of copying data
US20060203857A1 (en) System and method for data multiplexing
US20010049749A1 (en) Method and system for storing duplicate data
JPH08335144A (en) External storage device
US7421550B2 (en) Storage system and storage system management method
US7472241B2 (en) Storage system and backup method
JP5466650B2 (en) Apparatus and method for managing storage copy service system
JP2001043026A (en) Inter-system information communication system
JPH11338647A (en) Method of forming duplicate data
CN109783401B (en) Data storage methods and storage systems
JP2003330781A (en) Data multiple security method
KR20010011204A (en) Method and apparatus for overcoming raid failure by cache mirroring
JP4398596B2 (en) Disk array device
JP3122295B2 (en) Redundant method of magnetic disk controller
JP2003257127A (en) Magnetic tape device, control method therefor and program for magnetic tape device control
KR100299127B1 (en) Apparatus and method for dualizing main processor in asynchronous transfer mode exchanger
JP5076400B2 (en) Data processing system and information processing apparatus

Legal Events

Date Code Title Description
PA0109 Patent application

Patent event code: PA01091R01D

Comment text: Patent Application

Patent event date: 19990726

PG1501 Laying open of application
A201 Request for examination
PA0201 Request for examination

Patent event code: PA02012R01D

Patent event date: 20040708

Comment text: Request for Examination of Application

Patent event code: PA02011R01I

Patent event date: 19990726

Comment text: Patent Application

E902 Notification of reason for refusal
PE0902 Notice of grounds for rejection

Comment text: Notification of reason for refusal

Patent event date: 20060131

Patent event code: PE09021S01D

E601 Decision to refuse application
PE0601 Decision on rejection of patent

Patent event date: 20060524

Comment text: Decision to Refuse Application

Patent event code: PE06012S01D

Patent event date: 20060131

Comment text: Notification of reason for refusal

Patent event code: PE06011S01I