[go: up one dir, main page]

JP3440219B2 - 入出力装置及びディスク・タイムシェアリング方法 - Google Patents

入出力装置及びディスク・タイムシェアリング方法

Info

Publication number
JP3440219B2
JP3440219B2 JP21875799A JP21875799A JP3440219B2 JP 3440219 B2 JP3440219 B2 JP 3440219B2 JP 21875799 A JP21875799 A JP 21875799A JP 21875799 A JP21875799 A JP 21875799A JP 3440219 B2 JP3440219 B2 JP 3440219B2
Authority
JP
Japan
Prior art keywords
input
output
time
disk
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP21875799A
Other languages
English (en)
Other versions
JP2001043032A (ja
Inventor
匡史 加藤
修 木村
実希夫 伊藤
理一郎 武
勇次 堀田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP21875799A priority Critical patent/JP3440219B2/ja
Priority to US09/495,878 priority patent/US6480904B1/en
Priority to EP00102559A priority patent/EP1074908B1/en
Publication of JP2001043032A publication Critical patent/JP2001043032A/ja
Application granted granted Critical
Publication of JP3440219B2 publication Critical patent/JP3440219B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/4881Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/061Improving I/O performance
    • G06F3/0611Improving I/O performance in relation to response time
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/061Improving I/O performance
    • G06F3/0613Improving I/O performance in relation to throughput
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0655Vertical data movement, i.e. input-output transfer; data movement between one or more hosts and one or more storage devices
    • G06F3/0659Command handling arrangements, e.g. command buffers, queues, command scheduling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0683Plurality of storage devices
    • G06F3/0689Disk arrays, e.g. RAID, JBOD

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、複数の入出力に基
づいてディスク装置の使用をスケジューリングする入出
力装置及びディスク・タイムシェアリング方法に関し、
特に、競合する入出力に対し割得て時間を順番に切替え
るようにディスク装置の使用をスケジューリングする
出力装置及びディスク・タイムシェアリング方法に関す
る。
【0002】
【従来の技術】従来、ハードディスクドライブ等のディ
スク装置を使用してデータを管理するストレージシステ
ムにあっては、例えばディスク装置をRAID構成の装
置とし、このRAID装置をディスク制御装置の配下に
接続して上位のホストからの入出力を処理したり、直
接、サーバにRAID装置を接続し、サーバOSからの
入出力を処理するようにしている。
【0003】このようなストレージシステムにあって
は、同一のディスク装置に対して、応答時間の保証が要
求されるランダムアクセスと、単位時間当たりの処理量
が重視されるシーケンシャルアクセスを行う必要がある
場合、ランダムアクセスとシーケンシャルアクセスが競
合しないように、時間帯を分けた運用を行っている。例
えば、昼間は、ディスク装置のデータベースに対してラ
ンダムアクセス中心のOLTP業務(On Line Transact
ion Processing)を行い、業務終了後の夜間にデータベ
ースのバックアップを行っている。
【0004】
【発明が解決しようとする課題】1.ランダムアクセス
とシーケンシャルアクセスの資源配分 しかしながら、このようなストレージシステムにあって
は、業務の無停止化に伴い、夜間といえどもランダムア
クセス系のOLTP業務を継続する必要が出てきたた
め、ランダムアクセス系のOLTP業務中にシーケンシ
ャルアクセスであるバックアップの実行が必要となって
きている。
【0005】ランダムアクセスのみの場合は、ある平均
応答時間、例えば30msを満たせる単位時間当りの入出
力回数であるIOPS(Input Output Per Second )、
例えば100IOPSを見積もることができる。シーケンシ
ャルアクセスのみの場合は、例えば20MB/sといっ
たスループットを見積もることができる。
【0006】ところが、ランダムアクセスとシーケンシ
ャルアクセスを同時に行った場合は、受け付けた入出力
を要求をFIFOを用いたキューで処理するため、ラン
ダムアクセスがディスク装置を使用できる時間およびシ
ーケンシャルアクセスがディスク装置を使用できる時間
を保証する仕組みがない。
【0007】例えば、平均応答時間30msで50IOPS
のランダムアクセスと、5MB/sのシーケンシャルア
クセスが欲しい場合でも、シーケンシャルアクセスが頻
繁に発生するとシーケンシャルアクセスのスループット
は、上がる必要はないのであるが、5MB/sから10
MB/sに上がる。逆にランダムアクセスで平均応答時
間30msを満たすIOPSは、低下させたくはないにもか
かわらず、50IOPSから25IOPSに低下する。 2.論理ボリューム間の資源配分 また従来のストレージシステムは、性能要件の異なるデ
ータは異なるディスク装置に配置することで、それぞれ
の性能特性を引き出している。例えば、小量データのラ
ンダムアクセスで応答時間の保証が要求されるデータ
と、大量データのシーケンシャルアクセスで単位時間当
たりの処理量が重視されるデータは、異なるディスク装
置に配置している。
【0008】ところが、ディスク装置の大容量化に伴
い、異なる性能要件のデータを同一ディスク装置に配置
するケースが増えてきている。このように異なる性能要
件の論理ボリュームを同一ディスクに配置した場合も同
様の問題が生じる。従来は、受け付けた入出力をFIF
Oでスケジュールして論理ボリューム間のディスク資源
分配を制御する仕組みがない。このため、ある論理ボリ
ュームへの入出力が頻繁に発生すると、他の論理ボリュ
ームへの入出力性能が低下する。
【0009】例えば、10IOPSを保証して欲しいボリュ
ームAと、50IOPSを保証して欲しいボリュームBを同
一ディスクに配置した場合、ボリュームAへのアクセス
が頻繁に発生するとボリュームAのIOPSは、上がる必要
はないにもかかわらず、10IOPSから20IOPSに上が
る。逆にボリュームBのIOPSは、低下させたくはないに
もかかわらず、50IOPSから40IOPSへと低下する。 3.通常処理とバックアップ/コピー処理間の資源配分 従来のストレージシステムで、同一ディスク装置上に複
数の論理ボリュームが存在し、個々の論理ボリューム単
位でバックアップやコピーを行う場合を考える。従来
は、バックアップ/コピー処理による通常の入出力への
影響を抑えるため、バックアップ/コピー処理のペース
(インターバル)を、バックアップ/コピー処理の実行
時に設定する手法を採っている。
【0010】ところが、ボリュームAをコピー中に、ボ
リュームAと同じディスク装置上のボリュームBに対し
てコピーを実行すると、同時に2多重のコピー処理が同
一のディスク装置上で動作するため、通常の入出力への
影響は2倍になる。 4.通常処理とリビルディング間の資源配分 RAID装置では、複数のディスクドライブでデータを
冗長化させることにより、1つのディスクドライブに障
害が発生しても残りのディスクドライブからデータを復
旧することができる。このため、RAID装置では、デ
ィスクドライブに障害が発生しても、通常の入出力を継
続することができる。
【0011】また、交換されたディスクドライブに対し
て、残りのディスクドライブからデータの復旧が行われ
る。この復旧処理のことをリビルディング(Rebuilding)
と呼ぶ。リビルディングは、RAID装置を構成するデ
ィスクドライブに対する入出力処理を伴うため、同一の
ディスクドライブを通常の入出力と奪い合うことにな
る。
【0012】このため、リビルディングにより通常の入
出力の性能は低下する。例えば、ミラー構成をとるRA
ID1の場合、リビルディングは、ディスクドライブの
障害により1台になったディスクドライブから交換され
た新しいディスクドライブへデータをコピーする処理で
あり、コピー元のディスクドライブに対しリード入出力
が発生する。このリード入出力が通常の入出力を待たせ
ることになり、通常の入出力の性能が低下する。
【0013】この問題を解消するための従来のアプロー
チは2つある。第1のアプローチは、通常の入出力に影
響を与えないように、十分長いインターバルで、十分小
さいデータをコピーする。この場合、通常の入出力への
影響は小さくすることができるが、リビルディング完了
までの時間が長くなる。例えば9GBのディスクドライ
で構成するRAID1の場合、10時間前後が必要と
なる。
【0014】第2のアプローチは、ディスクドライブが
空いていれば、即ち、通常の入出力でディスクドライブ
を使用していなければ、リビルディングの入出力をスケ
ジュールする。この場合の問題は、リビルディング完了
までの時間が保証できない点にある。これはディスクド
ライブがほとんど空いていないと、リビルディングに長
時間必要になってしまう。 5.最大応答時間保証 ミッションクリティカルな業務では、入出力性能の要件
として平均応答時間の他に最大応答時間が重要となる。
近年のディスク装置は、実行待ち入出力を処理時間が最
短になるように並び替えるリ・オーダリング機能(Re-o
rdering 機能)を持っている。
【0015】リ・オーダリング機能は、ディスク装置
が、実行待ち入出力の中からシーク時間と回転待ち時間
の和で定義されるポジショニング時間を最小にする入出
力を、次に実行する入出力として選ぶ機能である。ディ
スク装置に入出力を依頼する際に、リ・オーダリングの
対象として良い旨のタスク指定となるシンプルタスク
(Simple task)をディスク装置に通知する。
【0016】ディスク装置はシンプルタスク指定の入出
力の場合は、ポジショニング時間を最小にするような順
番で入出力をスケジュールする。これにより、ランダム
アクセス時の平均処理時間が短縮される。例えば、ラン
ダムアクセスの平均処理時間は、リ・オーダリング機能
を使用することにより、9msから5msに短縮する。
【0017】リ・オーダリング機能は、このようにディ
スク装置のスループットを向上させるが、最大応答時間
が大きくなる問題がある。これは、次の入出力にポジシ
ョニング時間が最小となる入出力を選択するため、ある
入出力が長い間待ちのままでスケジュールされない現象
が発生するためである。
【0018】この現像を解決するため、ディスク装置
は、リ・オーダリングの対象として良いことを指定する
シンプルタスクの他に、オーダードタクス(Ordered ta
sk)を指定する機能を備えている。オーダードタクスの
指定で入出力を依頼すると、ディスク装置は、それまで
に受け付けていた未だ完了していない入出力を全て完了
させた後、オーダードタスクの入出力をスケジューリン
グする。
【0019】このようにシンプルタクスの間にオーダー
ドタスクを混ぜることにより、入出力の最大応答時間の
延長を抑えることが可能となる。しかし、ランダムアク
スセとシーケンシャルアクセス間、論理ボリューム間、
通常処理とバックアップ/コピー処理やリビルディング
処理間の資源配分を考えた場合、スループット(IOPS)
を向上させるためのシンプルタクスの利用に加え、シン
プルタクスクを使った場合の最大応答時間の保証が課題
となる。
【0020】本発明の目的は、ディクス装置に種類の異
なる複数の入出力が競合した場合の性能の最低保証を可
能とするディスク・タイムシェアリング装置及び方法を
提供することを目的とする。
【0021】
【課題を解決するための手段】図1は本発明の原理説明
図である。本発明の入出力装置は、図1(A)のよう
に、1又は複数のディスクドライブ24を備えたディス
ク装置16、ディスク装置16に入出力要求を発行する
入出力要求部18、及びディスク装置16への入出力元
入出力要求の性質に基づいてグループ化した入出力グ
ループを形成すると共に各入出力グループがディスク装
置16を使用する時間の比率を定義し、定義された時間
比率に基づき各入出力グループが連続してディスク装置
16を使用できるクォンタムτ1,τ2,τ3(割当時
間)を決定し、複数の入出力グループからディスク装置
16に入出力の依頼を受け付けている場合、図1(B)
のように、競合した入出力グループ間でクォンタムτ
1,τ2,τ3を順番に切り替えてディスク装置16を
使用するタイムシェアリングを行う入出力スケジュール
機構20を備える。
【0022】また入出力スケジュール機構20は、1つ
の入出力グループからのみ入出力の依頼のある場合は、
図1(C)のクォンタムτ1の時刻t0〜t2のよう
に、1つの入出力グループからの入出力に対しディスク
装置16を連続して使用可能とする。このように本発明
のディスク・タイムシェアリング装置によれば、予め定
義した入出力グループ毎に、入出力性能の最低値保証を
可能とすると共に、特定の入出力グループからの要求
が、ある時間帯に集中した場合は、その特定の入出力グ
ループに対して最大性能を保証できる。
【0023】具体的には、入出力スケジュール機構20
は、シーケンシャルアクセスと判断された入出力はシー
ケンシャルアクセス入出力グループに、それ以外の入出
力はランダムアクセス入出力グループに対応させ、シー
ケンシャルアクセスとランダムアクセスでディスク装置
16のタイムシェアリングを行う。
【0024】このため、ランダムアクセス要求がどれだ
け多く発生しようとも、シーケンシャルアクセスの入出
力でディスク装置を使用できる時間が保証されているか
ら、シーケンシャルアクセス性能の最低値保証が可能と
なる。また、ランダムアクセスの入出力でディスク装置
を使用できる時間が保証されているから、ランダムアク
セス性能の最低保証が可能となる。
【0025】また、シーケンシャルアクセス要求のみの
場合は、シーケンシャルアクセスの入出力のみでディス
ク装置を連続して使用できるから、シーケンシャルアク
セスの最大性能を保証できる。更に、ランダムアクセス
要求のみの場合は、ランダムアクセスの入出力要求のみ
でディスク装置を連続して使用できるから、ランダムア
クセスの最大性能を保証できる。
【0026】入出力スケジュール機構20は、性能要件
が同一となる複数の論理ボリュームを1つの入出力グル
ープに対応させ、性能要件が異なる論理ボリューム群間
でディスク装置16のタイムシェアリングを行う。この
ため、ある論理ボリュームへのアクセスの入出力でディ
スク装置を使用できる時間が保証されているから、他の
論理ボリュームに対する入出力要求がどれだけ多く発生
しようとも、当該論理ボリューム毎の入出力性能の最低
値保証が可能となる。
【0027】また、ある論理ボリュームへの入出力要求
のみの場合は、そのボリュームの入出力要求のみでディ
スク装置を連続して使用できるから、当該ボリュームへ
の入出力の最大性能を保証できる。
【0028】ディスク・タイムシェアリング装置の入出
力スケジュール機構20は、コピー及びバックアップ処
理の入出力を1つの入出力グループに対応させ、コピー
及びバックアップ処理とその他の処理の間でディスク装
置16のタイムシェアリングを行う。これによりコピー
/バックアップ処理が同一ディスク装置上で、何多重で
動作しようとも、通常処理の入出力で使用できるディス
ク使用時間が保証されているから通常処理(コピー/バ
ックアップ以外の処理)の入出力性能の最低値保証が可
能となる。
【0029】また、コピー/バックアップ処理で使用で
きるディスク装置の使用時間が保証されているから、コ
ピー/バックアップ処理全体のアクセス性能の最低保証
が可能となる。
【0030】またコピー/バックアップ処理の入出力の
みの場合は、コピー/バックアップ処理の入出力のみで
ディスク装置を連続して使用できるから、コピー/バッ
クアップ入出力の最大性能を保証できる。
【0031】ここでディスク装置16は、複数のディス
クドライブ24を備え、1つのディスクドライブ24が
故障しても他のディスクドライブ24からデータを復元
して再構築可能なRAID構成とした場合、入出力スケ
ジュール機構20は、RAID構成をとるディスク装置
16の再構築処理(リ・ビルディング処理)の入出力を
1つの入出力グループに対応させ、再構築処理とその他
の処理の間で前記ディスク装置16のタイムシェアリン
グを行う。
【0032】このため通常処理の入出力でディスクドラ
イブを使用できる時間が保証されているから、再構築動
作中の通常処理の入出力の性能を保証できる。また再構
築の入出力でディスクドライブを使用できる時間が保証
されているから、再構築完了までに要する時間を保証で
きる。
【0033】更に、リビルディング動作を一定のインタ
ーバルで行う従来の装置に比較し、本発明のディスク・
タイムシェアリングでは、通常の入出力が実行されてい
ない場合に、リビルディング処理を実行できるから、通
常処理の入出力性能を保証した上で、リビルディング完
了までに要する時間を短縮できる。
【0034】またディスク装置16が、シンプルタスク
(第1タスク)の指定でポジショニング時間を最小とす
るように複数の入出力をスケジューリングし、オーダー
ドタスク(第2タスク)の指定で受付け中の入出力を完
了させた後に第2タクス指定の入出力をスケジューリン
グするオーダード・タスク機能を備えた場合、入出力ス
ケジュール機構20は、ディスク装置16のタイムシェ
アリングを行う際に、シンプルタスクの指定とオーダー
ドタスクの指定を分けてスケジューリングする。
【0035】即ち、入出力スケジュール機構20は、複
数の入出力グループ間でディスク装置16を順番に使用
するタイムシェアリングを行う際に、入出力グループを
切替えた直後の最初の入出力はオーダードタスクを指定
して切替前のグループの入出力を完了させた後に切替後
のグループの入出力をスケジューリングし、次にグルー
プを切替えるまでの入出力はシンプルタスクで指定して
ポジショニング時間を最小とするように複数の入出力を
スケジューリングする。このため、1つのクォンタム内
で、ある入出力グループの入出力に対しディスク装置1
6を連続して使用することができる。
【0036】入出力スケジュール機構20は、クォンタ
ム切替時に未処理入出力の処理時間を予測して次のクォ
ンタム開始時刻T0 を算出(予測)し、入出力要求の受
付け又は入出力要求の完了応答毎に、その時の未処理入
出力の処理時間とクォンタム開始時刻T0 に基づいて残
り時間Tr を予測し、残り時間があると判断した場合
(Tr >0)は、現クォンタムの入出力要求をディスク
装置に投入し、残り時間がないと判断した場合(Tr ≦
0)は次のクォンタムに切替える。
【0037】リ・オーダリングの恩恵を受けるためには
ディスク入出力スケジュール機構20において、できる
だけ多くの入出力をディスク装置16に依頼する環境を
作る必要がある。このためにシンプルタスクを使う場
合、ディスク装置に対して複数の入出力要求を依頼する
ことになる。本発明のディスクタイムシェリングは、デ
ィスク装置での入出力処理時間の時分割制御を目的とし
ているので、ディスク装置へ入出力要求を依頼する際に
は、依頼された複数の要求をディスク装置で処理するの
に必要な時間を予測し、次のクォンタムに切替えた後に
切替え後のクォンタム種別の入出力をディスク装置に投
入するか否か判断する必要がある。
【0038】このため、クォンタム切替え時に現在ディ
スクドライブに依頼している要求が次のクォンタム内で
完了して新たな入出力要求が投入できるか否かを判断す
るため残り時間Tr を次式で算出する。 残り時間Tr =クォンタム開始時刻T0 +クォンタム割
当時間τ−未処理I/O処理時間−現在時刻 クォンタム開始時刻T0 =クォンタム切替時刻+未処理
I/O処理時間 未処理I/O処理時間=未処理I/O数×I/O平均処
理時間 入出力スケジュール機構20は、1つの入出力グループ
からの入出力に対しディスク装置を連続して使用する場
合、割当て時間をリセットした直後の最初の入出力はオ
ーダードタスクを指定してリセット前の入出力を完了さ
せた後にリセット後の入出力をスケジューリングし、次
にリセットするまでの入出力はシンプルタスクで指定し
てポジショニング時間を最小とするように複数の入出力
をスケジューリングする。
【0039】このように1つの入出力グループのクォン
タムが連続する場合にも、クォンタム開始時刻を現在時
刻に設定し直すためにクォンタムをリセットした後のデ
ィスク装置16に対する最初の入出力をオーダードタス
クで依頼することにより、ディスク装置16リオーダ
リングすることにより生じる弊害である応答時間の延長
を防止できる。
【0040】本発明は、1又は複数のディスクドライブ
24を備えたディスク装置16と、ディスク装置16に
入出力要求を発行する入出力要求部18と、入出力要求
基づいてディスク装置16の使用をスケジューリング
する入出力スケジュール機構20とを備えたディスク・
タイムシェアリング方法を提供する。
【0041】このディスク・タイムシアリング方法は、
ディスク装置への入出力元をグループ化した入出力グル
ープを形成すると共に各入出力グループがディスク装置
使用する時間の比率を定義し;定義された時間比率に
基づき各入出力グループが連続してディスク装置16を
使用できるクォンタムτi(割当時間)を決定し;複数
の入出力グループからディスク装置16に入出力の依頼
を受け付けている場合、競合した入出力グループ間でク
ォンタムτiを順番に切り替えてディスク装置16を使
用するタイムシェアリングを行う;ことを特徴とする。
【0042】このディスク・タイムシェアリング方法の
詳細も、装置構成と基本的に同じになる。
【0043】
【発明の実施の形態】図2は、本発明が適用されるスト
レージシステムのブロック図である。図2において、ス
トレージシステムは、デバイス制御装置12、アレイデ
ィスク装置14、及びディスク装置16で構成される。
デバイス制御装置12に対しては、ホスト10−1〜1
0−nが接続されており、ホスト10−1〜10−nの
アプリケーションにより入出力要求をデバイス制御装置
12に対し行っている。
【0044】アレイディスク装置14は、デバイス制御
装置12からの入出力要求を受けつけ、ディスク装置1
6に対し受けつけた入出力要求を発行する。本発明のデ
ィスク・タイムシェアリング装置は、アレイディスク装
置14に設けた入出力要求部18及びディスク入出力ス
ケジュール機構20と、ディスク装置16に設けたディ
スク入出力処理部22及びディスクドライブ24−1〜
24−nで構成される。
【0045】またディスク装置16に設けている複数の
ディスクドライブ24−1〜24−nがRAID構成を
とる場合には、アレイディスク装置14にはRAID制
御機構がさらに設けられることになる。
【0046】図3は、図2のストレージシステムに適用
された本発明のタイムシェアリング装置の基本的な実施
形態のブロック図であり、RAID構成のディスク装置
を例にとっている。
【0047】図3において、アレイディスク装置14
は、入出力要求部18、RAID制御部26、ディスク
入出力スケジュール機構20を備える。またディスク装
置16にはディスク入出力処理部22が設けられ、この
ディスク入出力処理22に対し、例えばRAID1の構
成(ミラーディスク構成)をとる2台のディスクドライ
ブ24−1,24−2が接続されている。
【0048】このような本発明のディスク・タイムシェ
アリング装置は、入出力要求部18からのディスク装置
16への入出力要求をグループ化して入出力グループを
形成すると共に、各入出力グループがディスク装置16
を使用する時間の比率を定義し、定義された時間比率に
基づき各入出力グループが連続してディスク装置を使用
できるクォンタム(割当時間)を決定し、複数の入出力
グループから依頼を受けつけている場合に競合した入出
力グループ間でクォンタムを順番に切り替えてディスク
装置16を使用するようにスケジューリングする処理を
行う。
【0049】またひとつの入出力グループからのみ入出
力の依頼のある場合は、ひとつの入出力グループからの
入出力に対しディスク装置16を連続して使用可能とす
るスケジューリングを行う。
【0050】このような本発明のディスク・タイムシェ
アリング処理を実現する図3の各部の構成及び機能を更
に詳細に説明すると次のようになる。入出力要求部18
は、例えば図2に示した上位のデバイス制御装置12か
らのコマンドに基づきディスク装置16に対する入出力
要求をRAID制御部26を介してディスク入出力スケ
ジュール機構20に発行する。RAID制御部は、依頼
された論理入出力要求を物理入出力要求に変換する処理
を主に行う。
【0051】ディスク入出力スケジュール機構20に
は、ディスク・タイムシェアリング制御情報30−1,
30−2、入出力スケジュール部32、入出力要求受付
部34、及び入出力完了処理部36が設けられる。ディ
スク・タイムシェアリング制御情報30−1,30−2
は、ディスク装置16に設けているディスクドライブ2
4−1,24−2単位に設けられる。
【0052】入出力スケジュール部32は、ディスクド
ライブ24−1,24−2単位に設けられたディスク・
タイムシェアリング制御情報30−1,30−2を参照
及び更新してディスク・タイムシェアリングを行う。
【0053】ここでディスク・タイムシェアリング制御
情報30−1について説明すると、この実施形態にあっ
ては入出力グループをG1,G2,G3の3つに分けて
定義した場合を例にとっており、入出力グループG1〜
G3に対応してスケジュール待ちグループキュー38−
38−が設けられる。このスケジュール待ちグル
ープキュー38−1〜38−3には、入出力要求受付部
34で受けつけた入出力要求がキューを構成するFIF
Oに格納することで並ぶ。
【0054】また入出力グループG1〜G3に対応して
完了待ちグループキュー40−1,40−2,40−3
が設けられる。完了待ちグループキュー40−140
−3には、ディスク装置16への入出力依頼が完了し、
ディスク装置16から入出力完了応答を受けていない入
出力要求がキューを構成するFIFOに格納することで
並んでいる。
【0055】更に入出力グループG1〜G3に対応して
グループ用クォンタム42−1,42−2,42−3が
設けられる。このグループ用クォンタム42−1〜42
−3には、入出力グループG1〜G3がディスク装置1
6を使用する時間の比率α1,α2,α3を予め定義
し、この定義された比率α1,α2,α3に基づき、そ
れぞれの入出力グループG1〜G3が連続してディスク
装置を使用できる割当時間となるクォンタムτ1,τ
2,τ3を決定して格納している。
【0056】例えば1回のタイムシェアリングを行なう
タイムシェアリング周期をTcとすると、入出力グルー
プG1〜G3のクォンタムτ1〜τ3は次式で定義され
る。
【0057】τ1=α1・Tc τ2=α2・Tc τ3=α3・Tc このような入出力グループG1〜G3のディスク装置1
6の使用を決めるクォンタムτ1〜τ3の適正値は次の
ようにして決める。まずクォンタムは値を小さくしすぎ
るとディスク装置16の入出力処理時間に近くなり、ポ
ジショニング時間を最小とするように入出力を選択する
リ・オーダリングの効果が小さくなり、全体の入出力性
能が低下する。
【0058】逆にクォンタムの値が大きすぎると、他の
入出力グループに切り替えるクォンタムの待ち時間が延
びることにより、平均入出力処理時間及び最大入出力処
理時間が延びることになる。例えばクォンタムτ1とク
ォンタムτ2をそれぞれ1時間に設定すると、クォンタ
ムτ1の処理中はクォンタムτ2の入出力を実行できな
いため、クォンタムτ2の入出力はクォンタムτ1の終
了を1時間待つことになる。
【0059】本願発明者の実験によれば、入出力の平均
処理時間が数ms〜20msのディスク装置16の場
合、クォンタムの値としては数十ms〜数百msが望ま
しい。
【0060】ここでディスク入出力スケジュール機構2
0でグループ化する入出力としては、例えば次のグルー
プ化がある。
【0061】(1)シーケンシャルアクセスとランダム
アクセスによるグループ化(2) 論理ボリュームによるグループ化(3) コピー/バックアップ処理と通常処理のグループ
(4) RAIDのリ・ビルディング処理と通常処理のグ
ループ化 これら4種類の入出力のグループ化に基づく本発明のデ
ィスク・タイムシェアリング処理は、後の説明でそれぞ
れについて詳細に説明する。
【0062】更にディスク・タイムシェアリング制御情
報30−1には、現クォンタム種別44、現クォンタム
開始時刻46、更に次入出力タスク種別48が設けられ
る。この現クォンタム種別44は、ディスク装置16の
ディスクドライブ24−1,24−2毎に設けられ、現
在、ディスクドライブ24−1,24−2を使用してい
る入出力グループの識別子が設定される。
【0063】現クォンタム開始時刻46は、ディスク装
置16のディスクドライブ24−1,24−2毎に設け
られ、現在クォンタム種別44に設定されている現在の
クォンタムが開始した時刻T0 が設定される。更に次入
出力タスク種別48は、ディスク装置16のディスクド
ライブ24−1,24−2毎に設けられ、次のディスク
ドライブに対する入出力依頼をシンプル・タスクとする
かオーダード・タスクとするかが設定される。この次入
出力タスク種別48に設定されるシンプル・タスク又は
オーダード・タスクは、ディスク装置16におけるリ・
オーダリング機能の効果を十分に生かすために行う。
【0064】ここでディスク装置16のリ・オーダリン
グ機能は、ディスクドライブ24−1又は24−2のそ
れぞれについて、実行待ちの入出力の中からシーク時間
と回転時間の和で与えられるポジショニング時間を最小
とする入出力を次に実行する入出力として選ぶ機能であ
る。
【0065】このようなリ・オーダリング機能を備えた
ディスク装置に入出力を依頼する場合、ンプル・タス
クを指定するとリ・オーダリングの対象としてよいこと
をディスクドライブに通知することになる。このンプ
ル・タスクを指定した入出力を受けつけたディスクドラ
イブは、ポジショニング時間を最小とするような順番で
入出力をスケジュールする。
【0066】しかしながらリ・オーダリング機能は常に
ポジショニング時間が最小となる入出力を選択するた
め、ある入出力が長い間待ちのままスケジュールされな
い現象が発生する。この現象を解消するためディスクド
ライブはシンプル・タスクの他にオーダード・タスクの
機能を備えている。オーダード・タスクを指定して入出
力を依頼すると、ディスクドライブはそれまで受け継い
でいた未だ完了していない入出力を全て完了させた後
に、オーダード・タスクの入出力をスケジュールする。
このためシンプル・タスクの間にオーダード・タスクを
混ぜることで、入出力の最大応答時間の延長を押さえる
ことが可能となる。
【0067】本発明のディスク・タイムシェアリング処
理にあっては、クォンタムを切り替えた後の最初の入出
力は、オーダード・タスクを指定してディスク装置16
に依頼し、クォンタム切り替え前の未だ完了していない
入出力を完了させた後に次のクォンタムの入出力を実行
する。このためクォンタムに切り替えた後の2つ目以降
の入出力についてはシンプル・タスクを指定する。
【0068】またひとつの入出力グループからの入出力
しかない場合には、その入出力グループのスケジュール
を連続するためにクォンタムをリセットしながら繰り返
すことになる。この場合にあってはクォンタムをリセッ
トした直後の最初の入出力はオーダード・タスクで依頼
し、前のクォンタムで完了してない入出力を総て完了し
た後にリセット後のクォンタムの入出力をスケジュール
する。
【0069】これによって複数の入出力グループの入出
力が競合する場合、及びひとつの入出力グループのみの
入出力のみを連続させる場合の最大応答時間の延長を防
止することができる。
【0070】図4は、図3のディスク入出力スケジュー
ル機構20に設けている入出力スケジュール部32によ
るディスク・タイムシェアリングのスケジュールの一例
である。
【0071】図4において、入出力グループG1〜G3
について、ディスク・タイムシェアリング制御情報30
−1のスケジュール待ちグループキュー38−1〜38
−3に入出力要求が格納されている競合状態にあって
は、入出力グループG1〜G3毎に決定されたクォンタ
ム持ち時間τ1,τ2,τ3に従って、グループG1〜
G3の順に各入出力をスケジューリングしてディスク装
置16に入出力を依頼する。
【0072】例えば時刻t0からのクォンタム持ち時間
τ1の間は、入出力グループG1の2つの入出力がスケ
ジュールされる。クォンタム切替えは、入出力完了時点
の時刻が現クォンタム切替え時刻を越えた時点で、次の
入出力グループのクォンタムに切替える。この切替えは
次式で判断する。 (現在クォンタムの入出力開始時刻)< (現クォンタム開始時刻+クォンタム) (1) 即ち、(1)式を満たせば、現クォンタム種別に対応す
る入出力グループG1の入出力をディスク装置に依頼
し、満たさない場合は、次の入出力グループG2のクォ
ンタムに切替える。
【0073】次の入出力グループG2のクォンタム持ち
時間τ2の間には、例えば6つの入出力がスケジュール
されている。更に時刻t2でクォンタム持ち時間τ2が
経過すると、入出力グループG3のクォンタム持ち時間
τ3への切り替えが行われ、例えば入出力グループG3
の3つの入出力がスケジュールされる。以下同様にクォ
ンタム持ち時間τ1,τ2,τ3を切り替えて、それぞ
れの入出力グループの入出力をスケジュールする。
【0074】図5は、特定の入出力グループの入出力の
みが連続した場合のタイムシェアリング処理の一例であ
る。図5において、時刻t0で入出力グループG1のみ
の入出力が図3のスケジュール待ちグループキュー38
−1に並んでおり、残りの入出力グループG2,G3の
スケジュール待ちキュー38−2,38−3は空であっ
たとする。
【0075】この場合には時刻t0からの入出力グルー
プG1のクォンタム持ち時間τ1で入出力グループG1
の2つの入出力をスケジュールした後、時刻t1でクォ
ンタム持ち時間τ1をリセットすることで次の同じ入出
力グループG1のクォンタム持ち時間τ1をリ・スター
トさせ、例えば3つの入出力をスケジュールする。
【0076】このようにひとつの入出力グループの入出
力のみ待ち状態にある時は、そのクォンタムをリセット
することで連続してひとつの入出力グループの入出力を
スケジュールする。
【0077】更に図5にあっては、時刻t2で3つの入
出力グループG1〜G3の入出力が競合状態となること
で、次のクォンタム持ち時間τ2への切り替えが行われ
る。しかしながら、クォンタム持ち時間τ2において入
出力グループG2の入出力が3つしかなく、クォンタム
持ち時間τ2の途中の時刻t3で3つの入出力要求が途
絶えている。
【0078】この場合には、例えば入出力グループG3
に待ち状態の入出力要求があることから、時刻t3でク
ォンタム持ち時間τ3に切り替え、入出力グループG3
の例えば3つの入出力をスケジュールする。
【0079】この図4及び図5に示したディスク・タイ
ムシェアリングのスケジュールにおいて、ディスクドラ
イブに対する入出力の依頼は、クォンタムを切り替えた
直後の入出力はオーダード・タスクで依頼し、2回目以
降の次のクォンタム切替えまでの入出力はシンプル・タ
スクで依頼する。
【0080】このようにディスクドライブ24−1,2
4−2のリ・オーダリング機能を生かすためには、クォ
ンタムを切り替えた際に現在ディスクトドライブ24−
1,24−2に依頼している入出力要求が全て完了する
までの時間を予測し、この予測時間が切り替え後のクォ
ンタム以内であれば、切り替え後にクォンタムの入出力
を依頼し、予測時間が切り替え後のクォンタムを越えて
いた場合には、切り替え後の入出力を依頼せずに次のク
ォンタムへの切り替えを待つようにする。
【0081】これはディスク装置16のリ・オーダリン
グの恩恵を受けるためにはディスク入出力スケジュール
機構20において、できるだけ多くの入出力をディスク
装置16に依頼する環境を作るためである。
【0082】シンプルタスクを使う場合、ディスク装置
に対して複数の入出力要求を依頼することになる。本発
明のディスクタイムシェリングは、ディスク装置での入
出力処理時間の時分割制御を目的としているので、ディ
スク装置へ入出力要求を依頼する際には、依頼された複
数の要求をディスク装置で処理するのに必要な時間を予
測し、次のクォンタムに切替えた後に切替え後のクォン
タム種別の入出力をディスク装置に投入するか否か判断
する必要がある。
【0083】このため、クォンタム切替え時に現在ディ
スクドライブに依頼している要求が次のクォンタム内で
完了して新たな入出力要求が投入できるか否かを判断す
るため残り時間Tr を次式で算出する。 Tr =T0 +τ−Tw −Tnow (2) 但し、T0 はクォンタム開始時刻(予測値) τはクォンタム割当時間 Tw は未処理I/O処理時間(予測値) Tnow は現在時刻 T0 =Ts +Tw (3) 但し、Ts は切替え前のクォンタム開始時刻 Tw =N×Ta (4) 但し、Nは未処理のI/O数 Ta はアクセス種別毎によるI/Oの平均処理時間 ここで未処理I/0とは、ディスク装置に入出力要求を
投入して完了応答が返っていなものをいう。この未処理
I/Oには、本発明の実施形態の場合、前未処理I/
O、前々未処理I/Oおよび全未処理I/Oがあり、そ
れぞれ直前のクォンタムの未処理I/O、2つ前のクォ
ンタムの未処理I/O、および全てのクォンタムを通じ
た未処理I/Oを意味する。
【0084】またクォンタム開始時刻T0 も予測値であ
り、前クォンタムの残り時間予測により、現クォンタム
への切替えを判断した際に予測する。この時、ディスク
装置上で前クォンタムの未処理I/Oの処理が全て完了
するのに必要な時間Twを(4)式で予測し、ディスク
装置上での前クォンタムの終了時刻、即ち、現クォンタ
ムの開始時刻T0 を(3)式で予測する。
【0085】(2)式の残り時間Trは、ディスク入出
力スケジュール機構が新たな入出力を受け付けた場合、
またはディスク装置から入出力の完了応答を受けた場合
に算出され、残り時間Tr が Tr >0 あれば、残り時間ありと判断し、現クォンタムの入出力
をディスク装置に投入する。また Tr ≦0 であれば、残り時間なしと判断し、クォンタムを切替え
る。
【0086】ここで前記(2)式の残り時間Tr の算出
に使用するディスクドライブの平均入出力処理時間Ta
の算出方法は、例えば直前のn個の入出力処理時間の平
均値とする。この場合nは例えばn=10の有限値であ
ってもよし、例えばn=∞つまりシステム始動時からの
総ての入出力についてでもよい。
【0087】更に入出力処理時間の平均値の算出につい
ては、入出力グループ毎に平均値を算出する方法と、全
ての入出力グループの平均値を算出する方法のいずれか
とすることができる。
【0088】一方、大量データをアクセスする場合、ポ
ジショニング時間がデータ転送時間に比較して短いた
め、アクセスするデータ量とディスクドライブの転送能
力から平均入出力処理時間Ta を予測する。この場合、
ポジショニング時間はリ・オーダリング機能の恩恵をど
の程度受けられるか、即ちその時のディスクドライブで
のリ・オーダリング対象の入出力の数、個々の入出力要
求のアドレスの分散具合などによって違ってくるが、大
量データアクセスの場合、処理時間に占めるポジショニ
ング時間の割合が小さいため、この場合には処理時間を (平均ポジショニング時間)+(データ転送時間) と予測する。
【0089】例えば転送速度が20MB/s、平均回転
待ち時間が3ms、平均シーク時間が5msのディスク
ドライブで1MBのデータをアクセスする場合、平均ポ
ジショニング時間が8msに対し、転送時間は52ms
なので、処理時間は両者を加えた60msとする。
【0090】図6は、クォンタム切替え時の残り時間予
測の例であり、シーケンシャル・クォンタムとランダム
・クォンタムを交互に繰り返す場合について、図6
(A)〜(J)と時間が経過する場合の例である。
【0091】図6(A)(B)は、ランダム・クォンタ
ムからシーケンシャル・クォンタムへの切替え時に、次
のクォンタム開始時刻T0 を予測する例である。ランダ
ム・クォンタムに切替っている現在時刻Tnow で、ラン
ダム・クォンタムの残り時間不足になったとする。この
とき、前クォンタムのシーケンシャルI/Oが1要求、
現クォンタムのランダムI/Oが3要求の完了応答が返
ってきておらず、ディスク装置で処理中である。
【0092】この場合、図6(B)のように、ディスク
装置に投入している処理中I/Oが全て完了するまでの
時間Tw1を(4)式で予測し、(2)式より次のシーケ
ンシャル・クォンタムの開始時刻T0 を決定する。また
クォンタムをシーケンシャル・クォンタムに切替える。
【0093】図6(C)〜(F)は、残り時間予測で、
残り時間ありと判断する例である。図6(B)でシーケ
ンシャル・クォンタムに切替わった後、ディスク入出力
スケジュール機構がシーケンシャルI/Oを現在時刻T
now で1要求受け付けたとする。この時、ディスク装置
に依頼しているI/O要求で完了応答が返ってきていな
い未処理I/Oとして、ランダムI/Oの1要求があ
る。即ち、ディスク装置は、前クォンタムのランダムI
/Oの1要求を処理中である。
【0094】この場合、図6(E)のように、ランダム
I/Oの1要求をディスク装置で完了するまでの時間T
w2を(4)式で予測し、図6(B)で求めたクォンタム
開始時刻T0 を使用して(2)式より残り時間Tr2を図
6(F)のように求める。この場合、Tr2>0であるこ
とから、シーケシンャルI/Oをディスク装置に投入す
ることができる。
【0095】図6(G)〜(J)は、残り時間予測で、
残り時間なしと判断する例である。さらに時間が進み、
図6(G)の現在時刻Tnow でディスク入出力スケジュ
ール機構がシーケンシャルI/Oを1要求受け付けたと
する。この時、ディスク装置に依頼しているI/O要求
で完了応答が返ってきていない未処理I/Oとして、の
シーケンシャルI/Oの1要求がある。即ち、ディスク
装置は、現クォンタムのシーケンシャルI/Oの1要求
を処理中である。
【0096】この場合、図6(I)のように、シーケン
シャルI/Oの1要求をディスク装置で完了するまでの
時間Tw3を(4)式で予測し、図6(B)で求めたクォ
ンタム開始時刻T0 を使用して(2)式より残り時間T
r3を図6(J)のように求める。この場合、Tr3<0で
あることから、残り時間なしと判断し、次のランダム・
クォンタムに切替える。
【0097】図8は、図3のディスク入出力スケジュー
ル機構20に設けた入出力スケジュール部32による本
発明のディスクタイム・シェアリング制御処理のフロー
チャートである。
【0098】この入出力スケジュール部32によるディ
スクタイム・シェアリング制御処理は、入出力要求受付
部34で入出力要求部18より、ある入出力要求を受付
けた際の呼出し、或いは入出力完了処理部36でディス
ク装置16に依頼した入出力に対する完了報告があった
ときからの呼出しを受けて動作する。
【0099】まず図4のスケジュールに示したように、
図3のディスク入出力スケジュール機構20において、
競合した3つの入出力グループ間でクォンタムを順番に
切替えてディスクドライブ24−1のタイムシェアリン
グを行なう場合を説明する。
【0100】ステップS1で現クォンタム種別に設定さ
れているクォンタム識別子i=1に対応するスケジュー
ル待ちグループキュー38−1を調べ、待ちの入出力の
有無を判定する。
【0101】スケジュール待ちグループキュー38−1
に待ちの入出力があれば、ステップS2に進み、前々ク
ォンタムに未完了の入出力があるか否かチェックする。
いま、クォンタム識別子i=1が最初のスケジュールで
あるとすると、前々クォンタムに未完了入出力はないこ
とから、ステップS3に進み、残り時間Tr を(2)式
から予測する。
【0102】続いてステップS4で残り時間TrがTr
>0か否かチェックし、この条件が成立する場合には残
り時間ありと判断してステップS8に進む。ステップS
4にあっては、現クォンタムのスケジュール待ちグルー
プキュー38−1の先頭の入出力をディスク装置16の
ディスク入出力処理部22を介してディスクドライブ2
4−1に依頼し、次入出力タスク種別情報48のタスク
をシンプルタクスに設定する。
【0103】続いてステップS1に戻り、現クォンタム
のスケジュール待ちグループキュー38−1に待ちの入
出力があるか否かチェックし、待ちがあればステップS
2、S3,S8の処理を繰り返す。このような入出力グ
ループG1のクォンタム持ち時間τ1における入出力の
スケジュールによりステップS3でTr ≦0となり、残
り時間無しが判断されるとステップS5に進み、他の入
出力グループG2,G3のスケジュール待ちグループキ
ュー38−2,38−3に待ちの入出力があるか否かチ
ェックする。
【0104】このとき次の入出力グループG2のスケジ
ュール待ちグループキュー38−2に入出力の待ちがあ
るとステップS10に進み、次の入出力グループG2の
クォンタム持ち時間τ2に切替え、次入出力タスク種別
情報48について、次のタスクをオーダードに設定す
る。同時に、クォンタム現在時刻T0 を(3)式から予
測し、予測したT0 を現クォンタム開始時刻に設定す
る。
【0105】これにより最初の入出力グループG1のク
ォンタム持ち時間τ1から次の入出力グループG2のク
ォンタム持ち時間τ2への切替えが行われ、再びステッ
プS1に戻り、クォンタム切替えに伴う次の入出力グル
ープG2をステップS2,S3,S4,S8により処理
する。
【0106】この時、ステップS10で次のタスクをオ
ーダードに設定しているため、クォンタム切替え後の最
初の入出力はオーダードの指定でディスクドライブ24
−1に依頼される。依頼が済んだならば次入出力タスク
種別情報48のタスクをシンプルに設定する。
【0107】次に図5に示したように1つの入出力グル
ープ、例えば入出力グループG1の入出力要求が連続し
た場合の処理を説明する。同じ入出力グループG1の入
出力要求の受付けが連続した場合には、ステップS1〜
S4の処理をクォンタムt1で繰り返して同じ入出力グ
ループの入出力要求をディスクドライブ24−1に依頼
し、この間にステップS4で残り時間無しが判別される
とステップS5に進み、他の入出力グループのスケジュ
ール待ちグループキュー38−2,38−3に待ちの入
出力があるか否かチェックする。
【0108】この時、他の入出力グループG2,G3の
スケジュール待ちクループキュー38−2,38−3に
待ちの入出力がなく空であった場合には、ステップS9
に進み、現クォンタム持ち時間τ1をリセットし次のタ
スクをオーダードに設定し、同時に、クォンタム現在時
刻To を予測して現クォンタム開始時刻に設定し、ステ
ップS1に戻る。この場合、現クォンタム種別はそのま
まとする。
【0109】このため現クォンタム持ち時間τ1をリセ
ットした後の次のクォンタムも同じクォンタム持ち時間
τ1となり、入出力グループG1の入出力要求が続いて
いる場合には、同じクォンタムτ1が継続される。
【0110】一方、図5の時刻t2以降に示すように時
刻t0〜t2の間に同一入出力グループG1の入出力
求が連続してクォンタムτ1,τ2がリセットにより継
続し、時刻t2までに残り2つの入出力グループG2,
G3の入出力要求が受付けられてスケジュール待ちグル
ープキュー38−2,38−3に格納されていると、次
の入出力グループG2のクォンタム持ち時間τ2への切
替えが行われる。
【0111】しかしながら、図5の時刻t3のようにク
ォンタム持ち時間τ2の途中で入出力グループG2のス
ケジュール待ちグループキュー38−2が空になってス
テップS1で待ちキュー無しが判別されると、ステップ
S6に進み、他のクォンタムについてスケジュール待ち
グループキュー38−1,38−3に待ちの入出力があ
るか否かチェックする。
【0112】この時、他のクォンタムに待ちの入出力が
あればステップS10に進み、全てのクォンタムに未完
了の入出力があるか否かチェックし、無ければステップ
S11に進み、次の入出力グループG3のクォンタム持
ち時間τ3に切替え、次タスクをオーダードに設定し、
更に、クォンタム開始時刻T0 を予測して設定し、ステ
ップS1に戻ることで切替え後の入出力グループG3の
最初の入出力要求をオーダードでディスクドライブ24
−1にステップS1〜S4,S8の処理を通じて依頼す
ることになる。
【0113】図は、シーケンシャルアクセスとランダ
ムアクセスについて入出力をグループ分けした場合の本
発明の実施形態のブロック図である。
【0114】図において、アレイディスク装置14及
びディスク装置16に設けられた本発明のディスクシェ
アリング装置は、図3の実施形態と同様、入出力要求部
18、RAID制御部26、ディスク入出力スケジュー
ル機構20、ディスク入出力処理部22及びディスクド
ライブ24−1,24−2で構成されている。
【0115】ここでディスク入出力スケジュール機構2
0で入出力をシーケンシャルアクセスの入出力グループ
とランダムアクセスの入出力グループにグループ分けす
るため、入出力要求部18にシーケンシャルアクセス検
出機構50を設けている。
【0116】この時、RAID制御部26に対する入出
力依頼インターフェースに、シーケンシャルアクセス検
出機構50で検出したシーケンシャルアクセスの入出力
であることを通知するインターフェースを追加してい
る。
【0117】シーケンシャルアクセス検出機構50は、
図2に示した上位のデバイス制御装置12から発行され
た入出力コマンドに含まれるアドレスとデータ長から次
の入出力コマンドのアドレスを認識しており、次の入出
力コマンドのアドレスが予測したアドレスに一致した場
合には、シーケンシャルアクセスを検出し、シーケンシ
ャルアクセスを示すフラグなどの情報をインタフェース
によりRAID制御部26を介してディスク入出力スケ
ジュール機構20の入出力要求受付部34に発行する。
【0118】このため入出力要求受付部34にあって
は、入出力要求部18から受付けた入出力要求につい
て、シーケンシャルアクセスかランダムアクセスかを認
識することができる。
【0119】ディスク入出力スケジュール機構20のデ
ィスクタイムシェアリング制御情報30−1,30−2
は、ディスク装置16のディスクドライブ24−1,2
4−2に対応して設けられている。
【0120】例えばディスクドライブ24−1に対応し
た図示のディスクタイムシェアリング制御情報30−1
を例にとると、入出力グループをシーケンシャルアクセ
スとランダムアクセスのグループに分けていることか
ら、この2つのグループに対応してグループごとにスケ
ジュール待ちグループキュー38−1,38−2及び完
了待ちグループキュー40−1,40−2が設けられ
る。
【0121】更にシーケンシャルアクセスとランダムア
クセスに対応してグループ用クォンタム42−1,42
−2にそれぞれのクォンタム待ち時間τ1,τ2が設定
される。それぞれの現クォンタム種別情報44、現クォ
ンタム開始時刻46、次入出力タスク種別情報48につ
いては、図3の実施形態と同様であり、それぞれディス
クドライブ24−1,24−2ごとに設定される。
【0122】このため図の実施形態にあっては、入出
力要求部18からディスク入出力スケジュール機構20
に入出力を要求する際に、シーケンシャルアクセス検出
機構50よりシーケンシャルアクセスと判断された入出
力は、ディスクタイムシェアリング制御情報30−1,
30−2におけるシーケンシャルアクセスグループのス
ケジュール待ちグループキュー38−1に格納され、ま
たそれ以外の入出力はランダムアクセスグループと判断
されてそのスケジュール待ちグループキュー38−2に
格納される。
【0123】このようにスケジュール待ちグループキュ
ー38−1,38−2に格納されたシーケンシャルアク
セスの入出力要求及びまたはランダムアクセスの入出力
要求は、それぞれについて決定したクォンタム持ち時間
τ1,τ2の比率に従ったスケジュールで順番に入出力
要求がディスク装置16に送られて、タイムシェアリン
グな入出力が行なわれることになる。
【0124】このように同じディスクドライブに対し、
ランダムアクセスとシーケンシャルアクセスが混在する
場合、図7に示した本発明のディスクタイムシェアリン
グ制御処理により、ランダムアクセス性能とシーケンシ
ャルアクセス性能の各々について、最低値保証が可能と
なる。
【0125】図、同じ性能要求が論理ボリュームを
1つの入出力グループに対応させた本発明の実施形態の
ブロック図である。
【0126】図において、本発明のディスクタイムシ
ェアリング装置は、図3の実施形態と同様、入出力要求
部18,RAID制御部26、ディスク入出力スケジュ
ール機構20、ディスク入出力処理部22及びディスク
ドライブ24−1,24−2で構成され、図2のように
アレイディスク装置14とディスク装置16に組み込ま
れている。
【0127】ここで2台のディスクドライブ24−1,
24−2には、例えば4つの論理ボリューム74−1〜
74−4及び76−1〜76−4が配置されており、各
論理ボリューム74−1〜74−4,76−1〜76−
4はそれぞれ固有の性能要件として、例えばスループッ
トIOPSを割当てている。
【0128】例えば論理ボリューム74−1,74−2
は25IOPSであり、論理ボリューム74−3,74−4
は50IOPSとなっている。このようなディスクドライブ
24−1の論理ボリューム74−1〜74−4は入出力
要求部18に設けた論理ボリューム管理機構70で管理
されており、本発明で性能要件が同一の論理ボリューム
を1つの入出力グループに対応させるため、論理ボリュ
ーム/グループ対応表72を設けている。
【0129】この論理ボリューム/グループ対応表72
は、例えばディスクドライブ24−1ついては、スルー
プットが50IOPSの論理ボリューム74−1,74−2
が入出力グループG1に対応づけられ、またスループッ
トが25IOPSの論理ボリューム74−3,74−4が入
出力グループG2に対応づけられている。
【0130】この時、RAID制御部26に対する入出
力依頼インターフェースに、論理ボリューム管理機構に
よる論理ボリューム/グループ対応表72の参照で認識
した論理グループの入出力であることを通知するインタ
ーフェースを追加している。
【0131】このため入出力要求部18からRAID制
御部26を介してディスク入出力スケジュール機構20
に入出力要求を行なう場合、論理ボリューム管理機構7
0による論理ボリューム/グループ対応表72の参照
で、入出力要求を行なう論理ボリュームが属するグルー
プを検索し、入出力グループを示す情報と共に、入出力
要求をディスク入出力スケジュール機構20に対し行な
う。
【0132】このため、ディスク入出力スケジュール機
構20の入出力要求受付部34は入出力要求部18より
入出力を受けると、これに付加されたグループ情報から
論理ボリューム74−1,74−2の入出力グループG
1か、論理ボリューム74−3,74−4の入出力グル
ープG2かを認識し、入出力グループG1にあってはデ
ィスクタイムシェアリング制御情報30−1のスケジュ
ール待ちグループキュー38−1に待ち行列として入出
力要求を格納し、入出力グループG2であれば、スケジ
ュール待ちグループキュー38−2に受付けた入出力要
求を格納する。
【0133】また同一性能で分けた入出力グループG
1,G2に対応して各グループのクォンタム待ち時間τ
1,τ2がグループ用クォンタム42−1,42−2に
設定されている。更にディスクドライブ24−1,24
−2ごとに現クォンタム種別情報44、現クォンタム開
始時刻46、更に次入出力タスク種別情報48が設定さ
れる。
【0134】このように入出力要求を同一性能の論理ボ
リュームごとにグループ分けした場合についても、ディ
スク入出力スケジュール機構20に設けている入出力ス
ケジュール部32によるディスクタイムシェアリング制
御は図のフローチャートに従って行なわれる。
【0135】その結果、同じディスクドライブ24−
1,24−2の各々に異なる性能要件の論理ボリューム
が混在しても、各論理ボリュームごとの入出力性能の最
低値を保証することが可能となる。
【0136】図10は、入出力要求をバックアップ処理
と通常処理の入出力グループにグループ分けしてディス
クタイムシェアリングを行なう本発明の実施形態のブロ
ック図である。
【0137】図10において、アレイディスク装置14
及びディスク装置16に適用された本発明のディスクタ
イムシェアリング装置は、図3の実施形態と同様、入出
力要求部18、RAID制御部26、ディスク入出力ス
ケジュール機構20、ディスク入出力処理部22で構成
される。
【0138】更にディスクドライブ24−1,24−2
はRAID1グループ82を構成している。ここでRA
ID1はディスクドライブ24−1のデータをミラーデ
ィスクとしてのディスクドライブ24−2にコピーした
ミラー構成をもつ。
【0139】入出力要求部18にはバックアップ処理の
ためのリードをRAID制御部26に依頼するバックア
ップ機構78が設けられる。ここでディスク装置16に
設けているRAID1グループ82に対し、通常処理と
バックアップ処理のディスク資源の配分比率を α1:α2=10:1 に定義したと仮定する。
【0140】RAID1グループ82は、2台のディス
クドライブ24−1,24−2で構成されているため、
ディスク入出力スケジュール機構20の中に各ディスク
ドライブ24−1,24−2に対応したディスクタイム
シェアリング制御情報30−1,30−2が設定され
る。
【0141】即ち、バックアップ処理の入出力グループ
に対応してスケジュール待ちグループキュー38−1と
完了待ちグループキュー40−1が設けられる。また通
常処理の入出力グループに対応してスケジュール待ちグ
ループキュー38−2と完了待ちグループキュー40−
2が設けられる。
【0142】またグループ用クォンタム42−1,42
−2には通常処理とバックアップ処理のディスク配分比
率α1:α2=10:1に基づき算出したクォンタム持
ち時間τ1,τ2が格納され、例えば通常入出力グルー
プについては、クォンタム待ち時間τ1=200msが
設定され、バックアップ入出力グループについてはクォ
ンタム待ち時間τ2=20msが設定される。
【0143】入出力要求部18からの入出力要求は、R
AID制御部26で依頼された論理入出力を物理入出力
に変換する。この時、RAID制御部26に対する入出
力依頼インターフェースにバックアップ機構78からの
入出力の場合はバックアップ入出力であることを通知す
るインターフェースを追加している。
【0144】RAID制御部26は、ディスク入出力ス
ケジュール機構20への入出力依頼時に、通常の入出力
かバックアップの入出力かを伝える。このためディスク
入出力スケジュール機構20の入出力要求受付部34
あっては、RAID制御部26からの入出力要求受付
けて、バックアップ入出力か通常の入出力かを認識で
き、通常の入出力要求の受付けであれば、通常入出力グ
ループのスケジュール待ちグループキュー38−1に格
納し、バックアップ入出力であればバックアップ入出力
グループのスケジュール待ちグループキュー38−2に
格納する。
【0145】そして入出力スケジュール部32は、図
のフローチャートに従ったディスクタイムシェアリング
処理により、通常の入出力のグループとバックアップ入
出力のグループに分けてディスクタイムシェアリングを
行なう。
【0146】ここでRAID1グループ82のディスク
ドライブ24−1,24−2が、例えば4つの論理ボリ
ュームから構成されている場合、1つの論理ボリューム
をバックアップする場合でも、同時に4つの論理ボリュ
ームをバックアップする場合でも、ディスクドライブ2
4−1,24−2における資源使用時間は変わらない。
【0147】即ち、クォンタム持ち時間をτ1=200
ms、τ2=20msとした場合、バックアップ処理に
20msを使用して200ms待つことを繰り返す。こ
のため、通常処理への影響はバックアップの多重度によ
らず保証する事ができる。
【0148】勿論、ディスクドライブ24−1の1つの
論理ボリュームをディスクドライブ24−2にバックア
ップする場合は、4つの論理ボリュームを同時にバック
アップする場合の4分の1の時間で完了することは勿論
である。
【0149】図11は、ディスク装置をRAID構成と
した場合のリビルディング処理と通常処理の入出力グル
ープに分けた場合の本発明の実施形態のブロック図であ
る。即ち、RAID構成のディスク装置における入出力
を1つの入出力グループに対応させることにより、リビ
ルディング処理とその他の処理の間でディスク装置のタ
イムシェアリングを行なう。
【0150】図11において、アレイディスク装置14
とディスク装置16に設けられた本発明のディスクタイ
ムシェアリング装置は、図2の実施形態と同様、入出力
要求部18,RAID制御部26、ディスク入出力スケ
ジュール機構20、ディスク入出力処理部22を持ち、
ディスクドライブ24−1,24−2によりミラー構成
をとるRAID1グループ82を構成している。
【0151】このRAID1グループ82を構成するデ
ィスクドライブ24−1,24−2において、いずれか
のディスクドライブ、例えばディスクドライブ24−2
が故障した場合には、故障したディスクドライブ24−
2を正常な装置に交換した後、ディスクドライブ24−
1のデータをディスクドライブ24−2にコピーするリ
ビルディング処理を行なう必要がある。
【0152】このため入出力要求部18にはリビルディ
ング機構84が設けられ、リビルディング処理の際に
は、RAID制御部26に対する入出力要求につき、リ
ビルディング処理であることを示すインターフェースを
追加している。またRAID制御部26はディスク入出
力スケジュール機構20に入出力を依頼する際に、リビ
ルディング入出力の通知を行なう。
【0153】ディスク入出力スケジュール機構20に
は、RAID1グループ82の2台のディスクドライブ
24−1,24−2に対応して、ディスクタイムシェア
リング制御情報30−1,30−2が設けられている。
例えばディスクドライブ24−1に対応したディスクタ
イムシェアリング制御情報30−1を例にとると、通常
の入出力のグループに対応してスケジュール待ちグルー
プキュー38−1と完了待ちグループキュー40−1が
設けられ、またリビルディング処理の入出力グループに
対応してスケジュール待ちグループキュー38−2と完
了待ちグループキュー40−2が設けられている。
【0154】更にグループ用クォンタム42−1,42
−2には、通常処理とリビルディング処理の際のディス
ク資源配分の比率α1,α2に基づくそれぞれのクォン
タム持ち時間τ1,τ2が設定されている。更に現クォ
ンタム種別情報44、現クォンタム開始時刻46、更に
次入出力タスク種別情報48については、通常処理の入
出力グループとリビルディング処理の入出力グループご
とに設けられる。
【0155】このように通常処理の入出力グループとリ
ビルディング処理の入出力グループに分けた場合につい
ても、入出力スケジュール部32によるディスクタイム
シェアリング制御処理は図7のフローチャートに従って
行なわれる。
【0156】このため図10の実施形態にあっては、R
AID構成のディスク装置のリビルディング処理におい
て、通常処理の入出力性能への影響を押さえ、且つリビ
ルディングを完了するまでに要する時間を保証した上
で、リビルディング完了までの時間を可能な限り短縮す
る事ができる。
【0157】図12は、本発明のディスクタイムシェア
リング装置が適用されるストレージシステムの他の環境
を示したブロック図である。
【0158】図12のストレージシステムにあっては、
サーバOS86に対するストレージシステムとして、ア
レイディスク装置14及びディスク装置16が設けられ
ている。この場合、本発明のディスクタイムシェアリン
グ装置は、サーバOS86に設けた入出力要求部18、
アレイディスク装置14に設けたディスク入出力スケジ
ュール機構20、更にディスク装置16に設けたディス
ク入出力処理部22とディスクドライブ24−1〜24
−nで構成される。
【0159】このような入出力要求部18、ディスク入
出力スケジュール機構20、ディスク入出力処理部22
及びディスクドライブ24−1〜24−nで構成される
本発明のディスクタイムシェアリング装置は、図3に示
した基本構成を持ち、具体的には図9〜図12のような
入出力グループに分けてディスク装置の資源を使用する
ディスクタイムシェアリングを行なうことになる。
【0160】図13は、本発明のディスクタイムシェア
リング装置が適用されるストレージシステムの他の例で
あり、サーバOS86にディスク装置16を接続してい
る。この場合、サーバOS86には入出力要求部18と
ディスク入出力スケジュール機構20が設けられ、ディ
スク装置16には、ディスク入出力処理部22とディス
クドライブ24−1〜24−nが設けられる。
【0161】勿論、本発明のディスクタイムシェアリン
グ装置が適用されるストレージシステムの動作環境は、
12及び図13に限定されず、適宜の上位装置、中間
的な制御装置、更に物理デバイスのハードウエア構成を
含む。
【0162】図14は本発明のディスクタイムシェアリ
ング装置について、図10の実施形態に従い、データベ
ースに対するランダムアクセスのOLTP業務と同時に
シーケンシャルアクセスであるバックアップのためのコ
ピー処理を実行した場合の計測結果である。
【0163】まずディスクタイムシェアリングを行なう
周期TcをTc=200μsに設定しており、入出力グ
ループをグループG1,G2,G3の3つに分け、それ
ぞれのディスク資源割当の比率を α1:α2:α3=90:5:5 とし、入出力グループG1にランダムアクセスの入出力
を、入出力グループG2,G3にコピー処理1、コピー
処理2を割当てている。
【0164】特性100はランダムアクセスのIOPSスル
ープットであり、このランダムアクセスは時間的な変化
を与えるため、スループットを100IOPS,160IOP
S, 40IOPS,100IOPSと変化させ、これを約10秒
ごとに繰り返している。
【0165】このようなランダムアクセス特性100に
対し、時刻t1でコピー処理1を起動し、その後の時刻
t2でコピー処理2を起動している。
【0166】これら2つのコピー処理の性能特性は、1
秒当りのコピー量[MB/秒]としてコピー特性10
2,104に示す。コピー処理1,2は、いずれも単独
で(他者との競合なしで)実行すると、各々20MB/
秒のスループットを出す。本測定では、コピー処理スル
ープットとランダムアクセス応答時間のふるまいがポイ
ントとなる。
【0167】更に特性106は本発明のディスクタイム
シェアリングを行なったときのランダムアクセスの平均
アクセス時間[ms]である。
【0168】この測定結果から明らかなように時刻t1
でコピー処理OPC1が開始されると、この時、ランダ
ムアクセス特性100のIOPSスループットは少ない事か
ら、コピー特性102のデータスループットは大きく上
昇する(14MB/秒)。続いてランダムアクセス特性
100が増加すると、これに伴ってコピー特性102の
スループットが減少する(5MB/秒)。
【0169】更に時刻t2でOPC2コピー処理が開始
され、同時に2つのコピー処理1,2の多重コピー処理
となっている。このようなランダムアクセス及び2つの
コピー処理の入出力要求が競合する状態にあっても、ラ
ンダムアクセスの平均アクセス時間特性106は、時刻
t1で最初のコピー処理OPC1が始まると、それまで
のアクセス時間より若干立ち上がるが、最大アクセス時
間は40ms以内に押さえられる。
【0170】また時刻t2で2つ目のコピー処理2が開
始されても、急激なランダムアクセスのアクセス時間の
増加は見られず、本発明によるディスクタイムシェアリ
ングによる性能保証が確認できる。
【0171】尚、上記の実施形態は入出力のグループ分
けとしてランダムアクセスとシーケンシャルアクセスの
入出力グループ、同一性能要件の論理ボリューム毎のグ
ループ分け、バックアップ処理やコピー処理によるグル
ープ分け、RAIDのリビルディング処理によるグルー
プ分けを例にとるものであったが、これら以外の入出力
性能の最低値保証が必要とする異なった入出力について
グループ分けを行なってもよいことは勿論である。
【0172】また上記の実施形態にあっては、ディスク
ドライブのオーダード機能を活用する際の入出力要求の
依頼として、シンプルタスクとオーダードタスクを使い
分ける場合を例にとるものであったが、本発明はこれに
限定されず、リオーダード機能を持たないディスクドラ
イブについても検証する事ができる。
【0173】この場合には、各実施形態のディスクタイ
ムシェアリング制御情報に設けている次入出力タスク種
別情報48を除き、また図8のタイムシェアリング制御
処理のフローチャートにあっては、ステップS8,S
9,S10におけるタスクの設定変更が不要となる。
【0174】更に本発明は、上記の実施形態に示した数
値による限定は受けず、更に本発明の目的と利点を損な
わない範囲で適宜の変形を含む。
【0175】
【発明の効果】以上説明してきたように本発明によれ
ば、同じディスク装置に対する様々な入出力要求に対
し、入出力要求の性質などに基づいてグループ分けし、
複数の入出力グループの入出力が競合した場合には、各
グループごとに予め定義したクォンタム(割当時間)を
順に切替えてディスク装置を使用させるディスクタイム
シェアリングを行なうことで、各入出力グループごとに
それぞれの入出力性能の最低値を保証することが可能と
なる。
【0176】より具体的には、同じディスク装置に対
し、ランダムアクセスとシーケンシャルアクセスが混在
する場合、ランダムアクセスとシーケンシャルアクセス
に分けた入出力グループに分けてディスクタイムシェア
リングを行なうことで、ランダムアクセスの入出力性能
とシーケンシャルアクセスの入出力性能の各々の最低値
を保証することが可能となる。
【0177】また同じディスク装置に異なる性能要件の
論理ボリュームが混在する場合、同じ性能要件で論理ボ
リュームをグループ分けしてディスクタイムシェアリン
グを行なうことで各論理ボリューム毎の入出力性能の最
低値の保証が可能となる。
【0178】また同じディスク装置に対して不特定多数
のバックアップ処理やコピー処理が動作する場合、バッ
クアップ処理やコピー処理の入出力グループとそれ以外
の通常処理の入出力グループに分けてディスクタイムシ
ェアリングを行なうことでバックアップ処理やコピー処
理の多重度によらず、バックアップ処理やコピー処理以
外の通常の入出力について入出力性能の保証が可能とな
る。
【0179】更にRAID構成のディスク装置でディス
クを故障した際に正常なディスクからデータをコピーす
るリビルディング処理において、リビルディング処理の
入出力のグループとそれ以外の通常処理の入出力のグル
ープに分けてディスクタイムシェアリングを行なうこと
で、リビルディング処理による通常の入出力処理の性能
への悪影響を押さえ、同時にリビルディング完了迄に要
する時間を保証した上で、リビルディング完了までの時
間を可能な限り短縮する事ができる。
【0180】更に入出力をグループ分けしたディスクタ
イムシェアリングにおいて、ディスク装置が受付けた入
出力要求の中からポジショニング時間が最小となる入出
力から実行するリオーダリング機能をもつ場合、入出力
グループのタイムシェアリングの切替え、即ちクォンタ
ムの切替え時、最初の入出力要求については、切替え前
の前クォンタムで完了していない入出力を全て完了させ
た後にクォンタム切替え後の最初の入出力を行なわせる
オーダードタスクで入出力を依頼し、それ以外について
は、ポジショニング時間を最小とする入出力を選択する
シンプルタスクを指定する事で、ディスク装置の持つオ
ーダリング機能を最大限に生かし、且つオーダリング機
能で必要以上に入出力が待ちとなる遅れをクォンタム切
替えで規制することで最大応答時間の延長を防止する事
ができる尚、本発明の他の特徴を列挙すると次のように
なる。 A.請求項1に関する特徴 (1)請求項1記載のディスク・タイムシェアリング装
置に於いて、入出力スケジュール機構は、シーケンシャ
ルアクセスと判断された入出力はシーケンシャルアクセ
ス入出力グループに、それ以外の入出力はランダムアク
セス入出力グループに対応させ、シーケンシャルアクセ
スとランダムアクセスでディスク装置のタイムシェアリ
ングを行うことを特徴とする。 (2)請求項1記載のディスク・タイムシェアリング装
置に於いて、入出力スケジュール機構は、性能要件が同
一となる複数の論理ボリュームを1つの入出力グループ
に対応させ、性能要件が異なる論理ボリューム群間でデ
ィスク装置のタイムシェアリングを行うことを特徴とす
る。 (3)請求項1記載のディスク・タイムシェアリング装
置に於いて、入出力スケジュール機構は、コピー及びバ
ックアップ処理の入出力を1つの入出力グループに対応
させ、コピー及びバックアップ処理とその他の処理の間
でディスク装置のタイムシェアリングを行うことを特徴
とする。 (4)請求項1記載のディスク・タイムシェアリング装
置に於いて、ディスク装置は、複数のディスクドライブ
を備え、1つのディスクドライブか故障しても他のディ
スクドライブからデータを復元して再構築可能なRAI
D構成であり、入出力スケジュール機構は、RAID構
成をとる前記ディスク装置の再構築処理の入出力を1つ
の入出力グループに対応させ、再構築処理とその他の処
理の間で前記ディスク装置のタイムシェアリングを行う
ことを特徴とする。 (5)請求項1記載のディスク・タイムシェアリング装
置に於いて、ディスク装置は、第1タスクの指定でポジ
ショニング時間を最小とするように複数の入出力をスケ
ジューリングし、第2タスクの指定で受付け中の入出力
を完了させた後に第2タクス指定の入出力をスケジュー
リングするオーダ・タスク機能を備え、入出力スケジュ
ール機構は、ディスク装置のタイムシェアリングを行う
際に、第1タスクの指定と第2タスクの指定を分けてス
ケジューリングすることを特徴とする。 (6)前記(7)記載のディスク・タイムシェアリング
装置に於いて、入出力スケジュール機構は、複数の入出
力グループ間でディスク装置を順番に使用するタイムシ
ェアリングを行う際に、入出力グループを切替えた直後
の最初の入出力は第2タスクを指定して切替前のグルー
プの入出力を完了させた後に切替後のグループの入出力
をスケジューリングし、その後、次のグループを切替え
るまでの入出力は第1タスクで指定してポジショニング
時間を最小とするように複数の入出力をスケジューリン
グすることを特徴とする。 (7)前記(6)記載のディスク・タイムシェアリング
装置に於いて、入出力スケジュール機構は、クォンタム
切替時に未処理入出力の予測処理時間に基づいて次のク
ォンタム開始時刻を予測し、入出力要求の受付け又は入
出力要求の完了応答毎に、その時の未処理入出力の予測
処理時間と前記クォンタム開始時刻に基づいて残り時間
を予測し、残り時間があると判断した場合は、現クォン
タムの入出力要求をディスク装置に投入し、残り時間が
ないと判断した場合は次のクォンタムに切替えることを
特徴とする。 (8)前記(5)記載のディスク・タイムシェアリング
装置に於いて、入出力スケジュール機構は、1つの入出
力グループからの入出力に対しディスク装置を連続して
使用する場合、割当時間をリセットした直後の最初の入
出力は第2タスクを指定してリセット前の入出力を完了
させた後にリセット後の入出力をスケジューリングし、
次にリセットするまでの入出力は第1タスクで指定して
ポジショニング時間を最小とするように複数の入出力を
スケジューリングすることを特徴とする。 B.請求項3に関する特徴 (1)請求項3記載のディスク・タイムシェアリング方
法に於いて、シーケンシャルアクセスと判断された入出
力はシーケンシャルアクセス入出力グループに、それ以
外の入出力はランダムアクセス入出力グループに対応さ
せ、シーケンシャルアクセスとランダムアクセスでディ
スク装置のタイムシェアリングを行うことを特徴とす
る。 (2)請求項3記載のディスク・タイムシェアリング方
法に於いて、性能要件が同一となる複数の論理ボリュー
ムを1つの入出力グループに対応させ、性能要件が異な
る論理ボリューム群間でディスク装置のタイムシェアリ
ングを行うことを特徴とする。 (3)請求項3記載のディスク・タイムシェアリング方
法に於いて、コピー及びバックアップ処理の入出力を1
つの入出力グループに対応させ、コピー及びバックアッ
プ処理とその他の処理の間でディスク装置のタイムシェ
アリングを行うことを特徴とする。 (4)請求項3記載のディスク・タイムシェアリング方
法に於いて、ディスク装置は、複数のディスクドライブ
を備え、1つのディスクドライブか故障しても他のディ
スクドライブからデータを復元して再構築可能なRAI
D構成であり、RAID構成をとるディスク装置の再構
築処理の入出力を1つの入出力グループに対応させ、再
構築処理とその他の処理の間で前記ディスク装置のタイ
ムシェアリングを行うことを特徴とする。 (5)請求項11記載のディスク・タイムシェアリング
方法に於いて、ディスク装置は、第1タスクの指定でポ
ジショニング時間を最小とするように複数の入出力をス
ケジューリングし、第2タスクの指定で受付け中の入出
力を完了させた後に第2タクス指定の入出力をスケジュ
ーリングするオーダ・タスク機能を備え、ディスク装置
のタイムシェアリングを行う際に、前記第1タスクの指
定と第2タスクの指定を分けてスケジューリングするこ
とを特徴とする。 (6)前記(5)記載のディスク・タイムシェアリング
方法に於いて、複数の入出力グループ間でディスク装置
を順番に使用するタイムシェアリングを行う際に、入出
力グループを切替えた直後の最初の入出力は第2タスク
を指定して切替前のグループの入出力を完了させた後に
切替後のグループの入出力をスケジューリングし、次に
グループを切替えるまでの入出力は第1タスクで指定し
てポジショニング時間を最小とするように複数の入出力
をスケジューリングすることを特徴とする。 (7)前記(6)記載のディスク・タイムシェアリング
方法に於いて、クォンタム切替時に未処理入出力の予測
処理時間に基づいて次のクォンタム開始時刻を予測し、
入出力要求の受付け又は入出力要求の完了応答毎に、そ
の時の未処理入出力の予測処理時間と前記クォンタム開
始時刻に基づいて残り時間を予測し、残り時間があると
判断した場合は、現クォンタムの入出力要求をディスク
装置に投入し、残り時間がないと判断した場合は次のク
ォンタムに切替えることを特徴とする。 (8)前記(5)記載のディスク・タイムシェアリング
方法に於いて、1つの入出力グループからの入出力に対
しディスク装置を連続して使用する場合、割当て時間を
リセットした直後の最初の入出力は第2タスクを指定し
てリセット前の入出力を完了させた後にリセット後の入
出力をスケジューリングし、次にリセットするまでの入
出力は第1タスクで指定してポジショニング時間を最小
とするように複数の入出力をスケジューリングすること
を特徴とする。
【図面の簡単な説明】
【図1】本発明の原理説明図
【図2】本発明が適用されるストレージシステムのブロ
ック図
【図3】3つの入出力グループを形成する本発明の基本
的な実施形態の機能ブロック図
【図4】図3の3つの入出力グループの入出力を対象と
した場合のディスク・タイムシェアリング処理のスケジ
ュール説明図
【図5】1つの入出力グループのみの入出力が連続する
場合のディスク・タイムシェアリング処理のスケジュー
ル説明図
【図6】クォンタム切替え時の残り時間の予測処理の説
明図
【図7】図3のディスク・タイムシェアリング処理のフ
ローチャート
【図8】シーケンシャルアクセスとランダムアクセスの
入出力グループに対応した本発明の実施形態の機能ブロ
ック図
【図9】論理ボリュームの入出力グループに対応した本
発明の実施形態の機能ブロック図
【図10】コピー/バックアップ処理と通常処理の入出
力グループに対応した本発明の実施形態の機能ブロック
【図11】リビルディング処理と通常処理の入出力グル
ープに対応した本発明の実施形態の機能ブロック図
【図12】サーバOSに入出力依頼部を設けた本発明が
適用されるた他のシステム構成図
【図13】サーバOSに入出力依頼部とディスク入出力
スケジュール機構を設けた本発明が適用されるた他のシ
ステム構成図
【図14】図10の実施形態においてデータベースに対
するランダムアクセスのOLTP業務と同時にシーケン
シャルアクセスであるバックアップのためのコピー処理
を実行した場合の計測結果の特性図
───────────────────────────────────────────────────── フロントページの続き (72)発明者 武 理一郎 神奈川県川崎市中原区上小田中4丁目1 番1号 富士通株式会社内 (72)発明者 堀田 勇次 神奈川県川崎市中原区上小田中4丁目1 番1号 富士通株式会社内 (56)参考文献 特開 平9−251351(JP,A) 特開 昭59−180647(JP,A) 特開 昭53−95548(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06F 3/06 - 3/08 G06F 13/10 - 13/14 G11B 19/02 G06F 12/00 - 12/16

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】1又は複数のディスクドライブを備えたデ
    ィスク装置と、 前記ディスク装置に入出力要求を発行する入出力要求部
    と、 ディスク装置への入出力元を入出力要求の性質に基づい
    グループ化した入出力グループを形成すると共に各入
    出力グループがディスクを使用する時間の比率を定義
    し、定義された時間比率に基づき各入出力グループが連
    続してディスク装置を使用できる割当時間(クォンタ
    ム)を決定し、複数の入出力グループからディスク装置
    に入出力の依頼を受け付けている場合、競合した入出力
    グループ間で前記割当時間を順番に切り替えてディスク
    装置を使用するタイムシェアリングを行う入出力スケジ
    ュール機構と、 を備えたことを特徴とする入出力装置。
  2. 【請求項2】請求項1記載の入出力装置に於いて、前記
    入出力スケジュール機構は、1つの入出力グループから
    のみ入出力の依頼のある場合は、1つの入出力グループ
    からの入出力に対しディスク装置を連続して使用可能と
    することを特徴とする入出力装置。
  3. 【請求項3】1又は複数のディスクドライブを備えたデ
    ィスク装置と、前記ディスク装置に入出力要求を発行す
    る入出力要求部と、前記入出力に基づいて前記ディスク
    装置の使用をスケジューリングする入出力スケジュール
    機構とを備えたディスク・タイムシェアリング方法に於
    いて、 前記ディクス装置への入出力元を入出力要求の性質に基
    づいてグループ化した入出力グループを形成すると共に
    各入出力グループがディスクを使用する時間の比率を定
    義し、 定義された時間比率に基づき各入出力グループが連続し
    てディスク装置を使用できる割当時間(クォンタム)を
    決定し、 複数の入出力グループからディスク装置に入出力の依頼
    を受け付けている場合、競合した入出力グループ間で前
    記割当時間を順番に切り替えてディスク装置を使用する
    タイムシェアリングを行う、 ことを特徴とするディスク・タイムシェアリング方法。
  4. 【請求項4】請求項3記載のディスク・タイムシェアリ
    ング方法に於いて、1つの入出力グループからのみ入出
    力の依頼のある場合は、1つの入出力グループからの入
    出力に対しディスク装置を連続して使用可能とすること
    を特徴とするディスクタイ・タイムシエアリング方法。
JP21875799A 1999-08-02 1999-08-02 入出力装置及びディスク・タイムシェアリング方法 Expired - Fee Related JP3440219B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP21875799A JP3440219B2 (ja) 1999-08-02 1999-08-02 入出力装置及びディスク・タイムシェアリング方法
US09/495,878 US6480904B1 (en) 1999-08-02 2000-02-02 Disk-time-sharing apparatus and method
EP00102559A EP1074908B1 (en) 1999-08-02 2000-02-07 Disk time-sharing apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP21875799A JP3440219B2 (ja) 1999-08-02 1999-08-02 入出力装置及びディスク・タイムシェアリング方法

Publications (2)

Publication Number Publication Date
JP2001043032A JP2001043032A (ja) 2001-02-16
JP3440219B2 true JP3440219B2 (ja) 2003-08-25

Family

ID=16724937

Family Applications (1)

Application Number Title Priority Date Filing Date
JP21875799A Expired - Fee Related JP3440219B2 (ja) 1999-08-02 1999-08-02 入出力装置及びディスク・タイムシェアリング方法

Country Status (3)

Country Link
US (1) US6480904B1 (ja)
EP (1) EP1074908B1 (ja)
JP (1) JP3440219B2 (ja)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3440219B2 (ja) * 1999-08-02 2003-08-25 富士通株式会社 入出力装置及びディスク・タイムシェアリング方法
US6647458B1 (en) * 2000-04-04 2003-11-11 Emc Corporation Benchmark tool write analysis for a mass storage system
US6732232B2 (en) * 2001-11-26 2004-05-04 International Business Machines Corporation Adaptive resource allocation in multi-drive arrays
US7734867B1 (en) * 2002-05-17 2010-06-08 Hewlett-Packard Development Company, L.P. Data storage using disk drives in accordance with a schedule of operations
EP1418506A3 (en) * 2002-11-08 2005-10-12 Matsushita Electric Industrial Co., Ltd. Data storing system and transmission control method
JP4633334B2 (ja) * 2003-01-27 2011-02-16 パナソニック株式会社 情報処理装置およびメモリアクセス調停方法
JP4322068B2 (ja) * 2003-03-07 2009-08-26 富士通株式会社 ストレージシステム及びそのデイスク負荷バランス制御方法
US7330910B2 (en) * 2004-05-20 2008-02-12 International Business Machines Corporation Fencing of resources allocated to non-cooperative client computers
JP4472617B2 (ja) * 2005-10-28 2010-06-02 富士通株式会社 Raidシステム、raidコントローラ及びそのリビルド/コピーバック処理方法
US20080282245A1 (en) * 2007-05-08 2008-11-13 International Business Machines Corporation Media Operational Queue Management in Storage Systems
US8090903B2 (en) * 2008-01-18 2012-01-03 Microsoft Corporation Fair and dynamic disk input/output bandwidth distribution
JP2011081580A (ja) * 2009-10-07 2011-04-21 Hitachi Ltd 計算機システム及び計算機システムの入出力方法
JP2012221340A (ja) 2011-04-12 2012-11-12 Fujitsu Ltd 制御方法及びプログラム、並びにコンピュータ
US9569312B2 (en) * 2011-09-27 2017-02-14 Xcube Research And Development, Inc. System and method for high-speed data recording
JP5853569B2 (ja) 2011-10-12 2016-02-09 富士通株式会社 制御方法及びプログラム、並びにコンピュータ
JP2013164820A (ja) * 2012-02-13 2013-08-22 Fujitsu Ltd 評価支援方法、評価支援プログラムおよび評価支援装置
JP5958020B2 (ja) * 2012-03-30 2016-07-27 富士通株式会社 ストレージシステム
WO2014132099A1 (en) * 2013-02-28 2014-09-04 Hitachi, Ltd Management system and method of dynamic storage service level monitoring
JP2015132987A (ja) * 2014-01-14 2015-07-23 富士通株式会社 情報処理装置,データコピー処理管理方法及びデータコピー処理管理プログラム
US10235248B1 (en) * 2017-04-27 2019-03-19 EMC IP Holding Company LLC Processing I/O operations in parallel while maintaining read/write consistency using range and priority queues in a data protection system
US11748207B2 (en) * 2021-09-27 2023-09-05 Rubrik, Inc. Scalable group backup in relational databases

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5581784A (en) 1992-11-17 1996-12-03 Starlight Networks Method for performing I/O's in a storage system to maintain the continuity of a plurality of video streams
JPH08147234A (ja) * 1994-11-17 1996-06-07 Fujitsu Ltd ストリーム処理装置及び方法
US5644789A (en) 1995-01-19 1997-07-01 Hewlett-Packard Company System and method for handling I/O requests over an interface bus to a storage disk array
JP3426385B2 (ja) * 1995-03-09 2003-07-14 富士通株式会社 ディスク制御装置
JP3201219B2 (ja) * 1995-05-29 2001-08-20 三菱電機株式会社 入出力処理システム
US5778426A (en) * 1995-10-23 1998-07-07 Symbios, Inc. Methods and structure to maintain a two level cache in a RAID controller and thereby selecting a preferred posting method
US5734861A (en) * 1995-12-12 1998-03-31 International Business Machines Corporation Log-structured disk array with garbage collection regrouping of tracks to preserve seek affinity
JPH11120685A (ja) * 1997-10-09 1999-04-30 Fujitsu Ltd ディスク装置
JP3440219B2 (ja) * 1999-08-02 2003-08-25 富士通株式会社 入出力装置及びディスク・タイムシェアリング方法

Also Published As

Publication number Publication date
US6480904B1 (en) 2002-11-12
JP2001043032A (ja) 2001-02-16
EP1074908A3 (en) 2002-03-27
EP1074908A2 (en) 2001-02-07
EP1074908B1 (en) 2012-07-25

Similar Documents

Publication Publication Date Title
JP3440219B2 (ja) 入出力装置及びディスク・タイムシェアリング方法
JP4922496B2 (ja) I/o要求に優先順位を与える方法
US6957433B2 (en) System and method for adaptive performance optimization of data processing systems
JP4921054B2 (ja) 負荷分散制御システム及び負荷分散制御方法
EP0384635B1 (en) Adaptive job scheduling for multiprocessing systems
EP0768599B1 (en) On-line disk array reconfiguration
JP4219602B2 (ja) 記憶制御装置および記憶制御装置の制御方法
KR20120109533A (ko) 쿼리 관리
JPH09319528A (ja) データ記憶システムにおけるデータの再配置方法、そのシステムに記憶されたデータのアクセス方法及びデータ記憶システム
JP3623697B2 (ja) ディスク・タイムシェアリング装置及び方法
JP4091225B2 (ja) ディスク・タイムシェアリング装置及び方法
JP5584422B2 (ja) 情報処理装置,スケジュール管理装置,スケジュール管理方法およびスケジュール管理プログラム
JP2002023962A (ja) ディスク装置及び制御方法
JP6056856B2 (ja) ストレージ制御装置、情報処理装置、ストレージ制御プログラム、及びストレージ制御方法
JPH09258907A (ja) 複数の記憶ディスク部を有した高可用性の外部記憶装置
CN117806540A (zh) 储存装置控制器及储存装置控制器的方法
US9164885B2 (en) Storage control device, storage control method, and recording medium
JP6010975B2 (ja) ジョブ管理装置、ジョブ管理方法、及びプログラム
US10824425B2 (en) Selecting destination for processing management instructions based on the processor buffer size and uncompleted management instructions
JP6115575B2 (ja) データセット多重度変更装置、サーバ、データセット多重度変更方法、およびコンピュータ・プログラム
EP3293625B1 (en) Method and device for accessing file, and storage system
CN102576294A (zh) 含有多个存储装置的存储系统、方法及程序
JP6836536B2 (ja) ストレージシステム及びio処理の制御方法
CN119415044B (zh) 一种raid1磁盘阵列读操作的选盘方法及系统
JPH05108274A (ja) 並列デイスク制御方法および並列デイスク制御装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20030513

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090613

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100613

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110613

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120613

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120613

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130613

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140613

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees