JP3440219B2 - 入出力装置及びディスク・タイムシェアリング方法 - Google Patents
入出力装置及びディスク・タイムシェアリング方法Info
- Publication number
- JP3440219B2 JP3440219B2 JP21875799A JP21875799A JP3440219B2 JP 3440219 B2 JP3440219 B2 JP 3440219B2 JP 21875799 A JP21875799 A JP 21875799A JP 21875799 A JP21875799 A JP 21875799A JP 3440219 B2 JP3440219 B2 JP 3440219B2
- Authority
- JP
- Japan
- Prior art keywords
- input
- output
- time
- disk
- group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/48—Program initiating; Program switching, e.g. by interrupt
- G06F9/4806—Task transfer initiation or dispatching
- G06F9/4843—Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
- G06F9/4881—Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/061—Improving I/O performance
- G06F3/0611—Improving I/O performance in relation to response time
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/061—Improving I/O performance
- G06F3/0613—Improving I/O performance in relation to throughput
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0655—Vertical data movement, i.e. input-output transfer; data movement between one or more hosts and one or more storage devices
- G06F3/0659—Command handling arrangements, e.g. command buffers, queues, command scheduling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0668—Interfaces specially adapted for storage systems adopting a particular infrastructure
- G06F3/0671—In-line storage system
- G06F3/0683—Plurality of storage devices
- G06F3/0689—Disk arrays, e.g. RAID, JBOD
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Description
づいてディスク装置の使用をスケジューリングする入出
力装置及びディスク・タイムシェアリング方法に関し、
特に、競合する入出力に対し割得て時間を順番に切替え
るようにディスク装置の使用をスケジューリングする入
出力装置及びディスク・タイムシェアリング方法に関す
る。
スク装置を使用してデータを管理するストレージシステ
ムにあっては、例えばディスク装置をRAID構成の装
置とし、このRAID装置をディスク制御装置の配下に
接続して上位のホストからの入出力を処理したり、直
接、サーバにRAID装置を接続し、サーバOSからの
入出力を処理するようにしている。
は、同一のディスク装置に対して、応答時間の保証が要
求されるランダムアクセスと、単位時間当たりの処理量
が重視されるシーケンシャルアクセスを行う必要がある
場合、ランダムアクセスとシーケンシャルアクセスが競
合しないように、時間帯を分けた運用を行っている。例
えば、昼間は、ディスク装置のデータベースに対してラ
ンダムアクセス中心のOLTP業務(On Line Transact
ion Processing)を行い、業務終了後の夜間にデータベ
ースのバックアップを行っている。
とシーケンシャルアクセスの資源配分 しかしながら、このようなストレージシステムにあって
は、業務の無停止化に伴い、夜間といえどもランダムア
クセス系のOLTP業務を継続する必要が出てきたた
め、ランダムアクセス系のOLTP業務中にシーケンシ
ャルアクセスであるバックアップの実行が必要となって
きている。
応答時間、例えば30msを満たせる単位時間当りの入出
力回数であるIOPS(Input Output Per Second )、
例えば100IOPSを見積もることができる。シーケンシ
ャルアクセスのみの場合は、例えば20MB/sといっ
たスループットを見積もることができる。
ャルアクセスを同時に行った場合は、受け付けた入出力
を要求をFIFOを用いたキューで処理するため、ラン
ダムアクセスがディスク装置を使用できる時間およびシ
ーケンシャルアクセスがディスク装置を使用できる時間
を保証する仕組みがない。
のランダムアクセスと、5MB/sのシーケンシャルア
クセスが欲しい場合でも、シーケンシャルアクセスが頻
繁に発生するとシーケンシャルアクセスのスループット
は、上がる必要はないのであるが、5MB/sから10
MB/sに上がる。逆にランダムアクセスで平均応答時
間30msを満たすIOPSは、低下させたくはないにもか
かわらず、50IOPSから25IOPSに低下する。 2.論理ボリューム間の資源配分 また従来のストレージシステムは、性能要件の異なるデ
ータは異なるディスク装置に配置することで、それぞれ
の性能特性を引き出している。例えば、小量データのラ
ンダムアクセスで応答時間の保証が要求されるデータ
と、大量データのシーケンシャルアクセスで単位時間当
たりの処理量が重視されるデータは、異なるディスク装
置に配置している。
い、異なる性能要件のデータを同一ディスク装置に配置
するケースが増えてきている。このように異なる性能要
件の論理ボリュームを同一ディスクに配置した場合も同
様の問題が生じる。従来は、受け付けた入出力をFIF
Oでスケジュールして論理ボリューム間のディスク資源
分配を制御する仕組みがない。このため、ある論理ボリ
ュームへの入出力が頻繁に発生すると、他の論理ボリュ
ームへの入出力性能が低下する。
ームAと、50IOPSを保証して欲しいボリュームBを同
一ディスクに配置した場合、ボリュームAへのアクセス
が頻繁に発生するとボリュームAのIOPSは、上がる必要
はないにもかかわらず、10IOPSから20IOPSに上が
る。逆にボリュームBのIOPSは、低下させたくはないに
もかかわらず、50IOPSから40IOPSへと低下する。 3.通常処理とバックアップ/コピー処理間の資源配分 従来のストレージシステムで、同一ディスク装置上に複
数の論理ボリュームが存在し、個々の論理ボリューム単
位でバックアップやコピーを行う場合を考える。従来
は、バックアップ/コピー処理による通常の入出力への
影響を抑えるため、バックアップ/コピー処理のペース
(インターバル)を、バックアップ/コピー処理の実行
時に設定する手法を採っている。
リュームAと同じディスク装置上のボリュームBに対し
てコピーを実行すると、同時に2多重のコピー処理が同
一のディスク装置上で動作するため、通常の入出力への
影響は2倍になる。 4.通常処理とリビルディング間の資源配分 RAID装置では、複数のディスクドライブでデータを
冗長化させることにより、1つのディスクドライブに障
害が発生しても残りのディスクドライブからデータを復
旧することができる。このため、RAID装置では、デ
ィスクドライブに障害が発生しても、通常の入出力を継
続することができる。
て、残りのディスクドライブからデータの復旧が行われ
る。この復旧処理のことをリビルディング(Rebuilding)
と呼ぶ。リビルディングは、RAID装置を構成するデ
ィスクドライブに対する入出力処理を伴うため、同一の
ディスクドライブを通常の入出力と奪い合うことにな
る。
出力の性能は低下する。例えば、ミラー構成をとるRA
ID1の場合、リビルディングは、ディスクドライブの
障害により1台になったディスクドライブから交換され
た新しいディスクドライブへデータをコピーする処理で
あり、コピー元のディスクドライブに対しリード入出力
が発生する。このリード入出力が通常の入出力を待たせ
ることになり、通常の入出力の性能が低下する。
チは2つある。第1のアプローチは、通常の入出力に影
響を与えないように、十分長いインターバルで、十分小
さいデータをコピーする。この場合、通常の入出力への
影響は小さくすることができるが、リビルディング完了
までの時間が長くなる。例えば9GBのディスクドライ
ブで構成するRAID1の場合、10時間前後が必要と
なる。
空いていれば、即ち、通常の入出力でディスクドライブ
を使用していなければ、リビルディングの入出力をスケ
ジュールする。この場合の問題は、リビルディング完了
までの時間が保証できない点にある。これはディスクド
ライブがほとんど空いていないと、リビルディングに長
時間必要になってしまう。 5.最大応答時間保証 ミッションクリティカルな業務では、入出力性能の要件
として平均応答時間の他に最大応答時間が重要となる。
近年のディスク装置は、実行待ち入出力を処理時間が最
短になるように並び替えるリ・オーダリング機能(Re-o
rdering 機能)を持っている。
が、実行待ち入出力の中からシーク時間と回転待ち時間
の和で定義されるポジショニング時間を最小にする入出
力を、次に実行する入出力として選ぶ機能である。ディ
スク装置に入出力を依頼する際に、リ・オーダリングの
対象として良い旨のタスク指定となるシンプルタスク
(Simple task)をディスク装置に通知する。
力の場合は、ポジショニング時間を最小にするような順
番で入出力をスケジュールする。これにより、ランダム
アクセス時の平均処理時間が短縮される。例えば、ラン
ダムアクセスの平均処理時間は、リ・オーダリング機能
を使用することにより、9msから5msに短縮する。
スク装置のスループットを向上させるが、最大応答時間
が大きくなる問題がある。これは、次の入出力にポジシ
ョニング時間が最小となる入出力を選択するため、ある
入出力が長い間待ちのままでスケジュールされない現象
が発生するためである。
は、リ・オーダリングの対象として良いことを指定する
シンプルタスクの他に、オーダードタクス(Ordered ta
sk)を指定する機能を備えている。オーダードタクスの
指定で入出力を依頼すると、ディスク装置は、それまで
に受け付けていた未だ完了していない入出力を全て完了
させた後、オーダードタスクの入出力をスケジューリン
グする。
ドタスクを混ぜることにより、入出力の最大応答時間の
延長を抑えることが可能となる。しかし、ランダムアク
スセとシーケンシャルアクセス間、論理ボリューム間、
通常処理とバックアップ/コピー処理やリビルディング
処理間の資源配分を考えた場合、スループット(IOPS)
を向上させるためのシンプルタクスの利用に加え、シン
プルタクスクを使った場合の最大応答時間の保証が課題
となる。
なる複数の入出力が競合した場合の性能の最低保証を可
能とするディスク・タイムシェアリング装置及び方法を
提供することを目的とする。
図である。本発明の入出力装置は、図1(A)のよう
に、1又は複数のディスクドライブ24を備えたディス
ク装置16、ディスク装置16に入出力要求を発行する
入出力要求部18、及びディスク装置16への入出力元
を入出力要求の性質に基づいてグループ化した入出力グ
ループを形成すると共に各入出力グループがディスク装
置16を使用する時間の比率を定義し、定義された時間
比率に基づき各入出力グループが連続してディスク装置
16を使用できるクォンタムτ1,τ2,τ3(割当時
間)を決定し、複数の入出力グループからディスク装置
16に入出力の依頼を受け付けている場合、図1(B)
のように、競合した入出力グループ間でクォンタムτ
1,τ2,τ3を順番に切り替えてディスク装置16を
使用するタイムシェアリングを行う入出力スケジュール
機構20を備える。
の入出力グループからのみ入出力の依頼のある場合は、
図1(C)のクォンタムτ1の時刻t0〜t2のよう
に、1つの入出力グループからの入出力に対しディスク
装置16を連続して使用可能とする。このように本発明
のディスク・タイムシェアリング装置によれば、予め定
義した入出力グループ毎に、入出力性能の最低値保証を
可能とすると共に、特定の入出力グループからの要求
が、ある時間帯に集中した場合は、その特定の入出力グ
ループに対して最大性能を保証できる。
は、シーケンシャルアクセスと判断された入出力はシー
ケンシャルアクセス入出力グループに、それ以外の入出
力はランダムアクセス入出力グループに対応させ、シー
ケンシャルアクセスとランダムアクセスでディスク装置
16のタイムシェアリングを行う。
け多く発生しようとも、シーケンシャルアクセスの入出
力でディスク装置を使用できる時間が保証されているか
ら、シーケンシャルアクセス性能の最低値保証が可能と
なる。また、ランダムアクセスの入出力でディスク装置
を使用できる時間が保証されているから、ランダムアク
セス性能の最低保証が可能となる。
場合は、シーケンシャルアクセスの入出力のみでディス
ク装置を連続して使用できるから、シーケンシャルアク
セスの最大性能を保証できる。更に、ランダムアクセス
要求のみの場合は、ランダムアクセスの入出力要求のみ
でディスク装置を連続して使用できるから、ランダムア
クセスの最大性能を保証できる。
が同一となる複数の論理ボリュームを1つの入出力グル
ープに対応させ、性能要件が異なる論理ボリューム群間
でディスク装置16のタイムシェアリングを行う。この
ため、ある論理ボリュームへのアクセスの入出力でディ
スク装置を使用できる時間が保証されているから、他の
論理ボリュームに対する入出力要求がどれだけ多く発生
しようとも、当該論理ボリューム毎の入出力性能の最低
値保証が可能となる。
のみの場合は、そのボリュームの入出力要求のみでディ
スク装置を連続して使用できるから、当該ボリュームへ
の入出力の最大性能を保証できる。
力スケジュール機構20は、コピー及びバックアップ処
理の入出力を1つの入出力グループに対応させ、コピー
及びバックアップ処理とその他の処理の間でディスク装
置16のタイムシェアリングを行う。これによりコピー
/バックアップ処理が同一ディスク装置上で、何多重で
動作しようとも、通常処理の入出力で使用できるディス
ク使用時間が保証されているから通常処理(コピー/バ
ックアップ以外の処理)の入出力性能の最低値保証が可
能となる。
きるディスク装置の使用時間が保証されているから、コ
ピー/バックアップ処理全体のアクセス性能の最低保証
が可能となる。
みの場合は、コピー/バックアップ処理の入出力のみで
ディスク装置を連続して使用できるから、コピー/バッ
クアップ入出力の最大性能を保証できる。
クドライブ24を備え、1つのディスクドライブ24が
故障しても他のディスクドライブ24からデータを復元
して再構築可能なRAID構成とした場合、入出力スケ
ジュール機構20は、RAID構成をとるディスク装置
16の再構築処理(リ・ビルディング処理)の入出力を
1つの入出力グループに対応させ、再構築処理とその他
の処理の間で前記ディスク装置16のタイムシェアリン
グを行う。
イブを使用できる時間が保証されているから、再構築動
作中の通常処理の入出力の性能を保証できる。また再構
築の入出力でディスクドライブを使用できる時間が保証
されているから、再構築完了までに要する時間を保証で
きる。
ーバルで行う従来の装置に比較し、本発明のディスク・
タイムシェアリングでは、通常の入出力が実行されてい
ない場合に、リビルディング処理を実行できるから、通
常処理の入出力性能を保証した上で、リビルディング完
了までに要する時間を短縮できる。
(第1タスク)の指定でポジショニング時間を最小とす
るように複数の入出力をスケジューリングし、オーダー
ドタスク(第2タスク)の指定で受付け中の入出力を完
了させた後に第2タクス指定の入出力をスケジューリン
グするオーダード・タスク機能を備えた場合、入出力ス
ケジュール機構20は、ディスク装置16のタイムシェ
アリングを行う際に、シンプルタスクの指定とオーダー
ドタスクの指定を分けてスケジューリングする。
数の入出力グループ間でディスク装置16を順番に使用
するタイムシェアリングを行う際に、入出力グループを
切替えた直後の最初の入出力はオーダードタスクを指定
して切替前のグループの入出力を完了させた後に切替後
のグループの入出力をスケジューリングし、次にグルー
プを切替えるまでの入出力はシンプルタスクで指定して
ポジショニング時間を最小とするように複数の入出力を
スケジューリングする。このため、1つのクォンタム内
で、ある入出力グループの入出力に対しディスク装置1
6を連続して使用することができる。
ム切替時に未処理入出力の処理時間を予測して次のクォ
ンタム開始時刻T0 を算出(予測)し、入出力要求の受
付け又は入出力要求の完了応答毎に、その時の未処理入
出力の処理時間とクォンタム開始時刻T0 に基づいて残
り時間Tr を予測し、残り時間があると判断した場合
(Tr >0)は、現クォンタムの入出力要求をディスク
装置に投入し、残り時間がないと判断した場合(Tr ≦
0)は次のクォンタムに切替える。
ディスク入出力スケジュール機構20において、できる
だけ多くの入出力をディスク装置16に依頼する環境を
作る必要がある。このためにシンプルタスクを使う場
合、ディスク装置に対して複数の入出力要求を依頼する
ことになる。本発明のディスクタイムシェリングは、デ
ィスク装置での入出力処理時間の時分割制御を目的とし
ているので、ディスク装置へ入出力要求を依頼する際に
は、依頼された複数の要求をディスク装置で処理するの
に必要な時間を予測し、次のクォンタムに切替えた後に
切替え後のクォンタム種別の入出力をディスク装置に投
入するか否か判断する必要がある。
スクドライブに依頼している要求が次のクォンタム内で
完了して新たな入出力要求が投入できるか否かを判断す
るため残り時間Tr を次式で算出する。 残り時間Tr =クォンタム開始時刻T0 +クォンタム割
当時間τ−未処理I/O処理時間−現在時刻 クォンタム開始時刻T0 =クォンタム切替時刻+未処理
I/O処理時間 未処理I/O処理時間=未処理I/O数×I/O平均処
理時間 入出力スケジュール機構20は、1つの入出力グループ
からの入出力に対しディスク装置を連続して使用する場
合、割当て時間をリセットした直後の最初の入出力はオ
ーダードタスクを指定してリセット前の入出力を完了さ
せた後にリセット後の入出力をスケジューリングし、次
にリセットするまでの入出力はシンプルタスクで指定し
てポジショニング時間を最小とするように複数の入出力
をスケジューリングする。
タムが連続する場合にも、クォンタム開始時刻を現在時
刻に設定し直すためにクォンタムをリセットした後のデ
ィスク装置16に対する最初の入出力をオーダードタス
クで依頼することにより、ディスク装置16をリオーダ
リングすることにより生じる弊害である応答時間の延長
を防止できる。
24を備えたディスク装置16と、ディスク装置16に
入出力要求を発行する入出力要求部18と、入出力要求
に基づいてディスク装置16の使用をスケジューリング
する入出力スケジュール機構20とを備えたディスク・
タイムシェアリング方法を提供する。
ディスク装置への入出力元をグループ化した入出力グル
ープを形成すると共に各入出力グループがディスク装置
を使用する時間の比率を定義し;定義された時間比率に
基づき各入出力グループが連続してディスク装置16を
使用できるクォンタムτi(割当時間)を決定し;複数
の入出力グループからディスク装置16に入出力の依頼
を受け付けている場合、競合した入出力グループ間でク
ォンタムτiを順番に切り替えてディスク装置16を使
用するタイムシェアリングを行う;ことを特徴とする。
詳細も、装置構成と基本的に同じになる。
レージシステムのブロック図である。図2において、ス
トレージシステムは、デバイス制御装置12、アレイデ
ィスク装置14、及びディスク装置16で構成される。
デバイス制御装置12に対しては、ホスト10−1〜1
0−nが接続されており、ホスト10−1〜10−nの
アプリケーションにより入出力要求をデバイス制御装置
12に対し行っている。
装置12からの入出力要求を受けつけ、ディスク装置1
6に対し受けつけた入出力要求を発行する。本発明のデ
ィスク・タイムシェアリング装置は、アレイディスク装
置14に設けた入出力要求部18及びディスク入出力ス
ケジュール機構20と、ディスク装置16に設けたディ
スク入出力処理部22及びディスクドライブ24−1〜
24−nで構成される。
ディスクドライブ24−1〜24−nがRAID構成を
とる場合には、アレイディスク装置14にはRAID制
御機構がさらに設けられることになる。
された本発明のタイムシェアリング装置の基本的な実施
形態のブロック図であり、RAID構成のディスク装置
を例にとっている。
は、入出力要求部18、RAID制御部26、ディスク
入出力スケジュール機構20を備える。またディスク装
置16にはディスク入出力処理部22が設けられ、この
ディスク入出力処理22に対し、例えばRAID1の構
成(ミラーディスク構成)をとる2台のディスクドライ
ブ24−1,24−2が接続されている。
アリング装置は、入出力要求部18からのディスク装置
16への入出力要求をグループ化して入出力グループを
形成すると共に、各入出力グループがディスク装置16
を使用する時間の比率を定義し、定義された時間比率に
基づき各入出力グループが連続してディスク装置を使用
できるクォンタム(割当時間)を決定し、複数の入出力
グループから依頼を受けつけている場合に競合した入出
力グループ間でクォンタムを順番に切り替えてディスク
装置16を使用するようにスケジューリングする処理を
行う。
力の依頼のある場合は、ひとつの入出力グループからの
入出力に対しディスク装置16を連続して使用可能とす
るスケジューリングを行う。
アリング処理を実現する図3の各部の構成及び機能を更
に詳細に説明すると次のようになる。入出力要求部18
は、例えば図2に示した上位のデバイス制御装置12か
らのコマンドに基づきディスク装置16に対する入出力
要求をRAID制御部26を介してディスク入出力スケ
ジュール機構20に発行する。RAID制御部は、依頼
された論理入出力要求を物理入出力要求に変換する処理
を主に行う。
は、ディスク・タイムシェアリング制御情報30−1,
30−2、入出力スケジュール部32、入出力要求受付
部34、及び入出力完了処理部36が設けられる。ディ
スク・タイムシェアリング制御情報30−1,30−2
は、ディスク装置16に設けているディスクドライブ2
4−1,24−2単位に設けられる。
ライブ24−1,24−2単位に設けられたディスク・
タイムシェアリング制御情報30−1,30−2を参照
及び更新してディスク・タイムシェアリングを行う。
情報30−1について説明すると、この実施形態にあっ
ては入出力グループをG1,G2,G3の3つに分けて
定義した場合を例にとっており、入出力グループG1〜
G3に対応してスケジュール待ちグループキュー38−
1〜38−3が設けられる。このスケジュール待ちグル
ープキュー38−1〜38−3には、入出力要求受付部
34で受けつけた入出力要求がキューを構成するFIF
Oに格納することで並ぶ。
完了待ちグループキュー40−1,40−2,40−3
が設けられる。完了待ちグループキュー40−1〜40
−3には、ディスク装置16への入出力依頼が完了し、
ディスク装置16から入出力完了応答を受けていない入
出力要求がキューを構成するFIFOに格納することで
並んでいる。
グループ用クォンタム42−1,42−2,42−3が
設けられる。このグループ用クォンタム42−1〜42
−3には、入出力グループG1〜G3がディスク装置1
6を使用する時間の比率α1,α2,α3を予め定義
し、この定義された比率α1,α2,α3に基づき、そ
れぞれの入出力グループG1〜G3が連続してディスク
装置を使用できる割当時間となるクォンタムτ1,τ
2,τ3を決定して格納している。
タイムシェアリング周期をTcとすると、入出力グルー
プG1〜G3のクォンタムτ1〜τ3は次式で定義され
る。
6の使用を決めるクォンタムτ1〜τ3の適正値は次の
ようにして決める。まずクォンタムは値を小さくしすぎ
るとディスク装置16の入出力処理時間に近くなり、ポ
ジショニング時間を最小とするように入出力を選択する
リ・オーダリングの効果が小さくなり、全体の入出力性
能が低下する。
入出力グループに切り替えるクォンタムの待ち時間が延
びることにより、平均入出力処理時間及び最大入出力処
理時間が延びることになる。例えばクォンタムτ1とク
ォンタムτ2をそれぞれ1時間に設定すると、クォンタ
ムτ1の処理中はクォンタムτ2の入出力を実行できな
いため、クォンタムτ2の入出力はクォンタムτ1の終
了を1時間待つことになる。
処理時間が数ms〜20msのディスク装置16の場
合、クォンタムの値としては数十ms〜数百msが望ま
しい。
0でグループ化する入出力としては、例えば次のグルー
プ化がある。
アクセスによるグループ化(2) 論理ボリュームによるグループ化(3) コピー/バックアップ処理と通常処理のグループ
化(4) RAIDのリ・ビルディング処理と通常処理のグ
ループ化 これら4種類の入出力のグループ化に基づく本発明のデ
ィスク・タイムシェアリング処理は、後の説明でそれぞ
れについて詳細に説明する。
報30−1には、現クォンタム種別44、現クォンタム
開始時刻46、更に次入出力タスク種別48が設けられ
る。この現クォンタム種別44は、ディスク装置16の
ディスクドライブ24−1,24−2毎に設けられ、現
在、ディスクドライブ24−1,24−2を使用してい
る入出力グループの識別子が設定される。
置16のディスクドライブ24−1,24−2毎に設け
られ、現在クォンタム種別44に設定されている現在の
クォンタムが開始した時刻T0 が設定される。更に次入
出力タスク種別48は、ディスク装置16のディスクド
ライブ24−1,24−2毎に設けられ、次のディスク
ドライブに対する入出力依頼をシンプル・タスクとする
かオーダード・タスクとするかが設定される。この次入
出力タスク種別48に設定されるシンプル・タスク又は
オーダード・タスクは、ディスク装置16におけるリ・
オーダリング機能の効果を十分に生かすために行う。
グ機能は、ディスクドライブ24−1又は24−2のそ
れぞれについて、実行待ちの入出力の中からシーク時間
と回転時間の和で与えられるポジショニング時間を最小
とする入出力を次に実行する入出力として選ぶ機能であ
る。
ディスク装置に入出力を依頼する場合、シンプル・タス
クを指定するとリ・オーダリングの対象としてよいこと
をディスクドライブに通知することになる。このシンプ
ル・タスクを指定した入出力を受けつけたディスクドラ
イブは、ポジショニング時間を最小とするような順番で
入出力をスケジュールする。
ポジショニング時間が最小となる入出力を選択するた
め、ある入出力が長い間待ちのままスケジュールされな
い現象が発生する。この現象を解消するためディスクド
ライブはシンプル・タスクの他にオーダード・タスクの
機能を備えている。オーダード・タスクを指定して入出
力を依頼すると、ディスクドライブはそれまで受け継い
でいた未だ完了していない入出力を全て完了させた後
に、オーダード・タスクの入出力をスケジュールする。
このためシンプル・タスクの間にオーダード・タスクを
混ぜることで、入出力の最大応答時間の延長を押さえる
ことが可能となる。
理にあっては、クォンタムを切り替えた後の最初の入出
力は、オーダード・タスクを指定してディスク装置16
に依頼し、クォンタム切り替え前の未だ完了していない
入出力を完了させた後に次のクォンタムの入出力を実行
する。このためクォンタムに切り替えた後の2つ目以降
の入出力についてはシンプル・タスクを指定する。
しかない場合には、その入出力グループのスケジュール
を連続するためにクォンタムをリセットしながら繰り返
すことになる。この場合にあってはクォンタムをリセッ
トした直後の最初の入出力はオーダード・タスクで依頼
し、前のクォンタムで完了してない入出力を総て完了し
た後にリセット後のクォンタムの入出力をスケジュール
する。
力が競合する場合、及びひとつの入出力グループのみの
入出力のみを連続させる場合の最大応答時間の延長を防
止することができる。
ル機構20に設けている入出力スケジュール部32によ
るディスク・タイムシェアリングのスケジュールの一例
である。
について、ディスク・タイムシェアリング制御情報30
−1のスケジュール待ちグループキュー38−1〜38
−3に入出力要求が格納されている競合状態にあって
は、入出力グループG1〜G3毎に決定されたクォンタ
ム持ち時間τ1,τ2,τ3に従って、グループG1〜
G3の順に各入出力をスケジューリングしてディスク装
置16に入出力を依頼する。
τ1の間は、入出力グループG1の2つの入出力がスケ
ジュールされる。クォンタム切替えは、入出力完了時点
の時刻が現クォンタム切替え時刻を越えた時点で、次の
入出力グループのクォンタムに切替える。この切替えは
次式で判断する。 (現在クォンタムの入出力開始時刻)< (現クォンタム開始時刻+クォンタム) (1) 即ち、(1)式を満たせば、現クォンタム種別に対応す
る入出力グループG1の入出力をディスク装置に依頼
し、満たさない場合は、次の入出力グループG2のクォ
ンタムに切替える。
時間τ2の間には、例えば6つの入出力がスケジュール
されている。更に時刻t2でクォンタム持ち時間τ2が
経過すると、入出力グループG3のクォンタム持ち時間
τ3への切り替えが行われ、例えば入出力グループG3
の3つの入出力がスケジュールされる。以下同様にクォ
ンタム持ち時間τ1,τ2,τ3を切り替えて、それぞ
れの入出力グループの入出力をスケジュールする。
みが連続した場合のタイムシェアリング処理の一例であ
る。図5において、時刻t0で入出力グループG1のみ
の入出力が図3のスケジュール待ちグループキュー38
−1に並んでおり、残りの入出力グループG2,G3の
スケジュール待ちキュー38−2,38−3は空であっ
たとする。
プG1のクォンタム持ち時間τ1で入出力グループG1
の2つの入出力をスケジュールした後、時刻t1でクォ
ンタム持ち時間τ1をリセットすることで次の同じ入出
力グループG1のクォンタム持ち時間τ1をリ・スター
トさせ、例えば3つの入出力をスケジュールする。
力のみ待ち状態にある時は、そのクォンタムをリセット
することで連続してひとつの入出力グループの入出力を
スケジュールする。
出力グループG1〜G3の入出力が競合状態となること
で、次のクォンタム持ち時間τ2への切り替えが行われ
る。しかしながら、クォンタム持ち時間τ2において入
出力グループG2の入出力が3つしかなく、クォンタム
持ち時間τ2の途中の時刻t3で3つの入出力要求が途
絶えている。
に待ち状態の入出力要求があることから、時刻t3でク
ォンタム持ち時間τ3に切り替え、入出力グループG3
の例えば3つの入出力をスケジュールする。
ムシェアリングのスケジュールにおいて、ディスクドラ
イブに対する入出力の依頼は、クォンタムを切り替えた
直後の入出力はオーダード・タスクで依頼し、2回目以
降の次のクォンタム切替えまでの入出力はシンプル・タ
スクで依頼する。
4−2のリ・オーダリング機能を生かすためには、クォ
ンタムを切り替えた際に現在ディスクトドライブ24−
1,24−2に依頼している入出力要求が全て完了する
までの時間を予測し、この予測時間が切り替え後のクォ
ンタム以内であれば、切り替え後にクォンタムの入出力
を依頼し、予測時間が切り替え後のクォンタムを越えて
いた場合には、切り替え後の入出力を依頼せずに次のク
ォンタムへの切り替えを待つようにする。
グの恩恵を受けるためにはディスク入出力スケジュール
機構20において、できるだけ多くの入出力をディスク
装置16に依頼する環境を作るためである。
に対して複数の入出力要求を依頼することになる。本発
明のディスクタイムシェリングは、ディスク装置での入
出力処理時間の時分割制御を目的としているので、ディ
スク装置へ入出力要求を依頼する際には、依頼された複
数の要求をディスク装置で処理するのに必要な時間を予
測し、次のクォンタムに切替えた後に切替え後のクォン
タム種別の入出力をディスク装置に投入するか否か判断
する必要がある。
スクドライブに依頼している要求が次のクォンタム内で
完了して新たな入出力要求が投入できるか否かを判断す
るため残り時間Tr を次式で算出する。 Tr =T0 +τ−Tw −Tnow (2) 但し、T0 はクォンタム開始時刻(予測値) τはクォンタム割当時間 Tw は未処理I/O処理時間(予測値) Tnow は現在時刻 T0 =Ts +Tw (3) 但し、Ts は切替え前のクォンタム開始時刻 Tw =N×Ta (4) 但し、Nは未処理のI/O数 Ta はアクセス種別毎によるI/Oの平均処理時間 ここで未処理I/0とは、ディスク装置に入出力要求を
投入して完了応答が返っていなものをいう。この未処理
I/Oには、本発明の実施形態の場合、前未処理I/
O、前々未処理I/Oおよび全未処理I/Oがあり、そ
れぞれ直前のクォンタムの未処理I/O、2つ前のクォ
ンタムの未処理I/O、および全てのクォンタムを通じ
た未処理I/Oを意味する。
り、前クォンタムの残り時間予測により、現クォンタム
への切替えを判断した際に予測する。この時、ディスク
装置上で前クォンタムの未処理I/Oの処理が全て完了
するのに必要な時間Twを(4)式で予測し、ディスク
装置上での前クォンタムの終了時刻、即ち、現クォンタ
ムの開始時刻T0 を(3)式で予測する。
力スケジュール機構が新たな入出力を受け付けた場合、
またはディスク装置から入出力の完了応答を受けた場合
に算出され、残り時間Tr が Tr >0 あれば、残り時間ありと判断し、現クォンタムの入出力
をディスク装置に投入する。また Tr ≦0 であれば、残り時間なしと判断し、クォンタムを切替え
る。
に使用するディスクドライブの平均入出力処理時間Ta
の算出方法は、例えば直前のn個の入出力処理時間の平
均値とする。この場合nは例えばn=10の有限値であ
ってもよし、例えばn=∞つまりシステム始動時からの
総ての入出力についてでもよい。
ては、入出力グループ毎に平均値を算出する方法と、全
ての入出力グループの平均値を算出する方法のいずれか
とすることができる。
ジショニング時間がデータ転送時間に比較して短いた
め、アクセスするデータ量とディスクドライブの転送能
力から平均入出力処理時間Ta を予測する。この場合、
ポジショニング時間はリ・オーダリング機能の恩恵をど
の程度受けられるか、即ちその時のディスクドライブで
のリ・オーダリング対象の入出力の数、個々の入出力要
求のアドレスの分散具合などによって違ってくるが、大
量データアクセスの場合、処理時間に占めるポジショニ
ング時間の割合が小さいため、この場合には処理時間を (平均ポジショニング時間)+(データ転送時間) と予測する。
待ち時間が3ms、平均シーク時間が5msのディスク
ドライブで1MBのデータをアクセスする場合、平均ポ
ジショニング時間が8msに対し、転送時間は52ms
なので、処理時間は両者を加えた60msとする。
測の例であり、シーケンシャル・クォンタムとランダム
・クォンタムを交互に繰り返す場合について、図6
(A)〜(J)と時間が経過する場合の例である。
ムからシーケンシャル・クォンタムへの切替え時に、次
のクォンタム開始時刻T0 を予測する例である。ランダ
ム・クォンタムに切替っている現在時刻Tnow で、ラン
ダム・クォンタムの残り時間不足になったとする。この
とき、前クォンタムのシーケンシャルI/Oが1要求、
現クォンタムのランダムI/Oが3要求の完了応答が返
ってきておらず、ディスク装置で処理中である。
装置に投入している処理中I/Oが全て完了するまでの
時間Tw1を(4)式で予測し、(2)式より次のシーケ
ンシャル・クォンタムの開始時刻T0 を決定する。また
クォンタムをシーケンシャル・クォンタムに切替える。
残り時間ありと判断する例である。図6(B)でシーケ
ンシャル・クォンタムに切替わった後、ディスク入出力
スケジュール機構がシーケンシャルI/Oを現在時刻T
now で1要求受け付けたとする。この時、ディスク装置
に依頼しているI/O要求で完了応答が返ってきていな
い未処理I/Oとして、ランダムI/Oの1要求があ
る。即ち、ディスク装置は、前クォンタムのランダムI
/Oの1要求を処理中である。
I/Oの1要求をディスク装置で完了するまでの時間T
w2を(4)式で予測し、図6(B)で求めたクォンタム
開始時刻T0 を使用して(2)式より残り時間Tr2を図
6(F)のように求める。この場合、Tr2>0であるこ
とから、シーケシンャルI/Oをディスク装置に投入す
ることができる。
残り時間なしと判断する例である。さらに時間が進み、
図6(G)の現在時刻Tnow でディスク入出力スケジュ
ール機構がシーケンシャルI/Oを1要求受け付けたと
する。この時、ディスク装置に依頼しているI/O要求
で完了応答が返ってきていない未処理I/Oとして、の
シーケンシャルI/Oの1要求がある。即ち、ディスク
装置は、現クォンタムのシーケンシャルI/Oの1要求
を処理中である。
シャルI/Oの1要求をディスク装置で完了するまでの
時間Tw3を(4)式で予測し、図6(B)で求めたクォ
ンタム開始時刻T0 を使用して(2)式より残り時間T
r3を図6(J)のように求める。この場合、Tr3<0で
あることから、残り時間なしと判断し、次のランダム・
クォンタムに切替える。
ル機構20に設けた入出力スケジュール部32による本
発明のディスクタイム・シェアリング制御処理のフロー
チャートである。
スクタイム・シェアリング制御処理は、入出力要求受付
部34で入出力要求部18より、ある入出力要求を受付
けた際の呼出し、或いは入出力完了処理部36でディス
ク装置16に依頼した入出力に対する完了報告があった
ときからの呼出しを受けて動作する。
図3のディスク入出力スケジュール機構20において、
競合した3つの入出力グループ間でクォンタムを順番に
切替えてディスクドライブ24−1のタイムシェアリン
グを行なう場合を説明する。
れているクォンタム識別子i=1に対応するスケジュー
ル待ちグループキュー38−1を調べ、待ちの入出力の
有無を判定する。
に待ちの入出力があれば、ステップS2に進み、前々ク
ォンタムに未完了の入出力があるか否かチェックする。
いま、クォンタム識別子i=1が最初のスケジュールで
あるとすると、前々クォンタムに未完了入出力はないこ
とから、ステップS3に進み、残り時間Tr を(2)式
から予測する。
>0か否かチェックし、この条件が成立する場合には残
り時間ありと判断してステップS8に進む。ステップS
4にあっては、現クォンタムのスケジュール待ちグルー
プキュー38−1の先頭の入出力をディスク装置16の
ディスク入出力処理部22を介してディスクドライブ2
4−1に依頼し、次入出力タスク種別情報48のタスク
をシンプルタクスに設定する。
のスケジュール待ちグループキュー38−1に待ちの入
出力があるか否かチェックし、待ちがあればステップS
2、S3,S8の処理を繰り返す。このような入出力グ
ループG1のクォンタム持ち時間τ1における入出力の
スケジュールによりステップS3でTr ≦0となり、残
り時間無しが判断されるとステップS5に進み、他の入
出力グループG2,G3のスケジュール待ちグループキ
ュー38−2,38−3に待ちの入出力があるか否かチ
ェックする。
ュール待ちグループキュー38−2に入出力の待ちがあ
るとステップS10に進み、次の入出力グループG2の
クォンタム持ち時間τ2に切替え、次入出力タスク種別
情報48について、次のタスクをオーダードに設定す
る。同時に、クォンタム現在時刻T0 を(3)式から予
測し、予測したT0 を現クォンタム開始時刻に設定す
る。
ォンタム持ち時間τ1から次の入出力グループG2のク
ォンタム持ち時間τ2への切替えが行われ、再びステッ
プS1に戻り、クォンタム切替えに伴う次の入出力グル
ープG2をステップS2,S3,S4,S8により処理
する。
ーダードに設定しているため、クォンタム切替え後の最
初の入出力はオーダードの指定でディスクドライブ24
−1に依頼される。依頼が済んだならば次入出力タスク
種別情報48のタスクをシンプルに設定する。
ープ、例えば入出力グループG1の入出力要求が連続し
た場合の処理を説明する。同じ入出力グループG1の入
出力要求の受付けが連続した場合には、ステップS1〜
S4の処理をクォンタムt1で繰り返して同じ入出力グ
ループの入出力要求をディスクドライブ24−1に依頼
し、この間にステップS4で残り時間無しが判別される
とステップS5に進み、他の入出力グループのスケジュ
ール待ちグループキュー38−2,38−3に待ちの入
出力があるか否かチェックする。
スケジュール待ちクループキュー38−2,38−3に
待ちの入出力がなく空であった場合には、ステップS9
に進み、現クォンタム持ち時間τ1をリセットし次のタ
スクをオーダードに設定し、同時に、クォンタム現在時
刻To を予測して現クォンタム開始時刻に設定し、ステ
ップS1に戻る。この場合、現クォンタム種別はそのま
まとする。
ットした後の次のクォンタムも同じクォンタム持ち時間
τ1となり、入出力グループG1の入出力要求が続いて
いる場合には、同じクォンタムτ1が継続される。
刻t0〜t2の間に同一入出力グループG1の入出力要
求が連続してクォンタムτ1,τ2がリセットにより継
続し、時刻t2までに残り2つの入出力グループG2,
G3の入出力要求が受付けられてスケジュール待ちグル
ープキュー38−2,38−3に格納されていると、次
の入出力グループG2のクォンタム持ち時間τ2への切
替えが行われる。
ォンタム持ち時間τ2の途中で入出力グループG2のス
ケジュール待ちグループキュー38−2が空になってス
テップS1で待ちキュー無しが判別されると、ステップ
S6に進み、他のクォンタムについてスケジュール待ち
グループキュー38−1,38−3に待ちの入出力があ
るか否かチェックする。
あればステップS10に進み、全てのクォンタムに未完
了の入出力があるか否かチェックし、無ければステップ
S11に進み、次の入出力グループG3のクォンタム持
ち時間τ3に切替え、次タスクをオーダードに設定し、
更に、クォンタム開始時刻T0 を予測して設定し、ステ
ップS1に戻ることで切替え後の入出力グループG3の
最初の入出力要求をオーダードでディスクドライブ24
−1にステップS1〜S4,S8の処理を通じて依頼す
ることになる。
ムアクセスについて入出力をグループ分けした場合の本
発明の実施形態のブロック図である。
びディスク装置16に設けられた本発明のディスクシェ
アリング装置は、図3の実施形態と同様、入出力要求部
18、RAID制御部26、ディスク入出力スケジュー
ル機構20、ディスク入出力処理部22及びディスクド
ライブ24−1,24−2で構成されている。
0で入出力をシーケンシャルアクセスの入出力グループ
とランダムアクセスの入出力グループにグループ分けす
るため、入出力要求部18にシーケンシャルアクセス検
出機構50を設けている。
力依頼インターフェースに、シーケンシャルアクセス検
出機構50で検出したシーケンシャルアクセスの入出力
であることを通知するインターフェースを追加してい
る。
図2に示した上位のデバイス制御装置12から発行され
た入出力コマンドに含まれるアドレスとデータ長から次
の入出力コマンドのアドレスを認識しており、次の入出
力コマンドのアドレスが予測したアドレスに一致した場
合には、シーケンシャルアクセスを検出し、シーケンシ
ャルアクセスを示すフラグなどの情報をインタフェース
によりRAID制御部26を介してディスク入出力スケ
ジュール機構20の入出力要求受付部34に発行する。
は、入出力要求部18から受付けた入出力要求につい
て、シーケンシャルアクセスかランダムアクセスかを認
識することができる。
ィスクタイムシェアリング制御情報30−1,30−2
は、ディスク装置16のディスクドライブ24−1,2
4−2に対応して設けられている。
た図示のディスクタイムシェアリング制御情報30−1
を例にとると、入出力グループをシーケンシャルアクセ
スとランダムアクセスのグループに分けていることか
ら、この2つのグループに対応してグループごとにスケ
ジュール待ちグループキュー38−1,38−2及び完
了待ちグループキュー40−1,40−2が設けられ
る。
クセスに対応してグループ用クォンタム42−1,42
−2にそれぞれのクォンタム待ち時間τ1,τ2が設定
される。それぞれの現クォンタム種別情報44、現クォ
ンタム開始時刻46、次入出力タスク種別情報48につ
いては、図3の実施形態と同様であり、それぞれディス
クドライブ24−1,24−2ごとに設定される。
力要求部18からディスク入出力スケジュール機構20
に入出力を要求する際に、シーケンシャルアクセス検出
機構50よりシーケンシャルアクセスと判断された入出
力は、ディスクタイムシェアリング制御情報30−1,
30−2におけるシーケンシャルアクセスグループのス
ケジュール待ちグループキュー38−1に格納され、ま
たそれ以外の入出力はランダムアクセスグループと判断
されてそのスケジュール待ちグループキュー38−2に
格納される。
ー38−1,38−2に格納されたシーケンシャルアク
セスの入出力要求及びまたはランダムアクセスの入出力
要求は、それぞれについて決定したクォンタム持ち時間
τ1,τ2の比率に従ったスケジュールで順番に入出力
要求がディスク装置16に送られて、タイムシェアリン
グな入出力が行なわれることになる。
ランダムアクセスとシーケンシャルアクセスが混在する
場合、図7に示した本発明のディスクタイムシェアリン
グ制御処理により、ランダムアクセス性能とシーケンシ
ャルアクセス性能の各々について、最低値保証が可能と
なる。
1つの入出力グループに対応させた本発明の実施形態の
ブロック図である。
ェアリング装置は、図3の実施形態と同様、入出力要求
部18,RAID制御部26、ディスク入出力スケジュ
ール機構20、ディスク入出力処理部22及びディスク
ドライブ24−1,24−2で構成され、図2のように
アレイディスク装置14とディスク装置16に組み込ま
れている。
24−2には、例えば4つの論理ボリューム74−1〜
74−4及び76−1〜76−4が配置されており、各
論理ボリューム74−1〜74−4,76−1〜76−
4はそれぞれ固有の性能要件として、例えばスループッ
トIOPSを割当てている。
は25IOPSであり、論理ボリューム74−3,74−4
は50IOPSとなっている。このようなディスクドライブ
24−1の論理ボリューム74−1〜74−4は入出力
要求部18に設けた論理ボリューム管理機構70で管理
されており、本発明で性能要件が同一の論理ボリューム
を1つの入出力グループに対応させるため、論理ボリュ
ーム/グループ対応表72を設けている。
は、例えばディスクドライブ24−1ついては、スルー
プットが50IOPSの論理ボリューム74−1,74−2
が入出力グループG1に対応づけられ、またスループッ
トが25IOPSの論理ボリューム74−3,74−4が入
出力グループG2に対応づけられている。
力依頼インターフェースに、論理ボリューム管理機構に
よる論理ボリューム/グループ対応表72の参照で認識
した論理グループの入出力であることを通知するインタ
ーフェースを追加している。
御部26を介してディスク入出力スケジュール機構20
に入出力要求を行なう場合、論理ボリューム管理機構7
0による論理ボリューム/グループ対応表72の参照
で、入出力要求を行なう論理ボリュームが属するグルー
プを検索し、入出力グループを示す情報と共に、入出力
要求をディスク入出力スケジュール機構20に対し行な
う。
構20の入出力要求受付部34は入出力要求部18より
入出力を受けると、これに付加されたグループ情報から
論理ボリューム74−1,74−2の入出力グループG
1か、論理ボリューム74−3,74−4の入出力グル
ープG2かを認識し、入出力グループG1にあってはデ
ィスクタイムシェアリング制御情報30−1のスケジュ
ール待ちグループキュー38−1に待ち行列として入出
力要求を格納し、入出力グループG2であれば、スケジ
ュール待ちグループキュー38−2に受付けた入出力要
求を格納する。
1,G2に対応して各グループのクォンタム待ち時間τ
1,τ2がグループ用クォンタム42−1,42−2に
設定されている。更にディスクドライブ24−1,24
−2ごとに現クォンタム種別情報44、現クォンタム開
始時刻46、更に次入出力タスク種別情報48が設定さ
れる。
リュームごとにグループ分けした場合についても、ディ
スク入出力スケジュール機構20に設けている入出力ス
ケジュール部32によるディスクタイムシェアリング制
御は図7のフローチャートに従って行なわれる。
1,24−2の各々に異なる性能要件の論理ボリューム
が混在しても、各論理ボリュームごとの入出力性能の最
低値を保証することが可能となる。
と通常処理の入出力グループにグループ分けしてディス
クタイムシェアリングを行なう本発明の実施形態のブロ
ック図である。
及びディスク装置16に適用された本発明のディスクタ
イムシェアリング装置は、図3の実施形態と同様、入出
力要求部18、RAID制御部26、ディスク入出力ス
ケジュール機構20、ディスク入出力処理部22で構成
される。
はRAID1グループ82を構成している。ここでRA
ID1はディスクドライブ24−1のデータをミラーデ
ィスクとしてのディスクドライブ24−2にコピーした
ミラー構成をもつ。
ためのリードをRAID制御部26に依頼するバックア
ップ機構78が設けられる。ここでディスク装置16に
設けているRAID1グループ82に対し、通常処理と
バックアップ処理のディスク資源の配分比率を α1:α2=10:1 に定義したと仮定する。
クドライブ24−1,24−2で構成されているため、
ディスク入出力スケジュール機構20の中に各ディスク
ドライブ24−1,24−2に対応したディスクタイム
シェアリング制御情報30−1,30−2が設定され
る。
に対応してスケジュール待ちグループキュー38−1と
完了待ちグループキュー40−1が設けられる。また通
常処理の入出力グループに対応してスケジュール待ちグ
ループキュー38−2と完了待ちグループキュー40−
2が設けられる。
−2には通常処理とバックアップ処理のディスク配分比
率α1:α2=10:1に基づき算出したクォンタム持
ち時間τ1,τ2が格納され、例えば通常入出力グルー
プについては、クォンタム待ち時間τ1=200msが
設定され、バックアップ入出力グループについてはクォ
ンタム待ち時間τ2=20msが設定される。
AID制御部26で依頼された論理入出力を物理入出力
に変換する。この時、RAID制御部26に対する入出
力依頼インターフェースにバックアップ機構78からの
入出力の場合はバックアップ入出力であることを通知す
るインターフェースを追加している。
ケジュール機構20への入出力依頼時に、通常の入出力
かバックアップの入出力かを伝える。このためディスク
入出力スケジュール機構20の入出力要求受付部34に
あっては、RAID制御部26からの入出力要求を受付
けて、バックアップ入出力か通常の入出力かを認識で
き、通常の入出力要求の受付けであれば、通常入出力グ
ループのスケジュール待ちグループキュー38−1に格
納し、バックアップ入出力であればバックアップ入出力
グループのスケジュール待ちグループキュー38−2に
格納する。
のフローチャートに従ったディスクタイムシェアリング
処理により、通常の入出力のグループとバックアップ入
出力のグループに分けてディスクタイムシェアリングを
行なう。
ドライブ24−1,24−2が、例えば4つの論理ボリ
ュームから構成されている場合、1つの論理ボリューム
をバックアップする場合でも、同時に4つの論理ボリュ
ームをバックアップする場合でも、ディスクドライブ2
4−1,24−2における資源使用時間は変わらない。
ms、τ2=20msとした場合、バックアップ処理に
20msを使用して200ms待つことを繰り返す。こ
のため、通常処理への影響はバックアップの多重度によ
らず保証する事ができる。
論理ボリュームをディスクドライブ24−2にバックア
ップする場合は、4つの論理ボリュームを同時にバック
アップする場合の4分の1の時間で完了することは勿論
である。
した場合のリビルディング処理と通常処理の入出力グル
ープに分けた場合の本発明の実施形態のブロック図であ
る。即ち、RAID構成のディスク装置における入出力
を1つの入出力グループに対応させることにより、リビ
ルディング処理とその他の処理の間でディスク装置のタ
イムシェアリングを行なう。
とディスク装置16に設けられた本発明のディスクタイ
ムシェアリング装置は、図2の実施形態と同様、入出力
要求部18,RAID制御部26、ディスク入出力スケ
ジュール機構20、ディスク入出力処理部22を持ち、
ディスクドライブ24−1,24−2によりミラー構成
をとるRAID1グループ82を構成している。
ィスクドライブ24−1,24−2において、いずれか
のディスクドライブ、例えばディスクドライブ24−2
が故障した場合には、故障したディスクドライブ24−
2を正常な装置に交換した後、ディスクドライブ24−
1のデータをディスクドライブ24−2にコピーするリ
ビルディング処理を行なう必要がある。
ング機構84が設けられ、リビルディング処理の際に
は、RAID制御部26に対する入出力要求につき、リ
ビルディング処理であることを示すインターフェースを
追加している。またRAID制御部26はディスク入出
力スケジュール機構20に入出力を依頼する際に、リビ
ルディング入出力の通知を行なう。
は、RAID1グループ82の2台のディスクドライブ
24−1,24−2に対応して、ディスクタイムシェア
リング制御情報30−1,30−2が設けられている。
例えばディスクドライブ24−1に対応したディスクタ
イムシェアリング制御情報30−1を例にとると、通常
の入出力のグループに対応してスケジュール待ちグルー
プキュー38−1と完了待ちグループキュー40−1が
設けられ、またリビルディング処理の入出力グループに
対応してスケジュール待ちグループキュー38−2と完
了待ちグループキュー40−2が設けられている。
−2には、通常処理とリビルディング処理の際のディス
ク資源配分の比率α1,α2に基づくそれぞれのクォン
タム持ち時間τ1,τ2が設定されている。更に現クォ
ンタム種別情報44、現クォンタム開始時刻46、更に
次入出力タスク種別情報48については、通常処理の入
出力グループとリビルディング処理の入出力グループご
とに設けられる。
ビルディング処理の入出力グループに分けた場合につい
ても、入出力スケジュール部32によるディスクタイム
シェアリング制御処理は図7のフローチャートに従って
行なわれる。
AID構成のディスク装置のリビルディング処理におい
て、通常処理の入出力性能への影響を押さえ、且つリビ
ルディングを完了するまでに要する時間を保証した上
で、リビルディング完了までの時間を可能な限り短縮す
る事ができる。
リング装置が適用されるストレージシステムの他の環境
を示したブロック図である。
サーバOS86に対するストレージシステムとして、ア
レイディスク装置14及びディスク装置16が設けられ
ている。この場合、本発明のディスクタイムシェアリン
グ装置は、サーバOS86に設けた入出力要求部18、
アレイディスク装置14に設けたディスク入出力スケジ
ュール機構20、更にディスク装置16に設けたディス
ク入出力処理部22とディスクドライブ24−1〜24
−nで構成される。
出力スケジュール機構20、ディスク入出力処理部22
及びディスクドライブ24−1〜24−nで構成される
本発明のディスクタイムシェアリング装置は、図3に示
した基本構成を持ち、具体的には図9〜図12のような
入出力グループに分けてディスク装置の資源を使用する
ディスクタイムシェアリングを行なうことになる。
リング装置が適用されるストレージシステムの他の例で
あり、サーバOS86にディスク装置16を接続してい
る。この場合、サーバOS86には入出力要求部18と
ディスク入出力スケジュール機構20が設けられ、ディ
スク装置16には、ディスク入出力処理部22とディス
クドライブ24−1〜24−nが設けられる。
グ装置が適用されるストレージシステムの動作環境は、
図12及び図13に限定されず、適宜の上位装置、中間
的な制御装置、更に物理デバイスのハードウエア構成を
含む。
ング装置について、図10の実施形態に従い、データベ
ースに対するランダムアクセスのOLTP業務と同時に
シーケンシャルアクセスであるバックアップのためのコ
ピー処理を実行した場合の計測結果である。
周期TcをTc=200μsに設定しており、入出力グ
ループをグループG1,G2,G3の3つに分け、それ
ぞれのディスク資源割当の比率を α1:α2:α3=90:5:5 とし、入出力グループG1にランダムアクセスの入出力
を、入出力グループG2,G3にコピー処理1、コピー
処理2を割当てている。
ープットであり、このランダムアクセスは時間的な変化
を与えるため、スループットを100IOPS,160IOP
S, 40IOPS,100IOPSと変化させ、これを約10秒
ごとに繰り返している。
対し、時刻t1でコピー処理1を起動し、その後の時刻
t2でコピー処理2を起動している。
秒当りのコピー量[MB/秒]としてコピー特性10
2,104に示す。コピー処理1,2は、いずれも単独
で(他者との競合なしで)実行すると、各々20MB/
秒のスループットを出す。本測定では、コピー処理スル
ープットとランダムアクセス応答時間のふるまいがポイ
ントとなる。
シェアリングを行なったときのランダムアクセスの平均
アクセス時間[ms]である。
でコピー処理OPC1が開始されると、この時、ランダ
ムアクセス特性100のIOPSスループットは少ない事か
ら、コピー特性102のデータスループットは大きく上
昇する(14MB/秒)。続いてランダムアクセス特性
100が増加すると、これに伴ってコピー特性102の
スループットが減少する(5MB/秒)。
され、同時に2つのコピー処理1,2の多重コピー処理
となっている。このようなランダムアクセス及び2つの
コピー処理の入出力要求が競合する状態にあっても、ラ
ンダムアクセスの平均アクセス時間特性106は、時刻
t1で最初のコピー処理OPC1が始まると、それまで
のアクセス時間より若干立ち上がるが、最大アクセス時
間は40ms以内に押さえられる。
始されても、急激なランダムアクセスのアクセス時間の
増加は見られず、本発明によるディスクタイムシェアリ
ングによる性能保証が確認できる。
けとしてランダムアクセスとシーケンシャルアクセスの
入出力グループ、同一性能要件の論理ボリューム毎のグ
ループ分け、バックアップ処理やコピー処理によるグル
ープ分け、RAIDのリビルディング処理によるグルー
プ分けを例にとるものであったが、これら以外の入出力
性能の最低値保証が必要とする異なった入出力について
グループ分けを行なってもよいことは勿論である。
ドライブのオーダード機能を活用する際の入出力要求の
依頼として、シンプルタスクとオーダードタスクを使い
分ける場合を例にとるものであったが、本発明はこれに
限定されず、リオーダード機能を持たないディスクドラ
イブについても検証する事ができる。
ムシェアリング制御情報に設けている次入出力タスク種
別情報48を除き、また図8のタイムシェアリング制御
処理のフローチャートにあっては、ステップS8,S
9,S10におけるタスクの設定変更が不要となる。
値による限定は受けず、更に本発明の目的と利点を損な
わない範囲で適宜の変形を含む。
ば、同じディスク装置に対する様々な入出力要求に対
し、入出力要求の性質などに基づいてグループ分けし、
複数の入出力グループの入出力が競合した場合には、各
グループごとに予め定義したクォンタム(割当時間)を
順に切替えてディスク装置を使用させるディスクタイム
シェアリングを行なうことで、各入出力グループごとに
それぞれの入出力性能の最低値を保証することが可能と
なる。
し、ランダムアクセスとシーケンシャルアクセスが混在
する場合、ランダムアクセスとシーケンシャルアクセス
に分けた入出力グループに分けてディスクタイムシェア
リングを行なうことで、ランダムアクセスの入出力性能
とシーケンシャルアクセスの入出力性能の各々の最低値
を保証することが可能となる。
論理ボリュームが混在する場合、同じ性能要件で論理ボ
リュームをグループ分けしてディスクタイムシェアリン
グを行なうことで各論理ボリューム毎の入出力性能の最
低値の保証が可能となる。
のバックアップ処理やコピー処理が動作する場合、バッ
クアップ処理やコピー処理の入出力グループとそれ以外
の通常処理の入出力グループに分けてディスクタイムシ
ェアリングを行なうことでバックアップ処理やコピー処
理の多重度によらず、バックアップ処理やコピー処理以
外の通常の入出力について入出力性能の保証が可能とな
る。
クを故障した際に正常なディスクからデータをコピーす
るリビルディング処理において、リビルディング処理の
入出力のグループとそれ以外の通常処理の入出力のグル
ープに分けてディスクタイムシェアリングを行なうこと
で、リビルディング処理による通常の入出力処理の性能
への悪影響を押さえ、同時にリビルディング完了迄に要
する時間を保証した上で、リビルディング完了までの時
間を可能な限り短縮する事ができる。
イムシェアリングにおいて、ディスク装置が受付けた入
出力要求の中からポジショニング時間が最小となる入出
力から実行するリオーダリング機能をもつ場合、入出力
グループのタイムシェアリングの切替え、即ちクォンタ
ムの切替え時、最初の入出力要求については、切替え前
の前クォンタムで完了していない入出力を全て完了させ
た後にクォンタム切替え後の最初の入出力を行なわせる
オーダードタスクで入出力を依頼し、それ以外について
は、ポジショニング時間を最小とする入出力を選択する
シンプルタスクを指定する事で、ディスク装置の持つオ
ーダリング機能を最大限に生かし、且つオーダリング機
能で必要以上に入出力が待ちとなる遅れをクォンタム切
替えで規制することで最大応答時間の延長を防止する事
ができる尚、本発明の他の特徴を列挙すると次のように
なる。 A.請求項1に関する特徴 (1)請求項1記載のディスク・タイムシェアリング装
置に於いて、入出力スケジュール機構は、シーケンシャ
ルアクセスと判断された入出力はシーケンシャルアクセ
ス入出力グループに、それ以外の入出力はランダムアク
セス入出力グループに対応させ、シーケンシャルアクセ
スとランダムアクセスでディスク装置のタイムシェアリ
ングを行うことを特徴とする。 (2)請求項1記載のディスク・タイムシェアリング装
置に於いて、入出力スケジュール機構は、性能要件が同
一となる複数の論理ボリュームを1つの入出力グループ
に対応させ、性能要件が異なる論理ボリューム群間でデ
ィスク装置のタイムシェアリングを行うことを特徴とす
る。 (3)請求項1記載のディスク・タイムシェアリング装
置に於いて、入出力スケジュール機構は、コピー及びバ
ックアップ処理の入出力を1つの入出力グループに対応
させ、コピー及びバックアップ処理とその他の処理の間
でディスク装置のタイムシェアリングを行うことを特徴
とする。 (4)請求項1記載のディスク・タイムシェアリング装
置に於いて、ディスク装置は、複数のディスクドライブ
を備え、1つのディスクドライブか故障しても他のディ
スクドライブからデータを復元して再構築可能なRAI
D構成であり、入出力スケジュール機構は、RAID構
成をとる前記ディスク装置の再構築処理の入出力を1つ
の入出力グループに対応させ、再構築処理とその他の処
理の間で前記ディスク装置のタイムシェアリングを行う
ことを特徴とする。 (5)請求項1記載のディスク・タイムシェアリング装
置に於いて、ディスク装置は、第1タスクの指定でポジ
ショニング時間を最小とするように複数の入出力をスケ
ジューリングし、第2タスクの指定で受付け中の入出力
を完了させた後に第2タクス指定の入出力をスケジュー
リングするオーダ・タスク機能を備え、入出力スケジュ
ール機構は、ディスク装置のタイムシェアリングを行う
際に、第1タスクの指定と第2タスクの指定を分けてス
ケジューリングすることを特徴とする。 (6)前記(7)記載のディスク・タイムシェアリング
装置に於いて、入出力スケジュール機構は、複数の入出
力グループ間でディスク装置を順番に使用するタイムシ
ェアリングを行う際に、入出力グループを切替えた直後
の最初の入出力は第2タスクを指定して切替前のグルー
プの入出力を完了させた後に切替後のグループの入出力
をスケジューリングし、その後、次のグループを切替え
るまでの入出力は第1タスクで指定してポジショニング
時間を最小とするように複数の入出力をスケジューリン
グすることを特徴とする。 (7)前記(6)記載のディスク・タイムシェアリング
装置に於いて、入出力スケジュール機構は、クォンタム
切替時に未処理入出力の予測処理時間に基づいて次のク
ォンタム開始時刻を予測し、入出力要求の受付け又は入
出力要求の完了応答毎に、その時の未処理入出力の予測
処理時間と前記クォンタム開始時刻に基づいて残り時間
を予測し、残り時間があると判断した場合は、現クォン
タムの入出力要求をディスク装置に投入し、残り時間が
ないと判断した場合は次のクォンタムに切替えることを
特徴とする。 (8)前記(5)記載のディスク・タイムシェアリング
装置に於いて、入出力スケジュール機構は、1つの入出
力グループからの入出力に対しディスク装置を連続して
使用する場合、割当時間をリセットした直後の最初の入
出力は第2タスクを指定してリセット前の入出力を完了
させた後にリセット後の入出力をスケジューリングし、
次にリセットするまでの入出力は第1タスクで指定して
ポジショニング時間を最小とするように複数の入出力を
スケジューリングすることを特徴とする。 B.請求項3に関する特徴 (1)請求項3記載のディスク・タイムシェアリング方
法に於いて、シーケンシャルアクセスと判断された入出
力はシーケンシャルアクセス入出力グループに、それ以
外の入出力はランダムアクセス入出力グループに対応さ
せ、シーケンシャルアクセスとランダムアクセスでディ
スク装置のタイムシェアリングを行うことを特徴とす
る。 (2)請求項3記載のディスク・タイムシェアリング方
法に於いて、性能要件が同一となる複数の論理ボリュー
ムを1つの入出力グループに対応させ、性能要件が異な
る論理ボリューム群間でディスク装置のタイムシェアリ
ングを行うことを特徴とする。 (3)請求項3記載のディスク・タイムシェアリング方
法に於いて、コピー及びバックアップ処理の入出力を1
つの入出力グループに対応させ、コピー及びバックアッ
プ処理とその他の処理の間でディスク装置のタイムシェ
アリングを行うことを特徴とする。 (4)請求項3記載のディスク・タイムシェアリング方
法に於いて、ディスク装置は、複数のディスクドライブ
を備え、1つのディスクドライブか故障しても他のディ
スクドライブからデータを復元して再構築可能なRAI
D構成であり、RAID構成をとるディスク装置の再構
築処理の入出力を1つの入出力グループに対応させ、再
構築処理とその他の処理の間で前記ディスク装置のタイ
ムシェアリングを行うことを特徴とする。 (5)請求項11記載のディスク・タイムシェアリング
方法に於いて、ディスク装置は、第1タスクの指定でポ
ジショニング時間を最小とするように複数の入出力をス
ケジューリングし、第2タスクの指定で受付け中の入出
力を完了させた後に第2タクス指定の入出力をスケジュ
ーリングするオーダ・タスク機能を備え、ディスク装置
のタイムシェアリングを行う際に、前記第1タスクの指
定と第2タスクの指定を分けてスケジューリングするこ
とを特徴とする。 (6)前記(5)記載のディスク・タイムシェアリング
方法に於いて、複数の入出力グループ間でディスク装置
を順番に使用するタイムシェアリングを行う際に、入出
力グループを切替えた直後の最初の入出力は第2タスク
を指定して切替前のグループの入出力を完了させた後に
切替後のグループの入出力をスケジューリングし、次に
グループを切替えるまでの入出力は第1タスクで指定し
てポジショニング時間を最小とするように複数の入出力
をスケジューリングすることを特徴とする。 (7)前記(6)記載のディスク・タイムシェアリング
方法に於いて、クォンタム切替時に未処理入出力の予測
処理時間に基づいて次のクォンタム開始時刻を予測し、
入出力要求の受付け又は入出力要求の完了応答毎に、そ
の時の未処理入出力の予測処理時間と前記クォンタム開
始時刻に基づいて残り時間を予測し、残り時間があると
判断した場合は、現クォンタムの入出力要求をディスク
装置に投入し、残り時間がないと判断した場合は次のク
ォンタムに切替えることを特徴とする。 (8)前記(5)記載のディスク・タイムシェアリング
方法に於いて、1つの入出力グループからの入出力に対
しディスク装置を連続して使用する場合、割当て時間を
リセットした直後の最初の入出力は第2タスクを指定し
てリセット前の入出力を完了させた後にリセット後の入
出力をスケジューリングし、次にリセットするまでの入
出力は第1タスクで指定してポジショニング時間を最小
とするように複数の入出力をスケジューリングすること
を特徴とする。
ック図
的な実施形態の機能ブロック図
した場合のディスク・タイムシェアリング処理のスケジ
ュール説明図
場合のディスク・タイムシェアリング処理のスケジュー
ル説明図
明図
ローチャート
入出力グループに対応した本発明の実施形態の機能ブロ
ック図
発明の実施形態の機能ブロック図
力グループに対応した本発明の実施形態の機能ブロック
図
ープに対応した本発明の実施形態の機能ブロック図
適用されるた他のシステム構成図
スケジュール機構を設けた本発明が適用されるた他のシ
ステム構成図
するランダムアクセスのOLTP業務と同時にシーケン
シャルアクセスであるバックアップのためのコピー処理
を実行した場合の計測結果の特性図
Claims (4)
- 【請求項1】1又は複数のディスクドライブを備えたデ
ィスク装置と、 前記ディスク装置に入出力要求を発行する入出力要求部
と、 ディスク装置への入出力元を入出力要求の性質に基づい
てグループ化した入出力グループを形成すると共に各入
出力グループがディスクを使用する時間の比率を定義
し、定義された時間比率に基づき各入出力グループが連
続してディスク装置を使用できる割当時間(クォンタ
ム)を決定し、複数の入出力グループからディスク装置
に入出力の依頼を受け付けている場合、競合した入出力
グループ間で前記割当時間を順番に切り替えてディスク
装置を使用するタイムシェアリングを行う入出力スケジ
ュール機構と、 を備えたことを特徴とする入出力装置。 - 【請求項2】請求項1記載の入出力装置に於いて、前記
入出力スケジュール機構は、1つの入出力グループから
のみ入出力の依頼のある場合は、1つの入出力グループ
からの入出力に対しディスク装置を連続して使用可能と
することを特徴とする入出力装置。 - 【請求項3】1又は複数のディスクドライブを備えたデ
ィスク装置と、前記ディスク装置に入出力要求を発行す
る入出力要求部と、前記入出力に基づいて前記ディスク
装置の使用をスケジューリングする入出力スケジュール
機構とを備えたディスク・タイムシェアリング方法に於
いて、 前記ディクス装置への入出力元を入出力要求の性質に基
づいてグループ化した入出力グループを形成すると共に
各入出力グループがディスクを使用する時間の比率を定
義し、 定義された時間比率に基づき各入出力グループが連続し
てディスク装置を使用できる割当時間(クォンタム)を
決定し、 複数の入出力グループからディスク装置に入出力の依頼
を受け付けている場合、競合した入出力グループ間で前
記割当時間を順番に切り替えてディスク装置を使用する
タイムシェアリングを行う、 ことを特徴とするディスク・タイムシェアリング方法。 - 【請求項4】請求項3記載のディスク・タイムシェアリ
ング方法に於いて、1つの入出力グループからのみ入出
力の依頼のある場合は、1つの入出力グループからの入
出力に対しディスク装置を連続して使用可能とすること
を特徴とするディスクタイ・タイムシエアリング方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP21875799A JP3440219B2 (ja) | 1999-08-02 | 1999-08-02 | 入出力装置及びディスク・タイムシェアリング方法 |
US09/495,878 US6480904B1 (en) | 1999-08-02 | 2000-02-02 | Disk-time-sharing apparatus and method |
EP00102559A EP1074908B1 (en) | 1999-08-02 | 2000-02-07 | Disk time-sharing apparatus and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP21875799A JP3440219B2 (ja) | 1999-08-02 | 1999-08-02 | 入出力装置及びディスク・タイムシェアリング方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001043032A JP2001043032A (ja) | 2001-02-16 |
JP3440219B2 true JP3440219B2 (ja) | 2003-08-25 |
Family
ID=16724937
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP21875799A Expired - Fee Related JP3440219B2 (ja) | 1999-08-02 | 1999-08-02 | 入出力装置及びディスク・タイムシェアリング方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US6480904B1 (ja) |
EP (1) | EP1074908B1 (ja) |
JP (1) | JP3440219B2 (ja) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3440219B2 (ja) * | 1999-08-02 | 2003-08-25 | 富士通株式会社 | 入出力装置及びディスク・タイムシェアリング方法 |
US6647458B1 (en) * | 2000-04-04 | 2003-11-11 | Emc Corporation | Benchmark tool write analysis for a mass storage system |
US6732232B2 (en) * | 2001-11-26 | 2004-05-04 | International Business Machines Corporation | Adaptive resource allocation in multi-drive arrays |
US7734867B1 (en) * | 2002-05-17 | 2010-06-08 | Hewlett-Packard Development Company, L.P. | Data storage using disk drives in accordance with a schedule of operations |
EP1418506A3 (en) * | 2002-11-08 | 2005-10-12 | Matsushita Electric Industrial Co., Ltd. | Data storing system and transmission control method |
JP4633334B2 (ja) * | 2003-01-27 | 2011-02-16 | パナソニック株式会社 | 情報処理装置およびメモリアクセス調停方法 |
JP4322068B2 (ja) * | 2003-03-07 | 2009-08-26 | 富士通株式会社 | ストレージシステム及びそのデイスク負荷バランス制御方法 |
US7330910B2 (en) * | 2004-05-20 | 2008-02-12 | International Business Machines Corporation | Fencing of resources allocated to non-cooperative client computers |
JP4472617B2 (ja) * | 2005-10-28 | 2010-06-02 | 富士通株式会社 | Raidシステム、raidコントローラ及びそのリビルド/コピーバック処理方法 |
US20080282245A1 (en) * | 2007-05-08 | 2008-11-13 | International Business Machines Corporation | Media Operational Queue Management in Storage Systems |
US8090903B2 (en) * | 2008-01-18 | 2012-01-03 | Microsoft Corporation | Fair and dynamic disk input/output bandwidth distribution |
JP2011081580A (ja) * | 2009-10-07 | 2011-04-21 | Hitachi Ltd | 計算機システム及び計算機システムの入出力方法 |
JP2012221340A (ja) | 2011-04-12 | 2012-11-12 | Fujitsu Ltd | 制御方法及びプログラム、並びにコンピュータ |
US9569312B2 (en) * | 2011-09-27 | 2017-02-14 | Xcube Research And Development, Inc. | System and method for high-speed data recording |
JP5853569B2 (ja) | 2011-10-12 | 2016-02-09 | 富士通株式会社 | 制御方法及びプログラム、並びにコンピュータ |
JP2013164820A (ja) * | 2012-02-13 | 2013-08-22 | Fujitsu Ltd | 評価支援方法、評価支援プログラムおよび評価支援装置 |
JP5958020B2 (ja) * | 2012-03-30 | 2016-07-27 | 富士通株式会社 | ストレージシステム |
WO2014132099A1 (en) * | 2013-02-28 | 2014-09-04 | Hitachi, Ltd | Management system and method of dynamic storage service level monitoring |
JP2015132987A (ja) * | 2014-01-14 | 2015-07-23 | 富士通株式会社 | 情報処理装置,データコピー処理管理方法及びデータコピー処理管理プログラム |
US10235248B1 (en) * | 2017-04-27 | 2019-03-19 | EMC IP Holding Company LLC | Processing I/O operations in parallel while maintaining read/write consistency using range and priority queues in a data protection system |
US11748207B2 (en) * | 2021-09-27 | 2023-09-05 | Rubrik, Inc. | Scalable group backup in relational databases |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5581784A (en) | 1992-11-17 | 1996-12-03 | Starlight Networks | Method for performing I/O's in a storage system to maintain the continuity of a plurality of video streams |
JPH08147234A (ja) * | 1994-11-17 | 1996-06-07 | Fujitsu Ltd | ストリーム処理装置及び方法 |
US5644789A (en) | 1995-01-19 | 1997-07-01 | Hewlett-Packard Company | System and method for handling I/O requests over an interface bus to a storage disk array |
JP3426385B2 (ja) * | 1995-03-09 | 2003-07-14 | 富士通株式会社 | ディスク制御装置 |
JP3201219B2 (ja) * | 1995-05-29 | 2001-08-20 | 三菱電機株式会社 | 入出力処理システム |
US5778426A (en) * | 1995-10-23 | 1998-07-07 | Symbios, Inc. | Methods and structure to maintain a two level cache in a RAID controller and thereby selecting a preferred posting method |
US5734861A (en) * | 1995-12-12 | 1998-03-31 | International Business Machines Corporation | Log-structured disk array with garbage collection regrouping of tracks to preserve seek affinity |
JPH11120685A (ja) * | 1997-10-09 | 1999-04-30 | Fujitsu Ltd | ディスク装置 |
JP3440219B2 (ja) * | 1999-08-02 | 2003-08-25 | 富士通株式会社 | 入出力装置及びディスク・タイムシェアリング方法 |
-
1999
- 1999-08-02 JP JP21875799A patent/JP3440219B2/ja not_active Expired - Fee Related
-
2000
- 2000-02-02 US US09/495,878 patent/US6480904B1/en not_active Expired - Lifetime
- 2000-02-07 EP EP00102559A patent/EP1074908B1/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
US6480904B1 (en) | 2002-11-12 |
JP2001043032A (ja) | 2001-02-16 |
EP1074908A3 (en) | 2002-03-27 |
EP1074908A2 (en) | 2001-02-07 |
EP1074908B1 (en) | 2012-07-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3440219B2 (ja) | 入出力装置及びディスク・タイムシェアリング方法 | |
JP4922496B2 (ja) | I/o要求に優先順位を与える方法 | |
US6957433B2 (en) | System and method for adaptive performance optimization of data processing systems | |
JP4921054B2 (ja) | 負荷分散制御システム及び負荷分散制御方法 | |
EP0384635B1 (en) | Adaptive job scheduling for multiprocessing systems | |
EP0768599B1 (en) | On-line disk array reconfiguration | |
JP4219602B2 (ja) | 記憶制御装置および記憶制御装置の制御方法 | |
KR20120109533A (ko) | 쿼리 관리 | |
JPH09319528A (ja) | データ記憶システムにおけるデータの再配置方法、そのシステムに記憶されたデータのアクセス方法及びデータ記憶システム | |
JP3623697B2 (ja) | ディスク・タイムシェアリング装置及び方法 | |
JP4091225B2 (ja) | ディスク・タイムシェアリング装置及び方法 | |
JP5584422B2 (ja) | 情報処理装置,スケジュール管理装置,スケジュール管理方法およびスケジュール管理プログラム | |
JP2002023962A (ja) | ディスク装置及び制御方法 | |
JP6056856B2 (ja) | ストレージ制御装置、情報処理装置、ストレージ制御プログラム、及びストレージ制御方法 | |
JPH09258907A (ja) | 複数の記憶ディスク部を有した高可用性の外部記憶装置 | |
CN117806540A (zh) | 储存装置控制器及储存装置控制器的方法 | |
US9164885B2 (en) | Storage control device, storage control method, and recording medium | |
JP6010975B2 (ja) | ジョブ管理装置、ジョブ管理方法、及びプログラム | |
US10824425B2 (en) | Selecting destination for processing management instructions based on the processor buffer size and uncompleted management instructions | |
JP6115575B2 (ja) | データセット多重度変更装置、サーバ、データセット多重度変更方法、およびコンピュータ・プログラム | |
EP3293625B1 (en) | Method and device for accessing file, and storage system | |
CN102576294A (zh) | 含有多个存储装置的存储系统、方法及程序 | |
JP6836536B2 (ja) | ストレージシステム及びio処理の制御方法 | |
CN119415044B (zh) | 一种raid1磁盘阵列读操作的选盘方法及系统 | |
JPH05108274A (ja) | 並列デイスク制御方法および並列デイスク制御装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20030513 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090613 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100613 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110613 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120613 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120613 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130613 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140613 Year of fee payment: 11 |
|
LAPS | Cancellation because of no payment of annual fees |