JP6303584B2 - データ処理装置、計算機システム、データ処理方法およびデータ処理プログラム - Google Patents
データ処理装置、計算機システム、データ処理方法およびデータ処理プログラム Download PDFInfo
- Publication number
- JP6303584B2 JP6303584B2 JP2014031596A JP2014031596A JP6303584B2 JP 6303584 B2 JP6303584 B2 JP 6303584B2 JP 2014031596 A JP2014031596 A JP 2014031596A JP 2014031596 A JP2014031596 A JP 2014031596A JP 6303584 B2 JP6303584 B2 JP 6303584B2
- Authority
- JP
- Japan
- Prior art keywords
- transfer
- band
- file
- bandwidth
- staging
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
(構成)
次に、図2を用いて、本発明の第1の実施形態に係るデータ処理装置1(スケジューラとも呼ぶ)の機能構成について詳細に説明する。
ジョブアサイン手段10は、ジョブの実行開始時間を決定する。
ファイルステージングアサイン手段20は、ファイルステージング処理の転送時間と帯域を決定する。
帯域スケジューラマップ管理手段30は、帯域と時間を軸にした二次元マップ(以降、帯域スケジューラマップ)により、帯域の使用予定時間を管理する。帯域スケジューラマップは、データ処理装置1の起動時に作成される。帯域スケジューラマップは、ファイルステージング処理において複数のジョブのそれぞれが占有する帯域を第1の軸とし、複数のジョブのそれぞれが帯域を占有する時間を第2の軸とする。なお、帯域スケジューラマップは、帯域スケジューラマップ管理手段30に格納されていてもよく、帯域スケジューラマップ管理手段30とは異なるメモリ上の領域に展開されていてもよい。
帯域制御手段40は、ファイルステージング処理において、帯域スケジューラマップに従ってステージング帯域を制御する。
次に、図4〜図6を参照して本発明の第1の実施形態に係るデータ処理装置1の動作について詳細に説明する。図4は本発明の第1の実施形態に係るデータ処理装置1の動作を説明するためのフローチャートである。図5は、図4のフローチャートを動作主体となる構成要素を明確に示すとともに、構成要素間のデータのやり取りを明確にするためのシークエンス図である。図6は、本発明の実施形態に係るデータ処理装置1の帯域スケジューラマップ管理手段30によって管理される帯域スケジューラマップの一例である。
次に、本発明の第2の実施形態に係るデータ処理装置5(データ処理装置)の構成について図7を参照して詳細に説明する。
第2の実施形態に係るデータ処理装置5(図7)の構成は、ファイルステージング処理において現時点の転送量(実績)を帯域スケジューラマップに反映する転送実績反映手段50が追加されている点が、第1の実施形態に係るデータ処理装置1(図2)とは異なる。図7において、ジョブアサイン手段10、ファイルステージング処理手段20および転送実績反映手段50、は決定手段2(図1)を構成する。また、帯域スケジューラマップ管理手段30は管理手段3(図1)に相当し、帯域制御手段40は制御手段4に相当する。
第2の実施形態に係るデータ処理装置5の動作は、図8のステップS207以降が、第1の実施形態に係るデータ処理装置1の動作とは異なる。帯域アサイン確保手段26によって領域が確保できなかった場合(ステップS206でNo)、図8のように、帯域スケジューラマップを最適化(実績反映)することによって空き領域を増やす。なお、図8のステップS201〜S206は、図4のステップS1〜S6と同じであるため、説明は省略する。
帯域スケジューラマップの最適化を行うためには、転送実績取得手段51を呼び出す。転送実績取得手段51は、ファイルステージング処理中の転送実績情報を収集し、収集した転送実績情報を転送実績登録手段52に通知する(ステップS207)。
次に、本発明の第3の実施形態に係るデータ処理装置6(データ処理装置)の構成について図11を参照して詳細に説明する。
第3の実施形態に係るデータ処理装置6の動作は、図10のステップS307以降が、第1の実施形態に係るデータ処理装置1の動作とは異なる。帯域アサイン確保手段26によって領域が確保できなかった場合(ステップS306でNo)、図10のように、帯域クラスの使用帯域比率を変更することによって空き領域を増やす。なお、図10のステップS301〜S306は、図4のステップS1〜S6と同じであるため、説明は省略する。
帯域クラス内の帯域借用を行うためには、余剰帯域検索手段43を呼び出す。
図11は、本発明の実施形態に係るデータ処理装置を含む計算機システム(クラスタシステム100)の一例の概念図である。
10 ジョブアサイン手段
11 予定実行時刻決定手段
20 ファイルステージングアサイン手段
21 予定転送終了時刻決定手段
22 帯域クラス決定手段
23 予定転送開始時刻決定手段
24 転送予定量取得手段
25 転送速度決定手段
26 帯域アサイン確保手段
30 帯域スケジューラマップ管理手段
31 帯域クラス設定情報記憶手段
32 転送予定情報記憶手段
40 帯域制御手段
41 ステージング帯域設定手段
42 帯域クラス設定手段
43 余剰帯域検索手段
50 転送実績反映手段
51 転送実績取得手段
52 転送実績登録手段
100 クラスタシステム
101 計算機ノード
102 ローカルファイルシステム
103 グローバルファイルシステム
Claims (10)
- ローカルファイルシステムとグローバルファイルシステムとの間でジョブファイルの転送を実行するファイルステージング処理に使用する帯域であるステージング帯域を決定する決定手段と、
帯域と時間とを2つの軸とする2次元マップである帯域スケジューラマップに基づいて帯域の使用予定時間を管理する管理手段と、
前記帯域スケジューラマップに基づいて帯域を制御する制御手段とを備え、
前記管理手段は、
前記ファイルステージング処理で使用する帯域に割り当てられた複数の帯域クラスの帯域比率情報をもつ帯域クラス設定情報を格納する帯域クラス設定情報記憶手段と、
前記ファイルステージング処理における予定転送終了時刻、ジョブファイルの転送予定量および転送実績量を含む転送予定情報を格納する転送予定情報記憶手段とを有し、
前記決定手段は、
ジョブの実行開始時刻を決定し、
前記実行開始時刻から予定転送終了時刻を決定し、
前記ジョブの実行ノード数と前記ファイルステージング処理の種類から使用する前記帯域クラスを決定し、
前記ステージング帯域を確保できる予定転送開始時刻を決定し、
前記転送予定情報記憶手段から前記転送予定量を取得し、
ジョブファイルの転送時間と転送量から転送速度を決定し、
前記ファイルステージング処理に必要な領域を前記転送予定情報記憶手段に確保し、
前記制御手段は、
前記帯域スケジューラマップに従って前記ファイルステージング処理で使用している帯域を設定・変更するデータ処理装置。 - 前記管理手段は、
前記ファイルステージング処理において複数の前記ジョブのそれぞれが占有する帯域と、前記複数のジョブのそれぞれが帯域を占有する時間とを対応させた前記帯域スケジューラマップによって帯域の前記使用予定時間を管理する請求項1に記載のデータ処理装置。 - 前記決定手段は、
前記ジョブの前記実行開始時刻を決定するジョブアサイン手段と、
前記ファイルステージング処理における前記ジョブファイルの転送時間および前記ステージング帯域を決定するファイルステージングアサイン手段とを備え、
前記管理手段は、
前記帯域スケジューラマップによって帯域の前記使用予定時間を管理する帯域スケジューラマップ管理手段を備え、
前記制御手段は、
前記帯域スケジューラマップに従って前記ステージング帯域を制御する帯域制御手段を備える請求項1に記載のデータ処理装置。 - ローカルファイルシステムとグローバルファイルシステムとの間でジョブファイルの転送を実行するファイルステージング処理に使用する帯域であるステージング帯域を決定する決定手段と、
帯域と時間とを2つの軸とする2次元マップである帯域スケジューラマップに基づいて帯域の使用予定時間を管理する管理手段と、
前記帯域スケジューラマップに基づいて帯域を制御する制御手段とを備え、
前記決定手段は、
ジョブの実行開始時刻を決定するジョブアサイン手段と、
前記ファイルステージング処理におけるジョブファイルの転送時間および前記ステージング帯域を決定するファイルステージングアサイン手段とを備え、
前記管理手段は、
前記帯域スケジューラマップによって帯域の使用予定時間を管理する帯域スケジューラマップ管理手段を備え、
前記制御手段は、
前記帯域スケジューラマップに従って前記ステージング帯域を制御する帯域制御手段を備え、
前記ジョブアサイン手段は、
前記ジョブの前記実行開始時刻を決定する予定実行時刻決定手段を有し、
前記帯域スケジューラマップ管理手段は、
前記ファイルステージング処理で使用する帯域に割り当てられた複数の帯域クラスの帯域比率情報をもつ帯域クラス設定情報を格納する帯域クラス設定情報記憶手段と、
前記ファイルステージング処理における予定転送終了時刻、ジョブファイルの転送予定量および転送実績量を含む転送予定情報を格納する転送予定情報記憶手段とを有し、
前記ファイルステージングアサイン手段は、
前記予定実行時刻決定手段からの通知を受けて前記実行開始時刻から前記予定転送終了時刻を決定する予定転送終了時刻決定手段と、
前記ジョブの実行ノード数と前記ファイルステージング処理の種類から使用する前記帯域クラスを決定する帯域クラス決定手段と、
前記ステージング帯域を確保できる予定転送開始時刻を決定する予定転送開始時刻決定手段と、
前記転送予定情報記憶手段から前記転送予定量を取得する転送予定量取得手段と、
ジョブファイルの転送時間と転送量から転送速度を決定する転送速度決定手段と、
前記ファイルステージング処理に必要な領域を前記転送予定情報記憶手段に確保する帯域アサイン確保手段とを有し、
前記帯域制御手段は、
前記ファイルステージング処理で使用している帯域を設定・変更するステージング帯域設定手段を有するデータ処理装置。 - 前記ファイルステージング処理における前記転送実績量を前記帯域スケジューラマップに反映する転送実績反映手段を備える請求項4に記載のデータ処理装置。
- 前記転送実績反映手段は、
外部の帯域制御装置から前記転送実績量を取得する転送実績取得手段と、
前記転送実績取得手段によって取得された前記転送実績量を前記転送予定情報記憶手段に登録する転送実績量登録手段とを有する請求項5に記載のデータ処理装置。 - 前記帯域制御手段は、
前記帯域クラスごとに設定されている帯域比率を設定・変更する帯域クラス設定手段と、
前記転送予定情報記憶手段に格納された前記転送予定情報から前記帯域クラスの余剰領域を検索する余剰帯域検索手段とを有する請求項4乃至6のいずれか一項に記載のデータ処理装置。 - 複数の計算機ノードと、
前記複数の計算機ノードが実行するジョブをジョブファイルとして格納するグローバルファイルシステムと、
前記グローバルファイルシステムと前記計算機ノードとの間で前記ジョブを実行できる形で前記ジョブファイルを一時保存するローカルファイルシステムと、
前記ローカルファイルシステムと前記グローバルファイルシステムとの間で前記ジョブファイルの転送を実行するファイルステージング処理に使用する帯域であるステージング帯域を決定する決定手段と、帯域と時間とを2つの軸とする2次元マップである帯域スケジューラマップに基づいて帯域の使用予定時間を管理する管理手段と、前記帯域スケジューラマップに基づいて前記ステージング帯域を制御する制御手段とを備えるデータ処理装置とを備え、
前記管理手段は、
前記ファイルステージング処理で使用する帯域に割り当てられた複数の帯域クラスの帯域比率情報をもつ帯域クラス設定情報を格納する帯域クラス設定情報記憶手段と、
前記ファイルステージング処理における予定転送終了時刻、前記ジョブファイルの転送予定量および転送実績量を含む転送予定情報を格納する転送予定情報記憶手段とを有し、
前記決定手段は、
前記ジョブの実行開始時刻を決定し、
前記実行開始時刻から予定転送終了時刻を決定し、
前記ジョブの実行ノード数と前記ファイルステージング処理の種類から使用する前記帯域クラスを決定し、
前記ステージング帯域を確保できる予定転送開始時刻を決定し、
前記転送予定情報記憶手段から前記転送予定量を取得し、
ジョブファイルの転送時間と転送量から転送速度を決定し、
前記ファイルステージング処理に必要な領域を前記転送予定情報記憶手段に確保し、
前記制御手段は、
前記帯域スケジューラマップに従って前記ファイルステージング処理で使用している帯域を設定・変更する計算機システム。 - コンピュータが、
ローカルファイルシステムとグローバルファイルシステムとの間でジョブファイルの転送を実行するファイルステージング処理に使用する帯域であるステージング帯域を決定し、
帯域と時間とを2つの軸とする2次元マップである帯域スケジューラマップに基づいて帯域の使用予定時間を管理し、
前記帯域スケジューラマップに基づいて前記ステージング帯域を制御するデータ処理方法であって、
前記ファイルステージング処理で使用する帯域に割り当てられた複数の帯域クラスの帯域比率情報をもつ帯域クラス設定情報を帯域クラス設定情報記憶手段に格納し、
前記ファイルステージング処理における予定転送終了時刻、ジョブファイルの転送予定量および転送実績量を含む転送予定情報を転送予定情報記憶手段に格納し、
ジョブの実行開始時刻を決定し、
前記実行開始時刻から予定転送終了時刻を決定し、
前記ジョブの実行ノード数と前記ファイルステージング処理の種類から使用する前記帯域クラスを決定し、
前記ステージング帯域を確保できる予定転送開始時刻を決定し、
前記転送予定情報記憶手段から前記転送予定量を取得し、
ジョブファイルの転送時間と転送量から転送速度を決定し、
前記ファイルステージング処理に必要な領域を前記転送予定情報記憶手段に確保し、
前記帯域スケジューラマップに従って前記ファイルステージング処理で使用している帯域を設定・変更するデータ処理方法。 - ローカルファイルシステムとグローバルファイルシステムとの間でジョブファイルの転送を実行するファイルステージング処理に使用する帯域であるステージング帯域を決定する処理と、
帯域と時間とを2つの軸とする2次元マップである帯域スケジューラマップに基づいて帯域の使用予定時間を管理する処理と、
前記帯域スケジューラマップに基づいて前記ステージング帯域を制御する処理とをコンピュータに実行させるデータ処理プログラムであって、
前記ファイルステージング処理で使用する帯域に割り当てられた複数の帯域クラスの帯域比率情報をもつ帯域クラス設定情報を帯域クラス設定情報記憶手段に格納する処理と、
前記ファイルステージング処理における予定転送終了時刻、ジョブファイルの転送予定量および転送実績量を含む転送予定情報を転送予定情報記憶手段に格納する処理と、
ジョブの実行開始時刻を決定する処理と、
前記実行開始時刻から予定転送終了時刻を決定する処理と、
前記ジョブの実行ノード数と前記ファイルステージング処理の種類から使用する前記帯域クラスを決定する処理と、
前記ステージング帯域を確保できる予定転送開始時刻を決定する処理と、
前記転送予定情報記憶手段から前記転送予定量を取得する処理と、
ジョブファイルの転送時間と転送量から転送速度を決定する処理と、
前記ファイルステージング処理に必要な領域を前記転送予定情報記憶手段に確保する処理と、
前記帯域スケジューラマップに従って前記ファイルステージング処理で使用している帯域を設定・変更する処理とを含むデータ処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014031596A JP6303584B2 (ja) | 2014-02-21 | 2014-02-21 | データ処理装置、計算機システム、データ処理方法およびデータ処理プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014031596A JP6303584B2 (ja) | 2014-02-21 | 2014-02-21 | データ処理装置、計算機システム、データ処理方法およびデータ処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015156185A JP2015156185A (ja) | 2015-08-27 |
JP6303584B2 true JP6303584B2 (ja) | 2018-04-04 |
Family
ID=54775448
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014031596A Expired - Fee Related JP6303584B2 (ja) | 2014-02-21 | 2014-02-21 | データ処理装置、計算機システム、データ処理方法およびデータ処理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6303584B2 (ja) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0675785A (ja) * | 1992-06-29 | 1994-03-18 | Fujitsu Ltd | プレステージング処理方法、バッファ管理方法及びファイルシステム |
JP3951949B2 (ja) * | 2003-03-31 | 2007-08-01 | 日本電気株式会社 | 分散型資源管理システムおよび分散型資源管理方法並びにプログラム |
JP5081498B2 (ja) * | 2007-05-24 | 2012-11-28 | 株式会社日立製作所 | 計算機システム、および、その制御方法 |
-
2014
- 2014-02-21 JP JP2014031596A patent/JP6303584B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2015156185A (ja) | 2015-08-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20200201763A1 (en) | Memory hierarchy-aware processing | |
JP6897574B2 (ja) | アクセラレータ制御装置、アクセラレータ制御方法およびプログラム | |
US10055252B2 (en) | Apparatus, system and method for estimating data transfer periods for job scheduling in parallel computing | |
JP6254949B2 (ja) | 仮想マシンプールにおけるリソースの価格設定 | |
Bicer et al. | Time and cost sensitive data-intensive computing on hybrid clouds | |
US9639576B2 (en) | Database management system, computer, and database management method | |
CN113342477A (zh) | 一种容器组部署方法、装置、设备及存储介质 | |
JP5533315B2 (ja) | 情報処理システム、管理装置、処理要求装置及びプログラム | |
JP7050957B2 (ja) | タスクスケジューリング | |
CN114265679A (zh) | 数据处理方法、装置和服务器 | |
JP6666555B2 (ja) | 情報処理装置、ジョブ投入方法、およびジョブ投入プログラム | |
JP6885193B2 (ja) | 並列処理装置、ジョブ管理方法、およびジョブ管理プログラム | |
CN110023904A (zh) | 双模式本地数据存储 | |
JP5614318B2 (ja) | スケジューリングプログラム,方法および装置 | |
US20120185672A1 (en) | Local-only synchronizing operations | |
CN108228323A (zh) | 基于数据本地性的Hadoop任务调度方法及装置 | |
US11093291B2 (en) | Resource assignment using CDA protocol in distributed processing environment based on task bid and resource cost | |
JP6303584B2 (ja) | データ処理装置、計算機システム、データ処理方法およびデータ処理プログラム | |
JP2016114967A (ja) | キャッシュ装置、キャッシュシステム、キャッシュ方法、及びキャッシュプログラム | |
WO2017018978A1 (en) | Scheduling jobs in a computing cluster | |
JP2019164510A (ja) | ストレージシステム及びio処理の制御方法 | |
JP2015176218A (ja) | 演算処理装置、演算処理装置の制御方法、及び演算処理装置の制御プログラム | |
JP6349837B2 (ja) | スケジューラ装置及びそのスケジューリング方法、演算処理システム、並びにコンピュータ・プログラム | |
US20230010895A1 (en) | Information processing apparatus, information processing method, and computer-readable recording medium storing information processing program | |
JP2006065658A (ja) | 並列計算機システムおよびジョブ投入方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170116 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20171110 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20171205 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171221 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180206 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180219 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6303584 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |