JP6364880B2 - 並列計算機システム,ジョブ管理装置の制御プログラム,及び並列計算機システムの制御方法 - Google Patents
並列計算機システム,ジョブ管理装置の制御プログラム,及び並列計算機システムの制御方法 Download PDFInfo
- Publication number
- JP6364880B2 JP6364880B2 JP2014072704A JP2014072704A JP6364880B2 JP 6364880 B2 JP6364880 B2 JP 6364880B2 JP 2014072704 A JP2014072704 A JP 2014072704A JP 2014072704 A JP2014072704 A JP 2014072704A JP 6364880 B2 JP6364880 B2 JP 6364880B2
- Authority
- JP
- Japan
- Prior art keywords
- job
- resource
- time
- free
- map
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
- G06F9/5038—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the execution order of a plurality of tasks, e.g. taking priority or time dependency constraints into consideration
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
- G06F9/505—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the load
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multi Processors (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
前記複数の計算ノードにジョブを割り当てるジョブ管理装置とを備え、
前記ジョブ管理装置は、ジョブ割り当ての結果生じた空き資源であって、現在時刻と割り当て済みの或るジョブの開始予定時刻との間に亘って前記複数の計算ノードの一部が空き状態の空き資源を探索する処理と、前記空き資源が発見されたときに未割り当てのジョブの中から前記空き資源に割り当て可能なジョブを検索する処理と、検索されたジョブを前記空き資源に割り当てる処理と、を実行する制御装置を含む
並列計算機システムである。
最初に、ジョブスケジューラによるジョブの割り当て処理の対象となる「計算資源」(以下、単に「資源」と表記することもある)について説明する。或るジョブが実行を開始するのに先立って、当該ジョブを実行するためのプロセッサ(一般的には複数のプロセッサ(プロセッサ群))がジョブに割り当てられる。このようなプロセッサ又はプロセッサ群が「資源」に該当する。プロセッサ又はプロセッサ群によって形成される計算資源の管理単位は、「計算ノード」と呼ばれる。
。
(1)ジョブ内のプロセス間通信が他のジョブの外乱にならないこと。
(2)計算ノードの異常(計算ノードダウン等)が発生した場合に、多数のジョブに影響しないこと(異常が発生した計算ノードを使用しているジョブだけが中断されること)。
本実施形態に係る並列計算機システムは、図3,図4に示したネットワーク1又はネットワーク2と、ネットワーク1又はネットワーク2に接続されてネットワーク1又はネットワーク2(複数の計算ノード)にジョブを割り当てるジョブ管理装置10とを含む。なお、図3及び図4のそれぞれにおけるネットワークとジョブ管理装置10との接続関係は模式的に示されたものである。
Unit(CPU)11と、メモリ12と、ネットワーク1やネットワーク2との通信イン
タフェース(通信IF)13とを含む。CPU11は、プロセッサ(制御装置)の一例である。
,EEPROM,フラッシュメモリなどであり、CPU11によって実行されるプログラムや、プログラムの実行に際して使用されるデータを記憶する。揮発性記憶媒体は、例えばRandom Access Memory(RAM)であり、CPU11の作業領域として使用される。メモリ12は、「記憶装置」、「記憶媒体」の一例である。
ジョブ管理装置10で実行される空き資源探索処理では、時間軸を考慮した空き資源探索のために、「資源マップ」を使用する。図6は、スケジューリングマップ上に表された資源マップの例を示す。資源マップは、計算資源に割り当てられたジョブの実行の開始予定時刻及び終了予定時刻について生成される資源使用状況のスナップショットである。資源マップは、「マップ構造体」とも呼ばれる。資源マップの情報は、例えばジョブの割り当て時において、ジョブの開始予定時刻及び終了予定時刻について作成され、メモリ12に記憶される。
ージ]で示すように、全体として直方体に形成された複数の計算ノードのスナップショッ
トとなる。図6の例では、直方体は、幅,奥行き,及び高さ方向に並べられた4×3×3の計算ノードNの集合である。
次に、資源マップを用いた空き資源探索処理の参考例について説明する。図7は、図6に示した状態の資源マップを経過時間40分のジョブ“jobA”を割り当てる場合の空き資源探索処理の参考例の概要を示す。
OR)を計算してマージマップA1を作成する。論理和の計算には、各資源マップ(now
マップを含む)をビット値に換算したビット換算値を用いる。ビット換算値において、例えば、割り当て済みの領域はオフ“0”で示され、未割り当て(空き状態)の領域はオン“1”で示される。以下の説明で言及する論理演算においては、このようなビット換算値が用いられているものとする。
の引数)の経過時間が設定される。また、変数“MMAP(マージマップ)”が初期化される。さらに、変数“SMAP(最初の資源マップ)”としてnowマップが設定され、変数“NMAP
(次の資源マップ)”の値に“SMAP.next(SMAPの次の資源マップ)”が設定される。
、SMAPの値がMMAPとして保持される。“SMAP”に“SMAP.next(SMAPの次の資源マップ)
”が設定される。図7の例に従うと、SMAPとしてnowマップの次の資源マップ(2)が設
定される。
)には、処理が02に戻され、そうでなければ(03,NO)、処理が04に進む。図7の例に従うと、資源マップ(2)の時刻は、現在時刻から40分経過した時刻より前であるので、処理が02に戻る。
ップ(2)との論理和が算出される。また、SMAPとして次の資源マップ(3)が設定される。
の値が設定される。図7の例に従うと、SMAPとして資源マップ(2)が設定され、NMAPとして資源マップ(3)が設定される。
次に、本実施形態における資源探索処理にて探索対象となる「閉じ空間」について説明する。一部の計算ノード(計算ノード群)が、「或る時刻まで未割当て」かつ「その時刻以降は割り当て(予約)済み」となる場合がある。この時点で未割り当てのジョブに必要な計算ノードの数、空間的配置の両方の条件を満たす計算ノードの集合について、未割り当てのジョブの予定実行時間以上の長さを持つ空き時間がなければ、当該計算ノードの集合に対してジョブを割り当てることができない。
図2に示した計算資源選択処理において、図7及び図8で説明したような空き資源探索処理(参考例)を適用して閉じ空間を探索しようとすると、以下の問題が生じていた。すなわち、参考例の空き資源探索処理は、nowマップを含む資源マップ間の論理和の計算及
び空きノードの調査を繰り返す時間のかかる処理である。
図10は、実施形態に係る閉じ空間優先制御処理の説明図である。図10の例では、スケジューリングマップ上において、各ジョブ“job1”〜ジョブ“job5”のそれぞれに対する割り当てが既に済んでいる。これによって、スケジューリングマップの左上隅に閉じ空間Aが存在している。
最初に、ジョブスケジューラは、現在時刻nowから資源マップ(2)の時刻(“job2”
の終了予定時刻)までにおける閉じ空間の有無の判定を行う。すなわち、ジョブスケジューラは、nowマップのビット換算値と資源マップ(2)のビット換算値との論理和(ビッ
ト論理和)を算出し、マージマップ(2)´とする。
OR)を算出する。排他的論理和においてビット“オン”の位置は、空きノードによって形成される閉じ空間を示す。但し、nowマップとマージマップ(2)´との排他的論理和
(XOR)は、全ビット“オフ”となるので、閉じ空間Aは検出されない。
次に、ジョブスケジューラは、現在時刻nowから資源マップ(3)の時刻(“job1”の
終了予定時刻且つ“job3”の開始予定時刻)までにおける閉じ空間Aの有無の判定を行う。すなわち、ジョブスケジューラは、マージマップ(2)´と資源マップ(3)のビット換算値との論理和を算出し、マージマップ(3)´とする。
次に、ジョブスケジューラは、nowマップとマージマップ(3)´との排他的論理和(
XOR)を算出する。排他的論理和において、ビット“オン”の位置が検出される。当該位置は、閉じ空間Aを示す。すなわち、ビット“オン”の位置は空きノードを示し、現在時刻nowと資源マップ(3)の時刻との間の時間帯が当該空きノードを使用可能な時間帯
を示す。
の終了予定時刻)までにおける閉じ空間の有無の判定を試行する。但し、資源マップ(3)に空き領域がないので、閉じ空間の探索が終了する。
閉じ空間Aが発見されると、ジョブスケジューラは、未割り当てのジョブから閉じ空間Aに入るジョブを検索する。図10の例では、未割り当てのジョブとしてジョブ“job6”〜“job99999”がある。具体的には、未割り当てのジョブのリスト(図示せず)がメモリ12に記憶されており、各ジョブ“job6”〜“job99999”は、優先度順でソートされている。また、リストには、各ジョブ“job6”〜“job99999”の実行に要するノード数(要求ノード数)と、経過時間(実行所要時間)とが保持されている。
源マップ(1)〜(6)の情報をCPU11が作成してメモリ12に記憶しているものとする。そして、図11に示す処理は、ジョブ“job6”の割り当て処理の時点で開始されたと仮定する。
ル(入力装置及び出力装置)を用いて入力した値を適用することができる。MTIMEの長さ
を調整することで、閉じ空間優先制御処理の実行時間を調整することができる。
。図11の例では、MTIME=8時間の設定に従って、10分間隔で480分(8×6=4
8)の配列を初期化する。また、CPU11は、変数MMの値(カウンタ値)を“1”に設定する。さらに、CPU11は、MMAP[MM-1]として、nowマップを設定し、NMAPとして、
“nowマップ.next”を設定する。101の処理を図10の例に則して説明すると、MMAP[MM-1]として、nowマップが設定され、NMAPとして、資源マップ(2)が設定される。なお
、“MMAP[MM]”は、マージマップ用のマップ構造体配列を示す。
マップ(2)との論理和(マージマップ(2)´)が算出される。
プとMMAP[MM]との排他的論理和を算出する。すなわち、図10に示すnowマップとマージ
マップ(2)´との排他的論理和が算出される。さらに、CPU11は、XMAPのビットオン位置をTLIST(閉じ空間リスト)に設定する。
て説明すると、CPU11は、資源マップ(2)の時刻が現在時刻からMTIMEとして設定
した時間(8時間)内か否かを判定する。資源マップ(2)の時刻は8時間以内であるため、処理が105に進む。NMAP.timeが現在時刻より8時間を過ぎているときには、閉じ
空間探索処理が終了する。
2に戻す。再度の102の処理では、CPU11は、MMAP[MM=2]として、MMAP[MM=1](マージマップ(2)´)とNMAP(資源マップ(3))との論理和であるマージマップ(3)´を算出する。さらに、CPU11は、XMAPとして、nowマップとマージマップ(3)´
との排他的論理和を算出し、XMAPのビットオン位置をTLISTに設定する。
ットオン位置を、空きノードとして認識することができる。また、CPU11は、例えば
MMの値(カウンタ値)より、資源マップを特定することができ、当該資源マップの時刻と現在時刻との間の時間帯で空き状態の計算ノードが空き資源(閉じ空間)であると認識することができる。これによって、閉じ空間A(ノード数及び時間帯(時間長))を特定することができる。
実施形態に係る閉じ空間優先制御処理では、閉じ空間探索処理によって閉じ空間Aが発見され、未割り当てのジョブの中から閉じ空間Aに収まるジョブが検索されると、当該ジョブは、当該ジョブより優先度の高い未割り当てのジョブがあっても優先的に割り当てられる。これによって、図9に示したような閉じ空間Aに係る資源が現在時刻の経過で無駄になるのを回避することができる。換言すれば、現在時刻の経過によって隙間の空き資源が無駄になるのを低減することができる。これによって、資源の稼働率向上を図ることができる。
結果とnowマップとの排他的論理和演算とによってなされる。閉じ空間探索処理は、この
ような簡易な論理演算であり、現在時刻から或る割り当て済みジョブの実行開始時刻までの時間帯を対象としてなされる短時間の処理である。また、閉じ空間に収まるジョブの検索処理は、閉じ空間のノード数及び時間長と未割り当てのジョブの要求ノード数及び経過時間(実行所要時間)との比較でなされる。このため、短時間で全未割り当てジョブに対する比較を完了することができる。
或る現在時刻で生じた閉じ空間に対し、対応するジョブが割当てられるまでに経過する時間は少なくなる。従って、隙間の空き資源(閉じ空間)を稼働率向上のために有効に活用することができる。
次に、実施形態2について説明する。実施形態2の構成は、実施形態1と共通する部分を含むので、主として相違点について説明し、共通点については説明を省略する。実施形態1で説明した閉じ空間探索処理は、閉じ空間探索処理の実行によって閉じ空間が発見された場合には、稼働率向上に貢献することができる。これに対し、発見できなかった場合には、単なるロスタイムとなり得る。
る。そして、現在時刻より後の資源マップの空き資源率をチェックし、現在時刻の空き資源率から所定量(例えば20[%])以上空き資源率が低下したときに、閉じ空間探索が実行されるようにする。
源率より25[%]増加している。このため、閉じ空間探索処理は開始されない。これに対し、資源マップ(3)の空き資源率は0%であり、nowマップの空き資源率との比較にお
いて25[%]減少している。このため、閉じ空間探索処理が開始される。
てメモリ12に記憶しているものとする。
して閉じ空間探索範囲時間(探索範囲)を設定する。閉じ空間探索範囲時間の長さは可変(適宜設定可能)であり、本実施形態では、一例として8時間が設定される。
プ.next(nowマップの次の資源マップ)”に設定する。図12に示す例に従えば、“now
マップ.next”として資源マップ(2)が設定される。
り小さいか否かを判定する。すなわち、CPU11は、NMAPに該当する資源マップの時刻が現在時刻からMTIMEの時間(8時間)だけ経過した時刻より前か否かを判定する。20
4の条件が満たされる場合(204,YES)には、処理が205に進み、そうでない場合(204,NO)には処理が213に進む。
)”から“NMAP.free(NMAPの空き資源率)”を減じた値“FREE”(nowマップの空き資源率からの減少分)を求める。次の206では、CPU11は、“FREE”の値が所定閾値(20[%])以上か否かを判定する。このとき、“FREE”の値が20以上であれば(206,YES)、処理が207に進み、そうでなければ(206,NO)、処理が211に進む。
を204に戻す。その後、204又は211にてNOの判定がなされるまで、204〜212のループが繰り返される。
11は、資源選択のサブルーチンを読み出して“JOB”に対する資源選択処理を行う。資
源選択処理として、図8に示したサブルーチンが実行され、優先度に従ったジョブの割り当てが行われる。
マップは適宜のタイミングで更新される。例えば、214の資源選択処理が開始されるに先立ち、nowマップが現在時刻に合わせて更新されるようにしても良い。
10・・・ジョブ管理装置
11・・・CPU
12・・・メモリ
Claims (6)
- 複数の計算ノードと、
前記複数の計算ノードにジョブを割り当てるジョブ管理装置とを備え、
前記ジョブ管理装置は、ジョブ割り当ての結果生じた空き資源であって、現在時刻と割り当て済みの或るジョブの開始予定時刻との間に亘って前記複数の計算ノードの一部が空き状態の空き資源を探索する処理と、前記空き資源が発見されたときに未割り当てのジョブの中から前記空き資源に割り当て可能なジョブを検索する処理と、検索されたジョブを前記空き資源に割り当てる処理と、を実行する制御装置と、
現在時刻における前記複数の計算ノードに対するジョブの割り当て状況を示す現在時刻の資源マップと、割り当て済の各ジョブの開始予定時刻及び終了予定時刻のそれぞれにおける前記複数の計算ノードに対するジョブの割り当て状況を示す資源マップとを記憶する記憶装置とを含み、
前記制御装置は、前記現在時刻の資源マップと前記現在時刻の次の時刻に該当する前記開始予定時刻又は前記終了予定時刻の資源マップとの論理和演算と、前記論理和演算の結果と前記現在時刻の資源マップとの排他的論理和演算とを含む前記空き資源の探索処理を行う
並列計算機システム。 - 前記制御装置は、前記空き資源を形成する計算ノードの数及び時間長と、未割り当てのジョブの要求ノード数及び実行所要時間との比較によって、前記空き資源に割り当て可能なジョブを検索する
請求項1に記載の並列計算機システム。 - 前記制御装置は、ジョブの割り当てがジョブの有する優先度順で行われる場合に、前記空き資源に割り当て可能なジョブの検索を前記優先度順で行う
請求項1又は2に記載の並列計算機システム。 - 前記制御装置は、現在時刻における空き資源率と、前記現在時刻の後にある割り当て済みの各ジョブの開始予定時刻及び終了予定時刻における空き資源率との比較を行い、当該開始予定時刻又は終了予定時刻の空き資源率が前記現在時刻における空き資源率から所定
量以上低下しているときに、前記空き資源を探索する処理を開始する
請求項1から3の何れか1項に記載の並列計算機システム。 - 複数の計算ノードにジョブを割り当てるジョブ管理装置の制御プログラムであって、
前記ジョブ管理装置として動作するコンピュータに、
ジョブ割り当ての結果生じた空き資源であって、現在時刻と割り当て済みの或るジョブの開始予定時刻との間に亘って前記複数の計算ノードの一部が空き状態の空き資源を探索するステップと、
前記空き資源が発見されたときに未割り当てのジョブの中から前記空き資源に割り当て可能なジョブを検索するステップと、
検索されたジョブを前記空き資源に割り当てるステップと、
を実行させ、
前記空き資源を探索するステップにおいて、現在時刻における前記複数の計算ノードに対するジョブの割り当て状況を示す現在時刻の資源マップと、割り当て済の各ジョブの開始予定時刻及び終了予定時刻のそれぞれにおける前記複数の計算ノードに対するジョブの割り当て状況を示す資源マップとを用いた、前記現在時刻の資源マップと前記現在時刻の次の時刻に該当する前記開始予定時刻又は前記終了予定時刻の資源マップとの論理和演算と、前記論理和演算の結果と前記現在時刻の資源マップとの排他的論理和演算とを含む前記空き資源の探索処理を前記コンピュータに実行させる
ジョブ管理装置の制御プログラム。 - 複数の計算ノードと、当該複数の計算ノードにジョブを割り当てるジョブ管理装置とを含む並列計算機システムの制御方法であって、
前記ジョブ管理装置が、
ジョブ割り当ての結果生じた空き資源であって、現在時刻と割り当て済みの或るジョブの開始予定時刻との間に亘って前記複数の計算ノードの一部が空き状態の空き資源を探索し、
前記空き資源が発見されたときに未割り当てのジョブの中から前記空き資源に割り当て可能なジョブを検索し、
検索されたジョブを前記空き資源に割り当てる、
ことを含み、
前記空き資源の探索において、現在時刻における前記複数の計算ノードに対するジョブの割り当て状況を示す現在時刻の資源マップと、割り当て済の各ジョブの開始予定時刻及び終了予定時刻のそれぞれにおける前記複数の計算ノードに対するジョブの割り当て状況を示す資源マップとを用いた、前記現在時刻の資源マップと前記現在時刻の次の時刻に該当する前記開始予定時刻又は前記終了予定時刻の資源マップとの論理和演算と、前記論理和演算の結果と前記現在時刻の資源マップとの排他的論理和演算とを含む前記空き資源の探索処理を行う
並列計算機システムの制御方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014072704A JP6364880B2 (ja) | 2014-03-31 | 2014-03-31 | 並列計算機システム,ジョブ管理装置の制御プログラム,及び並列計算機システムの制御方法 |
US14/666,353 US9588818B2 (en) | 2014-03-31 | 2015-03-24 | Parallel computer system and method for allocating jobs to calculation nodes |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014072704A JP6364880B2 (ja) | 2014-03-31 | 2014-03-31 | 並列計算機システム,ジョブ管理装置の制御プログラム,及び並列計算機システムの制御方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015194923A JP2015194923A (ja) | 2015-11-05 |
JP6364880B2 true JP6364880B2 (ja) | 2018-08-01 |
Family
ID=54190509
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014072704A Active JP6364880B2 (ja) | 2014-03-31 | 2014-03-31 | 並列計算機システム,ジョブ管理装置の制御プログラム,及び並列計算機システムの制御方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US9588818B2 (ja) |
JP (1) | JP6364880B2 (ja) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10491705B2 (en) * | 2015-09-08 | 2019-11-26 | At&T Intellectual Property I, L.P. | Visualization for network virtualization platform |
JP6666553B2 (ja) | 2016-05-10 | 2020-03-18 | 富士通株式会社 | 情報処理装置、ジョブ管理方法およびジョブ管理プログラム |
CN108073453B (zh) * | 2016-11-11 | 2022-05-10 | 阿里巴巴集团控股有限公司 | 分布式集群中cpu资源的调度方法以及装置 |
CN109324890B (zh) * | 2017-07-31 | 2021-01-05 | 华为技术有限公司 | 资源管理方法、装置及计算机可读存储介质 |
CN109583859A (zh) * | 2018-10-22 | 2019-04-05 | 中国平安人寿保险股份有限公司 | 多系统间批量交易任务处理方法及系统 |
JP7238616B2 (ja) * | 2019-06-11 | 2023-03-14 | 富士通株式会社 | 並列処理装置、ジョブ管理プログラム、及びジョブ管理方法 |
KR20210061138A (ko) * | 2019-11-19 | 2021-05-27 | 주식회사 엘지화학 | 배터리 관리 시스템 및 그 제어방법 |
GB2609781A (en) * | 2020-03-20 | 2023-02-15 | Synapse Innovation Inc | Resource allocation method and system |
CN112035234B (zh) * | 2020-09-02 | 2023-08-22 | 中国银行股份有限公司 | 分布式批量作业分配方法及装置 |
US11455191B2 (en) | 2020-10-13 | 2022-09-27 | International Business Machines Corporation | Parallel task initialization on dynamic compute resources |
US11374824B2 (en) | 2020-11-27 | 2022-06-28 | At&T Intellectual Property I, L.P. | Time-based visualization for network virtualization platform |
US11604515B2 (en) | 2020-11-27 | 2023-03-14 | At&T Intellectual Property I, L.P. | Network virtualization platforms enhanced with non-visual sensory interactivity |
US20230273813A1 (en) * | 2022-02-25 | 2023-08-31 | Dell Products L.P. | Schedule management for machine learning model-based processing in computing environment |
CN117311957A (zh) * | 2022-06-27 | 2023-12-29 | 华为技术有限公司 | 一种资源调度方法、装置及系统 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07141305A (ja) * | 1993-11-16 | 1995-06-02 | Hitachi Ltd | 並列計算機の実行制御方法 |
US8336040B2 (en) * | 2004-04-15 | 2012-12-18 | Raytheon Company | System and method for topology-aware job scheduling and backfilling in an HPC environment |
US7433931B2 (en) | 2004-11-17 | 2008-10-07 | Raytheon Company | Scheduling in a high-performance computing (HPC) system |
WO2006087713A2 (en) * | 2005-02-16 | 2006-08-24 | Yissum Research Development Company Of The Hebrew University Of Jerusalem | System and method for backfilling with system-generated predictions rather than user runtime estimates |
US8214836B1 (en) * | 2005-05-13 | 2012-07-03 | Oracle America, Inc. | Method and apparatus for job assignment and scheduling using advance reservation, backfilling, and preemption |
JP2008107875A (ja) * | 2006-10-23 | 2008-05-08 | Nec Corp | ジョブ制御装置及びジョブ制御プログラム |
US8565799B2 (en) * | 2007-04-04 | 2013-10-22 | Qualcomm Incorporated | Methods and apparatus for flow data acquisition in a multi-frequency network |
JP5605131B2 (ja) * | 2010-09-28 | 2014-10-15 | 富士通株式会社 | ジョブスケジューリングプログラム,方法,および装置 |
JP5614318B2 (ja) * | 2011-02-15 | 2014-10-29 | 富士通株式会社 | スケジューリングプログラム,方法および装置 |
JP5676297B2 (ja) * | 2011-02-17 | 2015-02-25 | 日本電気株式会社 | ジョブスケジューリングシステム、ジョブスケジューリング方法及びプログラム |
JP5684629B2 (ja) * | 2011-03-31 | 2015-03-18 | 日本電気株式会社 | ジョブ管理システム及びジョブ管理方法 |
JP5737057B2 (ja) * | 2011-08-19 | 2015-06-17 | 富士通株式会社 | プログラム、ジョブスケジューリング方法、および情報処理装置 |
JP6010975B2 (ja) * | 2012-03-30 | 2016-10-19 | 日本電気株式会社 | ジョブ管理装置、ジョブ管理方法、及びプログラム |
JP6186862B2 (ja) * | 2013-05-07 | 2017-08-30 | 富士通株式会社 | 情報処理装置、省電力化制御方法および省電力化制御プログラム |
JP6349837B2 (ja) * | 2014-03-25 | 2018-07-04 | 日本電気株式会社 | スケジューラ装置及びそのスケジューリング方法、演算処理システム、並びにコンピュータ・プログラム |
-
2014
- 2014-03-31 JP JP2014072704A patent/JP6364880B2/ja active Active
-
2015
- 2015-03-24 US US14/666,353 patent/US9588818B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US9588818B2 (en) | 2017-03-07 |
JP2015194923A (ja) | 2015-11-05 |
US20150277982A1 (en) | 2015-10-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6364880B2 (ja) | 並列計算機システム,ジョブ管理装置の制御プログラム,及び並列計算機システムの制御方法 | |
JP6233413B2 (ja) | タスク割り当て判定装置、制御方法、及びプログラム | |
JP6241300B2 (ja) | ジョブスケジューリング装置、ジョブスケジューリング方法、およびジョブスケジューリングプログラム | |
KR101651871B1 (ko) | 멀티코어 시스템 상에서 단위 작업을 할당하는 방법 및 그 장치 | |
KR101644800B1 (ko) | 컴퓨팅 시스템 및 방법 | |
CN107851043B (zh) | 快捷外围部件互连网络中资源组的动态分配 | |
JP5429382B2 (ja) | ジョブ管理装置及びジョブ管理方法 | |
JP2017510899A (ja) | リアルタイムストリーム計算システムにおいて計算資源の容量を増大させる方法および装置ならびに該容量を解放する方法および装置 | |
CN110187960A (zh) | 一种分布式资源调度方法及装置 | |
KR101695013B1 (ko) | 적응형 자원 할당 및 관리 방법 | |
CN112231098B (zh) | 任务处理方法、装置、设备及存储介质 | |
US10048987B1 (en) | Methods and apparatus for a resource sharing platform having resource quality estimation | |
JP6221588B2 (ja) | 情報処理システム、管理装置制御プログラム及び情報処理システムの制御方法 | |
JP5676297B2 (ja) | ジョブスケジューリングシステム、ジョブスケジューリング方法及びプログラム | |
CN113254179A (zh) | 基于高响应比的作业调度方法、系统、终端、存储介质 | |
US9740530B2 (en) | Decreasing the priority of a user based on an allocation ratio | |
WO2024260034A1 (zh) | 分布式训练任务调度方法、设备及非易失性可读存储介质 | |
KR102045125B1 (ko) | 분산환경에서의 cda 프로토콜을 활용한 자원할당방법 및 이를 적용한 기록매체 및 분산처리장치 | |
JP6666553B2 (ja) | 情報処理装置、ジョブ管理方法およびジョブ管理プログラム | |
JP4121525B2 (ja) | リソース利用率を制御する方法およびコンピュータシステム | |
JP5577745B2 (ja) | クラスタシステム、プロセス配置方法、及びプログラム | |
JP6303806B2 (ja) | 並列計算機システム,プロセス制御プログラム,及び並列計算機システムの制御方法 | |
JP6683046B2 (ja) | 並列処理装置、ジョブ管理方法、およびジョブ管理プログラム | |
JP6524733B2 (ja) | 並列演算装置、並列演算システム、およびジョブ制御プログラム | |
JP6322968B2 (ja) | 情報処理装置、情報処理方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170110 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20171018 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20171205 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180105 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180605 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180618 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6364880 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |