JP7159884B2 - 情報処理装置および情報処理方法 - Google Patents
情報処理装置および情報処理方法 Download PDFInfo
- Publication number
- JP7159884B2 JP7159884B2 JP2019009605A JP2019009605A JP7159884B2 JP 7159884 B2 JP7159884 B2 JP 7159884B2 JP 2019009605 A JP2019009605 A JP 2019009605A JP 2019009605 A JP2019009605 A JP 2019009605A JP 7159884 B2 JP7159884 B2 JP 7159884B2
- Authority
- JP
- Japan
- Prior art keywords
- value
- batch size
- information processing
- learning
- loss
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 67
- 238000003672 processing method Methods 0.000 title claims description 4
- 230000008859 change Effects 0.000 claims description 40
- 238000012549 training Methods 0.000 claims description 21
- 238000013528 artificial neural network Methods 0.000 claims description 20
- 238000004364 calculation method Methods 0.000 claims description 20
- 230000003247 decreasing effect Effects 0.000 claims description 9
- 238000010200 validation analysis Methods 0.000 claims description 4
- 238000000034 method Methods 0.000 description 37
- 238000012795 verification Methods 0.000 description 25
- 238000010586 diagram Methods 0.000 description 24
- 238000012545 processing Methods 0.000 description 12
- 230000002829 reductive effect Effects 0.000 description 10
- 238000013459 approach Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000007704 transition Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 239000000470 constituent Substances 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000007786 learning performance Effects 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 210000000653 nervous system Anatomy 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
1.実施形態
1.1.概要
1.2.情報処理装置10の機能構成例
1.3.検証結果
1.4.バッチサイズ増減の実現手法
2.ハードウェア構成例
3.まとめ
<<1.1.概要>>
まず、本開示の一実施形態の概要について説明する。上述したように、近年、ニューラルネットワークによる学習を高速化するための技術が多く提案されている。一般に、DNN(Deep Neural Network)の学習に要する時間は、パラメータの更新回数と比例関係にあることから、当該更新回数を減らすことが学習の高速化に対し有効な手段となり得る。
次に、本実施形態に係る情報処理装置10の機能構成例について説明する。図3は、本実施形態に係る情報処理装置10の機能構成例を示すブロック図である。図3を参照すると、本実施形態に係る情報処理装置10は、入出力制御部110、学習部120、微分計算部130、およびバッチサイズ変更部140を備える。
本実施形態に係る入出力制御部110は、DNNの学習に係るユーザインタフェースを制御する。例えば、本実施形態に係る入出力制御部110は、入力装置を介して入力された各種のデータを学習部120に引き渡す。また、例えば、入出力制御部110は、学習部120が出力する値を出力装置に引き渡す。
本実施形態に係る学習部120は、DNNを用いた学習を行う。上述したように、本実施形態に係る学習部120は、DNNが出力する学習に係る理想状態とのギャップ値に基づいて、学習中にバッチサイズの値を動的に変更すること、を特徴の一つとする。本実施形態に係る理想状態とのギャップ値は、例えば、損失、トレーニングエラー、バリデーションエラーなどを含む。
本実施形態に係る微分計算部130は、学習部120から入力される損失にn回微分処理を行うことでn回微分値を算出し、当該n回微分値を学習部120に出力する。
本実施形態に係るバッチサイズ変更部140は、学習部120が設定したバッチサイズの値に基づいて、バッチサイズの増減を制御する機能を有する。本実施形態に係るバッチサイズ変更部140が有する機能の詳細については、別途後述する。
次に、本実施形態に係る情報処理装置10により実現されるバッチサイズ変更手法の検証結果について述べる。
続いて、本実施形態に係るバッチサイズ増減の実現手法について詳細に説明する。本実施形態に係るバッチサイズ変更部140は、学習部120が設定したバッチサイズの値を取得し、当該値に基づいてGPU(Graphics Processing Unit)を制御することで、バッチサイズの増減を実現する。
次に、本開示の一実施形態に係る情報処理装置10のハードウェア構成例について説明する。図17は、本開示の一実施形態に係る情報処理装置10のハードウェア構成例を示すブロック図である。図17を参照すると、情報処理装置10は、例えば、プロセッサ871と、ROM872と、RAM873と、ホストバス874と、ブリッジ875と、外部バス876と、インターフェース877と、入力装置878と、出力装置879と、ストレージ880と、ドライブ881と、接続ポート882と、通信装置883と、を有する。なお、ここで示すハードウェア構成は一例であり、構成要素の一部が省略されてもよい。また、ここで示される構成要素以外の構成要素をさらに含んでもよい。
プロセッサ871は、例えば、演算処理装置又は制御装置として機能し、ROM872、RAM873、ストレージ880、又はリムーバブル記録媒体901に記録された各種プログラムに基づいて各構成要素の動作全般又はその一部を制御する。プロセッサ871は、例えば、GPUやCPUを含む。なお、本開示の一実施形態に係る情報処理装置10は、少なくとも2つのGPUを備える。
ROM872は、プロセッサ871に読み込まれるプログラムや演算に用いるデータ等を格納する手段である。RAM873には、例えば、プロセッサ871に読み込まれるプログラムや、そのプログラムを実行する際に適宜変化する各種パラメータ等が一時的又は永続的に格納される。
プロセッサ871、ROM872、RAM873は、例えば、高速なデータ伝送が可能なホストバス874を介して相互に接続される。一方、ホストバス874は、例えば、ブリッジ875を介して比較的データ伝送速度が低速な外部バス876に接続される。また、外部バス876は、インターフェース877を介して種々の構成要素と接続される。
入力装置878には、例えば、マウス、キーボード、タッチパネル、ボタン、スイッチ、及びレバー等が用いられる。さらに、入力装置878としては、赤外線やその他の電波を利用して制御信号を送信することが可能なリモートコントローラ(以下、リモコン)が用いられることもある。また、入力装置878には、マイクロフォンなどの音声入力装置が含まれる。
出力装置879は、例えば、CRT(Cathode Ray Tube)、LCD、又は有機EL等のディスプレイ装置、スピーカ、ヘッドホン等のオーディオ出力装置、プリンタ、携帯電話、又はファクシミリ等、取得した情報を利用者に対して視覚的又は聴覚的に通知することが可能な装置である。また、本開示に係る出力装置879は、触覚刺激を出力することが可能な種々の振動デバイスを含む。
ストレージ880は、各種のデータを格納するための装置である。ストレージ880としては、例えば、ハードディスクドライブ(HDD)等の磁気記憶デバイス、半導体記憶デバイス、光記憶デバイス、又は光磁気記憶デバイス等が用いられる。
ドライブ881は、例えば、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体901に記録された情報を読み出し、又はリムーバブル記録媒体901に情報を書き込む装置である。
リムーバブル記録媒体901は、例えば、DVDメディア、Blu-ray(登録商標)メディア、HD DVDメディア、各種の半導体記憶メディア等である。もちろん、リムーバブル記録媒体901は、例えば、非接触型ICチップを搭載したICカード、又は電子機器等であってもよい。
接続ポート882は、例えば、USB(Universal Serial Bus)ポート、IEEE1394ポート、SCSI(Small Computer System Interface)、RS-232Cポート、又は光オーディオ端子等のような外部接続機器902を接続するためのポートである。
外部接続機器902は、例えば、プリンタ、携帯音楽プレーヤ、デジタルカメラ、デジタルビデオカメラ、又はICレコーダ等である。
通信装置883は、ネットワークに接続するための通信デバイスであり、例えば、有線又は無線LAN、Bluetooth(登録商標)、又はWUSB(Wireless USB)用の通信カード、光通信用のルータ、ADSL(Asymmetric Digital Subscriber Line)用のルータ、又は各種通信用のモデム等である。
以上説明したように、本開示の一実施形態に係る情報処理装置10は、ニューラルネットワークを用いた学習を行う学習部120を備え、学習部120は、ニューラルネットワークが出力する学習に係る理想状態とのギャップ値に基づいて、学習中にバッチサイズの値を動的に変更すること、を特徴の一つとする。係る構成によれば、DNNによる学習を学習手法に依らず効果的に高速化することが可能となる。
(1)
ニューラルネットワークによる学習に係る理想状態とのギャップ値を取得する取得部と、
前記理想状態とのギャップ値に基づいて、前記ニューラルネットワークにおけるバッチサイズの値の動的な変更を指示する指示部と、
を備える、
情報処理装置。
(2)
前記理想状態とのギャップ値は、少なくとも損失に関する値を含み、
前記取得部は、前記損失に関する値を取得し、
前記指示部は、前記損失に関する値に基づいて、前記ニューラルネットワークにおけるバッチサイズの値の動的な変更を指示する、
前記(1)に記載の情報処理装置。
(3)
前記損失に関する値は、前記損失のn回微分値(nは0以上の整数。以下同様)を含む、
前記(2)に記載の情報処理装置。
(4)
前記損失のn回微分値は、時間方向における前記損失の微分値である、
前記(3)に記載の情報処理装置。
(5)
前記取得部は、APIを介して前記前記損失に関する値を取得し、
前記指示部は、前記損失に関する値に基づいて、自動的に前記バッチサイズの値の変更を指示する、
前記(2)~(4)のいずれかに記載の情報処理装置。
(6)
前記指示部は、前記損失に関する値から学習の収束が推定される場合、バッチサイズの値の増加を指示する、
前記(2)~(5)のいずれかに記載の情報処理装置。
(7)
前記指示部は、前記損失のn回微分値の値に基づいて、バッチサイズの値の増加を指示する、
前記(3)または(4)に記載の情報処理装置。
(8)
前記指示部は、前記損失の値または前記損失の傾きの少なくともいずれかが閾値を下回ることに基づいて、バッチサイズの値の増加を指示する、
前記(7)に記載の情報処理装置。
(9)
前記指示部は、前記損失に関する値に基づいて学習の発散が推定される場合、バッチサイズの値の減少を指示する、
前記(2)~(8)のいずれかに記載の情報処理装置。
(10)
前記指示部は、前記損失に関する値に基づいて学習の発散が推定される場合、過去のエポックにおけるネットワークモデルの再読み込みを指示する、
前記(9)に記載の情報処理装置。
(11)
前記指示部は、前記過去のエポックにおけるネットワークモデルの再読み込みが行われた場合、前記過去のエポックで設定された値よりも小さいバッチサイズの値を設定させる、
前記(10)に記載の情報処理装置。
(12)
前記指示部は、GPU中のモデルの作り直しによるバッチサイズの増減を指示する、
前記(1)~(11)のいずれかに記載の情報処理装置。
(13)
前記指示部は、学習に係る計算のループ数の増減によるバッチサイズの増減を指示する、
前記(1)~(12)のいずれかに記載の情報処理装置。
(14)
前記指示部は、学習に用いられるGPUの数の増減によるバッチサイズの増減を指示する、
前記(1)~(13)のいずれかに記載の情報処理装置。
(15)
前記指示部は、追加で利用可能なGPUが存在する場合、当該GPUの学習への割り当てによるバッチサイズの増加を指示する、
前記(1)~(14)のいずれかに記載の情報処理装置。
(16)
前記指示部は、追加で利用可能なGPUが存在せず、かつ現在利用中のGPUのメモリに空き容量が存在する場合、現在利用中のGPU中のモデルを作り直しによるバッチサイズの増加を指示する、
前記(1)~(15)のいずれかに記載の情報処理装置。
(17)
前記指示部は、現在利用中のGPUのメモリに空き容量が存在しない場合、学習に係る計算のループ数の増加によるバッチサイズの増加を指示する、
前記(1)~(16)のいずれかに記載の情報処理装置。
(18)
前記理想状態とのギャップ値は、トレーニングエラーまたはバリデーションエラーのうち少なくともいずれかを含む、
前記(1)に記載の情報処理装置。
(19)
プロセッサが、ニューラルネットワークによる学習に係る理想状態とのギャップ値を取得することと、
前記理想状態とのギャップ値に基づいて、前記ニューラルネットワークにおけるバッチサイズの値の動的な変更を指示することと、
を含む、
情報処理方法。
110 入出力制御部
120 学習部
130 微分計算部
140 バッチサイズ変更部
Claims (19)
- ニューラルネットワークによる学習に係る理想状態とのギャップ値を取得する取得部と、
前記理想状態とのギャップ値に基づいて、前記ニューラルネットワークにおけるバッチサイズの値の動的な変更を指示する指示部と、
を備える、
情報処理装置。 - 前記理想状態とのギャップ値は、少なくとも損失に関する値を含み、
前記取得部は、前記損失に関する値を取得し、
前記指示部は、前記損失に関する値に基づいて、前記ニューラルネットワークにおけるバッチサイズの値の動的な変更を指示する、
請求項1に記載の情報処理装置。 - 前記損失に関する値は、前記損失のn回微分値(nは0以上の整数。以下同様)を含む、
請求項2に記載の情報処理装置。 - 前記損失のn回微分値は、時間方向における前記損失の微分値である、
請求項3に記載の情報処理装置。 - 前記取得部は、APIを介し前記損失に関する値を取得し、
前記指示部は、前記損失に関する値に基づいて、自動的に前記バッチサイズの値の変更を指示する、
請求項2に記載の情報処理装置。 - 前記指示部は、前記損失に関する値から学習の収束が推定される場合、バッチサイズの値の増加を指示する、
請求項2に記載の情報処理装置。 - 前記指示部は、前記損失のn回微分値の値に基づいて、バッチサイズの値の増加を指示する、
請求項3に記載の情報処理装置。 - 前記指示部は、前記損失の値または前記損失の傾きの少なくともいずれかが閾値を下回ることに基づいて、バッチサイズの値の増加を指示する、
請求項7に記載の情報処理装置。 - 前記指示部は、前記損失に関する値に基づいて学習の発散が推定される場合、バッチサイズの値の減少を指示する、
請求項2に記載の情報処理装置。 - 前記指示部は、前記損失に関する値に基づいて学習の発散が推定される場合、過去のエポックにおけるネットワークモデルの再読み込みを指示する、
請求項9に記載の情報処理装置。 - 前記指示部は、前記過去のエポックにおけるネットワークモデルの再読み込みが行われた場合、前記過去のエポックで設定された値よりも小さいバッチサイズの値を設定させる、
請求項10に記載の情報処理装置。 - 前記指示部は、GPU中のモデルの作り直しによるバッチサイズの増減を指示する、
請求項1に記載の情報処理装置。 - 前記指示部は、学習に係る計算のループ数の増減によるバッチサイズの増減を指示する、
請求項1に記載の情報処理装置。 - 前記指示部は、学習に用いられるGPUの数の増減によるバッチサイズの増減を指示する、
請求項1に記載の情報処理装置。 - 前記指示部は、追加で利用可能なGPUが存在する場合、当該GPUの学習への割り当てによるバッチサイズの増加を指示する、
請求項1に記載の情報処理装置。 - 前記指示部は、追加で利用可能なGPUが存在せず、かつ現在利用中のGPUのメモリに空き容量が存在する場合、現在利用中のGPU中のモデルを作り直しによるバッチサイズの増加を指示する、
請求項1に記載の情報処理装置。 - 前記指示部は、現在利用中のGPUのメモリに空き容量が存在しない場合、学習に係る計算のループ数の増加によるバッチサイズの増加を指示する、
請求項1に記載の情報処理装置。 - 前記理想状態とのギャップ値は、トレーニングエラーまたはバリデーションエラーのうち少なくともいずれかを含む、
請求項1に記載の情報処理装置。 - プロセッサが、ニューラルネットワークによる学習に係る理想状態とのギャップ値を取得することと、
前記理想状態とのギャップ値に基づいて、前記ニューラルネットワークにおけるバッチサイズの値の動的な変更を指示することと、
を含む、
情報処理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019009605A JP7159884B2 (ja) | 2019-01-23 | 2019-01-23 | 情報処理装置および情報処理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019009605A JP7159884B2 (ja) | 2019-01-23 | 2019-01-23 | 情報処理装置および情報処理方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018169979A Division JP6471825B1 (ja) | 2018-09-11 | 2018-09-11 | 情報処理装置および情報処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020042753A JP2020042753A (ja) | 2020-03-19 |
JP7159884B2 true JP7159884B2 (ja) | 2022-10-25 |
Family
ID=69798500
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019009605A Active JP7159884B2 (ja) | 2019-01-23 | 2019-01-23 | 情報処理装置および情報処理方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7159884B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20220033314A (ko) | 2020-09-09 | 2022-03-16 | 삼성전자주식회사 | 호스트 프로세서 및 가속기의 동작 방법 및 이들을 포함한 전자 장치 |
KR102758486B1 (ko) * | 2020-12-08 | 2025-01-22 | 한국전자통신연구원 | 인공신경망 가속기를 위한 배치 크기 최적화 방법 및 장치 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001056802A (ja) | 1999-08-19 | 2001-02-27 | Oki Electric Ind Co Ltd | ニューラルネットワークの学習方法 |
US20180144261A1 (en) | 2016-11-18 | 2018-05-24 | NantOmics, LLC. | Methods and systems for predicting dna accessibility in the pan-cancer genome |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03223933A (ja) * | 1989-12-18 | 1991-10-02 | Hitachi Ltd | 情報処理システム |
-
2019
- 2019-01-23 JP JP2019009605A patent/JP7159884B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001056802A (ja) | 1999-08-19 | 2001-02-27 | Oki Electric Ind Co Ltd | ニューラルネットワークの学習方法 |
US20180144261A1 (en) | 2016-11-18 | 2018-05-24 | NantOmics, LLC. | Methods and systems for predicting dna accessibility in the pan-cancer genome |
Non-Patent Citations (1)
Title |
---|
二宮 洋,改良型online準ニュートン法によるニューラルネットワークの学習,電子情報通信学会技術研究報告,社団法人電子情報通信学会,2009年11月04日,Vol.109, No.269,pp.187-192 |
Also Published As
Publication number | Publication date |
---|---|
JP2020042753A (ja) | 2020-03-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113436643B (zh) | 语音增强模型的训练及应用方法、装置、设备及存储介质 | |
CN111199269B (zh) | 图像处理装置及其操作方法 | |
JP6471825B1 (ja) | 情報処理装置および情報処理方法 | |
CN109300179B (zh) | 动画制作方法、装置、终端和介质 | |
CN111105375B (zh) | 图像生成方法及其模型训练方法、装置及电子设备 | |
KR20200013162A (ko) | 전자 장치 및 그의 제어 방법 | |
CN110189385B (zh) | 模型训练及图片压缩、解压方法、装置、介质和电子设备 | |
KR102102182B1 (ko) | 영상 복원 장치 및 방법 | |
US20210303938A1 (en) | Method and apparatus for optimizing video playback start, device and storage medium | |
JP7159884B2 (ja) | 情報処理装置および情報処理方法 | |
CN114121029B (zh) | 语音增强模型的训练方法和装置以及语音增强方法和装置 | |
KR20210110852A (ko) | 이미지 변형 제어 방법, 장치 및 하드웨어 장치 | |
JP7287388B2 (ja) | 情報処理装置および情報処理方法 | |
WO2020097824A1 (zh) | 音频处理方法、装置、存储介质及电子设备 | |
CN114155852A (zh) | 语音处理方法、装置、电子设备及存储介质 | |
KR20200027080A (ko) | 전자 장치 및 그 제어 방법 | |
CN114747232A (zh) | 音频场景变化信令 | |
US10079028B2 (en) | Sound enhancement through reverberation matching | |
EP3816870A1 (en) | Electronic apparatus and control method thereof | |
WO2024184835A1 (en) | Efficient adaptation of spoken language understanding based on automatic speech recognition using multi-task learning | |
CN117809668A (zh) | 电子设备及电子设备的语音信号处理方法 | |
CN116866661A (zh) | 一种视频预渲染方法、装置、设备及存储介质 | |
CN117194696B (zh) | 基于人工智能的内容生成方法、装置、设备和存储介质 | |
CN117744732B (zh) | 深度学习模型的训练方法、推理方法、装置、设备和介质 | |
CN119007725A (zh) | 一种口型驱动、口型驱动模型的训练方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20190515 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20190522 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210709 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220614 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220705 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220830 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220913 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220926 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7159884 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |