JP7010877B2 - 機械学習装置、数値制御システム及び機械学習方法 - Google Patents
機械学習装置、数値制御システム及び機械学習方法 Download PDFInfo
- Publication number
- JP7010877B2 JP7010877B2 JP2019084477A JP2019084477A JP7010877B2 JP 7010877 B2 JP7010877 B2 JP 7010877B2 JP 2019084477 A JP2019084477 A JP 2019084477A JP 2019084477 A JP2019084477 A JP 2019084477A JP 7010877 B2 JP7010877 B2 JP 7010877B2
- Authority
- JP
- Japan
- Prior art keywords
- value
- machine learning
- reward
- blocks
- command
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B19/00—Programme-control systems
- G05B19/02—Programme-control systems electric
- G05B19/18—Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form
- G05B19/408—Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form characterised by data handling or data format, e.g. reading, buffering or conversion of data
- G05B19/4086—Coordinate conversions; Other special calculations
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B19/00—Programme-control systems
- G05B19/02—Programme-control systems electric
- G05B19/18—Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form
- G05B19/406—Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form characterised by monitoring or safety
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B19/00—Programme-control systems
- G05B19/02—Programme-control systems electric
- G05B19/18—Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form
- G05B19/408—Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form characterised by data handling or data format, e.g. reading, buffering or conversion of data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/063—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B19/00—Programme-control systems
- G05B19/02—Programme-control systems electric
- G05B19/18—Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form
- G05B19/4093—Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form characterised by part programming, e.g. entry of geometrical information as taken from a technical drawing, combining this with machining and material information to obtain control information, named part programme, for the NC machine
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B2219/00—Program-control systems
- G05B2219/30—Nc systems
- G05B2219/33—Director till display
- G05B2219/33056—Reinforcement learning, agent acts, receives reward, emotion, action selective
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B2219/00—Program-control systems
- G05B2219/30—Nc systems
- G05B2219/35—Nc in input of data, input till input file format
- G05B2219/35356—Data handling
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B2219/00—Program-control systems
- G05B2219/30—Nc systems
- G05B2219/36—Nc in input of data, input key till input tape
- G05B2219/36125—Select out of library, beforehand only functions needed for part program
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B2219/00—Program-control systems
- G05B2219/30—Nc systems
- G05B2219/43—Speed, acceleration, deceleration control ADC
- G05B2219/43011—Shorter time by adjusting corner speed, avoid zero speed when engage corner
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B2219/00—Program-control systems
- G05B2219/30—Nc systems
- G05B2219/49—Nc machine tool, till multiple
- G05B2219/49164—Corner, making corner
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Human Computer Interaction (AREA)
- Artificial Intelligence (AREA)
- Manufacturing & Machinery (AREA)
- Automation & Control Theory (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Neurology (AREA)
- Numerical Control (AREA)
Description
特許文献1には、直線と曲線で形成される所定の加工物の輪郭を工具経路とする工具の動作を機械学習する工作機械が記載されている。具体的には、特許文献1には、工作機械の動作を評価して評価データを出力する動作評価部と、工作機械の軸の移動量を機械学習する機械学習器とを備え、機械学習器は、工作機械の物理量データと評価データとを取得する状態観測部と、物理量データと評価データに基づいて報酬を計算する報酬計算部と、機械学習結果および物理量データに基づいて軸の移動量の調整を行う移動量調整学習部と、移動量調整学習部が調整した軸の移動量を出力する移動量出力部と、を有し、移動量調整学習部は、調整された前記軸の移動量と、状態観測部により取得された物理量データと、報酬計算部が計算した前記報酬と、に基づいて軸の移動量の調整を機械学習する工作機械が記載されている。
工作機械を制御する数値制御装置において、この内回り量を削減して、加工精度を向上させつつ、加工時間を削減することが望まれている。
前記第1の指令、前記m個以上のブロックの各ブロックの座標値、及び前記加工プログラムを前記数値制御装置が実行することで得られる加工経路の位置情報を含む状態情報を、取得する状態情報取得手段と、
前記状態情報に含まれる前記m個以上のブロックの各ブロックの座標値の調整情報を含む行動情報を前記数値制御装置に出力する行動情報出力手段と、
前記状態情報に含まれる前記第1の指令及び前記加工経路の位置情報を用いて算出される前記コーナー部の内回り量と、加工時間とに基づく、強化学習における報酬の値を出力する報酬出力手段と、
前記報酬出力手段により出力される報酬の値と、前記状態情報と、前記行動情報とに基づいて価値関数を更新する価値関数更新手段と、
を備える機械学習装置である。
前記第1の指令、前記m個以上のブロックの各ブロックの座標値、及び前記加工プログラムを前記数値制御装置が実行することで得られる加工経路の位置情報を含む状態情報を、取得し、
前記状態情報に含まれる前記m個以上のブロックの各ブロックの座標値の調整情報を含む行動情報を前記数値制御装置に出力し、
前記状態情報に含まれる前記第1の指令及び前記加工経路の位置情報を用いて算出される前記コーナー部の内回り量と、加工時間とに基づく、強化学習における報酬の値を求め、
前記報酬の値と、前記状態情報と、前記行動情報とに基づいて価値関数を更新する、
機械学習方法である。
図1は、本開示の一実施形態の数値制御システムの構成を示すブロック図である。
図1に示すように、数値制御システム10は、CNC(Computerized Numerical Control)装置等の数値制御装置100、機械学習装置200及びモータ301、302を備えている。機械学習装置200は数値制御装置100に含まれてもよい。
指令解析部101は、加工プログラムに2つのブロックからなるコーナー部を含み指令(第1の指令となる)が含まれることを検出した場合には、内部指令生成部102及び機械学習装置200に2つのブロックの指令を送る。なお、ここではコーナー部は直角としているが、鋭角でも鈍角でもよい。
図3に示される、点Aと点Bとの間の指令経路、点Bと点Cとの間の指令経路、点Cと点Dとの間の指令経路、点Dと点Eとの間の指令経路、及び点Eと点Fとの間の指令経路は、内部指令「G01;」、「N01 X5.0;」、「N02 X9.9 Y-0.1;」、「N03 X10.1 Y0.1;」、「N04 X10.0 Y5.0;」、及び「N05 Y10.0;」による5つのブロックの指令経路であり、この指令経路は図3において間隔の広い点線で示されている。また、図3において、5つのブロックの指令経路で実際に加工される、補正された加工経路が間隔の狭い点線で示されている。
X軸サーボ制御部105及びY軸サーボ制御部106とはそれぞれ、位置、速度フィードバックループを構成するための位置制御部、速度制御部、トルク指令値に基づいてモータを駆動するモータ駆動アンプ、及びユーザの操作を受け付けるための操作盤等を含んでいる。
機械学習装置200は、加工プログラムを実行し、加工プログラムの指令、数値制御装置100で生成された内部指令、内部指令の5つのブロックで設定された送り速度、各軸の時定数、加減速制御部104から出力される加速度及びモータ301及びモータ302から出力される位置検出値を用いて、内部指令の5つのブロックのX軸座標値及びY軸座標値を機械学習(以下、学習という)する。機械学習装置200による学習は出荷前に行われるが、出荷後に再学習を行ってもよい。
ここで、数値制御装置100は、加工プログラムによりモータ301、302を制御し、被加工物(ワーク)を搭載しない状態で工作機械を駆動する。
教師あり学習が、完全な正解を示すのに対して、強化学習における報酬は、環境の一部の変化に基づく断片的な値であることが多い。このため、エージェントは、将来にわたっての報酬の合計を最大にするように行動を選択するように学習する。
Q学習では、或る状態Sのとき、取り得る行動Aのなかから、価値Q(S,A)の最も高い行動Aを最適な行動として選択することを目的とする。
この更新式は、状態Stにおける行動Atの価値Q(St,At)よりも、行動Atによる次の状態St+1における最良の行動の価値maxa Q(St+1,A)の方が大きければ、Q(St,At)を大きくし、逆に小さければ、Q(St,At)を小さくすることを示している。つまり、或る状態における或る行動の価値を、それによる次の状態における最良の行動の価値に近づける。ただし、その差は、割引率γと報酬rt+1のあり方により変わってくるが、基本的には、ある状態における最良の行動の価値が、それに至る一つ前の状態における行動の価値に伝播していく仕組みになっている。
「Human-level control through deep reinforcement learning」、Volodymyr Mnih1著[online]、[平成29年1月17日検索]、インターネット〈URL:http://files.davidqiu.com/research/nature14236.pdf〉
上述した強化学習を行うために、図5に示すように、機械学習装置200は、状態情報取得部201、学習部202、行動情報出力部203、価値関数記憶部204、及び最適化行動情報出力部205を備える。学習部202は報酬出力部2021、価値関数更新部2022、及び行動情報生成部2023を備える。
状態情報取得部201は、状態情報Sを学習部202に対して出力する。
なお、内部指令の座標値xi、yiは予め製造者又はユーザが工作機械を調整している場合には、調整済の値を初期値として機械学習してもよい。
報酬出力部2021は、加工プログラムの指令により得られる指令経路(例えば図3の指令経路)の位置と、モータ301、302から出力される位置検出値により得られる、補正した実際の加工経路(例えば図3の補正した加工経路)の位置との差rの積分を評価関数とする。この差rは補正後の内回り量となる。加工プログラムの指令経路のX軸の座標値をx1、Y軸の座標値をy1で示し、座標値x1、y1に対応する、補正した実際の加工経路(例えば図3の補正した加工経路)のX軸の座標値をx2、Y軸の座標値をy2で示すと、評価関数fは、以下の数式2(以下に数2として示す)の評価関数f1を用いることができる。
ここで、状態Sにおける評価関数fの値をf(S)、状態情報S´に係る評価関数fの値をf(S´)で示す。
このとき、行動情報Aにより修正された状態情報S´に係る評価関数値f(S´)が、行動情報Aにより修正される前の状態情報Sに係る修正前の評価関数f(S)よりも大きくなった場合に、報酬出力部2021は、報酬の値を第1の負の値とする。
、評価関数f(S´)が、評価関数f(S)と等しい場合は、報酬出力部2021は、報酬の値をゼロとする。
報酬出力部2021は、モータ301、302から出力される位置検出値(位置情報)から、補正した実際の加工経路(例えば図3の補正した加工経路)での加工時間をカウントする。例えば図3において点Aでモータ301が回転を開始し、点Fでモータ302が回転を停止するまで時間を加工時間とする。なお、加工時間は、数値制御装置100によってモータ301、302から出力される位置検出値からカウントされ、状態情報取得部201が状態情報として取得してもよい。
値T(S´)>値T(S)の場合は、報酬を正の第2の値とする。
値T(S´)=値T(S)の場合は、報酬を正の第2の値より大きい正の第3の値とする。ゼロとする。
値T(S´)<値T(S)の場合は、報酬を正の第3の値より大きい正の第4の値とする。
なお、報酬の値の与え方はこれに限定されず、例えば、値T(S´)>値T(S)の場合は報酬をゼロとし、値T(S´)=値T(S)及び値T(S´)<値T(S)の場合は報酬を同じ正の値としてもよい。
以上説明した、加工精度に基づく報酬及び加工時間に基づく報酬の算出において、設定される報酬の値は、加工精度が加工時間よりも優先されるように設定されることが望ましい。加工精度が低い場合には被加工物の品質が低下するからである。
価値関数Qの更新は、オンライン学習で行ってもよく、バッチ学習で行ってもよく、ミニバッチ学習で行ってもよい。
より具体的には、最適化行動情報出力部205は、価値関数記憶部204が記憶している価値関数Qを取得する。この価値関数Qは、上述したように価値関数更新部2022がQ学習を行うことにより更新したものである。そして、最適化行動情報出力部205は、価値関数Qに基づいて、行動情報を生成し、生成した行動情報を指令フィルタ110に対して出力する。この最適化行動情報には、行動情報出力部203がQ学習の過程において出力する行動情報と同様に、内部指令生成部102の内部指令の座標値xi、yiを修正する情報が含まれる。
機械学習装置200は、以上の動作で、内部指令生成部102の座標値xi、yiの最適化を行い、加工精度を向上し、加工時間を短縮するように動作することができる。
図6は2つのブロックを有する指令に基づく加工経路におけるX軸及びY軸の速度と時間との関係を示す特性図である。図7は5つのブロックを有する内部指令に基づく、補正された加工経路におけるX軸及びY軸の速度と時間との関係を示す特性図である。
2つのブロックを有する指令に基づく加工経路では、図6に示すように、X軸の速度が減速を開始する時刻にY軸の速度が加速を開始する。一方、5つのブロックを有する内部指令に基づく、補正された加工経路では、図7に示すように、X軸の速度が減速を開始する時刻前からY軸の速度が加速され、X軸の速度が減速を開始する時刻ではY軸は既に加速を完了しているため、加工時間を短縮することができる。
これらの機能ブロックを実現するために、数値制御装置100及び機械学習装置200は、CPU(Central Processing Unit)等の演算処理装置を備える。また、数値制御装置100及び機械学習装置200は、アプリケーションソフトウェアやOS(Operating System)等の各種の制御用プログラムを格納したHDD(Hard Disk Drive)等の補助記憶装置や、演算処理装置がプログラムを実行する上で一時的に必要とされるデータを格納するためのRAM(Random Access Memory)といった主記憶装置も備える。
なお、数値制御装置100は機械学習装置200を含んでもよく、この場合、CPU(Central Processing Unit)等の演算処理装置、補助記憶装置及び主記憶装置は共用され、数値制御装置100及び機械学習装置200に対してそれぞれ設ける必要はなくなる。
f(S’)>f(S)である場合は、ステップS144で報酬を負の第1の値とする。f(S’)=f(S)である場合は、ステップS145で報酬をゼロとする。f(S’)<f(S)である場合は、ステップS146で報酬を正の第1の値とする。
T(S´)>T(S)の場合は、ステップS148で報酬を第2の正の値とする。T(S´)=T(S)の場合は、ステップS149で報酬を第2の正の値より大きい第3の正の値とする。T(S´)<値T(S)の場合は、ステップS150で報酬を第3の正の値より大きい第4の正の値とする。
なお、ステップS15はオンライン更新を例示しているが、オンライン更新に替えてバッチ更新又はミニバッチ更新に置き換えてもよい。
まず、ステップS21において、最適化行動情報出力部205は、価値関数記憶部204に記憶している価値関数Qを取得する。価値関数Qは、上述したように価値関数更新部2022がQ学習を行うことにより更新したものである。
上記のモータ制御装置のサーボ制御部及び機械学習装置に含まれる各構成部は、ハードウェア、ソフトウェア又はこれらの組み合わせにより実現することができる。また、上記のモータ制御装置に含まれる各構成部のそれぞれの協働により行なわれるサーボ制御方法も、ハードウェア、ソフトウェア又はこれらの組み合わせにより実現することができる。ここで、ソフトウェアによって実現されるとは、コンピュータがプログラムを読み込んで実行することにより実現されることを意味する。
<機械学習装置がネットワークを介して数値制御装置の外部に設けられた変形例>
図12は数値制御システムの他の構成例を示すブロック図である。図12に示す数値制御システム10Aが、図1に示した数値制御システム10と異なる点は、n(nは2以上の自然数)個の数値制御装置100A-1~100A-nがネットワーク400を介して機械学習装置200A-1~200A-nが接続されていることである。図12では、モータ301、302は省略されているが、モータ301、302は数値制御装置100A-1~100A-nのそれぞれに対して接続されている。機械学習装置200A-1~200A-nは図5に示した機械学習装置200と同じ構成を有している。
上述した実施形態では、数値制御装置100A-1~100A-nと、機械学習装置200A-1~200A-nとはそれぞれ1対1の組とされて通信可能に接続されているが、例えば1台の機械学習装置が複数の数値制御装置とネットワーク400を介して通信可能に接続され、各モータ制御装置と各工作機械の機械学習を実施するようにしてもよい。
その際、1台の機械学習装置の各機能を、適宜複数のサーバに分散する、分散処理システムとしてもよい。また、クラウド上で仮想サーバ機能等を利用して、1台の機械学習装置の各機能を実現してもよい。
(1)本開示の一態様は、加工プログラムを解析し、該加工プログラムに2個のブロックからなるコーナー部を含む第1の指令が含まれる場合に、該2個のブロックを該2個よりも多いm個(mは自然数)以上のブロックに替えた第2の指令を生成する数値制御装置に対して機械学習を行う機械学習装置であって、
前記第1の指令、前記m個以上のブロックの各ブロックの座標値、及び前記加工プログラムを前記数値制御装置が実行することで得られる加工経路の位置情報を含む状態情報を、取得する状態情報取得手段と、
前記状態情報に含まれる前記m個以上のブロックの各ブロックの座標値の調整情報を含む行動情報を前記数値制御装置に出力する行動情報出力手段と、
前記状態情報に含まれる前記第1の指令及び前記加工経路の位置情報を用いて算出される前記コーナー部の内回り量と、加工時間とに基づく、強化学習における報酬の値を出力する報酬出力手段と、
前記報酬出力手段により出力される報酬の値と、前記状態情報と、前記行動情報とに基づいて価値関数を更新する価値関数更新手段と、
を備える機械学習装置である。
この機械学習装置によれば、内回り量を削減するとともに加工時間を短縮することができる。
この機械学習装置によれば、数値制御装置に加工時間をカウントする機能を設ける必要がなくなる。
この数値制御システムによれば、内回り量を削減するとともに加工時間を短縮することができる。
前記第1の指令、前記m個以上のブロックの各ブロックの座標値、及び前記加工プログラムを前記数値制御装置が実行することで得られる加工経路の位置情報を含む状態情報を、取得し、
前記状態情報に含まれる前記m個以上のブロックの各ブロックの座標値の調整情報を含む行動情報を前記数値制御装置に出力し、
前記状態情報に含まれる前記第1の指令及び前記加工経路の位置情報を用いて算出される前記コーナー部の内回り量と、加工時間とに基づく、強化学習における報酬の値を求め、
前記報酬の値と、前記状態情報と、前記行動情報とに基づいて価値関数を更新する、
機械学習方法である。
この機械学習方法によれば、内回り量を削減するとともに加工時間を短縮することができる。
100、100A-1~100A-n 数値制御装置
101 指令解析部
102 内部指令生成部
103 補間部
104 加減速制御部
105 X軸サーボ制御部
106 Y軸サーボ制御部
200 機械学習装置
200A-1~200A-n 機械学習装置
201 状態情報取得部
202 学習部
203 行動情報出力部
204 価値関数記憶部
205 最適化行動情報出力部
400 ネットワーク
Claims (5)
- 加工プログラムを解析し、該加工プログラムに2個のブロックからなるコーナー部を含む第1の指令が含まれる場合に、該2個のブロックを該2個よりも多いm個(mは自然数)以上のブロックに替えた第2の指令を生成する数値制御装置に対して機械学習を行う機械学習装置であって、
前記第1の指令、前記m個以上のブロックの各ブロックの座標値、及び前記加工プログラムを前記数値制御装置が実行することで得られる加工経路の位置情報を含む状態情報を、取得する状態情報取得手段と、
前記状態情報に含まれる前記m個以上のブロックの各ブロックの座標値の調整情報を含む行動情報を前記数値制御装置に出力する行動情報出力手段と、
前記状態情報に含まれる前記第1の指令及び前記加工経路の位置情報を用いて算出される前記コーナー部の内回り量と、加工時間とに基づく、強化学習における報酬の値を出力する報酬出力手段と、
前記報酬出力手段により出力される報酬の値と、前記状態情報と、前記行動情報とに基づいて価値関数を更新する価値関数更新手段と、
を備える機械学習装置。 - 前記加工時間は前記位置情報を用いてカウントされる請求項1に記載の機械学習装置。
- 前記価値関数更新手段により更新された価値関数に基づいて、前記m個以上のブロックの各ブロックの座標値を生成して出力する最適化行動情報出力手段を備えた請求項1又は2に記載の機械学習装置。
- 請求項1から3のいずれか1項に記載の機械学習装置と、該機械学習装置によって、前記m個以上のブロックの各ブロックの座標値が機械学習される数値制御装置とを有する数値制御システム。
- 加工プログラムを解析し、該加工プログラムに2個のブロックからなるコーナー部を含む第1の指令が含まれる場合に、該2個のブロックを該2個よりも多いm個(mは自然数)以上のブロックに替えた第2の指令を生成する数値制御装置に対して機械学習を行う機械学習装置の機械学習方法であって、
前記第1の指令、前記m個以上のブロックの各ブロックの座標値、及び前記加工プログラムを前記数値制御装置が実行することで得られる加工経路の位置情報を含む状態情報を、取得し、
前記状態情報に含まれる前記m個以上のブロックの各ブロックの座標値の調整情報を含む行動情報を前記数値制御装置に出力し、
前記状態情報に含まれる前記第1の指令及び前記加工経路の位置情報を用いて算出される前記コーナー部の内回り量と、加工時間とに基づく、強化学習における報酬の値を求め、
前記報酬の値と、前記状態情報と、前記行動情報とに基づいて価値関数を更新する、
機械学習方法。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019084477A JP7010877B2 (ja) | 2019-04-25 | 2019-04-25 | 機械学習装置、数値制御システム及び機械学習方法 |
US16/828,021 US11640557B2 (en) | 2019-04-25 | 2020-03-24 | Machine learning device, numerical control system, and machine learning method |
DE102020204854.1A DE102020204854A1 (de) | 2019-04-25 | 2020-04-16 | Vorrichtung für maschinelles Lernen, numerisches Steuersystem undVerfahren für maschinelles Lernen |
CN202010323648.8A CN111857052B (zh) | 2019-04-25 | 2020-04-22 | 机器学习装置、数值控制系统以及机器学习方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019084477A JP7010877B2 (ja) | 2019-04-25 | 2019-04-25 | 機械学習装置、数値制御システム及び機械学習方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020181403A JP2020181403A (ja) | 2020-11-05 |
JP7010877B2 true JP7010877B2 (ja) | 2022-01-26 |
Family
ID=72839760
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019084477A Active JP7010877B2 (ja) | 2019-04-25 | 2019-04-25 | 機械学習装置、数値制御システム及び機械学習方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US11640557B2 (ja) |
JP (1) | JP7010877B2 (ja) |
CN (1) | CN111857052B (ja) |
DE (1) | DE102020204854A1 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018083667A1 (en) * | 2016-11-04 | 2018-05-11 | Deepmind Technologies Limited | Reinforcement learning systems |
JP6564432B2 (ja) * | 2017-08-29 | 2019-08-21 | ファナック株式会社 | 機械学習装置、制御システム、制御装置、及び機械学習方法 |
EP4012520B1 (en) * | 2019-09-02 | 2023-05-10 | Yamazaki Mazak Corporation | Control device, machine tool, calculation method, and program |
DE112021005768T5 (de) * | 2021-01-08 | 2023-08-17 | Mitsubishi Electric Corporation | Maschinenbearbeitungsprogramm-Modifikationsgerät, numerisches Steuerungsgerät, Maschinenbearbeitungsprogramm-Modifikationsverfahren und Maschinenlerngerät |
CN113905606B (zh) * | 2021-09-13 | 2022-09-30 | 中国地质大学(武汉) | 基于深度强化学习的贴片机贴装调度模型训练方法 |
CN114690707B (zh) * | 2021-12-01 | 2023-08-18 | 南京工业大学 | 一种基于改进bp神经网络的数控成形磨齿机直线轴几何综合误差辨识方法 |
CN114755974B (zh) * | 2022-04-19 | 2022-12-02 | 中科航迈数控软件(深圳)有限公司 | 复杂结构件加工路径优化方法、装置、终端及存储介质 |
WO2024042618A1 (ja) * | 2022-08-23 | 2024-02-29 | ファナック株式会社 | 制御装置及びコンピュータ読み取り可能な記録媒体 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5890208B2 (ja) | 2012-03-14 | 2016-03-22 | 日本放送協会 | パケット送信装置、パケット受信装置及びパケット伝送システム |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5890208A (ja) * | 1981-11-25 | 1983-05-28 | Yaskawa Electric Mfg Co Ltd | 自動機械におけるptp制御の軌道補正方式 |
JP2746170B2 (ja) | 1995-01-27 | 1998-04-28 | 日本電気株式会社 | 数値制御データ作成装置 |
JPH1148176A (ja) * | 1997-08-08 | 1999-02-23 | Yaskawa Electric Corp | ロボット位置教示装置 |
JP5734270B2 (ja) | 2012-12-21 | 2015-06-17 | ファナック株式会社 | コーナ角度に応じて自動的に加工経路の補正を行うワイヤ放電加工機 |
JP2017030067A (ja) * | 2015-07-30 | 2017-02-09 | ファナック株式会社 | 加工時間測定機能とオンマシン測定機能を有する制御装置付き加工装置 |
JP6169655B2 (ja) | 2015-07-30 | 2017-07-26 | ファナック株式会社 | 工作機械、シミュレーション装置、及び機械学習器 |
JP6219897B2 (ja) * | 2015-09-28 | 2017-10-25 | ファナック株式会社 | 最適な加減速を生成する工作機械 |
CN109643102B (zh) * | 2016-09-02 | 2021-10-01 | 三菱电机株式会社 | 指令值生成装置 |
JP6453919B2 (ja) | 2017-01-26 | 2019-01-16 | ファナック株式会社 | 行動情報学習装置、行動情報最適化システム及び行動情報学習プログラム |
JP6490127B2 (ja) * | 2017-03-15 | 2019-03-27 | ファナック株式会社 | 機械学習装置、サーボ制御装置、サーボ制御システム、及び機械学習方法 |
JP6499720B2 (ja) * | 2017-06-22 | 2019-04-10 | ファナック株式会社 | 機械学習装置、サーボ制御装置、サーボ制御システム、及び機械学習方法 |
JP6608879B2 (ja) * | 2017-07-21 | 2019-11-20 | ファナック株式会社 | 機械学習装置、数値制御装置、数値制御システム、及び機械学習方法 |
JP6564432B2 (ja) * | 2017-08-29 | 2019-08-21 | ファナック株式会社 | 機械学習装置、制御システム、制御装置、及び機械学習方法 |
JP6740199B2 (ja) * | 2017-10-30 | 2020-08-12 | ファナック株式会社 | 数値制御装置、cnc工作機械、数値制御方法及び数値制御用プログラム |
-
2019
- 2019-04-25 JP JP2019084477A patent/JP7010877B2/ja active Active
-
2020
- 2020-03-24 US US16/828,021 patent/US11640557B2/en active Active
- 2020-04-16 DE DE102020204854.1A patent/DE102020204854A1/de active Pending
- 2020-04-22 CN CN202010323648.8A patent/CN111857052B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5890208B2 (ja) | 2012-03-14 | 2016-03-22 | 日本放送協会 | パケット送信装置、パケット受信装置及びパケット伝送システム |
Also Published As
Publication number | Publication date |
---|---|
US11640557B2 (en) | 2023-05-02 |
DE102020204854A8 (de) | 2020-12-10 |
JP2020181403A (ja) | 2020-11-05 |
US20200342356A1 (en) | 2020-10-29 |
CN111857052B (zh) | 2024-03-22 |
CN111857052A (zh) | 2020-10-30 |
DE102020204854A1 (de) | 2020-10-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7010877B2 (ja) | 機械学習装置、数値制御システム及び機械学習方法 | |
US10921774B2 (en) | Machine learning devices and methods for optimizing the speed and accuracy of thread mill, inner diameter, outer shape, and surface machine tools | |
JP6453919B2 (ja) | 行動情報学習装置、行動情報最適化システム及び行動情報学習プログラム | |
JP6490127B2 (ja) | 機械学習装置、サーボ制御装置、サーボ制御システム、及び機械学習方法 | |
US10747193B2 (en) | Machine learning apparatus, servo control apparatus, servo control system, and machine learning method | |
JP6474449B2 (ja) | 調整装置及び調整方法 | |
US10824121B2 (en) | Machine learning device, servo motor controller, servo motor control system, and machine learning method | |
JP6748135B2 (ja) | 機械学習装置、サーボ制御装置、サーボ制御システム、及び機械学習方法 | |
US11914333B2 (en) | Machine learning device, servo control device, servo control system, and machine learning method | |
JP6784722B2 (ja) | 出力装置、制御装置、及び評価関数値の出力方法 | |
JP6453921B2 (ja) | 学習モデル構築装置、及び制御情報最適化装置 | |
JP6841801B2 (ja) | 機械学習装置、制御システム及び機械学習方法 | |
JP6978452B2 (ja) | 機械学習装置、制御装置、及び機械学習の探索範囲の設定方法 | |
JP2018077778A (ja) | 数値制御装置 | |
JP6806746B2 (ja) | モータ制御装置 | |
JP7175403B2 (ja) | 加工プログラム変換装置、数値制御装置および加工プログラムの変換方法 | |
JP6740263B2 (ja) | 機械学習装置、サーボモータ制御装置、サーボモータ制御システム、及び機械学習方法 | |
JP7166488B1 (ja) | 数値制御装置、加工システム、数値制御方法および加工方法 | |
JP6836540B2 (ja) | 情報処理装置及び情報処理方法 | |
WO2021187268A1 (ja) | 機械学習装置、数値制御システム、設定装置、数値制御装置、及び機械学習方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200909 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210818 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210831 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20211214 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220113 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7010877 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |