JP6814441B2 - Learning control device and learning control method for drive machines - Google Patents
Learning control device and learning control method for drive machines Download PDFInfo
- Publication number
- JP6814441B2 JP6814441B2 JP2017167080A JP2017167080A JP6814441B2 JP 6814441 B2 JP6814441 B2 JP 6814441B2 JP 2017167080 A JP2017167080 A JP 2017167080A JP 2017167080 A JP2017167080 A JP 2017167080A JP 6814441 B2 JP6814441 B2 JP 6814441B2
- Authority
- JP
- Japan
- Prior art keywords
- learning
- physical quantity
- signal
- target
- output signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 49
- 230000003252 repetitive effect Effects 0.000 claims description 37
- 238000004364 calculation method Methods 0.000 claims description 25
- 238000013178 mathematical model Methods 0.000 claims description 6
- 238000009941 weaving Methods 0.000 description 59
- 238000003466 welding Methods 0.000 description 59
- 230000001133 acceleration Effects 0.000 description 15
- 238000010586 diagram Methods 0.000 description 14
- 238000007796 conventional method Methods 0.000 description 13
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 11
- 238000012937 correction Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 7
- 230000006399 behavior Effects 0.000 description 5
- 238000010276 construction Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 239000002184 metal Substances 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000007789 gas Substances 0.000 description 1
- 239000011261 inert gas Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Landscapes
- Numerical Control (AREA)
- Manipulator (AREA)
Description
本発明は、繰り返し動作を行う駆動機械を制御するための学習制御装置及び学習制御方法に関する。 The present invention relates to a learning control device and a learning control method for controlling a driving machine that repeatedly operates.
一定の動作パターンを繰り返すロボット等の駆動機械が動作する場合に、駆動機械の固有振動に伴う振動が発生し、これによって高精度に動作の制御を行えないという問題がある。従来、かかる問題を解決するために、例えば機械先端点等の対象部位の前回周期における位置又は軌道誤差を求め、次回周期における位置又は軌道誤差を低減するように駆動機械を制御し、これを繰り返すことで位置又は軌道誤差を0付近までに収束させる学習制御方法が提案されている(特許文献1及び2参照)。 When a driving machine such as a robot that repeats a certain operation pattern operates, there is a problem that vibration is generated due to the natural vibration of the driving machine, and the operation cannot be controlled with high accuracy. Conventionally, in order to solve such a problem, for example, the position or trajectory error of a target part such as a machine tip point in the previous cycle is obtained, the drive machine is controlled so as to reduce the position or trajectory error in the next cycle, and this is repeated. Therefore, a learning control method for converging the position or orbital error to near 0 has been proposed (see Patent Documents 1 and 2).
特許文献1に開示された方法は、機械先端点に取り付けられた加速度センサによる検出加速度に基づいて機械先端点の本来の位置からのずれ量Δθを求め、位置指令Pcから位置フィードバックP1を減じて第1の位置偏差ε1を求め、第1の位置偏差ε1にずれ量Δθを加算して第2の位置偏差ε2を求め、第2の位置偏差ε2から補正量を求め、これを第1の位置偏差ε1に加算して速度指令Vcを求めるというものである。 In the method disclosed in Patent Document 1, the deviation amount Δθ from the original position of the machine tip point is obtained based on the detected acceleration by the acceleration sensor attached to the machine tip point, and the position feedback P1 is subtracted from the position command Pc. The first position deviation ε1 is obtained, the deviation amount Δθ is added to the first position deviation ε1 to obtain the second position deviation ε2, the correction amount is obtained from the second position deviation ε2, and this is the first position. The speed command Vc is obtained by adding to the deviation ε1.
特許文献2に開示された方法は、多関節ロボットの制御対象部位に設けられたセンサの検出結果から制御対象部位の位置を算出し、位置誤差を補正するための学習補正量を算出し、学習補正量に基づいて、制御対象部位の目標位置に関する位置指令データから算出される位置偏差データを補正し、補正された位置偏差データに基づいて多関節ロボットを所定の動作速度で動作させるというものである。この方法では、学習補正量の算出過程において、最大動作速度に至るまで多関節ロボットの動作速度を増加させながら学習補正量を算出する。 The method disclosed in Patent Document 2 calculates the position of the control target part from the detection result of the sensor provided in the control target part of the articulated robot, calculates the learning correction amount for correcting the position error, and learns. Based on the correction amount, the position deviation data calculated from the position command data related to the target position of the control target part is corrected, and the articulated robot is operated at a predetermined operation speed based on the corrected position deviation data. is there. In this method, in the process of calculating the learning correction amount, the learning correction amount is calculated while increasing the operation speed of the articulated robot up to the maximum operation speed.
多関節ロボットのような多入出力システムでは、1つの入力が1つの出力に影響するだけでなく、他の出力にも干渉する。したがって、1つの出力の制御に1つの入力を用いただけでは、この出力の制御を正確に行うことはできない。しかしながら、上記の特許文献1及び2には、かかる多入出力システムにおける干渉問題が考慮されておらず、干渉を抑制した正確な制御を行うことはできない。 In a multi-input / output system such as an articulated robot, one input not only affects one output, but also interferes with other outputs. Therefore, it is not possible to accurately control this output by using only one input for controlling one output. However, the above-mentioned Patent Documents 1 and 2 do not consider the interference problem in such a multi-input / output system, and accurate control that suppresses the interference cannot be performed.
本発明は斯かる事情に鑑みてなされたものであり、その主たる目的は、上記課題を解決することができる駆動機械の学習制御装置及び学習制御方法を提供することにある。 The present invention has been made in view of such circumstances, and a main object thereof is to provide a learning control device and a learning control method for a drive machine capable of solving the above problems.
上述した課題を解決するために、本発明の一の態様の駆動機械の学習制御装置は、複数の可動部位を有する駆動機械に一定の繰り返し動作を複数回実行させるように制御する駆動機械の学習制御装置であって、前記駆動機械の前記可動部位である複数の対象部位それぞれにおいて観測された位置に関する物理量である観測物理量を取得する観測物理量取得手段と、N回目の前記繰り返し動作における前記複数の対象部位それぞれに対する目標の前記物理量である目標物理量のそれぞれと、前記観測物理量取得手段によってN回目の前記繰り返し動作において取得された前記複数の対象部位それぞれに対する前記観測物理量のそれぞれとに基づいて、前記複数の対象部位毎に学習出力信号を生成する学習制御手段と、前記学習制御手段によって生成された前記学習出力信号に基づいて、N+1回目の前記繰り返し動作を前記駆動機械に実行させるための制御信号を、前記複数の対象部位それぞれに対して生成する制御信号生成手段とを備える。 In order to solve the above-mentioned problems, the learning control device for a driving machine according to one aspect of the present invention is for learning a driving machine that controls a driving machine having a plurality of movable parts to execute a certain repetitive operation a plurality of times. An observation physical quantity acquisition means for acquiring an observation physical quantity which is a physical quantity related to a position observed at each of a plurality of target parts which are the movable parts of the drive machine, and the plurality of the control devices in the Nth repetitive operation. Based on each of the target physical quantities which are the target physical quantities for each target part and each of the observed physical quantities for each of the plurality of target parts acquired in the Nth repetitive operation by the observed physical quantity acquisition means. A control signal for causing the driving machine to perform the N + 1th repetitive operation based on the learning control means that generates a learning output signal for each of a plurality of target parts and the learning output signal generated by the learning control means. Is provided with a control signal generation means for generating each of the plurality of target parts.
この態様において、前記学習制御手段は、前記駆動機械の時間空間におけるN回目の前記繰り返し動作における前記目標物理量及び前記観測物理量を、所定の基底信号の射影空間に射影した目標物理量射影成分及び観測物理量射影成分を算出する射影手段と、前記射影手段により算出されたN回目の前記繰り返し動作における前記目標物理量射影成分及び前記観測物理量射影成分に基づいて、N+1回目の前記繰り返し動作における前記射影空間での学習出力信号射影成分を算出する学習出力射影成分算出手段と、前記学習出力射影成分算出手段により算出された前記学習出力信号射影成分に基づいて、N+1回目の前記繰り返し動作における前記時間空間での前記学習出力信号を算出する学習出力信号算出手段とを有してもよい。 In this embodiment, the learning control means projects the target physical quantity and the observed physical quantity in the Nth repetitive operation in the time space of the driving machine onto a projection space of a predetermined base signal, and the target physical quantity projection component and the observed physical quantity. Based on the projection means for calculating the projection component, the target physical quantity projection component in the Nth repetitive operation calculated by the projection means, and the observed physical quantity projection component, in the projection space in the N + 1th repetitive operation. Based on the learning output projection component calculating means for calculating the learning output signal projection component and the learning output signal projection component calculated by the learning output projection component calculating means, the said in the time space in the N + 1th repetitive operation. It may have a learning output signal calculating means for calculating a learning output signal.
また、上記態様において、前記学習出力射影成分算出手段は、前記時間空間における前記観測物理量と前記学習出力信号との関係を示す数理モデルを前記射影空間における数理モデルに変換した射影空間モデルに基づいて構成された制御器により、前記学習出力信号射影成分を算出するように構成されていてもよい。 Further, in the above aspect, the learning output projection component calculation means is based on a projection space model obtained by converting a mathematical model showing the relationship between the observed physical quantity in the time space and the learning output signal into a mathematical model in the projection space. The controller may be configured to calculate the learning output signal projection component.
また、上記態様において、前記学習出力射影成分算出手段は、前記射影空間モデルを定常誤差ゼロで安定化させる制御器として構成されていてもよい。 Further, in the above aspect, the learning output projective component calculation means may be configured as a controller that stabilizes the projective space model with a steady error of zero.
また、上記態様において、前記基底信号は、前記対象部位の追従誤差に関する信号であってもよい。 Further, in the above aspect, the base signal may be a signal relating to the tracking error of the target portion.
また、上記態様において、前記基底信号は、前記繰り返し動作の周波数の整数倍の周波数成分を有する正弦波信号の組合せであってもよい。 Further, in the above aspect, the base signal may be a combination of sinusoidal signals having a frequency component that is an integral multiple of the frequency of the repetitive operation.
また、本発明の他の態様の駆動機械の学習制御方法は、複数の可動部位を有する駆動機械に一定の繰り返し動作を複数回実行させるように制御する駆動機械の学習制御方法であって、前記駆動機械の前記可動部位である複数の対象部位それぞれにおいて観測された位置に関する物理量である観測物理量を取得するステップと、N回目の前記繰り返し動作における前記複数の対象部位それぞれに対する目標の前記物理量である目標物理量のそれぞれと、N回目の前記繰り返し動作において取得された前記複数の対象部位それぞれに対する前記観測物理量のそれぞれとに基づいて、前記複数の対象部位毎に学習出力信号を生成するステップと、生成された前記学習出力信号に基づいて、N+1回目の前記繰り返し動作を前記駆動機械に実行させるための制御信号を、前記複数の対象部位それぞれに対して生成するステップとを有する。 Further, the learning control method for a driving machine according to another aspect of the present invention is a learning control method for a driving machine that controls a driving machine having a plurality of movable parts to execute a certain repetitive operation a plurality of times. The step of acquiring the observed physical quantity, which is a physical quantity related to the position observed in each of the plurality of target parts, which are the movable parts of the drive machine, and the target physical quantity for each of the plurality of target parts in the Nth repetitive operation. A step of generating a learning output signal for each of the plurality of target parts based on each of the target physical quantities and each of the observed physical quantities for each of the plurality of target parts acquired in the Nth repetitive operation. Based on the learned output signal, the step includes a step of generating a control signal for causing the driving machine to execute the N + 1th repetitive operation for each of the plurality of target parts.
本発明に係る駆動機械の学習制御装置及び学習制御方法によれば、多入出力システムにおける出力に対する入力の干渉を抑制することが可能となる。 According to the learning control device and the learning control method of the drive machine according to the present invention, it is possible to suppress the interference of the input with respect to the output in the multi-input / output system.
以下、本発明の好ましい実施の形態を、図面を参照しながら説明する。なお、以下に示す各実施の形態は、本発明の技術的思想を具体化するための方法及び装置を例示するものであって、本発明の技術的思想は下記のものに限定されるわけではない。本発明の技術的思想は、特許請求の範囲に記載された技術的範囲内において種々の変更を加えることができる。また、以下に示す各実施の形態では多関節マニピュレータの溶接ロボットを例に挙げて説明するが、本発明の適用対象はこれらに限定されるわけではなく、多入出力システムであれば多関節マニピュレータ以外の駆動機械を適用対象とすることも可能である。 Hereinafter, preferred embodiments of the present invention will be described with reference to the drawings. It should be noted that each of the embodiments shown below exemplifies a method and an apparatus for embodying the technical idea of the present invention, and the technical idea of the present invention is not limited to the following. Absent. The technical idea of the present invention can be modified in various ways within the technical scope described in the claims. Further, in each of the following embodiments, a welding robot of an articulated manipulator will be described as an example, but the application target of the present invention is not limited to these, and if it is an articulated input / output system, the articulated manipulator It is also possible to apply other drive machines.
<自動溶接システムの構成>
図1は、本実施の形態に係る自動溶接システムの構成を示す模式図である。自動溶接システム10は、溶接ロボット20と、学習制御装置30と、電源装置40とを備えている。
<Structure of automatic welding system>
FIG. 1 is a schematic view showing a configuration of an automatic welding system according to the present embodiment. The automatic welding system 10 includes a welding robot 20, a learning control device 30, and a power supply device 40.
溶接ロボット20は、垂直多関節型のマニピュレータから構成され、その先端に溶接トーチ21を有している。本実施の形態に係る溶接ロボット20は、MIG(Metal Inert Gas)溶接又はMAG(Metal Active Gas)溶接等の溶極式のアーク溶接を行う。かかる溶接ロボット20は、学習制御装置30及び電源装置40のそれぞれに接続されている。 The welding robot 20 is composed of a vertical articulated manipulator, and has a welding torch 21 at its tip. The welding robot 20 according to the present embodiment performs welding electrode type arc welding such as MIG (Metal Inert Gas) welding or MAG (Metal Active Gas) welding. The welding robot 20 is connected to each of the learning control device 30 and the power supply device 40.
溶接トーチ21にはワイヤ送給装置23から溶接ワイヤ24が送り込まれ、溶接トーチ21の先端からこれが送り出される。電源装置40は定電圧電源装置であり、溶接ワイヤ24に電力を供給する。これにより、溶接ワイヤ24とワーク(被溶接材)50との間に溶接電圧が印加され、アークが発生する。また、溶接ロボット20の先端部位、即ち溶接トーチ21を支持するアームの先端部分には、加速度センサ25が設けられている。加速度センサ25は、学習制御装置30に接続されている。電源装置40は、溶接中に生じる溶接電流を検出する電流センサ(図示せず)を備えている。 The welding wire 24 is sent from the wire feeding device 23 to the welding torch 21, and is sent out from the tip of the welding torch 21. The power supply device 40 is a constant voltage power supply device and supplies electric power to the welding wire 24. As a result, a welding voltage is applied between the welding wire 24 and the work (material to be welded) 50, and an arc is generated. Further, an acceleration sensor 25 is provided at the tip portion of the welding robot 20, that is, the tip portion of the arm that supports the welding torch 21. The acceleration sensor 25 is connected to the learning control device 30. The power supply device 40 includes a current sensor (not shown) that detects a welding current generated during welding.
電源装置40は、CPUとメモリとを備えており、電源制御用のコンピュータプログラムをCPUが実行することで溶接電力の制御を行う。また、電源装置40はワイヤ送給装置23に接続されており、CPUがワイヤの送給速度を制御する。かかる電源装置40は、学習制御装置30との間でデータ通信を行う。 The power supply device 40 includes a CPU and a memory, and controls welding power by executing a computer program for power supply control by the CPU. Further, the power supply device 40 is connected to the wire feeding device 23, and the CPU controls the wire feeding speed. The power supply device 40 performs data communication with the learning control device 30.
次に、学習制御装置30の構成について説明する。学習制御装置30は、溶接ロボット20の動作を制御する。図2は、学習制御装置30の構成を示すブロック図である。学習制御装置30は、CPU301と、メモリ302と、複数のスイッチを含む操作パネル303と、教示ペンダント304と、入出力部305と、通信部306とを備えている。 Next, the configuration of the learning control device 30 will be described. The learning control device 30 controls the operation of the welding robot 20. FIG. 2 is a block diagram showing the configuration of the learning control device 30. The learning control device 30 includes a CPU 301, a memory 302, an operation panel 303 including a plurality of switches, a teaching pendant 304, an input / output unit 305, and a communication unit 306.
溶接ロボット20の学習制御用のコンピュータプログラムである学習制御プログラム310がメモリ302に格納されており、この学習制御プログラム310をCPU301が実行することで、溶接ロボット20による溶接動作の学習制御が行われる。 A learning control program 310, which is a computer program for learning control of the welding robot 20, is stored in the memory 302. When the CPU 301 executes the learning control program 310, the welding robot 20 performs learning control of the welding operation. ..
学習制御装置30に対する指示の入力には、操作パネル303及び教示ペンダント304が用いられる。オペレータは、教示ペンダント304に教示プログラムを入力することができる。学習制御装置30は、教示ペンダント304から入力された教示プログラムにしたがって、溶接ロボット20を制御する。また、この教示プログラムは、図示しないコンピュータによって作成することも可能である。この場合、可搬型記録媒体によって受け渡ししたり、データ通信によって伝送したりして、教示プログラムを学習制御装置30に与えることができる。 The operation panel 303 and the teaching pendant 304 are used for inputting instructions to the learning control device 30. The operator can input the teaching program to the teaching pendant 304. The learning control device 30 controls the welding robot 20 according to the teaching program input from the teaching pendant 304. Further, this teaching program can also be created by a computer (not shown). In this case, the teaching program can be given to the learning control device 30 by being delivered by a portable recording medium or transmitted by data communication.
入出力部305には、上述した加速度センサ25、並びに、電源装置40に設けられた電流センサ、溶接ロボット20のアクチュエータであるモータの駆動回路、角度センサ及び角速度センサ(図示せず)が接続されている。加速度センサ25によって検出された加速度、電流センサによって検出された溶接電流の電流値、溶接ロボット20の各軸のモータの回転角度及び角速度が入出力部305に入力され、CPU301に与えられる。また、CPU301は、学習制御プログラム310により、後述するような溶接ロボット20の学習制御を行い、制御信号を溶接ロボット20のモータの駆動回路それぞれに出力する。 The above-mentioned acceleration sensor 25, a current sensor provided in the power supply device 40, a drive circuit of a motor which is an actuator of the welding robot 20, an angle sensor, and an angular velocity sensor (not shown) are connected to the input / output unit 305. ing. The acceleration detected by the acceleration sensor 25, the current value of the welding current detected by the current sensor, the rotation angle and the angular velocity of the motor of each axis of the welding robot 20 are input to the input / output unit 305 and given to the CPU 301. Further, the CPU 301 performs learning control of the welding robot 20 as described later by the learning control program 310, and outputs a control signal to each of the drive circuits of the motor of the welding robot 20.
通信部306は、有線又は無線通信機能を有する。かかる通信部306は、所定の通信プロトコルを使用して電源装置40との間でデータ通信を行う。 The communication unit 306 has a wired or wireless communication function. The communication unit 306 performs data communication with the power supply device 40 using a predetermined communication protocol.
以上のような構成の学習制御装置30は、溶接ロボット20の各軸のモータを制御して、溶接トーチ21の位置及び速度を制御する。かかる学習制御装置30は、溶接ロボット20にウィービング動作を実行させる。ウィービング動作は、溶接方向に対して交差する方向に溶接トーチ21を交互に揺動させる繰り返し動作である。学習制御装置30は、設定されたウィービング周期、振幅、溶接速度によってウィービング動作を行うように溶接ロボット20を制御する。 The learning control device 30 having the above configuration controls the motor of each axis of the welding robot 20 to control the position and speed of the welding torch 21. The learning control device 30 causes the welding robot 20 to perform a weaving operation. The weaving operation is a repetitive operation in which the welding torch 21 is alternately swung in a direction intersecting the welding direction. The learning control device 30 controls the welding robot 20 so as to perform the weaving operation according to the set weaving cycle, amplitude, and welding speed.
<学習制御の原理>
図3は、本実施の形態に係る学習制御装置による制御の原理を説明するための機能ブロック図である。学習制御装置30は、溶接ロボット20に所要の動作を行わせるために各モータの角度指令を算出し、それぞれの角度指令と、各モータの角度及び角速度の測定値とに基づいて、角度指令通りにモータが動作するようにモータに電流を与える。学習制御装置300は軸毎にモータを制御する1軸目のモータ制御部311,2軸目のモータ制御部321,…の各機能ブロックを有しており、モータ制御部311,321,…は各別に角度・角速度制御部312,322,…と電流制御部313,323,…とを有している。1軸目の角度・角速度制御部312には1軸目のモータへの角度指令信号θREF,1(t)と、1軸目のモータの角度及び角速度の測定値が入力される。角度・角速度制御部312は入力された角度指令信号θREF,1(t)並びに角度及び角速度の測定値から1軸目のモータへのトルク指令を算出する。2軸目のモータ制御部321も同様にして2軸目のモータへのトルク指令を算出する。3軸目以降のモータ制御部も同様である。
<Principle of learning control>
FIG. 3 is a functional block diagram for explaining the principle of control by the learning control device according to the present embodiment. The learning control device 30 calculates an angle command for each motor in order to cause the welding robot 20 to perform a required operation, and based on each angle command and the measured values of the angle and the angular velocity of each motor, as per the angle command. Apply current to the motor so that it operates. The learning control device 300 has each functional block of the first-axis motor control unit 311, 2nd-axis motor control unit 321, ... That controls the motor for each axis, and the motor control units 311, 321, ... Each of them has an angle / angular velocity control unit 312, 322, ... And a current control unit 313, 323, .... The angle command signal θ REF, 1 (t) to the motor of the first axis and the measured values of the angle and the angular velocity of the motor of the first axis are input to the angle / angular velocity control unit 312 of the first axis. The angle / angular velocity control unit 312 calculates a torque command to the motor of the first axis from the input angle command signal θ REF, 1 (t) and the measured values of the angle and the angular velocity. The second-axis motor control unit 321 also calculates the torque command to the second-axis motor in the same manner. The same applies to the motor control unit for the third and subsequent axes.
溶接ロボット20の先端部位に設けられた加速度センサ25の検出加速度は、データ変換部314により位置データ(ロボット先端位置信号)に変換され、座標変換部315に入力される。座標変換部315は、溶接ロボット20の運動学モデルを用いて、ロボット先端位置信号(直交座標系での位置)から各軸の関節角度を示す関節角度位置信号を算出する。以下、変換された関節角度位置信号を「対象部位位置信号」という。 The detected acceleration of the acceleration sensor 25 provided at the tip portion of the welding robot 20 is converted into position data (robot tip position signal) by the data conversion unit 314 and input to the coordinate conversion unit 315. The coordinate conversion unit 315 calculates a joint angle position signal indicating the joint angle of each axis from the robot tip position signal (position in the Cartesian coordinate system) using the kinematic model of the welding robot 20. Hereinafter, the converted joint angle position signal is referred to as a “target site position signal”.
1軸目の対象部位位置信号θL,1(t),2軸目の対象部位位置信号θL,2(t),…は、ウィービング動作の各周期において取得され、学習制御部316に与えられる。また、学習制御部316には、各軸の角度指令信号θREF,1(t),θREF,2(t),…も与えられる。学習制御部316は、N回目のウィービング動作における各対象部位位置信号θL,i(t)(つまり、観測物理量)及び各角度指令信号θREF,i(t)(つまり、目標物理量)とに基づいて、N+1回目のウィービング動作用の学習出力信号zi(t)を軸(つまり、対象部位)毎に出力する。なお、iは溶接ロボット20の関節(軸)を示すインデックスである。 The target site position signals θ L, 1 (t) of the first axis, the target site position signals θ L, 2 (t), ... Of the second axis are acquired in each cycle of the weaving operation and given to the learning control unit 316. Be done. Further, the learning control unit 316 is also given angle command signals θ REF, 1 (t), θ REF, 2 (t), ... For each axis. The learning control unit 316 sets each target site position signal θ L, i (t) (that is, observed physical quantity) and each angle command signal θ REF, i (t) (that is, target physical quantity) in the Nth weaving operation. based on, and outputs the N + 1 th learning output signal z i for weaving operation (t) axis (i.e., target site) for each. Note that i is an index indicating the joint (axis) of the welding robot 20.
各軸の学習出力信号ziは、対応する軸のN+1回目のウィービング動作用のトルク指令に加算され、そのトルク指令が電流制御部313,323,…に入力される。つまり、1軸目の学習出力信号z1は、1軸目の角度・角速度制御部312から出力されたトルク指令に加算され、このトルク指令が1軸目の電流制御部313に与えられる。2軸目以降の学習出力信号z2,z3,…も同様である。電流制御部313,323,…は、与えられたトルク指令を対応するモータが出力するための電流値を算出し、これを制御信号として出力する。このようにして算出された電流値の電流が各モータに供給され、各モータが駆動される。 Learning output signal z i of each axis is added to the torque command for the N + 1 th weaving operation of the corresponding axis, the torque command current control unit 313 and 323, are input to .... In other words, learning the output signal z 1 of the first axis is added to the torque command output from the first axis angular-velocity control section 312, the torque command is given to the first axis of the current control unit 313. Biaxial subsequent learning output signal z 2, z 3, ... is the same. The current control units 313, 323, ... Calculate the current value for the corresponding motor to output the given torque command, and output this as a control signal. The current of the current value calculated in this way is supplied to each motor, and each motor is driven.
ここで、学習制御部316についてさらに詳しく説明する。図4は、学習制御部316の構成を示す機能ブロック図である。学習制御部316は、信号記憶部331と、信号射影部332と、学習出力射影成分算出部333と、学習出力信号生成部334とを有している。学習制御部316に入力された角度指令信号θREF,i(t)及び対象部位位置信号θL,i(t)は信号記憶部331に記憶される。かかる信号記憶部331は、N回目のウィービング動作1周期分の角度指令信号及び対象部位位置信号θREF,i(t),θL,i(t)(t∈[(N−1)T,NT]、T:1回のウィービング動作の期間)を記憶する。 Here, the learning control unit 316 will be described in more detail. FIG. 4 is a functional block diagram showing the configuration of the learning control unit 316. The learning control unit 316 has a signal storage unit 331, a signal projection unit 332, a learning output projection component calculation unit 333, and a learning output signal generation unit 334. The angle command signals θ REF, i (t) and the target site position signals θ L, i (t) input to the learning control unit 316 are stored in the signal storage unit 331. The signal storage unit 331 includes an angle command signal for one cycle of the Nth weaving operation and a target site position signal θ REF, i (t), θ L, i (t) (t ∈ [(N-1) T,). NT], T: The period of one weaving operation) is stored.
信号記憶部331によって記憶されたN回目のウィービング動作1周期分の角度指令信号及び対象部位位置信号θREF,i(t),θL,i(t)(t∈[(N−1)T,NT])は、信号射影部332に与えられる。信号射影部332は、角度指令信号及び対象部位位置信号θREF,i(t),θL,i(t)(t∈[(N−1)T,NT])を、次式(1)で定義される基底Fに射影し、角度指令射影成分及び対象部位位置射影成分を算出する。
ここで、基底信号Fとしては、次式(3)で表されるように、繰り返し動作の周波数1/Tの整数倍の周波数成分を有する正弦波信号の組合せとすることができる。
なお、基底信号は、対象部位の追従誤差(=角度指令信号−対象部位位置信号)の周波数成分を含むように選定することが好ましい。例えば、ロボットの固有振動による追従誤差が生じる場合には、固有振動周波数成分を有する正弦波信号を含んだ基底信号を選定する。これにより、対象部位位置信号にノイズが含まれていても、追従誤差を精度よく抽出することが可能になる。このため、このような基底信号を選定することで、ローパスフィルタ等のノイズ除去回路を設ける必要がなくなり、ローパスフィルタ等を設けることによる必要な情報の欠落、位相遅れの発生等が発生することがない。 The base signal is preferably selected so as to include the frequency component of the tracking error (= angle command signal-target site position signal) of the target site. For example, when a tracking error occurs due to the natural vibration of the robot, a base signal including a sinusoidal signal having a natural vibration frequency component is selected. This makes it possible to accurately extract the tracking error even if the target site position signal contains noise. Therefore, by selecting such a base signal, it is not necessary to provide a noise removal circuit such as a low-pass filter, and the necessary information may be lost or a phase delay may occur due to the provision of the low-pass filter or the like. Absent.
信号射影部332によって生成された角度指令射影成分及び対象部位位置射影成分のそれぞれは、学習出力射影成分算出部333に入力される。学習出力射影成分算出部333は、与えられたN回目のウィービング動作1周期分の角度指令射影成分及び対象部位位置射影成分から、N+1回目のウィービング動作用の学習出力射影成分を算出する。この学習出力射影成分算出部333は、後述する射影空間モデルに基づいて構成される。 Each of the angle command projection component and the target site position projection component generated by the signal projection unit 332 is input to the learning output projection component calculation unit 333. The learning output projection component calculation unit 333 calculates the learning output projection component for the N + 1th weaving operation from the angle command projection component and the target site position projection component for one cycle of the given Nth weaving operation. The learning output projective component calculation unit 333 is configured based on a projective space model described later.
射影空間モデルの導出について説明する。まず、時間空間において、学習出力信号を入力とし対象部位位置信号を出力とするモデルを考える。溶接ロボット20のモデルPを以下の状態空間表現とする。
ここで、2つの関節のみを有する2リンクロボットのモデルを例に挙げて説明する。図5は、2リンクロボットの構成を示す模式図である。2リンクロボット200は、2つのモータ211,212と、2つのアーム221,222とを有する。1軸目のモータ211の回転角をθM,1、2軸目のモータ212の回転角をθM,2と表し、1軸目のアーム221(1軸目のモータ211により駆動されるアーム)の回転角をθL,1、2軸目のアーム221(2軸目のモータ212により駆動されるアーム)の回転角をθL,2と表す。このとき、2リンクロボット200のモデルは、次のように表現される。
上記の2リンクロボット200の場合、次式のような状態空間表現となる。
また、制御器側のモデルCは、次のような状態表現となる。
上記のモデルPとCとを組み合わせると、以下のように対象部位位置信号θL(t)と学習出力信号z(t)との関係を示す数理モデルGを得ることができる。
ここで、上述した時間空間上の数理モデルGを基底信号の射影空間上の表現に変換した射影空間モデルを導出する。N回目の繰り返し動作開始時の状態xNを次式(5)のように定義する。
次に、上記のように導出された射影空間モデルを用いて学習出力射影成分算出部333を構築する。図6は、学習出力射影成分算出部333の構築を説明するための機能ブロック図である。射影空間モデル350を学習対象の離散時間動的システムとして扱い、射影空間モデル350の出力である対象部位位置射影成分を角度指令射影成分に一致させるための制御器351を設計し、この制御器351を学習出力射影成分算出部333とする。つまり、学習出力射影成分算出部333は、射影空間モデルに基づいて構成された制御器である。 Next, the learning output projection component calculation unit 333 is constructed using the projective space model derived as described above. FIG. 6 is a functional block diagram for explaining the construction of the learning output projection component calculation unit 333. The projective space model 350 is treated as a discrete time dynamic system to be trained, and a controller 351 for matching the target site position projection component, which is the output of the projective space model 350, with the angle command projection component is designed, and this controller 351 is used. Is a learning output projective component calculation unit 333. That is, the learning output projection component calculation unit 333 is a controller configured based on the projection space model.
ここで、繰り返し動作の場合、角度指令射影成分は一定値となる。射影空間上で考えることにより、時間により変化する角度指令信号θREF(t)への追従制御問題を、一定値への収束問題とすることができる。これにより、この離散時間動的システムを定常誤差ゼロで安定化させるような制御器(学習出力射影成分算出部)を設計すれば、対象部位位置射影成分を角度指令射影成分と一致させることが可能になり、対象部位位置信号θL(t)=角度指令信号θREF(t)とすることができる。 Here, in the case of repeated operation, the angle command projection component becomes a constant value. By considering in projective space, the tracking control problem for the angle command signal θ REF (t) that changes with time can be set as the convergence problem to a constant value. By designing a controller (learning output projection component calculation unit) that stabilizes this discrete-time dynamic system with zero steady-state error, it is possible to match the target site position projection component with the angle-command projection component. Therefore, the target site position signal θ L (t) = angle command signal θ REF (t).
図7は、学習出力射影成分算出部333の構築例を示す機能ブロック図である。図7に示すように、定常誤差ゼロで安定化させる制御器351(学習出力射影成分算出部333)の設計として、状態推定部341、状態フィードバック部342、積分サーボ部343を備えた構成とすることができる。ここで、状態推定部341は、状態推定オブザーバ、カルマンフィルタ等の状態推定方法を用いて、対象部位位置射影成分と学習出力射影成分から射影空間モデル350の状態を推定する。状態フィードバック部342は、状態推定部341で推定された状態に対して状態フィードバックゲインを乗じて出力する。積分サーボ部343は、角度指令射影成分と対象部位位置射影成分との誤差を積分し、積分ゲインKIを乗じて出力する。 FIG. 7 is a functional block diagram showing a construction example of the learning output projection component calculation unit 333. As shown in FIG. 7, the controller 351 (learning output projection component calculation unit 333) that stabilizes with zero stationary error is designed to include a state estimation unit 341, a state feedback unit 342, and an integration servo unit 343. be able to. Here, the state estimation unit 341 estimates the state of the projective space model 350 from the target site position projection component and the learning output projection component by using a state estimation method such as a state estimation observer or a Kalman filter. The state feedback unit 342 outputs the state estimated by the state estimation unit 341 by multiplying the state feedback gain. Integrating servo section 343 integrates the error between the angle command projection component and the target portion position projection component, it outputs the result integral gain K I.
ここで、N回目の繰り返し動作の終了後に動作が止まる、即ち、振動が収まるのを待つようにした場合は、状態xN=0となり、射影空間モデル350は静的システムとなる。本実施の形態では、xN≠0を考慮した動的システムに基づいて制御器である学習出力射影成分算出部333を構成したため、N回目の繰り返し動作終了後に待ち時間を入れずにN+1回目の繰り返し動作を開始し、N+1回目の繰り返し動作においてN回目の繰り返し動作において発生した振動の影響が存在する状態であっても問題なく学習制御を行うことができる。また、上記の動的システムは多入出力システムの駆動機械のモデルにより導出されたものであり、この動的システムに基づいて学習出力射影成分算出部333を構成したため、多入出力システムの駆動機械においても出力に対する入力の干渉を抑制した制御を行うことができる。 Here, when the operation is stopped after the end of the Nth repeated operation, that is, when the vibration is settled, the state x N = 0, and the projective space model 350 becomes a static system. In the present embodiment, since the learning output projection component calculation unit 333, which is a controller, is configured based on a dynamic system considering x N ≠ 0, the N + 1th time is performed without waiting after the Nth time of the repeated operation is completed. The learning control can be performed without any problem even when the repetitive operation is started and the influence of the vibration generated in the Nth repetitive operation exists in the N + 1th repetitive operation. Further, the above dynamic system is derived from the model of the drive machine of the multi-input / output system, and since the learning output projection component calculation unit 333 is configured based on this dynamic system, the drive machine of the multi-input / output system It is also possible to perform control that suppresses input interference with the output.
再び図4を参照する。上記のような学習出力射影成分算出部333によって出力された学習出力射影成分は、学習出力信号生成部334に入力される。学習出力信号生成部334は、入力された学習出力射影成分と、基底信号Fとに基づいて、次式(6)のように学習出力信号zi(t)(t∈[(N−1)T,NT])を生成する。
<学習制御装置の動作>
以下、本実施の形態に係る学習制御装置30の動作について説明する。図8は、本実施の形態に係る学習制御装置の動作の手順を示すフローチャートである。学習制御装置30のCPU301は、N回目のウィービング動作を溶接ロボット20に実行させるよう、各軸のモータの角度指令を算出し、それぞれの角度指令信号を生成する(ステップS101)。また、溶接ロボット20の各関節に設けられた角度センサ及び角速度センサから出力される角度及び角速度の測定値が学習制御装置30に与えられる。CPU301は、生成された角度指令信号と、入力された角度及び角速度の測定値とに基づいて、各軸のモータへのトルク指令(以下、「補正前トルク指令」という)を算出する(ステップS102)。ステップS102の処理は、角度・角速度制御部312,322,…により実行される(図3参照)。
<Operation of learning control device>
Hereinafter, the operation of the learning control device 30 according to the present embodiment will be described. FIG. 8 is a flowchart showing the operation procedure of the learning control device according to the present embodiment. The CPU 301 of the learning control device 30 calculates the angle command of the motor of each axis so that the welding robot 20 executes the Nth weaving operation, and generates each angle command signal (step S101). Further, the learning control device 30 is given the measured values of the angle and the angular velocity output from the angle sensor and the angular velocity sensor provided in each joint of the welding robot 20. The CPU 301 calculates a torque command (hereinafter, referred to as “pre-correction torque command”) to the motor of each axis based on the generated angle command signal and the input measured values of the angle and the angular velocity (step S102). ). The process of step S102 is executed by the angle / angular velocity control units 312, 322, ... (See FIG. 3).
次に、CPU301は、N回目(但し、ここではN≧2)のウィービング動作用の学習出力信号を、補正前トルク指令に加算して、N回目のウィービング動作用のトルク指令を軸毎に算出する(ステップS103)。この学習出力信号は、上述した学習制御部316により、N−1回目のウィービング動作用の角度指令信号、及びN−1回目のウィービング動作において検出された溶接ロボット20の先端部位の位置データから算出された対象部位位置信号に基づいて生成されたものである。 Next, the CPU 301 adds the learning output signal for the Nth weaving operation (where N ≧ 2 in this case) to the pre-correction torque command, and calculates the torque command for the Nth weaving operation for each axis. (Step S103). This learning output signal is calculated from the angle command signal for the N-1th weaving operation and the position data of the tip portion of the welding robot 20 detected in the N-1th weaving operation by the learning control unit 316 described above. It is generated based on the target site position signal.
CPU301は、トルク指令に示されるトルクを対応するモータが出力するための電流値を軸毎に算出し(ステップS104)。算出された電流値を示す制御信号を出力する(ステップS105)。これにより、電流が各モータに供給され、溶接ロボット20がN回目のウィービング動作を実行する。ステップS104の処理は、電流制御部313,323,…により実行される(図3参照)。 The CPU 301 calculates the current value for outputting the torque indicated by the torque command by the corresponding motor for each axis (step S104). A control signal indicating the calculated current value is output (step S105). As a result, an electric current is supplied to each motor, and the welding robot 20 executes the Nth weaving operation. The process of step S104 is executed by the current control units 313, 323, ... (See FIG. 3).
N回目のウィービング動作における溶接ロボット20の先端部位の加速度は、加速度センサ25によって検出される。加速度センサ25による検出加速度は学習制御装置30に与えられ、CPU301は、加速度センサ25の検出加速度から溶接ロボット20の先端部位の位置を算出し、この位置から各軸の関節角度を示す対象部位位置信号を算出する(ステップS106)。ステップS106の処理は、データ変換部314及び座標変換部315により実行される(図3参照)。 The acceleration of the tip portion of the welding robot 20 in the Nth weaving operation is detected by the acceleration sensor 25. The detected acceleration by the acceleration sensor 25 is given to the learning control device 30, and the CPU 301 calculates the position of the tip portion of the welding robot 20 from the detected acceleration of the acceleration sensor 25, and from this position, the target portion position indicating the joint angle of each axis. The signal is calculated (step S106). The process of step S106 is executed by the data conversion unit 314 and the coordinate conversion unit 315 (see FIG. 3).
CPU301は、N+1回目のウィービング動作用の学習出力信号を生成する学習出力信号生成処理を実行する(ステップS107)。ステップS107の処理は、学習制御部316により実行される(図3参照)。 The CPU 301 executes a learning output signal generation process for generating a learning output signal for the N + 1th weaving operation (step S107). The process of step S107 is executed by the learning control unit 316 (see FIG. 3).
図9は、学習出力信号生成処理の手順を示すフローチャートである。学習出力信号生成処理において、まずCPU301は、N回目のウィービング動作における各軸の対象部位位置信号と、N回目のウィービング動作のための角度指令信号とを、メモリ302内の領域である信号記憶部331に記憶させる(ステップS201)。信号記憶部331には、N回目のウィービング動作1周期分の各軸の対象部位位置信号及び角度指令信号が記憶される。 FIG. 9 is a flowchart showing the procedure of the learning output signal generation processing. In the learning output signal generation process, the CPU 301 first stores the target site position signal of each axis in the Nth weaving operation and the angle command signal for the Nth weaving operation in a signal storage unit which is an area in the memory 302. It is stored in 331 (step S201). The signal storage unit 331 stores the target site position signal and the angle command signal of each axis for one cycle of the Nth weaving operation.
次にCPU301は、信号記憶部331に記憶された角度指令信号及び対象部位位置信号を基底信号に射影し、角度指令射影成分及び対象部位位置射影成分を算出する(ステップS202)。ステップS202の処理は、信号射影部332により実行される(図4参照)。 Next, the CPU 301 projects the angle command signal and the target site position signal stored in the signal storage unit 331 onto the base signal, and calculates the angle command projection component and the target site position projection component (step S202). The process of step S202 is executed by the signal projection unit 332 (see FIG. 4).
CPU301は、N回目のウィービング動作1周期分の角度指令射影成分及び対象部位位置射影成分から、N+1回目のウィービング動作用の学習出力射影成分を算出する(ステップS203)。ステップS203の処理は、学習出力射影成分算出部333により実行される(図4参照)。次にCPU301は、学習出力射影成分と基底信号とに基づいて、N+1回目のウィービング動作用の学習出力信号を生成する(ステップS204)。ステップS204の処理は、学習出力信号生成部334により実行される(図4参照)。以上で、学習出力信号生成処理が終了する。 The CPU 301 calculates the learning output projection component for the N + 1th weaving operation from the angle command projection component and the target site position projection component for one cycle of the Nth weaving operation (step S203). The process of step S203 is executed by the learning output projection component calculation unit 333 (see FIG. 4). Next, the CPU 301 generates a learning output signal for the N + 1th weaving operation based on the learning output projection component and the base signal (step S204). The process of step S204 is executed by the learning output signal generation unit 334 (see FIG. 4). This completes the learning output signal generation process.
N+1回目のウィービング動作用の学習出力信号を生成すると、CPU301は次の周期(N+1回目)のウィービング動作用の角度指令信号の算出を開始するタイミングまで待機する(ステップS108)。次の周期のウィービング動作用の角度指令信号の算出タイミングに到達すると、CPU301はステップS101に処理を戻し、N+1回目のウィービング動作用の角度指令信号を生成し(ステップS101)、N+1回目のウィービング動作用の補正前トルク指令を算出する(ステップS102)。そして、CPU301はN+1回目のウィービング動作用の学習出力信号を、N+1回目のウィービング動作用の補正前トルク指令に加算して、N+1回目のウィービング動作用のトルク指令を軸毎に算出する(ステップS103)。以降、CPU301は、ステップS104乃至S108の処理を実行する。以上のように、ステップS108のタイミング調整処理を設けることで、前回の周期のウィービング動作に係る角度指令信号及び対象部位位置信号に基づいて生成された学習出力信号を、次回の周期のウィービング動作に係る補正前トルク指令に加算することができる。 When the learning output signal for the N + 1th weaving operation is generated, the CPU 301 waits until the timing to start the calculation of the angle command signal for the weaving operation in the next cycle (N + 1th time) (step S108). When the calculation timing of the angle command signal for the weaving operation in the next cycle is reached, the CPU 301 returns to step S101 to generate the angle command signal for the N + 1th weaving operation (step S101), and the N + 1th weaving operation. The pre-correction torque command for is calculated (step S102). Then, the CPU 301 adds the learning output signal for the N + 1th weaving operation to the pre-correction torque command for the N + 1th weaving operation, and calculates the torque command for the N + 1th weaving operation for each axis (step S103). ). After that, the CPU 301 executes the processes of steps S104 to S108. As described above, by providing the timing adjustment process of step S108, the learning output signal generated based on the angle command signal and the target site position signal related to the weaving operation of the previous cycle can be used for the weaving operation of the next cycle. It can be added to the pre-correction torque command.
以上説明したようなステップS101乃至S108の処理を繰り返し実行することにより、ウィービング動作の学習制御が繰り返し行われる。 By repeatedly executing the processes of steps S101 to S108 as described above, the learning control of the weaving operation is repeatedly performed.
以上の如く構成したことにより、本実施の形態に係る学習制御装置30によれば、多入出力システムである溶接ロボット20のN回目のウィービング動作における各軸に対する角度指令信号のそれぞれと、N回目のウィービング動作において取得された各軸に対する対象部位位置信号のそれぞれとに基づいて、各軸に対するN+1回目の学習出力信号を生成するため、溶接ロボット20の1つの軸に対する角度指令信号(入力)が他の軸の角度(出力)に干渉すること、即ち出力に対する入力の干渉を抑制することができる。 With the above configuration, according to the learning control device 30 according to the present embodiment, each of the angle command signals for each axis in the Nth weaving operation of the welding robot 20 which is a multi-input / output system and the Nth time. In order to generate the N + 1th learning output signal for each axis based on each of the target site position signals for each axis acquired in the weaving operation of, the angle command signal (input) for one axis of the welding robot 20 is generated. Interfering with the angle (output) of another axis, that is, the interference of the input with respect to the output can be suppressed.
<評価試験>
発明者は、2リンクロボットに対して学習制御を伴わないフィードバック制御(以下、「従来手法」という)と本実施の形態に係る学習制御方法(以下、「本手法」という)を実施し、本手法の性能を評価した。図10は、従来手法の構成を示す機能ブロック図である。図10に示すように、角度・角速度制御部312,322,…及び電流制御部313,323,…を有し、データ変換部314,座標変換部315,及び学習制御部316を有しない制御装置によって従来手法を実施した。また、本評価試験では、従来手法及び本手法によって、ウィービング周波数2Hz、全振幅4mmの条件でウィービング動作を2リンクロボット200に実行させた。
<Evaluation test>
The inventor has implemented feedback control without learning control (hereinafter referred to as "conventional method") and learning control method according to the present embodiment (hereinafter referred to as "this method") for the two-link robot. The performance of the method was evaluated. FIG. 10 is a functional block diagram showing the configuration of the conventional method. As shown in FIG. 10, a control device having an angle / angular velocity control unit 312, 322, ..., a current control unit 313, 323, ..., And not having a data conversion unit 314, a coordinate conversion unit 315, and a learning control unit 316. The conventional method was carried out by. Further, in this evaluation test, the two-link robot 200 was made to execute the weaving operation under the conditions of the weaving frequency of 2 Hz and the total amplitude of 4 mm by the conventional method and the present method.
図11A乃至図11Dに、従来手法を実施した場合の2リンクロボット200の挙動を示す。図11Aは、1軸目の角度指令信号及び関節角度(対象部位位置信号)の時間変化を示すグラフであり、図11Bは、2軸目の角度指令信号及び関節角度(対象部位位置信号)の時間変化を示すグラフであり、図11Cは、ウィービング動作中の2リンクロボット200の先端部位の横方向(溶接方向に対する水平交差方向)の移動及び上下動を示すグラフであり、図11Dはウィービング動作中の2リンクロボット200の先端部位の移動を示すグラフである。図11A及び図11Bにおいて、縦軸は関節角度を、横軸は時間を示している。図11Cにおいて、縦軸は距離を、横軸は時間を示している。また、図11Dにおいて、縦軸は2リンクロボット200の先端部位の上下動の距離を、横軸はその横方向の移動の距離を示している。 11A to 11D show the behavior of the 2-link robot 200 when the conventional method is carried out. FIG. 11A is a graph showing the time change of the angle command signal and the joint angle (target site position signal) of the first axis, and FIG. 11B is the angle command signal and the joint angle (target site position signal) of the second axis. 11C is a graph showing a time change, FIG. 11C is a graph showing lateral movement and vertical movement of the tip portion of the 2-link robot 200 during the weaving operation (horizontal crossing direction with respect to the welding direction), and FIG. 11D is a weaving operation. It is a graph which shows the movement of the tip part of the 2-link robot 200 inside. In FIGS. 11A and 11B, the vertical axis represents the joint angle and the horizontal axis represents time. In FIG. 11C, the vertical axis represents distance and the horizontal axis represents time. Further, in FIG. 11D, the vertical axis represents the vertical movement distance of the tip portion of the two-link robot 200, and the horizontal axis represents the horizontal movement distance thereof.
図11A及び図11Bからは、振動により各関節の角度指令信号と関節角度との間にずれが生じていることが分かる。また、図11C及び図11Dからは、ウィービング動作の横方向移動において正弦波状の波形を示しておらず、また±約0.7mmの範囲で上下動が発生していることが分かる。これらの挙動は、前回のウィービング周期で生じた振動が、次回のウィービング動作においても残存しており、この振動による影響であると考えられる。 From FIGS. 11A and 11B, it can be seen that the vibration causes a deviation between the angle command signal of each joint and the joint angle. Further, from FIGS. 11C and 11D, it can be seen that the lateral movement of the weaving operation does not show a sinusoidal waveform, and that the vertical movement occurs within a range of ± about 0.7 mm. These behaviors are considered to be the influence of the vibration generated in the previous weaving cycle, which remains in the next weaving operation.
図12A乃至図12Dに、本手法を実施した場合の2リンクロボット200の学習初期の挙動を示し、図13A乃至図13Dに、学習後期の挙動を示す。図12A及び図13Aは、1軸目の角度指令信号及び関節角度の時間変化を示すグラフであり、図12B及び図13Bは、2軸目の角度指令信号及び関節角度の時間変化を示すグラフであり、図12C及び図13Cは、ウィービング動作中の2リンクロボット200の先端部位の横方向移動及び上下動の時間変化を示すグラフであり、図12D及び図13Dはウィービング動作中の2リンクロボット200の先端部位の移動を示すグラフである。図12A、図12B、図13A、及び図13Bにおいて、縦軸は角度を、横軸は時間を示している。図12C及び図13Cにおいて、縦軸は距離を、横軸は時間を示している。また、図12D及び図13Dにおいて、縦軸は2リンクロボット200の先端部位の上下動の距離を、横軸はその横方向の移動の距離を示している。 12A to 12D show the behavior of the two-link robot 200 at the initial stage of learning when this method is performed, and FIGS. 13A to 13D show the behavior of the latter stage of learning. 12A and 13A are graphs showing the time change of the angle command signal and the joint angle of the first axis, and FIGS. 12B and 13B are graphs showing the time change of the angle command signal and the joint angle of the second axis. 12C and 13C are graphs showing the time change of lateral movement and vertical movement of the tip portion of the 2-link robot 200 during the weaving operation, and FIGS. 12D and 13D show the 2-link robot 200 during the weaving operation. It is a graph which shows the movement of the tip part of. In FIGS. 12A, 12B, 13A, and 13B, the vertical axis represents an angle and the horizontal axis represents time. In FIGS. 12C and 13C, the vertical axis represents distance and the horizontal axis represents time. Further, in FIGS. 12D and 13D, the vertical axis represents the vertical movement distance of the tip portion of the 2-link robot 200, and the horizontal axis represents the horizontal movement distance thereof.
図12A及び図12Bからは、従来手法に比べて各関節の角度指令信号と関節角度との間のずれが大幅に減少していることが分かる。また、図12C及び図12Dからは、従来手法に比べて、ウィービング動作の横方向移動が正弦波状の波形に近くなっており、また上下動の範囲が減少していることが分かる。このように、学習初期においては、従来手法に比べてウィービング動作の挙動が改善している。また、図13A及び図13Bからは、各関節の角度指令信号と関節角度との間のずれがほとんどなくなっていることが、図13C及び図13Dからは、ウィービング動作の横方向移動が正弦波状の波形を示し、上下動が殆ど発生していないことが分かる。このように、多入出力システムにおける連続した(つまり、繰り返し動作の間に待ち時間がない)一連の動作に本手法を適用した場合に、繰り返し学習制御が進むにしたがって振動が徐々に低減していることが分かる。 From FIGS. 12A and 12B, it can be seen that the deviation between the angle command signal of each joint and the joint angle is significantly reduced as compared with the conventional method. Further, from FIGS. 12C and 12D, it can be seen that the lateral movement of the weaving operation is closer to the sinusoidal waveform and the range of the vertical movement is reduced as compared with the conventional method. As described above, in the initial stage of learning, the behavior of the weaving motion is improved as compared with the conventional method. Further, from FIGS. 13A and 13B, there is almost no deviation between the angle command signal of each joint and the joint angle, and from FIGS. 13C and 13D, the lateral movement of the weaving operation is sinusoidal. It shows a waveform, and it can be seen that almost no vertical movement occurs. In this way, when this method is applied to a series of continuous operations (that is, there is no waiting time between repeated operations) in a multi-input / output system, the vibration gradually decreases as the iterative learning control progresses. You can see that there is.
(その他の実施の形態)
上述した実施の形態においては、繰り返し動作であるウィービング動作の1周期ずつ学習出力信号を生成する構成について述べたが、これに限定されるものではない。連続した複数周期の繰り返し動作についての角度指令信号及び対象部位位置信号をまとめて処理し、当該複数周期分の学習出力信号を生成するように構成してもよい。
(Other embodiments)
In the above-described embodiment, the configuration in which the learning output signal is generated for each cycle of the weaving operation, which is a repetitive operation, has been described, but the present invention is not limited to this. The angle command signal and the target site position signal for the continuous operation of a plurality of cycles may be collectively processed to generate the learning output signal for the plurality of cycles.
また、上述した実施の形態では、単一の学習制御装置30によって学習制御プログラム310のすべての処理が実行される構成について述べたが、本発明はこれに限定されるものではなく、学習制御プログラム310と同様の処理を、複数の装置(コンピュータ)により分散して実行する分散システムとすることも可能である。 Further, in the above-described embodiment, the configuration in which all the processes of the learning control program 310 are executed by the single learning control device 30, but the present invention is not limited to this, and the learning control program is not limited to this. It is also possible to make a distributed system in which the same processing as 310 is distributed and executed by a plurality of devices (computers).
本発明の駆動機械の学習制御装置及び学習制御方法は、繰り返し動作を行う駆動機械を制御するための学習制御装置及び学習制御方法等として有用である。 The learning control device and learning control method for a drive machine of the present invention are useful as a learning control device and a learning control method for controlling a drive machine that performs repetitive operations.
10 自動溶接システム
20 溶接ロボット
25 加速度センサ
30 学習制御装置
301 CPU
302 メモリ
310 学習制御プログラム
316 学習制御部
331 信号記憶部
332 信号射影部
333 学習出力射影成分算出部
334 学習出力信号生成部
200 2リンクロボット
10 Automatic welding system 20 Welding robot 25 Accelerometer 30 Learning control device 301 CPU
302 Memory 310 Learning control program 316 Learning control unit 331 Signal storage unit 332 Signal projection unit 333 Learning output projection component calculation unit 334 Learning output signal generation unit 2002 Link robot
Claims (6)
前記駆動機械の前記可動部位である複数の対象部位それぞれにおいて観測された位置に関する物理量である観測物理量を取得する観測物理量取得手段と、
N回目の前記繰り返し動作における前記複数の対象部位それぞれに対する目標の前記物理量である目標物理量のそれぞれと、前記観測物理量取得手段によってN回目の前記繰り返し動作において取得された前記複数の対象部位それぞれに対する前記観測物理量のそれぞれとに基づいて、前記複数の対象部位毎に学習出力信号を生成する学習制御手段と、
前記学習制御手段によって生成された前記学習出力信号に基づいて、N+1回目の前記繰り返し動作を前記駆動機械に実行させるための制御信号を、前記複数の対象部位それぞれに対して生成する制御信号生成手段と
を備え、
前記学習制御手段は、
前記駆動機械の時間空間におけるN回目の前記繰り返し動作における前記目標物理量及び前記観測物理量を、所定の基底信号の射影空間に射影した目標物理量射影成分及び観測物理量射影成分を算出する射影手段と、
前記射影手段により算出されたN回目の前記繰り返し動作における前記目標物理量射影成分及び前記観測物理量射影成分に基づいて、N+1回目の前記繰り返し動作における前記射影空間での学習出力信号射影成分を算出する学習出力射影成分算出手段と、
前記学習出力射影成分算出手段により算出された前記学習出力信号射影成分に基づいて、N+1回目の前記繰り返し動作における前記時間空間での前記学習出力信号を算出する学習出力信号算出手段と
を有する、
駆動機械の学習制御装置。 A learning control device for a drive machine that controls a drive machine having a plurality of movable parts to execute a certain repetitive operation a plurality of times.
An observation physical quantity acquisition means for acquiring an observation physical quantity which is a physical quantity related to a position observed at each of a plurality of target parts which are the movable parts of the drive machine.
The target physical quantity, which is the target physical quantity for each of the plurality of target parts in the Nth repetitive motion, and the plurality of target parts acquired in the Nth repetitive motion by the observation physical quantity acquisition means. A learning control means that generates a learning output signal for each of the plurality of target parts based on each of the observed physical quantities, and
A control signal generating means for generating a control signal for causing the driving machine to execute the N + 1th repetitive operation based on the learning output signal generated by the learning control means for each of the plurality of target parts. equipped with a door,
The learning control means
A projection means for calculating the target physical quantity projection component and the observed physical quantity projection component by projecting the target physical quantity and the observed physical quantity in the Nth repetitive operation in the time space of the driving machine into the projective space of a predetermined base signal.
Learning to calculate the learning output signal projection component in the projection space in the N + 1th repetitive operation based on the target physical quantity projection component and the observed physical quantity projection component in the Nth repetitive operation calculated by the projection means. Output projection component calculation means and
A learning output signal calculating means for calculating the learning output signal in the time space in the N + 1th repetitive operation based on the learning output signal projection component calculated by the learning output projection component calculating means.
Have ,
Learning control device for drive machines.
請求項1に記載の駆動機械の学習制御装置。 The learning output projective component calculation means is provided by a controller configured based on a projective space model obtained by converting a mathematical model showing the relationship between the observed physical quantity in the time space and the learning output signal into a mathematical model in the projective space. , It is configured to calculate the learning output signal projection component,
The learning control device for a drive machine according to claim 1.
請求項2に記載の駆動機械の学習制御装置。 The learning output projective component calculation means is configured as a controller that stabilizes the projective space model with zero steady-state error.
The learning control device for a drive machine according to claim 2.
請求項1乃至3の何れかに記載の駆動機械の学習制御装置。 The basal signal is a signal relating to the tracking error of the target portion.
The learning control device for a drive machine according to any one of claims 1 to 3.
請求項4に記載の駆動機械の学習制御装置。 The basis signal is a combination of sinusoidal signals having a frequency component that is an integral multiple of the frequency of the repetitive operation.
The learning control device for a drive machine according to claim 4.
前記駆動機械の前記可動部位である複数の対象部位それぞれにおいて観測された位置に関する物理量である観測物理量を取得するステップと、
N回目の前記繰り返し動作における前記複数の対象部位それぞれに対する目標の前記物理量である目標物理量のそれぞれと、N回目の前記繰り返し動作において取得された前記複数の対象部位それぞれに対する前記観測物理量のそれぞれとに基づいて、前記複数の対象部位毎に学習出力信号を生成するステップと、
生成された前記学習出力信号に基づいて、N+1回目の前記繰り返し動作を前記駆動機械に実行させるための制御信号を、前記複数の対象部位それぞれに対して生成するステップと
を有し、
前記学習出力信号を生成するステップにおいて、
前記駆動機械の時間空間におけるN回目の前記繰り返し動作における前記目標物理量及び前記観測物理量を、所定の基底信号の射影空間に射影した目標物理量射影成分及び観測物理量射影成分を算出し、
算出したN回目の前記繰り返し動作における前記目標物理量射影成分及び前記観測物理量射影成分に基づいて、N+1回目の前記繰り返し動作における前記射影空間での学習出力信号射影成分を算出し、
算出した前記学習出力信号射影成分に基づいて、N+1回目の前記繰り返し動作における前記時間空間での前記学習出力信号を算出する、
駆動機械の学習制御方法。 It is a learning control method of a drive machine that controls a drive machine having a plurality of movable parts to execute a certain repetitive operation a plurality of times.
A step of acquiring an observed physical quantity which is a physical quantity related to a position observed in each of a plurality of target parts which are the movable parts of the driving machine.
The target physical quantity, which is the target physical quantity for each of the plurality of target parts in the Nth repetitive motion, and the observed physical quantity for each of the plurality of target parts acquired in the Nth repetitive motion, respectively. Based on the step of generating the learning output signal for each of the plurality of target parts,
Generated on the basis of the learning output signal, a control signal for executing the N + 1 th of the repetitive operation in the drive machine, possess and generating to said plurality of sites,
In the step of generating the learning output signal,
The target physical quantity and the observed physical quantity in the Nth repetitive operation in the time space of the driving machine are projected onto the projective space of a predetermined base signal, and the target physical quantity projection component and the observed physical quantity projection component are calculated.
Based on the calculated target physical quantity projection component and the observed physical quantity projection component in the Nth repetitive operation, the learning output signal projection component in the projection space in the N + 1th repetitive operation is calculated.
Based on the calculated learning output signal projection component, the learning output signal in the time space in the N + 1th repetitive operation is calculated .
Learning control method for drive machines.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017167080A JP6814441B2 (en) | 2017-08-31 | 2017-08-31 | Learning control device and learning control method for drive machines |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017167080A JP6814441B2 (en) | 2017-08-31 | 2017-08-31 | Learning control device and learning control method for drive machines |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019042842A JP2019042842A (en) | 2019-03-22 |
JP6814441B2 true JP6814441B2 (en) | 2021-01-20 |
Family
ID=65813472
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017167080A Active JP6814441B2 (en) | 2017-08-31 | 2017-08-31 | Learning control device and learning control method for drive machines |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6814441B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20230033679A1 (en) * | 2020-01-10 | 2023-02-02 | Fanuc Corporation | Control system |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4283214B2 (en) * | 2004-12-16 | 2009-06-24 | ファナック株式会社 | Machine tip control device |
-
2017
- 2017-08-31 JP JP2017167080A patent/JP6814441B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2019042842A (en) | 2019-03-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6314426B2 (en) | Robot control apparatus and robot control method | |
JP6484265B2 (en) | Robot system having learning control function and learning control method | |
KR101674282B1 (en) | Trajectory control device for articulated robot, and control method | |
JP5897644B2 (en) | Robot control device | |
JP5916583B2 (en) | Weaving control device for articulated robot | |
WO2017064851A1 (en) | Method for teaching robot and device for controlling robot arm | |
JP2011212823A (en) | Device and method of identifying robot arm positional correction parameter, and device and method of controlling robot using the same | |
JP6044511B2 (en) | Robot control method and robot system | |
JP2017209762A (en) | Robot device, robot control method, program, recording medium and production method of article | |
JP4498061B2 (en) | Welding robot controller | |
JP2020044590A (en) | Robot device | |
CN110154043B (en) | Robot system for learning control based on machining result and control method thereof | |
JP4269150B2 (en) | Robot controller | |
JP6814441B2 (en) | Learning control device and learning control method for drive machines | |
JP2005118995A (en) | Robot control method and control apparatus | |
JP6661676B2 (en) | Robot controller | |
JP2020001107A (en) | Robot system for performing learning control | |
JP2014180726A (en) | Compensating device for spring constant of multi-joint robot | |
JP7543160B2 (en) | Spring constant correction device, method and program | |
JPH058187A (en) | Robot | |
JP2003178107A (en) | Industrial articulated robot design / analysis support device and design / analysis support program | |
JP2013248683A (en) | Device and method for elastic deformation compensation control of articulated robot | |
Maťuga | Control and positioning of robotic arm on CNC cutting machines and their applications in industry | |
JPH0724574A (en) | Weaving controller for articulated welding robot | |
JPH03270865A (en) | Position and force control device for working machine with multiple degree of freedom |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190912 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200904 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200923 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201007 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201208 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201211 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6814441 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |