[go: up one dir, main page]

JP4587738B2 - ロボット装置及びロボットの姿勢制御方法 - Google Patents

ロボット装置及びロボットの姿勢制御方法 Download PDF

Info

Publication number
JP4587738B2
JP4587738B2 JP2004234022A JP2004234022A JP4587738B2 JP 4587738 B2 JP4587738 B2 JP 4587738B2 JP 2004234022 A JP2004234022 A JP 2004234022A JP 2004234022 A JP2004234022 A JP 2004234022A JP 4587738 B2 JP4587738 B2 JP 4587738B2
Authority
JP
Japan
Prior art keywords
phase
robot
movable part
walking
control
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2004234022A
Other languages
English (en)
Other versions
JP2005096068A (ja
Inventor
玄 遠藤
光男 川人
チェン ゴードン
淳 中西
淳 森本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ATR Advanced Telecommunications Research Institute International
Sony Corp
Original Assignee
ATR Advanced Telecommunications Research Institute International
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ATR Advanced Telecommunications Research Institute International, Sony Corp filed Critical ATR Advanced Telecommunications Research Institute International
Priority to JP2004234022A priority Critical patent/JP4587738B2/ja
Priority to US10/922,907 priority patent/US7657345B2/en
Priority to CNB2004100874223A priority patent/CN100346941C/zh
Priority to KR1020040067265A priority patent/KR101100657B1/ko
Priority to DE602004032295T priority patent/DE602004032295D1/de
Priority to EP04020192A priority patent/EP1510446B1/en
Publication of JP2005096068A publication Critical patent/JP2005096068A/ja
Application granted granted Critical
Publication of JP4587738B2 publication Critical patent/JP4587738B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B62LAND VEHICLES FOR TRAVELLING OTHERWISE THAN ON RAILS
    • B62DMOTOR VEHICLES; TRAILERS
    • B62D57/00Vehicles characterised by having other propulsion or other ground- engaging means than wheels or endless track, alone or in addition to wheels or endless track
    • B62D57/02Vehicles characterised by having other propulsion or other ground- engaging means than wheels or endless track, alone or in addition to wheels or endless track with ground-engaging propulsion means, e.g. walking members
    • B62D57/032Vehicles characterised by having other propulsion or other ground- engaging means than wheels or endless track, alone or in addition to wheels or endless track with ground-engaging propulsion means, e.g. walking members with alternately or sequentially lifted supporting base and legs; with alternately or sequentially lifted feet or skid
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J13/00Controls for manipulators
    • B25J13/08Controls for manipulators by means of sensing devices, e.g. viewing or touching devices
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1602Programme controls characterised by the control system, structure, architecture
    • B25J9/161Hardware, e.g. neural networks, fuzzy logic, interfaces, processor
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/18Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form
    • G05B19/414Structure of the control system, e.g. common controller or multiprocessor systems, interface to servo, programmable interface controller
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/40Control within particular dimensions
    • G05D1/49Control of attitude, i.e. control of roll, pitch or yaw
    • G05D1/495Control of attitude, i.e. control of roll, pitch or yaw to ensure stability
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S901/00Robots
    • Y10S901/01Mobile robot

Landscapes

  • Engineering & Computer Science (AREA)
  • Mechanical Engineering (AREA)
  • Automation & Control Theory (AREA)
  • Robotics (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Combustion & Propulsion (AREA)
  • Transportation (AREA)
  • Chemical & Material Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Fuzzy Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Remote Sensing (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Manufacturing & Machinery (AREA)
  • Manipulator (AREA)

Description

本発明は、脚などの複数の可動部を備えたロボット装置及びロボットの姿勢制御方法に係り、特に、所定の安定規範に基づいて姿勢の安定性を自律的に維持するロボット装置及びロボットの姿勢制御方法に関する。
さらに詳しくは、本発明は、ZMP(Zero Moment Point)を安定度判別の規範として用いずに機体の姿勢安定制御を行なうロボット装置及びロボットの姿勢制御方法に係り、特に、可動部の周期運動に着目して機体の姿勢安定制御を行なうロボット装置及びロボットの姿勢制御方法に関する。
電気的若しくは磁気的な作用を用いて人間の動作に似せた運動を行う機械装置のことを「ロボット」という。ロボットの語源は、スラブ語の“ROBOTA(奴隷機械)”に由来すると言われている。
わが国では、ロボットが普及し始めたのは1960年代末からであるが、その多くは、工場における生産作業の自動化・無人化などを目的としたマニピュレータや搬送ロボットなどの産業用ロボット(industrial robot)であった。最近では、可動脚を備え脚式作業を行なうことができる脚式移動ロボットに関する研究開発が進展し、実用化への期待も高まってきている。ヒトの動作をモデルにした脚式移動ロボットのことを、特に、「人間形」、若しくは「人間型」のロボット(humanoid robot)と呼ぶ。
2足直立による脚式移動は、クローラ式や、4足又は6足式などに比し不安定で姿勢制御や歩行制御が難しくなるが、不整地や障害物など作業経路上に凹凸のある歩行面や、階段や梯子の昇降など不連続な歩行面に対応することができるなど、柔軟な移動作業を実現できるという点で優れている。
2足の脚式移動ロボットに関する姿勢制御や安定歩行に関する技術は既に数多提案されている。ここで言う安定な「歩行」とは、「転倒することなく、脚を使って移動すること」と定義される。機体の転倒は、ロボットが実行中の作業を中断することを意味し、且つ、転倒状態から起き上がって作業を再開するために相当の労力や時間が払われる。また、転倒によって、ロボット本体自体、あるいは転倒するロボットと衝突する相手側の物体にも、致命的な損傷を与えてしまう危険がある。このため、転倒を回避するための姿勢安定制御は、脚式移動ロボットの開発上、最も重要な課題の1つに位置付けられている。
直立歩行を行なうロボットは基本姿勢としての通常の直立姿勢がそもそも不安定である。脚式移動ロボットの姿勢安定制御には、ZMP(Zero Moment Point)が歩行の安定度判別の規範として用いられることが多い。ZMPによる安定度判別規範は、歩行系から路面には重力と慣性力、並びにこれらのモーメントが路面から歩行系への反作用としての床反力並びに床反力モーメントとバランスするという「ダランベールの原理」に基づく。力学的推論の帰結として、足底接地点と路面の形成する支持多角形(すなわちZMP安定領域)の辺上あるいはその内側にピッチ軸及びロール軸モーメントがゼロとなる点、すなわちZMPが存在する(例えば、非特許文献1を参照のこと)。
ZMP規範に基づく2足歩行パターン生成は、足底着地点をあらかじめ設定することができ、路面形状に応じた足先の運動学的拘束条件を考慮し易いなどの利点がある。また、ZMPを安定度判別規範とすることは、力ではなく軌道を運動制御上の目標値として扱うことを意味するので、技術的に実現可能性が高まる。
目標ZMP制御は、すべての瞬間において、動的釣り合いを取るように運動を計画することにより、実機上で成功を収めている。ZMPを安定度判別規範とする運動生成手法は、安定した2足歩行を実現することができる、確立された手法である。一方、ZMPに基づく安定制御は常に1つの方程式に拘束されるという側面があり、ZMP規範に基づく軌道計画にはロボット自身や環境を正確にモデリングし、運動の実現には高精度な軌道追従制御系により環境モデルと常に整合を取る必要がある。言い換えれば、未知の環境への適応性という点で問題がある。ZMP方程式を数学的に解くことは演算負荷が比較的高く、リアルタイム制御への適用には困難を伴うこともある。
また、ZMP方程式を満たすことは、ロボットの姿勢安定制御において十分条件であって、必要条件ではない。例えば、人間の歩行などを観察すると、必ずしもすべての瞬間でZMP安定余裕が最大となるように保たれている訳ではない。
他方、ヒトなどの生体メカニズムでは、ZMPに依存しない形態で、四肢が持つ物理法則を好適に利用して、より人間らしい歩行動作を行なっていると言われている。ロボットも、このように物理法則をうまく利用することができれば、精緻なモデルを必要としないで(すなわち少ない演算負荷により)、アクチュエータの駆動トルクを要せず、高いエネルギ変換効率で歩行動作を実現することができると思料される。
例えば、歩行運動を周期運動として捉え、ロボットの可動部の少なくとも一部を物理振動子として捉え、この振動子の位相や振動数を決定又は制御するという形態で歩行動作を制御することができる。このような周期運動が継続することを「安定な歩行」とみなすことができる。このような場合、一周期の間に(ZMP理論では)動的釣り合いが保たれない瞬間がある、すなわち瞬間的に安定性を逸脱することはあっても、この周期を繰り返すことによって元の状態を回復することができれば、運動を継続することが可能である。勿論、一周期では元の状態に戻らなくても、現実的な時間内で一定の周期運動に収束すれば、やはり運動を継続することができる。
ロボットの歩行運動に着目し、安定性をこのように定義すれば、未知の外乱に対しても数周期後には定常状態に復帰するという、「大局的な安定性」を実現することができる。この結果、精緻なモデルや精緻なトラッキングが不要となる。また、アクチュエータのゲインを低下させることができ、低ゲインによりコスト低減や安全性の向上を実現することができる(逆に、精緻なモデルや精緻なトラッキングが必要な場合、高ゲイン化、高精度化とともにコストが増大する)。また、大局的安定性により、安定領域を逸脱することが許容される結果として、歩行やその他の脚式動作(歩容)を多様化して、ロボットは表現力を増し、環境への適応性も備えることができる。
このように歩行運動の周期性に着目した脚式移動ロボットの歩行技術として、四足ロボットの生物規範型不整地適応動歩行(例えば、非特許文献2を参照のこと)や、ヒトの2足歩行運動の外乱に対するリズムリセットと歩行の動的安定性の関係(例えば、非特許文献3を参照のこと)などが挙げられる。
前者によれば、独自の非線形ダイナミクスからなる機械システムと神経システムをカップリングした動的システムと環境との相互作用を通じて適応的な運動を創発的に生成する。しかしながら、位相や振動数の引き込みは非線形微分方程式(松岡オシレータ)により行なわれるが、これは物理振動子の位相の解析解を求めることができないことを意味し、システムを数学的に設計することができない。すなわち、具体的な設計論に至らない。
また、後者の場合、位相リセットを伴う運動軌道と歩行の動的安定性の関連を2足歩行の力学系モデルを用いて数学的に解析することができる。しかしながら、既知の外乱直後にオープン・ループで物理振動子の位相を調節するものであり、物理系からのフィードバックはなく、未知の状態や外乱に対する適応性に欠ける。
ヴコブラトビッチ(Miomir Vukobratovic)著「脚式移動ロボット(LEGGED LOCOMOTION ROBOTS)」(加藤一郎外著『歩行ロボットと人工の足』(日刊工業新聞社)) 福岡外著「四足ロボットの生物規範型不整地適応動歩行―神経・機械カップリング系構成法の提案とピッチ運動・CPG・ロール運動間相互引き込みの評価―」(日本ロボット学会誌21巻5号,2003年7月) 山崎外著「ヒトの二足歩行運動の外乱に対するリズムリセットと歩行の動的安定性の関係」(信学技報,社団法人 電子情報通信学会)
本発明の目的は、所定の安定規範に基づいて姿勢の安定性を自律的に維持することができる、優れたロボット装置及びロボットの姿勢制御方法を提供することにある。
本発明のさらなる目的は、ZMPを安定度判別の規範として用いずに機体の姿勢安定制御を好適に行なうことができる、優れたロボット装置及びロボットの姿勢制御方法を提供することにある。
本発明のさらなる目的は、可動部の周期運動に着目して機体の姿勢安定制御を行なうことができる、優れたロボット装置及びロボットの姿勢制御方法を提供することにある。
本発明のさらなる目的は、ロボットの可動部の少なくとも一部を状態と環境に応じた物理振動子として捉え、数学的に操作可能な位相発生により可動部の動作を制御するとともに、未知の外乱に適応的に対応することができる、優れたロボット装置及びロボットの姿勢制御方法を提供することにある。
本発明は、上記課題を参酌してなされたものであり、複数の可動部を有するロボット装置であって、
前記の可動部の少なくとも一部の周期運動に関する位相信号を発生する位相信号発生手段と、
前記位相信号に基づいて前記可動部の制御信号を生成する制御手段と、
前記制御信号に従って前記可動部を駆動する駆動手段と、
前記駆動手段により駆動される前記可動部の状態量を検出する状態量検出手段と、
前記状態量に基づいて前記可動部の周期運動に関する位相又は角周波数を推定する推定手段と、
を備え、
前記位相信号発生手段は、前記推定手段により推定された位相又は角周波数に基づいて、前記位相信号を更新する、
ことを特徴とするロボット装置である。
ここで、前記制御手段は、制御則の異なる複数の制御器を備え、前記位相信号に基づいて適切な制御器を選択し、該選択された制御器が前記位相信号に基づいて前記可動部の制御信号を生成する。
本発明に係るロボット装置によれば、可動部の運動を周期運動と捉え、その位相を調整することで大局的な姿勢安定制御を行なうことができる。すなわち、ロボット・システムに1以上の位相発生器を用い、その位相に応じて複数の制御器の中から1つを選択する。制御器は連続的な位相情報に基づいて可動部の駆動を制御する。また、物理系から実際の位相を推定し、この推定値を用いて位相発生器の振動数や位相を調節し、物理の位相とロボット・システムの位相発生器間で相互引き込みを行ない、結果としてロボットのダイナミクスを有効に用いた運動制御を実現することができる。
図1には、本発明に係るロボット装置の姿勢安定制御メカニズムの構成を概念的に示している。ロボット装置は、可動部の運動を周期運動と捉え、歩行やその他の可動部の動作を位相で記述する。
ロボット・システムを構成する物理系毎に1つ以上の位相発生器が定義される。また、制御が異なる複数の制御器が用意されており、ロボット・システムからの位相出力に応じて、適切な制御器が選択される。
制御器は、位相発生器からの連続した位相情報φに基づいて、ロボットの可動部の駆動を制御する。
ロボット・システム上に配設されたセンサでは、駆動時における状態量が検出される。位相推定器は、センサ情報に基づいて、実現された角周波数ωと位相φを推定する。
そして、推定された運動の位相や角周波数を基に、位相発生器では可動部の周期運動における位相と周波数を調節する。
従来は、歩行運動を周期運動として捉え、神経振動子のようなもので周期信号を発生し、それを用いてアクチュエータの制御を行ない、観測される歩行運動の周期的な信号と神経振動子を干渉させることで引き込みを行ない、安定な歩行運動を得ようとしていた(例えば、非特許文献2を参照のこと)。
これに対し、本発明では、周期運動を神経振動子のように直接振幅信号を発生させるのではなく、位相信号を発生させ、位相信号から制御量としての振幅信号に発生させることで、引き込み制御や安定領域を広く、設計し易いものにする。
位相信号は、典型的には、以下の更新則により調整される。
Figure 0004587738
上式で、ΔωとΔφは、運動を観測して得られる運動の位相推定値と位相発生器との位相誤差推定値であり、運動の位相推定はロボット・センサから推定される。具体的には、歩行運動であれば、足底スイッチ(又は接地確認センサ)の接地時点とその周期より推定され、腕部の運動であれば、手先の接触スイッチの時点とスタートからそこに至るまでの時間から予測される周期より推定され、全身協調運動であれば、同様な関節運動が始まる時点とその周期より推定される。
位相信号発生手段で生成する位相信号φから適当な変換を用いて、ロボットの可動部への入力信号(制御量)Uを得る。
Figure 0004587738
観測信号のベクトルVから推定される位相並びに角周波数をそれぞれφ0、ω0とおくと、下式により位相誤差推定値を得ることができる。(変形として、この推定を制御量Uと観測ベクトルVから比較する方法や、φとVから推定する方法、φ0とUから推定する方法、U、V、φから推定する方法なども考えられる。)
Figure 0004587738
滑らかな運動を保証するために、位相をなだらかに変化させる、あるいはダイナミクスを用いて操作するなどの方法が考えられる。例えば、
Figure 0004587738
として、
Figure 0004587738
とすることなどが考えられる。また、急峻な位相変化が予想される場合(例えば、歩行中に躓くなど)には、ロボットの可動部への入力信号(制御量)Uをダイナミカル・システムを用いて操作する方法が考えられる。例えば、
Figure 0004587738
とすることにより、滑らかな運動が実現される。(位相で滑らかにつなぐ場合は、例えば傾斜面歩行のような、数歩で収束するような場合に適している。これに対し、躓くなど早い対応が必要な場合には、位相を急峻に変化させ、制御基礎のものをスイッチングするべきである。このときの運動の滑らかさは制御器側で保証する。)
ロボットの可動部を周期運動として捉える従来の制御方法の多くは、時間をパラメータとして目標軌道を記述していた。これに対し、本発明では、位相φを用いて目標軌道を記述する。
また、本発明では、単一のロボット・システムに1つ以上の位相発生器を定義する。位相発生器の構成は特に限定されないが、位相リセットによる振る舞いの解析解が求まることが設計論的に望ましい。位相発生器はロボットの機体そのものであり、例えば機体全体として1つの位相発生器とみなすこともできるし、関節自由度毎に位相発生器として捉えることもでき(後述)、任意性がある。
また、本発明では、ロボット・システムからの位相出力φに応じて適切な制御器を選択する。例えば、下表に示すように、左右の脚状態に基づいてロボット・システムの位相が判別され、各状態について適切な制御器が用意されている。あるいは、2以上の制御器が同じPD制御などであっても、制御パラメータ(例えばゲイン値)が異なるようにする。
Figure 0004587738
制御器は、連続した位相情報φを基に可動部を制御する。また、運動をダイナミカル・システムで記述してあれば、急峻な位相変化が到来しても、制御器側で滑らかさを保証することができる。
図2には、2足の脚式移動ロボットが左右の脚を交互に支持脚、遊脚に切り替えて歩行動作を行なうときの、位相情報φに基づいて制御器を適宜選択するメカニズムについて図解している。
図示の例では、遊脚を持ち上げる動作を位相情報φに基づいて制御する制御器(Swing Controller)、遊脚を接地させる動作を位相情報φに基づいて制御する制御器(Touch Down Controller)、両脚支持期の動作を位相情報φに基づいて制御する制御器(Double Support Controller)、単脚支持期の動作を位相情報φに基づいて制御する制御器(Single Supprot Controller)が用意されている。
位相発生器(Phase Controller)は、歩行運動中の現時点での位相φを発生させる。そして、位相φに基づいて制御器が選択され、これに位相情報φが供給される。
制御器では、供給された位相情報φに基づいて、ロボットの可動部への制御量Uを生成する。ロボットの可動部は、制御量Uに従って歩行運動のための駆動を行なう。
歩行運動中には、可動部における各関節の角度、角速度、角加速度、その他のセンサ出力値が取得され、位相推定器(Phase Estimator)に投入される。位相推定器では、これらのセンサ出力値すなわち可動部の状態量に基づいて、周期運動における位相並びに角周波数を推定し、これを位相発生器に供給する。
位相発生器では、推定された位相又は角周波数に基づいて、位相信号Φを更新し、ロボット・システムの周期運動の位相を調整する。
ここで、ロボットの前記可動部は例えば1以上の関節自由度で構成されている。このような場合、前記状態量検出手段は前記関節の関節角又は関節角速度のうち少なくとも1つを状態量として検出する。そして、前記推定手段は前記関節角又は関節角速度のうち少なくとも1つに基づいて前関節の周期運動に関する位相又は周波数を推定することができる。
最も単純な例として、位相を関節角度として出力する。すなわち、横軸に周期(時間)Tをとり、縦軸に関節角度θをとると、正弦波形のチャートとなる(図3を参照のこと)。ここで、横軸に関節角をとり、縦軸に関節角速度をとると、単位円上を周回するチャートとなる。このとき、ある時点における回転角(単位円上の時点と原点を結ぶ直線が横軸となす角)φが周期運動の位相となる(図4を参照のこと)。
また、前記可動部として複数の可動脚を備えていてもよい。このような場合、 前記状態量検出手段は、前記可動脚の各足底において受ける床反力を状態量として検出する。そして、前記推定手段は、各可動脚の足底における床反力に基づいて位相又は角周波数を推定することができる。例えば、床反力に基づいて、左右いずれかの脚による単脚支持期又は両脚支持期を判定することができ、この支持脚判定結果を歩行運動における位相φとして推定することができる。
また、ロボット装置は、可動部として複数の可動脚を備えていてもよい。このような場合、前記状態量検出手段は、前記可動脚の各足底において受ける床反力を状態量として検出してもよい。そして、前記推定手段は、各可動脚の足底における床反力に基づいて前記可動部の周期運動における位相又は角周波数を推定するようにしてもよい。
あるいは、前記状態量検出手段は、前記可動脚の各足底において進行方向又はその直交方向に受ける床面からの摩擦力を状態量として検出し、前記推定手段は各可動脚の足底で床面から受ける摩擦力に基づいて前記可動部の周期運動における位相又は角周波数を推定するようにしてもよい。
また、前記ロボット装置は体幹部を備え、前記状態量検出手段は前記体幹部の傾きを状態量として検出するようにしてもよい。そして、前記推定手段は、前記体幹部の傾きに基づいて前記可動部の周期運動における位相又は角周波数を推定するようにしてもよい。
また、前記状態量検出手段は、前記ロボット装置又は可動部の加速度を状態量として検出し、前記推定手段は、前記加速度に基づいて前記可動部の周期運動における位相又は角周波数を推定するようにしてもよい。
また、前記推定手段は、所定の事象の発生に応答して、前記関節の周期運動に関する位相をリセットするようにしてもよい。
また、前記推定手段は、前記状態検出量検出手段で検出された状態量と前記可動部の周期に関する教師信号を学習し、前記の学習された教師信号に基づいて位相又は角周波数を推定するようにしてもよい。
また、前記推定手段は、前記状態検出量検出手段で検出された状態量に応じて前記可動部の周期運動に関する位相又は角周波数を出力するニューラル・ネットワークで構成してもよい。
前記推定手段は、連続した複数の内界センサ情報を基に、フィードフォワード・ニューラル・ネットワークで位相や角周波数を連続的に推定するようにしてもよい。
あるいは、位相を離散的に推定する場合には、例えば歩行動作において各脚の接地を位相0、一方の脚の接地を位相πと定義して、足底の接地確認センサの出力により観測することができる。また、この場合の周波数は、左右の脚の接地の時間間隔より算出することができる。
本発明に係るロボット装置においては、物理系毎に1つ以上の位相発生器が定義される。ここで、図5に示すように、機体全体を周期運動を行なう1つの物理振動子として捉え、機体全体で1つの位相発生器を定義するようにしてもよい。
あるいは、歩行やその他の脚式運動においては、左右の各脚の動作をそれぞれ独立した周期運動と捉え、図6に示すように、脚毎に1つの位相発生器を定義するようにしてもよい。
また、歩行やその他の脚式運動においては、左右の脚部においては協調的に動作し、単脚支持と両脚支持を交互に繰り返すことから、下肢においては1つの周期運動と捉えることができる一方、上肢と体幹などその他の部位においては別の周期運動と捉えることができる。このような場合、図7に示すように、下肢と、上肢及び体幹において、それぞれ異なる位相発生器を定義することができる。勿論、このときも左右の各脚の動作をそれぞれ独立した周期運動と捉え、図8に示すように、脚毎に1つの位相発生器を定義するようにしてもよい。
また、歩行やその他の機体運動において、左右の脚、左右の腕、体幹、頭部の動作をそれぞれ独立した周期運動と捉え、図9に示すように、部位毎に1つの位相発生器を定義するようにしてもよい。
また、上述したように可動部毎に、すなわち隣接する関節の運動を組み合わせて1つの周期運動と捉える必要は必ずしもなく、図10に示すように、関節毎に独立した周期運動を行なっているものと捉えて、関節毎に位相発生器を定義することもできる。
図6〜図10に示したように、単一のロボット装置上で複数の位相発生器を定義した場合、位相発生器毎すなわち周期運動と捉えられる可動部毎に、対応した制御を備えた制御器が配設されることになる。このような場合、装置全体の協調動作を実現するために可動部毎の制御器からの制御量を調停する調停手段をさらに備えていてもよい。
また、ロボット装置を構成するすべての可動部の運動を周期運動と捉えることができるとは限らない。すなわち、周期運動と捉えられる可動部と、周期運動と捉えられない可動部を含む場合がある。
このような場合、周期運動と捉えられない可動部のために、周期運動とは無関係の制御則に基づいて可動部を制御する第2の制御手段を配置すればよい。このような第2の制御手段は、例えばZMP安定度判別規範に基づいて制御信号を生成する。
そして、このような場合、装置全体の協調動作を実現するためには、前記制御手段による周期運動の位相に基づく可動部の制御量と、周期運動を行なわない可動部に対する第2の制御手段からの制御量とを調停する調停手段をさらに備えていてもよい(図11を参照のこと)。
本発明によれば、ZMPを安定度判別の規範として用いずに機体の姿勢安定制御を好適に行なうことができる、優れたロボット装置及びロボットの姿勢制御方法を提供することができる。
また、本発明によれば、可動部の周期運動に着目して機体の姿勢安定制御を行なうことができる、優れたロボット装置及びロボットの姿勢制御方法を提供することができる。
また、本発明によれば、ロボットの可動部の少なくとも一部を状態と環境に応じた物理振動子として捉え、数学的に操作可能な位相発生により可動部の動作を制御するとともに、未知の外乱に適応的に対応することができる、優れたロボット装置及びロボットの姿勢制御方法を提供することができる。
本発明のさらに他の目的、特徴や利点は、後述する本発明の実施形態や添付する図面に基づくより詳細な説明によって明らかになるであろう。
以下、図面を参照しながら本発明の実施形態について詳解する。
A.ロボットの構成
図12及び図13には本発明の実施に供される「人間形」又は「人間型」の脚式移動ロボット100が直立している様子を前方及び後方の各々から眺望した様子を示している。図示の通り、脚式移動ロボット100は、胴体部と、頭部と、左右の上肢部と、脚式移動を行なう左右2足の下肢部とで構成され、例えば胴体に内蔵されている制御部(図示しない)により機体の動作を統括的にコントロールするようになっている。
左右各々の下肢は、大腿部と、膝関節と、脛部と、足首と、足平とで構成され、股関節によって体幹部の略最下端にて連結されている。また、左右各々の上肢は、上腕と、肘関節と、前腕とで構成され、肩関節によって体幹部の上方の左右各側縁にて連結されている。また、頭部は、首関節によって体幹部の略最上端中央に連結されている。
このように構成されたロボット装置100は、制御部(図12及び図13には図示しない)による全身協調的な動作制御により、2足歩行を実現することができる。かかる2足歩行は、一般に、以下に示す各動作期間に分割される歩行周期を繰り返すことによって行なわれる。すなわち、
(1)右脚を持ち上げた、左脚による単脚支持期
(2)右足が接地した両脚支持期
(3)左脚を持ち上げた、右脚による単脚支持期
(4)左足が接地した両脚支持期
制御部は、この脚式移動ロボット100を構成する各関節アクチュエータの駆動制御や各センサ(後述)などからの外部入力を処理するコントローラ(主制御部)や、電源回路その他の周辺機器類を搭載した筐体である。制御部は、その他、遠隔操作用の通信インターフェースや通信装置を含んでいてもよい。
脚式移動ロボット100における歩行制御は、例えばZMPを安定度判別規範として、あらかじめ下肢の目標軌道を計画し、上記の各期間において計画軌道の修正を行なうことによっても実現される。この場合、両脚支持期では、下肢軌道の修正を停止して、計画軌道に対する総修正量を用いて腰の高さを一定値で修正する。また、単脚支持期では、修正を受けた脚の足首と腰との相対位置関係を計画軌道に復帰させるように修正軌道を生成する。
あるいは、後述するように、脚式移動ロボット100の左右の脚部など、全身の可動部のうち少なくとも一部を物理振動子として捉え、センサ出力などに基づいて得られる内部状態と外部環境に応じて物理振動子の位相を数学的に操作により発生させて、機体の大局的な安定性を実現するとともに、未知の外乱に適応的に対応することができる。
図14には、この脚式移動ロボット100が具備する関節自由度構成を模式的に示している。同図に示すように、ロボット装置100は、2本の腕部と頭部1を含む上肢と、移動動作を実現する2本の脚部からなる下肢と、上肢と下肢とを連結する体幹部とで構成された、複数の肢を備えた構造体である。
頭部を支持する首関節(Neck)は、首関節ヨー軸1と、第1及び第2の首関節ピッチ軸2a,2bと、首関節ロール軸3という4自由度を有している。
また、各腕部は、その自由度として、肩(Shoulder)における肩関節ピッチ軸4と、肩関節ロール軸5と、上腕ヨー軸6、肘(Elbow)における肘関節ピッチ軸7と、手首(Wrist)における手首関節ヨー軸8と、手部とで構成される。手部は、実際には、複数本の指を含む多関節・多自由度構造体である。
また、体幹部(Trunk)は、体幹ピッチ軸9と、体幹ロール軸10という2自由度を有する。
また、下肢を構成する各々の脚部は、股関節(Hip)における股関節ヨー軸11と、股関節ピッチ軸12と、股関節ロール軸13と、膝(Knee)における膝関節ピッチ軸14と、足首(Ankle)における足首関節ピッチ軸15と、足首関節ロール軸16と、足部とで構成される。
但し、エンターティンメント向けの脚式移動ロボット100が上述したすべての自由度を装備しなければならない訳でも、あるいはこれに限定される訳でもない。設計・製作上の制約条件や要求仕様などに応じて、自由度すなわち関節数を適宜増減することができることは言うまでもない。
なお、本実施形態に係る脚式移動ロボット100は、腰部位置に重心が設定されており、姿勢安定制御の重要な制御対象点であるとともに、装置の「基体」を構成する。
図15には、脚式移動ロボット100の制御システム構成を模式的に示している。同図に示すように、ロボット装置100は、ヒトの四肢を表現した各機構ユニット30、40、50R/L、60R/Lと、各機構ユニット間の協調動作を実現するための適応制御を行なう制御ユニット80とで構成される(但し、R及びLの各々は、右及び左の各々を示す接尾辞である。以下同様)。
脚式移動ロボット100全体の動作は、制御ユニット80によって統括的に制御される。制御ユニット80は、CPU(Central Processing Unit)やメモリ等の主要回路コンポーネント(図示しない)で構成される主制御部81と、電源回路やロボット100の各構成要素とのデータやコマンドの授受を行なうインターフェース(いずれも図示しない)などを含んだ周辺回路82とで構成される。
ここで言う周辺回路82は、ロボット装置に搭載される周辺機器類の他、ケーブルや無線を通して接続される外付けの周辺機器、充電ステーション(図示しない)やその他の周辺機器を接続するためのインターフェース・コネクタなどを含むものとする。
本発明を実現する上で、この制御ユニット80の設置場所は特に限定されない。図15では体幹部ユニット40に搭載されているが、頭部ユニット30に搭載してもよい。あるいは、脚式移動ロボット100外に制御ユニット80を配備して、脚式移動ロボット100の機体とは有線若しくは無線で交信するようにしてもよい。
図14に示した脚式移動ロボット100内の各関節自由度は、それぞれに対応するアクチュエータによって実現される。すなわち、頭部ユニット30には、首関節ヨー軸1、首関節ピッチ軸2、首関節ロール軸3の各々を表現する首関節ヨー軸アクチュエータM1、首関節ピッチ軸アクチュエータM2、首関節ロール軸アクチュエータM3が配設されている。
また、体幹部ユニット40には、体幹ピッチ軸9、体幹ロール軸10の各々を表現する体幹ピッチ軸アクチュエータM9、体幹ロール軸アクチュエータM10が配設されている。
また、腕部ユニット50R/Lは、上腕ユニット51R/Lと、肘関節ユニット52R/Lと、前腕ユニット53R/Lに細分化されるが、肩関節ピッチ軸4、肩関節ロール軸5、上腕ヨー軸6、肘関節ピッチ軸7、手首関節ヨー軸8の各々を表現する肩関節ピッチ軸アクチュエータM4、肩関節ロール軸アクチュエータM5、上腕ヨー軸アクチュエータM6、肘関節ピッチ軸アクチュエータM7、手首関節ヨー軸アクチュエータM8が配設されている。
また、脚部ユニット60R/Lは、大腿部ユニット61R/Lと、膝ユニット62R/Lと、脛部ユニット63R/Lに細分化されるが、股関節ヨー軸11、股関節ピッチ軸12、股関節ロール軸13、膝関節ピッチ軸14、足首関節ピッチ軸15、足首関節ロール軸16の各々を表現する股関節ヨー軸アクチュエータM11、股関節ピッチ軸アクチュエータM12、股関節ロール軸アクチュエータM13、膝関節ピッチ軸アクチュエータM14、足首関節ピッチ軸アクチュエータM15、足首関節ロール軸アクチュエータM16が配設されている。
各関節に用いられるアクチュエータM1、M2、M3…は、より好ましくは、ギア直結型で且つサーボ制御系をワンチップ化してモータ・ユニット内に搭載したタイプの小型ACサーボ・アクチュエータで構成することができる。
頭部ユニット30、体幹部ユニット40、腕部ユニット50、各脚部ユニット60などの機構ユニット毎に、アクチュエータ駆動制御用の副制御部35、45、55、65が配設されている。
体幹部40には、加速度センサ95と姿勢センサ96が配設されている。加速度センサ95は、XYZの各軸方向に配置する。また、腰部に加速度センサ95を配設することによって、質量操作量が大きな部位である腰部を制御対象点として設定して、その位置における姿勢や加速度を直接計測して、ZMPに基づく姿勢安定制御を行なうことができる。加速度センサ95と姿勢センサ96は、図14中ではそれぞれ加速度センサA1及びジャイロ・センサG1として構成されている。
また、各脚部60R及び60Lには、接地確認センサ91及び92と、加速度センサ93及び94がそれぞれ配設されている。接地確認センサ91及び92は、例えば足底に圧力センサを装着することにより構成され、床反力の有無により足底が着床したか否かを検出することができる。また、加速度センサ93及び94は、少なくともX及びYの各軸方向に配置する。左右の足部に加速度センサ93及び94を配設することにより、ZMP位置に最も近い足部で直接ZMP方程式を組み立てることができる。図3中では、左右の足首に、足平における加速度を計測するセンサA2及びA2と、足平の姿勢を計測するジャイロ・センサG2及びG3がそれぞれ配設されている。また、左右の足底の四隅に、接地並びに床反力を計測する力センサF1〜F4、F5〜F8が配設されている。
ここで、接地確認センサ91及び92に出力に基づいて、例えば両脚支持期、単脚支持期の判定や、さらには物理振動子としての可動脚の位相φや角周波数ωを推定することができる。また、加速度センサ93並びに94は、少なくともX及びYの各軸方向に配置する。左右の足部に加速度センサ93,94を配設することにより、ZMP位置に最も近い足部で直接ZMP方程式を組み立てることができる。
主制御部80は、各センサA1〜A3、G1〜G3、F1〜F8の出力に基づいて、ロボット100の内部状態や外部環境に応じた姿勢安定制御を行なう。より具体的には、副制御部35、45、55、65の各々に対して適応的な制御を行ない、脚式移動ロボット100の上肢、体幹、及び下肢が協調して駆動する。ここで、姿勢安定制御の第1の方法として、ZMPを規範として、すべての瞬間において、動的釣り合いを取るように運動を計画し目標ZMP制御を行なう。また、姿勢安定制御の第2の方法として、例えば歩行運動中に可動脚など機体の少なくとも一部において周期運動を抽出して、内部状態や外部環境に応じてその位相信号を発生し、この位相信号に基づいて可動部の駆動制御を行なう。
B.生物学的原理に基づく2足歩行
本発明者らは、人間のような行動を人と同様の情報処理手法に基づいてヒューマノイド・ロボットで実現するための研究を行なっている。以下では、このような研究を通じて、人間の情報処理の仕組みについての理解を深め、人間の2足歩行に関し生物学的な見地からその原理を明らかにし、得られた知見に基づきロボットで人間のような自然な歩行を行なう手法について詳解する。本明細書では、特に以下の3つの点に注目して説明する。
(1)CPG(Central Pattern Generator)の特性と2足歩行
近年、望ましい周期運動を実現するために、神経振動子を用いたCPGの研究が行なわれ、その性質の幾つかは実験的に明らかになってきているが、CPGを用いて2足歩行を実現するための基本的な性質は依然として明らかではない。そこで、本明細書では、CPGを用いて2足歩行を実現する上で必要となるCPGの特性を明らかにする。本発明者らは、神経振動子を用いたCPGにより、小型2 足歩行ロボットにおいて望ましい歩行運動の実現に成功した。
(2)歩行の基本原理
本発明者らは物理的・数学的な観点から歩行の原理的な要素に関連する研究を行ない、歩行の力学的な理解・制御手法の開発を目指している。本明細書では、周期運動の生成に関し、非線形力学系に基づく新しいCPGの概念並びにその有効性について説明する。
(3)歩行学習制御法
歩行制御器のより高いレベルの部位において、複数の評価基準を用いることができるような学習法について詳解する。その枠組みにおいて歩行中の状態の遷移や歩行周期の学習を行なう。さらに、安定な歩行軌道を生成すると同時にロバスト性と効率性の両方を実現するような学習法について説明する。本発明に係る歩行学習制御法によって、人間のように機敏な歩行運動をヒューマノイド・ロボットで実現する。
以下では、次の各項目に分けて、本発明の実施形態について説明する。
1.CPG(Central Pattern Generator) の基本的特性に関する研究:神経振動子を用いた2足歩行
2.歩行の基本原理:運動学習プリミティブを用いた人間の歩行の学習及び適応
3.学習による歩行制御:モデル・ベース強化学習による2足歩行の効率的な学習アルゴリズム
B−1.神経振動子による2足歩行
本発明者らは、従来の目標ZMP制御法に変わり得る、非モデル・ベースの2足歩行制御法を確立することを最終的な目標としている。ZMP規範に基づく従来手法は、制御工学的手法に基づく簡単化の後、解析的に解を求めることが可能であり、汎用性が非常に高い。反面、ロボット・環境とも精緻なモデル化を必要とし、その結果,実際のハードウェアに対する要求精度は非常に高い。また、数学的に導出される運動は、見かけの上でも人間の歩行様式とは異なるものとなっている.本発明者らは、以上の問題意識から、運動生理学・脳神経科学・計算機学習の知見を用いて「より人間に近い歩行制御法」について開示する。この項では、生物の脊髄に存在するリズム生成器(Central Pattern Generator,CPG)に着目し,神経振動子によりモデル化しその特性を理解するとともに、特に実機への適用を試みる。
B−1−1.Central Pattern Generator(CPG)の特性
B−1−1−1.CPGとは
生物の脊髄にはCPGと呼ばれるリズム生成器があることが実験的に確かめられている[1]。例として、最も原始的な魚類であるヤツメウナギの推進や、除脳猫の歩行実験がしばしば引用される。後者は、脳と脊髄を分断した猫を速度が変化するトレッドミル上で歩行させる実験である。このとき、速度に合わせて猫は歩容を変化させることが知られている。この実験から、脳が歩行運動すべてを司っているのではなく、脊髄中に何らかのリズム生成器が存在し、それらはセンサ・フィードバック(例えば接地情報)によって調節されていることが示されている。
また、ラットの脊髄神経単体を取り出すと、センサ入力なしに歩行時と同様の振動的な興奮が観察される。したがって、脊髄神経には脳やセンサ情報とは無関係に、内在的に振動する特性を持ったリズム生成器があると考えられており、これをCPGと呼んでいる(人間にCPGがあるかどうかはいまだ議論の分かれるところであるが、例えば生後間もない赤ん坊が脇を支えてやると歩行に似た左右の足踏み動作を行なうことや、障害を負い歩行困難な成人の脊椎に周期的な電気刺激を与えるとリハビリの効果が向上するなどの報告から、内在的なリズム発生器の存在が予想されている)。
B−1−1−2.神経振動子
CPG のモデル化には松岡による神経振動子モデルが一般に使われる(図16を参照のこと)[2]。x1、x2、v1、v2は内部変数、c、β、γ、τ1、τ2は定数である。入力をg、出力をyとする。このときτ1、τ2は発振の時定数・出力波形の外形を決める。下式中に陽に時間が表れていない点に注意されたい。
Figure 0004587738
ここで、τ1、τ2はオシレータの波形と周波数を決定する。cは振幅をコントロールする意味パラメータである。cは定常入力と呼ばれ出力の振幅を決める。出力を解析的に求めることは困難であるが、数値的にある程度の指針は示されている[3]
神経振動子は入力gがなくともτ1、τ2で決められた固有振動数ωnで発振する。十分な振幅の入力gがあり、その振動数がωn に近い場合、出力は入力に対して一定の位相関係で固定される。つまり「引き込み現象(Entrainment)」を起す。これが神経振動子の最も大きな特長である。
B−1−1−3.DBを用いた実験
CPGによる引き込み現象を定性的に理解するため、Dynamic Brain(DB)を用いて(1)ヨーヨー動作、(2)スリンキー(コイル状のバネ)動作の実験を行なった。手順として、まずDBシミュレータを用いてCPGを実装した後、実機で検証を行なった(図17を参照のこと)。まず、ヨーヨーを模した動きとして、1自由度バネ−マス系を肘の上下動で励振させることを考える。CPGの入力は手首トルク、出力を肘角度とした(重りはボトルに水を入れたもの、バネはゴムひもを用いたため非線形性を伴う)。正弦波で駆動した場合に比して、素早く振幅の一定した引き込みが見られた。また、質量やバネ定数など変化した場合でも、ある程度の範囲なら、引き込みを起すことが確認できた。また、バネのおもちゃであるスリンキーを用いて、振動を継続させる実験も行なった。手首トルクの振幅が小さくなると振動を停止する様子や、周期の変動にも適応的に調節する様子が確かめられた。しかしながら以下の点に注意が必要と思料される。
(1)神経振動子のみによる引き込みの範囲はさほど大きくない。
文献[3]にもあるように、神経振動子の固有振動数に近い領域でのみ引き込みが起こる。ヨーヨー動作の場合、質量を200[g]〜500[g]の範囲(固有振動数で±20%程度の差)の範囲では引き込みが見られたが、それを超える範囲では定常的な振動は難しい。すなわち、ある程度のモデル化をあらかじめ行なう必要がある。実際、振動子の時定数はバネ−マス系の固有振動数から先に求め、標準値として設定している。引き込み領域を拡大するため、琴坂らはPhase Lock Loop(PLL)と同様の手法で時定数を変化させている[4]
(2)フィードバック信号の振幅
振動子の入力はトルクであり、出力は関節角度である。次元の異なる量を結び付けていることから、何らかの正規化を行なわなければならない。DBのトルク・センサにはオフセットや不感帯があり、シミュレータでの値はほとんど使えず、実験的に求めざるを得ない。また、フィードバック信号として肘トルクを用いての実験も行なったが、肘の上下に伴い生じる前腕部の慣性トルクがバネ−マス系の力変動に重畳されるため、励振を続けることができない。これはInverse Dynamicsを用いて減算すれば解決できるが、精密なモデルが必要となる。シミュレータ上では重りの絶対速度をフィードバックした振動も試みた。この場合、ボディのダイナミクスなどは完全に除外されることからより安定した引き込みが見られるが、外界センサを必要とするため実機での実験は行なわなかった。
(3)フィードバック信号の位相
神経振動子による引き込みを起すことは簡単に確認できるが、目的とするリミット・サイクルの構成方法が問題である。成就した例では、励振させることが目的であり、「大きなトルクが印加されているときに肘を引き上げる」ことで実現可能である。逆に、制振を目的とするのであれば、フィードバック信号の符号を逆にすれば良く、このことはシミュレータ上でも確認できる。しかしながら、タスクによっては、例えば位相90[deg]で固定する必要もあり、このような場合、単一の神経振動子のみでは不可能である。宮腰らは、4つのニューロンを用いて位相を自動調整する機構を提案している[5]
B−1−2.2足歩行への適用
この項では、神経振動子を用いた2足歩行運動を考える上で、まず始めに過去の技術をまとめ、実ロボットを制御する場合の問題点を明らかにする。
CPGの2足歩行への適用は多賀による先駆的な研究から始まる[6,
7, 8]。多賀は従来の制御工学的歩行研究のアンチテーゼとも言うべきGlobal Entrainmentと呼ぶ概念を主張した。従来の工学的アプローチではロボットを制御対象として考えモデル化し、目標軌道を導出した後、実際の運動と理想軌道との誤差を減らすよう制御を行なう。環境の変化やロボットのパラメータ変化は理想状態からの誤差、あるいは外乱とみなされる。制御から言えば、このような変化は「理想状態から逸脱させる好ましくないもの」として捉えられる。これを生物になぞらえれば、神経系=制御系、筋骨格系=非制御系と考えられ、神経系はもっぱら筋骨格系を支配し、理想状態との誤差を減らすよう指令していると言える。目標ZMP制御も同じ立場である。これに対し、多賀は神経生理学的な知見から「神経系と筋骨格系とを相互作用する対等な力学系として記述」し、「リズムの引き込みを通じて神経系と筋骨格系とをあわせた位相空間で、リミット・サイクル・アトラクタが形成され、これが安定かつ柔軟な歩行の生成に対応する」と主張し、これをGlobal
Entrainmentと呼ぶ。ここでは、環境の変化や筋骨格系の変化、物理系・制御系のすべての要素が歩行の生成に寄与する。したがって、従来の制御工学のような明示的な神経系と筋骨格系の主従関係はない。図18に示すように、矢状面拘束の2足歩行モデルの各関節に神経振動子を配置し、環境との相互作用によって自律的に歩行が生成される。また、傾斜地では歩幅が自律的に調整される様子や、神経系の活動レベル(出力トルク振幅、パラメータ定常入力c)を変化させることで歩行から走行へ、歩容が自然に変化することなどをシミュレーションにより示している。
ところで、神経振動子を闇雲に設定しては歩行運動を生成することはできない。多賀は、神経生理学的な知見から、神経振動子の配置と結合、複数の重み付けされたセンサ・フィードバック経路を決定した。ここで、これらの結合を如何に見つけ、重み付けを行うかという点が問題である。上述したDBの実験で分かるように、単に何らかのリミット・サイクルを構成することは容易であるが、合目的なリミット・サイクルを構成することは困難である。ことさら神経振動子の入力に筋骨格系・環境とのインタラクションをすべて含んでいる場合、解析的に解くことは不可能である。多賀は、これらの重み付け係数を試行錯誤的に手動で調整した。これには年単位の多大な時間を費やしており、また、計算機環境によって結果が異なるなど、ロバスト性や拡張性に欠ける。
多賀の提案を受けて、長谷らはこれらの手動調整をGenetic Algorithm により最適化した[9, 10]。その結果、多賀が提案したフィードバック経路より多少簡潔な神経構造を自動的に獲得することができる。以降、長谷らのこの手法は神経振動子を用いた歩容獲得のスタンダードな方法となる。また、佐藤らは、強化学習の枠組みを用いて、多賀と同じモデルのフィードバック重み付け係数を獲得した[11]。また、このときの値は多賀の設定したものとは異なる。
さて、以上を概観するに、神経振動子を用いた2足歩行研究はほとんどすべてがシミュレーション・レベルに留まっているのが現状である。2足歩行の場合、床反力モデリングの不完全さなどから、シミュレータと実機は一致しないのが常である。したがって、以上の成果を実機にそのまま適用するのは困難であると考えられ、これが多賀の提案から10数年が経過した現在でも実験的に示されない大きな理由であると考えられる。
神経振動子をCPGとして用いた歩行制御において、実機で成功を収めた1つの例として、木村らによる四脚歩行ロボットが挙げられる[12, 13]。神経振動子と反射系、PDサーボ系、状態機械(State Machine)を巧妙に組み合わせることで、従来のアプローチでは困難な高い不整地踏破性を実現することができる。具体的には、CPGは関節を駆動するのではなく、脚の位相を制御し、その出力に応じたサーボ・ゲイン選択と状態遷移が起こる。センサ情報は神経振動子に入力され、各脚の位相関係を調節する。従来のアプローチでは神経振動子出力を関節トルク指令していたのに対し、位相のみを離散的に制御することで、高い運動性能を示すことができる。解析的な検討はほとんど行なわれておらず、多くのパラメータが実験的に選択されているものの。CPGによる制御の可能性を示した。また、その動きは非常に生物らしく見える動きである。木村らの研究の目的は、実機に適用し得るCPGコントローラを構築することである。したがって、実験的に成功した木村らのアプローチを参考に、次項では2足歩行への適用について考察する。現段階でCPGを用いて実機を動かした例は見られないことから、たとえ直観的なコントローラであっても、成功例を導き出すことが先決であると思料される。
B−1−3.2足歩行シミュレーション
この項では、実機を用いる前段階としてSD/Fastを用いたBiped Simulatorによりさまざまなコントローラを実装し検討する。まず、シミュレータについて説明し、続いて実装したコントローラについて言及する。
B−1−3−1.Biped Simulator
シミュレータは、本発明者らが構築したBiped Simulatorを用いる。このシミュレータは、動力学計算にSD/Fastという汎用ダイナミクスシミュレータを用いている。脚は体幹・腿・脛で構成され、足首関節は持たない。これは、問題の簡単化と、竹馬歩行時の床反力分布が通常歩行と似ているとの測定結果から歩行に本質的な運動に足首関節は寄与しないと仮定したことに依拠する。歩行路面と脚先は点接触とし、接触モデルは単純なバネ−ダンパ・モデルである。制御サイクルは1ミリ秒で、関節指令はトルクで行なわれる。しかしながら、多くの機械モデルはPDサーボ系が組まれていることから、実装性を考慮して内部的にPDコントローラを組み、位置目標値を与えることで脚軌道を制御した。脚先の接地状態・すべての状態変数が観測可能で、センサ情報の遅れはないものとする。
B−1−3−2.State Machine
まず始めに、歩行運動を直観的に理解するため、State Machine を用いて歩行について考察する。歩行運動を図19に示すように3つのステートに分離する。なお、PDゲインは、簡単のため、すべての相で固定している。
Stance1では、両脚支持状態で進行方向前側の脚(以下、「前脚」と呼ぶ)を屈曲することで重心位置を前方に倒し込む。前脚への荷重を見るため、前方の安定余裕(Stability Margin:SM)を指標として用いる。ここで、重心位置はほぼ腰部(基体)のジョイント近傍にあることと、脚質量、特に脛節は軽量であることから、簡易的に腰部ジョイントの床面投影点と前脚接地位置の相対距離を用いている。なお、定性的にはSMに動的効果を組み入れた指標がZMP安定余裕であると考えられる。
Stance1の運動を継続し、SMがある一定値以下になったとき、屈曲を止め,逆に進展動作(Stance2)に移る。進展により重心位置が高くなることで、位置エネルギが印加され、結果として歩行を継続するための運動エネルギを注入している。なお、進展の関数は時間ではなくSMの関数として表されている。したがって、速く倒れ込むようであれば速く進展する。Swingでは、Stance1の継続により進行方向後ろ側(以下、「後脚」と呼ぶ)が床から離れたときに切り替わる。遊脚軌道では、腰部はSM、膝は時間の関数として与えられている。腿節の質量は比較的大きいため、遊脚が支持脚より前方にあれば、両脚支持になる安定側に倒れ込む。直観的に言えば、倒れ易い片足支持相を素早く動かし、両脚支持相によって転倒を防ぐ歩容である。シミュレータに実装し、歩行を継続できることを確認した。
本方式のメリットとして、以下の事柄が挙げられる。
(1)直観的に理解し易い。
(2)オフライン時間ベースのオープン軌道ではないため(若干の外乱にならば)、適応できる。
(3)精緻なモデルを必要としない。
B−1−3−3.State Machine + CPG
前項では、ステート切り替えには、単純にSMと接地情報のみを用いていた。これらはシミュレーション上では問題がなくても、実機を用いた場合、センサ・ノイズなどにより正しく機能しない場合がある。そこで、ステートの切り替えにCPGを用いることを考えた。具体的には、SM変位を入力としてCPGを引き込み、その出力の正負の符号のみを使って相の切り替えを行なう。
前項では、相の切り替えにはSMの離散的な値のみ用いていたが、本項では連続的なSMの値を用いることによって、位相の推定がロバストになる可能性がある。シミュレータ上に実装し継続歩行可能なことを確認した。ステート・マシーン・ベースに比して、動きは滑らかになる。しかしながら、前項のアプローチに比してパラメータ変動に対するロバスト性などの面で十分なメリットは確認できない。これは、シミュレータというクリーンな環境のためとも考えられる。
木村のアプローチは、位相の推定ができるだけでなく、脚接地情報をCPGに有効にフィードバックすることにメリットがある。例えば、一脚が想定した床面高さより高いところに接地した場合でも、乗り上げた脚が縮み、対角脚が進展することで体勢を保つ機能を付加できる(ロール・ピッチ緊張性迷路反射)。しかし、これらの反射系は、4脚あることで初めて可能となるフィードバック系であり、2脚にそのまま適用することはできない。2足歩行が継続可能な効果的なセンサ・フィードバックについては後述に譲る。
B−1−3−4.Ballistic Walk + CPG
従来のCPGのアプローチは多くの場合、各関節に神経振動子を配置し、トルク出力により関節駆動を行なっている。これは振動子出力を拮抗筋に対応させる運動生理学的立場からは自然な考え方である。一方、ロボット工学的立場から見れば、このような配置はDirect Kinematics的な考え方であり、各神経振動子出力がどのように系全体(例えば重心高さなど)に反映されるかは直観的に理解し難いものである。これにより、ただでさえ複雑な振る舞いをする神経振動子を、倒れる、倒れないといった系全体の上位のレベルで評価して多数のパラメータ調整を行なうことは非常に難しい。ロボット工学的に考えるのであれば、このような場合、Inverse Kinematicsを用いるのが常套手段である。つまり、絶対座標系でX方向、Z方向に各々振動させるという考え方である。しかし、これは純粋に工学的手法であり、人間の歩行動作と類似性が見出せるかどうかは分らない(別の理由として、ハードウェアの制約がある。実際シミュレータ上に実装してみたが、重心高さを一定に保って体幹を進行方向に前後させようとした場合、実験機には充分な膝トルクがなく挫屈してしまうことが確かめられた)。
そこで、人間の歩行運動と類似性があり、また直観的な見通しも良いモデルとして、脚を腰関節から接地点までの直動(Linear Motion:LM)と、腰周りの回転(SWing motion:SW) に分解する、Compass−like Bipedを考える(図20を参照のこと)。
宮腰によると、腰部ジョイントがPassive(受動的)、脚が直動でActive(能動的)に動くCompass like bipedに対して、適切な初速を脚・体幹に与えれば、オープン・ループな歩行が可能であり、また、そのときの得られる床反力は人間の歩行と類似したものとなることが分っている。このとき、LMの振動数はSWに対して3倍の振動数である[14]。この知見に基づいて、CPGを直動自由度と腰部の回転自由度に割り振り、歩行を考えた。
図21には、神経振動子の配置と結合係数を示している。あらかじめCPG固有振動数を前々項の歩行振動数を参考にして、1倍、並びに3倍となるようにパラメータをセットし、定常発振させた後、機体に初速を与えたシミュレータ・モデルに出力する、始めはCPGに対して何もフィードバックを行なわずに動作を見た。その結果、パラメータ調節を行なっても7歩程度で転倒に至ることが分った。次に、両脚支持期のSMに応じてSW神経振動子にフィードバックをかけたところ、直動系には明示的なフィードバック経路は無いにもかかわらず、SW神経振動子が適切な位相関係に引き込まれた結果、歩行を継続することが可能である。しかしながら、パラメータ変化に対する感度が非常に高い。例えば、スイング角度が1[deg]変化するだけで転倒に至る。また、特に歩き始めの状態が難しく、定常状態突入し安定したリミット・サイクルができる初速度を見出すことは困難である。
B−1−4.実験機への適用
この項では、前項で記載した2足歩行シミュレーションの内容を実機に適用する。B−1−3−4項で導出したコントローラの実装を目指し、シミュレーションで得られた知見に基づいて実験的に調整を行なうことで歩行を実現することができる。
B−1−4−1.実験機
図22には、実験機としてのロボットの機体リンク部分の構造を模式的に示している。足裏形状によって大きく挙動が変わることから、点接地以外にも異なる形状の部品が付けられるよう機構改良を行なった。また、接地状態が計測できるよう機械スイッチを付加できる仕様とした。アクチュエータにはDCブラシレス・モータを使用し、減速機による摩擦や粘性を排除するためダイレクト・ドライブと同等の使用方法になっている。このため、機体の大きさに比して著しく高出力なモータ(2000[W]×4)を装備している。
B−1−4−2.足踏み動作
まず、その場で足踏みをする動作を考える。歩行に移る前に足踏み動作を実現するのは神経振動子を用いた歩行研究の常套手段である[15, 16]
本実験機の場合、足首関節が無いため脚を前後に一定角度で開くことで転倒を防ぐ。直動運動(LM)を行なうことで、上体のピッチ振動を発生させる。振動を継続させるために、図23に示すようなフィードバック経路を導入した。脚が遊脚の場合、それを継続させるよう伸縮側に興奮性のフィードバックを入れる。両脚接地時は体幹のピッチに応じて脚長を伸ばす方向に調節を行なう。つまり、前方向に傾いている場合は前脚の支持脚期間が延長される。前後脚は図21に示した結合を持たせてあるので、振動的に前後に揺れる足踏み動作が生成される。
実験的にパラメータの調整を行なった結果、足踏み動作を確認した。また、外乱を加えた場合でも、足踏みの周期や支持脚期間を延長することで復帰する様子が確認することができた。なお、バランスを保つセンサ・フィードバックは両脚支持期にのみ作用するので、例えば前方に大きく傾き後脚が浮いている場合復帰モーメントの大きさは足裏形状に依存する。
B−1−4−3.CPG + State Machine
前項で実現された足踏み動作にSwing Motionを組み合わせることで歩行動作を行なう。このとき、脚の切り替えにはState Machine を用い、後脚が遊脚且つ前方のStability Marginが一定値以下になった場合に、単純に前後脚の角度目標値を入れ替える(図24を参照のこと)。
直観的に言えば、「前に倒れそうになったら足を出す」ということである。実機に適用したところ、歩行動作が出来ることを確認した。このとき手動調整した値は、神経振動子パラメータ、PDゲイン、LM・SWの振幅、Stability Marginの閾値である。実験機のハードウェア的な問題(モータ加熱による特性の変化など)により、継続歩行距離は変化するが、50歩程度は常に歩くことができる(最長では連続360歩、歩行距離約50m、歩行速度約0.4m/s)。また、路面の材質の変化や推進に抗する向きの力に対しても、ある程度適応することが可能である。
ここで実現される、Swing Motionと組み合わせた足踏み動作は、歩幅と周期が自動的に調節され、その様子は非常に生物的に見える。これは、CPG、State Machineとも軌道計画に時間を陽に含んでいないため見られる現象であると考えられる。
他方、両脚が揃ってしまった場合や、下り坂の場合には、実装したフィードバック系が十分ではないこともある。その改善策として、SWの振幅を変化させる、足首関節を設けることなどが考えられる。
B−1−4−4.CPGのみ
次に、SWing Motion(SW)も神経振動子で駆動することについて考察してみる。Linear Motion(LM)と協調して動くことが必要であることから、LMの出力を符号反転してSWに入力する(図25を参照のこと)。
この結合の場合、LMとSWの位相差は180[deg]となる。SWの振動数はLMと同じ値とする。実験の結果、State Machineを用いた場合と同様に歩行が可能であった。
State Machineに比して、特に歩行開始時から定常状態に突入することが困難である。これはSWがLMに適切な位相関係で引き込まれるのに時間がかかることが原因であると考えられる。図63にはそのシミュレーション結果を、図26には定常歩行時の計測結果を、それぞれ示している。LMとSWの最適な位相差は180[deg]には限定されないが、実データを見るとSWは位相遅れを生じた状態で引き込まれている。
また、膝関節に関しても脚着床時に大きな偏差を生じていることが分る。これは、ゲインが低いことにより生じている。従来の軌道追従制御の観点からは、制御特性が低いという欠点とも捉えられるが、逆言すれば、木村らの4脚歩行機械と同様、低ゲイン・アクチュエータによる仮想バネ−ダンピング特性を積極的に利用して歩行していると言うこともできる。この結果から、ゲインの値が歩行に重要な影響を及ぼしていることが分る。
図64には、左股関節を周期運動を行なう物理振動子として捉えたときの、振動子の位相の変化を描いた位相平面図のシミュレーション結果を示している。また、図27には、そのときの実験結果を示している。各図から、リミット・サイクルが形成されていることが確かめられる。脚着床時に大きな角速度変化を生じていることから、着床時に床面との脚先相対速度ゼロで接地していないことが分る。このような衝突は、ロボットの挙動を不安定にするため、従来のZMPでは行なわないが、それ故、人間で言えば「抜き足差し足」のような不自然な歩き方になる。
一方、人間の歩行は速度調節に積極的に踵の衝突を利用していると考えられることから、より人間に近い歩き方であると考えられる。歩行周期に関しては、神経振動子の固有周期が1歩当たり0.33秒であるのに対し、定常時の歩行周期は平均で0.368秒であり、引き込み特性により調整されていることが分る。また、人間との誤差8%と比較的近い値を示していることから、ロボットにとって無理の無い運動であると考えられる。歩行時の歩幅は必ずしも一定ではなく、例えば左右で歩幅が異なるような歩行も観測されたが。歩行を継続することが可能であり、異なる歩幅であっても本手法が適用できる可能性が見出された.そこで、歩行速度を歩幅によって調節することを考える。
多賀は神経振動子の活性(振幅)を変化させる定常入力値c を大きくすることで歩行から走行への歩容変化を報告している[6]。cは1.8〜3.5の間で変更可能で、この範囲以外では歩行することができない。小さいcでは歩幅が狭くなることによりStability Marginが減少し容易に転倒し、大きい歩幅では遊脚着床時の大きな衝撃で挙動が不安定になるためである。
cの変化により歩容の印象が異なる。cが小さい場合はしとやかに、大きい場合は行進のように歩いている印象を受けることから、表現方法の1つとして用いることができると考えられる。
図28には、定常入力値cと歩行速度・機械的消費エネルギ・移動の効率を表す無次元量、移動仕事率の関係を示している。消費エネルギはサーボ・ドライバへのトルク指令値と測定された角速度より算出し、測定された歩行速度とあわせて移動仕事率を算出する。cを大きくすることで歩幅が増加し、歩行速度を変化させることが可能である。しかし、速度調節の範囲は限られており、足首関節が無い本実験機では、特に足裏円弧半径に依存するものと考えられる。
本手法は、動的効果を積極的に利用することで歩行を継続するものであり、機体のピッチ方向への固有振動数に近いところでしか歩行できない。この特性はPassive Dynamic Walk[17]に顕著に見られるように、機体の物理特性を積極的に利用した歩行に共通の問題である。歩行速度の低い移動には足首トルクによる制御や異なるフィードバック経路が必須であると考えられる。多賀はその場足踏みと定常歩行で異なる枠組みが必要であると主張している。
cが大きくなるにつれ消費エネルギも増加している。移動仕事率を求めるとcが1.8のとき最小となり最も効率が高かくなる。本手法によれば、脚式移動ロボットは極めて高いエネルギ効率で移動することができる。ここで、消費エネルギは純粋に機械出力から求めており、アクチュエータに印加している電力は、c=2.05のとき約340[W](効率0.7%)である。高効率歩容を目指したSpring Flamingo[18]でも機械出力5[W]に対し200[W]の電力(効率2.5%)であることから、バッテリ持続時間といった実効効率向上のためにはハードウェア特性が最重要課題であると思料される。
また本手法の歩行の様子を見ると、膝の屈曲が少なくなっている。図29には、脚長・質量で正規化した関節最大トルクを典型的な目標ZMP規範を用いた場合との比較を示している。この結果から、膝にかかる負荷が約3分の1となっていることが分る。
本手法において、最も重要なメリットの1つとして、関節ゲインを低く設定することができる点が挙げられる。現在の脚式移動ロボットの多くが高価にならざるを得ない理由は、高精度の軌道追従を実現するための高ゲイン設定にあるからである。高ゲインにするためには、ギアのバックラッシュ低減や応答特性の改善など、ハードウェアに対する要求が非常に高い。また、常に関節スティフネスが高い状態は、人とのインタラクションにおいて安全性を考える上で非常に危険である。また、反射ベースの動きは、環境に応じて異なることから、例えば転倒などの動作をとっても条件によってさまざまな反応を示す。これは人間を飽きさせないための重要なキーポイントではないかと本発明者らは考えている。
B−2.運動学習プリミティブに寄る人間の歩行の学習及び適用
SDR(ソニー)、ASIMO(ホンダ)、HRP(産総研)、H7(東大)などに代表されるようなヒューマノイド・ロボットが開発され、高いレベルの2足歩行の進歩は著しい。これらの多くはZMPを用いた関節軌道計画により歩行パターンを生成している(前述)。ZMPを規範とした運動生成手法は安定した2足歩行を実現する確立された手法である一方、その軌道計画にはロボットの正確なモデリングが必要であり、運動の実現には高精度な軌道追従制御系を要する。また、逆運動学上の特異点を回避するために、膝を曲げた歩行パターンになるという問題点も指摘されている。
これに対し、近年、生物規範型の制御手法として神経振動子を用いたCPGによる自律的な適応機構を持った歩行運動生成の試みがなされてきている(前述)。CPGとしては、松岡によって提案された伸筋と屈筋の駆動をモデル化した非線形の連立微分方程式による神経振動子[2]が広く用いられ、環境との相互作用を伴う引き込み現象を利用した周期運動の制御に応用されている。具体例としては2足歩行制御[19, 20]、4足歩行制御[12],ジャグリング[21]、ドラミング[4]、スリンキー(コイル状のバネ)の制御[3]などが挙げられる。しかしながら、各振動子の相互結合の設計をどのように行なうかという点や、目的とする動作を実現する振動子のパラメータの調整が困難であるという問題点があり、制御系の設計手法としての課題が残されている。
この項では、ロボットや歩行の物理的及び力学的性質に着目し、人間のような自然で滑らかな歩行の実現を目指した制御系の設計手法について説明する。本発明者らは、ヒューマノイド・ロボットのような多自由度システムにおいて、人間のような複雑で滑らかな運動を見まね学習により実現するための運動生成、運動記述アルゴリズムの研究を行なっている。関節軌道を非線形微分方程式によって記述し、人間が模範により示した運動を統計的学習手法を用いて高速に学習し実現する運動学習プリミティブについて既に提案している[22]。この項では、特に、位相振動子とLocally weighted learning(局所重み付き回帰による学習) [23] をベースとしたリミット・サイクル・アトラクタを持った周期運動学習プリミティブをCPGモデルとして用い、人間の歩行動作の学習、獲得した運動の適切なスケーリングによりロボットでの歩行の運動生成について説明する。図30にはその概念図を示している。
本プリミティブをCPGとして用いる利点は、計測された人間の歩行パターンなどの模範となる運動が与えられたときに、それらを高速に学習することが可能であることや、学習した周期運動の振幅、周期、オフセットに関するスケーリングが容易であることなどが挙げられる。この項では、さらに、環境からのフィードバックによる位相リセット[24]及び位相振動子、機械系、環境との相互作用による引き込みを利用した歩行周期の自律的な適応則の提案を行ない数値シミュレーションにより本手法の有効性の基礎的な検討をする。
この項では、図31に示す平面5リンク2足歩行ロボットのモデルを用いた数値シミュレーションを行なう。ロボットの全長は40cm、重さは約3kgであり、下表に数値シミュレーションで用いる物理パラメータを示している。
Figure 0004587738
図示の通り、ロボットは腰関節と膝関節に各2つのアクチュエータを持ち、その運動は矢状平面内に拘束されるものとする。シミュレーションでは、ロボットの運動方程式はSD/FAST[25]を用いて導出し、例えばルンゲ・クッタ法により1ミリ秒の時間間隔で積分し、地面との接触はバネ−ダンパ・モデルを用いて床反力を計算する。
B−2−1.運動学習プリミティブによる人間の歩行の学習
B−2−1−1.周期運動学習プリミティブ
この項では、本発明者らが提案した運動学習プリミティブ[22]について簡単に説明する。この運動プリミティブは、人間が模範により示した運動(到達運動・周期運動)を非線形微分方程式を用いて記述し、統計的学習手法により高速に学習し、ロボットでの運動生成に用いるためのものである。以下、周期運動に関する運動プリミティブの定式化について述べる。
基礎的な周期運動パターン生成器として、下式に示すような極座標系(φ,r)で表したリミット・サイクル振動子系を考える。
Figure 0004587738
ここで、(φ,r)はそれぞれ振動子の位相及び振幅を表す。τは時定数、r0は(相対的な)目標振幅、μは正の定数である。上式の位相ダイナミクスを以下のように表すこともできる。下式は、振動子としてのロボットの周期運動に関する位相信号φを生成する位相発生器に相当すると理解されたい。
Figure 0004587738
運動プリミティブの出力yは、位相振動子の状態(φ,r)及びその座標変換したものv(ハット)=[rcosφ,rsinφ]T を入力とした2次系のダイナミクスである以下の式で表される。
Figure 0004587738
ここで、αz並びにβzは正の定数、ymは出力のオフセットである。fは局所線形モデル[23]を用いた下式に示す非線形関数近似器であり、局所モデルはガウシアンΨi=exp(−hi(mod(φ,2π)−ci2)により重み付けられ、出力は各局所モデルの荷重平均を取ることにより求められる。
Figure 0004587738
iは局所線形モデルのパラメータであり、後述するように、目標となる模範軌道が与えられたときにLocally weighted regression(局所重み付き回帰)により決定される。
上記の2式[数10]及び[数11]は、歩行運動などのロボットの周期運動を位相情報φで記述するものであり、脚などの可動部の駆動を制御する制御器に相当する。このような制御器によれば、単純なパラメータの設定だけで、振幅、同期、オフセットなどを容易に且つ連続的に変更することができる。
この項で説明する運動プリミティブの特長として、図32には学習した軌道の変更の例を示している。運動プリミティブ中のパラメータr0、τ(=1/ω)、Ymを変更することにより、学習した運動の振幅、周期、オフセットをそれぞれ容易に変更することが可能である。本発明者らは、ヒューマノイド・ロボットDBを用いた8の字運動やドラミングの学習実験でその有効性について検証している[22]
B−2−1−2.運動学習プリミティブを用いた2足歩行ロボット制御系
図33には、本実施形態に係るロボット制御系の概念図を示している。CPGモデルとして、B−2−3−1項で述べた運動学習プリミティブを用い、その出力をロボットの目標関節軌道θdesとする。ここでは、各関節にそれぞれの目標軌道を生成する運動学習プリミティブを用いる(i=1〜4)。ロボットの関節角度制御には局所PDコントローラを用いる。ロボットからCPGへのフィードバックとしては地面との接地情報を用い、これにより振動子の位相リセット[24]及び固有振動数ωの更新を行なう。
この項では、位相リセットとして、各脚が接地したときに接地脚の振動子の位相をφ=0に、逆側の脚の位相をφ=πとする操作を行なう。歩行周期の適応における振動子の固有振動数の更新則についてはB−2−4項で詳しく述べる。また、位相リセットに関しては、この項で後述する。
B−2−1−3.人間の歩行パターンの学習
歩行データ:
この項では、人間の歩行の関節角データ(29歳男性、身長176cm、体重83.5kg、右足腰・膝関節という構成の人間の歩行の関節角データを用いる[26]。将来的には、さまざまな条件下でのデータを収集しそれらを基に学習を行なう。図34(左)には収集されたデータの関節角度を、同図(右)には右足接地から次の接地までの1周期分を取り出して示している。次項で述べる学習では、この軌道を20周期分繰り返し、周期軌道としたものを学習データとして使用するものとする。図34に示した長さの歩行データは便宜的なものであり、実際に歩行データを計測する際には十分な周期のデータを実際に計測することが好ましい、本データの周期は離散FFTによるパワースペクトラム及び自己相関をとることにより、周期T=1.17秒、周波数f=1/T=0.855Hzと推定する。
局所重み付き回帰による学習(Locally weighted learning):
人間の模範運動から関節軌道ydemoが計測により得られたとき、制御器に相当する上式[数10]中の学習パラメータwiをLocally weighted learning(局所重みつき回帰)[23]を求める手法について説明する。
ある時刻t におけるデータ点あるデータ点(ftarget,v(ハット))が与えられたとする。
Figure 0004587738
このとき、学習パラメータwiは、逐次局所重み付き回帰[23]によって以下のように更新される。
Figure 0004587738
ここで、
Figure 0004587738
であり、λ∈[0,1]は忘却係数である。また、学習において、局所モデルの数・配置のオンラインでの追加、局所モデルの担当領域オンライン最適化により、未知の近似対象に対して、事前に関数近似器の構造を決定することなく望ましい近似精度で近似を行なうことができる。
図35には、運動学習プリミティブでの人間の歩行軌道の学習の結果を示している。以下のシミュレーションでは、右足のデータのみ収録されていたため、まず上記の軌道の学習において、右足腰関節(R_HIP)及び右足膝関節(R_KNEE) のデータについてそれぞれの関節に対応する学習パラメータを決定する。次に、左足腰関節(L_HIP)、左足膝関節(L_KNEE)にはそれぞれ右足用の腰、膝関節の学習パラメータを用い、左右の振動子の位相をπ[rad]だけずらすことによって歩行の目標軌道の生成を行なう。
B−2−1−4.数値シミュレーション
パラメータ設定:
数値シミュレーションでは、運動学習プリミティブ、PDコントローラなどのパラメータは下表のように設定した。
Figure 0004587738
現段階ではこれらのパラメータはシミュレーションにおいて経験的に決定している。但し、これらのパラメータは、周期や振幅などのように物理的な意味合いが直感的であり、他のCPGモデルの場合に比べてその調整は比較的容易であると考えられる。なお、この項でのシミュレーションでは、振動子の周期については歩き始めから2歩目までは1.5秒(角周波数にしてω=4.19rad/s)、3歩目から9歩目までは1.2秒(角周波数にしてω=5.24rad/s)、10歩目以降は1.0秒(ω=6.28rad/s)と、段階的に変更した。これらの値は経験的に得たものである。後述では、引き込み現象を利用した歩行周期の自律的な適応則、並びにその結果から得られる周期のスケーリング則について考察する。
シミュレーション結果:
シミュレーションにおいて、歩き始めの一歩は両足を揃えた状態から左足を踏み出す軌道を設計者が人手により生成する。図36には、t=0〜20の運動学習プリミティブの出力による目標関節軌道及びロボットの各関節軌道を示している。図37には、歩行2周期分(歩数4歩)の左足の目標関節軌道及びロボットの各関節軌道、各足の接地タイミングを示している。さらに図38には、このときの関節トルク指令値を示している。この歩行時における腰関節及び膝関節指令速度の範囲は、それぞれ−3.12〜2.22rad/s、−6.09〜5.23rad/sの範囲である。
ここで、時刻t=11.2〜11.6秒の膝関節のトルク指令値に注目すると、膝の振り出しにトルクをほとんど要していないことが分かる。このことから、膝下リンクのスイングが太股リンクの振り出しを利用して受動的に行なわれていると考えられる。また、図39には、定常状態におけるロボットの歩行の様子を示している。各コマの時間間隔は66ミリ秒である。
B−2−2.位相振動子の引き込みを利用した歩行周期の自律的な適応
B−2−2−1.結合位相振動子系における引き込みによる同期
位相差フィードバックによる引き込み:
まず、結合位相振動子系の位相差フィードバックによる引き込みよる同期について簡単に説明する[27]。図40に示すような2つの結合位相振動子のダイナミクスを考える。下式は、ロボットの2つ可動部の周期運動に関する位相情報φ1及びφ2を生成する位相発生器に相当する。
Figure 0004587738
このとき、位相差ψをψ=φ2−φ1のように定義すると、その時間微分は下式の通りとなる。
Figure 0004587738
このときの平衡点ψ*は以下の式で求められる。
Figure 0004587738
また、このときの各振動子の振動数は下式に示すように引き込まれる。
Figure 0004587738
したがって、各振動子は引き込みの結果、漸近的に振動数ω*=(K2ω1+K1ω2)/(K1+K2)、位相差ψ=φ2−φ1=(ω2−ω1)/(K1+K2)で同期して振動することが分かる。
固有振動数適応による目標位相差の実現:
上記の位相振動子では、各々の振動子の固有振動数ω1及びω2が固定されている場合、各振動子は引き込みの結果、位相差ψ=φ2−φ1=(ω2−ω1)/(K1+K2)で同期して振動する。このとき、ω1=ω2であれば、各振動子は位相差ゼロで同期することが分かる。したがって、下式に示すように固有振動数の更新のダイナミクスを導入することにより、漸近的にω1→ω2とし、引き込みによって振動数の同調と位相差ゼロでの同期を実現することを考える。
Figure 0004587738
これにより漸近的にω1→ω2となるので、位相差はψ=φ2−φ1→0となる。
B−2−2−2.歩行周期適応則
この項では、上述した結合位相振動子の引き込みのメカニズムを、運動学習プリミティブを用いた歩行制御における歩行周期の自律的適応に応用することについて考察する。図30に示したように、本実施形態に係る制御系は、運動学習プリミティブを用いたCPGと機械系振動子(ロボット)が結合されたものであると考えられる。
本発明者らは、sin合成波を用いた目標関節軌道生成に関して、一歩に要する時間の実測値によりパターン生成器の振動数を下式のように更新することを考えた。
Figure 0004587738
この場合、位相推定器は、状態量Vに基づく位相の計測値ωn measuredをそのまま位相推定値として取り扱う。但し、
Figure 0004587738
であり、Tn measuredはn歩目においてロボットが一歩に要する時間(振動子に関しては半周期)と定義する。これは、B−2−4−1で説明した位相振動子のダイナミクスの観点から考えると、上式[数19]を離散化したものにほかならない。しかしながら、振動数の更新のみでは、位相差そのもののフィードバックがないため、引き込みにより望ましい位相差を実現するには不十分であることが分かる。そこで、本実施形態では、B−2−4−1項の記載に基づいて、さらに位相差のフィードバックを接地時の「位相リセット」で離散的に行なう下式のような適応則を運動学習プリミティブ(位相発生器)に導入する。位相リセットにより、歩行やその他の運動時における過渡特性を改善し、安定化することができる(後述)。下式は、位相発生器における更新則に相当し、位相推定器による位相や角周波数の推定値(この例では計測値)を基に位相信号を更新する。
Figure 0004587738
但し、nは歩数、φrobot heelstrikeは接地時における機械系振動子(ロボット)の位相であり、自足の接地時にはφrobot heelstrike=0、逆足接地時にはφrobot heelstrike=πという具合に、プリミティブ(位相発生器)に対して位相リセットを定義する。これにより、位相振動子と機械系振動子の歩行を実現する上での望ましい同期が実現されることが、B−2−4−1項の位相振動子のダイナミクスの解析との関連性から示唆される。この項では、ωの更新は離散的に行うが、連続的なωの更新や、位相フィードバックのゲインも考慮した下式の適応則を導入することもできる。
Figure 0004587738
B−2−2−3.数値シミュレーション
ここでは、前項で述べた歩行周期適応則についてのシミュレーションを行なう。角周波数ωの初期値は、4.78rad/s(振動子の周期1.5秒)とした。図41には、結合係数KをK=0.2、0.5、0.8とした場合のそれぞれの歩行シミュレーション結果を示している。同図左は一歩に要する時間を示し、同図右は角周波数ωの更新のプロットである。同図より、CPGと機械系の相互作用による引き込みにより歩行周期の自律的な適応が実現されていることが理解できよう。
B−2−3.運動のスケーリングに関する考察
B−2−2−3項で述べたシミュレーションでは、設計者がロボットでの歩行を実現するために経験的に歩行周期のスケーリングを行なった。しかしながら、B−2−2−2項で述べたように、明示的に目標周期を与えなくても、引き込み現象を利用することによってCPG−機械系が同期し、結果としてロボットの物理的な特性にとって望ましい歩行周期が得られていると考えられる。そこで、この項では、計測された人間の歩行周期とロボットが自律的に適応して得られた歩行周期の関係について考察を行なう。
人間の歩行において、遊脚が自由振動により振り出されるものと仮定し、図42に示すような長さの異なる2つの単振り子の運動を考える。このとき、線形化された振り子の運動方程式は周知のように、以下の式で表される。
Figure 0004587738
このときの固有振動数ωは下式の通りである。
Figure 0004587738
したがって、人間の歩行の周波数ωhumanと、人間の脚長lhumanと、ロボットの脚長lrobotが与えられたとき、ロボットの望ましい周波数ωrobotは単振り子の周波数の比より、以下の式で推定される。
Figure 0004587738
以下、人間の歩行データとB−2−4−2項で述べたシミュレーションにおいて、ロボットが自律的に適応して得られた歩行周期の関係について考察する。
文献[26]に収録されている歩行データは、身長176cm、29歳男性のものである。解剖学的には、人間の脚長は身長に対して約49%であることが知られている[28]。したがって、ここでは人間の脚長をlhuman=1.76×0.49=0.86mと仮定する。ロボットの脚長はlrobot=0.4mであるので、上式[数26]のスケーリング則より、ロボットの歩行周波数及び一歩に要する時間は以下のように推定することができる。
Figure 0004587738
B−2−2−2項の適応則を用いたロボットのシミュレーション結果では、漸近的に以下の通りとなる(K=0.2、0.5、0.8についての90歩目から100歩目までの間の値の平均)。
Figure 0004587738
この結果から、推定値とシミュレーション結果で得られた値の誤差は約3%であり、上式[数26]の周波数のスケーリング則によりロボットの望ましい歩行周期を計算することが可能であることが示唆される。
ここで、数値シミュレーションにより、位相リセットが外乱に対する歩行のロバスト性に有効であることを示す。本シミュレーションでは、外乱として、歩行中にさまざまなタイミングでロボットを前向きあるいは後ろ向きに押すような外力を0.1秒間だけ加え、どれだけの大きさまでの外力に対してロボットが転倒せず歩行を継続できるかを検証した。具体的には、歩行中の位相φ が0〜2πの間で各位相(0.1rad毎)に対し、ロボットが歩行継続可能な最大の外乱の大きさを調べた。図65では、そのシミュレーション結果を位相リセットがある場合と位相リセットがない場合とで比較して示している。
また、図66では、φ=2.0radにおいて、外乱として−2.0Nの外力が0.1秒間だけ加えられた場合(2.0N の力で後ろ向きに押された場合)の応答の例を示している。図66(a)は位相リセットありの場合、図66(b)は位相リセットなしの場合をそれぞれ示している。これらの結果により、位相リセットが歩行の外乱に対するロバスト性に貢献していることが分かる。
B−2−4.分散型位相発生器のための位相リセット
本発明では、ロボット装置を周期運動を行なう物理振動子と捉え、位相信号を生成する位相発生器を定義する.このとき、独立した周期運動を行なう複数の可動部(例えば、左右の脚や、脚と上体などの組み合わせ)が見出された場合には、図6〜図10を参照しながら既に説明したように、可動部毎に複数の位相発生器が定義される。
他方、ZMPの替わりに、neural oscillator(CPG)、passive dynamics、state machine、reinforcement learning、optimization、kinetic energy constraintなどは生物らしい機体動作を実現することができるものの、非線形力学系がすべてを覆い尽くし、現実的な設計論を構築するのが困難である(極言すれば、数学的な原理ではない)という問題がある。
そこで、複数の分布する神経振動子と物理世界の相互作用を、位相反応曲線(phase response curve又はphase resetting curve)で記述し、設計しようというアイデアに至る。これは、位相振動子を扱えばよいので、物理世界以外は、ある意味で離散力学系の安定周期解の解析になり、とても単純化される。システム全体としてはハイブリッド制御系であるが、物理世界からのフィードバックを位相リセットで近似することにより簡単化される。逆に、神経振動子から物理世界へは、目標軌道、トルク、筋肉への運動指令、スティッフネス、目標軌道からのずれに対するローカルなフィードバックのゲインなどのうち少なくとも一部を用いて、連続的な情報の流れを仮定する。振動子の位相に対する影響は1周期の中で2〜3回、可能であれば1回の位相リセットを考える。
分散配置される各位発生器間における相互同期も、状態変数の拡散、位相の差のサイン関数など連続力学系でもデザインすることができるが、設計の見通しの良さ、特に異なる位相差(ゲイト)の実現を考慮するとすべて位相反応曲線で行なった方がよいと思料される。
反射学の創設者Sherringtonの、刺激→反応→刺激→反応の連鎖による(歩行を含めた)複雑な行動の説明は、刺激を必要とせずにリズム運動を作り出すCPGの存在の実証によって否定されたというのは、あまりに単純化した話である。例えば、スティックインセクト(七節)は前者による歩行をすると言われているし、CPGも感覚入力からの修飾を受けている。状態機械というのも、陽には振動子が全くないが、振動子の位相をさらに粗視化して小数の領域に分け、ある位相の範囲で行なわれる運動系への下降性の運動プログラムだけに注目してそれを記述したものと見なせる。すると、状態機械というのも陰には位相振動子が背景にあるのだと言える。状態機械を位相振動子と位相リセットにシステマティックに焼き直すことが、本発明に係るロボットの設計論の本質である。
図43には、位相振動子と位相リセットのメカニズムを模式的に示している。同図に示す例では、脚式移動ロボットなどの状態機械から位相発生器の相当する神経振動子Nと、可動部やその状態量を検出するセンサからなる物理振動子Pが抽出されている。神経振動子Nからは継続的に位相情報φ若しくはこれに基づく制御量Uが供給されている。これに対し、物理振動子P側からは、位相リセット情報が供給される。
本発明者らは、連続相互作用より、あるいは連続相互作用を近似して、位相発生器に対する位相リセットを考えている。何故ならば、歩行というのは、接地、スタンス、スイングなど、現象が離散的であるからと強弁できる。少なくとも位相は離散的にリセットし、軌道、力、スティッフネス制御は連続的にするというハイブリッド制御は、トポロジカルに同じオープン、あるいはクローズド・キネマティック・チェーンになっているときは、質的に同じ連続制御則を適用し、しかしそれを離散的に切り替えるためには、離散的な事象(接地)に着目して、位相を(つまり複数プログラムの切り替えを)行なうというのは、非線形力学系から考えても合理的と思料される。
B−2−2項では、上述したように、歩行動作において例えば足裏のスイッチを利用して、各脚の接地を位相φ=0、一方の脚の接地を位相φ=πという具合に位相を離散的に推定している。図44には、2足歩行の脚式移動ロボットにおいて足裏のスイッチを利用して位相推定を行なうメカニズムを図解している。同図に示す例では、左右の脚の足裏のスイッチによって離床又は接地が検出されることに応答して、位相がリセットされ、系の周期が確定する。すなわち、1周期の間では、左右の脚が交互に立脚(stance)及び遊脚(swing)が繰り返される。ここで、離床時よりも接地時の方が情報の確信度(confidence)が高いので、位相リセットのタイミングとしてより適している。
しかしながら、足裏のスイッチだけで、離散的な事象(位相)を推定するのは精緻さにやや欠ける。換言すれば、足裏のスイッチだけでなくその他のさまざまな状態量を取り込んで位相推定を行なうことにより、確信度はより高まる。確信度まで含めて、フィードフォワード・ニューラル・ネットワークで位相を推定しておき、確信度が高くて、肝心な位相のときにリセットをかけることがより好ましい。小脳に、位相の推定器(順モデル)と位相のリセット器(逆モデル)があるとよい。
図45には、連続相互作用による位相リセットのメカニズムを図解している。ロボットの機体からは、独立した周期運動を行なう複数の可動部が見出され、個々の部位毎に位相発生器としての神経振動子N1、N2、N3、N4が定義されている。
各位相発生器N1、N2、N3、N4は、物理振動子としての下位の制御器Cに対して位相情報を出力する。そして、制御器Cは、位相情報に基づいてそれぞれの可動部への制御情報を生成する。
また、図示の制御メカニズムでは、位相発生器毎に位相フィードフォワード・モデル(すなわち位相推定器)を備えている。すなわち、可動部の状態量を検出すると、この状態量に基づいて可動部の周期運動に関する位相又は角周波数が推定され、これら推定値が位相発生器N1、N2、N3、N4にフィードフォワードされる。各位相発生器N1、N2、N3、N4では、推定された位相又は角周波数を用いて、所定の更新則に基づいて位相信号を更新する。
図44に示した制御メカニズムにおける動作手順を以下に示しておく。
(1)位相発生器としての神経振動子Nは、可動部を駆動制御する下位のコントローラCのスイッチングを行なう。
(2)物理振動子としての可動部における単一の位相(若しくは幾つかの位相)に基づいて、位相発生器としての神経振動子Nの位相をリセットする。
(3)位相反応曲線を用いて、複数の位相発生器間で、神経振動子の周期−位相の物理系の挙動に応じた同調化を行なう。位相反応曲線の詳細については、次項に譲る。
(4)位相リセットには、位相推定のためのフォワード・モデルを用いる。
B−2−5.位相反応曲線を用いた位相発生器の更新則
位相発生器での更新則は位相反応曲線(PRC:Phase Response Curve又はPhase Resetting Curve)を用いることで安定周期解を直観的に理解し易い形で保証しつつ、位相更新則を設計することができる。
位相反応曲線は、生体での同調を伴うリズム現象(例えば、生物の睡眠・覚醒サイクル、人のフィンガー・タッピング(机をトントンと周期的に繰り返し叩く動作)など)で観測されるような、外部刺激に対する振動子の位相の変化の関係を表したものである。例えば、周期運動をしている振り子に短時間の外乱を加えた場合、外乱がさほど大きくなければ、長い時間経過した後には元の周期での運動に収束する。このとき、収束した運動は、外乱が無い場合の運動と比べて、周期は同一であるものの、位相のずれが生じている。横軸に外乱を加えたタイミング(位相)、縦軸にどの程度位相ずれ(進みor遅れ)を生じたかを図示したものが位相反応曲線(PRC)である。
例えば、図46に示すような位相反応曲線について考察してみる。位相発生器が生成した位相信号がφkのときに、位相推定器から信号が入った場合にΔ(φk)だけ位相ズレを生じさせる。この位相反応曲線を設計することでロボット機体ダイナミクスを有効に利用した外界との望ましいリズムの同調を実現する周期運動を行うことを考える。このようなPRCの設計には強化学習の枠組みを用いることもできる。
ここで、位相推定器からの出力が1周期に1回ずつ離散的に発生するとする。具体的には、例えば右足が接地したときのみ位相推定器から信号が出力されるものとする。このとき、位相反応曲線を用いて、位相シフトΔ(φk)を離散的に行なう更新則を考える。なお、簡単のため、ここでは振動数ωの更新は行なわないものとする。すなわちTP、TNは一定値である。
図47は、引き込みの差分方程式を模式的に示している。但し、TNは位相発生器の自然周期、TPは周期運動を行なうロボットの可動部の自然周期、φは位相発生器としての神経振動子の位相、Δ(φ)は位相発生器の位相反応曲線(進行しているときの符号が正)、φkはk番目のサンプリング時刻において物理振動子からパルスが発されたときの神経振動子の位相である。
図47と以下の式(1)及び(2)から、位相反応曲線PRCによる位相調節後の新しい位相上での、次の位相推定器の出力が生じる時の位相φk+1は、式(3)のようになる。十分に時間が経過した後では、位相発生器の出力と位相推定器からの入力はある一定の位相関係に固定されることが、安定した周期運動のために必要である。すなわち、式(3)において、φk+1=φkとなる。よって、平衡点は式(4)のように得られる。
Figure 0004587738
位相反応曲線PRCを用いると、定常解の安定性が図式的に求められる。図48には、上式(4)を位相反応曲線上に示した様子を示している。図示のように、同式と同曲線の交点が収束後の位相ズレ量となる。このとき、位相反応曲線の傾きが負であれば、交点は安定な平衡点となり、安定周期解があることが分かる。一方、交点での傾きが正であれば、位相は発散するため安定解とはならないことが分かる。このように位相反応曲線の設計によって、安定周期解の存在を図式的に簡単に保証することができる。
位相反応曲線を用いた設計は、複数の位相発生器間であっても適用可能である。図49には、2つの位相発生器の間で、相互に離散的信号によって引き込む様子を示している。
このときの相互引き込みによる差分方程式を下式(5)〜(7)に示す。図50にはこれを示している。図示のように、ここでも安定性の判別が図式的に可能である。このように位相反応曲線を用いれば、複数の位相発生器間で安定周期解がどこにあるのか、図式的に理解することが容易になる。
Figure 0004587738
B−2−6.ニューラル・ネットワークを用いた位相推定器
上述した実施形態では、歩行動作において例えば足裏のスイッチを利用して、各脚の接地を位相φ=0、一方の脚の接地を位相φ=πという具合に位相を離散的に推定している。しかしながら、足裏のスイッチだけで、離散的な事象(位相)を推定するのは精緻さにやや欠ける。足裏のスイッチだけでなくその他のさまざまな状態量を取り込んで位相推定を行なうことにより、確信度はより高まる。この項では、ニューラル・ネットワークを用いた位相推定器の構成例について説明する。
センサの観測値vから位相推定値φ'を出力するニューラル・ネットワークを構成する。ここでは一例として、下式に示すようなパラメータ線形のものを考える。
Figure 0004587738
ここで、wiはi番目のネットワークの荷重(パラメータ)、bi()はi番目の基底関数である。例えば、下式に示すような動径基底関数を用いることができる。また、nは基底関数の数である。
Figure 0004587738
但し、viはi番目の基底関数の中心値であり、Dは基底関数の大きさを決めるパラメータである。
ここで、ニューラル・ネットワークの出力を用いて、例として次式の正規分布による確率モデルを考える。
Figure 0004587738
但し、σ2は分散を表す。これによって、現在の位相に関する確率モデルを得る。よって、例えばφa<φ<φb且つP(φ|v)>aを満たす場合は、制御器を切り替えるなどといったことが可能となる。但し、φa、φbは制御器の切り替え位相を示すものであり、aは閾値を示す。
また、確率モデルを用いて、ベイズ推定により位相推定器を構成することもできる。まず、一例として位相の事前確率を次式の正規分布で表す。
Figure 0004587738
ここで、φ0は位相出力器が出力する平均位相、σ2はその分散である。さらに、位相が与えられたときの予測されるセンサの観測値の確率モデルを次式のように表す。
Figure 0004587738
但し、v'(φ)は現在の位相から観測値を出力する関数であり、Σは観測値の共分散行列である。ここで、ベイズ推定により下式の通りとなる。
Figure 0004587738
よって、例えばφa<φ<φb且つP(φ|v)>aを満たす場合は、制御器を切り替えるなどといったことが可能となる。但し、φa及びφbは制御器の切り替え位相を示すものであり、aは閾値を示す。
より複雑な各確率分布の表現手法との一例として、混合分布を用いることも可能である。
B−3.モデル・ベース強化学習による2足歩行の効率的な学習アルゴリズム
この項では、人間の歩行学習メカニズムの理解を目指して、2足歩行ロボットのための学習アルゴリズムについて説明する。また、学習アルゴリズムの過程を通じて、効率の良い歩行を実現することを目指している。歩行運動は、倒れずに次の1歩を踏み出すというタスクとして表現することができるが、安定な歩行を生成するための教師軌道を求めることは容易ではない場合が多い。そこで、本実施形態では、学習の枠組みとして強化学習を用いている。
B−3−1.2足歩行ロボット
この項では、支持棒によって2次元平面内に拘束された5リンクの2足歩行ロボットを対象システムとして扱う(図51を参照こと)。開発された実ロボットは、ダイレクト・ドライブのモータをアクチュエータとして用いることで、高いバックドライバビリティーを供えている。同定されたロボットの物理パラメータを下表に示している。
Figure 0004587738
また、2足歩行の問題を扱う場合、地面と足裏の接触、衝突が問題となる。開発したシミュレータにおいて用いた衝突モデルは下式の通りである。
Figure 0004587738
但し、Fx、Fzはそれぞれ水平方向及び鉛直方向の床反力、x、zは足先の水平位置及び鉛直位置を表し、xgは足先接地点、zgは足先の高さを表す。また、床反力の表現としてバネ−ダンパ・モデルを用いており、水平方向の位置ゲインはkx=3000、速度ゲインはbx=30、鉛直方向の位置ゲインはkz=5000、速度ゲインはbz=100とする。滑りのモデルとしては、Fx>cFzならxg=xとした。但し、c=1.0は静止摩擦係数である。
B−3−2.State Machineを用いた実ロボットによる2足歩行の実現
この項では、学習アルゴリズムの基礎となる手法について検討する。最初の試みとして、既に歩行制御きの構築手法として成果を納めているState machine[29]を用いた方法を実際のロボット(図51を参照のこと)に適用した。
B−3−2−1.状態遷移図
State machineを用いた方法では、状態の定義と遷移の条件を決定する必要がある。ここでは、シミュレーションや実機を用いて、実験的に定義や条件を設定した。図52には、状態遷移図を示している。
状態1は両脚支持状態を示しており、ここから遊脚を引き上げ、状態2に遷移する。状態2では、遊脚を前方に振っている状態を示しており、遊脚の足先が支持脚の足先を過ぎると状態3に遷移する。状態3では、遊脚の膝を伸ばす状態を示している。ここで、上体の位置が支持脚を過ぎると、状態4に遷移する。状態4では、わずかに曲がった支持脚の膝を伸ばすことで、地面を蹴りエネルギを注入する。遊脚が地面に接地すると状態1に戻り、左右脚が支持脚と遊脚で交代する。
B−3−2−2.実験結果
図53に歩行中の関節角軌道を、図54に出力トルクの軌道を示している。また、図55には最終的に得られた実機による歩行パターンを示している(実ロボットでの歩行パターン(左列):左足が支持脚(右列):右足が支持脚,それぞれ上段から下段に向かって時間が進んでいる)。
B−3−3.歩行周期の推定
前項において、State machineを用いた動的な2足歩行について説明した。しかし、環境の変化に対し、同じパラメータを用いたState machineでは対応できないということが考えられる。この項では、歩行制御器の環境適応性について考察する。
図56には、ネコを用いた動物実験を示している。同図左はネコの歩行適応実験の様子を示しており。左前のトレッドミルのみ異なる速度を持つ。また、同図右は小脳とCPGモデルを示している。CF(Climbing Fiber)は登上線維を表す。CFはCPGからのフィードバックを受けている。この実験によると、Central Pattern Generator(CPG)のパラメータの変更には小脳が関わっていることが示唆されている[30]。脳の学習は一般に登上線維によって伝達される誤差信号を用いた教師付の学習を行なっていると言われている[31]。また、CPGのパラメータの変更を要するような適応実験において顕著な登上線維の発火が見られるという報告がある[30]。以上の点から考えると、歩行中の外界との相互作用によりCPGのパラメータを変更するための何らかの誤差信号を得ていると思料される。
実際の誤差信号が何であるかは不明であるが、本発明者らは、歩行周期によって誤差を検出することを考えた。歩行軌道生成器の歩行周期を、外界からの情報を用いて対象の力学系に適応させることを考える。ここで、目標歩行周期を実現するための角周波数ω*を実際の歩行に要した周期から導くと、下式の通りとなる。
Figure 0004587738
よって、誤差信号は下式で表される。
Figure 0004587738
但し、ωnはn歩目の推定された角周波数を示す。そこで、角周波数の更新則は下式のようになる。
Figure 0004587738
ここでは、この手法を検証するために、図57に示すような単純な3リンクの歩行ロボット・モデルを用いた。用いた制御器は次式に示すように、周期的な目標軌道を追従するようにした。
Figure 0004587738
但し、τlは左足に加えるトルク、τrは右足に加えるトルク、k=5.0は位置ゲイン、b=0.1は速度ゲイン、θl及びθrはそれぞれ左右の脚の角度を示す。また、現在の推定された位相はφ=ω(ハット)tのように表される。ここで、tは現在の時刻を表す。
B−3−3−1.シミュレーション結果
まず歩行周期の推定を行なわない場合についてシミュレーション上で実験を行なった。適切な初期条件(進行方向への初期速度0.2[m/s])を与え、平地(傾斜角=0度)で歩行可能な歩行周期を初期値(T=0.42[sec]、ω0=15[rad/sec])として選んだ。それらのパラメータを用いて上りの傾斜(3度)と下りの傾斜(4度)において歩行を行なわせたところ、それぞれ10歩以内に転倒した。
一方、歩行周期の推定を行なったところ、それぞれの傾斜において歩行を継続することができた。但し、それぞれの傾斜角は歩行周期の推定を行なった場合の歩行継続可能な限界を示している。これらより傾斜が大きい場合は、歩行周期の推定のみで対応することはできないことが分かる。
B−3−4.強化学習を用いた歩行運動の獲得
以上のことから、安定な歩行を得るためには、周期的な歩行軌道を環境が持つ力学系のタイミングに合わせることが有効であることが理解できよう。しかし、歩行軌道そのものを変更する手段を持たない。この項では、初期に与えられた歩行軌道では安定な歩行ができないような場合に、強化学習の枠組みを用いて歩行が可能となるような軌道の学習法について考察する。また、ここでの提案モデルはB−3−2項で説明したState machineと同様の枠組みを用いている。さらに、遷移条件を位相によって与えているため、前項で説明した歩行周期の推定方法を適用することができる。
この項で提案する手法では、パラメータ更新と行動決定を歩行軌道における2つのpoincare断面(φ=π/2,φ=3π/2位相上)において行なった。図58に示すように、ここでは歩行軌道を4つの中間姿勢(経由点)を用いて表現する(位相φ=π/2、φ=3π/2でのpoincare断面において、パラメータの更新と行動の選択を行なっている)。但し、左右の対象性を考慮すると、2つの中間姿勢のみを決定すれば良いことになる。この枠組みは、State machineにおける状態遷移条件を位相で決定していることになる(ここでは、図58に示すように位相φ=0、φ=π/2、φ=π、φ=3π/2において状態遷移を行なった)。同様の枠組みとして、松岡オシレータ[2]の出力を遷移条件に用いる手法が提案され、4足歩行ロボットへの適用に成功している[32]。また、この提案法を4つの中間姿勢を経由点として用いた軌道生成手法と考えることもできる[33]
このモデルを用いた学習手法の構築を行なう。学習器への入力状態は、上体の支持脚先端からのずれ及びその加速度成分からなるxとした。図59には、学習のための状態の定義(同図左)と行動の定義(同図右)を示している。つまり、支持脚を支持点にした倒立振子に対応するような状態表現を用いている。図示の通り、学習器の出力は、遊脚接地点の選択に対応する、遊脚膝関節の目標角である。
B−3−4−1.モデル・ベース強化学習法
この項では、モデルを用いる強化学習法[34,35]について簡単な説明を行なう。制御対象のモデルが既知の場合はそれを用いることができるが、ここではモデルが未知として、制御対象のモデル自体も学習することを考える。そこで、始めにモデルの学習方法について説明する。
モデル学習:
制御対象のモデルは教師付き学習の枠組みで行なうことができる。本実施形態に係る手法の中で学習すべきダイナミクス・モデルは図58に示したように、位相π/2から3π/2への状態xの写像を獲得することである(対象性を考慮すると、位相φ=3π/2からφ=π/2への写像も獲得することになる)。ここで、この離散時間ダイナミクスを以下のように表し、関数近似器を用いて近似することを考える。
Figure 0004587738
すなわち、下式に示すような、パラメータmを持つ関数近似器によってダイナミクスの推定を行なう。教師信号は、次の離散時刻での状態を用いることができる。
Figure 0004587738
価値関数の学習:
強化学習の目的は、各時刻で受け取る報酬(又は罰)の総和を一連の行動を通じて最大化(又は最小化)するような行動則を獲得することである。つまり、時刻Tにおいて受け取る報酬をr(T)とすると、下式のように定義される累積報酬の期待値(価値関数と呼ばれる)を最大化するように行動則の更新を行なう。但し、γ(0≦γ≦1)は割引率を表す。
Figure 0004587738
ここで問題となるのは、学習を通じてどのように価値関数を推定し、それを用いて行動則を更新するかである。ここでは、連続関数を用いた関数近似器をによって価値関数を近似することを考える。つまり、下式のように考える。
Figure 0004587738
但し、vは関数近似器のパラメータ・ベクトルを表す。ここで、上式[数38]の満たすべき報酬と価値関数の関係からのずれを下式のように表し、Temporal Difference誤差(TD誤差)と呼ぶ。
Figure 0004587738
この誤差を用いて,次式のように価値関数の更新を行なう。但し、β=0.2は、学習率でパラメータとして設定する必要がある。
Figure 0004587738
行動則の学習:
行動則の更新のために、推定されたモデルと価値関数を用いる。行動則を更新する手順は以下の通りである。
(1)現在の行動則と推定されたモデルを用いて、次の時刻(位相)での状態を推定する。
(2)次の時刻(位相)での状態における価値関数の勾配∂V/∂xを計算する。
(3)次の時刻(位相)での状態におけるモデルの入力に関する勾配∂f/∂uを計算する。
(4)価値関数の勾配∂V/∂xに状態が遷移するように行動則を更新することが望ましいが、制御入力によって1ステップの離散時間のうちに任意の状態に遷移させることはできない。そこで、モデルの入力に関する勾配∂f/∂uによって、制御入力が可能な方向に写像する。つまり、∂V/∂x・∂f/∂uの方向に行動則を更新する。
Figure 0004587738
ここで、α=0.2は学習率でパラメータである。
また、関数近似器としてはReceptive Field Weighted Regression(RFWR)[23]を用いた。
実験結果:
上述の手法を、図51に示した5リンク構成のモデルに適用し、シミュレーションにより検証を行なった。但し、初期の1歩に関しては、別途目標軌道を用意した。
図60には、学習中(25試行目)の歩行軌道の例を示している。膝関節の遊脚接地時の目標角が、探索行動のためばらつきがある出力になっている。各関節での目標角が滑らかにつながっているのは、出力された目標姿勢を躍度最小基準を用いた軌道(5次のスプライン)によって補間しているからである。このような手法は、和田ら[33]、宮本ら[36]によって提案されている。安定な歩行は約50試行で獲得された。図61には、学習後の安定な歩行軌道を示している。はじめの4歩くらいは膝を大きめに曲げてその後蹴ることにより、倒れないようにエネルギを注入していることが分かる。
図67には、学習の前後での2脚歩行ロボットの歩行軌道を比較している。同図の上段には学習前の歩行軌道を、同図の中段に30試行後の歩行軌道を、同図の下段には学習後の歩行軌道を、それぞれ示している。また、図68には、それぞれの試行での累積報酬を示している。ここでは、はじめて50歩の歩行に成功したときを歩行獲得と定義する。5回の実験を行なった結果、平均80試行で歩行運動を獲得する。図67の下段には、獲得された歩行軌道を示している。
また、図69には、シミュレーションにより獲得された価値関数を示している。同図から、定性的に以下のことが読み取れる。下式は、脚が前方にあり、且つ股関節位置が後方に速度を持っていることを表しており、後方に転倒し易い状態である。このとき、価値関数の値は低くなっている。
Figure 0004587738
また、下式は、支持脚が股関節の鉛直線上にあり、前方への速度を持っている場合に相当し、価値関数は高い値を示している。つまり、前進しているときには高い値を示している。
Figure 0004587738
以上のことから、定性的にも妥当な価値関数が獲得されていることが理解できよう。
図70には、提案する手法を実機に適用したときの、学習前の2脚ロボットが歩行する様子を示している。図示のように、数歩のうちに転倒に至っていることが分る。また、図71には、学習後の2脚ロボットが歩行する様子を示している。およそ50回の試行を経て、図示の実験例では、定常的な歩行動作を獲得することができた。
通常、歩行のような多自由度系の学習においては、学習が収束するまで数百から数万という多くの試行回数が必要であり、実機検証は現実的に不可能である。これに対し、本手法では50回という実機で十分に試行可能な少ない回数で学習を収束させることができる優れた方法であることが理解できよう。図72には、実機実験により獲得された価値関数を示している。関数の概形がシミュレーション結果図69とよく似ている形であることが分る。
また、環境の変化に対する適応性能を検証するため、学習によって獲得された制御器を用いて、勾配のある環境で歩行が可能であるかどうかを試した。勾配は0.1度毎に検証し、上りで0.6度、下りで0.2度まで新たに学習することなく、安定な歩行が可能であることが確認された。ここでの歩行の周期はT=0.79[sec](ω=8.0[rad/sec])とした。B4−2項で説明した実機実験で実現されたものとほぼ同じである。
B−3−4−2.歩行周期推定方法の適用
前項では、環境変化に対する適応性能の検証を行なった。大きな上り斜面への適応が困難であるのは、足首トルクを発生することができないためと考えられるが、下り斜面への適応性能は高いとは言えない結果になった。これは主に、設定した歩行周期が下り坂の場合のダイナミクスに合っていないためと考えられる。しかし、本実施形態に係る学習手法は、位相を遷移条件として用いているため、B−3−3項で詳解した歩行周期推定法を用いることができる。そこで、歩行周期推定法による適応実験をシミュレーション上で行なった。環境としては、1.5度の下り坂で実験を行なった。すると、7試行ほど転倒を繰り返した後、8試行目で安定な歩行を行なうことができるようになった。
B−3−4−3.獲得された行動則の解析
この項では、図58に示した、位相φ=π/2、φ=3π/2におけるpoincare断面において獲得された行動則が作り出す離散ダイナミクスの安定性について検証する。検証方法としては、poincare断面での離散ダイナミクスのヤコビアンの固有値を用いる[37,38]。この各固有値λiが|λi(J)|<1なら周期軌道は安定であると言える。本実施形態に係る手法では、ダイナミクス・モデルと行動則を表現するために連続関数を用いたので、次式に示すように、解析的にヤコビ行列Jを求めることができる。
Figure 0004587738
但し、学習中は探索的な行動を行なうこと、及びダイナミクスが状態として図59における入力状態xのみ考慮するという荒い表現になっているため、安定歩行軌道付近でのダイナミクスの近似精度が低い場合がある。このため,安定歩行中にモデルの更新のみを行なって、シミュレーション上のロボットを50歩かせた場合の固有値の変化を図62に示した。モデル誤差が減少するのに伴って、ヤコビ行列の固有値が1以下になっていることが判る。このとき、行動則の更新は行なっていない。つまり、学習された行動則は固有値の計算からも安定な歩行周期を生成することが確かめられた。
実機実験により獲得された制御器の安定性を、シミュレーションの場合と同様、検討した。図73には、試行毎の固有値の平均値を求めた結果を示している。学習が進むにつれて固有値が減少し、最終的に大きさが1より小さくなっていることが分る。実機実験により、学習された行動則は固有値の計算からも安定な歩行周期を生成することが確かめられた。
以上、特定の実施例を参照しながら、本発明について詳解してきた。しかしながら、本発明の要旨を逸脱しない範囲で当業者が該実施例の修正や代用を成し得ることは自明である。
本明細書では、2足の脚式移動ロボットに本発明を適用した実施形態を中心に説明してきたが、本発明の要旨はこれに限定されるものではない。4足あるいは任意の脚数の脚式ロボットの歩行動作や、脚式以外の移動ロボットの行動制御、移動体以外の機械装置における駆動制御に対しても、同様に本発明を適用することができる。
また、本発明の要旨は、必ずしも「ロボット」と称される製品には限定されない。すなわち、電気的若しくは磁気的な作用を用いて人間の動作に似せた運動を行なう機械装置あるいはその他一般的な移動体装置であるならば、例えば玩具などのような他の産業分野に属する製品であっても、同様に本発明を適用することができる。
要するに、例示という形態で本発明を開示してきたのであり、本明細書の記載内容を限定的に解釈するべきではない。本発明の要旨を判断するためには、冒頭に記載した特許請求の範囲の欄を参酌すべきである。
《参考文献》
1:Avis H.Cohen著“Control principle for locomotion − looking toward biology”(AMAM 2003)
2:Matsuoka K著“Sustained oscillations generated by mutually inhibiting neurons with adaption”(Biological Cybernetics,52,pp.345−353(1985))
3:Matthew M. Williamson著“Neural Control of Rhythmic Arm Movements”(Neural Networks,Vol.11,Issues 7−8,pp.1379−1394(1998))
4:琴坂、S.Schaal共著「神経振動子を用いたロボットのリズミックな運動生成」(日本ロボット学会誌,Vol.19,No.1,pp.116−123(2001))
5:宮腰、多賀、國吉共著「神経振動子のパラメータ自動調整機構」(第5回ロボティクスシンポジア予稿集,pp.301−306(2000))
6:G.Taga,Y.Yamaguchi,H.Shimizu共著“Self−organized control of bipedal locomotion by neural oscillators in unpredictable environment,Biological Cybernetics,vol.65,pp.147−159(1991))
7:G.Taga著“A model of the neuro−musculo−skeletal system for human locomotion I”(Emergence of basic gait,Biological Cybernetics,vol.73,pp.97−111(1995))
8:G.Taga著“A model of the neuro−musculo−skeletal system for human locomotion II”(Real−time Adaptability under various constraints“(Biological Cybernetics,vol.73,pp.113−121(1995))
9:長谷、山崎共著「神経振動子と遺伝的アルゴリズムを用いた実2足歩行類似運動の生成」(計測自動制御学会論文集,Vol.33,No.5,pp.448−454(1997))
10:長谷、山崎共著「2足歩行運動を生成する神経系構造の自律的獲得」(機論(C編),Vol.64,No.625,pp.3541−3547(1998))
11:M.Sato,Y.Nakamura,S.Ishii共著“Reinforcement Learning for Biped Locomotion”(ICANN(2002))
12:福岡、木村共著「4足ロボットの生物規範型不整地適応動歩行−体性感覚・前庭感覚による調整−」(日本ロボット学会誌,Vol.19,No.4,pp.510−517(2001))
13:H.Kimura,Y.Fukuoka,T.Mimura共著“Dynamics Based Integration of Motion Adaptation for a Quadruped Robot”(AMAM2003)
14:宮腰、山本、多賀、國吉共著「脚伸縮機構による二足歩行シミュレーション」(第18回日本ロボット学会学術講演会予稿集,第3巻,pp.1107−1108(2000))
15:G.Taga著“A Model of Integration of Posture and Locomotion”(Proceedings of International Symposium on Computer Simulation in Biomechanics(1997))
16:宮腰、多賀、國吉、長久保共著「神経振動子を用いた三次元2足足踏みシミュレーション−ヒューマノイドの実世界内行動を目指して」(日本ロボット学会誌,Vol.18,No.1,pp.87−93(2000))
17:T.McGeer著“Passive Dynamic Walking”(IJRR,pp.62−82(1990))
18:Pratt,Jerry著“Exploiting Inherent Robustness and Natural Dynamics in the Control of Bipedal Walking Robots”(Ph.D. Thesis,Computer Science Department,Massachusetts Institute of Technology,Cambridge,Massachusetts(2000))
19:Hase,K.、Yamazaki,N共著“Computational evolution of human bipedal walking by a neuro−musculoskeletal model.”(Artificial Life and Robotics,Vol.3,pp. 133−138, 1999)
20:Taga,G著“Nonlinear dynamics of the human motor control − real−time and anticipatory adaptation of locomotion and development of movements”(In Proceedings of the International Symposium on Adaptive Motion of Animals and Machines,2000)
21:Miyakoshi,S.、Yamakita,M.、Furuta,K.共著“Juggling control using neural oscillators”(In Proceedings of the IEEE/RSJ International Conference on Intelligent Robots and Systems,pp.1186−1193,1994)
22:Ijspeert,A.、Nakanishi,J.、Schaal,S.共著“Learning attractor landscapes for learning motor primitives”(In Neural Information Processing Systems(NIPS 2002),2002)
23:Schaal,S.、Atkeson,C.G.共著“Constructive incremental learning from only local information”(Neural Computation,Vol.10,No.8,pp.2047−2084,1998)
24:川人光男著「生体におけるリズム現象の工学的研究」(医用電子と生体工学,Vol.19,No.3,pp.171−178,1981)
25:http://www.sdfast.com
26:江原義弘、山本澄子共著「ボディダイナミクス入門歩き始めと歩行の分析」(医歯薬出版株式会社,2002)
27:Strogatz、S.H.著“Nonlinear dynamics and chaos: with applications to physics”(Addison−Wesley,1994)
28:Dempster,W.T.、Gaughran,G.R.L.共著“Properties of body segments based on size and weight”(American Journal of Anatomy,Vol.120,pp.33−54,1965.)
29:M.H.Raibert著“Legged Robots That Balance”(The MIT Press,Cambridge,MA,1986)
30:柳原大著「運動学習と小脳」(体育の科学,Vol.46,No.6,pp. 455−463,1996)
31:川人光男著「脳の計算理論」(産業図書,1996)
32:Y.Fukuoka、H.Kimura共著“Adaptive Dynamic Walking of a Quadruped Robot on Irregular Terrain based on Biological Concepts”(Int.Journal of Robotics Research,Vol.22,No.2, pp.187−202,2003)
33:Y.Wada、M. Kawato共著“A theory for cursive handwriting based on the minimization principle”(Biological Cybernetics, Vol.73,pp.3−15,1995)
34:R.S.Sutton、A.G.Barto共著“Reinforcement Learning:An Introduction”(The MIT Press,Cambridge,MA,1998)
35:K.Doya著“Reinforcement Learning in Continuous Time and Space”(Neural Computation,Vol.12,No.1,pp.219−245,2000)
36:H.Miyamoto、S. Schaal、F.Gandolfo、H.Gomi、Y.Koike、R.Osu、E.Nakano、Y.Wada、M.Kawato共著“A Kendama Learning Robot Based on Bi−directional Theory”(Neural Networks,Vol.9,pp.1281−1302,1996)
37:M.Garcia、A.Chatterjee、A.Ruina、M.J.Colemang共著“The simplest walking model: stability,complexityu,and scaling”(ASME Jounal of Biomechanical Engineering,Vol.120,No.2,pp.281−288,1998)
38:R.Q.Van der Linde著“Passive bipedal walking with phasic muscle contraction”(Biological Cybernetics,Vol.82,pp.227−237,1999)
図1は、本発明に係るロボット装置の姿勢安定制御メカニズムの構成を概念的に示した図である。 図2は、2足の脚式移動ロボットが左右の脚を交互に支持脚、遊脚に切り替えて歩行動作を行なうときの、位相情報φに基づいて制御器を適宜選択するメカニズムを示した図である。 図3は、可動部の関節角θと周期運動における位相φの関係を説明するための図である。 図4は、可動部の関節角θと周期運動における位相φの関係を説明するための図である。 図5は、ロボット全体の運動を周期運動と捉え、機体全体で1つの位相発生器を定義した様子を示した図である。 図6は、歩行やその他の脚式運動においては、左右の各脚の動作をそれぞれ独立した周期運動と捉え、脚毎に1つの位相発生器を定義した様子を示した図である。 図7は、下肢においては1つの周期運動と捉えることができる一方、上肢と体幹などその他の部位においては別の周期運動と捉え、下肢と、上肢及び体幹において、それぞれ異なる位相発生器を定義した様子を示した図である。 図8は、上肢及び体幹と、左右の各脚部をそれぞれ独立した周期運動と捉えて位相発生器を定義した様子を示した図である。 図9は、左右の脚、左右の腕、体幹、頭部の動作をそれぞれ独立した周期運動と捉え、部位毎に1つの位相発生器を定義した様子を示した図である。 図10は、関節毎に独立した周期運動を行なっているものと捉えて、関節毎に位相発生器を定義した様子を示した図である。 図11は、各可動部への制御量を調停して装置全体の協調動作を実現する仕組みを模式的に示した図である。 図12は、本発明の実施に供される「人間形」又は「人間型」の脚式移動ロボット100が直立している様子を前方から眺望した様子を示した図である。 図13は、本発明の実施に供される「人間形」又は「人間型」の脚式移動ロボット100が直立している様子を後方から眺望した様子を示した図である。 図14は、脚式移動ロボット100が具備する関節自由度構成を模式的に示した図である。 図15は、脚式移動ロボット100の制御システム構成を模式的に示した図である。 図16は、松岡による神経振動子モデルを示した図である。 図17は、DBを用いたCPGによる引き込み現象の実験機の構成を模式的に示した図である。 図18は、矢状面拘束の2足歩行モデルの各関節に神経振動子を配置し、環境との相互作用により自律的な歩行が生成される様子を示した図である。 図19は、歩行運動を3つのステートに分離した様子を示した図である。 図20は、Compass−like Bipedモデルを示した図である。 図21は、神経振動子の配置と結合係数を示した図である。 図22は、実験機としてのロボットの機体リンク部分の構造を模式的に示した図である。 図23は、フィードバック経路の構成を示した図である。 図24は、前後脚の角度目標値を入れ替える様子を示した図である。 図25は、LMの出力を符号反転してSWに入力する様子を示した図である。 図26は、定常歩行時の計測結果を示した図である。 図27は、Left hip jointの位相平面図を示した図である。 図28は、定常入力値cと歩行速度・機械的消費エネルギ・移動の効率を表す無次元量、移動仕事率の関係を示した図である。 図29は、脚長・質量で正規化した関節最大トルクを比較した結果を示した図である。 図30は、位相振動子と局所重光き回帰をベースとしたリミット・サイクル・アトラクタを持った周期運動学習プリミティブをCPGモデルとして用い、人間の歩行動作の学習、獲得した運動の適切なスケーリングによりロボットでの歩行の運動生成の概念図である。 図31は、平面5リンク2足歩行ロボットのモデルを示した図である。 図32は、学習した軌道の変更の例を示した図である。 図33は、本発明の一実施形態に係るロボット制御系の概念図である。 図34は、収集されたデータの関節角度と、右足接地から次の接地までの1周期分を取り出して示した図である。 図35は、運動学習プリミティブでの人間の歩行軌道の学習の結果を示した図である。 図36は、t=0〜20の運動学習プリミティブの出力による目標関節軌道及びロボットの各関節軌道を示した図である。 図37は、歩行2周期分(歩数4歩)の左足の目標関節軌道及びロボットの各関節軌道、各足の接地タイミングを示した図である。 図38は、関節トルク指令値を示した図である。 図39は、定常状態におけるロボットの歩行の様子を示した図である。 図40は、2つの結合位相振動子のダイナミクスを示した図である。 図41は、歩行シミュレーション結果を示した図である。 図42は、遊脚が自由振動により振り出されるものと仮定し、長さの異なる2つの単振り子の運動を描いた図である。 図43は、位相振動子と位相リセットのメカニズムを模式的に示した図である。 図44は、2足歩行の脚式移動ロボットにおいて足裏のスイッチを利用して位相推定を行なうメカニズムを示した図である。 図45は、連続相互作用による位相リセットのメカニズムを示した図である。 図46は、位相反応曲線の例を示した図である。 図47は、引き込みの差分方程式を模式的に示した図である。 図48は、位相反応曲線上で定常解の安定性を求める様子を示した図である。 図49は、2つの位相発生器の間で、相互に離散的信号によって引き込む様子を示した図である。但し、一方の位相発生器N1は位相φ、周期T1、位相反応曲線Δ(φ1)とし、他方の位相発生器N2は位相φ、周期T2、位相反応曲線Δ(φ2)とする。 図50は、相互引き込みによる差分方程式を示したグラフである。 図51は、支持棒によって2次元平面内に拘束された5リンクの2足歩行ロボットを示した図である。 図52は、図51に示した実ロボットについての状態遷移図を示した図である。 図53は、実験により得られた歩行中の関節角軌道を示した図である。 図54は、実験により得られた出力トルクの軌道を示した図である。 図55は、最終的に得られた実記による歩行パターンを示した図である。 図56は、ネコを用いた動物実験を示した図である。 図57は、単純な3リンク構成の歩行ロボット・モデルを示した図である。 図58は、歩行軌道生成モデルを示した図である。 図59は、学習のための状態の定義(同図左)と行動の定義(同図右)を示した図である。 図60は、学習中(25試行目)の歩行軌道の例を示した図である。 図61は、学習後の安定な歩行軌道を示した図である。 図62は、シミュレーション上のロボットを50歩かせた場合の固有値の変化を示した図である。 図63は、定常歩行時のシミュレーション結果を示した図である。 図64は、左股関節を周期運動を行なう物理振動子として捉えたときの、振動子の位相の変化を描いた位相平面図のシミュレーション結果を示した図である。 図65は、位相リセットが外乱に対する歩行のロバスト性に有効であることを表した数値シミュレーション結果を示した図である。 図66は、歩行時に外乱が与えられた場合の応答を示した図である。 図67は、学習の前後での2脚歩行ロボットの歩行軌道の比較を示した図である。 図68は、歩行の試行での累積報酬を示した図である。 図69は、シミュレーションにより獲得された価値関数を示した図である。 図70は、提案する手法を実機に適用したときの、学習前の2脚ロボットが歩行する様子を示した図である。 図71は、学習後の2脚ロボットが歩行する様子を示した図である。 図72は、実機実験により獲得された価値関数を示した図である。 図73は、試行毎の固有値の平均値を求めた結果を示した図である。
符号の説明
1…首関節ヨー軸
2A…第1の首関節ピッチ軸
2B…第2の首関節(頭)ピッチ軸
3…首関節ロール軸
4…肩関節ピッチ軸
5…肩関節ロール軸
6…上腕ヨー軸
7…肘関節ピッチ軸
8…手首関節ヨー軸
9…体幹ピッチ軸
10…体幹ロール軸
11…股関節ヨー軸
12…股関節ピッチ軸
13…股関節ロール軸
14…膝関節ピッチ軸
15…足首関節ピッチ軸
16…足首関節ロール軸
30…頭部ユニット,40…体幹部ユニット
50…腕部ユニット,51…上腕ユニット
52…肘関節ユニット,53…前腕ユニット
60…脚部ユニット,61…大腿部ユニット
62…膝関節ユニット,63…脛部ユニット
80…制御ユニット,81…主制御部
82…周辺回路
91,92…接地確認センサ
93,94…加速度センサ
95…姿勢センサ
96…加速度センサ
100…脚式移動ロボット

Claims (24)

  1. 複数の可動部を有するロボット装置であって、
    前記の可動部の少なくとも一部の周期運動に関する位相信号を発生する位相信号発生手段と、
    前記位相信号に基づいて前記可動部の制御信号を生成する制御手段と、
    前記制御信号に従って前記可動部を駆動する駆動手段と、
    前記駆動手段により駆動される前記可動部の状態量を検出する状態量検出手段と、
    前記状態量に基づいて前記可動部の周期運動に関する位相又は角周波数を推定する推定手段と、
    を備え、
    前記位相信号発生手段は、前記推定手段により推定された位相又は角周波数に基づいて、前記位相信号を更新する、
    ことを特徴とするロボット装置。
  2. 前記制御手段は、制御則の異なる複数の制御器を備え、前記位相信号に基づいて適切な制御器を選択し、該選択された制御器が前記位相信号に基づいて前記可動部の制御信号を生成する、
    ことを特徴とする請求項1に記載のロボット装置。
  3. 前記可動部は1以上の関節を有し、
    前記状態量検出手段は前記関節の関節角又は関節角速度のうち少なくとも1つを状態量として検出し、
    前記推定手段は前記関節角又は関節角速度のうち少なくとも1つに基づいて前記関節の周期運動に関する位相又は各周波数を推定する、
    ことを特徴とする請求項1に記載のロボット装置。
  4. 前記可動部として複数の可動脚を備え、
    前記状態量検出手段は、前記可動脚の各足底において受ける床反力を状態量として検出し、
    前記推定手段は、各可動脚の足底における床反力に基づいて前記可動部の周期運動における位相又は角周波数を推定する、
    ことを特徴とする請求項1に記載のロボット装置。
  5. 前記可動部として複数の可動脚を備え、
    前記状態量検出手段は、前記可動脚の各足底において進行方向又はその直交方向に受ける床面からの摩擦力を状態量として検出し、
    前記推定手段は、各可動脚の足底で床面から受ける摩擦力に基づいて前記可動部の周期運動における位相又は角周波数を推定する、
    ことを特徴とする請求項1に記載のロボット装置。
  6. 前記ロボット装置は体幹部を備え、
    前記状態量検出手段は、前記体幹部の傾きを状態量として検出し、
    前記推定手段は、前記体幹部の傾きに基づいて前記可動部の周期運動における位相又は角周波数を推定する、
    ことを特徴とする請求項1に記載のロボット装置。
  7. 前記状態量検出手段は、前記ロボット装置又は可動部の加速度を状態量として検出し、
    前記推定手段は、前記加速度に基づいて前記可動部の周期運動における位相又は角周波数を推定する、
    ことを特徴とする請求項1に記載のロボット装置。
  8. 前記推定手段は、所定の事象の発生に応答して、前記関節の周期運動に関する位相をリセットする、
    ことを特徴とする請求項1に記載のロボット装置。
  9. 前記推定手段は、前記状態検出量検出手段で検出された状態量と前記可動部の周期に関する教師信号を学習し、前記の学習された教師信号に基づいて位相又は角周波数を推定する、
    ことを特徴とする請求項1に記載のロボット装置。
  10. 前記推定手段は、前記状態検出量検出手段で検出された状態量に応じて前記可動部の周期運動に関する位相又は角周波数を出力するニューラル・ネットワークで構成される、
    ことを特徴とする請求項1に記載のロボット装置。
  11. 周期運動と捉えられる複数の可動部を含み、
    前記制御手段は、周期運動と捉えられる可動部毎に制御器を配設し、
    装置全体の協調動作を実現するために可動部毎の制御器からの制御量を調停する調停手段をさらに備える、
    ことを特徴とする請求項1に記載のロボット装置。
  12. 周期運動と捉えられる可動部と、周期運動と捉えられない可動部を含み、
    前記の周期運動と捉えられない可動部のための制御則に基づく制御信号を生成する第2の制御手段と、
    装置全体の協調動作を実現するために前記制御手段及び前記第2の制御手段からの制御量を調停する調停手段をさらに備える、
    ことを特徴とする請求項1に記載のロボット装置。
  13. 複数の可動部を有するロボットの姿勢制御方法であって、
    前記の可動部の少なくとも一部の周期運動に関する位相信号を発生する位相信号発生ステップと、
    前記位相信号に基づいて前記可動部の制御信号を生成する制御ステップと、
    前記制御信号に従って前記可動部を駆動する駆動ステップと、
    前記駆動ステップにより駆動される前記可動部の状態量を検出する状態量検出ステップと、
    前記状態量に基づいて前記可動部の周期運動に関する位相又は角周波数を推定する推定ステップと、
    を備え、
    前記位相信号発生ステップでは、前記推定ステップにより推定された位相又は角周波数に基づいて、前記位相信号を更新する、
    ことを特徴とするロボットの姿勢制御方法。
  14. 前記制御ステップは、制御則の異なる複数の制御サブステップを備え、前記位相信号に基づいて適切な制御サブステップを選択し、該選択された制御サブステップからの前記位相信号に基づいて前記可動部の制御信号を生成する、
    ことを特徴とする請求項13に記載のロボットの姿勢制御方法。
  15. 前記可動部は1以上の関節を有し、
    前記状態量検出ステップでは前記関節の関節角又は関節角速度のうち少なくとも1つを状態量として検出し、
    前記推定ステップでは、前記関節角又は関節角速度のうち少なくとも1つに基づいて前記関節の周期運動に関する位相又は各周波数を推定する、
    ことを特徴とする請求項13に記載のロボットの姿勢制御方法。
  16. 前記ロボットは前記可動部として複数の可動脚を備え、
    前記状態量検出ステップでは、前記可動脚の各足底において受ける床反力を状態量として検出し、
    前記推定ステップでは、各可動脚の足底における床反力に基づいて前記可動部の周期運動における位相又は角周波数を推定する、
    ことを特徴とする請求項13に記載のロボットの姿勢制御方法。
  17. 前記ロボットは前記可動部として複数の可動脚を備え、
    前記状態量検出ステップでは、前記可動脚の各足底において進行方向又はその直交方向に受ける床面からの摩擦力を状態量として検出し、
    前記推定ステップでは、各可動脚の足底で床面から受ける摩擦力に基づいて前記可動部の周期運動における位相又は角周波数を推定する、
    ことを特徴とする請求項13に記載のロボットの姿勢制御方法。
  18. 前記ロボット装置は体幹部を備え、
    前記状態量検出ステップでは、前記体幹部の傾きを状態量として検出し、
    前記推定ステップでは、前記体幹部の傾きに基づいて前記可動部の周期運動における位相又は角周波数を推定する、
    ことを特徴とする請求項13に記載のロボットの姿勢制御方法。
  19. 前記状態量検出ステップでは、前記ロボット装置又は可動部の加速度を状態量として検出し、
    前記推定ステップでは、前記加速度に基づいて前記可動部の周期運動における位相又は角周波数を推定する、
    ことを特徴とする請求項13に記載のロボットの姿勢制御方法。
  20. 前記推定ステップでは、所定の事象の発生に応答して、前記関節の周期運動に関する位相をリセットする、
    ことを特徴とする請求項13に記載のロボットの姿勢制御方法。
  21. 前記推定ステップでは、前記状態検出量検出ステップにおいて検出された状態量と前記可動部の周期に関する教師信号を学習し、前記の学習された教師信号に基づいて位相又は角周波数を推定する、
    ことを特徴とする請求項13に記載のロボットの姿勢制御方法。
  22. 前記推定ステップは、前記状態検出量検出ステップにおいて検出された状態量に応じて前記可動部の周期運動に関する位相又は角周波数を出力するニューラル・ネットワークで構成される、
    ことを特徴とする請求項13に記載のロボットの姿勢制御方法。
  23. 周期運動と捉えられる複数の可動部を含み、
    前記制御ステップは、周期運動と捉えられる可動部毎に対応する制御サブステップを有し、
    装置全体の協調動作を実現するために可動部毎の制御サブステップからの制御量を調停する調停ステップをさらに備える、
    ことを特徴とする請求項13に記載のロボットの姿勢制御方法。
  24. 前記ロボットは、周期運動と捉えられる可動部と、周期運動と捉えられない可動部を含み、
    前記の周期運動と捉えられない可動部のための制御則に基づく制御信号を生成する第2の制御ステップと、
    装置全体の協調動作を実現するために前記制御ステップ及び前記第2の制御ステップからの制御量を調停する調停ステップをさらに備える、
    ことを特徴とする請求項13に記載のロボットの姿勢制御方法。
JP2004234022A 2003-08-25 2004-08-11 ロボット装置及びロボットの姿勢制御方法 Expired - Lifetime JP4587738B2 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP2004234022A JP4587738B2 (ja) 2003-08-25 2004-08-11 ロボット装置及びロボットの姿勢制御方法
US10/922,907 US7657345B2 (en) 2003-08-25 2004-08-23 Robot and attitude control method of robot
CNB2004100874223A CN100346941C (zh) 2003-08-25 2004-08-25 机器人及机器人的姿态控制方法
KR1020040067265A KR101100657B1 (ko) 2003-08-25 2004-08-25 로봇 장치 및 로봇의 자세 제어 방법
DE602004032295T DE602004032295D1 (de) 2003-08-25 2004-08-25 Roboter und Verfahren zur Steuerung des Verhaltens desselben
EP04020192A EP1510446B1 (en) 2003-08-25 2004-08-25 Robot and attitude control method of robot

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2003300521 2003-08-25
JP2004234022A JP4587738B2 (ja) 2003-08-25 2004-08-11 ロボット装置及びロボットの姿勢制御方法

Publications (2)

Publication Number Publication Date
JP2005096068A JP2005096068A (ja) 2005-04-14
JP4587738B2 true JP4587738B2 (ja) 2010-11-24

Family

ID=34106947

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004234022A Expired - Lifetime JP4587738B2 (ja) 2003-08-25 2004-08-11 ロボット装置及びロボットの姿勢制御方法

Country Status (6)

Country Link
US (1) US7657345B2 (ja)
EP (1) EP1510446B1 (ja)
JP (1) JP4587738B2 (ja)
KR (1) KR101100657B1 (ja)
CN (1) CN100346941C (ja)
DE (1) DE602004032295D1 (ja)

Families Citing this family (214)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004220566A (ja) * 2002-12-26 2004-08-05 Toshiba Corp 機構シミュレーション方法および機構シミュレーションプログラム
US20060253223A1 (en) * 2003-12-30 2006-11-09 Vanderbilt University Robotic trajectories using behavior superposition
DE602005027049D1 (de) * 2004-01-13 2011-05-05 Honda Motor Co Ltd Gangerzeugungsvorrichtung für beweglichen roboter
JP4858935B2 (ja) * 2004-02-10 2012-01-18 国立大学法人東京工業大学 非線形制御器及び非線形的制御方法
US7896927B2 (en) 2004-02-12 2011-03-01 össur hf. Systems and methods for actuating a prosthetic ankle based on a relaxed position
US8057550B2 (en) 2004-02-12 2011-11-15 össur hf. Transfemoral prosthetic systems and methods for operating the same
US7386428B1 (en) * 2004-12-29 2008-06-10 Livermore Software Technology Corp. Method and system for guided cable contact in finite element analysis
JP4815611B2 (ja) * 2005-06-08 2011-11-16 国立大学法人 名古屋工業大学 受動歩行脚式ロボット
US7627540B2 (en) 2005-06-28 2009-12-01 Neurosciences Research Foundation, Inc. Addressing scheme for neural modeling and brain-based devices using special purpose processor
US7533071B2 (en) 2005-06-28 2009-05-12 Neurosciences Research Foundation, Inc. Neural modeling and brain-based devices using special purpose processor
US7765029B2 (en) * 2005-09-13 2010-07-27 Neurosciences Research Foundation, Inc. Hybrid control device
CN101309783B (zh) * 2005-11-16 2013-09-11 Abb股份有限公司 控制装有定位开关的工业机器人运动的方法、装置、系统及其应用
JP2007175860A (ja) * 2005-11-30 2007-07-12 Japan Science & Technology Agency 位相反応曲線学習方法及び装置、周期的運動制御方法及び装置、並びに歩行運動制御装置
JP4995458B2 (ja) * 2005-12-12 2012-08-08 本田技研工業株式会社 脚式移動ロボット
JP4812426B2 (ja) 2005-12-27 2011-11-09 富士通株式会社 ロボット制御装置
JP4818716B2 (ja) 2005-12-27 2011-11-16 富士通株式会社 ロボット制御装置
JP5034235B2 (ja) * 2006-01-16 2012-09-26 ソニー株式会社 制御システム及び制御方法、並びにコンピュータ・プログラム
JP4836592B2 (ja) * 2006-02-09 2011-12-14 ソニー株式会社 ロボット装置及びその制御方法
US8269778B1 (en) * 2006-06-08 2012-09-18 Pixar Shape preservation of simulated objects in computer animation
US20080004749A1 (en) * 2006-06-30 2008-01-03 Honeywell International, Inc. System and method for generating instructions for a robot
KR100835354B1 (ko) * 2006-07-05 2008-06-04 삼성전자주식회사 보행로봇 및 그의 제어방법
WO2008035827A1 (en) * 2006-09-21 2008-03-27 Jongchul Kim Pedestrian navigation method and apparatus for using geographic information system
US20080082301A1 (en) * 2006-10-03 2008-04-03 Sabrina Haskell Method for designing and fabricating a robot
US7949430B2 (en) * 2006-11-29 2011-05-24 Honda Motor Co., Ltd. Determination of foot placement for humanoid push recovery
WO2008080234A1 (en) 2007-01-05 2008-07-10 Victhom Human Bionics Inc. Joint actuation mechanism for a prosthetic and/or orthotic device having a compliant transmission
US9808357B2 (en) * 2007-01-19 2017-11-07 Victhom Laboratory Inc. Reactive layer control system for prosthetic and orthotic devices
US7703562B2 (en) * 2007-05-25 2010-04-27 Toyota Motor Engineering & Manufacturing North America, Inc. Energy efficient robotic system
WO2009025032A1 (ja) 2007-08-21 2009-02-26 Fujitsu Limited ロボット制御装置およびロボット制御方法
JP4440956B2 (ja) * 2007-09-12 2010-03-24 トヨタ自動車株式会社 脚式ロボット、及びその制御方法
JP4985776B2 (ja) 2007-09-25 2012-07-25 富士通株式会社 ロボット制御装置、ロボット制御方法およびロボット制御プログラム
EP2093025B1 (en) * 2007-10-23 2012-05-16 Honda Motor Co., Ltd. Two-legged walking robot
WO2009067458A1 (en) * 2007-11-21 2009-05-28 Honda Motor Co., Ltd. Learning capture points for humanoid push recovery
JP4552037B2 (ja) * 2007-12-10 2010-09-29 本田技研工業株式会社 ロボット
KR100958114B1 (ko) * 2007-12-17 2010-05-18 한국과학기술연구원 인간형 로봇의 보행 안정화 및 자세 제어 방법
JP5104355B2 (ja) 2008-02-01 2012-12-19 富士通株式会社 ロボット制御装置、ロボット制御方法およびロボット制御プログラム
JP5163227B2 (ja) * 2008-03-28 2013-03-13 トヨタ自動車株式会社 移動ロボットの移動制御方法および移動ロボット
JP4715863B2 (ja) * 2008-05-01 2011-07-06 ソニー株式会社 アクチュエータ制御装置及びアクチュエータ制御方法、アクチュエータ、ロボット装置、並びにコンピュータ・プログラム
KR20100001567A (ko) * 2008-06-27 2010-01-06 삼성전자주식회사 보행 로봇 및 그 제어 방법
JP5181957B2 (ja) 2008-09-16 2013-04-10 富士通株式会社 ロボット制御装置、ロボット制御方法およびロボット制御プログラム
JP5242342B2 (ja) * 2008-10-31 2013-07-24 株式会社東芝 ロボット制御装置
US8369991B2 (en) * 2008-12-19 2013-02-05 Honda Motor Co., Ltd. Humanoid fall direction change among multiple objects
US8352077B2 (en) * 2008-12-19 2013-01-08 Honda Motor Co., Ltd. Inertia shaping for humanoid fall direction change
KR101487782B1 (ko) * 2008-12-22 2015-01-29 삼성전자 주식회사 로봇 및 그 균형 제어방법
KR101493384B1 (ko) * 2008-12-22 2015-02-13 삼성전자 주식회사 로봇 및 그 균형 제어방법
KR101549817B1 (ko) * 2009-01-22 2015-09-04 삼성전자 주식회사 로봇의 보행 제어장치 및 그 방법
US8554370B2 (en) * 2009-05-15 2013-10-08 Honda Motor Co., Ltd Machine learning approach for predicting humanoid robot fall
KR101075026B1 (ko) * 2009-12-02 2011-10-20 한국생산기술연구원 로봇 하드웨어 설계지원 시스템 및 그의 방법
JP5506618B2 (ja) * 2009-12-28 2014-05-28 本田技研工業株式会社 ロボットの制御装置
KR101633362B1 (ko) * 2010-01-18 2016-06-28 삼성전자 주식회사 인간형 로봇 및 그 보행 제어방법
JP5377352B2 (ja) * 2010-02-05 2013-12-25 トヨタ自動車株式会社 車両用動力伝達装置の発進制御装置
EP2586577A4 (en) * 2010-06-22 2013-12-04 Toshiba Kk ROBOT CONTROL DEVICE
KR101200191B1 (ko) 2010-07-14 2012-11-13 서울대학교산학협력단 데이터 기반 바이페드 제어 장치 및 방법
KR101766755B1 (ko) * 2010-08-17 2017-08-10 삼성전자주식회사 보행 로봇 및 그 제어방법
KR20120024098A (ko) * 2010-09-06 2012-03-14 삼성전자주식회사 보행 로봇 및 그 제어방법
KR101760883B1 (ko) * 2010-09-09 2017-08-04 삼성전자주식회사 로봇 및 그 제어방법
JP5854695B2 (ja) * 2010-09-22 2016-02-09 キヤノン株式会社 ロボット装置の制御方法及びロボット装置
KR101732901B1 (ko) * 2010-10-05 2017-05-08 삼성전자주식회사 보행 로봇 및 그 제어방법
JP5743495B2 (ja) * 2010-11-05 2015-07-01 キヤノン株式会社 ロボット制御装置
KR20120069333A (ko) * 2010-12-20 2012-06-28 삼성전자주식회사 로봇의 보행 제어 장치 및 그 제어 방법
KR20120071599A (ko) * 2010-12-23 2012-07-03 삼성전자주식회사 보행 로봇 및 그 제어 방법
EP2672931A1 (en) * 2011-02-10 2013-12-18 Université de Mons Method for determining an artificial periodic patterned signal
CN102152309B (zh) * 2011-03-08 2012-11-21 浙江工业大学 人工肌肉集结群
US8880221B2 (en) * 2011-03-21 2014-11-04 Honda Motor Co., Ltd. Damage reduction control for humanoid robot fall
JP5750657B2 (ja) * 2011-03-30 2015-07-22 株式会社国際電気通信基礎技術研究所 強化学習装置、制御装置、および強化学習方法
US9060884B2 (en) 2011-05-03 2015-06-23 Victhom Human Bionics Inc. Impedance simulating motion controller for orthotic and prosthetic applications
US9566710B2 (en) 2011-06-02 2017-02-14 Brain Corporation Apparatus and methods for operating robotic devices using selective state space training
US10543109B2 (en) 2011-11-11 2020-01-28 Össur Iceland Ehf Prosthetic device and method with compliant linking member and actuating linking member
US9532877B2 (en) 2011-11-11 2017-01-03 Springactive, Inc. Robotic device and method of using a parallel mechanism
KR20130078886A (ko) * 2012-01-02 2013-07-10 현대자동차주식회사 보행로봇의 균형제어방법
JP5930753B2 (ja) * 2012-02-13 2016-06-08 キヤノン株式会社 ロボット装置の制御方法及びロボット装置
JP5930754B2 (ja) * 2012-02-13 2016-06-08 キヤノン株式会社 ロボット装置の制御方法及びロボット装置
KR101985790B1 (ko) * 2012-02-21 2019-06-04 삼성전자주식회사 보행 로봇 및 그 제어 방법
US10646358B2 (en) * 2012-03-14 2020-05-12 Vanderbilt University System and method for providing biomechanically suitable running gait in powered lower limb devices
JP5915285B2 (ja) * 2012-03-15 2016-05-11 セイコーエプソン株式会社 状態検出装置、電子機器、測定システム及びプログラム
US9044346B2 (en) 2012-03-29 2015-06-02 össur hf Powered prosthetic hip joint
JP5959899B2 (ja) * 2012-03-30 2016-08-02 本田技研工業株式会社 接触状態推定装置
JP6332900B2 (ja) * 2012-08-31 2018-05-30 セイコーエプソン株式会社 ロボットシステム及びロボット制御装置
EP2895116B1 (en) 2012-09-17 2020-04-29 Vanderbilt University A method for controlling a powered ankle prostheses
EP3427702B1 (en) 2013-02-26 2024-12-18 Össur HF Prosthetic foot with enhanced stability and elastic energy return
WO2014159114A1 (en) 2013-03-14 2014-10-02 össur hf Prosthetic ankle: a method of controlling based on adaptation to speed
US9764468B2 (en) 2013-03-15 2017-09-19 Brain Corporation Adaptive predictor apparatus and methods
JP2014205197A (ja) 2013-04-10 2014-10-30 セイコーエプソン株式会社 ロボット、ロボット制御装置およびロボットシステム
JP2014205199A (ja) 2013-04-10 2014-10-30 セイコーエプソン株式会社 ロボット、ロボット制御装置およびロボットシステム
JP6155780B2 (ja) 2013-04-10 2017-07-05 セイコーエプソン株式会社 ロボット、ロボット制御装置およびロボットシステム
JP2014205198A (ja) 2013-04-10 2014-10-30 セイコーエプソン株式会社 ロボット、ロボット制御装置およびロボットシステム
US9242372B2 (en) 2013-05-31 2016-01-26 Brain Corporation Adaptive robotic interface apparatus and methods
JP6354122B2 (ja) 2013-06-05 2018-07-11 セイコーエプソン株式会社 ロボット
US9792546B2 (en) 2013-06-14 2017-10-17 Brain Corporation Hierarchical robotic controller apparatus and methods
US9314924B1 (en) * 2013-06-14 2016-04-19 Brain Corporation Predictive robotic controller apparatus and methods
US9579789B2 (en) 2013-09-27 2017-02-28 Brain Corporation Apparatus and methods for training of robotic control arbitration
US9463571B2 (en) 2013-11-01 2016-10-11 Brian Corporation Apparatus and methods for online training of robots
US9597797B2 (en) 2013-11-01 2017-03-21 Brain Corporation Apparatus and methods for haptic training of robots
US9358685B2 (en) 2014-02-03 2016-06-07 Brain Corporation Apparatus and methods for control of robot actions based on corrective user inputs
US9292786B2 (en) * 2014-02-03 2016-03-22 Disney Enterprises, Inc. Universal balancing controller for lateral stabilization of bipedal robots in dynamic unstable environments
CN106456339B (zh) 2014-04-11 2020-02-07 奥索有限责任公司 具有可去除柔性构件的义肢脚
US9346167B2 (en) 2014-04-29 2016-05-24 Brain Corporation Trainable convolutional network apparatus and methods for operating a robotic vehicle
CN103970139B (zh) * 2014-05-09 2017-01-11 上海交通大学 一种机器人连续点位运动规划方法
CN103970019B (zh) * 2014-05-20 2016-08-31 哈尔滨工业大学 一种基于加速度动态配置的空间机器人抖动抑制轨迹规划方法
US9308648B2 (en) * 2014-07-24 2016-04-12 Google Inc. Systems and methods for robotic self-right
US9517561B2 (en) 2014-08-25 2016-12-13 Google Inc. Natural pitch and roll
US9618937B1 (en) 2014-08-25 2017-04-11 Google Inc. Slip detection using robotic limbs
US10081098B1 (en) 2014-08-25 2018-09-25 Boston Dynamics, Inc. Generalized coordinate surrogates for integrated estimation and control
US9387588B1 (en) 2014-08-25 2016-07-12 Google Inc. Handling gait disturbances with asynchronous timing
US9630318B2 (en) 2014-10-02 2017-04-25 Brain Corporation Feature detection apparatus and methods for training of robotic navigation
JP6228097B2 (ja) * 2014-10-06 2017-11-08 本田技研工業株式会社 移動ロボット
US9446518B1 (en) * 2014-11-11 2016-09-20 Google Inc. Leg collision avoidance in a robotic device
US9440353B1 (en) 2014-12-29 2016-09-13 Google Inc. Offline determination of robot behavior
US9499218B1 (en) 2014-12-30 2016-11-22 Google Inc. Mechanically-timed footsteps for a robotic device
US20160202670A1 (en) * 2015-01-08 2016-07-14 Northwestern University System and method for sequential action control for nonlinear systems
KR101696909B1 (ko) 2015-01-20 2017-01-17 한국생산기술연구원 보행 단계 인식 시스템
US9481086B2 (en) * 2015-02-18 2016-11-01 Disney Enterprises, Inc. Control method for floating-base robots including generating feasible motions using time warping
US9717387B1 (en) 2015-02-26 2017-08-01 Brain Corporation Apparatus and methods for programming and training of robotic household appliances
EP4257092A3 (en) 2015-03-04 2024-01-24 Ottobock Prosthetics, LLC Lower limb prosthesis
CN104865826B (zh) * 2015-03-19 2017-09-26 杭州电子科技大学 一种基于合作预测控制的多机器人环境监测方法
US9555846B1 (en) * 2015-03-20 2017-01-31 Google Inc. Pelvis structure for humanoid robot
US9789920B2 (en) * 2015-04-01 2017-10-17 Oregon State University Apparatus and method for energy regulation and leg control for spring-mass walking machine
US9594377B1 (en) 2015-05-12 2017-03-14 Google Inc. Auto-height swing adjustment
US10035264B1 (en) 2015-07-13 2018-07-31 X Development Llc Real time robot implementation of state machine
US10166680B2 (en) * 2015-07-31 2019-01-01 Heinz Hemken Autonomous robot using data captured from a living subject
US9586316B1 (en) 2015-09-15 2017-03-07 Google Inc. Determination of robotic step path
CA2999413C (en) * 2015-09-23 2022-07-19 Universite Catholique De Louvain Rehabilitation system and method
DE102015221337A1 (de) * 2015-10-30 2017-05-04 Keba Ag Verfahren und Steuerungssystem zum Steuern der Bewegungen von Gelenkarmen eines Industrieroboters sowie dabei eingesetztes Bewegungsvorgabemittel
US10949716B2 (en) * 2015-11-25 2021-03-16 Jakob Balslev Methods and systems of real time movement classification using a motion capture suit
CN105511267B (zh) * 2016-01-06 2018-03-30 北京化工大学 一种仿蛇搜救机器人多步态控制方法
US9925667B1 (en) 2016-01-25 2018-03-27 Boston Dynamics, Inc. Continuous slip recovery
US9789919B1 (en) 2016-03-22 2017-10-17 Google Inc. Mitigating sensor noise in legged robots
US10213916B2 (en) * 2016-03-23 2019-02-26 Seiko Epson Corporation Control apparatus and robot system
US9987745B1 (en) 2016-04-01 2018-06-05 Boston Dynamics, Inc. Execution of robotic tasks
JP6660242B2 (ja) * 2016-04-25 2020-03-11 本田技研工業株式会社 ロボットの制御信号を伝送するための光ファイバ配線構造
KR20180021595A (ko) * 2016-08-22 2018-03-05 엘지전자 주식회사 이동 로봇 및 그 제어방법
JP6517762B2 (ja) * 2016-08-23 2019-05-22 ファナック株式会社 人とロボットが協働して作業を行うロボットの動作を学習するロボットシステム
CN106994686B (zh) * 2016-12-01 2018-05-08 遨博(北京)智能科技有限公司 关节外力力矩的计算方法及装置、机器人
CN108237532B (zh) * 2016-12-23 2020-11-27 深圳光启合众科技有限公司 多足机器人的步态控制方法、装置和机器人
CN106737848B (zh) * 2016-12-29 2023-08-04 深圳市优必选科技有限公司 腿部结构及人形机器人
WO2018146770A1 (ja) 2017-02-09 2018-08-16 三菱電機株式会社 位置制御装置及び位置制御方法
JP6484265B2 (ja) * 2017-02-15 2019-03-13 ファナック株式会社 学習制御機能を備えたロボットシステム及び学習制御方法
EP3615281B1 (en) * 2017-04-28 2025-02-12 Southie Autonomy Works, Inc. Automated personalized feedback for interactive learning applications
CN107050868A (zh) * 2017-06-06 2017-08-18 江苏金刚文化科技集团股份有限公司 一种骑乘类体验系统及骑乘机器人
US10807246B2 (en) * 2018-01-08 2020-10-20 Beijing Jingdong Shangke Information Technology Co., Ltd. Mobile robotic device and method of controlling the same manipulator for locomotion and manipulation
US11648672B2 (en) 2018-01-16 2023-05-16 Sony Interactive Entertainment Inc. Information processing device and image generation method
WO2019142227A1 (ja) 2018-01-16 2019-07-25 株式会社ソニー・インタラクティブエンタテインメント 移動体および移動体制御方法
US11780084B2 (en) 2018-01-16 2023-10-10 Sony Interactive Entertainment Inc. Robotic device, control method for robotic device, and program
CN108127667B (zh) * 2018-01-18 2021-01-05 西北工业大学 一种基于关节角增量的机械臂体感交互控制方法
JP7121500B2 (ja) * 2018-02-21 2022-08-18 清水建設株式会社 装置制御システム及び装置制御方法
JP6857145B2 (ja) * 2018-03-09 2021-04-14 株式会社日立製作所 軌道計画装置、軌道計画方法、及び生産システム
JP7246751B2 (ja) * 2018-04-15 2023-03-28 国立大学法人 筑波大学 行動推定装置、行動推定方法、および行動推定プログラム
JP6990636B2 (ja) * 2018-08-30 2022-01-12 株式会社日立製作所 情報処理システム
CN109164821B (zh) * 2018-09-26 2019-05-07 中科物栖(北京)科技有限责任公司 一种无人机姿态训练方法及装置
CN109634100B (zh) * 2018-12-30 2021-11-02 深圳市优必选科技有限公司 仿人机器人行走加速度补偿方法、装置及仿人机器人
CN109645960B (zh) * 2019-01-15 2023-05-23 浙江大学 仿人机器人的生理参数发生装置及其方法
JP7190919B2 (ja) 2019-01-25 2022-12-16 株式会社ソニー・インタラクティブエンタテインメント 画像解析システム
JP7309371B2 (ja) 2019-01-25 2023-07-18 株式会社ソニー・インタラクティブエンタテインメント ロボット制御システム
JP7417356B2 (ja) 2019-01-25 2024-01-18 株式会社ソニー・インタラクティブエンタテインメント ロボット制御システム
US11826919B2 (en) * 2019-01-30 2023-11-28 Fuji Corporation Work coordinate generation device
CN109760761B (zh) * 2019-01-30 2021-01-08 清华大学深圳研究生院 一种基于生物仿生原理和直觉的四足机器人运动控制方法
CN109857131A (zh) * 2019-03-11 2019-06-07 山东职业学院 一种足式机器人两足-四足姿态变换控制方法
US11524401B1 (en) 2019-03-28 2022-12-13 Apple Inc. Learning skills from video demonstrations
CN109991979B (zh) * 2019-03-29 2020-10-30 华中科技大学 一种面向复杂环境的下肢机器人拟人步态规划方法
US10763868B2 (en) * 2019-06-28 2020-09-01 Intel Corporation Decentralized synchronization of multiple agents
CN110315543B (zh) * 2019-07-29 2021-02-26 北京理工大学 一种双足机器人步态生成与优化方法
CN110332164A (zh) * 2019-08-12 2019-10-15 吉林大学 六足液压系统
US20210056391A1 (en) * 2019-08-20 2021-02-25 Mind Machine Learning, Inc. Systems and Methods for Simulating Sense Data and Creating Perceptions
CN110865627A (zh) * 2019-08-29 2020-03-06 北京神舟航天软件技术有限公司 一种智能无人集群系统测试床架构
CN114514092B (zh) * 2019-10-16 2025-05-20 瑞典爱立信有限公司 通过无线网络控制机器人装置
US11745902B1 (en) * 2019-12-11 2023-09-05 Government Of The United States As Represented By The Secretary Of The Air Force Systems, methods and apparatus for multifunctional central pattern generator
CN111267991B (zh) * 2020-01-19 2021-05-11 之江实验室 一种双足机器人下肢结构尺寸的设计方法
FR3106975B1 (fr) * 2020-02-10 2023-10-27 Wandercraft Procédés de génération d’une trajectoire d’un exosquelette et de mise en mouvement de l’exosquelette
CN111291831B (zh) * 2020-03-06 2023-12-08 北京理工大学 一种仿人机器人摔倒预测方法
JP7484382B2 (ja) 2020-04-24 2024-05-16 横河電機株式会社 制御装置、制御方法および制御プログラム
CN111639749A (zh) * 2020-05-25 2020-09-08 上海智殷自动化科技有限公司 一种基于深度学习的工业机器人摩擦力辨识方法
WO2022014485A1 (ja) 2020-07-14 2022-01-20 国立大学法人筑波大学 情報処理装置、方法、及びプログラム
CN112163287A (zh) * 2020-08-17 2021-01-01 盐城工学院 四足步行机器人的建模方法
CN112060082B (zh) * 2020-08-19 2021-10-15 大连理工大学 基于仿生强化学习型小脑模型的在线稳定控制仿人机器人
JP7474440B2 (ja) 2020-08-26 2024-04-25 株式会社アイシン 歩行ロボットの制御装置
JP7547871B2 (ja) 2020-08-31 2024-09-10 オムロン株式会社 学習装置、学習方法、学習プログラム、制御装置、制御方法、及び制御プログラム
CN112445153B (zh) * 2020-10-19 2022-04-29 中国电子产品可靠性与环境试验研究所((工业和信息化部电子第五研究所)(中国赛宝实验室)) 浸水试验装置
CN112232350B (zh) * 2020-10-27 2022-04-19 广东技术师范大学 基于强化学习的水田机器人机械腿长度调整方法与系统
US11263796B1 (en) * 2020-11-11 2022-03-01 Sony Interactive Entertainment Inc. Binocular pose prediction
CN112720479B (zh) * 2020-12-22 2022-03-18 深圳市优必选科技股份有限公司 一种机器人姿态控制方法、装置及机器人
CN112847371B (zh) * 2021-01-11 2023-02-24 常州工程职业技术学院 一种仿人机器人动态跨越连续障碍物的运动规划方法
CN112906205B (zh) * 2021-01-29 2023-01-20 广东工业大学 一种用于全髋关节置换手术的虚拟学习方法
CN112937721B (zh) * 2021-04-18 2022-09-30 北京工业大学 一种七连杆双足机器人的设计以及基于zmp和cpg的混合控制方法
CN113246123B (zh) * 2021-04-30 2022-10-18 深圳市优必选科技股份有限公司 机器人控制方法、装置、计算机可读存储介质及机器人
CN113253748B (zh) * 2021-06-08 2022-02-22 深圳市优必选科技股份有限公司 并联构型仿人机器人的状态估计方法、装置、设备及介质
CN113500599B (zh) * 2021-07-16 2023-05-09 中山大学 一种基于神经网络的绳驱机械臂的轨迹跟踪方法及系统
CN114248266B (zh) * 2021-09-17 2024-03-26 之江实验室 双臂机器人的拟人化动作轨迹生成方法及装置、电子设备
CN114248804B (zh) * 2021-12-08 2023-11-10 深圳市优必选科技股份有限公司 步态规划方法、装置、电子设备及可读存储介质
CN114330122B (zh) * 2021-12-28 2024-05-24 东北电力大学 一种基于机器学习的水轮发电机组大轴轴线调整方法
CN114019988B (zh) * 2022-01-05 2022-04-01 季华实验室 基于cpg的agv控制方法、装置、电子设备及存储介质
CN114740875B (zh) * 2022-03-31 2024-08-02 山东大学 基于神经振荡器的机器人节律运动控制方法及系统
CN114872040B (zh) * 2022-04-20 2024-04-16 中国科学院自动化研究所 基于小脑预测与修正的肌肉骨骼机器人控制方法及装置
CN114633825B (zh) * 2022-05-16 2022-09-16 深圳鹏行智能研究有限公司 移动控制方法、足式机器人和计算机可读存储介质
CN114932961B (zh) * 2022-06-15 2023-10-10 中电海康集团有限公司 一种四足机器人运动控制系统
CN115016325A (zh) * 2022-07-04 2022-09-06 北京化工大学 一种足式机器人步态自学习方法
CN115446829B (zh) * 2022-08-10 2025-08-05 中国地质大学(武汉) 具有频率适应能力的交互控制方法及系统
CN115416017B (zh) * 2022-08-17 2024-09-27 燕山大学 液压四足机器人机电液控感仿真平台搭建方法
CN115495882B (zh) * 2022-08-22 2024-02-27 北京科技大学 一种非平坦地形下的机器人运动基元库构建方法及装置
CN115686012B (zh) * 2022-10-31 2024-04-12 北京小米机器人技术有限公司 机器人抗扰动方法、装置、设备及介质
EP4640379A1 (en) * 2022-12-12 2025-10-29 Apptronik, Inc. Humanoid robot
US12397419B2 (en) * 2023-03-06 2025-08-26 Mitsubishi Electric Research Laboratories, Inc. System and method for controlling a robotic manipulator
CN116619389B (zh) * 2023-07-17 2023-12-08 中山大学 一种小型仿生鼠四足机器人的步态控制方法
KR102884980B1 (ko) * 2023-10-27 2025-11-11 중앙대학교 산학협력단 로봇의 동작 경로 생성 장치 및 방법
CN117148728B (zh) * 2023-10-31 2024-01-26 西北工业大学宁波研究院 一种具有滑扑切换功能的仿生机器人的控制方法
DE102024201092A1 (de) * 2024-02-07 2025-08-07 Dürr Systems Ag Verfahren zum betrieb einer anlage und entsprechende anlage
CN119002325B (zh) * 2024-03-20 2025-06-10 腾讯科技(深圳)有限公司 机器人的控制方法、装置、设备及存储介质
CN118003341B (zh) * 2024-04-09 2024-06-14 首都体育学院 一种基于强化学习智能体的下肢关节力矩计算方法
CN118832561B (zh) * 2024-04-09 2025-05-06 江淮前沿技术协同创新中心 基于分段dmp的下肢外骨骼步态学习规划方法及系统
CN119088013B (zh) * 2024-08-28 2026-01-06 深圳大学 基于nurbs曲线的双足机器人落足点规划方法、计算机可读存储介质、足部装置
CN118769258B (zh) * 2024-09-09 2024-12-27 合肥中科深谷科技发展有限公司 仿人型机器人控制系统、控制方法及存储介质
CN119115940A (zh) * 2024-09-13 2024-12-13 上海期智研究院 人形机器人抬脚移动训练方法、装置、电子设备和介质
CN119536333A (zh) * 2024-11-25 2025-02-28 中国科学技术大学 基于门控循环单元的机器人强化学习控制方法及系统
CN119748437B (zh) * 2024-12-11 2026-01-16 武汉大学 基于动态势能奖励的机器人控制强化学习方法及装置
CN119772881A (zh) * 2024-12-16 2025-04-08 清华大学 基于脉冲神经网络的机械臂类脑控制方法及装置
CN120377751B (zh) * 2025-06-26 2025-09-30 深圳市堃联技术有限公司 一种具有工况自适应能力的伺服电机及其控制方法

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4338672A (en) 1978-04-20 1982-07-06 Unimation, Inc. Off-line teach assist apparatus and on-line control apparatus
JP3167404B2 (ja) 1992-02-26 2001-05-21 本田技研工業株式会社 ロボットの関節駆動制御装置
US5355064A (en) 1992-03-04 1994-10-11 Honda Giken Kogyo Kabushiki Kaisha Control system for legged mobile robot
JP3269852B2 (ja) 1992-05-29 2002-04-02 本田技研工業株式会社 脚式移動ロボットの姿勢安定化制御装置
US6751526B2 (en) * 1997-08-22 2004-06-15 Sony Corporation Method for describing robot structure and part of robot
US6289265B1 (en) 1998-04-20 2001-09-11 Honda Giken Kogyo Kabushiki Kaisha Controller for legged mobile robot
KR20010053481A (ko) * 1999-05-10 2001-06-25 이데이 노부유끼 로봇 장치 및 그 제어 방법
JP2001246579A (ja) * 2000-02-29 2001-09-11 Sony Corp 脚式移動ロボット及びその制御方法
US6633783B1 (en) * 2000-06-06 2003-10-14 Honda Giken Kogyo Kabushiki Kaisha Fuzzy logic based control
CN1392826A (zh) * 2000-10-05 2003-01-22 索尼公司 机器人设备及其控制方法
WO2002040222A1 (en) * 2000-11-17 2002-05-23 Sony Corporation Device and method for controlling motion of legged mobile robot, and motion unit generating method for legged mobile robot
DE60142849D1 (de) 2000-11-20 2010-09-30 Sony Corp Vorrichtung und verfahren zum steuern des betriebs eines roboters mit beinen und robotervorrichtung
GB0104995D0 (en) * 2001-02-28 2001-04-18 Isis Innovation Artificial morpho-functional multiped and motion controller therefor
JP2002301674A (ja) 2001-04-03 2002-10-15 Sony Corp 脚式移動ロボット及びその運動教示方法、並びに記憶媒体
ITTO20010553A1 (it) 2001-06-08 2002-12-08 Comau Spa Sistema di controllo per robot.
GB2423376B (en) * 2002-12-09 2007-03-21 Georgia Tech Res Inst Adaptive output feedback apparatuses and methods capable of controlling a non-mimimum phase system
JP4178186B2 (ja) * 2003-08-21 2008-11-12 国立大学法人 筑波大学 装着式動作補助装置、装着式動作補助装置の制御方法および制御用プログラム

Also Published As

Publication number Publication date
EP1510446A2 (en) 2005-03-02
KR101100657B1 (ko) 2012-01-03
KR20050021288A (ko) 2005-03-07
EP1510446B1 (en) 2011-04-20
US20050113973A1 (en) 2005-05-26
JP2005096068A (ja) 2005-04-14
DE602004032295D1 (de) 2011-06-01
CN1590039A (zh) 2005-03-09
EP1510446A3 (en) 2009-10-28
CN100346941C (zh) 2007-11-07
US7657345B2 (en) 2010-02-02

Similar Documents

Publication Publication Date Title
JP4587738B2 (ja) ロボット装置及びロボットの姿勢制御方法
Nakanishi et al. Learning from demonstration and adaptation of biped locomotion
KR100837988B1 (ko) 각식 이동 로봇을 위한 동작 제어 장치 및 동작 제어방법, 및 로봇 장치
Wu et al. Neurally controlled steering for collision-free behavior of a snake robot
Takemura et al. Slip-adaptive walk of quadruped robot
Li et al. Ai-cpg: Adaptive imitated central pattern generators for bipedal locomotion learned through reinforced reflex neural networks
US9037292B2 (en) Robot and control method of optimizing robot motion performance thereof
JP5052013B2 (ja) ロボット装置及びその制御方法
CN114740875A (zh) 基于神经振荡器的机器人节律运动控制方法及系统
Van der Noot et al. Neuromuscular model achieving speed control and steering with a 3D bipedal walker
Hitomi et al. Reinforcement learning for quasi-passive dynamic walking of an unstable biped robot
Palankar et al. A force threshold-based position controller for legged locomotion: Toward local leg feedback algorithms for robust walking on uneven terrain
Kashyap et al. Dynamic posture stabilization of humanoid robot NAO using 3D-multilinked dual spring-loaded inverted pendulum model for uneven and inclined floor
JP3674779B2 (ja) 脚式移動ロボットのための動作制御装置及び動作制御方法、並びにロボット装置
JP4587699B2 (ja) ロボット装置及びその制御方法
Léziart Locomotion control of a lightweight quadruped robot
Huzaifa et al. Toward a bipedal robot with variable gait styles: sagittal forces analysis in a planar simulation and a prototype ball-tray mechanism
Aractingi Controlling the locomotion of quadruped robots with learning methods
Palankar A distributed local-leg feedback algorithm for robust walking on uneven terrain
Noorani et al. Using the adaptive frequency nonlinear oscillator for earning an energy efficient motion pattern in a leg-like stretchable pendulum by exploiting the resonant mode
JP4481132B2 (ja) ロボット装置及びその制御方法
Bahçeci Trajectory generation for flight phase of a quadruped robot jump
JP2025528958A (ja) 二足歩行外骨格の安定した動きのための方法
van der Walt Q-Bert: Walking for a Bipedal Robot
Masuda et al. Brainless Walking: Animal Gaits Emerge From an

Legal Events

Date Code Title Description
AA64 Notification of invalidation of claim of internal priority (with term)

Free format text: JAPANESE INTERMEDIATE CODE: A241764

Effective date: 20040914

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040915

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070606

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100601

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100726

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100817

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100907

R150 Certificate of patent or registration of utility model

Ref document number: 4587738

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130917

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term