JP2024167393A - Information processing system, information processing method, computer program and vehicle - Google Patents
Information processing system, information processing method, computer program and vehicle Download PDFInfo
- Publication number
- JP2024167393A JP2024167393A JP2024152249A JP2024152249A JP2024167393A JP 2024167393 A JP2024167393 A JP 2024167393A JP 2024152249 A JP2024152249 A JP 2024152249A JP 2024152249 A JP2024152249 A JP 2024152249A JP 2024167393 A JP2024167393 A JP 2024167393A
- Authority
- JP
- Japan
- Prior art keywords
- learning
- robot
- unit
- voice
- program
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J13/00—Controls for manipulators
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N99/00—Subject matter not provided for in other groups of this subclass
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Mechanical Engineering (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Robotics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Manipulator (AREA)
- Toys (AREA)
Abstract
Description
本国際出願は、2014年12月25日に日本国特許庁に出願された日本国特許出願第2014-262907号に基づく優先権を主張するものであり、日本国特許出願第2014-262907号の全内容を本国際出願に参照により援用する。 This international application claims priority based on Japanese Patent Application No. 2014-262907, filed with the Japan Patent Office on December 25, 2014, the entire contents of which are incorporated herein by reference.
本開示はロボットに関する。 This disclosure relates to robots.
近年、人と会話できるロボットが注目されている。このロボットは、人が発音する音声をマイクで取得し、音声認識により音声の意味内容を推定する。そして、推定した意味内容に対し、予め関連付けられた回答を行う(特許文献1参照)。 In recent years, robots that can converse with people have been attracting attention. These robots use a microphone to pick up speech produced by people and infer the meaning of the speech through speech recognition. They then respond to the inferred meaning with a response that has been previously associated with the speech (see Patent Document 1).
ロボットの会話能力を、人工知能等を用いた学習により高めることが考えられる。しかしながら、ある特定のロボットの会話能力を学習により高めたとしても、例えば、異なる場所にある別のロボットを使用する場合、初歩から学習を行わなければならない。本開示は、ロボットの学習に関するユーザの負担を軽減できるロボットを提供することを一側面とする。 It is conceivable that a robot's conversational ability could be improved by learning using artificial intelligence, etc. However, even if the conversational ability of a particular robot is improved through learning, when using another robot in a different location, for example, learning must be carried out from the very basics. One aspect of the present disclosure is to provide a robot that can reduce the burden on users in terms of learning to use a robot.
本開示のロボットは、音声認識を行う音声認識ユニットと、前記音声認識ユニットの認識結果について学習する学習ユニットと、前記音声認識ユニットの認識結果に対し、前記学習ユニットの学習結果を用いて、対応する処理を行う処理ユニットと、前記学習結果を外部の記憶装置に記憶する記憶ユニットと、前記学習結果を前記記憶装置から取得する学習結果取得ユニットと、を備える。 The robot disclosed herein includes a voice recognition unit that performs voice recognition, a learning unit that learns from the recognition results of the voice recognition unit, a processing unit that performs corresponding processing on the recognition results of the voice recognition unit using the learning results of the learning unit, a storage unit that stores the learning results in an external storage device, and a learning result acquisition unit that acquires the learning results from the storage device.
本開示のロボットは、音声認識ユニットの認識結果について学習することができる。また、本開示のロボットは、学習結果を外部の記憶装置に記憶するとともに、その記憶装置から、学習結果を取得することができる。 The robot disclosed herein can learn about the recognition results of the voice recognition unit. The robot disclosed herein can also store the learning results in an external storage device and retrieve the learning results from the storage device.
そのため、ユーザは、例えば、第1のロボットの使用により生じた学習結果を外部の記憶装置に記憶しておき、第2のロボットを使用するとき、記憶しておいた学習結果を第2のロボットに導入することができる。その結果、ユーザは、第1のロボットにおける学習結果を利用することができ、第2のロボットを必ずしも初歩から学習させなくてもよい。 Therefore, for example, a user can store the learning results resulting from use of a first robot in an external storage device, and when using a second robot, can introduce the stored learning results into the second robot. As a result, the user can utilize the learning results of the first robot, and does not necessarily have to train the second robot from the very basics.
1、301…ロボット、3…制御ユニット、5…マイク、7…カメラ、9…タッチパネル、11…センサ群、13…GPS、15…スピーカ、17…モータ群、19…ディスプレイ、21…入力ユニット、23…標準プログラム記憶ユニット、25…人工知能ユニット、26…通信ユニット、27…演算ユニット、29…出力ユニット、31…クラウドネットワーク、33…端末、35…頭部、37…胴部、39…右腕部、41…左腕部、43…右脚部、45…左脚部、47、49…車輪、51…移動用モータ、53…首関節、55…肩関節、57…肘関節、59…手首関節、61…関節用モータ、63…キーボード、65…マウス、67…筐体、69…端子、71…車両制御部、101…コンピュータ、201…車載機 1, 301...robot, 3...control unit, 5...microphone, 7...camera, 9...touch panel, 11...sensor group, 13...GPS, 15...speaker, 17...motor group, 19...display, 21...input unit, 23...standard program storage unit, 25...artificial intelligence unit, 26...communication unit, 27...arithmetic unit, 29...output unit, 31...cloud network, 33...terminal, 35...head, 37...torso, 39...right arm, 41...left arm, 43...right leg, 45...left leg, 47, 49...wheels, 51...movement motor, 53...neck joint, 55...shoulder joint, 57...elbow joint, 59...wrist joint, 61...joint motor, 63...keyboard, 65...mouse, 67...casing, 69...terminal, 71...vehicle control unit, 101...computer, 201...vehicle-mounted device
本開示の実施形態を図面に基づき説明する。
<第1の実施形態>
1.ロボット1の構成
ロボット1の構成を図1、図2に基づき説明する。ロボット1は、図1に示すように、制御ユニット3、マイク5、カメラ7、タッチパネル9、センサ群11、GPS13、スピーカ15、モータ群17、及びディスプレイ19を備える。
An embodiment of the present disclosure will be described with reference to the drawings.
First Embodiment
1. Configuration of
制御ユニット3はマイクロコンピュータを備える。制御ユニットは、具体的には、入力ユニット21、標準プログラム記憶ユニット23、人工知能ユニット25、通信ユニット26、演算ユニット27、及び出力ユニット29を備える。
The
入力ユニット21は、マイク5、カメラ7、タッチパネル9、センサ群11、及びGPS13から情報を取得し、その情報を演算ユニット27及び人工知能ユニット25に出力する。
The input unit 21 acquires information from the
標準プログラム記憶ユニット23は、ロボット1の各種動作を実行するための標準プログラムを常時記憶している。標準プログラムは、後述するAI用プログラムとは異なり、
内容が変化しないプログラムである。
The standard program storage unit 23 constantly stores standard programs for executing various operations of the
It is a program whose contents do not change.
人工知能ユニット25は、ロボット1の各種動作を実行するためのAI(人工知能)用プログラムを記憶可能である。人工知能ユニット25は、AI用プログラムを記憶しているとき、それを学習により変化、発展させる。また、人工知能ユニット25は、AI用プログラムを新規にインストールすること、及びAI用プログラムを消去することが可能である。
The artificial intelligence unit 25 can store AI (artificial intelligence) programs for executing various operations of the
通信ユニット26は、外部のクラウドネットワーク31、端末33等と通信を行う。通信は無線通信であってもよいし、有線通信であってもよい。
演算ユニット27は、標準プログラム又はAI用プログラムを用いて、ロボット1の各種動作を実現するたに必要な演算を実行する。
The
The
出力ユニット29は演算ユニット27の演算結果をスピーカ15、モータ群17、及びディスプレイ19に出力する。なお、制御ユニット3に属する各ユニットの詳しい機能は後述する。
The
図2に示すように、ロボット1は、人型の外形を有しており、頭部35、胴部37、右腕部39、左腕部41、右脚部43、及び左脚部45を備える。
マイク5、カメラ7、及びスピーカ15は頭部35に設けられている。また、ディスプレイ19、及びタッチパネル9は胴部37の正面側に設けられている。
As shown in FIG. 2, the
The
右脚部43、及び左脚部45は、それぞれ、移動用の車輪47、49を備えている。車輪47、49は、それぞれ、前後方向に2つ設けられている。よって、ロボット1は、合計4つの車輪により地面に接する。車輪47、49は、モータ群17に属する移動用モータ51により駆動される。移動用モータ51の駆動力によって車輪47、49を回転させることにより、ロボット1は前後に移動することができる。また、車輪47の回転数と、車輪49の回転数とを異ならせることにより、ロボット1は右旋回又は左旋回をすることができる。
The
ロボット1は、首関節53、肩関節55、肘関節57、及び手首関節59を備える。各関節の自由度は、1~3の中から適宜設定できる。各関節は、モータ群17に属する関節用モータ61の駆動力により、動作する。上記の関節のうち、適宜選択したものを関節用モータ61で動かすことにより、ロボット1は所定の動作を行い、また、所定の姿勢を表現する。
The
センサ群11に属する複数のセンサは、ロボット1における各部の位置、速度、加速度、傾き、関節の角度等を検出する。その検出結果は、入力ユニット21を介して演算ユニット27にフィードバックされ、ロボット1の動作制御に用いられる。
The multiple sensors belonging to the
なお、標準プログラム記憶ユニット23、人工知能ユニット25、及び演算ユニット27は、音声認識ユニット、処理ユニット、及び学習停止ユニットの一例である。人工知能ユニット25は、学習ユニットの一例である。通信ユニット26は、記憶ユニット及び学習結果取得ユニットの一例である。入力ユニット21及び通信ユニット26は識別情報取得ユニットの一例である。クラウドネットワーク31は外部の記憶装置の一例である。
The standard program storage unit 23, the artificial intelligence unit 25, and the
2.ロボット1が実行する処理
(2-1)プログラム設定処理
制御ユニット3は、標準プログラムと、AI用プログラムとのうち、使用するプログラムを決めるために、図3に示すプログラム設定処理を実行する。このプログラム設定処理
は、ロボット1の電源がオンであるとき、所定時間ごとに繰り返し実行される。
2. Processing Executed by Robot 1 (2-1) Program Setting Processing In order to determine which of the standard program and the AI program to use, the
ステップ1では、その時点でAI用プログラムを使用しているか否かを判断する。AI用プログラムを使用していない場合(すなわち、標準プログラムを使用している場合)はステップ2に進み、AI用プログラムを使用している場合はステップ5に進む。
In
ステップ2では、ユーザの識別情報が入力されたか否かを判断する。識別情報は、例えば、以下の方法で入力することができる。
・端末33から通信ユニット26に識別情報を送信する。
In step 2, it is determined whether or not the user's identification information has been input. The identification information can be input, for example, in the following manner.
- The identification information is transmitted from the terminal 33 to the
・識別情報を表す電磁波(例えば、電波、赤外線等)を通信ユニット26に送信する。識別情報を表す電磁波は、端末33から送信してもよいし、固定式の装置(例えば、ビーコン、無線LANのアクセスポイント等)から送信してもよい。識別情報を表す電磁波は、定期的に送信してもよいし、ユーザの指示に応じて送信してもよいし、端末33や固定式の装置等がロボット1を検出することをきっかけとして送信してもよい。
- Electromagnetic waves (e.g., radio waves, infrared rays, etc.) representing the identification information are transmitted to the
・ユーザが識別情報の内容を声に出して言う。マイク5がその音声を取得し、音声認識により、識別情報を特定する。
・識別情報を表す一次元バーコードや二次元バーコードをカメラ7で撮影する。
The user speaks out the content of the identification information. The
A one-dimensional or two-dimensional barcode representing identification information is photographed by the
・タッチパネル9を用いて識別情報を入力する。
識別情報は、数字や文字で構成されるものであってもよいし、1次元又は2次元の画像(例えば一次元バーコードや二次元バーコード)であってもよいし、ユーザの生体情報(例えば、指紋、身体のいずれかの部位における静脈のパターン、虹彩、顔等)であってもよいし、音声で構成されるものであってもよい。
Use the
The identification information may be composed of numbers or letters, a one-dimensional or two-dimensional image (e.g., a one-dimensional or two-dimensional barcode), biometric information of the user (e.g., a fingerprint, a vein pattern in any part of the body, iris, face, etc.), or may be composed of voice.
識別情報が入力された場合はステップ3に進み、識別情報が入力されなかった場合は本処理を終了する。
ステップ3では、前記ステップ2で入力されたと判断された識別情報に対応するAI用プログラム及びデータセットを、クラウドネットワーク31からインストールする。インストールしたAI用プログラム及びデータセットは、人工知能ユニット25に記憶する。
If the identification information has been input, the process proceeds to step 3, and if the identification information has not been input, the process ends.
In
なお、クラウドネットワーク31には、識別情報と、AI用プログラム及びデータセットとが、対応付けられて記憶されている。データセットは、AI用プログラムの使用、学習等において用いるデータセットであり、音声認識及び音声合成において用いる辞書データを含む。 In addition, the cloud network 31 stores identification information in association with AI programs and data sets. The data sets are used for using and learning AI programs, and include dictionary data used in voice recognition and voice synthesis.
ステップ4では、ロボット1が使用するプログラムを、標準プログラムから、前記ステップ3でインストールしたAI用プログラムに変更する。この時点以降、ロボット1はAI用プログラムを使用する。
In step 4, the program used by
一方、前記ステップ1で肯定判断された場合はステップ5において、ロボット1の使用終了条件が充足されたか否かを判断する。使用終了条件は、例えば、以下のものとすることができる。
On the other hand, if the result of
・所定時間以上、ユーザがロボット1を操作しないこと。
・カメラ7の画像やマイク5で取得した音声においてユーザを認識できない状態が所定時間以上続くこと。
The user does not operate the
A state in which the user cannot be recognized in images from the
・ユーザがロボット1に対し、使用終了に該当する入力を行うこと(例えば、ユーザが
「使用終了」と声に出して言う、または、タッチパネル9に使用終了に該当する内容の入力を行う等)。
The user makes an input to the
・ロボット1の電源がオフになる。
・予め設定された時刻になる。
使用終了条件が充足された場合はステップ6に進み、使用終了条件が充足されない場合は本処理を終了する。
・
・The preset time arrives.
If the usage end condition is satisfied, the process proceeds to step 6, and if the usage end condition is not satisfied, the process ends.
ステップ6では、AI用プログラム及びデータセットを、クラウドネットワーク31にアップロードする。このとき、ユーザの識別情報と対応付けてアップロードする。なお、後述する学習が行われた場合、アップロードするAI用プログラム及びデータセットは、学習後のものである。 In step 6, the AI program and dataset are uploaded to the cloud network 31. At this time, they are uploaded in association with the user's identification information. Note that if learning, which will be described later, has been performed, the AI program and dataset uploaded will be those after learning.
ステップ7では、人工知能ユニット25からAI用プログラム及びデータセットを消去する。
ステップ8では、使用するプログラムを、AI用プログラムから標準プログラムに変更する。この時点以降、ロボット1は標準プログラムを使用する。
In
In step 8, the program to be used is changed from the AI program to the standard program. From this point on, the
(2-2)会話処理
制御ユニット3は、図4に示す会話処理を実行する。この処理は、マイク5が所定の閾値以上の音量を検出したときに実行される。
(2-2) Conversation Processing The
ステップ11では、マイク5を用いて音声を取得する。
ステップ12では、周知の音声認識技術により、前記ステップ11で取得した音声の内容を認識する。このとき、標準プログラムを使用している場合は、ロボット1が予め備えている標準辞書データを用いて音声の内容を認識する。また、AI用プログラムを使用している場合は、AI用プログラムとともにクラウドネットワーク31からインストールされ、過去の学習によって強化された辞書データを用いて音声の内容を認識する。
In
In step 12, the contents of the voice acquired in
ステップ13では、前記ステップ12で認識した音声の内容に対し、回答する音声のデータ(以下では回答音声データとする)を作成する。このとき、標準プログラムを使用している場合は、ロボット1が予め備えている標準辞書データを用いて回答音声データを作成する。また、AI用プログラムを使用している場合は、AI用プログラムとともにクラウドネットワーク31からインストールされ、過去の学習によって強化された辞書データを用いて回答音声データを作成する。
In
回答音声データの内容は、例えば、前記ステップ12で認識した音声の内容からキーワードを検出し、そのキーワードに予め対象付けられた事項を辞書データから探し、作成することができる。また、回答音声データの内容は、前記ステップ12で認識した音声の内容に対し、人工知能を用いて推論したものであってもよい。 The content of the response voice data can be created, for example, by detecting keywords from the content of the voice recognized in step 12, and searching dictionary data for items that are previously targeted by the keywords. The content of the response voice data can also be inferred from the content of the voice recognized in step 12 using artificial intelligence.
ステップ14では、前記ステップ13で作成した回答音声データに基づき、スピーカ15を用いて発音する。すなわち、前記ステップ11で取得した音声に対する回答を発音する。
In step 14, the
ステップ15では、その時点でAI用プログラムを使用中であるか否かを判断する。AI用プログラムを使用中である場合はステップ16に進み、標準プログラムを使用中である場合は本処理を終了する。
In
ステップ16では、その時点で学習停止中であるか否かを判断する。なお、学習停止は
、後述する学習停止判断処理により設定される。学習停止中ではない場合はステップ17に進み、学習停止中である場合は本処理を終了する。
In step 16, it is determined whether learning is stopped at that time. Note that whether learning is stopped is set by a learning stop determination process described later. If learning is not stopped, the process proceeds to step 17, and if learning is stopped, the process ends.
ステップ17では、その時点で設定されている学習制限内容を取得する。学習制限内容としては、例えば、ユーザ(前記ステップ2で入力されたと判断された識別情報に対応するユーザ)の家族、知人に関する情報(名前、住所、電話番号、メールアドレス、経歴、顔を含む画像)等である。
In
ステップ18では、前記ステップ12で認識した音声の内容について学習を行う。学習としては、例えば、機械学習が挙げられる。機械学習は、教師付き学習であってもよいし、教師無し学習であってもよい。また、学習は、人工無能による学習であってもよい。この場合、前記ステップ12で認識した音声からキーワードを抽出し、そのキーワードをデータセット(例えば、音声認識に用いる辞書データ)に追加することができる。このキーワードは、例えば、回答音声データを作成する処理(前記ステップ13)において利用できる。 In step 18, learning is performed on the content of the voice recognized in step 12. An example of learning is machine learning. Machine learning may be supervised learning or unsupervised learning. Furthermore, learning may be learning by artificial intelligence. In this case, keywords may be extracted from the voice recognized in step 12, and the keywords may be added to a data set (e.g., dictionary data used for voice recognition). The keywords may be used, for example, in the process of creating answer voice data (step 13).
ただし、前記ステップ12で認識した音声の内容であっても、前記ステップ17で取得した学習制限内容に該当する事項は、学習しないようにする。
ステップ19では、前記ステップ18での学習結果を反映するように、AI用プログラムとデータセットとを更新する。なお、学習結果を反映するように更新されたAI用プログラム及びデータセットは、学習結果の一例である。
However, even if the contents of the voice recognized in step 12 are subject to the learning restriction contents acquired in
In
(2-3)学習停止判断処理
制御ユニット3は、図5に示す学習停止判断処理を所定時間ごとに繰り返し実行する。図5のステップ21では、AI用プログラムを使用中であるか否かを判断する。AI用プログラムを使用中である場合はステップ22に進み、標準プログラムを使用中である場合は本処理を終了する。
(2-3) Learning stop determination process The
ステップ22では、GPS13を用いてロボット1の位置情報を取得する。
ステップ23では、カメラ7を用いて、ロボット1の周囲を撮像した画像を取得する。
ステップ24では、マイク5を用いて、音声を取得する。
In step 22 , the position information of the
In step 23, an image of the surroundings of the
In step 24, the
ステップ25では、その時点で学習停止中であるか否かを判断する。なお、学習停止の状態は、後述するステップ28において開始され、後述するステップ30において学習を再開したときに終了する。学習停止中ではない場合はステップ26に進み、学習停止中である場合はステップ29に進む。 In step 25, it is determined whether learning is currently stopped. The state of learning being stopped begins in step 28, which will be described later, and ends when learning is resumed in step 30, which will be described later. If learning is not currently stopped, proceed to step 26; if learning is currently stopped, proceed to step 29.
ステップ26では、前記ステップ23で取得した画像、又は前記ステップ24で取得した音声に、学習停止のきっかけとなるものがあるか否かを判断する。学習停止のきっかけとしては、例えば、以下のものが挙げられる。
In
・前記ステップ23で取得した画像において、学習停止を指示する動作として予め設定された動作が認識されること。その動作として、例えば、図6Aに示すように、人差し指を立てて口の前に置く動作が挙げられる。また、他の動作として、ウインクが挙げられる。 - A preset action is recognized in the image acquired in step 23 as an action instructing the user to stop learning. One example of such an action is placing the index finger upright in front of the mouth, as shown in FIG. 6A. Another example of such an action is a wink.
・前記ステップ24で取得した音声において、学習停止を指示するキーワードとして予め設定された音声が認識されること。そのキーワードとして、例えば、「秘密」、「オフレコ」、「プライベート」等が挙げられる。また、別のキーワードとして、例えば、ユーザの家族や知人の名前等が挙げられる。ユーザは、家族や知人の名前をキーワードとして
予めロボット1に登録しておくことができる。また、ロボット1が、過去に認識した音声データに基づき、どの言葉がユーザの家族や知人の名前であるかを推論し、ユーザの家族や知人の名前であると推論した言葉をキーワードとして登録してもよい。
In the voice acquired in step 24, a voice that is preset as a keyword instructing the user to stop learning is recognized. Examples of such keywords include "secret,""off the record," and "private." Other examples of such keywords include the names of the user's family members or acquaintances. The user can register the names of family members or acquaintances in the
・前記ステップ23で取得した画像において、予め登録された人の顔が認識されること。この人としては、例えば、ユーザの家族、知人等が挙げられる。なお、ユーザは、学習停止のきっかけとする人の顔画像を予め登録しておくことができる。 - The face of a person registered in advance is recognized in the image acquired in step 23. This person may be, for example, the user's family or acquaintances. The user can register in advance a facial image of a person that will trigger the learning to stop.
学習停止のきっかけがある場合はステップ28に進み、学習停止のきっかけがない場合はステップ27に進む。
ステップ27では、前記ステップ22で取得した位置情報が、学習を停止するべき位置として予め登録された位置に該当するか否かを判断する。学習を停止するべき位置としては、例えば、ユーザの自宅、会議室等が挙げられる。
If there is a trigger to stop learning, the process proceeds to step 28; if there is no trigger to stop learning, the process proceeds to step 27.
In
ユーザは、学習を停止するべき位置を予め登録しておくことができる。また、ロボット1が、過去のデータに基づき、学習を停止するべき場所を推論し、推論した場所を登録することができる。例えば、ロボット1は、学習停止のきっかけが過去に認識された場所を、学習を停止するべき場所として推論することができる。
The user can register in advance the location where learning should be stopped. Also, the
ステップ28では、学習停止の状態を開始する。この時点以降、前記会話処理における前記ステップ16では、肯定判断がなされ、前記ステップ18での学習が行われない。
一方、前記ステップ25で肯定判断された場合はステップ29にて、前記ステップ23で取得した画像、又は前記ステップ24で取得した音声に、学習を再開するきっかけとなるものがあるか否かを判断する。学習再開のきっかけとしては、例えば、以下のものが挙げられる。
A learning stop state is initiated in step 28. From this point onwards, a positive determination is made in step 16 in the conversation process, and learning in step 18 is not performed.
On the other hand, if the answer is YES in step 25, then in
・前記ステップ23で取得した画像において、学習再開を指示する動作として予め設定された動作が認識されること。その動作として、例えば、図6Bに示すように、親指と人差し指とで輪を作る(いわゆるOKを示す)動作が挙げられる。 - A preset action is recognized in the image acquired in step 23 as an action instructing the user to resume learning. For example, as shown in FIG. 6B, one such action is making a circle with the thumb and index finger (indicating "OK").
・前記ステップ24で取得した音声において、学習再開を指示するキーワードとして予め設定された音声が認識されること。そのキーワードとして、例えば、「OK」、「再開」、「学習」等が挙げられる。 - In the voice acquired in step 24, a voice that has been set in advance as a keyword instructing the user to resume learning is recognized. Examples of such keywords include "OK," "resume," and "learn."
学習再開のきっかけがある場合はステップ30に進み、学習再開のきっかけがない場合は本処理を終了する。
ステップ30では、学習を再開する。この時点以降、前記会話処理における前記ステップ16では否定判断がなされ、前記ステップ18の学習が行われる。
If there is a trigger to restart learning, the process proceeds to step 30, and if there is no trigger to restart learning, the process ends.
Learning is resumed in step 30. From this point on, a negative determination is made in step 16 in the conversation process, and learning in step 18 is performed.
(2-4)スケジュール管理処理
ロボット1は、以下に示すスケジュール管理処理を実行することができる。ユーザは予め自らのスケジュール情報を、ロボット1に入力しておく。スケジュール情報の入力は、例えば、タッチパネル9を用いて行ってもよいし、音声入力により行ってもよい。また、端末33からスケジュール情報を通信ユニット26に送信してもよい。
(2-4) Schedule Management Process The
スケジュール情報は、少なくとも、期日と、その期日までに実行すべき事項とを含む。ロボット1は、期日よりも所定時間(例えば、1日、3時間)前の時点で、マイク5により取得した音声、カメラ7により取得した画像、端末33から取得した情報等に基づき、ユーザがスケジュール情報に含まれる事項を実行済みであるか否かを判断し、未だ実行していない場合は、スピーカ15の音声、又はディスプレイ19に表示する画像により、ユ
ーザに警告する。
The schedule information includes at least a due date and items to be performed by that due date. The
3.ロボット1が奏する効果
(1A)ロボット1は、AI用プログラムを、学習により変化、発展させることができる。また、ロボット1は、データセット(例えば辞書データ)の内容を、学習により強化することができる。そして、ロボット1は、学習後のAI用プログラム及びデータセットを、クラウドネットワーク31にアップロードすることができる。また、ロボット1は、クラウドネットワーク31にアップロードされたAI用プログラム及びデータセットを、インストールすることができる。
3. Effects of the Robot 1 (1A) The
学習後のAI用プログラム及びデータセットをインストールするロボット1は、過去に学習を行ったロボット1と同じであっても、異なっていてもよい。また、学習後のAI用プログラム及びデータセットをインストールするロボット1は、過去に学習を行った場所にあるものであってもよいし、異なる場所にあるものであってもよい。
The
よって、ユーザは、過去の自らの使用よって学習したAI用プログラム及びデータセットを、ユーザがその時点でいる場所(例えば、職場、店舗、自宅等様々な場所)のロボット1に、クラウドネットワーク31からインストールし、ロボット1を使用することができる。
Therefore, the user can install the AI program and data set that have been learned from the user's past use from the cloud network 31 onto the
(1B)ロボット1は、ユーザの識別情報が入力されることを条件として、その識別情報に対応するAI用プログラム及びデータセットのインストールを許容する。そのため、あるユーザのAI用プログラム及びデータセットを、他人が勝手に使用してしまうことを抑制できる。
(1B) The
(1C)ロボット1は、人の音声を認識し、それに対する回答の音声を発音することができる。すなわち、ロボット1は人と会話をすることができる。また、ロボット1は、AI用プログラムを使用している場合、音声の認識結果に基づき学習を行い、その学習結果を用いて回答の音声を作成するので、学習が進むほど、より高度な会話を行うことができる。
(1C)
(1D)ロボット1は、その周囲にいる人の動作や、人の識別結果等に応じて、学習を停止する。そのため、ユーザにとって望ましくない事項をロボット1が学習し、後に他人に話してしまうことを抑制できる。
(1D) The
(1E)ロボット1は、それが存在する場所に応じて、学習を停止する。そのため、学習してほしくない場所で学習した事項を、ロボット1が後に他人に話してしまうことを抑制できる。
(1E) The
(1F)ロボット1は、その周囲にいる人の動作等に応じて、学習を再開する。そのため、ロボット1の学習を促進することができる。
(1G)ロボット1は、学習制限内容に該当する事項を学習しない。そのため、ユーザにとって望ましくない事項をロボット1が学習し、後に他人に話してしまうことを抑制できる。
(1F) The
(1G) The
(1H)ロボット1は、ユーザのスケジュール管理を行うことができる。
(1I)ロボット1は、ロボット1の使用終了条件が充足された場合、AI用プログラム及びデータセットを消去する。そのため、ユーザは、自分のAI用プログラム及びデータセットを後で他人が使用することを抑制できる。
<第2の実施形態>
1.コンピュータ101の構成
コンピュータ101の構成を図7、図8に基づき説明する。コンピュータ101の電気的構成は、前記第1の実施形態におけるロボット1と基本的に同じである。ただし、コンピュータ101における入力ユニット21は、外部のマイク5、カメラ7、キーボード63、マウス65、タッチパネル9と接続している。また、出力ユニット29は、外部のスピーカ15、及びディスプレイ19と接続している。
(1H) The
(1I) When the conditions for ending the use of the
Second Embodiment
1. Configuration of the
コンピュータ101は、図8に示すように、箱型の筐体67を備え、その内部に各構成を収容している。また、コンピュータ101は、外部の機器(例えば、マイク5、カメラ7、キーボード63、マウス65、タッチパネル9、スピーカ15、ディスプレイ19等)を接続可能な端子69を複数備えている。なお、コンピュータ101は広義でのロボットである。
As shown in FIG. 8, the
2.コンピュータ101が実行する処理
コンピュータ101は、前記第1の実施形態のロボット1と同様に、プログラム設定処理、会話処理、学習停止判断処理、及びスケジュール管理処理を実行する。また、コンピュータ101は、周知のコンピュータと同様の機能を有する。
2. Processing Executed by the
3.コンピュータ101が奏する効果
コンピュータ101は、前記(1A)~(1I)の効果を奏する。
<第3の実施形態>
1.車載機201の構成
車載機201の構成を図9に基づき説明する。車載機201は車両に搭載される。車載機201の電気的構成は、前記第2の実施形態におけるコンピュータ101と基本的に同じである。ただし、車載機201における入力ユニット21は、車両に設けられたマイク5、カメラ7、タッチパネル9、センサ群11、及びGPS13と接続している。
3. Effects of the
Third Embodiment
1. Configuration of the on-vehicle device 201 The configuration of the on-vehicle device 201 will be described with reference to Fig. 9. The on-vehicle device 201 is mounted on a vehicle. The electrical configuration of the on-vehicle device 201 is basically the same as that of the
マイク5は車両の車室内に設けられ、車両の乗員(ドライバ、又は他の乗員)の声を検出する。カメラ7は乗員を撮影する。タッチパネル9は車両の車室内に設けられ、乗員により操作される。センサ群11は、ドライバの運転操作(操舵角、アクセルの踏み込み量、ブレーキの踏み込み量、シフト位置等)と、車両の状態(速度、加速度、ヨーレート、パワーユニット(内燃機関、モータ等)の状態、燃料の残量、バッテリーの残量等)とを検出する。
The
また、出力ユニット29は、スピーカ15、ディスプレイ19、及び車両制御部71と接続している。スピーカ15及びディスプレイ19は車両の車室内に設けられている。車両制御部71は、車両に関する様々な制御(例えば、操舵、加速、減速、シフトチェンジ等)を行う。なお、車載機201は広義でのロボットである。
The
2.車載機201が実行する処理
(2-1)ロボット1と同様の処理
車載機201は、前記第1の実施形態のロボット1と同様に、プログラム設定処理、会話処理、学習停止判断処理、及びスケジュール管理処理を実行する。
2. Processing Executed by the Vehicle-Mounted Unit 201 (2-1) Processing Similar to That of the
(2-2)車両制御処理
車載機201の制御ユニット3は、図10に示す車両制御処理を所定時間ごとに繰り返し実行する。この処理は、マイク5が所定の閾値以上の音量を検出したときに実行される。
(2-2) Vehicle Control Processing The
ステップ31では、マイク5を用いて音声を取得する。ステップ32では、周知の音声
認識技術により、前記ステップ31で取得した音声から、車両に対する指示(例えば、発進、停止、減速、加速、右左折、レーンチェンジ、シフトチェンジ等)を認識する。このとき、標準プログラムを使用している場合は、車載機201が予め備えている標準辞書データを用いて上記の指示を認識する。また、AI用プログラムを使用している場合は、AI用プログラムとともにクラウドネットワーク31からインストールされ、過去の学習によって強化された辞書データを用いて上記の指示を認識する。
In step 31, voice is acquired using the
ステップ33では、前記ステップ32で認識した、車両対する指示に応じて、車両の制御内容を決定する。例えば、車両に対する指示が発進である場合、ブレーキを解除するタイミング、エンジン回転数の増加量及び増加速度等を決定する。このとき、標準プログラムを使用している場合は、標準プログラムを用いて車両の制御内容を決定する。また、AI用プログラムを使用している場合は、過去の学習によって進化したAI用プログラムを用いて制御内容を決定する。 In step 33, the vehicle control details are determined according to the instruction for the vehicle recognized in step 32. For example, if the instruction for the vehicle is to start, the timing for releasing the brakes, the amount of increase in engine speed and the rate of increase, etc. are determined. At this time, if a standard program is being used, the vehicle control details are determined using the standard program. Also, if an AI program is being used, the control details are determined using an AI program that has evolved through past learning.
ステップ34では、前記ステップ33で決定した制御内容を車両制御部71に出力する。なお、車両制御部71は、その制御内容に従って車両を制御する。
ステップ35では、その時点でAI用プログラムを使用中であるか否かを判断する。AI用プログラムを使用中である場合はステップ36に進み、標準プログラムを使用中である場合は本処理を終了する。
In step 34, the control contents determined in step 33 are output to the vehicle control unit 71. The vehicle control unit 71 controls the vehicle in accordance with the control contents.
In
ステップ36では、センサ群11から、車両の状態に関する検出結果を取得する。
ステップ37では、前記ステップ34で出力した制御内容と、前記ステップ36で取得したセンサ出力とに基づき学習を行う。その学習は、前記ステップ36で取得したセンサ出力が予め設定された最適範囲となるように、制御内容を修正するものである。
In step 36, detection results relating to the state of the vehicle are obtained from the
In
例えば、前記ステップ34で出力した制御内容が発進であった場合、発進の過程におけるセンサ出力(例えば、速度、加速度等のセンサ出力)が最適範囲であったか否かを確認し、最適範囲から外れていたならば、次回以降の発進時におけるセンサ出力が最適範囲に近づくように、発進の制御内容を修正する。 For example, if the control content output in step 34 was starting, it is confirmed whether the sensor output during the starting process (e.g., sensor output of speed, acceleration, etc.) was within the optimal range, and if it was outside the optimal range, the control content for starting is modified so that the sensor output for the next and subsequent starts approaches the optimal range.
ステップ38では、前記ステップ37での学習結果を反映するように、AI用プログラムを更新する。
3.車載機201が奏する効果
車載機201は、前記(1A)~(1I)の効果を奏する。さらに、車載機201は次の効果も奏する。
In step 38, the AI program is updated to reflect the learning results in
3. Effects of the Vehicle-Mounted Device 201 The vehicle-mounted device 201 provides the effects (1A) to (1I) described above. In addition, the vehicle-mounted device 201 also provides the following effects.
(3A)車載機201は、人の音声を認識し、それに対応する車両制御を行うことができる。また、車載機201は、AI用プログラムを使用している場合、車両制御部71に出力した車両制御の内容と、車両の状態を表すセンサ出力とに基づき学習を行うので、学習が進むほど、より高度な車両制御を行うことができる。 (3A) The vehicle-mounted device 201 can recognize human voices and perform corresponding vehicle control. In addition, when the vehicle-mounted device 201 is using an AI program, the vehicle-mounted device 201 learns based on the vehicle control content output to the vehicle control unit 71 and the sensor output indicating the vehicle state, so that the more the learning progresses, the more advanced the vehicle control can be performed.
(3B)車載機201は、車両制御処理に関し、AI用プログラムを、学習により変化、発展させることができる。また、車載機201は、クラウドネットワーク31にアップロードされたAI用プログラムを、インストールすることができる。 (3B) The vehicle-mounted device 201 can change and develop the AI program for vehicle control processing through learning. The vehicle-mounted device 201 can also install the AI program uploaded to the cloud network 31.
学習後のAI用プログラムをインストールする車載機201は、過去に学習を行った車載機201と同じであっても、異なっていてもよい。
よって、ユーザは、過去の自らの使用よって学習したAI用プログラムを、任意の車両の車載機201に、クラウドネットワーク31からインストールし、使用することができる。
<第4の実施形態>
1.ロボット301の構成
本実施形態のロボット301の構成は、基本的には前記第1の実施形態のロボット1と同様である。以下では、第1の実施形態との相違点を中心に説明する。ロボット301は、図11に示すように、第1の人工知能ユニット73と、第2の人工知能ユニット75とを備えている。
The vehicle-mounted device 201 into which the learned AI program is installed may be the same as the vehicle-mounted device 201 that performed learning in the past, or it may be different.
Therefore, a user can install and use an AI program that has been learned through his or her own past use in the onboard device 201 of any vehicle from the cloud network 31.
Fourth Embodiment
1. Configuration of Robot 301 The configuration of the robot 301 of this embodiment is basically the same as that of the
第1の人工知能ユニット73は、ロボット301の各種動作を実行するためのAI用プログラム及びデータセットを記憶している。以下では、このプログラムを第1のAI用プログラムとし、このデータセットを第1のデータセットとする。 The first artificial intelligence unit 73 stores an AI program and a data set for executing various operations of the robot 301. Hereinafter, this program will be referred to as the first AI program, and this data set will be referred to as the first data set.
第1人工知能ユニット73は、第1のAI用プログラム及び第1のデータセットを学習により変化、発展させる。第1の人工知能ユニット73が行う学習は、後述する学習停止、及び学習制限に影響されない。また、第1のAI用プログラム及び第1のデータセットは、クラウドネットワーク31にアップロードされることはない。 The first artificial intelligence unit 73 changes and develops the first AI program and the first data set through learning. The learning performed by the first artificial intelligence unit 73 is not affected by the learning stop and learning restrictions described below. In addition, the first AI program and the first data set are not uploaded to the cloud network 31.
第2の人工知能ユニット75は、AI用プログラム及びデータセットを記憶可能である。以下では、このプログラムを第2のAI用プログラムとし、このデータセットを第2のデータセットとする。 The second artificial intelligence unit 75 is capable of storing an AI program and a dataset. Hereinafter, this program will be referred to as the second AI program, and this dataset will be referred to as the second dataset.
第2のAI用プログラムは、基本的には第1のAI用プログラムと同様であるが、ロボット301の各種動作を実行するためには使用されない。第2人工知能ユニット75は、第2のAI用プログラム及び第2のデータセットを学習により変化、発展させる。第2のAI用プログラム及び第2のデータセットは、学習結果を蓄積し、クラウドネットワーク31にアップロードされる。そのことにより、学習結果をクラウドネットワーク31に記憶することができる。 The second AI program is basically the same as the first AI program, but is not used to execute various operations of the robot 301. The second artificial intelligence unit 75 changes and develops the second AI program and the second data set through learning. The second AI program and the second data set accumulate the learning results and are uploaded to the cloud network 31. This allows the learning results to be stored in the cloud network 31.
ただし、第2の人工知能ユニット75が行う学習は、後述する学習停止、及び学習制限により制限される。そのため、第2のAI用プログラム及び第2のデータセットのアップロードによってクラウドネットワーク31に記憶される学習結果は制限される。 However, the learning performed by the second artificial intelligence unit 75 is limited by the learning stop and learning limit described below. Therefore, the learning results stored in the cloud network 31 by uploading the second AI program and the second data set are limited.
第2のAI用プログラム及び第2のデータセットは、クラウドネットワーク31から第2の人工知能ユニット75にダウンロードすることが可能である。そして、ダウンロードされた第2のAI用プログラム及び第2のデータセットに基づき、第1のAI用プログラム及び第1のデータセットの学習を行うことができる。詳しくは後述する。 The second AI program and the second data set can be downloaded from the cloud network 31 to the second artificial intelligence unit 75. Then, based on the downloaded second AI program and the second data set, learning of the first AI program and the first data set can be performed. Details will be described later.
2.ロボット301が実行する処理
(2-1)プログラムインストール処理
制御ユニット3は、ロボット301の電源がオンになったとき、図12に示すプログラムインストール処理を実行する。
2. Processing Executed by the Robot 301 (2-1) Program Installation Processing When the power supply of the robot 301 is turned on, the
ステップ41では、ユーザの識別情報が入力されたか否かを判断する。識別情報は、前記第1の実施形態と同様のものとすることができる。識別情報が入力された場合はステップ42に進み、識別情報が入力されなかった場合は本処理を終了する。
In
ステップ42では、前記ステップ41で入力されたと判断された識別情報に対応する第2のAI用プログラム及び第2のデータセットを、クラウドネットワーク31からインストールする。インストールした第2のAI用プログラム及び第2のデータセットは、第2の人工知能ユニット75に記憶する。第2の人工知能ユニット75に既に第2のAI用プログラム及び第2のデータセットが記憶されていた場合は上書きする。
In step 42, the second AI program and the second data set corresponding to the identification information determined to have been input in
ステップ43では、前記ステップ42でインストールした第2のAI用プログラム及び第2のデータセットには含まれているが、第1のAI用プログラム及び第1のデータセットには記憶されていない内容を学習する。
In
ステップ44では、第1のAI用プログラム及び第1のデータセットに、前記ステップ43で学習した内容を加え、更新する。すなわち、ダウンロードされた第2のAI用プログラム及び第2のデータセットに基づき、第1のAI用プログラム及び第1のデータセットの学習を行う。
In step 44, the first AI program and the first data set are updated by adding the contents learned in
(2-2)会話処理
制御ユニット3は、図13に示す会話処理を実行する。この処理は、マイク5が所定の閾値以上の音量を検出したときに実行される。会話処理は、第1の人工知能ユニット73に記憶されている第1のAI用プログラム及び第1のデータセットを用いて行われる。
(2-2) Conversation Processing The
ステップ51~54の処理は、前記第1の実施形態におけるステップ11~14の処理と同様である。
ステップ55では、第1の人工知能ユニット73が、前記ステップ52で認識した音声の内容について学習を行う。学習の内容は、前記第1の実施形態と同様である。
The processing in
In
ステップ56では、前記ステップ55での学習結果を反映するように、第1のAI用プログラム及び第1のデータセットを更新する。
ステップ57では、第2の人工知能ユニット75がその時点で学習停止中であるか否かを判断する。なお、第2の人工知能ユニット75の学習停止は、後述する、第2の人工知能ユニット学習停止判断処理により設定される。第2の人工知能ユニット75が学習停止中ではない場合はステップ58に進み、学習停止中である場合は本処理を終了する。
In step 56, the first AI program and the first data set are updated to reflect the learning results in
In
ステップ58では、その時点で設定されている学習制限内容を取得する。学習制限内容としては、例えば、ユーザ(前記ステップ41で入力されたと判断された識別情報に対応するユーザ)の家族、知人に関する情報(名前、住所、電話番号、メールアドレス、経歴、顔を含む画像)等である。 In step 58, the learning restriction contents set at that time are obtained. The learning restriction contents include, for example, information about the family and acquaintances of the user (the user corresponding to the identification information determined to have been entered in step 41) (names, addresses, telephone numbers, email addresses, career history, images including faces), etc.
ステップ59では、第2の人工知能ユニット75が、前記ステップ52で認識した音声の内容について学習を行う。学習の内容は、前記第1の実施形態と同様である。ただし、前記ステップ52で認識した音声の内容であっても、前記ステップ58で取得した学習制限内容に該当する事項は、学習しないようにする。
In
ステップ60では、前記ステップ59での学習結果を反映するように、第2のAI用プログラム及び第2のデータセットを更新する。
(2-3)第2の人工知能ユニット学習停止判断処理
制御ユニット3は、図14に示す第2の人工知能ユニット学習停止判断処理を所定時間ごとに繰り返し実行する。
In step 60, the second AI program and the second data set are updated to reflect the learning results in
(2-3) Processing for Determining Whether to Stop Learning of the Second Artificial Intelligence Unit The
ステップ71では、GPS13を用いてロボット301の位置情報を取得する。
ステップ72では、カメラ7を用いて、ロボット301の周囲を撮像した画像を取得する。
In step 71 , the position information of the robot 301 is acquired using the
In step 72, the
ステップ73では、マイク5を用いて、音声を取得する。
ステップ74では、第2の人工知能ユニット75がその時点で学習停止中であるか否かを判断する。なお、学習停止の状態は、後述するステップ77において開始され、後述す
るステップ79において学習を再開したときに終了する。学習停止中ではない場合はステップ75に進み、学習停止中である場合はステップ78に進む。
In step 73, the
In step 74, it is determined whether or not the second artificial intelligence unit 75 is currently halted from learning. The halted learning state is started in step 77, which will be described later, and ends when learning is resumed in
ステップ75では、前記ステップ72で取得した画像、又は前記ステップ73で取得した音声に、学習停止のきっかけとなるものがあるか否かを判断する。学習停止のきっかけは、前記第1の実施形態と同様である。学習停止のきっかけがある場合はステップ77に進み、学習停止のきっかけがない場合はステップ76に進む。 In step 75, it is determined whether or not there is a trigger for stopping learning in the image acquired in step 72 or the audio acquired in step 73. The trigger for stopping learning is the same as in the first embodiment. If there is a trigger for stopping learning, proceed to step 77, and if there is no trigger for stopping learning, proceed to step 76.
ステップ76では、前記ステップ71で取得した位置情報が、学習を停止するべき位置として予め登録された位置に該当するか否かを判断する。学習を停止するべき位置は、前記第1の実施形態と同様である。 In step 76, it is determined whether the location information acquired in step 71 corresponds to a location that has been registered in advance as a location where learning should be stopped. The location where learning should be stopped is the same as in the first embodiment.
ステップ77では、第2の人工知能ユニット75について学習停止の状態を開始する。この時点以降、前記会話処理における前記ステップ57では、肯定判断がなされ、前記ステップ59での学習が行われない。
In step 77, the second artificial intelligence unit 75 enters a learning stop state. From this point onwards, a positive judgment is made in
一方、前記ステップ74で肯定判断された場合はステップ78にて、前記ステップ72で取得した画像、又は前記ステップ73で取得した音声に、学習を再開するきっかけとなるものがあるか否かを判断する。学習再開のきっかけは、前記第1の実施形態と同様である。学習再開のきっかけがある場合はステップ79に進み、学習再開のきっかけがない場合は本処理を終了する。 On the other hand, if the determination in step 74 is affirmative, then in step 78, it is determined whether or not there is a trigger for restarting learning in the image acquired in step 72 or the audio acquired in step 73. The trigger for restarting learning is the same as in the first embodiment. If there is a trigger for restarting learning, the process proceeds to step 79, and if there is no trigger for restarting learning, the process ends.
ステップ79では、第2の人工知能ユニット75における学習を再開する。この時点以降、前記会話処理における前記ステップ57では否定判断がなされ、前記ステップ59の学習が行われる。
In
(2-4)プログラムアップロード処理
制御ユニット3は、図15に示すプログラムアップロード処理を所定時間ごとに繰り返し実行する。
(2-4) Program Upload Processing The
ステップ81では、ロボット301の使用終了条件が充足されたか否かを判断する。使用終了条件は、前記第1の実施形態の前記ステップ5で判断するものと同様である。使用終了条件が充足された場合はステップ82に進み、使用終了条件が充足されない場合は本処理を終了する。
In
ステップ82では、第2のAI用プログラム及び第2のデータセットを、クラウドネットワーク31にアップロードする。このとき、ユーザの識別情報と対応付けてアップロードする。なお、前述した学習が行われた場合、アップロードする第2のAI用プログラム及び第2のデータセットは、学習後のものである。 In step 82, the second AI program and the second data set are uploaded to the cloud network 31. At this time, they are uploaded in association with the user's identification information. Note that if the above-mentioned learning has been performed, the second AI program and the second data set to be uploaded are those after learning.
3.ロボット301が奏する効果
ロボット301は、前記(1B)、(1C)、(1F)、(1H)の効果を奏する。さらに、ロボット301は、次の効果も奏する。
3. Effects of the Robot 301 The robot 301 has the effects (1B), (1C), (1F), and (1H) described above. In addition, the robot 301 also has the following effects.
(4A)ロボット301は、第1のAI用プログラム及び第1のデータセットを、学習により変化、発展させることができる。さらに、第1のAI用プログラム及び第1のデータセットにおける学習は、学習停止の処理、及び学習制限の処理に影響されない。 (4A) The robot 301 can change and develop the first AI program and the first data set through learning. Furthermore, the learning in the first AI program and the first data set is not affected by the learning stop process and the learning limit process.
また、第1のAI用プログラム及び第1のデータセットはクラウドネットワーク31にアップロードされないので、その内容が他人に知られることを抑制できる。
(4B)ロボット301は、学習後の第2のAI用プログラム及び第2のデータセットを、クラウドネットワーク31にアップロードすることができる。また、ロボット301は、第2のAI用プログラム及び第2のデータセットをクラウドネットワーク31からインストールすることができる。
Furthermore, since the first AI program and the first data set are not uploaded to the cloud network 31, their contents can be prevented from being known to others.
(4B) The robot 301 can upload the second AI program and the second data set after learning to the cloud network 31. The robot 301 can also install the second AI program and the second data set from the cloud network 31.
学習後の第2のAI用プログラム及び第2のデータセットをインストールするロボット301は、過去に学習を行ったロボット301と同じであっても、異なっていてもよい。また、学習後の第2のAI用プログラム及び第2のデータセットをインストールするロボット301は、過去に学習を行った場所にあるものであってもよいし、異なる場所にあるものであってもよい。 The robot 301 on which the second AI program and the second data set are installed after learning may be the same as the robot 301 that has previously learned, or it may be different. Furthermore, the robot 301 on which the second AI program and the second data set are installed after learning may be located in the same place where learning was previously performed, or it may be located in a different place.
よって、ユーザは、過去の自らの使用よって学習した第2のAI用プログラム及び第2のデータセットを、ユーザがその時点でいる場所(例えば、職場、店舗、自宅等様々な場所)のロボット301に、クラウドネットワーク31からインストールすることができる。そして、第2のAI用プログラム及び第2データセットを用いて学習を行い、第1のAI用プログラム及び第1のデータセットを変化、発展させることができる。 Therefore, the user can install the second AI program and the second data set, which have been learned through the user's own past use, from the cloud network 31 to the robot 301 in the location where the user is at the time (e.g., various locations such as the workplace, store, home, etc.). The second AI program and the second data set can then be used to learn, and the first AI program and the first data set can be changed and developed.
(4C)ロボット301は、クラウドネットワーク31にアップロードされる第2のAI用プログラム及び第2のデータセットついて、学習を制限する。すなわち、ロボット301は、その周囲にいる人の動作や、人の識別結果等に応じて、第2のAI用プログラム及び第2のデータセットについての学習を停止する。また、ロボット301は、それが存在する場所に応じて、第2のAI用プログラム及び第2のデータセットにおける学習を停止する。また、ロボット301は、学習制限内容に該当する事項を、第2のAI用プログラム及び第2のデータセットに含ませない。 (4C) The robot 301 restricts learning of the second AI program and the second data set uploaded to the cloud network 31. That is, the robot 301 stops learning of the second AI program and the second data set depending on the actions of people around it, the results of identifying people, etc. The robot 301 also stops learning of the second AI program and the second data set depending on the location where it is located. The robot 301 also does not include any items that fall under the learning restriction content in the second AI program and the second data set.
そのため、ユーザが他人に知られたくない事項を含む第2のAI用プログラム及び第2のデータセットが、クラウドネットワーク31にアップロードされることを抑制できる。<第5の実施形態>
1.ロボット401の構成
本実施形態のロボット401の構成は、基本的には前記第1の実施形態のロボット1と同様である。以下では、第1の実施形態との相違点を中心に説明する。ロボット401は、図16に示すように、通信ユニット26を用いてインターネット77と接続することができる。インターネット77はネットワークの一例である。また、ロボット401は車両内に置くことができる。この場合、ロボット401は、後述する会話等処理により、車両の乗員と会話することができる。
Therefore, it is possible to prevent the second AI program and the second data set, which include information that the user does not want others to know, from being uploaded to the cloud network 31. <Fifth embodiment>
1. Configuration of the Robot 401 The configuration of the robot 401 of this embodiment is basically the same as that of the
2.ロボット401が実行する処理
(2-1)ロボット1と同様の処理
ロボット401は、前記第1の実施形態のロボット1と同様に、プログラム設定処理、学習停止判断処理、及びスケジュール管理処理を実行する。
2. Processing Executed by Robot 401 (2-1) Processing Similar to
(2-2)会話等処理
ロボット401の制御ユニット3は、図17に示す会話等処理を所定時間ごとに繰り返し実行する。この処理は、マイク5が所定の閾値以上の音量を検出したときに実行される。
(2-2) Conversation, etc. Processing The
ステップ91、92の処理は、それぞれ、前記第1の実施形態におけるステップ11、12の処理と同様である。
ステップ93では、前記ステップ92で認識した音声の内容に関連する情報を、通信ユニット26を用い、インターネット77において検索し、取得する。例えば、前記ステッ
プ92で認識した音声の内容からキーワードを抽出し、そのキーワードに予め関連付けられた事項を含む情報を検索する。検索の対象としては、例えば、SNS(ソーシャルネットワーキングサービス)、ブログ、電子掲示板等が挙げられる。また、前記ステップ92で認識した音声の内容が質問である場合、その質問に対する回答を検索する。検索の方法としては、例えば、公知の検索エンジンを用いることができる。
The processes in steps 91 and 92 are similar to the processes in
In step 93, information related to the content of the voice recognized in step 92 is searched and acquired from the Internet 77 using the
ステップ94では、前記ステップ92で認識した音声の内容に対し、基本的には前記第1の実施形態におけるステップ13と同様に、回答音声データを作成する。ただし、本ステップでは、前記ステップ93で取得した情報も用いて、回答音声データを作成する。前記ステップ93で取得した情報を用いるとは、例えば、その情報を音声化したものを、回答音声データに含めることである。
In step 94, response voice data is created for the content of the voice recognized in step 92, essentially in the same manner as in
ステップ95では、後述するステップ96で発音するときの音声の種類を、前記ステップ94で作成した回答の内容に応じて決定する。音声の種類としては、例えば、男性の声、女性の声、大人の声、子供の声等が挙げられる。 In step 95, the type of voice to be pronounced in step 96 (described later) is determined based on the content of the answer created in step 94. Examples of the type of voice include a male voice, a female voice, an adult voice, a child's voice, etc.
音声の種類は、具体的には、以下のようにして決定する。まず、制御ユニット3は、前記ステップ94で作成した回答の内容から、特徴(例えば、男性に特有の特徴、女性に特有の特徴、大人に特有の特徴、子供に特有の特徴等)を抽出する。
Specifically, the type of voice is determined as follows: First, the
制御ユニット3は、回答の内容における特徴と、音声の種類とを対応付けたマップを予め備えている。制御ユニット3は、上記のように抽出した特徴をそのマップに入力することで、抽出した特徴に対応した音声の種類を決定する。
The
例えば、前記ステップ94で作成した回答の内容から、男性に特有の特徴と大人に特有の特徴とが抽出されれば、制御ユニット3は、大人の男性の音声を決定する。
ステップ96では、前記ステップ94で作成した回答音声データに基づき、スピーカ15を用いて発音する。このとき、前記ステップ95で設定した種類の音声を用いて発音する。
For example, if features specific to men and features specific to adults are extracted from the content of the answer created in step 94, the
In step 96, a voice is generated from the
ステップ97では、まず、前記ステップ92で認識した音声の内容、又は、前記ステップ94で作成した回答の内容に対応する感情(例えば、喜び、怒り、悲しみ、平静等)を取得する。この感情の取得は以下のように行う。 In step 97, first, the emotion (e.g., joy, anger, sadness, calm, etc.) corresponding to the content of the voice recognized in step 92 or the content of the answer created in step 94 is obtained. This emotion is obtained as follows.
制御ユニット3は、音声の内容や回答の内容に現れる特徴と、感情とを対応付けたマップを予め備えている。音声の内容に現れる特徴としては、例えば、音量、音声の抑揚、音程の高低等が挙げられる。また、回答の内容に現れる特徴としては、例えば、回答の内容に含まれる、感情を反映した語句、感情を反映した言い回し等が挙げられる。
The
制御ユニット3は、前記ステップ92で認識した音声の内容、又は、前記ステップ94で作成した回答から抽出した特徴を前記マップに入力することにより、対応する感情を取得する。
The
次に、制御ユニット3は、取得した感情を表現する人又はキャラクタの顔画像を作成し、ディスプレイ19に表示する。例えば、取得した感情が喜びである場合、笑顔の人又はキャラクタの顔画像をディスプレイ19に表示する。また、取得した感情が悲しみである場合、泣き顔の人又はキャラクタの顔画像をディスプレイ19に表示する。
Next, the
ステップ98~102の処理は、それぞれ、前記第1の実施形態におけるステップ15~19の処理と同様である。
3.ロボット401が奏する効果
ロボット401は、前記(1A)~(1I)の効果を奏する。さらに、ロボット401は次の効果も奏する。
The processes in steps 98 to 102 are similar to the processes in
3. Effects of the Robot 401 The robot 401 has the effects (1A) to (1I) described above. In addition, the robot 401 also has the following effects.
(5A)ロボット401は、音声の内容に関連する情報を、インターネット77において検索し、取得することができる。そして、ロボット401は、そのように取得した情報も用いて、回答音声データを作成する。そのことにより、より適切な回答音声データを作成することができる。 (5A) The robot 401 can search and acquire information related to the content of the voice on the Internet 77. The robot 401 then uses the information acquired in this way to create response voice data. This allows the robot 401 to create more appropriate response voice data.
(5B)ロボット401は、回答の内容に応じて音声の種類を決定することができる。そのため、ユーザは、回答の内容と、それを発音する音声の種類との不調和を感じにくい。 (5B) The robot 401 can determine the type of voice depending on the content of the answer. Therefore, the user is less likely to feel a discord between the content of the answer and the type of voice that pronounces it.
(5C)ロボット401は、認識した音声の内容、又は、回答の内容に対応する感情を取得し、取得した感情を表現する人又はキャラクタの顔画像をディスプレイ19に表示する。そのことにより、ユーザは、ロボット401をあたかも人間のように感じることができる。
<第6の実施形態>
1.ロボット501の構成
本実施形態のロボット501の構成は、基本的には前記第1の実施形態のロボット1と同様である。
(5C) The robot 401 acquires an emotion corresponding to the content of the recognized voice or the content of the reply, and displays a facial image of a person or character expressing the acquired emotion on the
Sixth Embodiment
1. Configuration of Robot 501 The configuration of the robot 501 of this embodiment is basically the same as that of the
2.ロボット501が実行する処理
(2-1)ロボット1と同様の処理
ロボット501は、前記第1の実施形態のロボット1と同様に、プログラム設定処理、会話処理、学習停止判断処理、及びスケジュール管理処理を実行する。
2. Processing Executed by Robot 501 (2-1) Processing Similar to
(2-2)通話処理
図18に示すように、複数のロボット501は、ユーザ79とユーザ81との間の通話を可能にする。例えば、ユーザ79側のロボット501(以下ではロボット501Aとする)は、ユーザ79が発音した音声をマイク5で取得する。また、ロボット501Aは、ユーザ79による、通話相手のロボット501(以下ではロボット501Bとする)を指定する入力を、タッチパネル9を用いて受け付ける。
18, a plurality of robots 501 enable a call between a
ロボット501Aは、ユーザ79が発音した音声を変換した信号(以下では音声変換信号とする)と、ロボット501Aの識別信号と、ユーザ79により指定された通話相手のロボット501Bの識別信号とを、通信ユニット26を用いてホストコンピュータ83に送信する。
The robot 501A transmits to the
ホストコンピュータ83は、受信したロボット501Aの識別信号と、通話相手のロボット501Bの識別信号とが、通話ペアとして設定されているか否かを判断する。通話ペアとして設定されていれば、音声変換信号を、通話相手のロボット501Bに転送する。なお、通話ペアの設定については後述する。
The
ロボット501Bは、通信ユニット26を用いて、転送された音声変換信号を受信し、その音声変換信号に基づき、スピーカ15を用いて発音する。以上の処理により、ユーザ79が発音した音声が、ロボット501B側のユーザ81に伝えられる。また、ロボット501Bは、音声を発音することに加えて、その音声を文字に変換し、その文字をディスプレイ19に表示する。
The robot 501B receives the transferred voice conversion signal using the
また、ロボット501Bが上述したロボット501Aの処理を行い、ロボット501Aが上述したロボット501Bの処理を行うことで、ユーザ81が発音した音声を、ユーザ79に伝えることもできる。
In addition, by having robot 501B perform the processing of robot 501A described above, and robot 501A perform the processing of robot 501B described above, it is possible to transmit the voice spoken by
一方、ホストコンピュータ83は、受信したロボット501Aの識別信号と、通話相手のロボット501Bの識別信号とが、通話ペアとして設定されてなければ、上記の音声変換信号の転送を行わない。
On the other hand, if the identification signal of the received robot 501A and the identification signal of the other party's robot 501B are not set as a call pair, the
(2-3)通話ペア設定処理
次に、ホストコンピュータ83が上記の通話ペアを設定する処理を、図19に基づき説明する。
(2-3) Call Pair Setting Process Next, the process in which the
ステップ111では、通話ペアの設定要求を新たに受信したか否かを判断する。通話ペアの設定要求とは、ロボット501Aがホストコンピュータ83に送信する要求である。通話ペアの設定要求には、要求の送信元であるロボット501Aの識別信号と、そのロボット501A側のユーザ79の特徴(例えば、趣味、衣食住の好み、関心を持つ事項等)と、ユーザ79の顔写真の画像データとが含まれる。
In step 111, it is determined whether a new call pair setting request has been received. A call pair setting request is a request that robot 501A sends to host
通話ペアの設定要求は、ユーザの指示に応じてロボット501Aが送信してもよいし、ロボット501Aが自動的に送信してもよい。通話ペアの設定要求をホストコンピュータ83が新たに受信した場合はステップ112に進み、受信しなかった場合は本処理を終了する。
The call pair setting request may be sent by the robot 501A in response to a user instruction, or may be sent automatically by the robot 501A. If the
ステップ112では、前記ステップ111で受信したと判断した通話ペアの設定要求(以下では、新たな設定要求とする)に含まれるユーザ79の特徴を、設定待ちリストにおいて検索する。ここで、設定待ちリストとは、過去にいずれかのロボット501から受信した、通話ペアの設定要求(以下では、過去の設定要求とする)のリストである。
In step 112, the characteristics of
ステップ113では、前記ステップ112での検索の結果、新たな設定要求に含まれるユーザ79の特徴と一致する特徴を有する、過去の設定要求が発見されたか否かを判断する。そのような過去の設定要求が発見された場合はステップ114に進み、発見されなかった場合はステップ116に進む。
In step 113, it is determined whether or not a past setting request is found that has characteristics matching those of
ステップ114では、前記ステップ113で発見された、過去の設定要求の送信元であるロボット501Bと、新たな設定要求の送信元であるロボット501Aとを、通話ペアとして設定する。 In step 114, robot 501B, which was found in step 113 and was the sender of the previous setting request, and robot 501A, which is the sender of the new setting request, are set as a call pair.
ステップ115では、通話ペアとして設定されたロボット501A、501Bのそれぞれに、相手のロボット501に関する情報を通知する。すなわち、ロボット501Aにはロボット501Bに関する情報を通知し、ロボット501Bにはロボット501Aに関する情報を通知する。通知する情報には、相手のロボット501の識別信号、対応するユーザの顔写真の画像データ等が含まれる。 In step 115, each of robots 501A and 501B set as a call pair is notified of information about the other robot 501. That is, robot 501A is notified of information about robot 501B, and robot 501B is notified of information about robot 501A. The notified information includes an identification signal of the other robot 501, image data of a face photo of the corresponding user, etc.
一方、前記ステップ113で否定判断された場合はステップ116にて、新たな設定要求を設定待ちリストに追加する。これ以降、新たな設定要求は、過去の設定要求のリストにおける一部となる。 On the other hand, if the determination in step 113 is negative, the new configuration request is added to the configuration waiting list in step 116. From this point on, the new configuration request becomes part of the list of past configuration requests.
なお、相手側のロボット501に関する情報を通知されたロボット501は、その情報を用いて、通話ペアの相手を表すアイコン85を作成し、図20に示すように、ディスプレイ19に表示する。アイコン85は、通話ペアの相手側のユーザの顔写真を含む。ロボ
ット501は、複数のアイコン85をディスプレイ19に表示することができる。
The robot 501, which has been notified of the information about the other robot 501, uses the information to create an
ロボット501は、特定のアイコン85がユーザによってタッチされたとき、そのアイコン85に対応するユーザを通話相手として認識する。そして、ロボット501は、音声変換信号を上記のようにホストコンピュータ83に送信するとき、タッチしたアイコン85に対応するロボット501の識別信号を、ホストコンピュータ83に送信する。
When a
(2-4)その他の処理
ホストコンピュータ83は、前記(2-2)の通話処理のとき、ロボット501Aが送信した音声変換信号の内容を分析する。その分析結果が予め設定された禁止事項(例えば犯罪に関する事項等)に該当する場合、通話処理を開始しないようにしたり、通話処理を途中で終了したりする。そのため、ホストコンピュータ83は、通話処理が犯罪等に利用されることを抑制できる。
(2-4) Other Processing The
また、前記(2-2)の通話処理のとき、ロボット501Bは、他のコンピュータ501Aから送信された音声も用いて学習を行う。そのため、学習を一層効率的に行うことができる。 In addition, during the call processing in (2-2) above, the robot 501B also uses the voice transmitted from the other computer 501A to learn. This allows learning to be carried out even more efficiently.
また、前記(2-2)の通話処理において、ユーザ79の発音が所定時間以上途絶えたとき、又は、ユーザ79が指示したとき、ロボット501Aは、自らが作成した音声変換信号をホストコンピュータ83に送信する。この場合、ロボット501Aと、ユーザ81とが通話することになる。コンピュータ501Aは、過去の通話処理により得られた学習結果を用いて音声変換信号を作成することができる。また、ロボット501Aは、過去の通話においてロボット501A又はロボット501Bが発音した音声(例えば、相槌等)を記憶しておき、その音声に対応する音声変換信号を作成してもよい。
In addition, in the call processing of (2-2) above, when the
3.ロボット501が奏する効果
ロボット501は、前記(1A)~(1I)の効果を奏する。さらに、ロボット501は次の効果も奏する。
3. Effects of the Robot 501 The robot 501 has the effects (1A) to (1I) described above. In addition, the robot 501 also has the following effects.
(6A)ロボット501A側のユーザ79と、ロボット501B側のユーザ81とは、通話を行うことができる。
(6B)ユーザ79とユーザ81との通話は、ロボット501Aとロボット501Bとが通話ペアとして設定されていることが前提になる。通話ペアは、ユーザ79とユーザ81との特徴が一致する場合に設定される。よって、ロボット501は、特徴が一致するユーザ同士の通話を選択的に可能にする。
(6A) A
(6B) A call between
(6C)ロボット501は通話相手のユーザの顔写真を含むアイコン85を作成し、ディスプレイ19に表示する。ユーザは、アイコン85をタッチすることで、容易に通話相手を選択することができる。また、アイコン85は通話相手の顔写真を含んでいるので、ユーザは、どのアイコン85がどの通話相手に対応しているのかを容易に理解することができる。
<その他の実施形態>
(1)前記第1~第6の実施形態において、ロボット1、301、401、501、コンピュータ101、車載機201は、状況に応じて学習制限内容を増減してもよい。例えば、当初は学習制限内容に属していた事項が、複数の人物によって話されたと認識した場合、その事項を学習制限内容から除外してもよい。
(6C) The robot 501 creates an
<Other embodiments>
(1) In the first to sixth embodiments, the
(2)前記第1~第6の実施形態において、ロボット1、301、401、501、コンピュータ101、車載機201は、マイク5により音声を取得したとき、その音声の声
色を判断し、その判断結果に応じて、音声の内容を学習するか否かを決めてもよい。
(2) In the first to sixth embodiments, when the
(3)前記第1~第6の実施形態において、音声の認識結果に応じて行う処理は、回答音声データの作成(前記ステップ13)、車両の制御内容決定(前記ステップ33)以外のものであってもよい。例えば、音声の認識結果に応じて、ロボット1、301、401、501を移動させたり、コンピュータ101に接続した外部装置を操作したりしてもよい。また、音声の認識結果に応じて、例えば、所定の動作(例えば、箱の開閉、窓の開閉、鍵の施錠又は開錠、家電製品の操作等)を行ってもよい。
(3) In the first to sixth embodiments, the process performed in response to the voice recognition result may be something other than creating answer voice data (step 13) or determining the vehicle control content (step 33). For example, the
(4)前記第1~第6の実施形態において、AI用プログラム及びデータセットを記憶するものは、クラウドネットワーク31以外のものであってもよい。例えば、周知のサーバ、記憶媒体等に記憶してもよい。 (4) In the first to sixth embodiments, the AI program and data set may be stored in something other than the cloud network 31. For example, they may be stored in a well-known server, storage medium, etc.
(5)前記第3の実施形態において、車載機201は、車両以外の移動体(例えば、鉄道車両、航空機、船舶等)に搭載され、それらを制御するものであってもよい。
(6)前記第1、第4~6の実施形態において、ロボット1、301、401、501の形態は人型でなくてもよい。例えば、動物、魚、想像上キャラクタ等の形態であってもよい。
(5) In the third embodiment, the on-board device 201 may be mounted on a moving object other than a vehicle (for example, a railroad car, an aircraft, a ship, etc.) and may control the moving object.
(6) In the first, fourth to sixth embodiments, the form of the
(7)前記第1~第3、第5、第6の実施形態において、ロボット1、401、501、コンピュータ101、車載機201は、標準プログラムと、AI用プログラムとを同時に使用してもよい。この場合、標準プログラムにより基本的な処理を実行するとともに、AI用プログラムにより、学習の結果得られた付加的な処理を実行することができる。
(7) In the first to third, fifth and sixth embodiments, the
(8)前記第1~第6の実施形態において、ロボット1、301、401、501、コンピュータ101、車載機201の形態は、家電製品(例えば、テレビ、冷蔵庫、エアコン、掃除機、洗濯機等)、携帯端末(例えば、携帯電話(スマートフォンを含む)、メガネ型端末、腕時計型端末)等であってもよい。
(8) In the first to sixth embodiments, the
(9)前記第1~第6の実施形態において、ロボット1、301、401、501、コンピュータ101、車載機201は、カメラ7を用いて自動的に画像を取得し、取得した画像をネットワーク上に送信する機能を有していてもよい。送信先としては、サーバ、端末、車両、他のロボット等が挙げられる。送信する画像は、カメラ7を用いて取得した画像そのものであってもよいし、カメラ7を用いて取得した画像から抽出した一部(例えば、人の顔、人の全身、車両、車両のナンバープレート等)の画像であってもよい。
(9) In the first to sixth embodiments, the
上記の機能を有するロボット1、301、401、501、コンピュータ101、車載機201は、防犯の用途、他のロボットの監視の用途等に使用することができる。上記の機能を有するロボット1、301、401、501、コンピュータ101、車載機201は、例えば、室内、路上、特定の施設(例えば、住居、マンション、オフィス、駐車場等)の入口、他のロボットの近傍等に設置することができる。
The
また、上記の機能を有するロボット1、301、401、501、コンピュータ101、車載機201は、空中を飛行する機能を持つか、飛行物に搭載することができる。その場合、上空の視点から撮影した地上の画像をネットワーク上で送信することができる。この場合、ロボット1、301、401、501、コンピュータ101、車載機201は、撮影した画像において道路の白線を認識し、その白線に沿って移動することができる。また、ロボット1、301、401、501、コンピュータ101、車載機201は、上空の視点から撮影した地上の画像において信号機を認識し、その表示内容(赤信号、青信号等)を、地上の車両に送信することができる。
Furthermore, the
(10)前記第1~第6の実施形態において、ロボット1、301、401、501、コンピュータ101、車載機201は、カメラ7を用いて人の行動を認識し、その認識結果に予め関連付けられた音声を出力してもよい。
(10) In the first to sixth embodiments, the
例えば、ガスの火をつけたまま人が台所を離れるという行動を認識した場合、その人に対する警告の音声を出力することができる。また、人が所定の物を探す行動を認識した場合、その物の場所を探し、物のありかを音声で知らせることができる。また、人が住宅の入口から室内に入るという行動を認識したとき、「おかえりなさい」という音声を出力することができる。人の行動と、それに関連付けられた音声とは、学習により増加させることができる。 For example, if the system recognizes that a person leaves the kitchen with the gas still on, it can output a voice warning to that person. Also, if the system recognizes that a person is searching for a specific object, it can search for the location of that object and notify the user of its location by voice. Also, if the system recognizes that a person enters a house through the entrance, it can output a voice saying "Welcome home." Human actions and the voices associated with them can be increased through learning.
上記のように音声を発する場合、その音声の種類は、そのときの状況と、音声の内容とに関連付けられたものとすることができる。例えば、画像において父親を認識した場合、「おかえりなさい」という音声の種類は、その子供の声とすることができる。 When sound is emitted as described above, the type of sound can be associated with the situation at the time and the content of the sound. For example, if a father is recognized in an image, the type of sound "Welcome home" can be determined to be the voice of his child.
(11)前記第1~第6の実施形態において、制御ユニットは、マイクロコンピュータを備えているが、個別の電子回路の組合せであってもよいし、AISIC(Application Specified Integrated Circuit)であってもよいし、FPGA(Field Programmable Gate Array)などのプログラマブル・ロジック・デバイスあるいはこれらの組合せであってもよい。
(12)前記第1~第6の実施形態の構成の一部又は全部を適宜組み合わせてもよい。例えば、前記第4~第6の実施形態の構成を、前記第2、第3の実施形態に適用してもよい。
(11) In the first to sixth embodiments, the control unit includes a microcomputer. However, the control unit may be a combination of individual electronic circuits, an AISIC (Application Specified Integrated Circuit), a programmable logic device such as an FPGA (Field Programmable Gate Array), or a combination of these.
(12) A part or all of the configurations of the first to sixth embodiments may be combined as appropriate. For example, the configurations of the fourth to sixth embodiments may be applied to the second and third embodiments.
本開示は、情報処理システム、情報処理方法、及びコンピュータプログラムに関する。 The present disclosure relates to an information processing system, an information processing method, and a computer program .
ロボットの会話能力を、人工知能を用いた学習により高めることが考えられる。本開示は、人工知能を用いた会話に関する新規技術を提供することを一側面とする。It is conceivable that the conversation ability of a robot can be improved by learning using artificial intelligence. One aspect of the present disclosure is to provide a new technology related to conversation using artificial intelligence.
本開示の一側面によれば、情報処理システムが提供される。情報処理システムは、音声取得ユニットと、出力ユニットと、学習制御ユニットと、を備える。According to one aspect of the present disclosure, there is provided an information processing system, the information processing system including a voice acquisition unit, an output unit, and a learning control unit.
音声取得ユニットは、ユーザの音声を取得するように構成される。The voice capturing unit is configured to capture the voice of the user.
出力ユニットは、音声取得ユニットが取得したユーザの音声に対する応答音声を、ユーザとの間の会話を学習する学習機能を有する人工知能を用いて作成し、応答音声を、ユーザに向けて出力するように構成される。The output unit is configured to create a response voice to the user's voice acquired by the voice acquisition unit using artificial intelligence having a learning function of learning the conversation with the user, and to output the response voice to the user.
学習制御ユニットは、ユーザの音声に基づき、学習機能を制限するように構成される。The learning control unit is configured to limit the learning function based on the user's voice.
本開示の別側面によれば、音声取得ユニットと、読出ユニットと、出力ユニットと、学習ユニットと、学習制御ユニットと、を備える情報処理システムが提供されてもよい。According to another aspect of the present disclosure, there may be provided an information processing system including a voice acquisition unit, a read-out unit, an output unit, a learning unit, and a learning control unit.
音声取得ユニットは、ユーザの音声を取得するように構成される。The voice capturing unit is configured to capture the voice of the user.
読出ユニットは、ユーザとの過去の会話により学習された人工知能に関するデータセットを、記憶装置から読み出すように構成される。The reading unit is configured to read from the storage device a dataset relating to the artificial intelligence that has been trained through past conversations with the user.
出力ユニットは、音声取得ユニットが取得した音声に応答する言葉としての応答語を、読み出されたデータセットを用いて、人工知能により作成し、ユーザに向けて出力するように構成される。The output unit is configured to use the retrieved data set to generate a response word as a word responsive to the voice acquired by the voice acquisition unit through artificial intelligence, and to output the response word to a user.
学習ユニットは、ユーザの音声に基づく学習動作を実行し、記憶装置が記憶するデータセットを更新することによって、データセットに学習結果を記録するように構成される。The learning unit is configured to perform learning operations based on the user's voice and record the learning results in the dataset by updating the dataset stored by the storage device.
学習制御ユニットは、ユーザの音声に基づき、学習ユニットによる学習動作を制限するように構成される。The learning control unit is configured to limit a learning operation by the learning unit based on the user's voice.
本開示の別側面によれば、音声取得ユニットと、検索ユニットと、出力ユニットとを備える情報処理システムが提供されてもよい。According to another aspect of the present disclosure, there may be provided an information processing system including a voice acquisition unit, a search unit, and an output unit.
音声取得ユニットは、ユーザの音声を取得するように構成される。The voice capturing unit is configured to capture the voice of the user.
検索ユニットは、音声取得ユニットが取得したユーザの音声に含まれる質問に関連する関連情報を、質問の内容に基づいてインターネット上で検索するように構成される。The search unit is configured to search for relevant information related to the question contained in the user's voice acquired by the voice acquisition unit on the Internet based on the content of the question.
出力ユニットは、検索ユニットがインターネットから取得した関連情報に基づき、質問に対する回答を作成し、回答を少なくとも音声の形態でユーザに向けて出力するように構成される。The output unit is adapted to generate an answer to the question based on the relevant information retrieved from the Internet by the search unit, and to output the answer to the user at least in the form of voice.
Claims (3)
前記音声認識ユニットの認識結果について学習する学習ユニット(25)と、
前記音声認識ユニットの認識結果に対し、前記学習ユニットの学習結果を用いて、対応する処理を行う処理ユニット(23、25、27)と、
前記学習結果を外部の記憶装置に記憶する記憶ユニット(26)と、
前記学習結果を前記記憶装置から取得する学習結果取得ユニット(26)と、
を備えるロボット(1、301)。 A voice recognition unit (23, 25, 27) for performing voice recognition;
a learning unit (25) for learning about the recognition result of the speech recognition unit;
a processing unit (23, 25, 27) for performing corresponding processing on the recognition result of the speech recognition unit using the learning result of the learning unit;
a storage unit (26) for storing the learning result in an external storage device;
a learning result acquisition unit (26) for acquiring the learning result from the storage device;
A robot (1, 301) comprising:
前記学習結果取得ユニットは、前記識別情報に対応付けられた前記学習結果を前記外部記憶装置から取得する請求項1に記載のロボット。 An identification information acquisition unit (21, 26) for acquiring user identification information,
The robot according to claim 1 , wherein the learning result acquisition unit acquires the learning result associated with the identification information from the external storage device.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014262907 | 2014-12-25 | ||
JP2014262907 | 2014-12-25 | ||
JP2020105300A JP6994781B2 (en) | 2014-12-25 | 2020-06-18 | On-board equipment and vehicles |
JP2021197647A JP7251833B2 (en) | 2014-12-25 | 2021-12-06 | Host computer and system |
JP2023038727A JP7555620B2 (en) | 2014-12-25 | 2023-03-13 | Information processing system, electronic device, information processing method, and computer program |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023038727A Division JP7555620B2 (en) | 2014-12-25 | 2023-03-13 | Information processing system, electronic device, information processing method, and computer program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2024167393A true JP2024167393A (en) | 2024-12-03 |
Family
ID=56149918
Family Applications (9)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016565988A Active JP6544693B2 (en) | 2014-12-25 | 2015-10-21 | robot |
JP2018236315A Active JP6744529B2 (en) | 2014-12-25 | 2018-12-18 | In-vehicle device and vehicle |
JP2020105300A Active JP6994781B2 (en) | 2014-12-25 | 2020-06-18 | On-board equipment and vehicles |
JP2021115110A Active JP7122038B2 (en) | 2014-12-25 | 2021-07-12 | In-vehicle device and vehicle |
JP2021197647A Active JP7251833B2 (en) | 2014-12-25 | 2021-12-06 | Host computer and system |
JP2023032952A Pending JP2023065621A (en) | 2014-12-25 | 2023-03-03 | Robot and vehicle |
JP2023038727A Active JP7555620B2 (en) | 2014-12-25 | 2023-03-13 | Information processing system, electronic device, information processing method, and computer program |
JP2024152249A Pending JP2024167393A (en) | 2014-12-25 | 2024-09-04 | Information processing system, information processing method, computer program and vehicle |
JP2024155184A Pending JP2024170597A (en) | 2014-12-25 | 2024-09-09 | On-board device and vehicle |
Family Applications Before (7)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016565988A Active JP6544693B2 (en) | 2014-12-25 | 2015-10-21 | robot |
JP2018236315A Active JP6744529B2 (en) | 2014-12-25 | 2018-12-18 | In-vehicle device and vehicle |
JP2020105300A Active JP6994781B2 (en) | 2014-12-25 | 2020-06-18 | On-board equipment and vehicles |
JP2021115110A Active JP7122038B2 (en) | 2014-12-25 | 2021-07-12 | In-vehicle device and vehicle |
JP2021197647A Active JP7251833B2 (en) | 2014-12-25 | 2021-12-06 | Host computer and system |
JP2023032952A Pending JP2023065621A (en) | 2014-12-25 | 2023-03-03 | Robot and vehicle |
JP2023038727A Active JP7555620B2 (en) | 2014-12-25 | 2023-03-13 | Information processing system, electronic device, information processing method, and computer program |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2024155184A Pending JP2024170597A (en) | 2014-12-25 | 2024-09-09 | On-board device and vehicle |
Country Status (2)
Country | Link |
---|---|
JP (9) | JP6544693B2 (en) |
WO (1) | WO2016103881A1 (en) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017191390A (en) * | 2016-04-12 | 2017-10-19 | ロボットスタート株式会社 | Communication system, communication log collection system, server, and communication method |
JP6329331B1 (en) * | 2016-07-04 | 2018-05-23 | 株式会社Seltech | System with artificial intelligence |
CN106297782A (en) * | 2016-07-28 | 2017-01-04 | 北京智能管家科技有限公司 | A kind of man-machine interaction method and system |
US10304463B2 (en) * | 2016-10-03 | 2019-05-28 | Google Llc | Multi-user personalization at a voice interface device |
CN107053191B (en) * | 2016-12-31 | 2020-05-08 | 华为技术有限公司 | Robot, server and man-machine interaction method |
WO2019064650A1 (en) * | 2017-09-28 | 2019-04-04 | 三菱自動車工業株式会社 | Information transfer support system for vehicle |
JP2021121877A (en) * | 2018-04-27 | 2021-08-26 | ソニーグループ株式会社 | Information processing device and information processing method |
CN109118860A (en) * | 2018-09-19 | 2019-01-01 | 江苏金惠甫山软件科技有限公司 | Expert English language training by qualified teachers system and method based on artificial intelligence |
JP2020056907A (en) * | 2018-10-02 | 2020-04-09 | 株式会社Tarvo | Cloud voice conversion system |
JP7342419B2 (en) * | 2019-05-20 | 2023-09-12 | カシオ計算機株式会社 | Robot control device, robot, robot control method and program |
JP7151654B2 (en) | 2019-07-26 | 2022-10-12 | トヨタ自動車株式会社 | Search device, learning device, search system, search program, and learning program |
JP2021144086A (en) * | 2020-03-10 | 2021-09-24 | 株式会社東海理化電機製作所 | Agent system and computer program |
JP7591891B2 (en) | 2020-09-10 | 2024-11-29 | avatarin株式会社 | Communication Systems and Robots |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
IL90277A0 (en) * | 1989-05-12 | 1989-12-15 | Shmuel Shapira | System for locating compatible persons at a given locality |
JP2522414B2 (en) * | 1989-10-19 | 1996-08-07 | 日本電気株式会社 | Server-client connection method |
JP4543444B2 (en) * | 1999-02-24 | 2010-09-15 | 株式会社エクォス・リサーチ | Vehicle control device |
JP2001051694A (en) | 1999-08-10 | 2001-02-23 | Fujitsu Ten Ltd | Voice recognition device |
JP2002041276A (en) | 2000-07-24 | 2002-02-08 | Sony Corp | Interactive operation-supporting system, interactive operation-supporting method and recording medium |
JP4000828B2 (en) * | 2001-11-06 | 2007-10-31 | 株式会社デンソー | Information system, electronic equipment, program |
JP3945356B2 (en) * | 2002-09-17 | 2007-07-18 | 株式会社デンソー | Spoken dialogue apparatus and program |
JP2004195636A (en) | 2002-12-02 | 2004-07-15 | Sony Corp | Interaction control device and method and robot device |
JP2004214895A (en) * | 2002-12-27 | 2004-07-29 | Toshiba Corp | Auxiliary communication apparatus |
JP4343621B2 (en) * | 2003-08-22 | 2009-10-14 | エヌ・ティ・ティ・コミュニケーションズ株式会社 | File management system, file generation device, file acquisition device, authentication device, and program |
US7308112B2 (en) * | 2004-05-14 | 2007-12-11 | Honda Motor Co., Ltd. | Sign based human-machine interaction |
JP2005345903A (en) | 2004-06-04 | 2005-12-15 | Honda Motor Co Ltd | Vocal equipment control unit |
JP2007034198A (en) | 2005-07-29 | 2007-02-08 | Denso Corp | Speech recognition system and mobile terminal device used therefor |
WO2008007688A1 (en) * | 2006-07-13 | 2008-01-17 | Nec Corporation | Talking terminal having voice recognition function, sound recognition dictionary update support device, and support method |
JP5170052B2 (en) * | 2009-09-30 | 2013-03-27 | 中部日本電気ソフトウェア株式会社 | Driving support system, server device, driving support device, and information processing method |
JP2011085966A (en) * | 2009-10-13 | 2011-04-28 | Sony Corp | Information processing device, information processing method, and program |
JP5742184B2 (en) * | 2010-11-16 | 2015-07-01 | トヨタ自動車株式会社 | Driving assistance device |
JP5667895B2 (en) * | 2011-01-25 | 2015-02-12 | メガトレンド株式会社 | Bank transfer fraud prevention device |
JP2013223161A (en) * | 2012-04-18 | 2013-10-28 | Fic Service Co Ltd | Telephone call connection service system |
WO2013190963A1 (en) | 2012-06-18 | 2013-12-27 | エイディシーテクノロジー株式会社 | Voice response device |
JP5617942B2 (en) | 2013-02-05 | 2014-11-05 | 株式会社デンソー | In-vehicle device control system |
-
2015
- 2015-10-21 JP JP2016565988A patent/JP6544693B2/en active Active
- 2015-10-21 WO PCT/JP2015/079730 patent/WO2016103881A1/en active Application Filing
-
2018
- 2018-12-18 JP JP2018236315A patent/JP6744529B2/en active Active
-
2020
- 2020-06-18 JP JP2020105300A patent/JP6994781B2/en active Active
-
2021
- 2021-07-12 JP JP2021115110A patent/JP7122038B2/en active Active
- 2021-12-06 JP JP2021197647A patent/JP7251833B2/en active Active
-
2023
- 2023-03-03 JP JP2023032952A patent/JP2023065621A/en active Pending
- 2023-03-13 JP JP2023038727A patent/JP7555620B2/en active Active
-
2024
- 2024-09-04 JP JP2024152249A patent/JP2024167393A/en active Pending
- 2024-09-09 JP JP2024155184A patent/JP2024170597A/en active Pending
Also Published As
Publication number | Publication date |
---|---|
WO2016103881A1 (en) | 2016-06-30 |
JP7122038B2 (en) | 2022-08-19 |
JP6744529B2 (en) | 2020-08-19 |
JP6544693B2 (en) | 2019-07-17 |
JP2023065621A (en) | 2023-05-12 |
JP7555620B2 (en) | 2024-09-25 |
JP2020173453A (en) | 2020-10-22 |
JP2023072025A (en) | 2023-05-23 |
JP7251833B2 (en) | 2023-04-04 |
JP2019095795A (en) | 2019-06-20 |
JP2021185410A (en) | 2021-12-09 |
JP2022043116A (en) | 2022-03-15 |
JPWO2016103881A1 (en) | 2017-10-05 |
JP2024170597A (en) | 2024-12-10 |
JP6994781B2 (en) | 2022-01-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7555620B2 (en) | Information processing system, electronic device, information processing method, and computer program | |
US8209179B2 (en) | Speech communication system and method, and robot apparatus | |
KR102730113B1 (en) | Building management robot and method for providing service using the same | |
KR20190084789A (en) | Electric terminal and method for controlling the same | |
KR20190022109A (en) | Method for activating voice recognition servive and electronic device for the same | |
KR102740847B1 (en) | Method for processing user input and electronic device supporting the same | |
US11107471B2 (en) | Dialog processing server, control method for dialog processing server, and terminal | |
JP2016522465A (en) | Apparatus and method for providing a persistent companion device | |
US10872438B2 (en) | Artificial intelligence device capable of being controlled according to user's gaze and method of operating the same | |
KR20210062428A (en) | Remote control method and apparatus for an imageing apparatus | |
US20200234710A1 (en) | Automatic dialogue design | |
US20210334640A1 (en) | Artificial intelligence server and method for providing information to user | |
WO2018003196A1 (en) | Information processing system, storage medium and information processing method | |
JP2023086816A (en) | Automobile and gait recognition system | |
WO2023231211A1 (en) | Voice recognition method and apparatus, electronic device, storage medium, and product | |
US11116027B2 (en) | Electronic apparatus and operation method thereof | |
CN115904082A (en) | Multi-mode interaction system and interaction method | |
US20200134334A1 (en) | Electronic apparatus and operation method thereof | |
JP2024155783A (en) | Electronics | |
JP2025013316A (en) | Control System | |
JP2024138697A (en) | Information processing system, information processing device, information processing program, and information processing method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240904 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20241105 |