JP7339124B2 - 制御装置、システム及び制御方法 - Google Patents
制御装置、システム及び制御方法 Download PDFInfo
- Publication number
- JP7339124B2 JP7339124B2 JP2019197505A JP2019197505A JP7339124B2 JP 7339124 B2 JP7339124 B2 JP 7339124B2 JP 2019197505 A JP2019197505 A JP 2019197505A JP 2019197505 A JP2019197505 A JP 2019197505A JP 7339124 B2 JP7339124 B2 JP 7339124B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- control device
- equal
- emergency stop
- controlled object
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 35
- 238000003860 storage Methods 0.000 description 23
- 238000010586 diagram Methods 0.000 description 17
- 238000001514 detection method Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 11
- 230000015654 memory Effects 0.000 description 8
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 239000012636 effector Substances 0.000 description 3
- 230000007613 environmental effect Effects 0.000 description 3
- 239000012634 fragment Substances 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 241001417093 Moridae Species 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/87—Detection of discrete points within a voice signal
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
- G10L2015/025—Phonemes, fenemes or fenones being the recognition units
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L2025/783—Detection of presence or absence of voice signals based on threshold decision
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Manipulator (AREA)
Description
制御対象の動作中に検出される音データから音声区間を判定する判定部と、
前記音声区間における音データに基づいて算出される話速が第1閾値以上であり、かつ、前記音声区間の長さが第2閾値以下である場合に、前記制御対象を停止させる制御部とを有する。
<ロボットの外観構成>
はじめに、本実施形態に係る制御装置の制御対象の一例であるロボットの外観構成について説明する。図1は、ロボットの外観構成の一例を示す図である。
次に、ロボット10に内蔵される制御装置100のハードウェア構成について説明する。図2は、制御装置のハードウェア構成の一例を示す図である。
次に、制御装置100の機能構成について説明する。上述したとおり、制御装置100は、実行部110及び緊急停止部120として機能するが、ここでは緊急停止部120の機能について説明する。図3は、制御装置の緊急停止部の機能構成の一例を示す第1の図である。制御装置100は、プロセッサ201が、主記憶装置202または補助記憶装置203に格納された制御プログラムの一例である緊急停止プログラムを実行することで緊急停止部120として機能する。
・話速が予め定められた閾値以上である。
・音声区間長が予め定められた閾値以下である。
次に、緊急停止部120による緊急停止処理の流れについて説明する。図4は、緊急停止部による緊急停止処理の流れを示す第1のフローチャートである。
・話速が予め定められた閾値以上である。
・音声区間長が予め定められた閾値以下である。
以上の説明から明らかなように、第1の実施形態に係る制御装置の緊急停止部は、作業中のロボットにおいて緊急停止させるべき状況が生じると、一般に、ユーザは短い言葉で早口に叫ぶことが多い点に着目し、
・話速が予め定められた閾値以上であり、かつ、
・音声区間長が予め定められた閾値以下である、
場合に、緊急停止させるべき状況が生じたと判定し、緊急停止信号を出力する。
上記第1の実施形態では、緊急停止させるべき状況が生じた場合にユーザが咄嗟に発声する音声の音声区間長と話速とに着目した。一方で、緊急停止させるべき状況が生じた場合、ユーザは、比較的大きな声で叫ぶことが想定される。そこで、第2の実施形態では、緊急停止させるべき状況が生じたか否かを判定するにあたり、音声区間長と話速とに加えて、音圧レベルに着目する。以下、第2の実施形態について、上記第1の実施形態との相違点を中心に説明する。
はじめに、第2の実施形態に係る制御装置100の緊急停止部の機能構成について説明する。図5は、制御装置の緊急停止部の機能構成の一例を示す第2の図である。図3に示した機能構成との相違点は、第2の実施形態に係る制御装置100の緊急停止部500の場合、音圧レベル算出器501を有する点、及び、緊急発声判定器502が緊急発声判定器304とは異なる機能を有する点である。
・話速が予め定められた閾値以上である。
・音声区間長が予め定められた閾値以下である。
・音圧レベルが予め定められた閾値以上である。
次に、緊急停止部500による緊急停止処理の流れについて説明する。図6は、緊急停止部による緊急停止処理の流れを示す第2のフローチャートである。図4で示したフローチャートとの相違点は、ステップS211である。
以上の説明から明らかなように、第2の実施形態に係る制御装置の緊急停止部は、作業中のロボットにおいて緊急停止させるべき状況が生じると、一般に、ユーザは短い言葉で早口に大声で叫ぶことが多い点に着目し、
・話速が予め定められた閾値以上であり、かつ、
・音声区間長が予め定められた閾値以下であり、かつ、
・音圧レベルが予め定められた閾値以上である、
場合に、緊急停止させるべき状況が生じたと判定し、緊急停止信号を出力する。
上記第1の実施形態では、緊急停止させるべき状況が生じた場合にユーザが咄嗟に発声する音声の音声区間長と話速とに着目した。一方で、緊急停止させるべき状況が生じた場合に、ユーザが発声する可能性の高い音声内容は限られている。また、緊急停止させるべき状況が生じた場合に、ユーザが発声する可能性の低い音声内容もある。そこで、第3の実施形態では、緊急停止させるべき状況が生じたか否かを判定するにあたり、音声区間長と話速とに加えて、認識された音素列に着目する。以下、第3の実施形態について、上記第1の実施形態との相違点を中心に説明する。
はじめに、第3の実施形態に係る制御装置100の緊急停止部の機能構成について説明する。図7は、制御装置の緊急停止部の機能構成の一例を示す第3の図である。図3に示した機能構成との相違点は、緊急発声判定器702が緊急発声判定器304とは異なる機能を有する点である。
・話速が予め定められた閾値以上である。
・音声区間長が予め定められた閾値以下である。
・音素列が、音素列格納部701に格納された、予め定められた音素列の集合に含まれる音素列を含む。
・話速が予め定められた閾値以上である。
・音声区間長が予め定められた閾値以下である。
・音素列が、音素列格納部701に格納された、予め定められた音素列の集合に含まれる音素列を含まない。
以上の説明から明らかなように、第3の実施形態に係る制御装置の緊急停止部は、作業中のロボット10において緊急停止させるべき状況が生じると、一般に、ユーザは特定の短い言葉で早口に叫ぶことが多い点に着目し、
・話速が予め定められた閾値以上であり、かつ、
・音声区間長が予め定められた閾値以下であり、かつ、
・音素列が、予め定められた音素列を含む(あるいは含まない)、
場合に、緊急停止させるべき状況が生じたと判定し、緊急停止信号を出力する。
上記第1の実施形態では、緊急停止させるべき状況が生じた場合にユーザが咄嗟に発声する音声の音声区間長と話速とに着目した。一方で、緊急停止させるべき状況が生じた場合、ユーザは、ロボットの方向に向かって発声する可能性が高い。そこで、第4の実施形態では、緊急停止させるべき状況が生じたか否かを判定するにあたり、音声区間長と話速とに加えて、ユーザが発声した方向に着目する。以下、第4の実施形態において、上記第1の実施形態との相違点を中心に説明する。
はじめに、第4の実施形態に係る制御装置100の緊急停止部の機能構成について説明する。図8は、制御装置の緊急停止部の機能構成の一例を示す第4の図である。図3に示した機能構成との相違点は、第4の実施形態に係る制御装置100の緊急停止部800の場合、画像取得部801及び顔認識器802を有する点と、緊急発声判定器803が緊急発声判定器304とは異なる機能を有する点である。
・話速が予め定められた閾値以上である。
・音声区間長が予め定められた閾値以下である。
・顔が正面を向いている。
次に、緊急停止部800による緊急停止処理の流れについて説明する。図9は、緊急停止部による緊急停止処理の流れを示す第3のフローチャートである。図4で示したフローチャートとの相違点は、ステップS411、S412である。
上記説明では、画像取得部801が取得した画像データから、顔認識器802が顔領域を検出し、検出した顔領域に基づいて、顔の向きを認識するものとして説明した。しかしながら、画像取得部801が取得した画像データに、複数のユーザが含まれ、複数の顔領域が検出されることも考えられる。そこで、変形例1では、音取得部301が音の到来方向(発声したユーザが位置する方向)を特定し、顔認識器802では、画像データに含まれる複数の顔領域のうち、特定した到来方向に位置する顔領域について、顔の向きを認識する。
・H. Pan, R. Scheibler, E. Bezzam, I. Dokmanic, and M. Vetterli,"FRIDA: FRI-based DOA estimation for arbitrary array layouts, " Proc. ICASSP, pp. 3186-3190, 2017
・R. Schmidt, "Multiple emitter location and signal parameter estimation," IEEE Trans. Antennas Propag., Vol. 34, Issue 3, pp. 276-280, 1986
が知られている。
上記説明では、マイクロフォン20、カメラ30がロボット10と一体的に構成されていることを前提としていた。しかしながら、マイクロフォン20またはカメラ30のいずれか一方または両方が、ロボット10と別体として構成されることも考えられる。
・話速が予め定められた閾値以上である。
・音声区間長が予め定められた閾値以下である。
・顔が予め設定された方向を向いている。
以上の説明から明らかなように、第4の実施形態に係る制御装置の緊急停止部は、作業中のロボットにおいて緊急停止させるべき状況が生じると、一般に、ユーザは短い言葉で早口に所定の方向に向かって叫ぶことが多い点に着目し、
・話速が予め定められた閾値以上であり、かつ、
・音声区間長が予め定められた閾値以下であり、かつ、
・顔の向きが予め定められた方向を向いている、
場合に、緊急停止させるべき状況が生じたと判定し、緊急停止信号を出力する。
上記第1の実施形態では、緊急停止させるべき状況が生じたか否かを判定する場合について説明した。これに対して、第5の実施形態では、緊急停止させるべき状況が生じたか否かを判定することに加えて、通常停止させるべき状況が生じたか否かについても判定する。
a)外部からの力によって動かされても、通常停止命令があった位置に戻るように位置制御して固定する方法、
b)外部からの力によって動かされた場合には、外部からの力がなくなった時点の位置を保持するように制御して固定する方法、
c)ブレーキを配し、当該ブレーキにより位置を固定する方法、
等が含まれる。
はじめに、第5の実施形態に係る制御装置100の緊急停止部の機能構成について説明する。図11は、制御装置の緊急停止部の機能構成の一例を示す第5の図である。図3に示した機能構成との相違点は、緊急停止部1100が、停止発声判定器1101を有する点である。
次に、緊急停止部1100による緊急停止処理の流れについて説明する。図12は、緊急停止部による緊急停止処理の流れを示す第5のフローチャートである。図4で示したフローチャートとの相違点は、ステップS601、S602である。
以上の説明から明らかなように、第5の実施形態に係る制御装置の緊急停止部は、ロボットにおいて緊急停止させるべき状況が生じていないと判定した場合でも、音素列に通常停止すべき音素列が含まれていた場合には、ロボットを通常停止させる。
上記第1の実施形態では、緊急停止させるべき状況が生じた場合にユーザが咄嗟に発声する音声の音声区間長と話速とに着目した。一方で、緊急停止させるべき状況が生じた場合、ユーザは、同じ単語、単語断片、又は言い回しを繰り返し発声することが想定される。例えば、「まてまてまて」(英語の場合には、"Wait, Wait, Wait")、「ストップストップ」(英語の場合には、"Stop, Stop, Stop")、「危ない危ない危ない」(英語の場合には、"Danger, Danger, Danger")「ちょっちょっちょっ」(英語の場合には、"Hey, Hey, Hey")などである。そこで、第6の実施形態では、緊急停止させるべき状況が生じたか否かを判定するにあたり、同一単語の繰り返しに着目する。以下、第6の実施形態について、上記第1の実施形態との相違点を中心に説明する。
はじめに、第6の実施形態に係る制御装置100の緊急停止部の機能構成について説明する。図13は、制御装置の緊急停止部の機能構成の一例を示す第6の図である。図3に示した機能構成との相違点は、第6の実施形態に係る制御装置100の緊急停止部1300の場合、繰り返し検出器1301を有する点、及び、緊急発声判定器1302が緊急発声判定器304とは異なる機能を有する点である。
def detect(input):
R = []
for w in range(2, len(input)//2+1):
for b in range(len(input)-w+1):
s = input[b:b+w]
R.append(s*2)
for r in R:
if r in input:
return True
return False
なお、上記記述において、戻り値が"True"とは、inputに入力された音素列において繰り返し部分が検出されたことを表す。一方、戻り値が"False"とは、inputに入力された音素列において繰り返し部分が検出されなかったことを表す。
・話速が予め定められた閾値以上である。
・音素列に繰り返し部分が含まれる。
次に、緊急停止部1300による緊急停止処理の流れについて説明する。図14は、緊急停止部による緊急停止処理の流れを示す第6のフローチャートである。図4で示したフローチャートとの相違点は、ステップS1401である。
以上の説明から明らかなように、第6の実施形態に係る制御装置の緊急停止部は、作業中のロボットにおいて緊急停止させるべき状況が生じると、一般に、ユーザは短い言葉を繰り返し早口で発話することが多い点に着目し、
・話速が予め定められた閾値以上であり、かつ、
・ユーザの発声に対応する音素列に繰り返し部分が含まれる、
場合に、緊急停止させるべき状況が生じたと判定し、緊急停止信号を出力する。
・話速が予め定められた閾値以上である。
・音声区間長が予め定められた閾値以下である。
・音素列に繰り返し部分が含まれる。
上記第6の実施形態では、緊急停止させるべき状況が生じた場合にユーザが咄嗟に発声する音声の話速と発声に対応する音素列における繰り返し部分とに着目した。一方で、緊急停止させるべき状況が生じた場合かつユーザにとっての危険度が時間とともに上昇していく場合、同じ単語や言い回しを繰り返し発声しつつ、その音圧レベルが時間と共に上昇してくことが想定される。例えば、回転機械に服を巻き込まれたものの数秒程度は猶予があるような場合、徐々に大きな声になることが想定される。そこで、第7の実施形態では、緊急停止させるべき状況が生じたか否かを判定するにあたり、話速と同一単語の繰り返しとに加えて、音圧レベルの上昇に着目する。以下、第7の実施形態について、上記第6の実施形態との相違点を中心に説明する。なお、以下では、説明を簡単にするため、単語が繰り返されるものとして説明するが、単語の繰り返しに代えて単語断片や単語列が繰り返されてもよい。
はじめに、第7の実施形態に係る制御装置100の緊急停止部の機能構成について説明する。図15は、制御装置の緊急停止部の機能構成の一例を示す第7の図である。図13に示した機能構成との相違点は、第7の実施形態に係る制御装置100の緊急停止部1500の場合、第2の実施形態に記載した音圧レベル算出器と同様の音圧レベル算出器1501を有する点、及び、緊急発声判定器1502が緊急発声判定器1302とは異なる機能を有する点である。
・話速が予め定められた閾値以上である。
・音素列に繰り返し部分が含まれる。
・音圧レベルが増加している(繰り返し区間における第1時刻の音圧レベルが、第1時刻より後の第2時刻の音圧レベルより小さい)。
次に、緊急停止部1500による緊急停止処理の流れについて説明する。図16は、緊急停止部による緊急停止処理の流れを示す第7のフローチャートである。図6で示したフローチャートとの相違点は、ステップS1601、S1602である。
以上の説明から明らかなように、第7の実施形態に係る制御装置の緊急停止部は、作業中のロボットにおいて緊急停止させるべき状況が生じると、ユーザは短い言葉を繰り返し早口で発声し、その発声に対応する音声データの音圧レベルは徐々に大きくなることが多い点に着目し、
・話速が予め定められた閾値以上であり、かつ、
・ユーザの発声に対応する音素列に繰り返し部分が含まれ、かつ、
・繰り返し区間の音圧レベルが増加している、
場合に、緊急停止させるべき状況が生じたと判定し、緊急停止信号を出力する。
・話速が予め定められた閾値以上である。
・音声区間長が予め定められた閾値以下である。
・音素列に繰り返し部分が含まれる。
・音圧レベルが増加している。
上記各実施形態では、単位時間あたりの音素数を算出することで話速を算出するものとしたが、話速の算出方法はこれに限定されない。例えば、音素より小さい単位を用いて話速を算出してもよい。あるいは、音素より大きい単位(例えば、モーラ、音節、単語)を用いて話速を算出してもよい。
・音声区間長が予め定められた閾値以下であり、かつ、
・音圧レベルが予め定められた閾値以上である、
場合に、緊急停止させるべき状況が生じたと判定し、緊急停止信号を出力してもよい。
・音声区間長が予め定められた閾値以下であり、かつ、
・音素列が、予め定められた音素列を含む(あるいは含まない)、
場合に、緊急停止させるべき状況が生じたと判定し、緊急停止信号を出力してもよい。
・音声区間長が予め定められた閾値以下であり、かつ、
・音素列に繰り返し部分が含まれる、
場合に、緊急停止させるべき状況が生じたと判定し、緊急停止信号を出力してもよい。
・音声区間長が予め定められた閾値以下であり、かつ、
・音素列に繰り返し部分が含まれ、かつ、
・音圧レベルが増加している、
場合に、緊急停止させるべき状況が生じたと判定し、緊急停止信号を出力してもよい。
20 :マイクロフォン
30 :カメラ
40 :可動部
41~44 :関節
45 :エンドエフェクタ
100 :制御装置
300 :緊急停止部
301 :音取得部
302 :音声区間検出器
303 :音素認識器
304 :緊急発声判定器
305 :話速算出器
306 :制御部
500 :緊急停止部
501 :音圧レベル算出器
502 :緊急発声判定器
700 :緊急停止部
701 :音素列格納部
702 :緊急発声判定器
800 :緊急停止部
801 :画像取得部
802 :顔認識器
803 :緊急発声判定器
1100 :緊急停止部
1101 :停止発声判定器
1300 :緊急停止部
1301 :繰り返し検出器
1302 :緊急発声判定器
1500 :緊急停止部
1501 :音圧レベル算出器
1502 :緊急発声判定器
Claims (21)
- 制御対象の動作中に検出される音データから音声区間を判定する判定部と、
前記音声区間における音データに基づいて算出される話速が第1閾値以上であり、かつ、前記音声区間の長さが第2閾値以下である場合に、前記制御対象を停止させる制御部と
を有する制御装置。 - 前記制御部は、
前記話速が前記第1閾値以上であり、かつ、前記音声区間の長さが前記第2閾値以下であり、かつ、前記音声区間における音データの音圧の大きさが第3閾値以上である場合に、前記制御対象を停止させる、請求項1に記載の制御装置。 - 前記制御部は、
前記話速が前記第1閾値以上であり、かつ、前記音声区間の長さが前記第2閾値以下であり、かつ、前記音声区間における音データに基づいて認識された音素列が予め定められた音素列を含む場合に、前記制御対象を停止させる、請求項1に記載の制御装置。 - 前記制御部は、
前記話速が前記第1閾値以上であり、かつ、前記音声区間の長さが前記第2閾値以下であり、かつ、前記音声区間における音データに基づいて認識された音素列が予め定められた音素列を含まない場合に、前記制御対象を停止させる、請求項1に記載の制御装置。 - 前記音声区間において撮影された画像データより顔領域を検出し、検出した顔領域に基づいて、顔の向きを認識する認識部を更に有し、
前記制御部は、
前記話速が前記第1閾値以上であり、かつ、前記音声区間の長さが前記第2閾値以下であり、かつ、前記顔の向きが予め設定された方向を向いている場合に、前記制御対象を停止させる、請求項1に記載の制御装置。 - 前記認識部は、前記音声区間において撮影された画像データのうち、前記音声区間における音の到来方向に位置する顔領域を検出する、請求項5に記載の制御装置。
- 制御対象の動作中に検出される音データから音声区間を判定する判定部と、
前記音声区間の長さが第1閾値以下であり、かつ、前記音声区間における音データの音圧の大きさが第2閾値以上である場合に、前記制御対象を停止させる制御部と
を有する制御装置。 - 制御対象の動作中に検出される音データから音声区間を判定する判定部と、
前記音声区間の長さが第1閾値以下であり、かつ、前記音声区間における音データに基づいて認識された音素列が予め定められた音素列を含む場合に、前記制御対象を停止させる制御部と
を有する制御装置。 - 制御対象の動作中に検出される音データから音声区間を判定する判定部と、
前記音声区間の長さが第1閾値以下であり、かつ、前記音声区間における音データに基づいて認識された音素列が予め定められた音素列を含まない場合に、前記制御対象を停止させる制御部と
を有する制御装置。 - 制御対象の動作中に検出される音データから音声区間を判定する判定部と、
前記音声区間における音データに基づいて算出される話速が第1閾値以上であり、かつ、前記音声区間における音素列に繰り返し部分が含まれる場合に、前記制御対象を停止させる制御部と
を有する制御装置。 - 前記制御部は、前記音素列に含まれる繰り返し部分の第1時刻における音データの音圧の大きさが、前記音素列に含まれる繰り返し部分の前記第1時刻より後の第2時刻における音データの音圧の大きさより小さい場合、前記制御対象を停止させる、請求項10に記載の制御装置。
- 前記音声区間における音データの音圧の大きさは、前記音声区間でない非音声区間における音データの音圧の大きさとの差分を用いて表される値である、
請求項2又は請求項7に記載の制御装置。 - 前記音声区間における音データの音圧の大きさは、前記音声区間に含まれる複数の区間それぞれにおいて算出された音圧の大きさの中央値、最大値、又は、平均値のいずれかを用いて表される値である、
請求項2又は請求項7に記載の制御装置。 - 前記音声区間における音データの音圧の大きさは、前記音声区間における音データの音圧レベルである、
請求項2、請求項7、請求項12又は請求項13に記載の制御装置。 - 前記制御部は、複数種類の停止方法により前記制御対象を停止させることが可能である、
請求項1乃至14のいずれか1項に記載の制御装置。 - 前記複数種類の停止方法には、前記制御対象への電源供給の少なくとも一部を停止することで、前記制御対象を停止させる停止方法と、前記制御対象への電源供給を維持したまま、前記制御対象を停止させる停止方法とが含まれる、請求項15に記載の制御装置。
- 前記制御部は、前記制御対象の可動部を停止させる、
請求項1乃至16のいずれか1項に記載の制御装置。 - 前記制御対象はロボットである、
請求項1乃至17のいずれか1項に記載の制御装置。 - 請求項1乃至請求項18のいずれか1項に記載の制御装置と、
前記制御装置によって動作が制御される制御対象と
を有するシステム。 - 制御対象の動作中に検出される音データから音声区間を判定する判定工程と、
前記音声区間における音データに基づいて算出される話速が第1閾値以上であり、かつ、前記音声区間の長さが第2閾値以下である場合に、前記制御対象を停止させる制御工程と
を有する制御方法。 - 制御対象の動作中に検出される音データから音声区間を判定する判定工程と、
前記音声区間の長さが第1閾値以下であり、かつ、前記音声区間における音データの音圧の大きさが第2閾値以上である場合に、前記制御対象を停止させる制御工程と
を有する制御方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2020/001718 WO2020174930A1 (ja) | 2019-02-26 | 2020-01-20 | 制御装置、システム及び制御方法 |
US17/445,530 US12051412B2 (en) | 2019-02-26 | 2021-08-20 | Control device, system, and control method |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019032699 | 2019-02-26 | ||
JP2019032699 | 2019-02-26 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2020138314A JP2020138314A (ja) | 2020-09-03 |
JP2020138314A5 JP2020138314A5 (ja) | 2022-11-07 |
JP7339124B2 true JP7339124B2 (ja) | 2023-09-05 |
Family
ID=72279909
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019197505A Active JP7339124B2 (ja) | 2019-02-26 | 2019-10-30 | 制御装置、システム及び制御方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US12051412B2 (ja) |
JP (1) | JP7339124B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11386888B2 (en) * | 2020-07-17 | 2022-07-12 | Blue Ocean Robotics Aps | Method of adjusting volume of audio output by a mobile robot device |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007027167A (ja) | 2005-07-12 | 2007-02-01 | Yamagata Casio Co Ltd | 部品搭載装置の非常停止方法 |
JP2014228644A (ja) | 2013-05-21 | 2014-12-08 | シャープ株式会社 | 報知装置 |
JP2014235345A (ja) | 2013-06-03 | 2014-12-15 | 株式会社東芝 | 音声処理装置、方法およびプログラム |
JP2017145066A (ja) | 2016-02-15 | 2017-08-24 | 庸 菊池 | 悲鳴緊急停止装置 |
Family Cites Families (53)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS60217395A (ja) | 1984-04-13 | 1985-10-30 | 株式会社東芝 | 音声による危機状態の検出装置 |
JP3119510B2 (ja) * | 1991-10-28 | 2000-12-25 | 株式会社リコー | 音声認識装置 |
JPH05273992A (ja) | 1992-03-25 | 1993-10-22 | Mitsubishi Electric Corp | 音声区間検出装置 |
JPH06175689A (ja) | 1992-12-07 | 1994-06-24 | Ricoh Co Ltd | 音声認識反応装置 |
JPH06348299A (ja) | 1993-06-07 | 1994-12-22 | Nippondenso Co Ltd | 音素認識装置および音素認識方法 |
JP2005202076A (ja) | 2004-01-14 | 2005-07-28 | Sony Corp | 発話制御装置及び方並びにロボット装置 |
JP4468777B2 (ja) | 2004-09-29 | 2010-05-26 | 本田技研工業株式会社 | 脚式歩行ロボットの制御装置 |
US7840308B2 (en) | 2004-09-10 | 2010-11-23 | Honda Motor Co., Ltd. | Robot device control based on environment and position of a movable robot |
JP2006179071A (ja) | 2004-12-21 | 2006-07-06 | Funai Electric Co Ltd | Dvdレコーダおよび映像音声再生装置 |
JP2007025140A (ja) | 2005-07-14 | 2007-02-01 | Yaskawa Electric Corp | ロボット装置およびロボット装置の情報提示方法 |
JP2007221300A (ja) | 2006-02-15 | 2007-08-30 | Fujitsu Ltd | ロボット及びロボットの制御方法 |
JP4817312B2 (ja) | 2006-08-28 | 2011-11-16 | 独立行政法人産業技術総合研究所 | 叫び声を用いたロボットの緊急停止方法及びシステム |
JP5029167B2 (ja) * | 2007-06-25 | 2012-09-19 | 富士通株式会社 | 音声読み上げのための装置、プログラム及び方法 |
EP2230054A4 (en) * | 2007-12-07 | 2011-11-09 | Yaskawa Denki Seisakusho Kk | ROBOTIC MOTOR CONTROL METHOD, ROBOTIC SYSTEM AND ROBOTIC REGULATION REGULATOR |
US8005488B2 (en) * | 2007-12-14 | 2011-08-23 | Promptu Systems Corporation | Automatic service vehicle hailing and dispatch system and method |
FR2940497B1 (fr) * | 2008-12-23 | 2011-06-24 | Voxler | Procede de pilotage d'une application a partir d'un signal de voix et dispositif associe pour sa mise en oeuvre. |
US8395503B2 (en) * | 2010-09-23 | 2013-03-12 | Altorr Corporation | Automatic door |
JP6122792B2 (ja) | 2014-02-06 | 2017-04-26 | 日本電信電話株式会社 | ロボット制御装置、ロボット制御方法及びロボット制御プログラム |
JP2015181778A (ja) | 2014-03-25 | 2015-10-22 | シャープ株式会社 | 自走式掃除機 |
TW201622677A (zh) * | 2014-09-19 | 2016-07-01 | Panasonic Ip Man Co Ltd | 起立動作支援系統、起立動作支援系統之控制部的控制方法、起立動作支援系統之控制部用程式、照護帶、機器人 |
JP2016153999A (ja) | 2015-02-17 | 2016-08-25 | 横河電機株式会社 | 管理装置、管理システム、管理方法、管理プログラム、及び記録媒体 |
US20160239697A1 (en) | 2015-02-17 | 2016-08-18 | Yokogawa Electric Corporation | Manager, management system, management method, and non-transitory computer readable storage medium |
KR102521493B1 (ko) | 2015-10-27 | 2023-04-14 | 삼성전자주식회사 | 청소 로봇 및 그 제어방법 |
CN108290296B (zh) | 2015-12-07 | 2021-05-07 | 川崎重工业株式会社 | 机器人系统及其运转方法 |
JP6595008B2 (ja) * | 2016-01-27 | 2019-10-23 | 株式会社日立産機システム | 気体圧縮機及び気体圧縮機システム |
JP2017151517A (ja) | 2016-02-22 | 2017-08-31 | 富士ゼロックス株式会社 | ロボット制御システム |
JP6659424B2 (ja) * | 2016-03-29 | 2020-03-04 | 本田技研工業株式会社 | ロボットおよびその制御方法 |
US10808879B2 (en) | 2016-04-20 | 2020-10-20 | Sony Interactive Entertainment Inc. | Actuator apparatus |
JP6615716B2 (ja) | 2016-08-08 | 2019-12-04 | 株式会社ソニー・インタラクティブエンタテインメント | ロボットおよび筐体 |
EP3446839B1 (en) | 2016-04-20 | 2023-01-18 | Sony Interactive Entertainment Inc. | Robot and housing |
JP6759852B2 (ja) * | 2016-08-22 | 2020-09-23 | 株式会社デンソーウェーブ | I/oモジュール |
US10074359B2 (en) | 2016-11-01 | 2018-09-11 | Google Llc | Dynamic text-to-speech provisioning |
DE102016125408A1 (de) * | 2016-12-22 | 2018-06-28 | RobArt GmbH | Autonomer mobiler roboter und verfahren zum steuern eines autonomen mobilen roboters |
US11400601B2 (en) * | 2017-01-19 | 2022-08-02 | Sharp Kabushiki Kaisha | Speech and behavior control device, robot, storage medium storing control program, and control method for speech and behavior control device |
CN208596290U (zh) * | 2017-04-13 | 2019-03-12 | 旭化成微电子株式会社 | 驱动控制装置、设备、光学模块 |
KR20180119016A (ko) * | 2017-04-24 | 2018-11-01 | 주식회사 광진산업 | 착탈식 자외선 살균 모듈이 구비된 진공청소기 |
KR20180124564A (ko) | 2017-05-12 | 2018-11-21 | 네이버 주식회사 | 수신된 음성 입력의 입력 음량에 기반하여 출력될 소리의 출력 음량을 조절하는 사용자 명령 처리 방법 및 시스템 |
JPWO2018229986A1 (ja) * | 2017-06-16 | 2020-05-21 | 三菱電機株式会社 | 車両起動システム、遠隔制御システム、列車統合管理システム、自動列車制御装置および車両起動方法 |
JP6834798B2 (ja) * | 2017-06-19 | 2021-02-24 | 株式会社デンソーウェーブ | I/oモジュール |
WO2019016938A1 (ja) * | 2017-07-21 | 2019-01-24 | 三菱電機株式会社 | 音声認識装置及び音声認識方法 |
EP3684558B1 (en) * | 2017-09-18 | 2025-02-19 | Telefonaktiebolaget LM Ericsson (publ) | Technique for providing reliable control in a cloud robotics system |
FI20175862A1 (fi) * | 2017-09-28 | 2019-03-29 | Kipuwex Oy | Järjestelmä äänilähteen määrittämiseksi |
JP7109207B2 (ja) * | 2018-02-23 | 2022-07-29 | パナソニックホールディングス株式会社 | 相互作用装置、相互作用方法、相互作用プログラム及びロボット |
JP6936772B2 (ja) * | 2018-06-04 | 2021-09-22 | 株式会社ホンダアクセス | 情報提供装置 |
JP6966979B2 (ja) * | 2018-06-26 | 2021-11-17 | 株式会社日立製作所 | 対話システムの制御方法、対話システム及びプログラム |
US20210210096A1 (en) * | 2018-08-03 | 2021-07-08 | Sony Corporation | Information processing device and information processing method |
CN110825121B (zh) * | 2018-08-08 | 2023-02-17 | 纬创资通股份有限公司 | 控制装置与无人机控制方法 |
WO2020056380A1 (en) * | 2018-09-13 | 2020-03-19 | The Charles Stark Draper Laboratory, Inc. | Locating and attaching interchangeable tools in-situ |
US11433546B1 (en) * | 2018-10-24 | 2022-09-06 | Amazon Technologies, Inc. | Non-verbal cuing by autonomous mobile device |
JP2020121375A (ja) | 2019-01-30 | 2020-08-13 | 株式会社Preferred Networks | 制御装置、制御対象装置、制御方法及びプログラム |
JP2020136828A (ja) * | 2019-02-15 | 2020-08-31 | シャープ株式会社 | 電子機器、制御方法及びプログラム |
JP7273538B2 (ja) * | 2019-02-26 | 2023-05-15 | パナソニックホールディングス株式会社 | 装置、方法、及びプログラム |
US11715466B2 (en) * | 2019-11-21 | 2023-08-01 | Rovi Guides, Inc. | Systems and methods for local interpretation of voice queries |
-
2019
- 2019-10-30 JP JP2019197505A patent/JP7339124B2/ja active Active
-
2021
- 2021-08-20 US US17/445,530 patent/US12051412B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007027167A (ja) | 2005-07-12 | 2007-02-01 | Yamagata Casio Co Ltd | 部品搭載装置の非常停止方法 |
JP2014228644A (ja) | 2013-05-21 | 2014-12-08 | シャープ株式会社 | 報知装置 |
JP2014235345A (ja) | 2013-06-03 | 2014-12-15 | 株式会社東芝 | 音声処理装置、方法およびプログラム |
JP2017145066A (ja) | 2016-02-15 | 2017-08-24 | 庸 菊池 | 悲鳴緊急停止装置 |
Also Published As
Publication number | Publication date |
---|---|
US12051412B2 (en) | 2024-07-30 |
JP2020138314A (ja) | 2020-09-03 |
US20210383808A1 (en) | 2021-12-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102623272B1 (ko) | 전자 장치 및 이의 제어 방법 | |
US20220059124A1 (en) | Direction based end-pointing for speech recognition | |
US20160093296A1 (en) | System and method for machine-mediated human-human conversation | |
WO2017145373A1 (ja) | 音声認識装置 | |
EP3002753A1 (en) | Speech enhancement method and apparatus for same | |
WO2018013564A1 (en) | Combining gesture and voice user interfaces | |
KR20050035562A (ko) | 잡음에 강인한 화자위치 추정방법 및 장치와 이를 이용한카메라 제어시스템 | |
JP4246703B2 (ja) | 自動音声認識の方法 | |
JP2003514412A (ja) | 音源が一対のマイクロフォンから近いか遠いかを判断する方法 | |
EP1494208A1 (en) | Method for controlling a speech dialog system and speech dialog system | |
CN108665907B (zh) | 声音识别装置、声音识别方法、记录介质以及机器人 | |
JP7339124B2 (ja) | 制御装置、システム及び制御方法 | |
EP3654329B1 (en) | In-vehicle device and speech recognition method | |
US20190303443A1 (en) | Speech translation apparatus, speech translation method, and recording medium storing the speech translation method | |
WO2020158231A1 (ja) | 制御装置、制御対象装置、制御方法及び記憶媒体 | |
JP7533472B2 (ja) | 情報処理装置、及びコマンド処理方法 | |
JP6459330B2 (ja) | 音声認識装置、音声認識方法、及び音声認識プログラム | |
JP4791857B2 (ja) | 発話区間検出装置及び発話区間検出プログラム | |
WO2020044543A1 (ja) | 情報処理装置、情報処理方法及びプログラム | |
WO2020174930A1 (ja) | 制御装置、システム及び制御方法 | |
JP5375423B2 (ja) | 音声認識システム、音声認識方法および音声認識プログラム | |
WO2020230784A1 (ja) | 制御装置、ロボット、制御方法及び制御プログラム | |
JP6673243B2 (ja) | 音声認識装置 | |
JP2009104047A (ja) | 情報処理方法及び情報処理装置 | |
JP2018045192A (ja) | 音声対話装置および発話音量調整方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221027 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221027 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230509 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230605 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230815 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230824 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7339124 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |