JP2010026220A - Voice translation device and voice translation method - Google Patents
Voice translation device and voice translation method Download PDFInfo
- Publication number
- JP2010026220A JP2010026220A JP2008187011A JP2008187011A JP2010026220A JP 2010026220 A JP2010026220 A JP 2010026220A JP 2008187011 A JP2008187011 A JP 2008187011A JP 2008187011 A JP2008187011 A JP 2008187011A JP 2010026220 A JP2010026220 A JP 2010026220A
- Authority
- JP
- Japan
- Prior art keywords
- translation
- unit
- signal
- speech
- microphone
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013519 translation Methods 0.000 title claims abstract description 385
- 238000000034 method Methods 0.000 title claims description 71
- 238000012545 processing Methods 0.000 claims description 32
- 238000003384 imaging method Methods 0.000 claims description 7
- 230000002457 bidirectional effect Effects 0.000 abstract 1
- 230000003993 interaction Effects 0.000 abstract 1
- 238000001514 detection method Methods 0.000 description 16
- 230000005236 sound signal Effects 0.000 description 9
- 230000006870 function Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000004397 blinking Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005401 electroluminescence Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007257 malfunction Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
Images
Landscapes
- Telephone Function (AREA)
Abstract
Description
本発明は、音声翻訳装置、および音声翻訳方法に関する。 The present invention relates to a speech translation apparatus and a speech translation method.
従来の音声翻訳装置は、翻訳入力マイクに加えて、集音マイクを備え、集音マイクから入力された音声に基づき周囲環境を判定し、判定した周囲環境を用いて、翻訳入力マイクから入力された音声を翻訳し、翻訳した結果の音声を、翻訳出力スピーカから出力している(例えば、特許文献1)。 A conventional speech translation apparatus includes a sound collection microphone in addition to a translation input microphone, and determines the surrounding environment based on the sound input from the sound collection microphone, and is input from the translation input microphone using the determined ambient environment. The translated voice is translated and the translated voice is output from the translation output speaker (for example, Patent Document 1).
また、特許文献2には、可聴帯域の音声信号を、可聴帯域より高い周波数帯域(超音波帯)の信号に変調し、スピーカから出力することで、指向性を持たせて音声を出力する超指向性スピーカの技術とともに、この超指向性スピーカの技術を用いて、複数の番組を表示しているテレビジョン受像機が、各番組の音声をそれぞれ異なる方向に指向性を持たせて出力する技術が記載されている。また、両面ディスプレイの各々の面に対応して、超指向性スピーカを設けた両面映像ディスプレイ装置もある(例えば、特許文献3)。
また、携帯電話端末などの携帯端末装置が、複数の超指向性スピーカを備え、通話内容などが使用者以外に聞こえないようにしたものもある(例えば、特許文献4)。
In addition, there is a mobile terminal device such as a mobile phone terminal that includes a plurality of super-directional speakers so that the contents of a call cannot be heard by anyone other than the user (for example, Patent Document 4).
しかしながら、従来の音声翻訳装置にあっては、双方向の対話をするには、対話者の人数分の音声翻訳装置を用いなければならない、あるいは、1台の音声翻訳装置を対話者の間で交互に用いなければならず煩雑であるという問題がある。
なお、特許文献2のテレビジョン受像機および特許文献3の両面ディスプレイは、複数の人に個別に音声を出力するものの、対話および音声翻訳は行えず、特許文献4の携帯電話端末は、音声翻訳は行えないものの、双方向の対話を行うことはできるが、対話者の人数分の装置が必要である。
However, in the conventional speech translation apparatus, in order to perform a two-way dialogue, it is necessary to use the speech translation apparatus for the number of the talkers, or one speech translation apparatus between the talkers. There is a problem that it must be used alternately and is complicated.
In addition, although the television receiver of
本発明は、このような事情に鑑みてなされたもので、その目的は、双方向の対話の音声翻訳を、1台で容易に行うことができる音声翻訳装置を提供することにある。 The present invention has been made in view of such circumstances, and an object of the present invention is to provide a speech translation apparatus capable of easily performing speech translation of a two-way dialogue with a single device.
(1)この発明は上述した課題を解決するためになされたもので、本発明の音声翻訳装置は、第1の言語による音声を収音し、該収音した音声を信号に変換して出力する第1マイクロフォンと、前記第1マイクロフォンが出力する信号を受け、該信号が表す音声を第2の言語に変換した音声を表す信号を生成する翻訳処理を行い、該翻訳処理結果の信号を出力する第1翻訳部と、前記第1翻訳部が出力した信号の音声を出力する第1スピーカ部と、第2の言語による音声を収音し、該収音した音声を信号に変換して出力する第2マイクロフォンと、前記第2マイクロフォンが出力する信号を受け、該信号が表す音声を第1の言語に変換した音声を表す信号を生成する翻訳処理を行い、該翻訳処理結果の信号を出力する第2翻訳部と、前記第2翻訳部が出力した信号の音声を出力する第2スピーカ部とを具備し、前記第1マイクロフォンが最も効率良く収音可能な音源の方向と、前記第2スピーカ部が音声を出力する方向とが略一致し、前記第2マイクロフォンが最も効率良く収音可能な音源の方向と、前記第1スピーカ部が音声を出力する方向とが略一致していることを特徴とする。 (1) The present invention has been made to solve the above-described problems, and the speech translation apparatus of the present invention collects speech in the first language, converts the collected speech into a signal, and outputs the signal. A first microphone that receives the signal output from the first microphone, performs a translation process to generate a signal representing a voice converted from the voice represented by the signal into a second language, and outputs a signal of the translation process result A first translation unit, a first speaker unit that outputs a voice of a signal output from the first translation unit, a voice in a second language is collected, and the collected voice is converted into a signal and output. Receiving a signal output from the second microphone, performing a translation process for generating a signal representing a voice converted from the voice represented by the signal into the first language, and outputting a signal of the translation process result A second translation unit, and the second translation unit A second speaker unit that outputs the sound of the signal output by the translation unit, and the direction of the sound source that the first microphone can collect the sound most efficiently and the direction in which the second speaker unit outputs the sound. The direction of the sound source that can be picked up most efficiently by the second microphone and the direction in which the first speaker unit outputs sound are substantially the same.
(2)また、本発明の音声翻訳装置は、上述の音声翻訳装置であって、前記第1スピーカ部および前記第2スピーカ部は、指向性を持たせて音声を出力する指向性スピーカであることを特徴とする。 (2) The speech translation device of the present invention is the speech translation device described above, wherein the first speaker unit and the second speaker unit are directional speakers that output speech with directivity. It is characterized by that.
(3)また、本発明の音声翻訳装置は、上述の音声翻訳装置であって、第2翻訳部が前記第2マイクロフォンから翻訳対象の信号を受け取り中であることを、前記第2スピーカ部が音声を出力する方向に通知する第1翻訳状態通知部と、第1翻訳部が前記第1マイクロフォンから翻訳対象の信号を受け取り中であることを、前記第1スピーカ部が音声を出力する方向に通知する第2翻訳状態通知部とを具備することを特徴とする。 (3) Further, the speech translation device of the present invention is the speech translation device described above, wherein the second speaker unit is receiving a signal to be translated from the second microphone. A first translation state notifying unit for notifying in a direction of outputting sound, and that the first translation unit is receiving a signal to be translated from the first microphone; And a second translation state notifying unit for notifying.
(4)また、本発明の音声翻訳装置は、上述の音声翻訳装置であって、前記第1翻訳部が翻訳処理中であることを、前記第2スピーカ部が音声を出力する方向に通知する第1翻訳状態通知部と、前記第2翻訳部が翻訳処理中であることを、前記第1スピーカ部が音声を出力する方向に通知する第2翻訳状態通知部とを具備することを特徴とする。 (4) Moreover, the speech translation apparatus according to the present invention is the above-described speech translation apparatus, and notifies the second speaker unit in the direction of outputting speech that the first translation unit is performing translation processing. A first translation state notifying unit and a second translation state notifying unit for notifying in a direction in which the first speaker unit outputs a voice that the second translation unit is performing a translation process, To do.
(5)また、本発明の音声翻訳装置は、上述の音声翻訳装置であって、前記第1翻訳部が翻訳処理結果の音声の信号を出力中であることを、前記第2スピーカ部が音声を出力する方向に通知する第1翻訳状態通知部と、前記第2翻訳部が翻訳処理結果の音声の信号を出力中であることを、前記第1スピーカ部が音声を出力する方向に通知する第2翻訳状態通知部とを具備することを特徴とする。 (5) Further, the speech translation device of the present invention is the speech translation device described above, wherein the first speaker unit is outputting a speech signal as a translation processing result, and the second speaker unit The first translation state notifying unit for notifying in the direction of outputting the signal and the second translation unit notifying that the first speaker unit outputs the sound signal of the translation processing result in the direction of outputting the sound. And a second translation state notifying unit.
(6)また、本発明の音声翻訳装置は、上述の音声翻訳装置であって、前記第1スピーカ部は、前記第1翻訳部が出力した信号の音声に加えて、前記第2翻訳部が出力した信号の音声を出力し、前記第2スピーカ部は、前記第2翻訳部が出力した信号の音声に加えて、前記第1翻訳部が出力した信号の音声を出力することを特徴とする。 (6) Moreover, the speech translation device of the present invention is the speech translation device described above, wherein the first speaker unit includes the second translation unit in addition to the speech of the signal output from the first translation unit. The sound of the output signal is output, and the second speaker unit outputs the sound of the signal output from the first translation unit in addition to the sound of the signal output from the second translation unit. .
(7)また、本発明の音声翻訳装置は、上述の音声翻訳装置であって、前記第1翻訳部は、さらに前記第2翻訳部が翻訳処理した結果の信号を受け、該信号が表す音声を第2の言語に変換した音声を表す信号を生成する翻訳処理を行い、該翻訳処理結果の信号を出力し、前記第2翻訳部は、さらに前記第1翻訳部が翻訳処理した結果の信号を受け、該信号が表す音声を第1の言語に変換した音声を表す信号を生成する翻訳処理を行い、該翻訳処理結果の音声の信号を出力することを特徴とする。 (7) The speech translation apparatus of the present invention is the speech translation apparatus described above, wherein the first translation unit further receives a signal resulting from translation processing by the second translation unit, and the speech represented by the signal Is translated into a second language to generate a signal representing the speech, and a signal resulting from the translation process is output. The second translation unit is a signal resulting from the translation process performed by the first translation unit. And performing a translation process for generating a signal representing a voice obtained by converting the voice represented by the signal into a first language, and outputting a speech signal as a result of the translation process.
(8)また、本発明の音声翻訳装置は、上述の音声翻訳装置であって、前記第1翻訳部による翻訳処理の開始指示を受けつける第1翻訳開始指示部と、前記第2翻訳部による翻訳処理の開始指示を受けつける第2翻訳開始指示部とを具備し、前記第1翻訳部は、前記第1翻訳開始指示部が翻訳開始の指示を受けると、前記第1マイクロフォンが出力する信号を受けて第1の言語に変換する翻訳処理を開始し、前記第2翻訳部は、前記第2翻訳開始指示部が翻訳開始の指示を受けると、前記第1マイクロフォンが出力する信号を受けて第1の言語に変換する翻訳処理を開始することを特徴とする。 (8) Moreover, the speech translation apparatus of the present invention is the speech translation apparatus described above, wherein the first translation start instruction unit receives a translation processing start instruction by the first translation unit, and the translation by the second translation unit. A second translation start instruction unit that receives a process start instruction, and the first translation unit receives a signal output from the first microphone when the first translation start instruction unit receives an instruction to start translation. The second translation unit receives a signal output from the first microphone when the second translation start instruction unit receives an instruction to start translation, and receives a signal output from the first microphone. The translation processing for converting to the language is started.
(9)また、本発明の音声翻訳装置は、上述の音声翻訳装置であって、前記第2翻訳開始指示部は、前記第1スピーカ部の出力方向を撮像する撮像部を備え、該撮像部による撮像結果から前記翻訳開始の指示を検出することを特徴とする。 (9) The speech translation device of the present invention is the speech translation device described above, wherein the second translation start instruction unit includes an imaging unit that images the output direction of the first speaker unit, and the imaging unit The translation start instruction is detected from the imaging result obtained by.
(10)また、本発明の音声翻訳装置は、上述の音声翻訳装置であって、前記第2翻訳開始指示部は、前記第2マイクロフォンが出力する信号を受け、該信号から前記翻訳開始の指示を検出することを特徴とする。 (10) The speech translation device of the present invention is the speech translation device described above, wherein the second translation start instruction unit receives a signal output from the second microphone and instructs the translation start from the signal. Is detected.
(11)また、本発明の音声翻訳方法は、音声翻訳装置における音声翻訳方法において、前記音声翻訳装置の第1のマイクロフォンが、第1の言語による音声を収音し、該収音した音声を信号に変換して出力する第1の過程と、前記音声翻訳装置が、前記第1の過程にて出力した信号を受け、該信号が表す音声を第2の言語に変換した音声を表す信号を生成する翻訳処理を行い、該翻訳処理結果の信号を出力する第2の過程と、前記音声翻訳装置が、前記第2の過程にて出力した信号の音声を、前記音声翻訳装置の第2マイクロフォンが最も効率良く収音可能な音源の方向と略一致する方向に出力する第3の過程と、前記音声翻訳装置の第2のマイクロフォンが、第2の言語による音声を収音し、該収音した音声を信号に変換して出力する第4の過程と、前記音声翻訳装置が、前記第4の過程にて出力した信号を受け、該信号が表す音声を第1の言語に変換した音声を表す信号を生成する翻訳処理を行い、該翻訳処理結果の信号を出力する第5の過程と、前記音声翻訳装置が、前記第5の過程にて出力した信号の音声を、前記第1マイクロフォンが最も効率良く収音可能な音源の方向と略一致する方向に出力する第6の過程と有することを特徴とする。 (11) In the speech translation method of the present invention, in the speech translation method in the speech translation device, the first microphone of the speech translation device collects the speech in the first language, and the collected speech is A first step of converting the signal into a signal and outputting the signal, and a signal representing the sound obtained by converting the speech represented by the speech translation device into the second language upon receiving the signal output in the first step. A second step of performing a translation process to be generated and outputting a signal of the result of the translation process; and a voice of the signal output by the speech translation device in the second step is a second microphone of the speech translation device. Is output in a direction substantially coincident with the direction of the sound source that can collect sound most efficiently, and the second microphone of the speech translation apparatus collects speech in the second language, The converted voice is converted into a signal and output. And a translation process in which the speech translation device receives the signal output in the fourth step and generates a signal representing speech obtained by converting speech represented by the signal into a first language, The fifth process of outputting the processing result signal, and the voice of the signal output by the speech translation apparatus in the fifth process are approximately the direction of the sound source that the first microphone can collect most efficiently. And a sixth process of outputting in the matching direction.
この発明によれば、第1マイクロフォンが最も効率良く収音可能な音源の方向と、第2スピーカ部が音声を出力する方向とが略一致し、第2マイクロフォンが最も効率良く収音可能な音源の方向と、第1スピーカ部が音声を出力する方向とが略一致しているので、双方向の対話の音声翻訳を、1台で容易に行うことができる。 According to this invention, the direction of the sound source that the first microphone can collect sound most efficiently coincides with the direction in which the second speaker unit outputs sound, and the sound source that the second microphone can collect sound most efficiently. Since the direction in which the first speaker unit outputs the voice substantially coincides with each other, the voice translation of the interactive dialogue can be easily performed with one unit.
[第1の実施形態]
以下、図面を参照して、本発明の第1の実施形態について説明する。図1は、この発明の第1の実施形態による音声翻訳装置1の構成を示す概略ブロック図である。音声翻訳装置1は、第1マイクロフォン10、第1翻訳部11、第1音声記憶部12、第1指向性スピーカ部13、第1翻訳状態通知部16、表示部17、第1翻訳開始指示部18、第2マイクロフォン21、第2翻訳部22、第2音声記憶部23、第2指向性スピーカ部24、第2翻訳状態通知部27、LED(Light Emitting Diode;発光ダイオード)28、第2翻訳開始指示部29を具備する。音声翻訳装置1は、設定により、様々な言語間の音声翻訳を行うことが可能であるが、以下では、第1の言語を理解する対話者Aと、第2の言語を理解する対話者Bとの双方向の対話を音声翻訳する場合を、説明する。
[First Embodiment]
Hereinafter, a first embodiment of the present invention will be described with reference to the drawings. FIG. 1 is a schematic block diagram showing the configuration of a speech translation apparatus 1 according to the first embodiment of the present invention. The speech translation apparatus 1 includes a
第1翻訳開始指示部18は、第1翻訳部11による翻訳処理、すなわち対話者Aの音声の翻訳処理の開始指示を、外部から受けつける。本実施形態では、第1翻訳開始指示部18は、当該音声翻訳装置1の表面に設けられ、押されたこと(加圧)を検出するキーボタン(外面の特定領域)である操作部(検出部)20と、操作部20のキーボタンが押されたことを翻訳処理の開始指示として検出する第1指示検出部19とを具備する。ここで、キーボタンは複数有り、上下左右の方向の各々、0〜9の数字の各々、「#」、「*」、「決定」などが対応付けられており、第1指示検出部19は、これらのうちのいずれか一つが押されたことを翻訳処理の開始指示として検出するようにしてもよいし、特定の一つ、例えば「決定」のキーボタンが押されたことを翻訳処理の開始指示として検出するようにしてもよい。なお、本実施形態においては、操作部20は、音声翻訳装置1の表面に設けられ、押されたことを検出するキーボタンであるとして説明したが、タッチパネルのように外面の特定領域への接触を検出するようにしてもよい。
The first translation start instructing
第1マイクロフォン10は、収音可能な周波数帯域に人の声の周波数帯域を含むマイクロフォンであり、対話者Aの外部からの第1の言語による音声を収音し、該収音した音声を信号に変換して出力する。
第1翻訳部11は、第1マイクロフォン10が出力する信号、すなわち対話者Aの音声の信号を受け、該信号が表す音声を第2の言語に変換した音声を表す信号を生成する翻訳処理を行い、該翻訳処理結果の信号を出力する。より詳細には、第1翻訳部11は、第1翻訳開始指示部18が翻訳開始の指示を受けると、第1マイクロフォン10が出力する信号を受け、音声認識処理を行い、該信号が表す音声を第1の言語の文字列に変換して第1音声記憶部12に記憶させる。次に、第1翻訳部11は、翻訳処理を行うことで、第1音声記憶部12に記憶させた第1の言語の文字列を第2の言語の文字列に変換する。さらに、第1翻訳部11は、音声合成処理を行って、この第2の言語の文字列から第2の言語の音声の信号を生成し、出力する。第1音声記憶部12は、RAM(Random Access Memory)、ハードディスクなどの読書き可能なメモリである。
The
The
第1指向性スピーカ部(第1スピーカ部)13は、第1翻訳部11が出力した信号の音声、すなわち対話者Aによる第1の言語の音声を第2の言語に翻訳した音声を出力する。本実施形態では、第1指向性スピーカ部13は、第1指向性制御部14と第1スピーカ15とを備え、指向性を持たせて音声を出力する機能を営む。第1指向性制御部14は、第1翻訳部11から受けた音声の信号(可聴帯域の音声信号)を、可聴帯域より高い周波数帯域(超音波帯)の信号に変調する。第1スピーカ15は、第1指向性制御部14による変調結果の周波数帯域の超音波を出力可能な超音波発生素子である。第1スピーカ15は、第1指向性制御部14により変調された信号の超音波を出力することで、第1指向性制御部14にて変調した音声を、指向性を持たせて出力する。なお、このように音声信号を可聴帯域より高い周波数帯域(超音波帯)の信号に変調し、該信号の超音波をスピーカで出力することで、指向性を持たせて音声を出力することは公知の技術であり、このときに用いる変調方式には、振幅変調、周波数変調、位相変調などがあり、いずれを用いても良い。
The first directional speaker unit (first speaker unit) 13 outputs the voice of the signal output from the
第2翻訳開始指示部29は、第2翻訳部22による翻訳処理、すなわち対話者Bの音声の翻訳処理の開始指示を、外部から受けつける。本実施形態では、第2翻訳開始指示部29は、当該音声翻訳装置1の表面に設けられ、第1スピーカの音声の出力方向を撮像する(すなわち、対話者Bを撮像する)カメラ(撮像部)31と第2指示検出部30とを備える。第2指示検出部30は、カメラ31による撮像結果の画像中からの予め決められた形状または被写体の動きの検出を開始指示の検出とする。これにより、対話者Aが音声翻訳装置1を携帯しているときに、対話者Bは、特定のポーズ(予め決められた形状)をとること、あるいは特定の動きをすることにより、翻訳開始を指示することができる。
The second translation
第2マイクロフォン21は、収音可能な周波数帯域に人の声の周波数帯域を含むマイクロフォンであり、対話者Bによる外部からの第2の言語による音声を収音し、該収音した音声を信号に変換して出力する。
第2翻訳部22は、第2マイクロフォン21が出力する信号、すなわち対話者Bの音声の信号を受け、該信号が表す音声を第1の言語に変換した音声を表す信号を生成する翻訳処理を行い、該翻訳処理結果の信号を出力する。より詳細には、第2翻訳部22は、第2翻訳開始指示部29が翻訳開始の指示を受けると、第2マイクロフォン21が出力する信号を受け、音声認識処理を行い、該信号が表す音声を第1の言語の文字列に変換して第2音声記憶部23に記憶させる。次に、第2翻訳部22は、翻訳処理を行うことで、第2音声記憶部23に記憶させた第2の言語の文字列を第1の言語の文字列に変換する。さらに、第2翻訳部22は、音声合成処理を行って、この第1の言語の文字列から第1の言語の音声の信号を生成し、出力する。第2音声記憶部23は、RAM(Random Access Memory)、ハードディスクなどの読書き可能なメモリである。
The
The
第2指向性スピーカ部(第2スピーカ部)24は、第2翻訳部22が出力した信号の音声、すなわち対話者Bによる第2の言語の音声を第1の言語に翻訳した音声を出力する。本実施形態では、第2指向性スピーカ部24は、第2指向性制御部25と第2スピーカ26とを備え、指向性を持たせて音声を出力する機能を営む。第2指向性制御部25は、第1指向性制御部14と同様に、第2翻訳部22から受けた音声の信号(可聴帯域の音声信号)を、可聴帯域より高い周波数帯域(超音波帯)の信号に変調する。第2スピーカ26は、第2指向性制御部25による変調結果の周波数帯域の超音波を出力可能な、第1スピーカ15と同様の超音波発生素子である。第2スピーカ26は、第2指向性制御部25により変調された信号の超音波を出力することで、第2指向性制御部25にて変調した音声を、指向性を持たせて出力する。なお、第1指向性スピーカ部13の説明でも述べたように、このように指向性を持たせて音声を出力することは公知の技術であり、このときに用いる変調方式には、振幅変調、周波数変調、位相変調などがあり、いずれを用いてもよい。
The second directional speaker unit (second speaker unit) 24 outputs the voice of the signal output from the
第1翻訳状態通知部16は、第1翻訳部11および第2翻訳部22から通知されて、それらの動作状態を取得し、取得した状態に応じて、第2翻訳部22が第2マイクロフォン21から翻訳対象の信号を受け取り中であること、第1翻訳部11が翻訳処理中であること、および、第1翻訳部11が翻訳処理結果の音声の信号を出力中であること、すなわち第2スピーカ26が翻訳結果の音声を出力中であることを、それぞれを表す文字、図形などを、液晶または有機EL(Organic Electro−Luminescence;有機エレクトロルミネセンス)などのディスプレイである表示部17に表示して、通知する。
The first translation
表示部17は、第2指向性スピーカ部24が音声を出力する方向に表示するディスプレイである。すなわち表示部17の表示面は、第2指向性スピーカ部24の第2スピーカ26と同一の方向を向くように音声翻訳装置1の表面に設けられており、第2指向性スピーカ部24が出力した音声を聞き取れる位置から、表示部17の表示内容を見ることができる。
The
第2翻訳状態通知部27は、第1翻訳部11および第2翻訳部22から通知されて、それらの動作状態を取得し、取得した状態に応じて、第1翻訳部11が第1マイクロフォン10から翻訳対象の信号を受け取り中であること、第2翻訳部22が翻訳処理中であること、および、第2翻訳部22が翻訳処理結果の音声の信号を出力中であること、すなわち第1スピーカ15が翻訳結果の音声を出力中であることを表す色または点滅などの発光パターンでLED28を発光させて通知するが、この通知の態様はこれに限定されない。
The second translation
LED28は、第1指向性スピーカ部13が音声を出力する方向に表示する、すなわち第1指向性スピーカ部13が出力した音声を聞き取れる位置から、表示内容を見ることができるように、当該音声翻訳装置1の表面に設けられている。
また、第1マイクロフォン10が最も効率良く収音可能な音源の方向と、第2指向性スピーカ部24の第2スピーカ26が音声を出力する方向とが略一致し、第2マイクロフォン21が最も効率良く収音可能な音源の方向と、第1指向性スピーカ部13の第1スピーカ15が音声を出力する方向とが略一致している。
The
In addition, the direction of the sound source that the
このように第1マイクロフォン10、第2スピーカ26、第2マイクロフォン21、第1スピーカ15が配置されているので、対話者Aは、第2スピーカ26から出力された第1の言語に翻訳された音声が聞こえる位置で、第1マイクロフォン10に向かって第1の言語で話せばよく。対話者Bは、第1スピーカ15から出力された第2の言語に翻訳された音声が聞こえる位置で、第2マイクロフォン21に向かって第2の言語で話せばよい。このため、双方向の対話の音声翻訳を、1台で容易に行うことができる。
Since the
また、表示部17は、第2指向性スピーカ部24の第2スピーカ26が音声を出力する方向に表示するので、対話者Aは、第2スピーカ26から出力された第1の言語に翻訳された音声が聞こえる位置にいれば、表示部17に表示される第1翻訳状態通知部16による通知を見て、音声翻訳の状態を認識することができる。すなわち、第1翻訳状態通知部16による通知のうち、第2翻訳部22が第2マイクロフォン21から翻訳対象の信号を受け取り中であることの通知を認識することで、対話者Aは、現在、対話相手の対話者Bが話している内容が翻訳されて、後に第2スピーカ26から出力されるであろうことを認識できる。
In addition, since the
また、第1翻訳部11が翻訳処理中であることの通知を認識することで、対話者Aは、先に自分が話した内容が翻訳中であり、未だ対話相手の対話者Bに伝わっていないことを認識できる。また、第2スピーカ26が翻訳結果の音声を出力中であることの通知を認識することで、対話者Aは、先に自分が話した内容を、対話相手の対話者Bが聞いている最中であることを認識できる。これにより、本実施形態のように、指向性スピーカを用いているために翻訳結果が聞こえなくても、話し手は、音声翻訳装置1の動作状態と、対話相手に翻訳結果が通知されているか否かとがわかる。
In addition, by recognizing that the
また、LED28は、第1指向性スピーカ部13の第1スピーカ15が音声を出力する方向に表示する。このため、対話者Bは、第1スピーカ15から出力された第2の言語に翻訳された音声が聞こえる位置にいれば、上述の対話者Aと同様に音声翻訳の状態を認識することができる。
また、第1指向性スピーカ部13、第2指向性スピーカ部24は、翻訳結果の音声を指向性を持たせて出力するので、これらの出力した音声を、第1マイクロフォン10、第2マイクロフォン21が収音してしまい、収音した音声を再度翻訳するなどの誤動作を防ぐことができる。また、翻訳結果を対話相手以外の第3者に聞かれる可能性を小さくすることができる。また、話し手に翻訳結果が聞こえて、翻訳結果を気にしてしまい、話し手が話し難くなることを避けることができる。
Moreover, LED28 displays in the direction in which the
In addition, the first
図2は、本実施形態における音声翻訳装置1の外観を示す概略外観図である。本実施形態において、音声翻訳装置1は、クラムシェルタイプの携帯電話端末に備えられている。図2(a)は、音声翻訳装置1を備えた携帯電話端末を開いた状態の内側の外観図であり、図2(b)は、開いた状態の外側の外観図である。図2(a)に示すように、第2スピーカ26、表示部17、第1マイクロフォン10は、同一の方向を向いており、さらに、この内側の面に操作部20が設けられている。また、図2(b)に示すように、LED28、カメラ31、第1スピーカ15、第2マイクロフォン21は、同一の方向を向いている。
FIG. 2 is a schematic external view showing the external appearance of the speech translation apparatus 1 in the present embodiment. In the present embodiment, the speech translation apparatus 1 is provided in a clamshell type mobile phone terminal. 2A is an external view of the inside of the mobile phone terminal including the speech translation device 1 in an opened state, and FIG. 2B is an external view of the outside in the open state. As shown in FIG. 2A, the
すなわち、第1マイクロフォン10が最も効率良く収音可能な音源の方向と、第2指向性スピーカ部24の第2スピーカ26が音声を出力する方向とが略一致し、第2マイクロフォン21が最も効率良く収音可能な音源の方向と、第1指向性スピーカ部13の第1スピーカ15が音声を出力する方向とが略一致している。なお、第1マイクロフォン10および第2マイクロフォン21の最も効率良く収音可能な音源の方向は、これらマイクロフォン各々に音波を誘導するために設けられた開口部の方向である。また、表示部17は、第2スピーカ26が音声を出力する方向に表示し、LED28は、第1スピーカ15が音声を出力する方向に表示する。さらに、第1スピーカ15と、第2スピーカ26との音声を出力する方向は逆方向である。
このような配置により、図2(a)に示す内側を音声翻訳装置1を保持している対話者A自らに向け、図2(b)に示す外側を対話相手である対話者Bに向けると、音声翻訳装置1を使用しやすくなっている。
That is, the direction of the sound source that can be collected most efficiently by the
With such an arrangement, when the inside shown in FIG. 2A is directed to the conversation person A holding the speech translation apparatus 1, the outside shown in FIG. 2B is directed to the conversation person B who is the conversation partner. The speech translation apparatus 1 is easy to use.
図3は、本実施形態における音声翻訳装置1の動作を説明するフローチャートである。対話者Aが話す第1の言語から第2の言語へ翻訳する場合を例に採り、説明する。まず、第1指示検出部19は、操作部20のキーボタン、例えば「決定」のキーボタンが押されているかの検出処理、すなわち、翻訳開始指示の検出処理を行う(S1)。このとき、対話者Aが操作部20のキーボタンを押下しておらず、第1指示検出部19は、翻訳開始指示なしと判定したときは(S2−No)、ステップS1に戻って、検出処理を繰り返す。
FIG. 3 is a flowchart for explaining the operation of the speech translation apparatus 1 according to this embodiment. A case where the conversation person A translates from the first language to the second language will be described as an example. First, the first
一方、対話者Aが操作部20のキーボタンを押下しており、ステップS2にて第1指示検出部19が、翻訳開始指示有りと判定したときは(S2−Yes)、第1翻訳部11は、第1マイクロフォン10からの翻訳対象の信号の受け付け開始を、第2翻訳状態通知部27にLED28を用いて通知させる(S3)とともに、第1マイクロフォン10からの翻訳対象の音声信号(第1の言語の音声信号)の受け付けを開始する(S4)。第1翻訳部11は、受け付けた音声信号を音声認識処理して、第1の言語の文字列に変換し、第1音声記憶部12に記憶させる。第1翻訳部11は、予め決められた時間より長い無音部分が続くなどを条件に会話の区切り目を検出すると、翻訳対象の音声信号の受け付けを停止し、さらに翻訳中であることを通知するように、第1翻訳状態通知部16、および第2翻訳状態通知部27に指示する(S5)。
On the other hand, when the conversation person A is pressing the key button of the
次に、第1翻訳部11は、第1音声記憶部12に記憶させた第1の言語の文字列を読み出して、第2の言語への翻訳処理を行う(S6)。第1翻訳部11は、翻訳処理が終了すると、翻訳結果の出力中であることを通知するように、第1翻訳状態通知部16に指示する(S7)。次に、第1翻訳部11は、翻訳結果の音声信号を、第1指向性スピーカ部13から出力させる(S8)。
Next, the
なお、自分が話したことの翻訳結果を確認したい場合などには、第1スピーカ15が、第1翻訳部11が出力した信号の音声に加えて、第2翻訳部22が出力した信号の音声を出力し、第2スピーカ26が、第2翻訳部22が出力した信号の音声に加えて、第1翻訳部11が出力した信号の音声を出力するようにしてもよい。
In addition, when it is desired to confirm the translation result of what he / she spoke, the
また、第1翻訳部11が、さらに第2翻訳部22から、第2マイクロフォン21が出力した信号を翻訳処理した結果の信号を受け、該信号が表す音声を第2の言語に変換した音声を表す信号を生成する翻訳処理を行い、該翻訳処理結果の信号を、第1指向性スピーカ部13に出力し、第2翻訳部22が、さらに第1翻訳部11から、第1マイクロフォン10が出力した信号を翻訳処理した結果の信号を受け、該信号が表す音声を第1の言語に変換した音声を表す信号を生成する翻訳処理を行い、該翻訳処理結果の信号を、第2指向性スピーカ部24に出力するようにしてもよい。これにより、翻訳結果を再翻訳した結果を聞き、翻訳の妥当性を知ることができる。
In addition, the
また、本実施形態では、第2翻訳開始指示部29は、カメラ31が撮像した画像から、予め決められた形状または被写体の動作の検出を、翻訳開始の指示とするとして説明したが、第2マイクロフォン21が出力する信号を受け、該信号が予め決められた条件(例えば、予め決められた言葉、周波数など)を満たしていることの検出を翻訳開始の指示とするようにしてもよい。
また、本実施形態において、第1翻訳部11は、第1翻訳開始指示部18による翻訳開始の指示を受けると、第1マイクロフォン10からの信号の受付を開始し、続いて翻訳処理を行うとして説明したが、第1翻訳部11は、第1マイクロフォン10からの信号を受け付けて、音声信号あるいは音声認識により変換した文字列を、第1音声記憶部12に記憶させておき、第1翻訳開始指示部18による翻訳開始の指示を受けると、第1音声記憶部12から音声信号あるいは文字列を読み出して、翻訳処理を開始するようにしてもよい。第2翻訳部21についても、上述の第1翻訳部11と同様に、第2翻訳開始指示部29による翻訳開始の指示を受けると、第2音声記憶部23から音声信号あるいは文字列を読み出して、翻訳処理を開始するようにしてもよい。
In the present embodiment, the second translation
In the present embodiment, when the
[第2の実施形態]
以下、図面を参照して、本発明の第2の実施形態について説明する。図4は、本実施形態による音声翻訳装置1aの構成を示す概略ブロック図である。同図において図1の各部に対応する部分には同一の符号(10〜15、18〜26、29〜31)を付け、その説明を省略する。音声翻訳装置1aは、第1マイクロフォン10、第1翻訳部11、第1音声記憶部12、第1指向性スピーカ部13、第1翻訳状態通知部16a、第1翻訳開始指示部18、第2マイクロフォン21、第2翻訳部22、第2音声記憶部23、第2指向性スピーカ部24、第2翻訳状態通知部27a、第2翻訳開始指示部29を具備する。
[Second Embodiment]
The second embodiment of the present invention will be described below with reference to the drawings. FIG. 4 is a schematic block diagram showing the configuration of the
音声翻訳装置1aは、図1の音声翻訳装置1とは、表示部17およびLED28を備えず、第1翻訳状態通知部16および第2翻訳状態通知部27に替えて、第1翻訳状態通知部16aおよび第2翻訳状態通知部27aを具備する点が異なる。第1翻訳状態通知部16aは、第1翻訳部11および第2翻訳部22から通知されて、それらの動作状態を取得し、取得した状態を表す音の信号を生成して、第2指向性制御部25に出力する。これにより、第1翻訳状態通知部16aは、取得した状態を表す音を、第2スピーカ26に指向性を持たせて出力させる。また、第2翻訳状態通知部27aは、第1翻訳部11および第2翻訳部22から通知されて、それらの動作状態を取得し、取得した状態を表す音の信号を生成して、第1指向性制御部14に出力する。これにより、第2翻訳状態通知部27aは、取得した状態を表す音を、第1スピーカ15に指向性を持たせて出力させる。
The
このように、第1翻訳部11、第2翻訳部22の状態を表す音を、第1スピーカ15あるいは第2スピーカ26から指向性を持たせて出力することで、第1の実施形態における音声翻訳装置1のように表示部17およびLED28を備えていなくても、音声翻訳装置1aを使用しているユーザは、これらの状態を把握することができる。
なお、第1翻訳部11および第2翻訳部22の動作状態を、第1の実施形態では第1翻訳状態通知部16が表示部17に表示させて対話者Aに通知し、第2翻訳状態通知部27がLED28を点灯させて対話者Bに通知し、第2の実施形態では第1翻訳状態通知部16aは第2スピーカ26に音声を出力させて対話者Aに通知し、第2翻訳状態通知部27aは第1スピーカ15に音声を出力させて対話者Bに通知するとして説明した。しかし、第1翻訳状態通知部16、16aによる通知は、第2指向性スピーカ部24が音声を出力する方向に向かって行われればよく、第2翻訳状態通知部27、27aによる通知は、第1指向性スピーカ部13が音声を出力する方向に向かって行われればよく、通知の態様は、上述の形態に限定されない。
As described above, the sound representing the state of the
In the first embodiment, the first translation
なお、この図1における第1翻訳部11、第1指向性制御部14、第1翻訳状態通知部16、第1指示検出部19、第2翻訳部22、第2指向性制御部25、第2翻訳状態通知部27、第2指示検出部30、および図4における第1翻訳状態通知部16a、第2翻訳状態通知部27aは専用のハードウェアにより実現されるものであってもよく、また、これらの各部はメモリおよびCPU(中央演算装置)により構成され、各部の機能を実現するためのプログラムをメモリにロードして実行することによりその機能を実現させるものであってもよい。
1, the
また、図1における第1翻訳部11、第1指向性制御部14、第1翻訳状態通知部16、第1指示検出部19、第2翻訳部22、第2指向性制御部25、第2翻訳状態通知部27、第2指示検出部30、および図4における第1翻訳状態通知部16a、第2翻訳状態通知部27aの機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより各部の処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。
In addition, the
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含むものとする。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。 The “computer-readable recording medium” refers to a storage device such as a flexible medium, a magneto-optical disk, a portable medium such as a ROM and a CD-ROM, and a hard disk incorporated in a computer system. Furthermore, the “computer-readable recording medium” dynamically holds a program for a short time, like a communication line when transmitting a program via a network such as the Internet or a communication line such as a telephone line. In this case, a volatile memory in a computer system serving as a server or a client in that case is also used to hold a program for a certain period of time. The program may be a program for realizing a part of the functions described above, and may be a program capable of realizing the functions described above in combination with a program already recorded in a computer system.
以上、この発明の実施形態を図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計変更等も含まれる。 The embodiment of the present invention has been described in detail with reference to the drawings. However, the specific configuration is not limited to this embodiment, and includes design changes and the like within a scope not departing from the gist of the present invention.
本発明は、携帯電話端末、PDA(Personal Digital Assistants;携帯情報端末)、電子辞書装置などの携帯情報機器に用いて好適であるが、これらに限定されない。 The present invention is suitable for use in portable information devices such as mobile phone terminals, PDAs (Personal Digital Assistants), and electronic dictionary devices, but is not limited thereto.
1、1a…音声翻訳装置
10…第1マイクロフォン
11…第1翻訳部
12…第1音声記憶部
13…第1指向性スピーカ部
14…第1指向性制御部
15…第1スピーカ
16、16a…第1翻訳状態通知部
17…表示部
18…第1翻訳開始指示部
19…第1指示検出部
20…操作部
21…第2マイクロフォン
22…第2翻訳部
23…第2音声記憶部
24…第2指向性スピーカ部
25…第2指向性制御部
26…第2スピーカ
27、27a…第2翻訳状態通知部
28…LED
29…第2翻訳開始指示部
30…第2指示検出部
31…カメラ
DESCRIPTION OF
29 ... Second translation
Claims (11)
前記第1マイクロフォンが出力する信号を受け、該信号が表す音声を第2の言語に変換した音声を表す信号を生成する翻訳処理を行い、該翻訳処理結果の信号を出力する第1翻訳部と、
前記第1翻訳部が出力した信号の音声を出力する第1スピーカ部と、
第2の言語による音声を収音し、該収音した音声を信号に変換して出力する第2マイクロフォンと、
前記第2マイクロフォンが出力する信号を受け、該信号が表す音声を第1の言語に変換した音声を表す信号を生成する翻訳処理を行い、該翻訳処理結果の信号を出力する第2翻訳部と、
前記第2翻訳部が出力した信号の音声を出力する第2スピーカ部と
を具備し、
前記第1マイクロフォンが最も効率良く収音可能な音源の方向と、前記第2スピーカ部が音声を出力する方向とが略一致し、
前記第2マイクロフォンが最も効率良く収音可能な音源の方向と、前記第1スピーカ部が音声を出力する方向とが略一致していることを特徴とする音声翻訳装置。 A first microphone that collects sound in a first language, converts the collected sound into a signal, and outputs the signal;
A first translation unit which receives a signal output from the first microphone, performs a translation process for generating a signal representing a voice obtained by converting the voice represented by the signal into a second language, and outputs a signal of the translation process result; ,
A first speaker unit that outputs a sound of a signal output by the first translation unit;
A second microphone that collects sound in a second language, converts the collected sound into a signal, and outputs the signal;
A second translation unit that receives a signal output from the second microphone, performs a translation process for generating a signal representing a voice obtained by converting the voice represented by the signal into a first language, and outputs a signal of the translation process result; ,
A second speaker unit that outputs the sound of the signal output by the second translation unit;
The direction of the sound source that the first microphone can collect sound most efficiently coincides with the direction in which the second speaker unit outputs sound,
A speech translation apparatus, wherein a direction of a sound source that can be most efficiently picked up by the second microphone and a direction in which the first speaker unit outputs a sound substantially coincide with each other.
第1翻訳部が前記第1マイクロフォンから翻訳対象の信号を受け取り中であることを、前記第1スピーカ部が音声を出力する方向に通知する第2翻訳状態通知部と
を具備することを特徴とする請求項2に記載の音声翻訳装置。 A first translation state notifying unit for notifying that the second speaker unit is receiving a signal to be translated from the second microphone in a direction in which the second speaker unit outputs sound;
A second translation state notifying unit for notifying that the first speaker unit is receiving a signal to be translated from the first microphone in a direction in which the first speaker unit outputs a voice; The speech translation apparatus according to claim 2.
前記第2翻訳部が翻訳処理中であることを、前記第1スピーカ部が音声を出力する方向に通知する第2翻訳状態通知部と
を具備することを特徴とする請求項2に記載の音声翻訳装置。 A first translation state notifying unit for notifying that the first translation unit is performing a translation process in a direction in which the second speaker unit outputs audio;
The voice according to claim 2, further comprising: a second translation state notifying unit that notifies that the second speaker is performing a translation process in a direction in which the first speaker unit outputs the voice. Translation device.
前記第2翻訳部が翻訳処理結果の音声の信号を出力中であることを、前記第1スピーカ部が音声を出力する方向に通知する第2翻訳状態通知部と
を具備することを特徴とする請求項2に記載の音声翻訳装置。 A first translation state notifying unit for notifying that the second speaker unit is outputting a voice that the first translation unit is outputting a speech signal of the translation processing result;
A second translation state notifying unit for notifying that the second speaker is outputting a speech signal as a result of translation processing in a direction in which the first speaker unit outputs the sound. The speech translation apparatus according to claim 2.
前記第2スピーカ部は、前記第2翻訳部が出力した信号の音声に加えて、前記第1翻訳部が出力した信号の音声を出力すること
を特徴とする請求項2に記載の音声翻訳装置。 The first speaker unit outputs the audio of the signal output by the second translation unit in addition to the audio of the signal output by the first translation unit,
3. The speech translation apparatus according to claim 2, wherein the second speaker unit outputs the speech of the signal output from the first translation unit in addition to the speech of the signal output from the second translation unit. .
前記第2翻訳部は、さらに前記第1翻訳部が翻訳処理した結果の信号を受け、該信号が表す音声を第1の言語に変換した音声を表す信号を生成する翻訳処理を行い、該翻訳処理結果の信号を出力すること
を特徴とする請求項2に記載の音声翻訳装置。 The first translation unit further receives a signal obtained as a result of translation processing by the second translation unit, performs a translation process for generating a signal representing a voice obtained by converting the voice represented by the signal into a second language, Output the processing result signal,
The second translation unit further receives a signal obtained as a result of the translation processing by the first translation unit, performs a translation process for generating a signal representing a voice obtained by converting the voice represented by the signal into a first language, and The speech translation apparatus according to claim 2, wherein a signal of a processing result is output.
前記第2翻訳部による翻訳処理の開始指示を受けつける第2翻訳開始指示部と
を具備し、
前記第1翻訳部は、前記第1翻訳開始指示部が翻訳開始の指示を受けると、前記第1マイクロフォンが出力する信号を受けて第1の言語に変換する翻訳処理を開始し、
前記第2翻訳部は、前記第2翻訳開始指示部が翻訳開始の指示を受けると、前記第1マイクロフォンが出力する信号を受けて第1の言語に変換する翻訳処理を開始すること
を特徴とする請求項1に記載の音声翻訳装置。 A first translation start instruction unit for receiving an instruction to start translation processing by the first translation unit;
A second translation start instruction unit for receiving an instruction to start translation processing by the second translation unit;
When the first translation start instruction unit receives an instruction to start translation, the first translation unit starts a translation process of receiving a signal output from the first microphone and converting it into a first language;
When the second translation start instruction unit receives an instruction to start translation, the second translation unit starts a translation process of receiving a signal output from the first microphone and converting it into a first language. The speech translation apparatus according to claim 1.
を特徴とする請求項8に記載の音声翻訳装置。 The said 2nd translation start instruction | indication part is provided with the imaging part which images the output direction of the said 1st speaker part, and detects the said instruction | indication of the said translation start from the imaging result by this imaging part. Speech translation device.
を特徴とする請求項8に記載の音声翻訳装置。 The speech translation apparatus according to claim 8, wherein the second translation start instruction unit receives a signal output from the second microphone and detects the instruction to start translation from the signal.
前記音声翻訳装置の第1のマイクロフォンが、第1の言語による音声を収音し、該収音した音声を信号に変換して出力する第1の過程と、
前記音声翻訳装置が、前記第1の過程にて出力した信号を受け、該信号が表す音声を第2の言語に変換した音声を表す信号を生成する翻訳処理を行い、該翻訳処理結果の信号を出力する第2の過程と、
前記音声翻訳装置が、前記第2の過程にて出力した信号の音声を、前記音声翻訳装置の第2マイクロフォンが最も効率良く収音可能な音源の方向と略一致する方向に出力する第3の過程と、
前記音声翻訳装置の第2のマイクロフォンが、第2の言語による音声を収音し、該収音した音声を信号に変換して出力する第4の過程と、
前記音声翻訳装置が、前記第4の過程にて出力した信号を受け、該信号が表す音声を第1の言語に変換した音声を表す信号を生成する翻訳処理を行い、該翻訳処理結果の信号を出力する第5の過程と、
前記音声翻訳装置が、前記第5の過程にて出力した信号の音声を、前記第1マイクロフォンが最も効率良く収音可能な音源の方向と略一致する方向に出力する第6の過程と
有することを特徴とする音声翻訳方法。 In a speech translation method in a speech translation device,
A first process in which a first microphone of the speech translation apparatus collects speech in a first language, converts the collected speech into a signal, and outputs the signal;
The speech translation apparatus receives the signal output in the first process, performs a translation process for generating a signal representing the speech converted from the speech represented by the signal into a second language, and outputs a signal of the translation process result A second process of outputting
The speech translation device outputs the speech of the signal output in the second process in a direction substantially coincident with the direction of the sound source that the second microphone of the speech translation device can collect most efficiently. Process,
A fourth step in which the second microphone of the speech translation apparatus collects the speech in the second language, converts the collected speech into a signal, and outputs the signal;
The speech translation apparatus receives the signal output in the fourth process, performs a translation process for generating a signal representing the speech converted from the speech represented by the signal into the first language, and outputs a signal of the translation process result A fifth process of outputting
A sixth process in which the speech translation apparatus outputs the speech of the signal output in the fifth process in a direction substantially coincident with the direction of the sound source that the first microphone can collect most efficiently. A speech translation method characterized by the above.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008187011A JP2010026220A (en) | 2008-07-18 | 2008-07-18 | Voice translation device and voice translation method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008187011A JP2010026220A (en) | 2008-07-18 | 2008-07-18 | Voice translation device and voice translation method |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010026220A true JP2010026220A (en) | 2010-02-04 |
Family
ID=41732117
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008187011A Pending JP2010026220A (en) | 2008-07-18 | 2008-07-18 | Voice translation device and voice translation method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2010026220A (en) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2357384A1 (en) | 2010-02-09 | 2011-08-17 | JATCO Ltd | Oil pump with air vent structure |
KR20150056690A (en) * | 2013-11-15 | 2015-05-27 | 삼성전자주식회사 | Method for recognizing a translatable situation and performancing a translatable function and electronic device implementing the same |
JP2016177782A (en) * | 2015-03-19 | 2016-10-06 | パナソニックIpマネジメント株式会社 | Wearable device and translation system |
WO2017086434A1 (en) * | 2015-11-18 | 2017-05-26 | 株式会社リクルートライフスタイル | Speech translation program, speech translation device, and control method for same |
JP2019062513A (en) * | 2017-09-22 | 2019-04-18 | 丁紹傑 | mobile phone |
KR20190140589A (en) * | 2018-06-12 | 2019-12-20 | 박해연 | Portable Wi-Fi routing device providing two-way interpretation function |
JPWO2021006303A1 (en) * | 2019-07-10 | 2021-01-14 | ||
US11295755B2 (en) | 2018-08-08 | 2022-04-05 | Fujitsu Limited | Storage medium, sound source direction estimation method, and sound source direction estimation device |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005107595A (en) * | 2003-09-26 | 2005-04-21 | Nec Corp | Automatic translation device |
JP2005222136A (en) * | 2004-02-03 | 2005-08-18 | Seiko Epson Corp | Interactive translation device |
-
2008
- 2008-07-18 JP JP2008187011A patent/JP2010026220A/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005107595A (en) * | 2003-09-26 | 2005-04-21 | Nec Corp | Automatic translation device |
JP2005222136A (en) * | 2004-02-03 | 2005-08-18 | Seiko Epson Corp | Interactive translation device |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2357384A1 (en) | 2010-02-09 | 2011-08-17 | JATCO Ltd | Oil pump with air vent structure |
KR20150056690A (en) * | 2013-11-15 | 2015-05-27 | 삼성전자주식회사 | Method for recognizing a translatable situation and performancing a translatable function and electronic device implementing the same |
KR102256291B1 (en) * | 2013-11-15 | 2021-05-27 | 삼성전자 주식회사 | Method for recognizing a translatable situation and performancing a translatable function and electronic device implementing the same |
JP2016177782A (en) * | 2015-03-19 | 2016-10-06 | パナソニックIpマネジメント株式会社 | Wearable device and translation system |
WO2017086434A1 (en) * | 2015-11-18 | 2017-05-26 | 株式会社リクルートライフスタイル | Speech translation program, speech translation device, and control method for same |
JP2019062513A (en) * | 2017-09-22 | 2019-04-18 | 丁紹傑 | mobile phone |
KR20190140589A (en) * | 2018-06-12 | 2019-12-20 | 박해연 | Portable Wi-Fi routing device providing two-way interpretation function |
KR102124808B1 (en) * | 2018-06-12 | 2020-07-23 | (주)메타콤 | Portable Wi-Fi routing device providing two-way interpretation function |
US11295755B2 (en) | 2018-08-08 | 2022-04-05 | Fujitsu Limited | Storage medium, sound source direction estimation method, and sound source direction estimation device |
JPWO2021006303A1 (en) * | 2019-07-10 | 2021-01-14 | ||
WO2021006303A1 (en) * | 2019-07-10 | 2021-01-14 | 日本電気株式会社 | Translation system, translation device, translation method, and translation program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2010026220A (en) | Voice translation device and voice translation method | |
US9111545B2 (en) | Hand-held communication aid for individuals with auditory, speech and visual impairments | |
US20220277752A1 (en) | Voice interaction method and related apparatus | |
US8082152B2 (en) | Device for communication for persons with speech and/or hearing handicap | |
KR100819928B1 (en) | Voice recognition device of mobile terminal and its method | |
US20140171036A1 (en) | Method of communication | |
WO2013077110A1 (en) | Translation device, translation system, translation method and program | |
JP2000068882A (en) | Wireless communication device | |
KR101846218B1 (en) | Language interpreter, speech synthesis server, speech recognition server, alarm device, lecture local server, and voice call support application for deaf auxiliaries based on the local area wireless communication network | |
CN113488042A (en) | Voice control method and electronic equipment | |
JP2004214895A (en) | Auxiliary communication apparatus | |
JP2013191103A (en) | Electronic device and program | |
JP5733566B2 (en) | Translation apparatus, translation method, and program | |
KR20060043271A (en) | Input device | |
EP4418264A1 (en) | Speech interaction method and terminal | |
JP2004015250A (en) | Mobile terminal | |
JP2011150657A (en) | Translation voice reproduction apparatus and reproduction method thereof | |
JP2009302824A (en) | Voice communication system | |
WO2017187674A1 (en) | Information processing device, information processing system, and program | |
JP7293863B2 (en) | Speech processing device, speech processing method and program | |
CN115514843B (en) | Alarm method and device, equipment and storage medium | |
WO2006001204A1 (en) | Automatic translation device and automatic translation method | |
CN119233037A (en) | Video data processing method, electronic device and readable medium | |
JP2000184077A (en) | Intercom system | |
JP2004179937A (en) | Door phone equipment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100826 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111108 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111115 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20120321 |