WO2011036769A1

WO2011036769A1 - 翻訳装置、及びプログラム

Info

Publication number: WO2011036769A1
Application number: PCT/JP2009/066677
Authority: WO
Inventors: 一男住田; 康顕有賀; 哲朗知野
Original assignee: 株式会社東芝
Priority date: 2009-09-25
Filing date: 2009-09-25
Publication date: 2011-03-31
Also published as: US20120221323A1; US8583417B2; JPWO2011036769A1; JP5221768B2

Abstract

　対訳記憶部５２は、第１言語及び第２言語の文を対応付けた対訳とＩＤとを対応付けて記憶する。翻訳部７０は、対訳を用いて第１文を第２言語に翻訳する。次発話テーブル記憶部５４は、ＩＤを有し、ＩＤが示す対訳に含まれる第１言語の文か第２言語の文かを識別する第１識別情報と、第１識別情報が示す文の次発話として過去に対訳記憶部から選択された文を識別する第２識別情報と、を対応付けた次発話テーブルを記憶する。取得部７５は、次発話テーブルを参照し、第１文の第１識別情報に対応付けられた第２識別情報が示す文である次発話候補を対訳記憶部から取得する。表示部１０は、第１文、第１文の翻訳結果、及び次発話候補を表示する。選択受付部６０は、次発話候補の選択を受け付ける。翻訳部は、選択された次発話候補が第１言語の場合、第２言語に翻訳し、選択された次発話候補が第２言語の場合、第１言語に翻訳する。

Description

翻訳装置、及びプログラム

　本発明は、翻訳装置、及びプログラムに関する。

　近年、文化や経済のグローバル化に伴い、異なる言語を母語とする人同士のコミュニケーションを支援する翻訳装置への期待が高まっている。例えば特許文献１には、利用者の過去の対話履歴をデータベースに格納し、この対話履歴を参照して利用者の次発話を予測し、提示する技術が開示されている。

特許第３９６２７６６号公報

　しかしながら、特許文献１に開示された技術では、対話支援装置の使用回数に比例して対話履歴のデータ量が増大するため、大容量の記憶装置が必要となり、コストの増大を招いてしまう。

　本発明は、上記に鑑みてなされたものであり、低コストで利用者の次発話を予測することができる翻訳装置、及びプログラムを提供することを目的とする。

　本発明の翻訳装置は、意味内容が同義の第１言語の文及び第２言語の文を対応付けた対訳と、前記対訳のＩＤとを、対応付けて複数記憶する対訳記憶部と、選択された前記第１言語の第１文を、前記対訳を用いて前記第２言語に翻訳する翻訳部と、前記ＩＤを有し、前記ＩＤが示す前記対訳に含まれる前記第１言語の文か前記第２言語の文かを識別する第１識別情報と、前記第１識別情報が示す文の次発話として過去に前記対訳記憶部から選択された文を識別する第２識別情報と、を対応付けた次発話テーブルを記憶する次発話テーブル記憶部と、前記次発話テーブルを参照し、前記第１文の前記第１識別情報に対応付けられた前記第２識別情報が示す文である次発話候補を前記対訳記憶部から取得する取得部と、前記第１文、前記第１文の翻訳結果、及び前記次発話候補を表示する表示部と、前記次発話候補の選択を受け付ける選択受付部と、を備え、前記翻訳部は、選択された前記次発話候補が前記第１言語の場合、前記対訳を用いて前記第２言語に翻訳し、選択された前記次発話候補が前記第２言語の場合、前記対訳を用いて前記第１言語に翻訳することを特徴とする。

　本発明によれば、低コストで利用者の次発話を予測することができるという効果を奏する。

第１実施形態の翻訳装置の概要の説明図。第１実施形態の翻訳装置の概要の説明図。第１実施形態の翻訳装置を示すブロック図。初期画面例を示す図。第１実施形態の対訳の例を示す図。次発話テーブルの例を示す図。次発話の候補例を示す図。次発話の候補例を示す図。次発話の候補の画面表示例を示す図。次発話の候補の画面表示例を示す図。第１実施形態の翻訳装置の処理例を示すフローチャート。第１実施形態の翻訳装置の次発話候補取得処理例を示すフローチャート。第２実施形態の翻訳装置を示すブロック図。意味カテゴリ辞書の例を示す図。第２実施形態の検索処理例を示すフローチャート。第２実施形態の対訳の例を示す図。第２実施形態の対訳の例を示す図。第１、２実施形態の翻訳装置のハードウェア構成図。

　以下、添付図面を参照しながら、本発明の翻訳装置、及びプログラムの実施形態を詳細に説明する。なお、以下の各実施形態では、第１言語に日本語を用い、第２言語に英語を用いた場合を例にとり説明するが、翻訳形態はこれに限定されるものではなく、あらゆる言語間での翻訳に適用することができる。

（第１実施形態）
　まず、図１及び図２を参照しながら、第１の実施形態の翻訳装置の概要を説明する。図１及び図２に示す例では、日本語を母語とするユーザＪと英語を母語とするユーザＥとが翻訳装置１を利用してコミュニケーションを行う様子を示しており、詳細には、日本語を母語とするユーザＪがマイク１１から音声を入力し、音声認識結果を次発話として選択した後の状態を示している。

　ディスプレイ１２には、マイク１１から入力された音声の音声認識結果であってタッチペン１３により次発話として選択された日本語文１５が表示されるとともに、日本語文１５の次発話の候補として日本語文１６～１８が表示されている。この後、ユーザＪは、ディスプレイ１２に表示された日本語文１６～１８のいずれかをタッチペン１３で選択したり、新たな発話を行ってマイク１１から音声を入力することにより、次発話を行う。なお、ユーザＥにより次発話が行われた場合には、その翻訳結果がスピーカ１４から音声出力される。

　ディスプレイ２２には、日本語文１５の翻訳結果である英語文２５が表示されるとともに、日本語文１５の次発話の候補として英語文２６～２８が表示されている。なお、日本語文１５の翻訳結果は、スピーカ２４からも音声出力される。この後、ユーザＥは、ディスプレイ２２に表示された英語文２６～２８のいずれかをタッチペン２３で選択したり、新たな発話を行ってマイク２１から音声を入力することにより、次発話を行う。

　次に、第１の実施形態の翻訳装置の構成を説明する。

　図３は、第１実施形態の翻訳装置１の構成の一例を示すブロック図である。図３に示すように、翻訳装置１は、表示部１０と、選択部２０と、入力部３０と、音声出力部４０と、記憶部５０と、選択受付部６０と、更新部６５と、翻訳部７０と、取得部７５と、出力制御部８０と、入力受付部８５と、認識部９０と、検索部９５とを備える。

　表示部１０は、後述する出力制御部８０の指示により、翻訳結果、次発話の候補、及び音声認識結果などを表示するものであり、例えば、タッチパネル式ディスプレイ、液晶ディスプレイ、又は有機ＥＬディスプレイなどの既存の表示装置により実現できる。また、表示部１０は、翻訳装置１が起動されると、初期画面を表示する。

　図４は、初期画面の一例を示す図である。図４に示す例では、日本語表示画面１００の候補表示エリア１１０に、ユーザＪにより最初に発話される可能性の高い日本語の挨拶文などが候補として表示されている。同様に、英語表示画面２００の候補表示エリア２１０に、ユーザＥにより最初に発話される可能性の高い英語の挨拶文などが候補として表示されている。なお、日本語表示画面１００は、図１に示すディスプレイ１２に表示される画面であり、英語表示画面２００は、図２に示すディスプレイ２２に表示される画面である。

　図３に戻り、選択部２０は、表示部１０に表示された候補の中から次発話を選択するものであり、タッチパネル式ディスプレイ、又はポインティングデバイスなどの既存の入力装置により実現できる。なお、表示部１０及び選択部２０は、タッチパネル式ディスプレイなどにより一体的に実現してもよい。

　入力部３０は、ユーザＪやユーザＥが発話する音声などを入力するものであり、例えば、マイクなどの既存の音声入力装置により実現できる。

　音声出力部４０は、後述する出力制御部８０の指示により、翻訳結果などを音声出力するものであり、スピーカなどの既存の音声出力装置により実現できる。

　記憶部５０は、翻訳装置１で実行される各種プログラムや翻訳装置１で行われる各種処理に使用される情報などを記憶するものである。記憶部５０は、例えば、ＨＤＤ（Hard　Disk　Drive）、ＳＳＤ（Solid　State　Drive）、メモリカード、光ディスク、ＲＯＭ（Read　Only　Memory）、ＲＡＭ（Random　Access　Memory）などの磁気的、光学的、又は電気的に記憶可能な既存の記憶装置により実現できる。そして、記憶部５０は、対訳記憶部５２と、次発話テーブル記憶部５４とを含む。

　対訳記憶部５２は、意味内容が同義の日本語文及び英語文を対応付けた対訳と、対訳のＩＤとを、対応付けて複数記憶する。図５は、対訳記憶部５２に記憶されている対訳の一例を示す図である。図５に示す例では、対訳記憶部５２は、対訳を特定するＩＤと、対訳を構成する日本語文と、日本語文の使用頻度と、対訳を構成する英語文と、英語文の使用頻度とを対応付けて記憶している。例えば、ＩＤが００００１の対訳の場合、日本語文が日本語文１２０、日本語文１２０の使用頻度が３９０回、英語文が英語文２２０、英語文２２０の使用頻度が２３８回であることを表している。同様に、ＩＤが００００９の対訳の場合、日本語文が日本語文１２１、日本語文１２１の使用頻度が０回、英語文が英語文２２１、英語文２２１の使用頻度が１１５回であることを表している。

　図３に戻り、次発話テーブル記憶部５４は、ＩＤを識別するとともにＩＤが示す対訳を構成する第１言語の文か第２言語の文かを識別する第１識別情報と、第１識別情報が示す文の次発話として過去に対訳記憶部５２から選択された文を識別する第２識別情報とを対応付けた次発話テーブルを記憶する。

　図６は、次発話テーブル記憶部５４に記憶されている次発話テーブルの一例を示す図である。図６に示す例では、次発話テーブル記憶部５４は、第１識別情報と、第２識別情報と、頻度情報とを対応付けた次発話テーブルを記憶している。頻度情報は、第１識別情報が示す文の次発話として第２識別情報が示す文が選択された頻度を示す情報であり、選択頻度と、合計頻度とを含む。選択頻度は、第１識別情報が示す文の次発話として第２識別情報が示す文が選択された回数を表し、合計頻度は、第１識別情報が示す文の次発話として第２識別情報が示す文と同じ言語の文が選択された回数を表す。なお、第１識別情報には、対訳記憶部５２に記憶されている対訳を特定するＩＤ１と対訳の言語を示す言語種別１が含まれ、第２識別情報には、対訳記憶部５２に記憶されている対訳を特定するＩＤ２と対訳の言語を示す言語種別２が含まれている。

　例えば、図６に示す対訳テーブルの１行目のエントリ１３０は、ＩＤ１が００００１、言語種別１がＪ、ＩＤ２が００００１、言語種別２がＥ、選択頻度が４９回、合計頻度が２５５回である。そして、図５に示すように、対訳のＩＤが００００１の日本語文は日本語文１２０であり、対訳のＩＤが００００１の英語文は英語文２２０である。従って、エントリ１３０は、日本語文１２０の次発話として英語文２２０が選択された回数が４９回であること、及び日本語文１２０の次発話として何らかの英語文が選択された回数が２５５回であることを表している。

　また、図６に示す対訳テーブルの６行目のエントリ１３１は、ＩＤ１が００００４、言語種別１がＪ、ＩＤ２が００００９、言語種別２がＥ、選択頻度が３０回、合計頻度が２２９回である。そして、図５に示すように、対訳のＩＤが００００４の日本語文は日本語文１１２であり、対訳のＩＤが００００９の英語文は英語文２２１である。従って、エントリ１３１は、日本語文１１２の次発話として英語文２２１が選択された回数が３０回であること、及び日本語文１１２の次発話として何らかの英語文が選択された回数が２２９回であることを表している。

　図３に戻り、選択受付部６０は、選択部２０からの選択を受け付ける。例えば、図４において、選択部２０により日本語文１１２が次発話として選択された場合、選択受付部６０は、日本語文１１２の選択を受け付ける。

　更新部６５は、次発話テーブルを参照して、前回選択を受け付けた文の第１識別情報と今回選択を受け付けた文の第２識別情報とに対応付けられた頻度情報を更新する。具体的には、更新部６５は、前回選択を受け付けた文の第１識別情報と今回選択を受け付けた文の第２識別情報とに対応付けられた頻度情報の選択頻度と合計頻度とをインクリメントする。また更新部６５は、前回選択を受け付けた文の第１識別情報と、今回選択を受け付けた文と同じ言語の文の第２識別情報と、に対応付けられた頻度情報の合計頻度をインクリメントする。更に、更新部６５は、対訳記憶部５２に記憶されている対訳を参照して、今回選択を受け付けた文の使用頻度をインクリメントする。

　例えば、図４において、選択部２０により日本語文１１２が次発話として選択された場合、更新部６５は、図５に示す対訳を参照して、今回選択を受け付けた日本語文１１２の使用頻度をインクリメントする。なお、図４では、前回選択を受け付けた文が存在しないため、更新部６５は、図６に示す次発話テーブルの選択頻度及び合計頻度を更新しない。

　翻訳部７０は、対訳記憶部５２に記憶されている対訳を用いて、選択受付部６０により選択が受け付けられた文を翻訳する。具体的には、選択受付部６０により日本語文の選択が受け付けられた場合、翻訳部７０は、日本語文を英語に翻訳する。また、選択受付部６０により英語文の選択が受け付けられた場合、翻訳部７０は、英語文を日本語に翻訳する。なお、後述の認識部９０により音声認識された認識結果が対訳中に存在しない場合には、翻訳部７０は、認識結果を機械翻訳する。

　取得部７５は、次発話テーブル記憶部５４に記憶されている次発話テーブルを参照し、選択受付部６０により選択が受け付けられた文の第１識別情報に対応付けられた複数の第２識別情報それぞれが示す日本語及び英語の文を対訳記憶部５２から取得する。具体的には、取得部７５は、次発話テーブルを参照し、選択受付部６０により選択が受け付けられた文の第１識別情報に対応付けられた複数の第２識別情報それぞれが示す日本語文を、頻度情報が示す頻度が高い順に所定数の範囲内で対訳記憶部５２から取得する。同様に、取得部７５は、次発話テーブルを参照し、選択受付部６０により選択が受け付けられた文の第１識別情報に対応付けられた複数の第２識別情報それぞれが示す英語文を、頻度情報が示す頻度が高い順に所定数の範囲内で対訳記憶部５２から取得する。

　例えば、図４において、選択受付部６０により日本語文１１２の選択が受け付けられた場合、取得部７５は、次発話テーブルを参照し、日本語文１１２を示す第１識別情報に対応付けられた第２識別情報のうち言語種別２がＪであるエントリのスコアを、数式（１）を用いて求める。そして、取得部７５は、算出されたスコア（頻度）が高い順に所定数の範囲内で対訳記憶部５２から第２識別情報が示す文を取得する。この場合、取得部７５は、ＩＤ１が００００４、言語種別１がＪ、ＩＤ２が００００８、及び言語種別２がＪであるエントリ１３３のスコアと、ＩＤ１が００００４、言語種別１がＪ、ＩＤ２が００４３９、及び言語種別２がＪであるエントリ１３４のスコアとを求める。そして、取得部７５は、対訳記憶部５２からＩＤが００００８の日本語文、ＩＤが００４３９の日本語文の順に取得し、日本語文の次発話の候補に追加する。なお、図４において、選択受付部６０により日本語文１１２の選択が受け付けられた場合、取得部７５は、日本語文１１２を示す第１識別情報に対応付けられた第２識別情報のうち言語種別２がＥであるエントリについても同様の処理を行い、英語文の次発話の候補に追加する。

　（ｓ_ｉ，ｌ_ｉ）はＩＤ２及び言語種別２を示し、（ｓ_ｊ，ｌ_ｊ）はＩＤ１及び言語種別１を示し、Ｆｒｅｑ（（ｓ_ｊ，ｌ_ｊ））は合計頻度を示し、Ｆｒｅｑ（（ｓ_ｉ，ｌ_ｉ），（ｓ_ｊ，ｌ_ｊ））は選択頻度を示す。つまり、数式（１）では、合計頻度に対する選択頻度の割合を求める。

　また、取得部７５は、取得した日本語文の数が所定数に満たない場合には、更に、数式（２）を用いて、対訳記憶部５２に記憶されている対訳の日本語文のスコアを求め、算出されたスコアが高い順に所定数の範囲内で対訳記憶部５２から第２識別情報が示す日本語文を取得する。但し、取得部７５は、既に取得済みの第２識別情報が示す文については取得しない。ここでは取得部７５は、対訳記憶部５２からＩＤが００００１の日本語文、ＩＤが００００５の日本語文、ＩＤが００００６の日本語文、ＩＤが００００７の日本語文の順に取得し、候補に追加する。なお、取得部７５は、取得した英語文の数が所定数に満たない場合にも同様の処理を行い、英語文の次発話の候補である候補に追加する。

　Ｓｍは、数式（１）で求めたスコアの最小値であり（但し、対象となるエントリが存在せず、数式（１）を用いてスコアが求められなかった場合は、１）、ｂは係数であり、ｍａｘ（Ｆｒｅｑ（（ｓ_ｉ，ｌ_ｉ）））は使用頻度の最大値を示し、Ｆｒｅｑ（（ｓ_ｉ，ｌ_ｉ））は使用頻度を示す。なお、係数ｂの値は、数式（１）で求めたスコアの最小値を超えないようにするため、１未満の値（例えば、０）にすることが望ましい。

　このようにして次発話の候補を取得することにより、次発話テーブルから求めた文に矛盾せず、使用頻度の高い文を次発話の候補に追加することができる。

　図７は、取得部７５により取得された日本語文の次発話の候補の一例を示す図である。図７に示す例では、ＩＤが００００８の日本語文、ＩＤが００４３９の日本語文、ＩＤが００００１の日本語文、ＩＤが００００５の日本語文、ＩＤが００００６の日本語文、ＩＤが００００７の日本語文というスコアの高い順に候補に追加されている。なお、図７に示す例では、ＩＤが００００１の日本語文、及びＩＤが００００５の日本語文のスコアは数式（１）で求められ、他の日本語文のスコアは数式（２）で求められている。

　図８は、取得部７５により取得された英語文の次発話の候補の一例を示す図である。図８に示す例では、ＩＤが００００９の英語文、ＩＤが０００１０の英語文、ＩＤが００９２１の英語文、ＩＤが０１２１９の英語文、ＩＤが０００８６の英語文、ＩＤが０２０５５の英語文というスコアの高い順に候補に追加されている。なお、図８に示す例では、いずれの英語文のスコアも数式（１）で求められている。

　図３に戻り、出力制御部８０は、表示部１０に対する表示制御や音声出力部４０に対する音声制御を行うものであり、表示制御部８２と、音声制御部８４とを含む。なお、出力制御部８０は、以下で説明する表示出力及び音声出力を必要に応じて切り替えるようにしてもよいし、併用するようにしてもよい。

　表示制御部８２は、選択受付部６０により選択が受け付けられた文、選択受付部６０により選択が受け付けられた文の翻訳結果を表示部１０に表示させる。また、表示制御部８２は、取得部７５により取得された日本語文を日本語の次発話の候補として表示部１０に表示させ、取得部７５により取得された英語文を英語の次発話の候補として表示部１０に表示させる。また、表示制御部８２は、後述の認識部９０の認識結果等も表示部１０に表示させるが、詳細は後述する。

　図９は、取得部７５により取得された文を次発話の候補として表示した画面の一例を示す図である。図９に示す例では、日本語表示画面１００の対話履歴表示エリア１４０に日本語文１１２が表示され、候補表示エリア１１０に、図７に示す日本語文が日本語の次発話の候補として表示されている。同様に、英語表示画面２００の対話履歴表示エリア２４０に日本語文１１２の翻訳結果である英語文２１２が表示され、候補表示エリア２１０に、図８に示す英語文が英語の次発話の候補として表示されている。

　図３に戻り、音声制御部８４は、選択受付部６０により選択が受け付けられた文の翻訳結果などを音声出力部４０に出力させる。具体的には、音声制御部８４は、翻訳結果を音声信号に変換する音声合成処理を行い、音声合成処理により生成した音声信号をＤＡ変換して音声出力部４０に音声出力させる。

　入力受付部８５は、入力部３０から日本語又は英語の音声の入力を受け付ける。具体的には、入力受付部８５は、入力部３０から入力された音声のアナログ信号に対してサンプリングを行って、ステレオのデジタル信号に変換する。なお、デジタル信号への変換には、例えば、ＡＤ変換など既存の技術を用いることができる。

　認識部９０は、入力受付部８５により受け付けられた音声を認識し、認識した音声の文字列を生成する。例えば、入力受付部８５により受け付けられた音声が日本語の場合、認識部９０は、音声を認識して日本語の文字列を生成し、入力受付部８５により受け付けられた音声が英語の場合、認識部９０は、音声を認識して英語の文字列を生成する。具体的には、認識部９０は、入力受付部８５により変換されたデジタル信号から、音声を構成する音素を判別するための音響的な特徴を示す特徴量を時系列で抽出する。そして認識部９０は、抽出した特徴量の時系列に基づいて、入力受付部８５により受け付けられた音声に対して確からしい文字列や単語列を生成する。

　なお、特徴量の抽出には、ＦＦＴ（高速フーリエ変換）に基づく周波数スペクトル分析、線形予測分析、又はケプストラム分析などの既存の手法を用いることができる。これらの手法では、連続する音声波形の短い時間区間を切り出し処理することにより、分析対象とした時間区間における特徴量を抽出でき、分析の時間区間を順次シフトさせていくことにより、特徴量を時系列で抽出できる。特徴量の抽出、及び文字列や単語列の生成の詳細な手法については、例えば、「鹿野清宏他編、“音声認識システム”、オーム社出版局、２００１」などで開示されている方法を用いることができる。

　検索部９５は、認識部９０に認識された文と類似する文を対訳記憶部５２から検索する。具体的には、入力受付部８５により受け付けられた音声が日本語の場合、検索部９５は、認識部９０により生成された日本語の文字列に類似する日本語文を対訳記憶部５２から検索する。また、入力受付部８５により受け付けられた音声が英語の場合、検索部９５は、認識部９０により生成された英語の文字列に類似する英語文を対訳記憶部５２から検索する。例えば、検索部９５は、数式（３）に示すＤｉｃｅ係数、数式（４）に示すＪａｃｃａｒｄ係数、又は数式（５）に示すコサイン係数などを用いて、文同士の類似度を算出する。

　なお、数式（３）～数式（５）において、σ（ｓ_ｘ，ｓ_ｙ）は、文ｓ_ｘと文ｓ_ｙとの類似度を表し、ｘ_ｉ、ｙ_ｉは、それぞれ文ｓ_ｘ、文ｓ_ｙの単語の有無を表す。文ｓ_ｘ又は文ｓ_ｙに含まれる１番目からＴ番目までの単語に対し、文ｓ_ｘにｉ番目の単語が存在すればｘ_ｉは１、存在しなければｘ_ｉは０に設定され、文ｓ_ｙにｉ番目の単語が存在すればｙ_ｉは１、存在しなければｙ_ｉは０に設定される。なお、日本語の単語には、助詞や助動詞などの付属語を用い、英語の単語には、冠詞や前置詞を除いた自立語を用いることが好ましい。

　数式（３）～数式（５）では、比較する文同士で同じ単語が多く含まれているほど類似度σが大きくなる定義になっており、単語の意味や品詞などの違いは考慮していないが、これらの違いを考慮して文同士の類似度を算出してもよい。

　ここで、表示制御部８２による認識結果等の表示手法について説明する。表示制御部８２は、認識部９０に認識された文、検索部９５により検索された類似文を次発話の候補として表示部１０に表示させる。具体的には、入力受付部８５により受け付けられた音声が日本語の場合、表示制御部８２は、認識部９０により生成された日本語の文字列、及び検索部９５により検索された日本語文を日本語の次発話の候補として表示部１０に表示させる。同様に、入力受付部８５により受け付けられた音声が英語の場合、表示制御部８２は、認識部９０により生成された英語の文字列、及び検索部９５により検索された英語文を英語の次発話の候補として表示部１０に表示させる。

　図１０は、検索部９５により検索された文を次発話の候補として表示した画面の一例を示す図であり、詳細には、図９に示す状態において、ユーザＥがＳｐｅａｋボタン２６０を押下して英語の音声を入力した後の状態を示している。図１０に示す例では、英語表示画面２００の認識結果表示エリア２５０にユーザＥにより入力された音声の認識結果が表示され、候補表示エリア２１０に、音声の認識結果である英語文２５２と、検索部９５により検索された英語文２５２に類似する複数の英語文が英語の次発話の候補として表示されている。

　次に、第１の実施形態の翻訳装置の動作を説明する。

　図１１は、第１実施形態の翻訳装置１で行われる処理の流れの一例を示すフローチャートである。

　まず、表示制御部８２は、初期画面を表示部１０に表示させる（ステップＳ１００）。表示制御部８２は、例えば、図４に示すような初期画面を表示部１０に表示させる。

　続いて、入力受付部８５は、入力部３０から音声が入力されたか否かを確認する（ステップＳ１０２）。

　音声が入力されなかった場合（ステップＳ１０２でＮｏ）、選択受付部６０は、表示部１０に表示されている候補の中から次発話が選択されたか否かを確認する（ステップＳ１０４）。例えば図４において、日本語文１１２が次発話として選択された場合、選択受付部６０は、日本語文１１２の選択を確認する。なお、次発話が選択されなかった場合（ステップＳ１０４でＮｏ）、ステップＳ１０２に戻る。

　次発話が選択された場合（ステップＳ１０４でＹｅｓ）、更新部６５は、次発話テーブルを参照して、前回選択を受け付けた文の第１識別情報と今回選択を受け付けた文の第２識別情報とに対応付けられた頻度情報を更新する（ステップＳ１０６）。

　続いて、翻訳部７０は、対訳記憶部５２に記憶されている対訳を用いて、選択受付部６０により選択が受け付けられた文を翻訳する（ステップＳ１０８）。翻訳部７０は、例えば、日本語文１１２を英語文２１２に翻訳する。

　続いて、取得部７５は、次発話テーブルを参照し、選択受付部６０により選択が受け付けられた文の第１識別情報に対応付けられた複数の第２識別情報それぞれが示す日本語及び英語の文を対訳記憶部５２から取得する（ステップＳ１１０）。なお、取得部７５による次発話候補取得処理の詳細は、後述する。

　続いて、表示制御部８２は、選択受付部６０により選択が受け付けられた文、選択受付部６０により選択が受け付けられた文の翻訳結果、日本語文の次発話の候補、及び英語文の次発話の候補を表示部１０に表示させる（ステップＳ１１２）。表示制御部８２は、例えば、図９に示すような画面を表示部１０に表示させる。そして、ステップＳ１１２が終了すると、ステップＳ１０２へ戻る。

　一方、ステップＳ１０２において、音声が入力された場合（ステップＳ１０２でＹｅｓ）、認識部９０は、入力受付部８５により受け付けられた音声を認識し、認識した音声の文字列を生成する（ステップＳ１１４）。

　続いて、検索部９５は、認識部９０に認識された文と類似する文を対訳記憶部５２から検索する（ステップＳ１１６）。

　続いて、表示制御部８２は、認識部９０の認識結果、及び検索部９５により検索された類似文を表示部１０に表示させる（ステップＳ１１８）。表示制御部８２は、例えば、図１０に示すような画面を表示部１０に表示させる。

　続いて、選択受付部６０は、表示部１０に表示されている候補の中から次発話の選択を待ち（ステップＳ１２０でＮｏ）、選択が確認されると（ステップＳ１２０でＹｅｓ）、ステップＳ１０６へ進む。

　図１２は、第１実施形態の翻訳装置１で行われる次発話候補取得処理の流れの一例を示すフローチャートである。

　まず、取得部７５は、選択受付部６０により選択された文が対訳記憶部５２に記憶されているか否か確認する（ステップＳ２００）。

　選択された文が対訳記憶部５２に記憶されている場合（ステップＳ２００でＹｅｓ）、取得部７５は、選択された文を前発話文に設定する（ステップＳ２０２）。

　一方、選択された文が対訳記憶部５２に記憶されていない場合（ステップＳ２００でＮｏ）、検索部９５は、選択された文との類似度が最も高い文を対訳記憶部５２から検索し、検索された文を前発話文に設定する（ステップＳ２０４）。

　続いて、取得部７５は、選択受付部６０により選択された文と、選択受付部６０により選択された文の翻訳結果とを対応付けて対訳記憶部５２に対訳として追加する（ステップＳ２０６）。

　続いて、取得部７５は、次発話テーブルを参照し、前発話文の第１識別情報に対応付けられた複数の第２識別情報それぞれが示す前発話文と同一言語の文を取得する。即ち、取得部７５は、ＩＤ１及び言語種別１が前発話文に一致し、かつ言語種別１と言語種別２とが一致するＩＤ２の文を、頻度が高い順に所定数の範囲内で対訳記憶部５２から取得し、候補１に追加する（ステップＳ２０８）。

　続いて、取得部７５は、次発話テーブルを参照し、前発話文の第１識別情報に対応付けられた複数の第２識別情報それぞれが示す前発話文と異なる言語の文を取得する。即ち、取得部７５は、ＩＤ１及び言語種別１が前発話文に一致し、かつ言語種別１と言語種別２とが異なるＩＤ２の文を、頻度が高い順に所定数の範囲内で対訳記憶部５２から取得し、候補２に追加する（ステップＳ２１０）。

　続いて、取得部７５は、候補１に追加した文が所定数に満たない場合、前発話文と言語が一致する文を頻度が高い順に所定数の範囲になるまで対訳記憶部５２から取得し、候補１に追加する（ステップＳ２１２）。

　続いて、取得部７５は、候補２に追加した文が所定数に満たない場合、前発話文と言語が異なる文を頻度が高い順に所定数の範囲になるまで対訳記憶部５２から取得し、候補２に追加する（ステップＳ２１４）。

　以上のように第１実施形態では、対訳を構成する複数の第１言語及び第２言語の文をそれぞれ識別する第１識別情報と、第１識別情報が示す文の次発話として過去に対訳から選択された文を識別する第２識別情報とを対応付けた次発話テーブルを用いて、次発話の候補を取得する。従って第１実施形態によれば、翻訳装置１の使用を重ねても対話履歴のデータ量などは増加しないため、低コストで利用者の次発話を予測することができる。

　特に第１実施形態では、第１識別情報が示す文の次発話として第２識別情報が示す文の選択された頻度が高い順に次発話の候補を取得するため、次発話としてユーザに選択される可能性の高いものを優先的に表示することができる。

（第２実施形態）
　第２実施形態では、意味カテゴリ辞書を用いて類似文を検索する例について説明する。以下では、第１実施形態との相違点の説明を主に行い、同様の機能を有する構成要素については、同様の名称・符号を付し、その説明を省略する。

　図１３は、第２実施形態の翻訳装置１００１の構成の一例を示すブロック図である。図１３に示す翻訳装置１００１は、記憶部１０５０に意味カテゴリ辞書記憶部１０５６が含まれる点、検索部１０９５の処理内容、及び対訳記憶部１０５２に記憶されている対訳が第１実施形態の翻訳装置１と相違する。

　図１４は、意味カテゴリ辞書記憶部１０５６に記憶されている意味カテゴリ辞書の一例を示す図である。図１４に示すように、意味カテゴリ辞書記憶部１０５６は、単語と当該単語の意味カテゴリとを対応付けた意味カテゴリ辞書を記憶する。

　図１３に戻り、検索部１０９５は、意味カテゴリ辞書を参照して、認識部９０により認識された文字列に類似する文を対訳記憶部１０５２から検索する。

　図１５は、第２実施形態の検索部１０９５の検索の詳細を示すフローチャートである。

　検索部１０９５は、意味カテゴリ辞書を参照して、認識部９０により認識された文字列を複数の単語に分割する（ステップＳ３００）。つまり、検索部１０９５は、認識部９０により認識された文字列の形態素解析を行う。

　続いて、検索部１０９５は、分割した単語それぞれの意味カテゴリを求める（ステップＳ３０２）。具体的には、入力受付部８５により受け付けられた音声が日本語の場合、意味カテゴリ辞書を参照して、認識部９０により認識された日本語の文字列を分割した単語それぞれの意味カテゴリを求める。同様に、入力受付部８５により受け付けられた音声が
英語の場合、意味カテゴリ辞書を参照して、認識部９０により認識された英語の文字列を分割した単語それぞれの意味カテゴリを求める。

　ここで、対訳記憶部１０５２について説明する。対訳記憶部１０５２は、対訳を構成する日本語文、英語文それぞれに意味カテゴリを対応付けて記憶する。図１６は、対訳記憶部１０５２に記憶されている対訳を構成する日本語文の一例を示す図である。図１６に示す例では、対訳を構成する日本語文それぞれに意味カテゴリが対応付けられている。図１７は、対訳記憶部１０５２に記憶されている対訳を構成する英語文の一例を示す図である。図１７に示す例では、対訳を構成する英語文それぞれに意味カテゴリが対応付けられている。例えば、図１６及び図１７において、日本語文１２０や英語文２２０には、「挨拶」という意味カテゴリが対応付けられ、日本語の単語１６１や英語の単語２６１には、「衣服」という意味カテゴリが対応付けられている。なお、対訳を構成する日本語文、英語文への意味カテゴリの付与は、図１５に示すフローチャートのステップＳ３００、Ｓ３０２の処理により行うことができる。

　図１５に戻り、続いて、検索部１０９５は、分割した単語それぞれの意味カテゴリと、対訳記憶部１０５２に記憶されている文を構成する複数の単語それぞれの意味カテゴリとを比較して、認識部９０により認識された文字列に類似する文を検索する（ステップＳ３０４）。具体的には、入力受付部８５により受け付けられた音声が日本語の場合、検索部１０９５は、日本語の文字列を分割した単語それぞれの意味カテゴリと、図１６に示すような、対訳記憶部１０５２に記憶されている日本語文を構成する複数の単語それぞれの意味カテゴリとを比較して、認識部９０により認識された日本語の文字列に類似する日本語文を検索する。同様に、入力受付部８５により受け付けられた音声が英語の場合、検索部１０９５は、英語の文字列を分割した単語それぞれの意味カテゴリと、図１７に示すような、対訳記憶部１０５２に記憶されている英語文を構成する複数の単語それぞれの意味カテゴリとを比較して、認識部９０により認識された英語の文字列に類似する英語文を検索する。例えば、検索部１０９５は、数式（３）に示すＤｉｃｅ係数、数式（４）に示すＪａｃｃａｒｄ係数、又は数式（５）に示すコサイン係数などを用いて、文同士の類似度を算出する。

　例えば、図１６に示す日本語文１７１には、「頭・目鼻・顔」と「意識・感覚」という意味カテゴリが対応付けられ、日本語文１７２には、「頭・目鼻・顔」と「意識・感覚」という意味カテゴリが対応付けられ、日本語文１７３には、「衣服」と「包摂」という意味カテゴリが対応付けられている。

　この場合、日本語文１７１と日本語文１７２の類似度、及び日本語文１７１と日本語文１７３の類似度は、数式（３）を用いて計算すると、以下の通りである。なお以下では、日本語文１７１を文１、日本語文１７２を文２、日本語文１７３を文３としている。

　σ(文１，文２)＝２＊（ｅ（頭・目鼻・顔，文１）＊ｅ（頭・目鼻・顔，文２）＋ｅ（意識・感覚，文１）＊ｅ（意識・感覚，文２））／（（ｅ（頭・目鼻・顔，文１）^２＋ｅ（意識・感覚，文１）^２）＋（ｅ（頭・目鼻・顔，文２）^２＋ｅ（意識・感覚，文２）^２））＝２＊（１＊１＋１＊１）／（（１^２＋１^２）＋（１^２＋１^２））＝１

　σ(文１，文３)＝２＊（ｅ（頭・目鼻・顔，文１）＊ｅ（頭・目鼻・顔，文２）　＋ｅ（意識・感覚，文１）＊ｅ（意識・感覚，文２）＋ｅ（衣服，文１）＊ｅ（衣服，文２）＋ｅ（包摂，文１）＊ｅ（包摂，文２））／（（ｅ（頭・目鼻・顔，文１））^２＋ｅ（意識・感覚，文１）^２）＋（ｅ（衣服，文２）^２＋ｅ（包摂，文２）^２））＝２＊（１＊０＋１＊０＋０＊１＋０＊１）／（（１^２＋１^２）＋（１^２＋１^２））＝０

　この結果、σ(文１，文２)＝１であるため、日本語文１７１と日本語文１７２とは類似する。一方、σ(文１，文３)＝０であるため、日本語文１７１と日本語文１７３とは類似しない。なお、ｅ（ｘ，ｓ）は、文ｓに意味カテゴリｘが存在する場合に１、存在しない場合に０を出力する関数である。

　以上のように、意味カテゴリ辞書を用いても類似文を検索することができる。なお、文が疑問か肯定かという情報も文の類似度を算出する上で重要であるため、このような情報を用いて、類似度計算を行うようにしてもよい。

（ハードウェア構成）
　図１８は、第１、２実施形態の翻訳装置１、１００１のハードウェア構成の一例を示すブロック図である。図１８に示すように、第１、２の実施の形態の翻訳装置１、１００１は、ＣＰＵ９０１と、ＲＯＭ、ＲＡＭ、及びＨＤＤなどの記憶装置９０２と、ユーザの音声を入力するマイク９０９と、入力された音声をＡＤ変換するＡＤ装置９０８と、翻訳結果などを音声に変換するＤＡ装置９１０と、音声を出力するスピーカ９１１と、キーボード、マウス、又はペンなどの入力装置９０５と、入力装置９０５を制御する入力コントローラ９０４と、ディスプレイなどの表示装置９０７と、表示装置９０７を制御する出力コントローラ９０６と、各モジュールを接続するバス９０３とを備えており、通常のコンピュータを利用したハードウェア構成となっている。

　第１、２実施形態の翻訳装置１、１００１で実行される翻訳プログラムは、インストール可能な形式又は実行可能な形式のファイルでＣＤ－ＲＯＭ、フレキシブルディスク（ＦＤ）、ＣＤ－Ｒ、ＤＶＤ（Digital　Versatile　Disk）等のコンピュータで読み取り可能な記録媒体に記録されてコンピュータプログラムプロダクトとして提供される。また、第１、２実施形態の翻訳装置１、１００１で実行される翻訳プログラムを、ＲＯＭ等に予め組み込んで提供するように構成してもよい。

　第１、２実施形態の翻訳装置１、１００１で実行される翻訳プログラムは、上述した各部をコンピュータ上で実現させるためのモジュール構成となっている。実際のハードウェアとしては、ＣＰＵがＨＤＤから翻訳プログラムをＲＡＭ上に読み出して実行することにより、上記各部がコンピュータ上で実現されるようになっている。

（変形例）
　なお、本発明は、上記実施の形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化することができる。また、上記実施の形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成することができる。例えば、実施の形態に示される全構成要素からいくつかの構成要素を削除してもよい。さらに、異なる実施の形態にわたる構成要素を適宜組み合わせても良い。

　例えば、検索部９５、１０９５が類似文を検索する場合、一般的に、対訳記憶部５２、１０５２に記憶されている文のうち次発話候補として取得部７５により取得された文を優先することが望ましい。このため、検索部９５、１０９５は、対訳記憶部５２、１０５２
に記憶されている文のうち取得部７５により取得された文の優先度を上げて、認識部９０に認識された文字列に類似する文を対訳記憶部５２、１０５２から検索するようにしてもよい。

　具体的には、入力受付部８５により受け付けられた音声が日本語の場合、検索部９５、１０９５は、対訳記憶部５２、１０５２に記憶されている日本語文のうち取得部７５により取得された日本語文の優先度を上げて、日本語の文字列に類似する日本語文を対訳記憶部５２、１０５２から検索する。同様に、入力受付部８５により受け付けられた音声が英語の場合、検索部９５、１０９５は、対訳記憶部５２、１０５２に記憶されている英語文のうち取得部７５により取得された英語文の優先度を上げて、英語の文字列に類似する英語文を対訳記憶部５２、１０５２から検索する。

　なお、例えば、数式（６）を用いることで、次発話候補として取得された文を優先することができる。

　但し、０＜α＜１である。

　以上のように、本発明にかかる翻訳装置、及びプログラムは、異なる言語を母語とするユーザ同士のコミュニケーションの支援に有用である。

　１、１００１　翻訳装置
　１０　表示部
　１１、２１　マイク
　１２、２２　ディスプレイ
　１３、２３　タッチペン
　１４、２４　スピーカ
　２０　選択部
　３０　入力部
　４０　音声出力部
　５０、１０５０　記憶部
　５２、１０５２　対訳記憶部
　５４　次発話テーブル記憶部
　６０　選択受付部
　６５　更新部
　７０　翻訳部
　７５　取得部
　８０　出力制御部
　８２　表示制御部
　８４　音声制御部
　８５　入力受付部
　９０　認識部
　９５、１０９５　検索部
　９０１　ＣＰＵ
　９０２　記憶装置
　９０３　バス
　９０４　入力コントローラ
　９０５　入力装置
　９０６　出力コントローラ
　９０７　表示装置
　９０８　ＡＤ装置
　９０９　マイク
　９１０　ＤＡ装置
　９１１　スピーカ
　１０５６　意味カテゴリ辞書記憶部

Claims

　意味内容が同義の第１言語の文及び第２言語の文を対応付けた対訳と、前記対訳のＩＤとを、対応付けて複数記憶する対訳記憶部と、
　選択された前記第１言語の第１文を、前記対訳を用いて前記第２言語に翻訳する翻訳部と、
　前記ＩＤを有し、前記ＩＤが示す前記対訳に含まれる前記第１言語の文か前記第２言語の文かを識別する第１識別情報と、前記第１識別情報が示す文の次発話として過去に前記対訳記憶部から選択された文を識別する第２識別情報と、を対応付けた次発話テーブルを記憶する次発話テーブル記憶部と、
　前記次発話テーブルを参照し、前記第１文の前記第１識別情報に対応付けられた前記第２識別情報が示す文である次発話候補を前記対訳記憶部から取得する取得部と、
　前記第１文、前記第１文の翻訳結果、及び前記次発話候補を表示する表示部と、
　前記次発話候補の選択を受け付ける選択受付部と、
　を備え、
　前記翻訳部は、選択された前記次発話候補が前記第１言語の場合、前記対訳を用いて前記第２言語に翻訳し、選択された前記次発話候補が前記第２言語の場合、前記対訳を用いて前記第１言語に翻訳することを特徴とする翻訳装置。
　前記次発話テーブル記憶部は、更に、前記第１識別情報が示す文の次発話として前記第２識別情報が示す文が選択された頻度を示す頻度情報を前記次発話テーブルに対応付けて記憶し、
　前回選択を受け付けた文の前記第１識別情報と前記第１文の前記第２識別情報とに対応付けられた前記頻度情報を更新する更新部を更に備え、
　前記取得部は、前記次発話テーブルを参照し、前記第１文の前記第１識別情報に対応付けられた複数の前記第２識別情報それぞれが示す前記第１言語の文である前記第１言語の次発話候補を前記頻度情報が示す頻度が高い順に所定数の範囲内で前記対訳記憶部から取得するとともに、前記第１文の前記第１識別情報に対応付けられた複数の前記第２識別情報それぞれが示す前記第２言語の文である前記第２言語の次発話候補を前記頻度情報が示す頻度が高い順に所定数の範囲内で前記対訳記憶部から取得することを特徴とする請求項１に記載の翻訳装置。
　前記第１言語又は前記第２言語の発話の音声の入力を受け付ける入力受付部と、
　前記音声が前記第１言語の場合、前記音声を認識して前記第１言語の第１文字列を生成し、前記音声が前記第２言語の場合、前記音声を認識して前記第２言語の第２文字列を生成する認識部と、
　前記音声が前記第１言語の場合、前記第１文字列に類似する前記第１言語の文を前記対訳記憶部から検索し、前記音声が前記第２言語の場合、前記第２文字列に類似する前記第２言語の文を前記対訳記憶部から検索する検索部と、を更に備え、
　前記表示部は、前記音声が前記第１言語の場合、前記第１文字列及び検索された前記第１言語の文を前記第１文の前記第１言語の次発話候補として表示し、前記音声が前記第２言語の場合、前記第２文字列及び検索された前記第２言語の文を前記第１文の前記第２言語の次発話候補として表示することを特徴とする請求項１に記載の翻訳装置。
　単語と前記単語の意味カテゴリとを対応付けた意味カテゴリ辞書を記憶する意味カテゴリ辞書記憶部を更に備え、
　前記検索部は、前記音声が前記第１言語の場合、前記第１文字列を構成する複数の単語それぞれの意味カテゴリと、前記対訳記憶部に記憶されている前記第１言語の文を構成する複数の単語それぞれの意味カテゴリとを比較して、前記第１文字列に類似する前記第１言語の文を検索し、前記音声が前記第２言語の場合、前記第２文字列を構成する複数の単語それぞれの意味カテゴリと、前記対訳記憶部に記憶されている前記第２言語の文を構成する複数の単語それぞれの意味カテゴリとを比較して、前記第２文字列に類似する前記第２言語の文を検索することを特徴とする請求項３に記載の翻訳装置。
　前記検索部は、前記音声が前記第１言語の場合、前記対訳記憶部に記憶されている前記第１言語の文のうち前記取得部により取得された前記第１言語の文の優先度を上げて、前記第１文字列に類似する前記第１言語の文を前記対訳記憶部から検索し、前記音声が前記第２言語の場合、前記対訳記憶部に記憶されている前記第２言語の文のうち前記取得部により取得された前記第２言語の文の優先度を上げて、前記第２文字列に類似する前記第２言語の文を前記対訳記憶部から検索することを特徴とする請求項３に記載の翻訳装置。
　選択された前記第１言語の第１文を、意味内容が同義の第１言語の文及び第２言語の文を対応付けた対訳と前記対訳のＩＤとを対応付けて複数記憶する対訳記憶部の前記対訳を用いて前記第２言語に翻訳する翻訳部と、
　前記ＩＤを有し、前記ＩＤが示す前記対訳に含まれる前記第１言語の文か前記第２言語の文かを識別する第１識別情報と、前記第１識別情報が示す文の次発話として過去に前記対訳記憶部から選択された文を識別する第２識別情報と、を対応付けた次発話テーブルを記憶する次発話テーブル記憶部の前記次発話テーブルを参照し、前記第１文の前記第１識別情報に対応付けられた前記第２識別情報が示す文である次発話候補を前記対訳記憶部から取得する取得部と、
　前記第１文、前記第１文の翻訳結果、及び前記次発話候補を表示する表示部と、
　前記次発話候補の選択を受け付ける選択受付部と、
　してコンピュータを機能させ、
　前記翻訳部は、選択された前記次発話候補が前記第１言語の場合、前記対訳を用いて前記第２言語に翻訳し、選択された前記次発話候補が前記第２言語の場合、前記対訳を用いて前記第１言語に翻訳することを特徴とする翻訳プログラム。