[go: up one dir, main page]

JP5331964B2 - 翻訳支援装置、翻訳支援方法および翻訳支援プログラム - Google Patents

翻訳支援装置、翻訳支援方法および翻訳支援プログラム Download PDF

Info

Publication number
JP5331964B2
JP5331964B2 JP2007324106A JP2007324106A JP5331964B2 JP 5331964 B2 JP5331964 B2 JP 5331964B2 JP 2007324106 A JP2007324106 A JP 2007324106A JP 2007324106 A JP2007324106 A JP 2007324106A JP 5331964 B2 JP5331964 B2 JP 5331964B2
Authority
JP
Japan
Prior art keywords
predicate
subject
translation
sentence
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007324106A
Other languages
English (en)
Other versions
JP2009146238A (ja
Inventor
敏史 藤井
Original Assignee
敏史 藤井
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 敏史 藤井 filed Critical 敏史 藤井
Priority to JP2007324106A priority Critical patent/JP5331964B2/ja
Publication of JP2009146238A publication Critical patent/JP2009146238A/ja
Application granted granted Critical
Publication of JP5331964B2 publication Critical patent/JP5331964B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

本発明は翻訳技術に関する。より詳しくは、本発明は、日本語から外国語へ翻訳する際に、前編集、すなわち翻訳対象文を翻訳前に翻訳しやすく編集することを支援し、優れた翻訳結果が得られることに寄与する技術に関する。
企業活動のボーダーレス化に伴い、母国語が異なる者同士のコミュニケーションの機会が増えてきている。国際間のコミュニケーションにおいては英語が用いられることが多く、英語習得の必要性が高まっている。一方で、異言語の習得は多大な時間と苦労を要する観点や、母国語を用いる場合と比較して情報理解力や情報伝達力が劣る観点から、母国語でのコミュニケーションを望む声も小さくない。双方が母国語でコミュニケーションをはかるためには、翻訳を行う媒体を介することが必要となる。
かかる媒体として、人的媒体すなわち翻訳者が広く活用されてきた。しかしながら、人力を活用した翻訳は、当然のことながらコストが非常に高くつく。文学作品のような翻訳文の正確さが重要である場合はともかくとして、技術コミュニケーションや社内連絡など、意味が伝われば目的を達するような場合には、翻訳費用は付加価値を生じさせない単なるコストであり、極端な場合には、情報伝達によって得られる価値より翻訳コストの方が高いといった本末転倒な結果を招きかねない。
そこで、物的媒体、すなわち機械翻訳の普及が期待されており、情報技術の高度化に伴い、種々の機械翻訳技術が開発されてきている。
具体的には、自然言語である日本語を数学的に処理し、外国語へと翻訳するシステムが開発されている。かかる自然言語処理のフェーズとしては、形態素解析、構文解析、意味解析、文脈解析というフェーズがある。形態素解析では、文を意味的最小単位である形態素に分節して品詞の認定処理を行う。構文解析では、文法規則などを基に句構造などの文の構造を解析する。文法規則が木構造であることから、構文解析結果は一般に個々の形態素が係り受け関係などを基にして接合された木構造となる。意味解析では、文中の語の語義や、語と語の間の意味関係などに基づいて、文が伝える意味を表現する意味構造を求めて、意味構造を合成する。また、文脈解析では、文の系列である文章を解析の基本単位とみなして、文間の意味的なまとまりを得て談話構造を構成する。かような翻訳処理に関する技術としては、例えば、特許文献1〜4が挙げられる。
翻訳処理を行う技術の開発が重要であることは勿論であるが、翻訳前に翻訳される文章を調整する技術(前編集)および翻訳処理された文章をより正確な文章に校正する技術(後編集)に関する技術の開発も重要である。
後編集に関する技術としては、例えば、特許文献5は、機械翻訳文と校正後の文とを比較して、校正規則を生成する技術を開示している。
前編集に関する技術も、高精度の翻訳のために非常に重要である。そこで、古くから、前編集に関する技術開発が行われてきた。特許文献6においては、主語と述語との間に存在する単語の数を計り、所定の数以上の単語が主語と述語との間に存在する場合に警告メッセージを表示して文章の構成を促す方法が開示されている。
特許文献7は、形態素解析の結果、品詞を決定できない部位の全てについてオペレーターに品詞を決定させ、その後、構文解析へと移す方法が開示している。構文解析においても、係り受けが不明確な箇所についてオペレーターに決定させる。特許文献8は、翻訳を開始する前に、原文に補助情報を付与して、翻訳の便宜に資する方法を開示している。該方法においては、例えば、「今日本人」という原文がある場合に、予め、意図するところに応じて、1)「今」にカーソルを合わせて「いま」という読みを入力する、2)「日本」にカーソルを合わせて「にほん」を入力する、3)「日本人」にカーソルを合わせて、訳語「Japanese」を入力する、のいずれかを選択させ、意味を明確にしてから翻訳する。
特許文献9は、曖昧性の高い単語が存在する場合に、漢字による再入力または訳語指定を求めるメッセージを出力する技術を開示している。例えば、「なる」という多義的に解釈可能な単語が文中に存在する場合には、漢字への変換または訳語の指定が促される。特許文献10は、原文の曖昧性を排除するために、原文には表記されない補助記号を入力する方法を開示している。例えば「ここではきものを脱いでください」という文において、「で」の下にカーソルを移動させて文節切りの指定をする。このとき、電子データ上は「ここで$/$はきものを脱いでください」と記憶されるが、原文には文節区切り指定は表示されない。
特許文献11は、翻訳処理前に入力された原文の表現を自動的に変換する方法が開示されている。この方法においては、予め定められた日本語テンプレートにマッチするように、入力された原文が変換される。例えば、「してください」、「してもらえませんか」、「していただけないでしょうか」、「してほしいのですが」は、「してください」に統一される。また、翻訳を困難にする重文については、いずれの接続詞が適切かをオペレーターに選択させる。例えば、「〜が・・」の構造を有する重文については、「〜。しかし、・・」、「〜。そして、・・」、「〜。だから、・・」の中から適切なものを選択させる。このような原語を用いた、構文を大きく変換しない前処理は、外国語に詳しくないユーザーにとって比較的ユーザーフレンドリーであるといえる。その他、前編集に関するものとして、特許文献12〜15が知られている。
しかしながら、上記技術は、いずれも入力される文章が、曖昧さを有していたとしても、文法的に正確であることを前提としている。ところが現実には、言わんとすることは理解できるものの、日本語として文法的には誤りがある場合が少なくない。例えば、「特許文献5は、機械翻訳文と校正後の文とを比較して、校正規則を生成する技術を開示している。」という文章を、「特許文献5は、機械翻訳文と校正後の文とを比較して、校正規則を生成する技術が開示されている。」と記載してしまうことが多い。
翻訳者が翻訳作業を行う場合には、「文献」という概念および「開示される」という動詞の意味を考慮して、「開示される」のは文献ではなく文献に記載された内容であることを理解し、「特許文献5は」という箇所は「特許文献5においては」を意図していることを見抜く。しかしながら、機械翻訳において、単語の持つ概念を考慮して現実的にありえない状況である場合に、自ら適切な判断を臨機応変にさせるには、相当の技術的発展が必要である。特に、「物体Aが物体Bを貫通される」といったように、「物体Aが物体Bを貫通する」の誤記とも、「物体Aが物体Bで貫通される」の誤記とも、どちらとも取れるような場合、機械翻訳で正確な翻訳をするのは困難である。実際、既存の機械翻訳ソフトの1つに「物体Aが物体Bを貫通される」という文章を翻訳させると、”It is penetrated object B object A.”と意味不明の翻訳をしてしまう。一方で、このような文法のゆれを許容するように翻訳プログラムを組むと、翻訳の精度が途端に低下してしまう。このような問題は、翻訳者により翻訳させる場合においても同様である。原文作成者と翻訳者とは異なる場合が多いが、日本語に文法的誤りがある場合には、翻訳者の翻訳労力が増大する。
上述のように、翻訳技術が進歩しても、翻訳される原文そのものに欠陥があっては、優れた翻訳文は期待できない。
特開平9−114830号公報 特開平11−85749号公報 特開2003−281132号公報 特開2004−287679号公報 特開2000−259631号公報 特開2002−278954号公報 特開昭63−49974号公報 特開昭63−276174号公報 特開平3−225468号公報 特開平7−73185号公報 国際公開WO00/13102 特開平2−300971号公報 特開平3−157766号公報 特開平8−329089号公報 特開2007−4730号公報
本発明は、翻訳対象となる日本語の文法的正確さを、翻訳前に確認する手段を提供することを目的とする。
前述の通り、原文の正確さが優れた翻訳のためには必要である。本発明は、主語と述語との対応関係が不明確になりがちな構造を日本語が有するがために誤訳が生じやすい点に鑑み、原文における主語−述語の対応関係を予め正確にしておくことによって、原文の誤認識を防止するものである。
具体的には、本発明は、日本語による翻訳対象文を異言語への翻訳に先立ち前編集する翻訳支援装置であって、利用者が入力した翻訳対象文を受け付ける翻訳対象文受付手段と、前記翻訳対象文受付手段が受け付けた前記翻訳対象文を形態素解析する形態素解析手段と、前記形態素解析手段が解析した形態素情報を構文解析し、翻訳対象文における主語候補および述語候補を特定する構文解析手段と、前記構文解析手段が特定した主語候補および述語候補を表示する表示手段とを備える、翻訳支援装置に関する。
また本発明は、日本語による翻訳対象文を異言語へ翻訳する翻訳装置であって、利用者が入力した翻訳対象文を受け付ける翻訳対象文受付手段と、前記翻訳対象文受付手段が受け付けた前記翻訳対象文を形態素解析する形態素解析手段と、前記形態素解析手段が解析した形態素情報を構文解析し、翻訳対象文における主語候補および述語候補を特定する構文解析手段と、前記構文解析手段が特定した主語候補および述語候補を表示する表示手段と、前記表示手段が表示した主語候補および述語候補の変更を受け付ける候補変更受付手段と、前記主語候補および前記述語候補に関して利用者による確定を受け付ける、主語述語確定受付手段と、前記主語述語確定受付手段が受け付けた主語候補および述語候補を主語および述語として認識して、翻訳対象文の異言語への翻訳を行う翻訳手段とを備える、翻訳装置に関する。
また本発明は、日本語による翻訳対象文を異言語への翻訳に先立ち前編集する翻訳支援方法であって、利用者が入力した翻訳対象文を受け付ける翻訳対象文受付ステップと、前記翻訳対象文受付ステップで受け付けた前記翻訳対象文を形態素解析する形態素解析ステップと、前記形態素解析ステップで解析した形態素情報を構文解析し、翻訳対象文における主語候補および述語候補を特定する構文解析ステップと、前記構文解析ステップが解析した主語候補および述語候補を表示する表示ステップとを有する、翻訳支援方法に関する。
また本発明は、日本語による翻訳対象文を異言語への翻訳に先立ち前編集する翻訳支援プログラムであって、利用者が入力した翻訳対象文を受け付ける翻訳対象文受付手順と、前記翻訳対象文受付ステップで受け付けた前記翻訳対象文を形態素解析する形態素解析手順と、前記形態素解析ステップで解析した形態素情報を構文解析し、翻訳対象文における主語候補および述語候補を特定する構文解析手順と、前記構文解析ステップが解析した主語候補および述語候補を表示する表示手順とをコンピュータに実行させる翻訳支援プログラムに関する。
前編集により翻訳の品質を高めることを現実社会において普及させるためには、(1)前編集の作業がユーザーフレンドリーであること、(2)前編集に要する負担が軽いこと、(3)前編集によって翻訳時の誤訳が低減されること、が同時に満たされることが求められる。この点、本発明においては、原文における主語および述語の対応関係を確認すればよいため、前編集を行う者は外国語の知識がなくとも良い。また、原文の全体を再確認するのではなく、確認が簡単な主語−述語関係をチェックする方式であるため、前編集に要する負担が軽い。さらに、主語と述語との対応関係が正確に翻訳された場合には、翻訳文の読解において、致命的な欠陥が生じにくい。仮に係り受けが不明確な翻訳文が作成されたとしても、主語−述語の対応関係が明確であれば、意味するところを推認することが可能である。
以下、本発明について図面を参照しながら説明する。なお、以下では、英語を翻訳される異言語であることを前提として説明するが、異言語は英語に限るものではなく、あらゆる言語に適用することができる。
(第1の実施形態)
図1は、第1の実施形態にかかる翻訳支援装置10の構成を示すブロック図である。同図に示すように、翻訳支援装置10は、翻訳対象文受付部100と、形態素解析部102と、構文解析部104と、表示部106と、修正候補受付部108と、修正文表示部110と、修正受付部112と、翻訳対象文修正部114と、候補変更受付部116と、候補変更部118と、主語述語確定受付部120と、主語述語情報付加部122と、出力部124とを備えている。
翻訳対象文受付部100は、利用者による翻訳対象文の入力を受付けるものである。翻訳対象文の入力は、キーボード、ポインティングデバイス、手書き文字認識などの一般的に用いられているあらゆる入力方法を適用することができる。また、翻訳対象文受付部100は、利用者からの音声入力を受付け、受付けた音声に対し音声認識処理を行い、翻訳対象文を出力するように構成してもよい。
この際に行われる音声認識処理は、LPC分析、隠れマルコフモデル(HMM:Hidden Markov Model)、ダイナミックプログラミング、ニューラルネットワーク、Nグラム言語モデルなどを用いた、一般的に利用されているあらゆる音声認識方法を適用することができる。
形態素解析部102は、翻訳対象文受付部100が受付けた翻訳対象文に対し、形態素解析を行う。形態素解析部102は、翻訳対象文受付部100より出力された日本語文章を形態素解析するとともに、単語単位の品詞情報(用言の活用形の解析も含む)からなる形態素解析情報を日本語文章に付与する。形態素解析情報が付与された日本語文章は、構文解析部104に出力される。
構文解析部104は、文法規則などを基に句構造などの文の構造を解析する。構文解析部104において、主語候補および述語候補が特定される。
形態素解析部102および構文解析部104が出力する翻訳対象文の処理の一例を以下に示す。形態素解析部102に翻訳対象文「私が食べる」が入力された場合、(1)式のような形態素系列が与えられる。
<pron 僕><cm が><v 働く> ・・・(1)
上記形態素系列は、原言語文「私が食べる」が“私”、"が"、"食べる"の3つの単語に分割可能であり、それぞれの文法範疇に対応する品詞"pron"、"cm"、"v"が割り当てられていることを示している。
構文解析部104においては、文の構造が解析され、(2)式のような統語構造が与えられる。
(s(np <pron 僕><cm が>)(vp <v 働く>)) ・・・(2)
上記統語構造は、単語および文法範疇の書き換え関係を括弧により表現した形式である。すなわち、(np <pron 僕> <cm が>)は、文法範疇pronとcmとが、文法範疇npによって書き換えられることを示し、さらに、(s(np <pron 僕><cm が>)(vp <v 働く>))は、文法範疇npとvpが、文法範疇sによって書き換えられることを示している。
なお、上記のような記述形式は一例であり、従来から用いられているあらゆる形態素系列の記述形式および統合構造の記述形式により記述されうる。
主語候補および述語候補を特定する過程においては、必要に応じて、意味解析および文脈解析が加えられてもよい。なお、形態素解析、構文解析、意味解析などの解析時には、形態素情報、構文情報、意味情報などを格納した自然言語処理用の辞書を格納したHDD、光ディスク、メモリカード、RAMなどの一般的に利用されている記憶手段が参照される。
表示部106は、構文解析部から出力された主語候補および述語候補を利用者向けに表示する。第1の実施形態においては、構文解析部104が特定した主語候補および述語候補が図2に示すような主語候補および述語情報のみが表示された表として表示される。また、修正候補受付部108に利用者から修正文の表示指示が入力された場合には、修正文表示部110が入力者に対して修正文を表示できるように、該当する文データを出力する。また、修正受付部112に利用者から修正指示が入力された場合、候補変更受付部116に利用者から変更指示が入力された場合、主語述語確定受付部118に利用者から確定指示が入力された場合には、構文解析部104から出力された主語候補および述語候補のアップデートおよび確定をする。確定した主語情報および述語情報を含む翻訳対象文は主語述語情報付加部122に出力される。
修正候補受付部108は、表示部106によって示された主語候補および述語候補の表において、利用者が修正を希望する主語候補および述語候補の組み合わせがあった場合に、利用者からの修正希望を受け付ける。利用者からの修正希望は修正文表示部110へと伝えられる。
修正文表示部110は、利用者から修正希望があった主語候補および述語候補の組み合わせを含む文を利用者に対して表示する。
修正受付部112は、修正文表示部110が表示した文について、利用者から表現の訂正や誤記の修正の入力を受け付ける。入力は、翻訳対象文修正部114へと出力される。
翻訳対象文修正部114は、利用者からの入力に従い翻訳対象文の修正を行う。修正された内容は、修正文表示部110により利用者に表示される。なお、翻訳対象文の修正は、表示部106を経由して修正文表示部110へと伝達されてもよい。
候補変更受付部116は、表示部106が表示した主語候補または述語候補の変更を利用者より受け付ける。修正文表示部110により表示された修正文を見た利用者が、主語または述語が誤って認識されていると判断した場合、候補変更受付部116に正しい主語または述語を入力する。
候補変更部118は、構文解析部104が特定した主語候補または述語候補を、候補変更受付部116への利用者からの入力に従って変更する。変更後の主語候補または述語候補は表示部106によって、利用者に表示される。
主語述語確定受付部120は、表示部106に表示されている主語述語の組み合わせについて確定を受け付ける。利用者は、表示部106に表示されている主語述語の組み合わせについて確認、および必要な修正を加えた後、主語述語の関係が正しく反映されていると判断した場合に確定を入力する。主語および述語が確定した翻訳対象文は、主語述語情報付加部122へ主語情報および述語情報と共に出力され、主語情報および述語情報が翻訳対象文に付加される。
出力部124は、主語述語確定受付部120から主語情報および述語情報付きの翻訳対象文を受け取り、出力するものである。続いて機械翻訳処理が施される場合には、出力部124からは電子データの形で出力されるのが良い。確定した主語および述語情報を元にして、翻訳者を利用した翻訳を行う場合には、主語および述語情報が明示された形でテキスト印刷してもよい。本発明は機械翻訳の前編集として利用される場合に高い意義を有するが、場合によっては、本発明の前編集で確定された主語述語情報を人力により翻訳に活用してもよい。本発明の前編集を経た翻訳対象文においては、主語述語の対応関係が明示されているため、翻訳者の誤訳を減らし、また、翻訳者の文章読解に要する労力を軽減できる。
次に、このように構成された第1の実施形態にかかる翻訳支援装置10による前編集処理について説明する。図3は、第1の実施形態における前編集処理の流れを示すフローチャートである。なお、同等の機能が発現するのであれば、図示するフローチャート以外の処理も可能であることは勿論である。
まず、翻訳対象文受付部100が、利用者が入力した翻訳対象文の入力を受付ける(S301)。翻訳対象文は一文ずつ入力されてもよいが、利用者の負担を軽減する観点からは、翻訳する予定のある複数の文を一度に入力することが好ましい。本発明の第1の実施形態の説明においては、複数の文からなる翻訳対象文を処理する態様について説明する。
次に、形態素解析部102が、翻訳対象文について形態素解析を実行し、形態素情報を出力する(S302)。形態素解析部102から出力された形態素情報に対して、構文解析部104は構文解析を実行し、構文情報を出力する(S303)。構文情報は、複数の文のそれぞれについて出力される。
表示部106は、構文解析部104から入力された主語候補および述語候補を表示する(S303)。第1の実施形態においては、表示部106は、主語候補および述語情報のみが表示された表を利用者に提示する。図2は、第1の実施形態において表示部106が利用者に提示する表の一実施形態を示す図である。図2は、主語候補および述語候補の一覧表が提示される実施形態である。表の形式が図示するようなスタイルに限定されないことは勿論である。例えば、利用者からの入力に応じて1文ずつ順次表示してもよいし、2〜10文程度の小グループずつ順次表示してもよい。
また、図2においては、句点で区切られた1文につき、主語候補および述語候補を1つずつ提示しているが、複文や重文の場合に、2以上の主語候補および述語候補を表示してもよい。これにより、翻訳精度を高めることができる。ただし、あまりにチェック項目が多くなると、利用者のチェック負担が重くなり実用性が低下するため、両者のバランスを考慮することが好ましい。
利用者は、表示部106によって表示された主語候補および述語候補の組み合わせを確認し、述語候補の受動・能動の誤り、誤記の有無等をチェックする。主語述語の対応、受動・能動の誤り、誤記等、何ら問題がない場合には、主語述語確定受付部120に確定が入力され(S304のYES)、翻訳対象文、並びに主語候補情報及び述語候補情報は主語述語情報付加部122に出力される。
確定しない場合、すなわち、修正候補受付部108に利用者から入力があった場合には(S304のNO)、修正文表示部110により利用者に選択された文が表示される(S305)。図2に示す表は、本明細書の冒頭部分における文章を参考にして作成したものであるが、第5文における「翻訳者が」「活用してきた」は、文脈を考慮すると「翻訳者が」「活用されてきた」の誤記である可能性が高い。このとき、利用者は、修正する可能性がある第5文を選択する。修正候補の選択方法は、特に限定されない。ユーザーフレンドリーの観点からは、修正文に係る文番号、主語候補または述語候補をクリックすると、修正文が表示される形式が好ましい。
図4は、修正文表示部によって利用者に表示される画面の一例である。図4においては、主語候補および述語候補が下線部で表示されている。他の表示様式を用いてもよい。例えば、主語候補と述語候補とを色分け記載する様式や、主語候補の後に(主)、述語候補の後に(述)と表示する様式などが考えられる。利用者は、修正文を確認し、修正を加える(S306のYES)。図示した例においては、利用者はカーソルを「活用してきた」に移動させ、「活用されてきた」と修正し、「OK」をクリックする。修正された内容は翻訳対象文へと反映され(S307)、修正文表示部における主語候補および述語候補の組み合わせが更新される。図5は、第5文の述語候補が修正された後における、表示部106による表示を示す図である。なお、文を確認したが修正が必要なかった場合にには、「キャンセル」をクリックする。
利用者が、誤記等の修正入力は必要ないが(S306のNO)、主語候補または述語候補が誤認識されていると感じた場合には(S308のYES)、主語候補または述語候補が修正される。図5に示す主語候補および述語候補の組み合わせにおいては、第3文の主語は誤認されていると思われる。このとき、第5文を表示させた場合と同様にして、第3文を表示させる。図6は、第3文が修正文表示部によって利用者に表示された状態を示す図である。
利用者は、「小さくない」に対応する主語として「声も」を選択し、「主語変更」をクリックする。修正された内容は翻訳対象文へと反映され(S309)、修正文表示部における主語候補および述語候補の組み合わせが更新される。図7は、第3文の主語候補が変更された後における、表示部106による表示を示す図である。なお、文を確認したが修正が必要なかった場合にには、「キャンセル」をクリックする。主語候補の変更に際しては、ユーザーフレンドリーの観点からは、カーソルキー(←、→、↑、↓)で主語候補および述語候補を、「異言語の」、「習得は」、「多大な」というような文節単位で選択できることが好ましい。
利用者が、修正文表示部110によって表示された主語候補および述語候補に問題がないと感じたら、主語述語確定受付部120に確定が入力され(S304のYES)、翻訳対象文、並びに主語候補情報及び述語候補情報は主語述語情報付加部122に出力される。
主語述語情報付加部122においては、翻訳対象文に主語情報および述語情報が付加される。主語情報および述語情報の付加方法としては、XML(eXtensible Markup Language)などのマークアップ言語を用いる方法や、別ファイルにより主語情報および述語情報を提供する方法などが挙げられる。主語述語情報付加部122は、利用者に明示的に翻訳対象文における主語情報および述語情報を付加してもよいし、利用者に非明示的に翻訳対象文における主語情報および述語情報を付加してもよい。用途に応じて適宜選択すればよい。
なお、表示部106に表示された時点で既に構文解析部104によって主語候補および述語候補は特定されている。したがって、表示部から出力される時点で翻訳対象文に付与されている主語情報および述語情報をそのまま出力させる場合には、主語述語情報付加部122を経ずに、表示部106から出力部124へと出力してもよい。
主語情報および述語情報が付加された翻訳対象文は、要求に応じて出力部124によって出力される(S310)。
(第2の実施形態)
第2の実施形態は、主語候補および述語候補を抜き出して表示するのではなく、翻訳対象文において利用者向けに表示する。
図8は、第2の実施形態にかかる翻訳支援装置80の構成を示すブロック図である。同図に示すように、翻訳支援装置80は、翻訳対象文受付部800と、形態素解析部802と、構文解析部804と、表示部806と、修正受付部812と、翻訳対象文修正部814と、候補変更受付部816と、候補変更部818と、主語述語確定受付部820と、主語述語情報付加部822と、出力部824とを備えている。
翻訳対象文受付部800、形態素解析部802、および構文解析部804に関しては、第1の実施形態と同様であるため、ここでは説明を省略する。
表示部806は、構文解析部から出力された主語候補および述語候補を利用者向けに表示する。第2の実施形態においては、構文解析部804が特定した主語候補および述語候補が、図9に示すように、文中において明示される。図9においては、主語候補が一重下線で、述語候補が二重下線で表示されているが、他の表示様式を用いてもよい。例えば、主語候補と述語候補とを色分け記載する様式や、主語候補の後に(主)、述語候補の後に(述)と表示する様式などが考えられる。また、主語候補から述語候補に矢印が伸びる様式も考えられる。
また、修正受付部812に利用者から修正指示が入力された場合、候補変更受付部816に利用者から変更指示が入力された場合、主語述語確定受付部818に利用者から確定指示が入力された場合には、構文解析部804から出力された主語候補および述語候補のアップデートおよび確定をする。確定した主語情報および述語情報を含む翻訳対象文は主語述語情報付加部822に出力される。
修正受付部812は、表示部806が表示した文について、利用者から表現の訂正や誤記の修正の入力を受け付ける。入力は、翻訳対象文修正部814へと出力される。
翻訳対象文修正部814は、利用者からの入力に従い翻訳対象文の修正を行う。修正された内容は、表示部806により利用者に表示される。
候補変更受付部816は、表示部806が表示した主語候補または述語候補の変更を利用者より受け付ける。表示部806により表示された修正文を見た利用者が、主語または述語が誤って認識されていると判断した場合、候補変更受付部816に正しい主語または述語を入力する。
候補変更部818は、構文解析部804が特定した主語候補または述語候補を、候補変更受付部816への利用者からの入力に従って変更する。変更後の主語候補または述語候補は表示部806によって、利用者に表示される。
主語述語確定受付部820は、表示部806に表示されている主語述語の組み合わせについて確定を受け付ける。利用者は、表示部806に表示されている主語述語の組み合わせについて確認、および必要な修正を加えた後、主語述語の関係が正しく反映されていると判断した場合に確定を入力する。主語および述語が確定した翻訳対象文は、主語述語情報付加部822へ主語情報および述語情報と共に出力され、主語情報および述語情報が翻訳対象文に付加される。
出力部824は、主語述語確定受付部820から主語情報および述語情報付きの翻訳対象文を受け取り、出力するものである。続いて機械翻訳処理が施される場合には、出力部824からは電子データの形で出力されるのが良い。確定した主語および述語情報を元にして、翻訳者を利用した翻訳を行う場合には、主語および述語情報が明示された形でテキスト印刷してもよい。本発明は機械翻訳の前編集として利用される場合に高い意義を有するが、場合によっては、本発明の前編集で確定された主語述語情報を人力により翻訳に活用してもよい。本発明の前編集を経た翻訳対象文においては、主語述語の対応関係が明示されているため、翻訳者の誤訳を減らし、また、翻訳者の文章読解に要する労力を軽減できる。
次に、このように構成された第2の実施形態にかかる翻訳支援装置80による前編集処理について説明する。図10は、第2の実施形態における前編集処理の流れを示すフローチャートである。なお、同等の機能が発現するのであれば、図示するフローチャート以外の処理も可能であることは勿論である。
まず、翻訳対象文受付部800が、利用者が入力した翻訳対象文の入力を受付ける(S1001)。翻訳対象文は一文ずつ入力されてもよいが、利用者の負担を軽減する観点からは、翻訳する予定のある複数の文を一度に入力することが好ましい。本発明の第2の実施形態の説明においては、複数の文からなる翻訳対象文を処理する態様について説明する。
次に、形態素解析部802が、翻訳対象文について形態素解析を実行し、形態素情報を出力する(S1002)。形態素解析部802から出力された形態素情報に対して、構文解析部804は構文解析を実行し、構文情報を出力する(S1003)。構文情報は、複数の文のそれぞれについて出力される。
表示部806は、構文解析部804から入力された主語候補および述語候補を表示する(S1003)。第2の実施形態においては、表示部806は、翻訳対象文の文中に、主語候補および述語候補を明示する。図9が、第2の実施形態において表示部806の表示様式の一例である。
利用者は、表示部806によって表示された主語候補および述語候補の組み合わせを確認し、述語候補の受動・能動の誤り、誤記の有無等をチェックする。述語候補の受動・能動の誤り、誤記等を発見した場合には、利用者は翻訳対象文に修正を加える(S1004のYES)。第2の実施形態においては翻訳対象文が表示部806によって利用者に提示されていることから、利用者は表示されている翻訳対象文を修正する、通常のワープロソフトにおける操作を同様の作業により、修正を行うことができる。修正受付部812に入力された修正内容は、翻訳対象文修正部814において翻訳対象文に反映され、修正後の主語候補および述語候補が表示部806により利用者に向けて表示される。
利用者が、誤記等の修正入力は必要ないが(S1004のNO)、主語候補または述語候補が誤認識されていると感じた場合には(S1006のYES)、主語候補または述語候補が修正される。図9に示す主語候補および述語候補の組み合わせにおいては、第1の実施形態の場合と同様、第3文の主語は誤認されていると思われる。
利用者は、「小さくない」に対応する主語として「声も」を選択し、「主語変更」をクリックする。修正された内容は翻訳対象文へと反映され(S1007)、修正文表示部における主語候補および述語候補の組み合わせが更新される。図11は、第3文の主語候補が変更され、第5文における誤記(活用してきた→活用されてきた)が修正された後における、表示部806による表示を示す図である。主語候補の変更に際しては、ユーザーフレンドリーの観点からは、カーソルキー(←、→、↑、↓)で主語候補および述語候補を、「異言語の」、「習得は」、「多大な」というような文節単位で選択できることが好ましい。
利用者が、表示部806によって表示された主語候補および述語候補に問題がないと感じたら、主語述語確定受付部820に確定が入力され(S1008のYES)、翻訳対象文、並びに主語候補情報及び述語候補情報は主語述語情報付加部822に出力される。利用者による確定の入力手段としては、図9に示すような確定ボタンを設定しておくことが考えられるが、かような態様に限定されるものでは勿論ない。
主語述語情報付加部822においては、翻訳対象文に主語情報および述語情報が付加される。主語情報および述語情報の付加方法としては、XML(eXtensible Markup Language)などのマークアップ言語を用いる方法や、別ファイルにより主語情報および述語情報を提供する方法などが挙げられる。主語述語情報付加部822は、利用者に明示的に翻訳対象文における主語情報および述語情報を付加してもよいし、利用者に非明示的に翻訳対象文における主語情報および述語情報を付加してもよい。用途に応じて適宜選択すればよい。
なお、表示部806に表示された時点で既に構文解析部804によって主語候補および述語候補は特定されている。したがって、表示部から出力される時点で翻訳対象文に付与されている主語情報および述語情報をそのまま出力させる場合には、主語述語情報付加部822を経ずに、表示部806から出力部824へと出力してもよい。
主語情報および述語情報が付加された翻訳対象文は、要求に応じて出力部124出力される(S310)。
出力部(120、820)より出力される主語情報および述語情報付きの翻訳対象文は、その後の翻訳において用いられる。翻訳対象文に付与されている主語情報および述語情報に基づき機械翻訳されると、翻訳コスト軽減の観点からは、特に有効である。ただし、機械翻訳用途に限定されるものではなく、翻訳者による翻訳にも有意義である。本発明の前編集を経た翻訳対象文においては、主語述語の対応関係が明示されているため、翻訳者の誤訳を減らし、また、翻訳者の文章読解に要する労力を軽減できる。
機械翻訳を行う際には、機械翻訳の方式については特に限定されない。主語および述語を固定した上で、構文解析を再度実施し、その後、機械翻訳を実行する。翻訳支援装置(10、80)から出力される前に、主語および述語を固定した上で、構文解析を再度実施し、構文情報付きの情報として出力してもよい。翻訳支援装置(10、80)と翻訳処理手段とを一体化し、翻訳装置とすることもできる。
前述のように、前編集により翻訳の品質を高めることを現実社会において普及させるためには、(1)前編集の作業がユーザーフレンドリーであること、(2)前編集に要する負担が軽いこと、(3)前編集によって翻訳時の誤訳が低減されること、が同時に満たされることが求められる。特に前編集に要する労力は、現実社会における実施を考慮すると重要なファクターである。つまり、いくら翻訳における誤訳が解消するからといって、前編集に誤訳修正に必要な労力以上の労力を掛けたのでは、前編集を行う意義が失われてしまう。例えば、特許文献6においては、「会議は大阪である」の「で」が、格助詞であるか助動詞であるかをオペレーターに問うシステムが例示されているが、言語に関する特別の知識を有しない者に、このような問いに回答することを求めるのは酷であり、前編集に要する負担が大きすぎる。
本発明においては、翻訳対象文の言語による確認であるため、翻訳先言語の知識がなくても前編集を行うことができ、ユーザーフレンドリーである。また、主語と述語との対応関係は、言語に特別の知識を有さずともチェックすることが容易である。
また、主語と述語との対応関係、言い換えれば文章の軸が誤らなければ、その他については、多少の修飾関係の不明瞭さがあったとしても、係り受けを推定することがそれほど困難ではない。実際、日本語の文章においても、理論上は多義的解釈が可能な文章は日常的に存在しているが、内容の理解が困難になることは稀である。
本発明は、種々の翻訳に適用することが可能であり、翻訳対象文の種類は限定されないが、技術レポートや特許明細書などの技術文書の翻訳に特に適している。技術文書は、日本語において省略されがちな人称代名詞(私、僕、彼など)が登場することが非常に少なく、事実を伝えることが翻訳の主目的であり、修辞法を駆使して翻訳を行う必要性に乏しい。また、翻訳は単なる労力増加要因・コスト増加要因として捉えられがちなところ、機械翻訳の適用により、労力・コストの削減を図ることが期待される。
なお、上記説明した装置で実行される翻訳支援プログラムは、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、フレキシブルディスク、CD−R、DVD等のコンピュータで読み取り可能な記録媒体に記録して提供するように構成してもよい。
さらに、上記説明した装置で実行される翻訳支援プログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよい。また、上記説明した装置で実行される翻訳支援プログラムをインターネット等のネットワーク経由で提供または配布するように構成してもよい。
上記説明した装置で実行される本発明のプログラムは、上述した各部(翻訳対象文受付部、形態素解析部、構文解析部、表示部等)を含むモジュール構成とすることができ、実際のハードウェアとしてはCPUが上述した記録媒体から本発明のプログラムを読み出して実行することにより上記各部が主記憶装置上にロードされ、各部が主記憶装置上に生成されるようにされうる。なお、本プログラムは、独立したアプリケーションとして成立していなくてもよい。例えば、既存のワープロソフトや翻訳処理ソフトに付加機能として追加されうる。
第1の実施形態にかかる翻訳支援装置10の構成を示すブロック図である。 表示部106による表示の一実施形態を示す図である。 第1の実施形態における前編集処理の流れを示すフローチャートである。 修正文表示部によって利用者に表示される画面の一例である。 第5文の述語候補が修正された後における、表示部106による表示を示す図である。 第3文が修正文表示部によって利用者に表示された状態を示す図である。 第3文の主語候補が変更された後における、表示部106による表示を示す図である。 第2の実施形態にかかる翻訳支援装置80の構成を示すブロック図である。 表示部806による表示の一実施形態を示す図である。 第2の実施形態における前編集処理の流れを示すフローチャートである。 第3文の主語候補が変更され、第5文における誤記が修正された後における、表示部806による表示を示す図である。
符号の説明
10 翻訳支援装置
100 翻訳対象文受付部
102 形態素解析部
104 構文解析部
106 表示部
108 修正候補受付部
110 修正文表示部
112 修正受付部
114 翻訳対象文修正部
116 候補変更受付部
118 候補変更部
120 主語述語確定受付部
122 主語述語情報付加部
124 出力部
80 翻訳支援装置
800 翻訳対象文受付部
802 形態素解析部
804 構文解析部
806 表示部
812 修正受付部
814 翻訳対象文修正部
816 候補変更受付部
818 候補変更部
820 主語述語確定受付部
822 主語述語情報付加部
824 出力部

Claims (7)

  1. 日本語による翻訳対象文を異言語への翻訳に先立ち前編集する翻訳支援装置であって、
    利用者が入力した翻訳対象文を受け付ける翻訳対象文受付手段と、
    前記翻訳対象文受付手段が受け付けた前記翻訳対象文を形態素解析する形態素解析手段と、
    前記形態素解析手段が解析した形態素情報を構文解析し、翻訳対象文における主語候補および述語候補を特定する構文解析手段と、
    前記構文解析手段が特定した主語候補および述語候補を、主語候補および述語情報のみが表示された表として表示する表示手段と、
    前記表示手段によって表示された文の述語候補の受動・能動の文法的誤りについて、利用者による修正を受け付ける修正受付手段と、
    前記修正受付手段により修正された後の主語候補および述語候補を、主語情報および述語情報として翻訳対象文に付加する、主語述語情報付加手段と、
    を備える、翻訳支援装置。
  2. 日本語による翻訳対象文を異言語への翻訳に先立ち前編集する翻訳支援装置であって、
    利用者が入力した翻訳対象文を受け付ける翻訳対象文受付手段と、
    前記翻訳対象文受付手段が受け付けた前記翻訳対象文を形態素解析する形態素解析手段と、
    前記形態素解析手段が解析した形態素情報を構文解析し、翻訳対象文における主語候補および述語候補を特定する構文解析手段と、
    前記構文解析手段が特定した主語候補および述語候補を文中において明示する表示手段と、
    前記表示手段によって表示された文の述語候補の受動・能動の文法的誤りについて、利用者による修正を受け付ける修正受付手段と、
    前記修正受付手段により修正された後の主語候補および述語候補を、主語情報および述語情報として翻訳対象文に付加する、主語述語情報付加手段と、
    を備える、翻訳支援装置。
  3. 前記翻訳対照文受付手段は複数の文を同時に受け付け、
    前記形態素解析手段は、前記翻訳対象文受付手段が受け付けた複数の文のそれぞれについて形態素解析をし、
    前記構文解析手段は、前記形態素解析手段が解析した複数の文のそれぞれについての形態素情報を構文解析し、前記複数の文のそれぞれについて主語候補および述語候補を特定し、
    前記表示手段は、前記構文解析手段が特定した主語候補および述語候補を、文中において明示する、請求項に記載の翻訳支援装置。
  4. 日本語による翻訳対象文を異言語へ翻訳する翻訳装置であって、
    利用者が入力した翻訳対象文を受け付ける翻訳対象文受付手段と、
    前記翻訳対象文受付手段が受け付けた前記翻訳対象文を形態素解析する形態素解析手段と、
    前記形態素解析手段が解析した形態素情報を構文解析し、翻訳対象文における主語候補および述語候補を特定する構文解析手段と、
    前記構文解析手段が特定した主語候補および述語候補を、主語候補および述語情報のみが表示された表として表示する表示手段と、
    前記表示手段によって表示された文の述語候補の受動・能動の文法的誤りについて、利用者による修正を受け付ける修正受付手段と、
    前記修正受付手段により修正された後の主語候補および述語候補を、主語情報および述語情報として翻訳対象文に付加する、主語述語情報付加手段と、
    前記主語述語付加手段により付加された主語候補および述語候補を主語および述語として認識して、翻訳対象文の異言語への翻訳を行う翻訳手段と、
    を備える、翻訳装置。
  5. 日本語による翻訳対象文を異言語へ翻訳する翻訳装置であって、
    利用者が入力した翻訳対象文を受け付ける翻訳対象文受付手段と、
    前記翻訳対象文受付手段が受け付けた前記翻訳対象文を形態素解析する形態素解析手段と、
    前記形態素解析手段が解析した形態素情報を構文解析し、翻訳対象文における主語候補および述語候補を特定する構文解析手段と、
    前記構文解析手段が特定した主語候補および述語候補を文中において明示する表示手段と、
    前記表示手段によって表示された文の述語候補の受動・能動の文法的誤りについて、利用者による修正を受け付ける修正受付手段と、
    前記修正受付手段により修正された後の主語候補および述語候補を、主語情報および述語情報として翻訳対象文に付加する、主語述語情報付加手段と、
    前記主語述語付加手段により付加された主語候補および述語候補を主語および述語として認識して、翻訳対象文の異言語への翻訳を行う翻訳手段と、
    を備える、翻訳装置。
  6. 日本語による翻訳対象文を異言語への翻訳に先立ち前編集する翻訳支援プログラムであって、
    利用者が入力した翻訳対象文を受け付ける翻訳対象文受付手順と、
    前記翻訳対象文受付ステップで受け付けた前記翻訳対象文を形態素解析する形態素解析手順と、
    前記形態素解析ステップで解析した形態素情報を構文解析し、翻訳対象文における主語候補および述語候補を特定する構文解析手順と、
    前記構文解析ステップが解析した主語候補および述語候補を主語候補および述語情報のみが表示された表として表示する表示手順と、
    前記表示手順において表示された文の述語候補の受動・能動の文法的誤りについて、利用者による修正を受け付ける修正受付手順と、
    前記修正受付手順により修正された後の主語候補および述語候補を、主語情報および述語情報として翻訳対象文に付加する、主語述語情報付加手順と、
    をコンピュータに実行させる翻訳支援プログラム。
  7. 日本語による翻訳対象文を異言語への翻訳に先立ち前編集する翻訳支援プログラムであって、
    利用者が入力した翻訳対象文を受け付ける翻訳対象文受付手順と、
    前記翻訳対象文受付ステップで受け付けた前記翻訳対象文を形態素解析する形態素解析手順と、
    前記形態素解析ステップで解析した形態素情報を構文解析し、翻訳対象文における主語候補および述語候補を特定する構文解析手順と、
    前記構文解析ステップが解析した主語候補および述語候補を文中において明示する表示手順と、
    前記表示手順において表示された文の述語候補の受動・能動の文法的誤りについて、利用者による修正を受け付ける修正受付手順と、
    前記修正受付手順により修正された後の主語候補および述語候補を、主語情報および述語情報として翻訳対象文に付加する、主語述語情報付加手順と、
    をコンピュータに実行させる翻訳支援プログラム。
JP2007324106A 2007-12-16 2007-12-16 翻訳支援装置、翻訳支援方法および翻訳支援プログラム Expired - Fee Related JP5331964B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007324106A JP5331964B2 (ja) 2007-12-16 2007-12-16 翻訳支援装置、翻訳支援方法および翻訳支援プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007324106A JP5331964B2 (ja) 2007-12-16 2007-12-16 翻訳支援装置、翻訳支援方法および翻訳支援プログラム

Publications (2)

Publication Number Publication Date
JP2009146238A JP2009146238A (ja) 2009-07-02
JP5331964B2 true JP5331964B2 (ja) 2013-10-30

Family

ID=40916758

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007324106A Expired - Fee Related JP5331964B2 (ja) 2007-12-16 2007-12-16 翻訳支援装置、翻訳支援方法および翻訳支援プログラム

Country Status (1)

Country Link
JP (1) JP5331964B2 (ja)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6190268A (ja) * 1984-10-08 1986-05-08 Sharp Corp 翻訳方式
JPS63208165A (ja) * 1987-02-25 1988-08-29 Canon Inc 翻訳装置
JPH1074201A (ja) * 1996-08-30 1998-03-17 Brother Ind Ltd 機械翻訳装置

Also Published As

Publication number Publication date
JP2009146238A (ja) 2009-07-02

Similar Documents

Publication Publication Date Title
US7904291B2 (en) Communication support apparatus and computer program product for supporting communication by performing translation between languages
US6282507B1 (en) Method and apparatus for interactive source language expression recognition and alternative hypothesis presentation and selection
US20070198245A1 (en) Apparatus, method, and computer program product for supporting in communication through translation between different languages
JP2004355625A (ja) 機械トランスレータをトレーニングする方法およびそのシステム
WO2003065245A1 (fr) Procede de traduction, procede de production de phrase traduite, support d&#39;enregistrement, programme et ordinateur
WO2009014465A2 (en) System and method for multilingual translation of communicative speech
KR101709693B1 (ko) 크라우드 소싱을 이용한 웹툰 언어 자동 번역 방법
List et al. Toward a sustainable handling of interlinear-glossed text in language documentation
US7620541B2 (en) Critiquing clitic pronoun ordering in french
JPH0344764A (ja) 機械翻訳装置
JP5331964B2 (ja) 翻訳支援装置、翻訳支援方法および翻訳支援プログラム
JP4007413B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
Kabra et al. Auto spell suggestion for high quality speech synthesis in hindi
Nolan et al. UniArab: RRG Arabic-to-English machine translation
JPH08190562A (ja) 機械翻訳装置
JP4371080B2 (ja) 自然言語学習支援装置及び方法
JP6045948B2 (ja) 機械翻訳装置及び機械翻訳プログラム
Bosch et al. Computational morphological analysers and machine-readable lexicons for South African Bantu languages
Winiwarter JETCAT-Japanese-English Translation using Corpus-based Acquisition of Transfer rules
JP3353873B2 (ja) 機械翻訳装置
Nørstebø Moshagen et al. The GiellaLT infrastructure: A multilingual infrastructure for rule-based NLP
JP3233800B2 (ja) 機械翻訳装置
JPH11265381A (ja) 言語変換方法ならびに装置及び同方法がプログラムされ記録される記録媒体
LIST Please cite as: List, Johann-Mattis and Sims, Nathanial A.(2019): Towards a sustainable handling of inter-linear-glossed text in language documentation.[Preprint under review. Not peer-reviewed]
JP4531325B2 (ja) 機械翻訳装置および機械翻訳方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101206

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20101206

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121002

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121203

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130611

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130624

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees