[go: up one dir, main page]

JP2017151553A - 機械翻訳装置、機械翻訳方法、及びプログラム - Google Patents

機械翻訳装置、機械翻訳方法、及びプログラム Download PDF

Info

Publication number
JP2017151553A
JP2017151553A JP2016031323A JP2016031323A JP2017151553A JP 2017151553 A JP2017151553 A JP 2017151553A JP 2016031323 A JP2016031323 A JP 2016031323A JP 2016031323 A JP2016031323 A JP 2016031323A JP 2017151553 A JP2017151553 A JP 2017151553A
Authority
JP
Japan
Prior art keywords
conceptual structure
morphemes
relationship
compound word
translation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2016031323A
Other languages
English (en)
Inventor
昌剛 角谷
Masatake Sumiya
昌剛 角谷
友樹 長瀬
Yuki Nagase
友樹 長瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2016031323A priority Critical patent/JP2017151553A/ja
Publication of JP2017151553A publication Critical patent/JP2017151553A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

【課題】機械翻訳において、複合語の途中に他の単語が挿入されている場合でも複合語を抽出し適切な訳文を生成する。
【解決手段】機械翻訳装置は、形態素解析部と、概念構造生成部と、概念構造変更部と、訳文生成部と、を備える。形態素解析部は、原文を解析して複数の形態素に分割する。概念構造生成部は、原文における形態素間の関係を表す概念構造を生成する。概念構造変更部は、概念構造における形態素間の関係に基づいて生成した複合語の候補が辞書データに登録されている場合に、概念構造における複数の形態素を1個の複合語を表す形態素に変更する。訳文生成部は、概念構造変更部において変更された概念構造と、辞書データとに基づいて原文の訳文を生成する。
【選択図】図1

Description

本発明は、機械翻訳装置、機械翻訳方法、及びプログラムに関する。
第1の言語による文章(原文)を第2の言語に機械翻訳(自動翻訳)する方法の1つに、ルールベース翻訳と呼ばれる方法がある。ルールベース翻訳では、単語の意味及び文法ルールを含む辞書データを用いて原文に対する訳文を生成する。ルールベース翻訳においては、原文に対する形態素解析の結果及び辞書データに基づいて原文の概念構造を生成した後、概念構造及び辞書データに基づいて訳文を生成する。
ルールベース翻訳では、辞書データに登録されていない単語や複合語が原文に含まれる場合、正確な訳文や自然な訳文を生成することが難しい。ところが、辞書データへの単語や複合語の登録数を多くする場合、登録処理に手間がかかる上、辞書データが肥大化する。
このため、ルールベース翻訳では、辞書データにおける熟語(複合語)を、単語位置マークを含む表現形式とすることで、複合語の不正確な訳を防止するとともに、辞書データの容量の増大を抑制している(例えば、特許文献1を参照)。
特開平5−197745号公報
しかしながら、原文では、複合語の途中に予期せぬ修飾語等が挿入されることがある。ルールベース翻訳において修飾語等の他の単語が挿入された複合語を正しく翻訳するには、それぞれの複合語において修飾語等が挿入され得る箇所を想定し単語位置マークを含む表現形式で辞書データに登録する必要がある。このため、辞書データへの複合語の登録処理には非常に手間がかかる。更に、種々の複合語の全てに対し、修飾語等が挿入され得る箇所を想定して全ての組み合わせを網羅することは非常に困難である。
1の側面において、本発明は、機械翻訳において、複合語の途中に他の単語が挿入されている場合でも複合語を抽出し適切な訳文を生成することを目的とする。
機械翻訳装置は、形態素解析部と、概念構造生成部と、概念構造変更部と、訳文生成部と、を備える。形態素解析部は、原文を解析して複数の形態素に分割する。概念構造生成部は、原文における形態素間の関係を表す概念構造を生成する。概念構造変更部は、概念構造における形態素間の関係に基づいて生成した複合語の候補が辞書データに登録されている場合に、概念構造における複数の形態素を1個の複合語を表す形態素に変更する。訳文生成部は、概念構造変更部において変更された概念構造と、辞書データとに基づいて原文の訳文を生成する。
機械翻訳において、複合語の途中に他の単語が挿入されている場合でも複合語を抽出し適切な訳文を生成することが可能となる。
第1の実施形態に係る機械翻訳装置の機能的構成を示す図である。 辞書データの例を示す図である。 合成規則の例を示す図である。 第1の実施形態に係る翻訳処理を説明するフローチャートである。 概念構造変更処理の内容を説明するフローチャートである。 翻訳処理の一例を説明する図(その1)である。 翻訳処理の一例を説明する図(その2)である。 翻訳処理の別の例を説明する図(その1)である。 翻訳処理の別の例を説明する図(その2)である。 第2の実施形態に係る機械翻訳装置の機能的構成を示す図である。 機械翻訳システムの構成例を示す図である。 コンピュータのハードウェア構成を示す図である。
[第1の実施形態]
図1は、第1の実施形態に係る機械翻訳装置の機能的構成を示す図である。
図1に示すように、本実施形態の機械翻訳装置1は、原文受付部101と、形態素解析部102と、概念構造生成部103と、概念構造変更部104と、訳文生成部105と、訳文出力部106と、辞書データ保持部110と、を備える。
原文受付部101は、機械翻訳装置1に翻訳させる文章(原文)の入力を受け付ける。機械翻訳装置1に翻訳させる原文は、例えば、テキストデータ等の文字データである。原文の入力は、例えば、機械翻訳装置1の利用者が機械翻訳装置1に接続されたキーボード装置等の入力装置を用いて行う。
形態素解析部102は、辞書データ保持部110が保持する辞書データを参照して原文に対する形態素解析を行い、原文を形態素に分割する処理を行う。
概念構造生成部103は、辞書データと、原文における各形態素の係り受け構造とに基づいて、原文の概念構造を生成する。以下、概念構造における形態素のことを「ノード」ともいう。
概念構造変更部104は、生成した概念構造におけるノード間の関係と、辞書データと、ノードの合成規則とに基づいて、複数のノードの合成や置換等を行い、概念構造を変更する。概念構造変更部104は、複合語抽出部104aと、合成規則反映部104bと、合成規則保持部104cと、を含む。複合語抽出部104aは、概念構造におけるノード間の関係と、合成規則保持部104cが保持する合成規則と、辞書データとに基づいて、複数のノードの組み合わせで表される複合語を抽出する。合成規則反映部104bは、抽出した複合語に係るノード及びノード間の関係に対して合成規則を反映させて概念構造を変更する。
訳文生成部105は、原文の形態素及び概念構造と、辞書データとに基づいて、訳文を生成する。概念構造変更部104において概念構造を変更した場合、訳文生成部105は、原文の形態素と変更後の概念構造に基づいて、訳文を生成する。
訳文出力部106は、生成した訳文を出力する。訳文出力部106は、例えば、生成した訳文を含む画像データを表示装置に出力して表示させる。
図2は、辞書データの例を示す図である。
辞書データは、翻訳に係る第1の言語と第2の言語との語句の対応関係等が登録されたデータである。第1の言語が英語であり、第2の言語が日本語である場合の辞書データは、図2に示したように、英語における語句と、日本語における語句と、品詞とが対応付けられている。辞書データに登録される語句は、単語の他に、複数の単語が結合して特定の意味を持つ複合語も含む。例えば、英語の「green apple」は、単語単位で訳すと「緑のリンゴ」であるが、日本語で「青リンゴ」と呼ばれているリンゴを意味する。また、例えば、英語の「machine translation」は、日本語ではコンピュータによる翻訳という意味での「自動翻訳」又は「機械翻訳」を意味する。このような複合語を含む原文から複合語に特有の意味を反映させた自然な訳文を生成するため、辞書データには「green apple」や「machine translation」等の複合語も登録される。なお、辞書データは、言語間の語句の対応関係の他、構文解析に用いる品詞間の係り受けの関係等の情報を含む。
図3は、合成規則の例を示す図である。
合成規則保持部104cが保持する合成規則は、原文の概念構造における複数のノードの合成や置換についての規則が登録されたデータである。合成規則は、図3に示したように、ノード間の関係と、合成語表記と、置換規則と、を含む。
ノード間の関係は、概念構造における複数のノード間の係り受けの関係を表す。例えば、図3に示した合成規則における規則1のノード間の関係は、形容詞(A)のノードと、名詞(N)のノードとの間に「名詞(N)は形容詞(A)の修飾対象」という関係があることを表す。また、規則2のノード間の関係は、第1の名詞(N1)と第2の名詞(N2)との間に「第2の名詞(N2)は第1の名詞(N1)の概念の範囲を限定する」という関係があることを表す。
合成語表記は、概念構造にノード間の関係を満たすノードの組がある場合に、当該ノードの組から推定される複合語のノードの語順を表す情報である。例えば、規則1の関係を満たす名詞(N)のノードと形容詞(A)のノードとの組がある場合、当該ノードの組は「形容詞(A)+名詞(N)」の語順で表記される1個の複合語であると推定する。また、規則2のノード間の関係を満たす第1の名詞(N1)と第2の名詞(N2)との組がある場合、当該ノードの組は「第2の名詞(N2)+第1の名詞(N1)」の語順で表記される1個の複合語であると推定する。また、規則3のノード間の関係を満たす第1の名詞(N1)と第2の名詞(N2)と第3の名詞(N3)との組がある場合、当該3個の名詞の組には「第3の名詞(N3)+第1の名詞(N1)」の語順で表記される複合語が存在すると推定する。
置換規則は、3個以上のノード間に特定の係り受けの関係があり、かつノード間の関係から推定した複合語が辞書データに登録されている場合の概念構造の変更規則を表す情報である。例えば、第1の名詞(N1)のノードと、第2の名詞(N2)のノードと、第3の名詞(N3)のノードとの間に規則3の関係があり、かつ「第3の名詞(N3)+第1の名詞(N1)」の語順で表記される複合語が辞書データに登録されているとする。この場合、当該3個の名詞のノード間の関係は、置換規則に基づいて次のように変更する。第1の名詞(N1)のノードと第3の名詞(N3)のノードとを「第3の名詞(N3)+第1の名詞(N1)」の語順で表記される複合語(N3+N1)を表す1個のノードに置換する。また、第2の名詞(N2)のノードと複合語(N3+N1)のノードとの関係を「第2の名詞(N2)は複合語(N3+N1)の概念の範囲を限定する」という関係に変更する。
図4は、第1の実施形態に係る翻訳処理を説明するフローチャートである。
本実施形態の機械翻訳装置1は、図4に示すように、まず、原文データの入力を受け付ける(ステップS1)。ステップS1の処理は、原文受付部101が行う。原文受付部101は、例えば、機械翻訳装置1の利用者(オペレータ)がキーボード装置等を利用して作成した原文データ(原文の文字データ)、或いは利用者が指定した電子ファイルの原文データを読み込み、形態素解析部102に送信する。
次に、機械翻訳装置1は、形態素解析部102において、入力された原文データに対する形態素解析を行う(ステップS2)。形態素解析部102は、辞書データ保持部110の辞書データを参照し、既知の解析方法に従って原文を解析して形態素に分割する。形態素解析部102は、原文に対する形態素解析の結果を概念構造生成部103に送信する。
次に、機械翻訳装置1は、概念構造生成部103において、形態素解析の結果及び辞書データに基づいて原文の概念構造を生成する(ステップS3)。概念構造生成部103は、機械翻訳における既知の構文解析法及び意味解析法に従って、形態素(ノード)間の関係を表す概念構造を生成する。概念構造生成部103は、生成した概念構造を概念構造変更部104に送信する。
次に、機械翻訳装置1は、概念構造変更部104において、概念構造変更処理を行う(ステップS4)。概念構造変更部104は、概念構造におけるノード間の関係と、辞書データと、合成規則とに基づいて、辞書データに登録された複合語と合致する合成語表記に係る複数のノードを1個のノードに変更する処理を行う。概念構造変更部104は、概念構造変更処理を行った後の概念構造を訳文生成部105に送信する。なお、合成規則に登録された関係を満たすノード間の関係が概念構造に存在しない場合、概念構造変更部104は、原文の概念構造を概念構造変更処理の結果として訳文生成部105に送信する。また、合成規則の合成語表記で表される合成語(複合語の候補)が辞書データに登録されていない場合も、概念構造変更部104は、原文の概念構造を概念構造変更処理の結果として訳文生成部105に送信する。
次に、機械翻訳装置1は、訳文生成部105において、概念構造変更処理後の概念構造と、形態素の組み合わせと、辞書データとに基づいて訳文を作成する(ステップS5)。訳文生成部105は、機械翻訳における既知の訳文生成法に基づいて、概念構造に従った訳文を生成する。訳文生成部105は、生成した訳文を訳文出力部106に送信する。
次に、機械翻訳装置1は、訳文出力部106において、訳文生成部105で生成した訳文を出力する(ステップS6)。訳文出力部106は、例えば、訳文を含む画像データを液晶表示ディスプレイ等の表示装置に出力して表示させる。ステップS6の処理を終えると、機械翻訳装置1は、入力された原文に対する翻訳処理を終了する。
図5は、概念構造変更処理の内容を説明するフローチャートである。
概念構造変更処理(ステップS4)は、機械翻訳装置1の概念構造変更部104が行う。
概念構造変更部104は、図5に示すように、まず、概念構造におけるノード間の関係を1つ選択する(ステップS401)。ステップS401の処理は、複合語抽出部104aが行う。
次に、概念構造変更部104は、選択したノード間の関係をキー情報として合成規則保持部104cが保持する合成規則を検索し(ステップS402)、選択したノード間の関係と合致する合成規則があるか否かを判定する(ステップS403)。ステップS402の処理、及びステップS403の判定は、複合語抽出部104aが行う。
選択したノード間の関係と合致する合成規則がある場合(ステップS403;Yes)、概念構造変更部104は、次に、合成規則におけるノード間の関係と対応付けられた合成語表記の語順に従って複合語の候補を生成する(ステップS404)。ステップS404の処理は、複合語抽出部104aが行う。
複合語の候補を生成すると、概念構造変更部104は、次に、複合語の候補をキーワードとして辞書データを検索し(ステップS405)、複合語の候補が辞書データに登録されているか否かを判定する(ステップS406)。ステップS405の処理、及びステップS406の判定は、複合語抽出部104aが行う。
複合語の候補が辞書データに登録されている場合(ステップS406;Yes)、概念構造変更部104は、次に、合成規則に従ってノード間の関係を変更する(ステップS407)。ステップS407の処理は、合成規則反映部104bが行う。合成規則反映部104bは、ステップS401で選択したノード間の関係における合成語表記に係るノードの組を1個の複合語のノードに変更する。また、合成規則反映部104bは、ステップS401で選択したノード間の関係に対する置換規則が合成規則に登録されている場合、当該置換規則に従ってノード間の関係を変更する。
ステップS407の後、概念構造変更部104は、未選択のノード間の関係があるか否かを判定する(ステップS408)。なお、複合語の候補が辞書データに登録されていない場合(ステップS406;No)、概念構造変更部104は、ステップS407の処理を省略してステップS408の判定を行う。更に、ステップS401で選択したノード間の関係と合致する合成規則がない場合(ステップS403;No)、概念構造変更部104は、ステップS404〜S407の処理を省略してステップS408の判定を行う。
ステップS408において、概念構造変更部104は、例えば、ステップS3で生成した概念構造において選択し得るノード間の関係のなかにステップS403の判定を行っていない関係があるか否かを判定する。ステップS403の判定を行っていないノード間の関係が残っている場合(ステップS408;Yes)、概念構造変更部104が行う処理は、ステップS401に戻る。そして、選択し得る全てのノード間の関係に対してステップS403の判定を行った場合(ステップS408;No)、概念構造変更部104は、概念構造変更処理を終了する(リターン)。
図6Aは、翻訳処理の一例を説明する図(その1)である。図6Bは、翻訳処理の一例を説明する図(その2)である。
本実施形態に係る機械翻訳処理の一例として、図6Aの(a)に示した「She ate a green big apple.」という原文(英語の文)を日本語に翻訳する例を挙げる。
原文の入力を受け付けると、機械翻訳装置1は、原文に対する形態素解析を行う。原文に対する形態素解析を行うと、図6Aの(b)に示したような解析結果が得られる。すなわち、原文は、「She(PRON)」、「ate(V)」、「a(ART)」、「green(A)」、「big(A)」、「apple(N)」、及び「.(SYM)」の7個の形態素に分割される。ここで、各形態素には、それぞれの品詞を括弧書きで付している。括弧書きで付した品詞のうち、PRONは代名詞を意味し、Vは動詞を意味する。また、ARTは冠詞(不定冠詞)を意味し、Aは形容詞を意味する。更に、Nは名詞を意味し、SYMは記号を意味する。
次に、機械翻訳装置1は、形態素解析の結果に基づいて、図6Aの(c)に示すような概念構造を生成する。すなわち、原文の概念構造は、「she(PRON)」のノード201と、「ate」の原形である「eat(V)」のノード202と、「apple(N)」のノード203と、「big(A)」のノード204と、「green(A)」のノード205との5個のノードを含む。
また、原文の概念構造では、ノード間の関係として下記(関係1)〜(関係4)の関係が設定される。
(関係1)「she(PRON)」のノード201と「eat(V)」のノード202との間の「ノード201はノード202の動作主である」という関係。
(関係2)「apple(N)」のノード203と「eat(V)」のノード202との間の「ノード203はノード202の動作対象である」という関係。
(関係3)「apple(N)」のノード203と「big(A)」のノード204との間の「ノード203はノード204の修飾対象である」という関係。
(関係4)「apple(N)」のノード203と「green(A)」のノード205との間の「ノード203はノード205の修飾対象である」という関係。
図6Aの(c)に示した概念構造を生成すると、機械翻訳装置1は、次に、生成した概念構造と、図3の合成規則と、図2の辞書データとに基づいて、概念構造変更処理(ステップS4)を行う。
概念構造における(関係1)〜(関係4)のうち図3の合成規則に登録された関係は、(関係3)及び(関係4)である。このため、ステップS401で(関係3)を選択した場合、概念構造変更部104は、ステップS404において、図6Aの(d)に示したように、ノード間の関係と対応する「big apple」という表記の合成語(複合語の候補)を生成する。また、ステップS401で(関係4)を選択した場合、概念構造変更部104は、ステップS404において、図6Aの(d)に示したように、ノード間の関係と対応する「green apple」という表記の合成語(複合語の候補)を生成する。
ここで、「big apple」は、日本語では「大きいリンゴ」という意味であり、「big apple」という1個の複合語に特有の意味はない。一方、「green apple」は、日本語では「青リンゴ」という意味があり、「green apple」という1個の複合語に特有の意味がある。このため、辞書データには、図2に示したように、「big apple」及び「green apple」のうち「green apple」という複合語のみが登録されている。
「big apple」及び「green apple」のうち「green apple」のみが辞書データに登録されている場合、概念構造変更部104は、ステップS406において「big apple」が辞書データに登録されていないと判定する。この場合、概念構造変更部104は、図6Aの(c)に示した概念構造における「apple(N)」のノード203と「big(A)」のノード204との関係を変更しない。
一方、「big apple」及び「green apple」のうち「green apple」のみが辞書データに登録されている場合、概念構造変更部104は、ステップS406において「green apple」が辞書データに登録されていると判定する。この場合、概念構造変更部104は、図6Aの(c)に示した概念構造における「apple(N)」のノード203と「green(A)」のノード205とを、1個の複合語「green apple」を表すノードに変更する。
よって、概念構造変更処理により、原文の概念構造は、図6Bの(e)に示す構造に変更される。すなわち、概念構造変更処理後の概念構造は、「she(PRON)」のノード201と、「eat(V)」のノード202と、「big(A)」のノード204と、「green apple(N)」のノード206との4個のノードを含む。
また、概念構造変更処理後の概念構造では、ノード間の関係として下記(関係1)、(関係5)、及び(関係6)の関係が設定される。
(関係1)「she(PRON)」のノード201と「eat(V)」のノード202との間の「ノード201はノード202の動作主である」という関係。
(関係5)「green apple(N)」のノード206と「eat(V)」のノード202との間の「ノード206はノード202の動作の対象である」という関係。
(関係6)「green apple(N)」のノード206と「big(A)」のノード204との間の「ノード206はノード204の修飾対象である」という関係。
このように原文の概念構造を変更した場合、訳文生成部105は、図6Aの(a)に示した原文を、図6Bの(f)に示した文「She / ate / a / big / green apple / .」と解釈して日本語の文に翻訳する。なお、図6Bの(f)の文におけるスラッシュ(/)は、形態素の区切りを表す。
概念構造変更処理後の文では、「green」及び「big」の2個の形容詞の語順が入れ替わっており、かつ「green」及び「apple」が「green apple」という1個の複合語(形態素)に変更されている。よって、訳文生成部105が生成する訳文は、図6Bの(g)に示すように「彼女は大きい青リンゴを食べた。」となる。
図6Aの(b)に示した形態素及び図6Aの(c)に示した概念構造に基づいて訳文を生成する場合、訳文生成部105は、例えば、「彼女は緑色の大きいリンゴを食べた。」という訳文を生成する。この訳文における「緑色の大きいリンゴ」は、原文の「green big apple」に対する訳として誤りであるとは言い切れない。しかしながら、「green big apple」は、「緑色の大きいリンゴ」と訳すよりも「大きい青リンゴ」と訳すほうが自然な訳に感じられる。また、「緑色の大きいリンゴ」と訳した場合、大きい青リンゴのことを指すのか、熟す前の大きいリンゴのことを指すのかが不明確になる可能性がある。
これに対し、本実施形態に係る翻訳処理では、上記のように、概念構造におけるノード(形態素)間の関係と、合成規則とに基づいて、「green / big / apple」を「big / green apple」に変更する。そのため、途中に予期しない修飾語(big)が挿入された複合語(green apple)を、複合語に特有の意味で訳すことが可能となる。よって、本実施形態に係る翻訳処理では、複合語における単語間に他の単語が挿入されている原文であっても、複合語に特有の意味を用いた適切な訳文を生成することが可能となる。
また、概念構造を変更させることなく「彼女は大きい青リンゴを食べた。」という訳文を生成するには、例えば、「green apple(青リンゴ)」という複合語とは別に「green big apple(大きい青リンゴ)」という複合語を辞書データに付加する必要が生じる。更に、「(形容詞1) (形容詞2) (名詞)」という語順の場合に「(形容詞2) (形容詞1 + 名詞)」として翻訳するには、種々の形容詞(修飾語)を含む複合語を辞書データに登録する必要が生じる。そのため、概念構造を変更させることなく適切な訳文が生成されるようにする場合、辞書データに複合語を登録する処理に手間がかかる上、辞書データのデータ量が増大(肥大化)する。
一方、本実施形態に係る翻訳処理では、概念構造におけるノード間の関係と、合成規則とに基づいて複合語に係るノード間の関係を変更する。この際、ノード間の関係は各ノードの品詞と係り受けの関係で定義するため、ノード間の関係が同一であれば単語の組み合わせによらず同一の規則を適用可能である。したがって、合成規則を作成する処理は、辞書データに種々の複合語を登録する処理と比べて手間が少ない。更に、同一の合成規則を単語の組み合わせが異なる多数の複合語に適用可能であるため、辞書データに多数の複合語を登録することによるデータ量の肥大化を抑制することが可能となる。
図7Aは、翻訳処理の別の例を説明する図(その1)である。図7Bは、翻訳処理の別の例を説明する図(その2)である。
本実施形態に係る翻訳処理の別の例として、図7Aの(a)に示した「... machine EJ translation ...」の部分を日本語に翻訳する例を挙げる。なお、原文における「EJ」は、「English-Japanese」の略語として辞書データに登録されているものとする。
原文の入力を受け付けると、機械翻訳装置1は、原文に対する形態素解析を行う。原文に対する形態素解析を行うと、図7Aの(b)に示したような解析結果が得られる。
すなわち、原文は、「machine(N)」、「EJ(N)」、「translation(N)」の3個の形態素に分割される。ここで、各形態素に付した「(N)」は、名詞であることを意味する。
次に、機械翻訳装置1は、形態素解析の結果に基づいて、図7Aの(c)に示すような概念構造を生成する。すなわち、原文の概念構造は、「translation(N1)」のノード211と、「EJ(N2)」のノード212と、「machine(N3)」のノード213とを含む。
また、この概念構造では、ノード間の関係として下記(関係7)及び(関係8)が設定される。
(関係7)「translation(N1)」のノード211と「EJ(N2)」のノード212との間の「ノード212はノード211の概念の範囲を限定する」という関係。
(関係8)「EJ(N2)」のノード212と「machine(N3)」のノード213との間の「ノード213はノード212の概念の範囲を限定する」という関係。
すなわち、「translation(N1)」のノード211、「EJ(N2)」のノード212、及び「machine(N3)」のノード213の3個のノード間の関係は、図3の合成規則における規則3の関係と合致する。
図7Aの(c)に示した概念構造を生成すると、機械翻訳装置1は、次に、生成した概念構造と、図3の合成規則と、辞書データとに基づいて、概念構造変更処理(S4)を行う。図3の合成規則における規則3では、合成語表記が「N3+N1」となっている。このため、機械翻訳装置1の概念構造変更部104は、ステップS404において、図7Aの(d)に示したように、「machine translation(N3+N1)」という表記の合成語(複合語の候補)を生成する。
「machine translation」は、日本語では「自動翻訳」、「機械翻訳」という1個の複合語としての意味がある。このため、図2の辞書データのように「machine translation(N:名詞)」という複合語が登録されている場合、概念構造変更部104は、図7Aの(c)に示した概念構造を、図7Bの(e)に示した概念構造に変更する。すなわち、概念構造変更処理後の概念構造は、「machine translation(N3+N1)」のノード214、及び「EJ(N2)」のノード212、の2個のノードを含む。
また、図3の合成規則における規則3には、3個のノード間の関係を「名詞(N2)は名詞(N3+N1)の概念の範囲を限定する」というに関係に置換する置換規則が対応付けられている。そのため、概念構造変更処理後の概念構造では、図7Bの(e)に示したように、「EJ(N)」のノード212と「machine translation(N)」のノード214との間に、「ノード212はノード214の概念の範囲を限定する」という関係が設定される。
このように原文の概念構造を変更した場合、訳文生成部105は、図7Aの(a)に示した原文を、図7Bの(f)に示した文「... / EJ / machine translation / ...」と解釈して日本語の文に翻訳する。なお、図7Bの(f)の文におけるスラッシュ(/)は、形態素の区切りを表す。
概念構造変更処理後の文では、「machine」及び「EJ」の2個の名詞の語順が入れ替わっており、かつ「machine」及び「translation」が「machine translation」という1個の複合語(形態素)に変更されている。よって、訳文生成部105が生成する訳文における「machine EJ translation」の部分は、図7Bの(g)に示すように「英日自動翻訳」となる。
図7Aの(b)に示した形態素及び図7Aの(c)に示した概念構造に基づいて訳文を生成する場合、訳文生成部105は、「machine EJ translation」の部分を、例えば「機械英日翻訳」と訳す。この訳は誤りとは言い切れないが、辞書データに登録された「machine translation」という複合語の持つ意味を反映した適切な訳にはなっていない。
また、概念構造を変更させることなく「英日自動翻訳」という訳文を生成するには、「machine EJ translation」という複合語を辞書データに付加する必要が生じる。更に、「(名詞3) (名詞2) (名詞1)」という語順の場合に「(名詞2) (名詞3 + 名詞1)」として翻訳させるには、3個の名詞を含む種々の複合語を辞書データに登録する必要が生じる。そのため、概念構造を変更させることなく適切な訳文が生成されるようにする場合、辞書データに複合語を登録する処理に手間がかかる上、辞書データのデータ量が増大する。
これに対し、本実施形態に係る翻訳処理では、上記のように、概念構造におけるノード(形態素)間の関係と、合成規則とに基づいて、「machine / EJ / translation」を「EJ / machine translation」に変更する。そのため、途中に予期しない限定詞(EJ)が挿入された複合語(machine translation)を、複合語の持つ意味で訳すことが可能となる。よって、本実施形態に係る翻訳処理では、複合語における単語間に他の単語が挿入されている原文であっても、複合語に特有の意味を用いた適切な訳文を生成することが可能となる。
また、本実施形態に係る翻訳処理では、概念構造におけるノード間の関係と、合成規則とに基づいて複合語に係るノード間の関係を変更する。この際、ノード間の関係は各ノードの品詞と係り受けの関係で定義するため、ノード間の関係が同一であれば単語の組み合わせによらず同一の規則を適用可能である。したがって、合成規則を作成する処理は、辞書データに種々の複合語を登録する処理と比べて手間が少ない。更に、同一の合成規則を単語の組み合わせが異なる多数の複合語に適用可能であるため、辞書データに多数の複合語を登録することによるデータ量の肥大化を抑制することが可能となる。
以上のように、本実施形態に係る翻訳処理では、ノード間の関係に基づいて生成した複合語の候補が辞書データに登録されている場合には合成規則に従って概念構造を変更し、変更後の概念構造に基づいて訳文を生成する。そのため、複合語の単語間(形態素間)に他の単語(修飾語や限定名詞等)が挿入されているような場合であっても、機械翻訳装置1は、複合語の持つ意味を用いた自然な訳文を生成することができる。
また、合成規則は、ノード(品詞)間の関係と、合成語表記と、置換規則との対応関係を表すものであるため、ノード間の関係が同一であれば単語の組み合わせによらず適用可能である。そのため、合成規則を作成する処理は、辞書データに多数の複合語を登録する処理と比べて手間が少ない。辞書データに登録する複合語の数の増大を抑制することができるため、辞書データのデータ量の肥大化を抑制することが可能となる。
また、本実施形態に係る翻訳処理では、原文の概念構造におけるノード間の関係のうちの合成規則と合致するノード間の関係に含まれる複数のノードを用いて複合語の候補を生成する。そのため、原文の概念構造における全てのノード間の関係のうちの複合語になり得ないノード間の関係から複合語の候補を生成して辞書データを検索する処理を省略でき、翻訳処理に係る処理負荷の増大を抑制することが可能となる。
なお、本実施形態に係る機械翻訳装置1が行う機械翻訳処理は、テキストデータ等の文字データの翻訳に限らず、音声データとして入力された原文を翻訳する処理であってもよい。また、生成した訳文は、文字データとして出力する代わりに、音声に変換して出力してもよい。
更に、本実施形態に係る機械翻訳処理で用いる辞書データは、図2に示した英語と日本語との対応関係を表す辞書データに限らず、他の言語間の対応関係を表す辞書データであってもよい。また、機械翻訳装置1は、言語の組み合わせが異なる複数の辞書データ及び対応する合成規則を保持させ、原文の言語に応じて辞書データ及び合成規則を使い分けてもよい。
[第2の実施形態]
図8は、第2の実施形態に係る機械翻訳装置の機能的構成を示す図である。
図8に示すように、本実施形態の機械翻訳装置1は、原文受付部101と、形態素解析部102と、概念構造生成部103と、概念構造変更部104と、訳文生成部105と、訳文出力部106と、辞書データ保持部110と、を備える。また、概念構造変更部104は、複合語抽出部104aと、合成規則反映部104bと、合成規則保持部104cと、を含む。また、本実施形態の機械翻訳装置1は、合成規則編集部107、を更に備える。
本実施形態の機械翻訳装置1における原文受付部101、形態素解析部102、概念構造生成部103、概念構造変更部104、及び訳文生成部105の各部は、それぞれ、第1の実施形態で説明した機能を有する(処理を行う)。また、辞書データ保持部110には、図2に示したような辞書データを保持させる。また、概念構造変更部104の合成規則保持部104cには、図3に示したような合成規則を保持させる。
一方、本実施形態の機械翻訳装置1における合成規則編集部107は、合成規則保持部104cに保持させている合成規則を編集する。合成規則編集部107は、例えば、機械翻訳装置1の管理者(オペレータ)がキーボード装置等を利用して作成した新たな合成規則についての情報の入力を受け付け、合成規則保持部104cに保持させている合成規則に追加する処理を行う。また、合成規則編集部107は、例えば、管理者(オペレータ)がキーボード装置等を利用して修正した合成規則についての情報の入力を受け付け、合成規則保持部104cに保持させている合成規則を修正する処理を行う。
すなわち、本実施形態に係る機械翻訳装置1は、合成規則保持部104cに保持させる合成規則を随時編集可能な構成となっている。そのため、利用者からの要望等に応じて管理者が合成規則を追加又は修正することが可能となる。
また、本実施形態に係る機械翻訳装置1は、例えば、インターネット等の通信ネットワークを介して複数の利用者に機械翻訳のサービスを提供する機械翻訳システムに適用可能である。
図9は、機械翻訳システムの構成例を示す図である。
図9に示すように、機械翻訳システム3は、サーバ121と、記憶部122と、管理者端末123と、を備える。サーバ121は、図8の機械翻訳装置1における原文受付部101、形態素解析部102、概念構造生成部103、複合語抽出部104a、合成規則反映部104b、訳文生成部105、及び訳文出力部106を含む。記憶部122は、辞書データ保持部110及び合成規則保持部104cとして機能し、辞書データ125及び合成規則126を保持する。管理者端末123は、機械翻訳システムの管理者が利用する端末であり、合成規則編集部107を含む。
サーバ121と、記憶部122と、管理者端末123とは、バス129により通信可能に接続されている。機械翻訳システム3の管理者は、管理者端末123を操作して合成規則を作成又は変更し、記憶部122の合成規則126を編集することが可能である。すなわち、図9の機械翻訳システム3におけるサーバ121、記憶部122、及び管理者端末123が、図8の機械翻訳装置1として機能する。
また、機械翻訳装置1(サーバ121、記憶部122、及び管理者端末123)は、インターネット等の通信ネットワーク4と通信可能に接続されている。機械翻訳システム3の利用者は、利用者端末5を用い、通信ネットワーク4を介して機械翻訳装置1のサーバ121にアクセスすることにより、機械翻訳のサービスを利用可能となる。サーバ121は、利用者端末5から原文を受信し入力を受け付けると、辞書データ125及び合成規則126に基づいて訳文を生成し、生成した訳文を利用者端末5に返信する。
なお、機械翻訳システム3における機械翻訳装置1は、本実施形態に係る機能的構成の装置に限らず、第1の実施形態で挙げた構成と対応したサーバ121及び記憶部122を備えた構成であってもよい。
また、第1及び第2の実施形態に係る機械翻訳装置1は、例えば、辞書データ保持部110で保持する辞書データの内容を随時変更可能な構成であってもよい。
更に、機械翻訳システム3では、例えば、サーバ121において翻訳処理の履歴(合成規則の反映履歴)を蓄積してもよい。蓄積した履歴は、例えば、各合成規則の適用頻度の算出に用いることが可能である。各合成規則の適用頻度に基づいて、例えば、適用頻度の高い順に合成規則を並べ替える編集をすることで、概念構造変更部104による概念構造変更処理(ステップS4)を効率よく行うことが可能となる。
また、図4及び図5に示したフローチャートは、機械翻訳装置1が行う翻訳処理の一例に過ぎず、必要に応じて処理の内容を変更又は追加可能である。
また、第1及び第2の実施形態に係る機械翻訳装置1は、例えば、コンピュータと、当該コンピュータに実行させるプログラムとを用いて実現することが可能である。以下、コンピュータとプログラムとを用いて実現される機械翻訳装置について、図10を参照して説明する。
図10は、コンピュータのハードウェア構成を示す図である。
図10に示すように、コンピュータ9は、Central Processing Unit(CPU)901と、主記憶装置902と、補助記憶装置903と、入力装置904と、出力装置905と、を備える。また、コンピュータ9は、通信制御装置906と、記憶媒体駆動装置907と、を備える。コンピュータ9におけるこれらの要素901〜907は、バス910により相互に接続されており、要素間でのデータの受け渡しが可能になっている。
CPU 901は、オペレーティングシステムを含む各種のプログラムを実行することによりコンピュータ9の全体の動作を制御する演算処理装置である。
主記憶装置902は、図示しないRead Only Memory(ROM)及びRandom Access Memory(RAM)を含む。主記憶装置902のROMには、例えばコンピュータ9の起動時にCPU 901が読み出す所定の基本制御プログラム等が予め記録されている。また、主記憶装置902のRAM は、CPU 901が各種のプログラムを実行する際に、必要に応じて作業用記憶領域として使用する。主記憶装置902のRAMは、例えば、原文の形態素の訳、概念構造、及び合成規則等の記憶に利用可能である。
補助記憶装置903は、Hard Disk Drive(HDD)やSolid State Drive(SSD)等の主記憶装置902に比べて容量の大きい記憶装置である。補助記憶装置903には、CPU 901によって実行される各種のプログラムや各種のデータ等を記憶させることができる。補助記憶装置903は、例えば、図4及び図5に示した処理等を含む翻訳プログラムの記憶に利用可能である。また、補助記憶装置903は、例えば、辞書データ及び合成規則の記憶に利用可能である。
入力装置904は、例えばキーボード装置やタッチパネル装置等である。コンピュータ9のオペレータが入力装置704に対し押下する等の操作を行うと、入力装置904は、その操作内容に対応付けられている入力情報をCPU 901に送信する。また、音声入力に対応したコンピュータ9の場合、入力装置904にはマイクロフォン等の音声入力装置を利用可能である。
出力装置905は、例えば、液晶ディスプレイやスピーカ等である。出力装置905は、例えば、訳文生成部105が生成した訳文(文字データ)を画像又は音声として出力する。
通信制御装置906は、通信ネットワーク4を介した、コンピュータ9と図示しない他の通信端末との各種通信を制御する装置である。
記憶媒体駆動装置907は、図示しない可搬型記憶媒体に記録されているプログラムやデータの読み出し、補助記憶装置903に記憶されたデータ等の可搬型記憶媒体への書き込みを行う。可搬型記憶媒体としては、例えば、USB規格のコネクタが備えられているフラッシュメモリが利用可能である。また、可搬型記憶媒体としては、Compact Disk(CD)、Digital Versatile Disc(DVD)、Blu-ray Disc(Blu-rayは登録商標)等の光ディスクも利用可能である。
コンピュータ9は、CPU 901が補助記憶装置903等から図4及び図5の処理を含むプログラムを読み出して実行し、入力装置904から入力された原文に対する機械翻訳処理を行う。また、コンピュータ9は、機械翻訳処理により生成した訳文を出力装置905に出力する。なお、原文は、補助記憶装置903に記憶させておいたものでもよいし、記憶媒体駆動装置907を用いて可搬型記憶媒体から読み出したものでもよい。
更に、コンピュータ9は、図1及び図8に示した機械翻訳装置1として動作させるだけでなく、例えば、図9に示した機械翻訳システム3におけるサーバ121及び記憶部122として動作させることも可能である。コンピュータ9をサーバ121及び記憶部122として動作させる場合、コンピュータ9は、通信制御装置906を介して入力された原文に対する機械翻訳処理を行った後、生成した訳文を通信制御装置906から利用者端末5に向けて送信する。
加えて、機械翻訳装置1として用いるコンピュータ9は、図10に示した全ての構成要素を含む必要はなく、用途や条件に応じて一部の構成要素を省略することも可能である。例えば、コンピュータ9は、記憶媒体駆動装置907が省略されたものであってもよい。
以上記載した各実施例を含む実施形態に関し、更に以下の付記を開示する。
(付記1)
原文を解析して複数の形態素に分割する形態素解析部と、
前記原文における前記形態素間の関係を表す概念構造を生成する概念構造生成部と、
前記概念構造における前記形態素間の関係に基づいて生成した複合語の候補が辞書データに登録されている場合に、前記概念構造における複数の形態素を、前記複合語を表す1個の形態素に変更する概念構造変更部と、
前記概念構造変更部において変更された前記概念構造と、前記辞書データとに基づいて前記原文の訳文を生成する訳文生成部と、
を備えることを特徴とする機械翻訳装置。
(付記2)
前記概念構造変更部は、前記形態素間の品詞の関係及び係り受けの関係に基づいて複合語の候補を生成する、
ことを特徴とする付記1に記載の機械翻訳装置。
(付記3)
前記形態素間の関係と、前記形態素間の関係から生成する前記複合語の候補における語順との対応関係を表す情報を含む合成規則を保持する合成規則保持部、を更に備え、
前記概念構造変更部は、前記概念構造における前記形態素間の関係のうちの前記合成規則と合致する形態素間の関係に含まれる複数の形態素を組み合わせて前記複合語の候補を生成する、
ことを特徴とする付記1に記載の機械翻訳装置。
(付記4)
前記合成規則は、前記複合語の候補が前記辞書データに登録されている場合の前記複合語を表す形態素と、前記複合語に含まれない他の形態素との関係を表す情報を含む、
ことを特徴とする付記3に記載の機械翻訳装置。
(付記5)
前記合成規則を編集する編集部、
を更に備えることを特徴とする付記3に記載の機械翻訳装置。
(付記6)
コンピュータが、
原文を解析して複数の形態素に分割し、
前記原文における前記形態素間の関係を表す概念構造を生成し、
前記概念構造における前記形態素間の関係に基づいて複合語の候補を生成し、生成した前記複合語の候補が辞書データに登録されている場合に、前記概念構造における複数の形態素を、前記複合語を表す1個の形態素に変更し、
前記形態素が変更された前記概念構造と、前記辞書データとに基づいて前記原文の訳文を生成する、
処理を実行することを特徴とする機械翻訳方法。
(付記7)
前記複合語の候補を生成する処理では、前記コンピュータは、前記形態素間の品詞の関係及び係り受けの関係に基づいて前記複合語の候補を生成する、
ことを特徴とする付記6に記載の機械翻訳方法。
(付記8)
前記複合語の候補を生成する処理では、前記コンピュータは、記憶部に記憶させた、前記形態素間の関係と、前記形態素間の関係から生成する前記複合語の候補の語順との対応関係を表す情報を含む合成規則に基づいて、前記概念構造における前記形態素間の関係のうちの前記合成規則と合致する形態素間の関係に含まれる複数の形態素を組み合わせて前記複合語の候補を生成する、
ことを特徴とする付記6に記載の機械翻訳方法。
(付記9)
前記合成規則は、前記複合語の候補が前記辞書データに登録されている場合の前記複合語を表す形態素と、前記複合語に含まれない他の形態素との関係を表す情報を含み、
前記コンピュータが、前記概念構造における複数の形態素を前記複合語を表す1個の形態素に変更するとともに、前記合成規則に基づいて前記複合語を表す形態素と他の形態素との関係を変更する、処理を実行する、
ことを特徴とする付記8に記載の機械翻訳方法。
(付記10)
原文を解析して複数の形態素に分割し、
前記原文における前記形態素間の関係を表す概念構造を生成し、
前記概念構造における前記形態素間の関係に基づいて複合語の候補を生成し、生成した前記複合語の候補が辞書データに登録されている場合に、前記概念構造における複数の形態素を前記複合語を表す1個の形態素に変更し、
前記形態素が変更された前記概念構造に基づいて前記原文の訳文を生成する、
処理をコンピュータに実行させるプログラム。
1 機械翻訳装置
101 原文受付部
102 形態素解析部
103 概念構造生成部
104 概念構造変更部
104a 複合語抽出部
104b 合成規則反映部
104c 合成規則保持部
105 訳文生成部
106 訳文出力部
107 合成規則編集部
110 辞書データ保持部
121 サーバ
122 記憶部
123 管理者端末
125 辞書データ
126 合成規則
129,910 バス
201〜206,211〜214 ノード
3 機械翻訳システム
4 通信ネットワーク
5 利用者端末
9 コンピュータ
901 CPU
902 主記憶装置
903 補助記憶装置
904 入力装置
905 出力装置
906 通信制御装置
907 記憶媒体駆動装置

Claims (7)

  1. 原文を解析して複数の形態素に分割する形態素解析部と、
    前記原文における前記形態素間の関係を表す概念構造を生成する概念構造生成部と、
    前記概念構造における前記形態素間の関係に基づいて生成した複合語の候補が辞書データに登録されている場合に、前記概念構造における複数の形態素を、前記複合語を表す1個の形態素に変更する概念構造変更部と、
    前記概念構造変更部において変更された前記概念構造と、前記辞書データとに基づいて前記原文の訳文を生成する訳文生成部と、
    を備えることを特徴とする機械翻訳装置。
  2. 前記概念構造変更部は、前記形態素間の品詞の関係及び係り受けの関係に基づいて複合語の候補を生成する、
    ことを特徴とする請求項1に記載の機械翻訳装置。
  3. 前記形態素間の関係と、前記形態素間の関係から生成する前記複合語の候補における語順との対応関係を表す情報を含む合成規則を保持する合成規則保持部、を更に備え、
    前記概念構造変更部は、前記概念構造における前記形態素間の関係のうちの前記合成規則と合致する形態素間の関係に含まれる複数の形態素を組み合わせて前記複合語の候補を生成する、
    ことを特徴とする請求項1に記載の機械翻訳装置。
  4. 前記合成規則は、前記複合語の候補が前記辞書データに登録されている場合の前記複合語を表す形態素と、前記複合語に含まれない他の形態素との関係を表す情報を含む、
    ことを特徴とする請求項3に記載の機械翻訳装置。
  5. 前記合成規則を編集する編集部、
    を更に備えることを特徴とする請求項3に記載の機械翻訳装置。
  6. コンピュータが、
    原文を解析して複数の形態素に分割し、
    前記原文における前記形態素間の関係を表す概念構造を生成し、
    前記概念構造における前記形態素間の関係に基づいて複合語の候補を生成し、生成した前記複合語の候補が辞書データに登録されている場合に、前記概念構造における複数の形態素を、前記複合語を表す1個の形態素に変更し、
    前記形態素が変更された前記概念構造と、前記辞書データとに基づいて前記原文の訳文を生成する、
    処理を実行することを特徴とする機械翻訳方法。
  7. 原文を解析して複数の形態素に分割し、
    前記原文における前記形態素間の関係を表す概念構造を生成し、
    前記概念構造における前記形態素間の関係に基づいて複合語の候補を生成し、生成した前記複合語の候補が辞書データに登録されている場合に、前記概念構造における複数の形態素を、前記複合語を表す1個の形態素に変更し、
    前記形態素が変更された前記概念構造に基づいて前記原文の訳文を生成する、
    処理をコンピュータに実行させるプログラム。
JP2016031323A 2016-02-22 2016-02-22 機械翻訳装置、機械翻訳方法、及びプログラム Pending JP2017151553A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016031323A JP2017151553A (ja) 2016-02-22 2016-02-22 機械翻訳装置、機械翻訳方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016031323A JP2017151553A (ja) 2016-02-22 2016-02-22 機械翻訳装置、機械翻訳方法、及びプログラム

Publications (1)

Publication Number Publication Date
JP2017151553A true JP2017151553A (ja) 2017-08-31

Family

ID=59740811

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016031323A Pending JP2017151553A (ja) 2016-02-22 2016-02-22 機械翻訳装置、機械翻訳方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP2017151553A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102018118804A1 (de) 2017-08-04 2019-02-07 Mazda Motor Corporation Kühlvorrichtung für einen Motor
JP2020123227A (ja) * 2019-01-31 2020-08-13 富士通株式会社 単語出力方法、単語出力プログラム及び情報処理装置
US11995416B2 (en) 2019-06-04 2024-05-28 Panasonic Intellectual Property Management Co., Ltd. Translation device

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102018118804A1 (de) 2017-08-04 2019-02-07 Mazda Motor Corporation Kühlvorrichtung für einen Motor
JP2020123227A (ja) * 2019-01-31 2020-08-13 富士通株式会社 単語出力方法、単語出力プログラム及び情報処理装置
US11995416B2 (en) 2019-06-04 2024-05-28 Panasonic Intellectual Property Management Co., Ltd. Translation device

Similar Documents

Publication Publication Date Title
JP4410486B2 (ja) 機械翻訳装置及びプログラム
JP4001283B2 (ja) 形態素解析装置および自然言語処理装置
JP2017151553A (ja) 機械翻訳装置、機械翻訳方法、及びプログラム
Hämäläinen et al. Development of an open source natural language generation tool for finnish
Rikters Hybrid machine translation by combining output from multiple machine translation systems
JP2011175500A (ja) 語順変換装置、機械翻訳用統計モデル作成装置、機械翻訳装置、語順変換方法、機械翻訳用統計モデル作成方法、機械翻訳方法、プログラム
JP6160438B2 (ja) 機械翻訳装置、機械翻訳プログラム及び機械翻訳方法
JP5025603B2 (ja) 機械翻訳装置、機械翻訳プログラム及び機械翻訳方法
JP4476609B2 (ja) 中国語解析装置、中国語解析方法および中国語解析プログラム
Tambouratzis et al. Machine Translation with Minimal Reliance on Parallel Resources
JP4875040B2 (ja) 機械翻訳システム及び機械翻訳プログラム
JP4869281B2 (ja) 機械翻訳装置、プログラム及び方法
JP2006004366A (ja) 機械翻訳システム及びそのためのコンピュータプログラム
JP4007413B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP5879989B2 (ja) 機械翻訳システム、機械翻訳方法および機械翻訳プログラム
Bahadur et al. Machine translation—A journey
WO2009144890A1 (ja) 翻訳前換言規則生成システム
JP4203102B2 (ja) 中国語解析装置、中国語解析方法および中国語解析プログラム
JP2006201873A (ja) 未登録語自動抽出装置及びプログラム、並びに未登録語自動登録装置及びプログラム
JP5909123B2 (ja) 機械翻訳装置、機械翻訳方法およびプログラム
JP2009258887A (ja) 機械翻訳装置及び機械翻訳プログラム
JP5746921B2 (ja) 機械翻訳装置、方法及びプログラム
US20130080144A1 (en) Machine translation apparatus, a method and a non-transitory computer readable medium thereof
JP4021813B2 (ja) 複合語登録プログラムおよび登録装置
JP3313810B2 (ja) アスペクト処理装置