JP2006331335A - 翻訳パターン作成装置、方法及びプログラム - Google Patents
翻訳パターン作成装置、方法及びプログラム Download PDFInfo
- Publication number
- JP2006331335A JP2006331335A JP2005157889A JP2005157889A JP2006331335A JP 2006331335 A JP2006331335 A JP 2006331335A JP 2005157889 A JP2005157889 A JP 2005157889A JP 2005157889 A JP2005157889 A JP 2005157889A JP 2006331335 A JP2006331335 A JP 2006331335A
- Authority
- JP
- Japan
- Prior art keywords
- translation
- pattern
- translation pattern
- result
- correspondence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
【解決手段】 対訳文書の各言語の文に対して形態素解析を行い、各言語の形態素解析結果を用いて各言語の単語、単語列の対応関係を推定し、対応度合が基準度合を超えている対応関係から翻訳パターンを作成する。そして、同一文に対し、作成された翻訳パターンを使用して機械翻訳すると共に、作成された翻訳パターンを使用しないで機械翻訳し、得られた2種類の翻訳結果に基づいて、作成された翻訳パターンを評価したり、その後の翻訳パターンの作成動作を制御したりする。2種類の翻訳結果は、翻訳の元になった上記同一文に対する正解の対訳文との関係で、いずれが正しいかを判断できる。
【選択図】 図1
Description
以下、本発明による翻訳パターン作成装置、方法及びプログラムの第1の実施形態を、図面を参照しながら詳述する。
図1は、第1の実施形態の翻訳パターン作成装置の機能的構成を示すブロック図である。第1の実施形態の翻訳パターン作成装置は、パソコンなどの情報処理装置(1台に限定されず、複数台を分散処理し得るようにしたものであっても良い)上に、第1の実施形態の翻訳パターン作成プログラム(固定データを含む)をインストールすることにより、構築されるものであるが、機能的には、図1で表すことができる。
次に、第1の実施形態の翻訳パターン作成装置の動作(第1の実施形態の翻訳パターン作成方法)を、図面を参照しながら説明する。以下では、使用者が、英語(原言語)が日本語(目的言語)に翻訳された対訳文書を入力した場合を例に、第1の実施形態の翻訳パターン作成装置の動作を説明する。
参考文献4:金山博、荻野紫穂共著,「翻訳精度評価手法BLEUの日英翻訳の適用」,自然言語処理154-19,pages131-136,2003
上述したステップS304においては、例えば、これらの技術を利用して評価点を求めて第2のバッファ1.272に格納する。図5(A)は、このときの第2のバッファ1.272の評価値の格納状態を示している。
上記第1の実施形態によれば、作成した翻訳パターンを仮登録し、仮登録した翻訳パターンの使用前後での翻訳結果の正解例文に比較した評価値を得、これら評価値同士を比較し、仮登録した翻訳パターンを使用した翻訳結果の評価値が良好であれば、本登録すると共に、仮登録するか否かの基準を下げて処理を繰り返すようにしたので、翻訳結果の品質を向上できる限りにおいて、対応が推定された対訳の部分から有効な翻訳パターンを作成することができる。
次に、本発明による翻訳パターン作成装置、方法及びプログラムの第2の実施形態を、図面を参照しながら詳述する。
第2の実施形態は、翻訳パターン一時辞書の使用前後の翻訳結果を評価することによって、一語一語に対して登録すべきか否かを判断するものである。また、その判断結果を翻訳パターンの自動作成方法に再利用する(判断結果をフィードバックする)ことにより、対応推定の精度の向上を図ったものである。
次に、第2の実施形態の翻訳パターン作成装置の動作(第2の実施形態の翻訳パターン作成方法)を、図面を参照しながら説明する。
第2の実施形態によれば、作成された翻訳パターンを使用した際の翻訳結果を評価することによって、一語一語に対して、その語を含む翻訳パターンを登録すべきか否かを判断し、翻訳結果を向上させる翻訳パターンを本登録する。従って、品質低下の可能性がある語を含む翻訳パターンは登録されることはない。このようにその語を登録すべきか否かの判断結果を、それ以降に行われる翻訳パターンの自動作成に再利用することにより、対応推定の精度の向上を図ることができる。
(c1)第2の実施形態では、閾値zは既定の設定値iを利用する方式で説明したが、第1の実施形態のように、閾値zの限界値を変化させる自動的な対応推定を行っても良い。すなわち、第1の実施形態の技術思想と、第2の実施形態の技術思想とを融合させるようにしても良い。
(c6)翻訳エンジンは、参考文献1に記載のパターンベースの翻訳エンジンが適していると説明したが、原言語と目的言語の表現を対とする対訳辞書を用いる翻訳エンジンであれば、どんなエンジンであっても構わない。
Claims (11)
- 文単位の対応が付いた対訳文書から翻訳に必要な翻訳パターンを作成する翻訳パターン作成装置において、
対訳文書の各言語の文に対して形態素解析を行う形態素解析手段と、
各言語の形態素解析結果を用いて各言語の単語、単語列の対応関係を推定し、対応度合が基準度合を超えている対応関係から翻訳パターンを作成する翻訳パターン作成手段と、
同一文に対し、作成された翻訳パターンを使用して機械翻訳すると共に、作成された翻訳パターンを使用しないで機械翻訳する翻訳手段と、
作成された翻訳パターンを使用した翻訳結果の第1の評価値と使用しない翻訳結果の第2の評価値とを得る翻訳結果評価手段と、
第1の評価値が第2の評価値より良好なときに、上記基準度合を緩める変更を行って、上記翻訳パターン作成手段を再起動させるパターン作成継続判定手段と
を有することを特徴とする翻訳パターン作成装置。 - 文単位の対応が付いた対訳文書から翻訳に必要な翻訳パターンを作成する翻訳パターン作成装置において、
対訳文書の各言語の文に対して形態素解析を行う形態素解析手段と、
各言語の形態素解析結果を用いて各言語の単語、単語列の対応関係を推定し、対応度合が基準度合を超えている対応関係から翻訳パターンを作成する翻訳パターン作成手段と、
同一文に対し、作成された翻訳パターンを使用して機械翻訳すると共に、作成された翻訳パターンを使用しないで機械翻訳する翻訳手段と、
作成された翻訳パターンを使用した翻訳結果と使用しない翻訳結果とで相違が生じた上記同一文の部分を認識し、翻訳結果が低下する要因となる翻訳パターンと、低下する要因とならない翻訳パターンとを分類する作成パターン分類手段と
を有することを特徴とする翻訳パターン作成装置。 - 上記翻訳パターン作成手段は、上記作成パターン分類手段が分類した翻訳結果が低下する要因となる翻訳パターンと、低下する要因とならない翻訳パターンの情報を、次回の翻訳パターンの作成時に利用することを特徴とする請求項2に記載の翻訳パターン作成装置。
- 入力された対訳文書を分割し、分割された文書の一部を上記形態素解析手段に投入すると共に、その投入した分割対訳文書に対する上記形態素解析手段、上記翻訳パターン作成手段、上記翻訳手段及び上記作成パターン分類手段の処理が完了したときに、文書の対象範囲を広げて、上記形態素解析手段に投入し、かかる範囲拡大を繰り返す対訳文書入力制御手段を有することを特徴とする請求項2又は3に記載の翻訳パターン作成装置。
- 上記作成された翻訳パターンを使用した翻訳結果の第1の評価値と使用しない翻訳結果の第2の評価値とを得る翻訳結果評価手段と、
第1の評価値が第2の評価値より良好なときに、上記基準度合を緩める変更を行って、上記翻訳パターン作成手段を再起動させるパターン作成継続判定手段と
をさらに有することを特徴とする請求項2〜4のいずれかに記載の翻訳パターン作成装置。 - 文単位の対応が付いた対訳文書から翻訳に必要な翻訳パターンを作成する翻訳パターン作成方法において、
対訳文書の各言語の文に対して形態素解析を行う形態素解析工程と、
各言語の形態素解析結果を用いて各言語の単語、単語列の対応関係を推定し、対応度合が基準度合を超えている対応関係から翻訳パターンを作成する翻訳パターン作成工程と、
同一文に対し、作成された翻訳パターンを使用して機械翻訳すると共に、作成された翻訳パターンを使用しないで機械翻訳する翻訳工程と、
作成された翻訳パターンを使用した翻訳結果の第1の評価値と使用しない翻訳結果の第2の評価値とを得る翻訳結果評価工程と、
第1の評価値が第2の評価値より良好なときに、上記基準度合を緩める変更を行って、上記翻訳パターン作成工程を再起動させるパターン作成継続判定工程と
を有することを特徴とする翻訳パターン作成方法。 - 文単位の対応が付いた対訳文書から翻訳に必要な翻訳パターンを作成する翻訳パターン作成方法において、
対訳文書の各言語の文に対して形態素解析を行う形態素解析工程と、
各言語の形態素解析結果を用いて各言語の単語、単語列の対応関係を推定し、対応度合が基準度合を超えている対応関係から翻訳パターンを作成する翻訳パターン作成工程と、
同一文に対し、作成された翻訳パターンを使用して機械翻訳すると共に、作成された翻訳パターンを使用しないで機械翻訳する翻訳工程と、
作成された翻訳パターンを使用した翻訳結果と使用しない翻訳結果とで相違が生じた上記同一文の部分を認識し、翻訳結果が低下する要因となる翻訳パターンと、低下する要因とならない翻訳パターンとを分類する作成パターン分類工程と
を有することを特徴とする翻訳パターン作成方法。 - 上記翻訳パターン作成工程は、上記作成パターン分類工程で分類した翻訳結果が低下する要因となる翻訳パターンと、低下する要因とならない翻訳パターンの情報を、次回の翻訳パターンの作成時に利用することを特徴とする請求項7に記載の翻訳パターン作成方法。
- 入力された対訳文書を分割し、分割された文書の一部を上記形態素解析工程に投入すると共に、その投入した分割対訳文書に対する上記形態素解析工程、上記翻訳パターン作成工程、上記翻訳工程及び上記作成パターン分類工程による一連の処理が完了したときに、文書の対象範囲を広げて、上記形態素解析工程に投入し、かかる範囲拡大を繰り返す対訳文書入力制御工程を有することを特徴とする請求項7又は8に記載の翻訳パターン作成方法。
- 上記作成された翻訳パターンを使用した翻訳結果の第1の評価値と使用しない翻訳結果の第2の評価値とを得る翻訳結果評価工程と、
第1の評価値が第2の評価値より良好なときに、上記基準度合を緩める変更を行って、上記翻訳パターン作成工程を再起動させるパターン作成継続判定工程と
をさらに有することを特徴とする請求項7〜9のいずれかに記載の翻訳パターン作成方法。 - 請求項6〜10のいずれかに記載の翻訳パターン作成方法を、コンピュータが実行可能なコードで記述していることを特徴とする翻訳パターン作成プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005157889A JP4001605B2 (ja) | 2005-05-30 | 2005-05-30 | 翻訳パターン作成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005157889A JP4001605B2 (ja) | 2005-05-30 | 2005-05-30 | 翻訳パターン作成装置 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007177230A Division JP4480741B2 (ja) | 2007-07-05 | 2007-07-05 | 翻訳パターン作成装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006331335A true JP2006331335A (ja) | 2006-12-07 |
JP4001605B2 JP4001605B2 (ja) | 2007-10-31 |
Family
ID=37552937
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005157889A Expired - Fee Related JP4001605B2 (ja) | 2005-05-30 | 2005-05-30 | 翻訳パターン作成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4001605B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008217770A (ja) * | 2007-02-05 | 2008-09-18 | Sorun Corp | 言語データ表示システム、言語データ表示方法、及び言語データ表示プログラム |
-
2005
- 2005-05-30 JP JP2005157889A patent/JP4001605B2/ja not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008217770A (ja) * | 2007-02-05 | 2008-09-18 | Sorun Corp | 言語データ表示システム、言語データ表示方法、及び言語データ表示プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP4001605B2 (ja) | 2007-10-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4940325B2 (ja) | 文書校正支援装置、方法およびプログラム | |
US20050228643A1 (en) | Discovery of parallel text portions in comparable collections of corpora and training using comparable texts | |
JP5071373B2 (ja) | 言語処理装置、言語処理方法および言語処理用プログラム | |
WO2009035863A2 (en) | Mining bilingual dictionaries from monolingual web pages | |
JP2008276517A (ja) | 訳文評価装置、訳文評価方法およびプログラム | |
JP2004038976A (ja) | 用例ベースの機械翻訳システム | |
JP2020190970A (ja) | 文書処理装置およびその方法、プログラム | |
Ive et al. | Reassessing the proper place of man and machine in translation: a pre-translation scenario | |
JP2015060458A (ja) | 機械翻訳装置、方法、及びプログラム | |
CN112650836B (zh) | 基于句法结构元素语义的文本分析方法、装置及计算终端 | |
Li et al. | Chinese spelling check based on neural machine translation | |
JP4001605B2 (ja) | 翻訳パターン作成装置 | |
JP4480741B2 (ja) | 翻訳パターン作成装置 | |
JP4869281B2 (ja) | 機械翻訳装置、プログラム及び方法 | |
JP7135730B2 (ja) | 要約生成方法及び要約生成プログラム | |
JP4431759B2 (ja) | 未登録語自動抽出装置及びプログラム、並びに未登録語自動登録装置及びプログラム | |
Wu | Model and Simulation of Maximum Entropy Phrase Reordering of English Text in Language Learning Machine | |
Tambouratzis | Conditional Random Fields versus template-matching in MT phrasing tasks involving sparse training data | |
JP4812811B2 (ja) | 機械翻訳装置及び機械翻訳プログラム | |
JP2004326584A (ja) | 対訳固有表現抽出装置及び方法、対訳固有表現抽出プログラム | |
Afli et al. | From Arabic user-generated content to machine translation: integrating automatic error correction | |
Gao | Intelligent Detection System Based on Recurrent Neural Network Machine Translation for Typical Errors in English Translation | |
JP2010182261A (ja) | 対訳情報作成装置、機械翻訳装置及びプログラム | |
JP2011186507A (ja) | 翻訳前換言規則生成システム、翻訳前換言規則生成方法および翻訳前換言規則生成用プログラム | |
JP2000250914A (ja) | 機械翻訳方法、装置、および機械翻訳プログラムを記録した記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070508 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070705 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20070705 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070814 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070814 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100824 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100824 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110824 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120824 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130824 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |