JP4001605B2 - 翻訳パターン作成装置 - Google Patents
翻訳パターン作成装置 Download PDFInfo
- Publication number
- JP4001605B2 JP4001605B2 JP2005157889A JP2005157889A JP4001605B2 JP 4001605 B2 JP4001605 B2 JP 4001605B2 JP 2005157889 A JP2005157889 A JP 2005157889A JP 2005157889 A JP2005157889 A JP 2005157889A JP 4001605 B2 JP4001605 B2 JP 4001605B2
- Authority
- JP
- Japan
- Prior art keywords
- translation
- pattern
- translation pattern
- dictionary
- sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000013519 translation Methods 0.000 title claims description 375
- 238000011156 evaluation Methods 0.000 claims description 46
- 238000012545 processing Methods 0.000 claims description 37
- 238000004458 analytical method Methods 0.000 claims description 16
- 230000000877 morphologic effect Effects 0.000 claims description 6
- 230000014616 translation Effects 0.000 description 357
- 238000000034 method Methods 0.000 description 69
- 238000012217 deletion Methods 0.000 description 19
- 230000037430 deletion Effects 0.000 description 19
- 239000000872 buffer Substances 0.000 description 18
- 230000014509 gene expression Effects 0.000 description 10
- 101100535994 Caenorhabditis elegans tars-1 gene Proteins 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000012552 review Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 101150043590 TBPL1 gene Proteins 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000012854 evaluation process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000002040 relaxant effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 101150110220 trf1 gene Proteins 0.000 description 1
- 101150049395 trf2 gene Proteins 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Description
以下、本発明による翻訳パターン作成装置の第1の実施形態を、図面を参照しながら詳述する。
図1は、第1の実施形態の翻訳パターン作成装置の機能的構成を示すブロック図である。第1の実施形態の翻訳パターン作成装置は、パソコンなどの情報処理装置(1台に限定されず、複数台を分散処理し得るようにしたものであっても良い)上に、翻訳パターン作成プログラム(固定データを含む)をインストールすることにより、構築されるものであるが、機能的には、図1で表すことができる。
次に、第1の実施形態の翻訳パターン作成装置の動作を、図面を参照しながら説明する。以下では、使用者が、英語(原言語)が日本語(目的言語)に翻訳された対訳文書を入力した場合を例に、第1の実施形態の翻訳パターン作成装置の動作を説明する。
参考文献4:金山博、荻野紫穂共著,「翻訳精度評価手法BLEUの日英翻訳の適用」,自然言語処理154-19,pages131-136,2003
上述したステップS304においては、例えば、これらの技術を利用して評価点を求めて第2のバッファ1.272に格納する。図5(A)は、このときの第2のバッファ1.272の評価値の格納状態を示している。
上記第1の実施形態によれば、作成した翻訳パターンを仮登録し、仮登録した翻訳パターンの使用前後での翻訳結果の正解例文に比較した評価値を得、これら評価値同士を比較し、仮登録した翻訳パターンを使用した翻訳結果の評価値が良好であれば、本登録すると共に、仮登録するか否かの基準を下げて処理を繰り返すようにしたので、翻訳結果の品質を向上できる限りにおいて、対応が推定された対訳の部分から有効な翻訳パターンを作成することができる。
次に、本発明による翻訳パターン作成装置の第2の実施形態を、図面を参照しながら詳述する。
第2の実施形態は、翻訳パターン一時辞書の使用前後の翻訳結果を評価することによって、一語一語に対して登録すべきか否かを判断するものである。また、その判断結果を翻訳パターンの自動作成方法に再利用する(判断結果をフィードバックする)ことにより、対応推定の精度の向上を図ったものである。
次に、第2の実施形態の翻訳パターン作成装置の動作を、図面を参照しながら説明する。
第2の実施形態によれば、作成された翻訳パターンを使用した際の翻訳結果を評価することによって、一語一語に対して、その語を含む翻訳パターンを登録すべきか否かを判断し、翻訳結果を向上させる翻訳パターンを本登録する。従って、品質低下の可能性がある語を含む翻訳パターンは登録されることはない。このようにその語を登録すべきか否かの判断結果を、それ以降に行われる翻訳パターンの自動作成に再利用することにより、対応推定の精度の向上を図ることができる。
(c1)第2の実施形態では、閾値zは既定の設定値iを利用する方式で説明したが、第1の実施形態のように、閾値zの限界値を変化させる自動的な対応推定を行っても良い。
(c6)翻訳エンジンは、参考文献1に記載のパターンベースの翻訳エンジンが適していると説明したが、原言語と目的言語の表現を対とする対訳辞書を用いる翻訳エンジンであれば、どんなエンジンであっても構わない。
Claims (1)
- 文単位の対応が付いた対訳文書から翻訳に必要な翻訳パターンを作成する翻訳パターン作成装置において、
対訳文書の各言語の文に対して形態素解析を行う形態素解析手段と、
各言語の形態素解析結果を用いて各言語の単語、単語列の対応関係を推定し、対応度合が基準度合を超えている対応関係から翻訳パターンを作成する翻訳パターン作成手段と、
同一文に対し、作成された翻訳パターンを使用して機械翻訳すると共に、作成された翻訳パターンを使用しないで機械翻訳する翻訳手段と、
作成された翻訳パターンを使用した翻訳結果の第1の評価値と使用しない翻訳結果の第2の評価値とを得る翻訳結果評価手段と、
第1の評価値が第2の評価値より、翻訳結果と上記対訳文書との差分が少ないことを示す値であるときに、上記基準度合を下げる変更を行って、上記翻訳パターン作成手段に翻訳パターン作成処理を再度行わせるパターン作成継続判定手段と
を有することを特徴とする翻訳パターン作成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005157889A JP4001605B2 (ja) | 2005-05-30 | 2005-05-30 | 翻訳パターン作成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005157889A JP4001605B2 (ja) | 2005-05-30 | 2005-05-30 | 翻訳パターン作成装置 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007177230A Division JP4480741B2 (ja) | 2007-07-05 | 2007-07-05 | 翻訳パターン作成装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006331335A JP2006331335A (ja) | 2006-12-07 |
JP4001605B2 true JP4001605B2 (ja) | 2007-10-31 |
Family
ID=37552937
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005157889A Expired - Fee Related JP4001605B2 (ja) | 2005-05-30 | 2005-05-30 | 翻訳パターン作成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4001605B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008217770A (ja) * | 2007-02-05 | 2008-09-18 | Sorun Corp | 言語データ表示システム、言語データ表示方法、及び言語データ表示プログラム |
-
2005
- 2005-05-30 JP JP2005157889A patent/JP4001605B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2006331335A (ja) | 2006-12-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7251181B2 (ja) | 対訳処理方法および対訳処理プログラム | |
JP4940325B2 (ja) | 文書校正支援装置、方法およびプログラム | |
JP2008276517A (ja) | 訳文評価装置、訳文評価方法およびプログラム | |
Baldridge et al. | How well does active learning actually work? Time-based evaluation of cost-reduction strategies for language documentation. | |
WO2009035863A2 (en) | Mining bilingual dictionaries from monolingual web pages | |
JP5646792B2 (ja) | 単語分割装置、単語分割方法、及び単語分割プログラム | |
JP2007241764A (ja) | 構文解析プログラム、構文解析方法、構文解析装置、及び構文解析プログラムが記録されたコンピュータ読み取り可能な記録媒体 | |
JP2020190970A (ja) | 文書処理装置およびその方法、プログラム | |
CN112650836B (zh) | 基于句法结构元素语义的文本分析方法、装置及计算终端 | |
JP2015060458A (ja) | 機械翻訳装置、方法、及びプログラム | |
Li et al. | Chinese spelling check based on neural machine translation | |
JP4001605B2 (ja) | 翻訳パターン作成装置 | |
JP4480741B2 (ja) | 翻訳パターン作成装置 | |
JP4869281B2 (ja) | 機械翻訳装置、プログラム及び方法 | |
WO2009144890A1 (ja) | 翻訳前換言規則生成システム | |
JP4812811B2 (ja) | 機械翻訳装置及び機械翻訳プログラム | |
JP3437782B2 (ja) | 機械翻訳方法及びその装置並びに機械翻訳プログラムを記憶した媒体 | |
JP3999771B2 (ja) | 翻訳支援プログラム、翻訳支援装置、翻訳支援方法 | |
Afli et al. | From Arabic user-generated content to machine translation: integrating automatic error correction | |
JP4313967B2 (ja) | 自然言語変換システム | |
Gao | Intelligent Detection System Based on Recurrent Neural Network Machine Translation for Typical Errors in English Translation | |
JP2000250914A (ja) | 機械翻訳方法、装置、および機械翻訳プログラムを記録した記録媒体 | |
JP2004326584A (ja) | 対訳固有表現抽出装置及び方法、対訳固有表現抽出プログラム | |
KR20020054244A (ko) | 부분문틀을 이용한 장문 번역 장치 및 그 방법 | |
Favaro et al. | POS Tagging and Lemmatization of Historical Varieties of Languages. The Challenge of Old Italian |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070508 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070705 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20070705 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070814 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070814 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100824 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100824 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110824 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120824 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130824 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |