[go: up one dir, main page]

JPH05298360A - 翻訳文評価方法、翻訳文評価装置、翻訳文評価機能付き機械翻訳システムおよび機械翻訳システム評価装置 - Google Patents

翻訳文評価方法、翻訳文評価装置、翻訳文評価機能付き機械翻訳システムおよび機械翻訳システム評価装置

Info

Publication number
JPH05298360A
JPH05298360A JP4097656A JP9765692A JPH05298360A JP H05298360 A JPH05298360 A JP H05298360A JP 4097656 A JP4097656 A JP 4097656A JP 9765692 A JP9765692 A JP 9765692A JP H05298360 A JPH05298360 A JP H05298360A
Authority
JP
Japan
Prior art keywords
sentence
translated
translation
language
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4097656A
Other languages
English (en)
Inventor
Hiroyuki Kaji
博行 梶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP4097656A priority Critical patent/JPH05298360A/ja
Priority to US08/047,150 priority patent/US5408410A/en
Publication of JPH05298360A publication Critical patent/JPH05298360A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/51Translation evaluation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】 【目的】 翻訳文の評価を計算機で行なうことを可能と
し、機械翻訳文の質を自動的かつ客観的に評価すること
ができるようにすることを目的とする。 【構成】 機械翻訳文を解析する第1翻訳文解析ステッ
プ(13)、望ましい翻訳文を解析する第2翻訳文解析
ステップ(14)、二つの翻訳文の間の語句の対応関係
を解析する語句対応づけステップ(15)、対応づけら
れた語句の割合と対応する語句の一致度に基づいて二つ
の翻訳文の一致度を算出する翻訳文一致度算出ステップ
(16)により機械翻訳文を評価する。 【効果】 機械翻訳文の質を自動的かつ客観的に評価す
ることができる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、機械翻訳システムに係
わり、特に機械翻訳文の質を自動的かつ客観的に評価す
るための翻訳文評価方法及び翻訳文評価装置、翻訳文を
評価する機能を有する機械翻訳システム並びに機械翻訳
システムを評価するための機械翻訳システム評価装置に
関する。
【0002】
【従来の技術】自然言語間の機械翻訳システム、たとえ
ば日本語と英語間の機械翻訳システムにおいては、人間
並みの翻訳品質を実現することが困難であり、開発者に
とってもユーザにとっても翻訳結果の質を定量的にかつ
客観的に評価することが重要である。
【0003】翻訳文の質の評価に関する従来技術は、例
えば、「情報処理」第26巻第10号1197−120
2ページ「長尾真:機械翻訳文の質の評価と言語の制
限」に解説されている。翻訳文の原文に対する忠実度
や、翻訳文の理解容易性について、いくつかのランクと
各ランクの判定基準を定めておき、機械翻訳システムに
よって得られる翻訳文を評価者(人間)が一つ一つチェ
ックしてランクづけするというのが従来の典型的な方法
である。
【0004】
【発明が解決しようとする課題】ところが、この種のラ
ンクづけによる翻訳文の質の評価を行うのは人間であ
り、その評価に多大な時間を要する。しかも各評価者に
よる判定のゆれが生じ、必ずしも客観的な評価とはいい
難いという問題がある。
【0005】本発明の目的は、翻訳文の評価を計算機で
行なうことを可能にして、上記問題点を解決し、機械翻
訳文の質を自動的かつ客観的に評価することができるよ
うにすることである。
【0006】
【課題を解決するための手段】翻訳文の計算機による評
価を実現するため、人間が作成した望ましい翻訳文を利
用することが本発明の着眼点である。すなわち、ある文
に対して機械翻訳システムによって得られる第1の翻訳
文と、同一文に対して人間が作成した望ましい第2の翻
訳文とを比較して、それらの間の語彙的及び構文的な一
致度を算出し、それを第1の翻訳文の質の評価とみなす
のである。上述の考え方による翻訳文評価は、以下のよ
うな本発明の構成により実現される。
【0007】すなわち、本発明に係る翻訳文評価方法
は、第1言語の原文に対する第2言語の第1の翻訳文の
形態素解析と構文解析を行なう第1翻訳文解析ステップ
と、該原文に対する第2言語の第2の翻訳文の形態素解
析と構文解析を行なう第2翻訳文解析ステップと、第1
翻訳文と第2翻訳文の間の語句の対応づけを行なう語句
対応づけステップと、前記語句対応づけステップの結果
に基づいて第1翻訳文と第2翻訳文の語彙的及び構文的
一致度を算出する翻訳文一致度算出ステップとを備えた
ことを特徴とする。
【0008】また本発明に係る翻訳文評価装置は、第1
言語の原文に対する第2言語の第1の翻訳文の形態素解
析と構文解析を行なう第1翻訳文解析手段と、該原文に
対する第2言語の第2の翻訳文の形態素解析と構文解析
を行なう第2翻訳文解析手段と、第1翻訳文と第2翻訳
文の間の語句の対応づけを行なう語句対応づけ手段と、
前記語句対応づけの結果に基づいて第1翻訳文と第2翻
訳文の語彙的及び構文的一致度を算出する翻訳文一致度
算出手段とを備えたことを特徴とする。
【0009】さらに本発明に係る翻訳文評価方法は、第
1言語の原文に対する第2言語の第1の翻訳文の形態素
解析を行なう第1翻訳文解析ステップと、該原文に対す
る第2言語の第2の翻訳文の形態素解析を行なう第2翻
訳文解析ステップと、第1翻訳文と第2翻訳文の間の単
語の対応づけを行なう単語対応づけステップと、前記単
語対応づけステップの結果に基づいて第1翻訳文と第2
翻訳文の語彙的一致度を算出する翻訳文一致度算出ステ
ップとを備えたことを特徴とする。
【0010】また本発明に係る翻訳文評価装置は、第1
言語の原文に対する第2言語の第1の翻訳文の形態素解
析を行なう第1翻訳文解析手段と、該原文に対する第2
言語の第2の翻訳文の形態素解析を行なう第2翻訳文解
析手段と、第1翻訳文と第2翻訳文の間の単語の対応づ
けを行なう単語対応づけ手段と、前記単語対応づけの結
果に基づいて第1翻訳文と第2翻訳文の語彙的一致度を
算出する翻訳文一致度算出手段とを備えたことを特徴と
する。
【0011】このように語彙的一致度のみを算出するこ
とで、近い言語間の翻訳評価を簡単に行うことができ
る。たとえば英語とスペイン語の間あるいは日本語と韓
国語の間の翻訳評価の場合である。
【0012】また、本発明に係る翻訳文評価機能付き機
械翻訳システムは、第1言語の文を第2言語の文に翻訳
する機械翻訳手段を有する機械翻訳システムであって、
第1言語の原文に対して前もって作成された第2言語の
第2の翻訳文(いわば望ましい翻訳文)を該第1言語の
原文とともに読み込むテキスト読み込み手段と、該機械
翻訳手段によって前記第1言語の原文を翻訳して得られ
る第1の翻訳文と前記第2の翻訳文との一致度を算出す
る翻訳文評価手段とを備えたことを特徴とする。このよ
うなテキスト読み込み手段を設ければ、第1言語の原文
とともに、機械翻訳とは独立に作成された第2の翻訳文
を読み込んで、システムの評価を行なうことができる。
【0013】さらに、本発明に係る翻訳文評価機能付き
機械翻訳システムは、第1言語の文を第2言語の文に翻
訳する機械翻訳手段を有する機械翻訳システムであっ
て、第1言語の原文に対して前もって作成された第2言
語の複数の翻訳文からなる翻訳文セットを該第1言語の
原文とともに読み込むテキスト読み込み手段と、該機械
翻訳手段によって前記第1言語の原文を翻訳して得られ
る機械翻訳文と前記翻訳文セットに含まれる翻訳文の各
々との一致度を算出した上で、一致度の最大値を該機械
翻訳文の評価点として採用する翻訳文評価手段とを備え
たことを特徴とする。
【0014】このように第2言語の望ましい翻訳文を複
数読み込んでおき、機械翻訳文とこれらの望ましい翻訳
文の各々との一致度を算出してその最大値を機械翻訳文
の評価点とすることにより、より正確な評価が行なえ
る。
【0015】さらに本発明に係る翻訳文評価機能付き機
械翻訳システムは、第1言語の文を第2言語の文に翻訳
する機械翻訳手段を有する機械翻訳システムであって、
該機械翻訳手段によって得られる翻訳文を編集するため
の翻訳文編集手段と、前記機械翻訳手段によって得られ
る第1の翻訳文と、該第1の翻訳文を前記翻訳文編集手
段を用いて編集して得た第2の翻訳文との一致度を算出
する翻訳文評価手段とを備えたことを特徴とする。この
ような翻訳文編集手段を設ければ、機械翻訳システムに
よる翻訳結果を後編集したものを望ましい翻訳文である
第2の翻訳文として評価を行なうことができる。
【0016】上述したすべての翻訳文評価機能付き機械
翻訳システムにおいて、翻訳文評価手段における翻訳文
評価の方式は上述の本発明に係る翻訳文評価方法および
翻訳文評価装置を適用すればよい。
【0017】また、本発明に係る機械翻訳システム評価
装置は、第1言語の原文を機械翻訳した第2言語の第1
の翻訳文及び該原文の望ましい翻訳文である第2言語の
第2の翻訳文を読み込むテキスト読み込み手段と、前記
第1の翻訳文と前記第2の翻訳文との一致度を算出する
翻訳文評価手段とを備えたことを特徴とする。これによ
り、機械翻訳した結果と望ましい翻訳文とを入力して、
その機械翻訳システムの評価を行なうことができる。
【0018】さらに本発明に係る機械翻訳システム評価
装置は、第1言語の原文に対する複数の翻訳文からなる
翻訳文セットと機械翻訳文を読み込むテキスト読み込み
手段と、前記翻訳文セットに含まれる翻訳文の各々と機
械翻訳文との一致度を算出した上で、一致度の最大値を
該機械翻訳文の評価点として採用する翻訳文評価手段と
を備えたことを特徴とする。望ましい翻訳文を複数入力
して機械翻訳の結果を評価するので、より正確な評価を
行なうことができる。
【0019】本発明に係る翻訳文評価機能付き機械翻訳
システムは、複数組の第1の翻訳文と第2の翻訳文のそ
れぞれの組に関して前記翻訳文評価手段が算出した翻訳
文の一致度の平均値、分布、原文の長さ別平均値の少く
とも1つを計算して表示する評価結果集計表示手段をさ
らに備えたことを特徴とする。このような評価結果集計
表示手段は、上述の機械翻訳システム評価装置に設ける
こともできる。これにより、翻訳の評価結果がより定量
的かつ客観的に表示される。
【0020】さらに本発明に係る機械翻訳システム評価
装置は、第1言語の原文に対する第2言語の三つの翻訳
文、すなわち第1の翻訳文(甲)、第1の翻訳文(乙)
及び第2の翻訳文を該原文とともに読み込むテキスト読
み込み手段と、前記第1の翻訳文(甲)と前記第2の翻
訳文の一致度、並びに前記第1の翻訳文(乙)と前記第
2の翻訳文の一致度を算出する翻訳文評価手段と、該翻
訳文評価機能で算出された第1の翻訳文(甲)と第2の
翻訳文の一致度が第1の翻訳文(乙)と第2の翻訳文の
一致度より小さい原文を選んで、該原文と第1の翻訳文
(甲)、第1の翻訳文(乙)、第2の翻訳文を表示する
翻訳文選択表示手段とを備えたことを特徴とする。これ
により、1つの機械翻訳システムの異なるバ−ジョンあ
るいは2つの機械翻訳システムの比較を行なうことがで
きる。
【0021】
【作用】本発明に係る翻訳文評価方法は以下のように作
用する。まず、機械翻訳システムにより翻訳された結果
である第1の翻訳文、及び望ましい翻訳文である第2の
翻訳文が用意されているものとする。まず、第1翻訳文
解析ステップで、第1翻訳文に対して少くとも形態素解
析のみ、あるいは形態素解析と構文解析が実行され、第
1翻訳文を構成する単語を示す単語テーブルと第1翻訳
文を構成する句を示す句構造解析テーブルが出力され
る。同様に、第2翻訳文解析ステップで、第2翻訳文に
対して少くとも形態素解析のみ、あるいは形態素解析と
構文解析が実行され、第2翻訳文を構成する単語を示す
単語テーブルと第2翻訳文を構成する句を示す句構造解
析テーブルが出力される。そのあと、語句対応づけステ
ップで、第1翻訳文と第2翻訳文の間の語句の対応関係
が抽出され、語句対応テーブルが出力される。翻訳文一
致度算出ステップで、第1翻訳文と第2翻訳文の間の語
彙的及び構文的一致度が算出される。
【0022】本発明に係る翻訳文評価装置の作用も同様
である。
【0023】また、本発明に係る翻訳文評価機能付き機
械翻訳システムでは、第1言語の原文とともに、前もっ
て作成されてある第2言語の第2の翻訳文(望ましい翻
訳文)を読み込み、機械翻訳手段によって第1言語の原
文を翻訳して第1の翻訳文を得、その第1の翻訳文と第
2の翻訳文との一致度を算出して翻訳文評価を行なうこ
とができる。
【0024】
【実施例】以下、図面を用いて本発明の機械翻訳システ
ムの一実施例である日英機械翻訳システムについて説明
する。
【0025】このシステムのハードウエア構成は図1に
示すように中央処理装置1、記憶装置2、二次記憶装置
3、入力装置4及び表示装置5である。システムの機能
は、中央処理装置1が記憶装置2に記憶されたプログラ
ムを実行することによって実現される。記憶装置2は処
理の途中で作られる各種のテーブル類の記憶領域として
も利用される。二次記憶装置3には、翻訳辞書31、英
語単語辞書32、英語単語関係辞書33、テキストファ
イル34が記憶される。入力装置4は対訳テキストの読
み込みに用いられる。表示装置5は翻訳文評価結果の表
示に用いられる。
【0026】図1の翻訳辞書31は、図2に例示するよ
うに、日本語の単語である見出し語311と、その日本
語の単語の品詞、活用形パターン、意味マーカーなどを
含む見出し語属性情報312と、見出し語に対応する英
語の訳語313と、その英語の訳語の品詞、変化形パタ
ーンなどを含む訳語属性情報314とからなるレコード
の集まりである。翻訳辞書31のレコ−ドは、見出し語
311をキーとして検索することができる。
【0027】図1の英語単語辞書32は、図3に例示す
るように、英語の単語である見出し語321とその品詞
323、変化形パターン324を含むレコードの集まり
である。不規則変化する語に関して、変化形を見出し語
321としてその基本形325を含むレコードも含まれ
ている。2種類のレコードたとえば「take」と「t
ook」を区別するため、レコード内にはレコード種別
322も記されている。レコード種別322は、「0」
と「1」で表す。「1」は不規則変化を示す。レコード
は見出し語321をキーとして検索することができる。
【0028】図1の英語単語関係辞書33は、英語の単
語で同義語であるもの、及び同一の日本語単語の訳語に
なり得るが語義が異なるものを記憶したものである。英
語単語関係辞書33のレコードは、図4に例示するよう
に第1単語331及び第2単語332と同義性の程度3
33の組一つ以上からなり、レコ−ドは第1単語331
をキーとして検索できる。第1単語331、第2単語3
32とも単語の基本形である。同義性の程度333の値
は、組になっている第2単語332が第1単語331の
同義語である場合「0.5」、組になっている第2単語
332が第1単語331の異義語である場合「0.0」
である。
【0029】図1のテキストファイル34は、図5に例
示するように、文番号341と原文342、第1翻訳文
343、第2翻訳文344、評価点345からなるレコ
ードの集まりである。各レコードは、文番号341をキ
ーとして登録、検索あるいは更新することができる。
【0030】図1の中央処理装置1で実行される処理の
フローチャートを図6に示す。図1のハ−ドウエア構成
図を参照して、図6に示す処理手順を説明する。
【0031】まず、テキスト読み込みステップ11にお
いて、ユーザが用意した対訳テキストを入力装置4から
読み込み、図1のテキストファイル34に格納する。対
訳テキストは対訳関係にある日本文と英文を対にして入
力されるので、テキスト読み込みステップ11は、対訳
文に入力順のシーケンス番号を付与して図5のように文
番号341とし、読み込んだ日本文を原文342に、読
み込んだ英文を第2翻訳文344にしたレコードを作成
して登録する。この段階では、レコード内の第1翻訳文
343と評価点345の欄は空白である。
【0032】そのあと、テキストファイル34から対訳
文を一つずつ読み出し、対訳文の各々に対して図6の機
械翻訳ステップ12から評価結果表示ステップ17まで
の処理を次のように実行する。
【0033】まず機械翻訳ステップ12では、図2の翻
訳辞書31を参照しながら、図5のテキストファイル3
4から読み出したレコード内の原文342たとえば「代
表的な装置としてメ−ザやレ−ザがあげられる」を英語
に翻訳して、図5のように該テキストファイル34のレ
コードの第1翻訳文343に書き込む。機械翻訳につい
ては従来からさまざまな方法が提案されているが、本発
明は特にその方法を問わない。
【0034】第1翻訳文解析ステップ13は、形態素解
析13a、構文解析13b、後処理13cの三つのサブ
ステップから構成される。形態素解析サブステップ13
aにおいて、図3の英語単語辞書32を参照しながら、
図5の第1翻訳文343がどんな単語から構成されてい
るかを明らかにする。英文の形態素解析の方法は、例え
ば特開昭58−40684の中で開示されている。形態
素解析サブステップ13aの結果、図7(a)に例示す
る単語テーブルを出力する。
【0035】図7(a)は「A maser and a laser are
cited as a representative device. 」という第1翻訳
文(図5の第1翻訳文343)に対して得られる単語テ
ーブルである。単語テーブルは翻訳文を構成する単語を
文頭から順に並べたもので、各単語について、その基本
形211、品詞212、文中での出現形を示す情報21
3および内容語/機能語の別214の情報を保持する。
複数の品詞をもつ単語の品詞は、前後の単語との関係で
一つに絞れることもあるが、一つに絞れないこともあ
る。一つに絞れない場合、品詞212には複数の品詞が
並べて書かれ、文中での出現形を示す情報213、内容
語/機能語の別214も各品詞に対応して書かれる。内
容語/機能語の別214は、名詞、動詞、形容詞などが
内容語(C)であり、前置詞、接続詞、冠詞などが機能
語(F)というように品詞によって決められる。品詞2
12が書かれているので冗長な情報といえるが、特にあ
との処理のため単語テーブルのレコード中にセットされ
る。
【0036】図6の構文解析サブステップ13bにおい
て、CYK(Cocke−Younger−Kasam
i)法のような並列型構文解析の方法を用いて、図5の
第1翻訳文343に含まれる句の可能性を全て抽出す
る。その結果、図8(a)に例示する句構造解析テーブ
ルを出力する。
【0037】図8(a)は「A maser and a laser are
cited as a representative device. 」という第1翻訳
文に対して得られる句構造解析テーブルである。句構造
解析テーブルは三角行列の形をしている。以下におい
て、三角行列の左からi番目、下からj番目の要素を
(i,j)要素と呼ぶ。
【0038】行列の各要素には、0個以上の句標識が付
属情報とともに書かれる。翻訳文の第i番目から第(i
+j−1)番目までの単語の並びが句を構成するとき、
その句標識が句構造解析テーブルの(i,j)要素に書
かれる。翻訳文の第i番目から第(i+j−1)番目ま
での単語の並びが構成する句としていくつかの種類の可
能性がある場合は、複数の句標識が(i,j)要素に書
かれる。句標識の付属情報はいずれも構文解析の途中で
得られる情報であって、翻訳文一致度算出ステップ16
で参照される。
【0039】例えば、N(名詞)の場合には該名詞の単
/複の別、NP(名詞句)の場合には該名詞句が含む冠
詞に対応する定/不定の別、PP(前置詞句)の場合に
は該前置詞句を構成する前置詞(for,in,…)、
V1(動詞と助動詞が構成する句)の場合には時制が、
それぞれ付属情報である。また、句を構成する要素の句
標識の並びも付属情報である。なお、図8(a)の句構
造テーブルでは、スペースの関係上、付属情報を省略し
句標識のみを記している。
【0040】図8(a)の一例をあげてみる。各(i,
j)要素のうち(1,5)要素はNP(名詞句)となっ
ている。(1,5)要素は「a maser and
alaser」がNP(名詞句)であることを表す。ま
た(6,6)要素は「becite as a rep
resentative device」がVP(動詞
句)であることを表している。
【0041】後処理サブステップ13cにおいて、図7
(a)の単語テーブルと図8(a)の句構造解析テーブ
ルを、内容語に対応する要素のみからなるように編成し
なおす。すなわち機能語(前置詞,接続詞,冠詞など)
を除くように編成しなおす。編成しなおされた単語テー
ブル及び句構造解析テーブルは、それぞれ縮約単語テー
ブル及び縮約句構造解析テーブルと呼ぶ。縮約単語テー
ブル、縮約句構造解析テーブルを作る理由は、あとに続
く図6の語句対応づけステップ15において、単語の対
応づけの対象を内容語に限定し、句の対応づけも内容語
の対応関係に基づいて行なうためである。
【0042】図9(a)及び図10(a)は、それぞ
れ、図7(a)の単語テーブル及び図8(a)の句構造
解析テーブルに後処理を施した縮約単語テーブル及び縮
約句構造解析テーブルの例を示す。この例からもわかる
ように、図9(a)の縮約単語テーブルは、機能語を除
き内容語のみを詰めて並べたものである。また、図10
(a)の縮約句構造解析テーブルは、対応する内容語の
集合が同一であるテーブル中の要素を一つの要素にまと
めたものである。
【0043】図6の後処理サブステップ13cの処理は
図11のフローチャートに示すとおりである。ここで、
W、WB、X、XBはそれぞれ図7の単語テーブル、図
9の縮約単語テーブル、図8の句構造解析テーブル、図
10の縮約句構造解析テーブルを表す。また、(i,
j)は図8の句構造解析テーブルの要素を指すインデク
スであり、(i’,j’)は図10の縮約句構造解析テ
ーブルの要素を指すインデクスである。また、Nは翻訳
文に含まれる語の数であり、そのNの値は形態素解析サ
ブステップ13aの結果決まっている。
【0044】まず、縮約単語テーブルWBと縮約句構造
解析テーブルXBのエリアをクリアし、(i,j)に初
期値(1,1)を、i’に初期値1をそれぞれセットす
る(ステップ1301)。j=1,2,…,N−i+1
の各値についてステップ1302−1304の処理を実
行する。
【0045】すなわち、図7(a)の単語テーブルWを
参照して、翻訳文の第i語から第(i+j−1)語のう
ちの内容語の数を数え、これをj’にセットする(ステ
ップ1302)。そして、図8(a)の句構造解析テー
ブルXの(i,j)要素の内容を図10(a)の縮約句
構造解析テーブルXBの(i’,j’)要素に付加する
(ステップ1304)。ただし、P(前置詞)やART
(冠詞)、CNJ(接続詞)など機能語Fのみからなる
句標識は除外する(ステップ1303)。以上のステッ
プ1302−1304の処理をj=N−i+1まで実行
する。
【0046】次に、図7(a)の単語テーブルWを参照
して、翻訳文の第i語が内容語Cか機能語Fか判定する
(ステップ1305)。内容語Cであれば、単語テーブ
ルWの第i要素を図9(a)の縮約単語テーブルWBの
第i’要素にした(ステップ1306)あと、i,i’
をともに1進める(ステップ1307)。機能語Fであ
れば、iのみ1進め、i’はそのままにする(ステップ
1308)。iがNを越えるまで、上記のステップ13
02−1308の処理を実行する。
【0047】図6の第2翻訳文解析ステップ14は、第
1翻訳文解析ステップ13と全く同様である。その結
果、第2翻訳文344「Typical device
s include a maser and a l
aser」に対する単語テーブルと句構造解析テーブ
ル、それらに後処理を施した縮約単語テーブルと縮約句
構造解析テーブルが得られる。第2翻訳文の例「Typica
l devices include a maser and a laser.」に対する単
語テーブルを図7(b)に、句構造解析テーブルを図8
(b)に、縮約単語テーブルを図9(b)に、縮約句構
造解析テーブルを図10(b)にそれぞれ示す。
【0048】図6の語句対応づけステップ15は、後述
する単語対応づけサブステップ15a及び句対応づけサ
ブステップ15bの二つのサブステップから構成され
る。単語対応づけサブステップ15aは、第1翻訳文3
43と第2翻訳文344の間の単語の対応関係を明らか
にする。それに続く句対応づけサブステップ15bは、
第1翻訳文343と第2翻訳文344の間の句の対応関
係を明らかにする。その結果は図12に例示する語句対
応テーブルで表現される。
【0049】図12の語句対応テーブルは三角行列であ
って、サイズは第2翻訳文の縮約句構造解析テーブルと
同じである。行列の要素には、第1翻訳文の縮約句構造
解析テーブルの要素を指すインデクスが0個以上書かれ
る。語句の対応関係にあいまい性がある場合は複数個書
かれる。第2翻訳文の第i番目から第(i+j−1)番
目までの内容語が構成する句と、第1翻訳文の第m番目
から第(m+n−1)番目までの内容語が構成する句と
が対応するとき、語句対応テーブルの(i,j)要素に
「(m,n)」が書かれる。
【0050】たとえば、図9(a)と図9(b)を参照
して、第1翻訳文の図9(a)の1番目「maser」
は、第2翻訳文の図9(b)の4番目の「maser」
と対応して一致する。このため、図12の語句対応テ−
ブルの(1,1)の要素には第2翻訳文である図9
(b)の4番目の1語長の「maser」ということで
(4,1)が入る。また第1翻訳文の図9(a)の3番
目「cite」は第2翻訳文の図9(b)にはないので
(1,3)要素は空白である。
【0051】語句対応づけステップ15では、図12の
語句対応テーブルとともに、図13に例示する単語同義
性テーブルを作成する。単語同義性テーブルは、第2翻
訳文の各内容語に対応する要素が並べられたテーブルで
ある。すなわち、第2翻訳文の第i内容語とそれに対応
する第1翻訳文中の内容語との間の同義性の程度が第i
要素に書かれる。なお、第2翻訳文の第i内容語に対応
する内容語が第1翻訳文になかったり、同定できない場
合、同義性の程度は「0.0」にする。語句対応づけス
テップ15の処理においては、さらに対応づけフラグテ
ーブルが利用される。対応づけフラグテーブルは、第1
翻訳文の各内容語に対応するフラグが並べられたテーブ
ルである。第mフラグは、第1翻訳文の第m内容語が第
2翻訳文中の内容語と対応づけられたときのみ、オンに
される。
【0052】図6の単語対応づけサブステップ15aの
処理は図14と図15のフローチャートに示すとおりで
ある。ここで、WB1、WB2はそれぞれ図9(a)の
第1翻訳文の縮約単語テーブル、及び図9(b)の第2
翻訳文の縮約単語テーブルを表す。また、M、Iはそれ
ぞれ第1翻訳文、第2翻訳文の縮約単語テーブルの要素
数であり、m、iはそれぞれ第1翻訳文、第2翻訳文中
の内容語を指すインデクスである。さらに、C、S、F
はそれぞれ語句対応テーブル、単語同義性テーブル、対
応づけフラグテーブルを表す。
【0053】まず、図12の語句対応テーブルCの全要
素を空にし、図13の単語同義性テーブルSの全要素の
値を「0.0」にし、また対応づけフラグテーブルFの
全フラグをオフにする(ステップ1501)。その後、
第2翻訳文の各内容語に関してステップ1502−15
07の処理を行なう。
【0054】まず、図9(b)の第2翻訳文の第i内容
語と同じ内容語が図9(a)の第1翻訳文の縮約単語テ
ーブルにあるかどうか調べる(ステップ1502)。第
1翻訳文の第m内容語が第2翻訳文の第i内容語と一致
すれば、語句対応テーブルの(i,1)要素に「(m,
1)」を書き加えるとともに、単語同義性テーブルSの
第i要素の値を「1.0」にし、さらに対応づけフラグ
テーブルFの第mフラグをオンにする(ステップ150
3)。図9(b)の第2翻訳文の第i内容語と同じ内容
語が図9(a)の第1翻訳文の縮約単語テーブル中にな
ければステップ1504からステップ1505に進み、
図9(b)の第2翻訳文の第i内容語をキーとして図4
の英語単語関係辞書33を検索する(ステップ150
5)。レコードが検索されたら、ステップ1506−1
507の処理を行なう。
【0055】すなわち、該レコード内の第2単語332
のいずれかと同じ内容語が図9(a)の第1翻訳文の縮
約単語テーブルにあるかどうか調べる(ステップ150
6)。第1翻訳文の第m内容語が検索されたレコード内
の第2単語332の一つと一致すれば、語句対応テーブ
ルの(i,1)要素に「(m,1)」を書き加えるとと
もに、検索されたレコード内の該第2単語332と組に
なっている同義性の程度333を単語同義性テーブルの
第i要素に書き込み、さらに対応づけフラグテーブルの
第mフラグをオンにする(ステップ1507)。
【0056】図6の句対応づけサブステップ15bの処
理は図16と図17のフローチャートに示すとおりであ
る。ここで、XB1、XB2はそれぞれ図10(a)の
第1翻訳文の縮約句構造解析テーブル、及び図10
(b)の第2翻訳文の縮約句構造解析テーブルを表す。
また、(m,n)、(i,j)はそれぞれ図9(a)の
第1翻訳文、図9(b)の第2翻訳文の縮約句構造解析
テーブルの要素を指すインデクスである。また、M、I
はそれぞれ第1翻訳文、第2翻訳文の縮約単語テーブル
の要素数である。さらに、C、Fはそれぞれ語句対応テ
ーブル、対応づけフラグテーブルを表す。
【0057】まず、図10(b)の第2翻訳文の縮約句
構造解析テーブルの(i,j)要素を取り出し(i=
1,…,I−1;j=2,…,I−i+1)、各要素に
対してステップ1521−1526の処理を行なう。す
なわち、図10(b)の第2翻訳文の縮約句構造解析テ
ーブルの(i,j)要素が空でないかどうかチェックす
る(ステップ1521)。空でなければ、図12の語句
対応テーブルの(i,1)要素、…、(i+j−1,
1)要素に空のものがないかどうかチェックする(ステ
ップ1522)。図12の語句対応テーブルの(i,
1)要素、…、(i+j−1,1)要素に空のものがな
ければ、それらの要素の各々からそこに書かれている図
10(a)の第1翻訳文の縮約句構造解析テーブルの要
素を指すインデクスを一つずつ選び、インデクス集合U
を作る(ステップ1523)。
【0058】インデクス集合Uが第1翻訳文の縮約句構
造解析テーブルの連続する要素の集合を表しているなら
ば、すなわちU={(x,1),(x+2,1),…,
(x+j−1,1)}であれば(ステップ1524)、
さらに、第1翻訳文の縮約句構造解析テーブルの(x,
j)要素が空でないかどうかチェックする(ステップ1
525)。空でなければ、語句対応テーブルの(i,
j)要素に「(x,j)」を書き加える(ステップ15
26)。
【0059】次に、図10(b)の第2翻訳文の縮約句
構造解析テーブルの(i,j)要素を取り出し(i=
1,…,I−1;j=2,…,I−i+1)、各要素に
対してステップ1527−1532の処理を行なう。第
2翻訳文の縮約句構造解析テーブルの(i,j)要素が
空でなく、かつ図12の語句対応テーブルの(i,j)
要素が空であるかどうかチェックする(ステップ152
7)。第2翻訳文の縮約句構造解析テーブルの(i,
j)要素が空でなく、かつ語句対応テーブルの(i,
j)要素が空であれば、語句対応テーブルの(i,1)
要素、…、(i+j−1,1)要素のうち空でない要素
の各々からそこに書かれている第1翻訳文の縮約句構造
解析テーブルの要素を指すインデクスを一つずつ選び、
インデクス集合Uを作り(ステップ1528)、ステッ
プ1529−1532の処理を行なう。第1翻訳文の縮
約句構造解析テーブルの(m,n)要素を取り出して
(m=1,…,M−1;n=2,…,M−m+1)、第
1翻訳文の縮約句構造解析テーブルの(m,n)要素が
空でないこと(ステップ1529)、Uが{(m,
1),(m+1,1),…,(m+n−1,1)}の部
分集合であること(ステップ1530)、{(m,
1),(m+1,1),…,(m+n−1,1)}−U
の要素(x,1)に対して対応づけフラグテーブルの第
xフラグがオフであること(ステップ1531)をチェ
ックする。ステップ1529−1531が全て成立する
場合、語句対応テーブルの(i,j)要素に「(m,
n)」を書き加える(ステップ1532)。
【0060】図6の翻訳文一致度算出ステップ16で
は、図10(a)の第1翻訳文343の縮約句構造解析
テーブル、図10(b)の第2翻訳文344の縮約句構
造解析テーブル、図12の語句対応テーブル、及び図1
3の単語同義性テーブルを参照して、第2翻訳文344
に対する第1翻訳文343の一致度を算出する。この処
理では、さらに句重みテーブルと減点テーブルを参照す
る。句重みテーブルは、図18に例示するように、句標
識ごとに翻訳文の一致度への寄与の度合を定めたもので
ある。減点テーブルは、図19に例示するように、第1
翻訳文と第2翻訳文の対応する句の特性(句構造解析テ
ーブルに書かれた付属情報)の差異ごとに句の一致度
(満点は1.0)からの減点分を定めたものである。
【0061】翻訳文一致度算出ステップ16の処理は図
20のフローチャートに示すとおりである。ここで、X
B1、XB2はそれぞれ第1翻訳文、第2翻訳文の縮約
句構造解析テーブルを表し、Cは語句対応テーブルを表
す。また、(i,j)は第2翻訳文の縮約句構造解析テ
ーブルの要素を指すインデクスであり、Iは第2翻訳文
の内容語の数である。さらに、Aは句重みを累計してい
く変数、Bは第1翻訳文と第2翻訳文の対応する語句の
一致度を累計していく変数である。
【0062】まず、変数A、Bを0に初期化した(ステ
ップ1601)あと、(i,j)(i=1,…,I;j
=1,…,I−i+1)の各値についてステップ160
2−1605の処理を行なう。
【0063】図10(b)の第2翻訳文の縮約句構造解
析テーブルの(i,j)要素が空かどうかチェックする
(ステップ1602)。空であれば、当該(i,j)に
ついての処理は終了する。空でなければ、図18の句重
みテーブルを参照して、図10(b)の第2翻訳文の縮
約句構造解析テーブルの(i,j)要素に示されている
句の重みを求め、変数Aに加算する(ステップ160
3)。ここで、当該要素に複数の句標識が書かれている
ときは、重みの最も大きいものを採用する。次に、語句
対応テーブルの(i,j)要素が空かどうかチェックす
る(ステップ1604)。空であれば、当該(i,j)
についての処理は終了する。
【0064】語句対応テーブルの(i,j)要素が空で
ないとき、図12の語句対応テーブルが示している第2
翻訳文中の句と第1翻訳文中の句との一致度を求めて変
数Bに加算する(ステップ1605)。すなわち、図1
2の語句対応テーブルの(i,j)要素に書かれている
インデクスを(m,n)としたとき、図10(b)の第
2翻訳文の縮約句構造解析テーブルの(i,j)要素に
書かれている句の付属情報と図10(a)の第1翻訳文
の縮約句構造解析テーブルの(m,n)要素に書かれて
いる句の付属情報とを比較し、その差異に基づいて図1
9の減点テーブルを参照し、1から減点分を引いてい
く。マイナスになるときはそれ以上引かず、0とする。
このようにして得られた点に当該句の重みを掛けたもの
を変数Bに加算する。なお、語句対応テーブルの(i,
j)要素に複数のインデクスが書かれているときは、最
大の得点を与えるインデクスを採用する。
【0065】(i,j)の各値についてステップ160
2−1605の処理を終了したら、B/Aを計算し、図
5のテキストファイル34のレコード中の評価点345
に書き込む(ステップ1606)。
【0066】一致度算出の例として、第1翻訳文「A ma
ser and a laser are cited as a representative devi
ce. 」と第2翻訳文「Typical devices include a mase
r and a laser.」に関して句ごとに重みと得点を示した
ものを図21に示す。図21の三角行列の各要素は第2
翻訳文の句に対応しており、各要素中に書かれた分母が
重みを、分子が句の一致度を表している。図21の数値
の意味は、図12に示されている語句対応テーブル、図
10(a)(b)の縮約句構造解析テーブルと対応づけ
ると理解できる。図21を集計して得られる翻訳文の一
致度は0.52である。この一致度0.52は図5に表
すようにテキストファイルに格納される。
【0067】図6の評価結果表示ステップ17におい
て、原文、第1翻訳文、第2翻訳文とともに、第1翻訳
文と第2翻訳文との一致度を表示装置5に表示する。表
示画面の例を図22に示す。
【0068】図6の機械翻訳ステップ12から評価結果
表示ステップ17までをテキストファイル34から読み
出した対訳文の各々に対して実行したあと、評価結果集
計表示ステップ18で、テキストファイル34の全文に
対する評価結果のサマリデータを計算して、表示装置5
に表示する。表示されるデータは、図23に例示するよ
うに、評価点の平均値や分布、原文の長さ別の評価点平
均値などである。
【0069】以上、本発明による機械翻訳システムの実
施例である日英機械翻訳システムを説明した。
【0070】なお、本発明は上述の実施例に限定されな
い。たとえば、実施例で示した翻訳辞書31と英語単語
辞書32の間にはデータの重複がある。英語単語関係辞
書33を含めて、データの重複がないように構成しても
よいことは当然である。要は、機械翻訳12、翻訳文解
析13、14、語句対応づけ15のそれぞれのステップ
で、必要な辞書情報が利用できればよい。
【0071】実施例の英語単語関係辞書33に記憶され
る単語の同義性の程度33は、同義語の場合の「0.
5」と異義語の場合の「0.0」の2段階であったが、
同義性の程度にもっと多くの段階を設定してもよい。そ
のようにすれば、翻訳文の間の語彙的一致度のきめ細か
い評価が可能になる。
【0072】実施例では、一つの原文に対して一つの第
2翻訳文が与えられている。しかし、一つの原文に対し
て模範的な翻訳文が複数考えられるのがむしろ普通であ
り、第2翻訳文を複数与えるようにしてもよい。この場
合、第2翻訳文の各々と第1翻訳文との一致度を算出し
た上で、一致度の最大値を第1翻訳文の評価点として採
用するものとする。
【0073】実施例では、第2翻訳文は原文と一緒に機
械翻訳システムに入力されるものとしているが、機械翻
訳システムによって生成された第1翻訳文を人間が後編
集した結果を第2翻訳文として利用してもよい。その場
合のシステムの処理は、テキスト読み込みステップ11
は原文のみを読み込むものとし、機械翻訳ステップ12
と第1翻訳文解析ステップ13の間に、人間により後編
集された翻訳文を読み込むステップを挿入したものとす
ればよい。
【0074】実施例は翻訳文評価機能を組み込んだ機械
翻訳システムであるが、機械翻訳システムから独立した
機械翻訳システム評価装置を構成することもできる。こ
れは、第1の翻訳文と第2の翻訳文を読み込むテキスト
読み込み機能と、第1の翻訳文と第2の翻訳文の一致度
を算出する翻訳文評価機能とを組み合わせることによっ
て実現される。
【0075】さらに、上記機械翻訳システム評価装置の
変形として、一つの機械翻訳システムの異なるバージョ
ンあるいは二つの機械翻訳システムを比較評価する機械
翻訳システム評価装置が実現できる。これは、甲、乙二
つの第1翻訳文を読み込んで、甲、乙それぞれと第2翻
訳文の一致度を計算し、二つの一致度の大小を比較する
ようにしたものである。すなわち、第1言語の原文に対
する第2言語の三つの翻訳文、すなわち第1の翻訳文
(甲)、第1の翻訳文(乙)及び第2の翻訳文を該原文
とともに読み込むテキスト読み込み機能と、前記第1の
翻訳文(甲)と前記第2の翻訳文の一致度、並びに前記
第1の翻訳文(乙)と前記第2の翻訳文の一致度を算出
する翻訳文評価機能と、該翻訳文評価機能で算出された
第1の翻訳文(甲)と第2の翻訳文の一致度が第1の翻
訳文(乙)と第2の翻訳文の一致度より小さい原文を選
んで、該原文と第1の翻訳文(甲)、第1の翻訳文
(乙)、第2の翻訳文を表示する翻訳文選択表示機能を
組み合わせることによって実現される。
【0076】図18の句重みテ−ブルの各値や図19の
減点テ−ブルの値は、一例であってこれらの値に限定さ
れるものではない。
【0077】
【発明の効果】本発明によれば、望ましい翻訳文を示す
対訳テキストさえ用意すれば、機械翻訳システムの翻訳
文の質を自動的かつ客観的に評価できるという効果が得
られる。また、機械翻訳システムの開発者が開発目標の
達成度を把握できるだけでなく、ユーザが利用したい分
野の典型的な対訳テキストを用意することによって、機
械翻訳システムがその分野に適しているか、あるいは利
用効果があるかどうかを容易に判断することができる。
さらに、ある分野の同一対訳テキストを用いて複数の機
械翻訳システムを評価することにより、その分野に最も
適した機械翻訳システムを選定することができる。
【図面の簡単な説明】
【図1】本発明の機械翻訳システムの一実施例である日
英機械翻訳システムのハードウエア構成を示す図であ
る。
【図2】翻訳辞書のレコードを例示する図である。
【図3】英語単語辞書のレコードを例示する図である。
【図4】英語単語関係辞書のレコードを例示する図であ
る。
【図5】テキストファイルのレコードを例示する図であ
る。
【図6】翻訳文評価処理のフローチャートである。
【図7】単語テーブルを例示する図である。
【図8】句構造解析テーブルを例示する図である。
【図9】縮約単語テーブルを例示する図である。
【図10】縮約句構造解析テーブルを例示する図であ
る。
【図11】翻訳文解析ステップの後処理サブステップの
処理を示すフローチャートである。
【図12】語句対応テーブルを例示する図である。
【図13】単語同義性テーブルを例示する図である。
【図14】語句対応づけステップの単語対応づけサブス
テップの処理を示すフローチャート(その1)である。
【図15】語句対応づけステップの単語対応づけサブス
テップの処理を示すフローチャート(その2)である。
【図16】語句対応づけステップの句対応づけサブステ
ップの処理を示すフローチャート(その1)である。
【図17】語句対応づけステップの句対応づけサブステ
ップの処理を示すフローチャート(その2)である。
【図18】句重みテーブルを例示する図である。
【図19】減点テーブルを例示する図である。
【図20】翻訳文一致度算出ステップの処理を示すフロ
ーチャートである。
【図21】翻訳文の一致度算出の例を説明する図であ
る。
【図22】評価結果表示画面の例である。
【図23】評価結果集計表示画面の例である。
【符号の説明】
1 中央処理装置 2 記憶装置 3 二次記憶装置 4 入力装置 5 表示装置 11 テキスト読み込みステップ 12 機械翻訳ステップ 13 第1翻訳文解析ステップ 13a 形態素解析サブステップ 13b 構文解析サブステップ 13c 後処理サブステップ 14 第2翻訳文解析ステップ 15 語句対応づけステップ 15a 単語対応づけサブステップ 15b 句対応づけサブステップ 16 翻訳文一致度算出ステップ 17 評価結果表示ステップ 18 評価結果集計表示ステップ 31 翻訳辞書 32 英語単語辞書 33 英語単語関係辞書 34 テキストファイル

Claims (18)

    【特許請求の範囲】
  1. 【請求項1】第1言語の原文に対する第2言語の第1の
    翻訳文の形態素解析と構文解析を行なう第1翻訳文解析
    ステップと、該原文に対する第2言語の第2の翻訳文の
    形態素解析と構文解析を行なう第2翻訳文解析ステップ
    と、第1翻訳文と第2翻訳文の間の語句の対応づけを行
    なう語句対応づけステップと、前記語句対応づけステッ
    プの結果に基づいて第1翻訳文と第2翻訳文の語彙的及
    び構文的一致度を算出する翻訳文一致度算出ステップと
    を備えたことを特徴とする翻訳文評価方法。
  2. 【請求項2】第1言語の原文に対する第2言語の第1の
    翻訳文の形態素解析を行なう第1翻訳文解析ステップ
    と、該原文に対する第2言語の第2の翻訳文の形態素解
    析を行なう第2翻訳文解析ステップと、第1翻訳文と第
    2翻訳文の間の単語の対応づけを行なう単語対応づけス
    テップと、前記単語対応づけステップの結果に基づいて
    第1翻訳文と第2翻訳文の語彙的一致度を算出する翻訳
    文一致度算出ステップとを備えたことを特徴とする翻訳
    文評価方法。
  3. 【請求項3】前記第1の翻訳文が前記原文を機械翻訳し
    た翻訳文であり、前記第2の翻訳文が前記原文の望まし
    い翻訳文である請求項1または2の翻訳文評価方法。
  4. 【請求項4】第1言語の原文に対する第2言語の第1の
    翻訳文の形態素解析と構文解析を行なう第1翻訳文解析
    手段と、該原文に対する第2言語の第2の翻訳文の形態
    素解析と構文解析を行なう第2翻訳文解析手段と、第1
    翻訳文と第2翻訳文の間の語句の対応づけを行なう語句
    対応づけ手段と、前記語句対応づけの結果に基づいて第
    1翻訳文と第2翻訳文の語彙的及び構文的一致度を算出
    する翻訳文一致度算出手段とを備えたことを特徴とする
    翻訳文評価装置。
  5. 【請求項5】第1言語の原文に対する第2言語の第1の
    翻訳文の形態素解析を行なう第1翻訳文解析手段と、該
    原文に対する第2言語の第2の翻訳文の形態素解析を行
    なう第2翻訳文解析手段と、第1翻訳文と第2翻訳文の
    間の単語の対応づけを行なう単語対応づけ手段と、前記
    単語対応づけの結果に基づいて第1翻訳文と第2翻訳文
    の語彙的一致度を算出する翻訳文一致度算出手段とを備
    えたことを特徴とする翻訳文評価装置。
  6. 【請求項6】前記第1の翻訳文が前記原文を機械翻訳し
    た翻訳文であり、前記第2の翻訳文が前記原文の望まし
    い翻訳文である請求項4または5の翻訳文評価装置。
  7. 【請求項7】第1言語の文を第2言語の文に翻訳する機
    械翻訳手段を有する機械翻訳システムであって、第1言
    語の原文に対して前もって作成された第2言語の第2の
    翻訳文を該第1言語の原文とともに読み込むテキスト読
    み込み手段と、該機械翻訳手段によって前記第1言語の
    原文を翻訳して得られる第1の翻訳文と前記第2の翻訳
    文との一致度を算出する翻訳文評価手段とを備えたこと
    を特徴とする翻訳文評価機能付き機械翻訳システム。
  8. 【請求項8】第1言語の文を第2言語の文に翻訳する機
    械翻訳手段を有する機械翻訳システムであって、第1言
    語の原文に対して前もって作成された第2言語の複数の
    翻訳文からなる翻訳文セットを該第1言語の原文ととも
    に読み込むテキスト読み込み手段と、該機械翻訳手段に
    よって前記第1言語の原文を翻訳して得られる機械翻訳
    文と前記翻訳文セットに含まれる翻訳文の各々との一致
    度を算出した上で、一致度の最大値を該機械翻訳文の評
    価点として採用する翻訳文評価手段とを備えたことを特
    徴とする翻訳文評価機能付き機械翻訳システム。
  9. 【請求項9】第1言語の文を第2言語の文に翻訳する機
    械翻訳手段を有する機械翻訳システムであって、該機械
    翻訳手段によって得られる翻訳文を編集するための翻訳
    文編集手段と、前記機械翻訳手段によって得られる第1
    の翻訳文と、該第1の翻訳文を前記翻訳文編集手段を用
    いて編集して得た第2の翻訳文との一致度を算出する翻
    訳文評価手段とを備えたことを特徴とする翻訳文評価機
    能付き機械翻訳システム。
  10. 【請求項10】前記翻訳文評価手段は、請求項1または
    2に記載の翻訳文評価方法に沿って作動するものである
    ことを特徴とする請求項7、8または9に記載の翻訳文
    評価機能付き機械翻訳システム。
  11. 【請求項11】前記翻訳文評価手段として請求項4また
    は5に記載の翻訳文評価装置を用いたことを特徴とする
    請求項7、8または9に記載の翻訳文評価機能付き機械
    翻訳システム。
  12. 【請求項12】第1言語の原文を機械翻訳した第2言語
    の第1の翻訳文及び該原文の望ましい翻訳文である第2
    言語の第2の翻訳文を読み込むテキスト読み込み手段
    と、前記第1の翻訳文と前記第2の翻訳文との一致度を
    算出する翻訳文評価手段とを備えたことを特徴とする機
    械翻訳システム評価装置。
  13. 【請求項13】第1言語の原文に対する複数の翻訳文か
    らなる翻訳文セットと機械翻訳文を読み込むテキスト読
    み込み手段と、前記翻訳文セットに含まれる翻訳文の各
    々と機械翻訳文との一致度を算出した上で、一致度の最
    大値を該機械翻訳文の評価点として採用する翻訳文評価
    手段とを備えたことを特徴とする機械翻訳システム評価
    装置。
  14. 【請求項14】前記翻訳文評価手段は、請求項1または
    2に記載の翻訳文評価方法に沿って作動するものである
    ことを特徴とする請求項12または13に記載の機械翻
    訳システム評価装置。
  15. 【請求項15】前記翻訳文評価手段として請求項4また
    は5に記載の翻訳文評価装置を用いたことを特徴とする
    請求項12または13に記載の機械翻訳システム評価装
    置。
  16. 【請求項16】複数組の第1の翻訳文と第2の翻訳文の
    それぞれの組に関して前記翻訳文評価手段が算出した翻
    訳文の一致度の平均値、分布、原文の長さ別平均値の少
    くとも1つを計算して表示する評価結果集計表示手段を
    さらに備えたことを特徴とする請求項7、8、9、10
    または11の翻訳文評価機能付き機械翻訳システム。
  17. 【請求項17】複数組の第1の翻訳文と第2の翻訳文の
    それぞれの組に関して前記翻訳文評価手段が算出した翻
    訳文の一致度の平均値、分布、原文の長さ別平均値の少
    くとも1つを計算して表示する評価結果集計表示手段を
    さらに備えたことを特徴とする請求項12、13、14
    または15の機械翻訳システム評価装置。
  18. 【請求項18】第1言語の原文に対する第2言語の三つ
    の翻訳文、すなわち第1の翻訳文(甲)、第1の翻訳文
    (乙)及び第2の翻訳文を該原文とともに読み込むテキ
    スト読み込み手段と、前記第1の翻訳文(甲)と前記第
    2の翻訳文の一致度、並びに前記第1の翻訳文(乙)と
    前記第2の翻訳文の一致度を算出する翻訳文評価手段
    と、該翻訳文評価機能で算出された第1の翻訳文(甲)
    と第2の翻訳文の一致度が第1の翻訳文(乙)と第2の
    翻訳文の一致度より小さい原文を選んで、該原文と第1
    の翻訳文(甲)、第1の翻訳文(乙)、第2の翻訳文を
    表示する翻訳文選択表示手段とを備えたことを特徴とす
    る機械翻訳システム評価装置。
JP4097656A 1992-04-17 1992-04-17 翻訳文評価方法、翻訳文評価装置、翻訳文評価機能付き機械翻訳システムおよび機械翻訳システム評価装置 Pending JPH05298360A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP4097656A JPH05298360A (ja) 1992-04-17 1992-04-17 翻訳文評価方法、翻訳文評価装置、翻訳文評価機能付き機械翻訳システムおよび機械翻訳システム評価装置
US08/047,150 US5408410A (en) 1992-04-17 1993-04-13 Method of and an apparatus for automatically evaluating machine translation system through comparison of their translation results with human translated sentences

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4097656A JPH05298360A (ja) 1992-04-17 1992-04-17 翻訳文評価方法、翻訳文評価装置、翻訳文評価機能付き機械翻訳システムおよび機械翻訳システム評価装置

Publications (1)

Publication Number Publication Date
JPH05298360A true JPH05298360A (ja) 1993-11-12

Family

ID=14198120

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4097656A Pending JPH05298360A (ja) 1992-04-17 1992-04-17 翻訳文評価方法、翻訳文評価装置、翻訳文評価機能付き機械翻訳システムおよび機械翻訳システム評価装置

Country Status (2)

Country Link
US (1) US5408410A (ja)
JP (1) JPH05298360A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012079107A (ja) * 2010-10-01 2012-04-19 Nippon Telegr & Teleph Corp <Ntt> 翻訳品質自動評価装置とその方法、及び語順最適化機械翻訳学習装置とプログラム
US8606559B2 (en) 2008-09-16 2013-12-10 Electronics And Telecommunications Research Institute Method and apparatus for detecting errors in machine translation using parallel corpus
JP2015191430A (ja) * 2014-03-28 2015-11-02 株式会社ゼンリンデータコム 翻訳装置、翻訳方法及び翻訳プログラム
JP2018022269A (ja) * 2016-08-02 2018-02-08 国立研究開発法人情報通信研究機構 自動翻訳システム、自動翻訳方法、およびプログラム
JP2023066183A (ja) * 2021-10-28 2023-05-15 株式会社川村インターナショナル 言語資産管理システム、言語資産管理方法、及び、言語資産管理プログラム

Families Citing this family (69)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03129469A (ja) * 1989-10-14 1991-06-03 Canon Inc 自然言語処理装置
US5995922A (en) * 1996-05-02 1999-11-30 Microsoft Corporation Identifying information related to an input word in an electronic dictionary
JP3959180B2 (ja) * 1998-08-24 2007-08-15 東芝ソリューション株式会社 通信翻訳装置
US6473896B1 (en) * 1998-10-13 2002-10-29 Parasoft, Corp. Method and system for graphically generating user-defined rules for checking language quality
AU2440100A (en) 1999-03-19 2000-10-09 Trados Gmbh Workflow management system
US20060116865A1 (en) * 1999-09-17 2006-06-01 Www.Uniscape.Com E-services translation utilizing machine translation and translation memory
US20010029455A1 (en) * 2000-03-31 2001-10-11 Chin Jeffrey J. Method and apparatus for providing multilingual translation over a network
FR2812102B1 (fr) * 2000-07-18 2005-02-04 Tradweb Procede et systeme pour la traduction linguistique
US7236932B1 (en) * 2000-09-12 2007-06-26 Avaya Technology Corp. Method of and apparatus for improving productivity of human reviewers of automatically transcribed documents generated by media conversion systems
US6996518B2 (en) * 2001-01-03 2006-02-07 International Business Machines Corporation Method and apparatus for automated measurement of quality for machine translation
WO2004055691A1 (ja) * 2002-12-18 2004-07-01 Ricoh Company, Ltd. 翻訳支援システムおよびそのプログラム
US7319949B2 (en) * 2003-05-27 2008-01-15 Microsoft Corporation Unilingual translator
US7587307B2 (en) * 2003-12-18 2009-09-08 Xerox Corporation Method and apparatus for evaluating machine translation quality
CN100555270C (zh) * 2004-01-13 2009-10-28 中国科学院计算技术研究所 一种机器翻译自动评测方法及其系统
US7983896B2 (en) 2004-03-05 2011-07-19 SDL Language Technology In-context exact (ICE) matching
US20100262621A1 (en) * 2004-03-05 2010-10-14 Russ Ross In-context exact (ice) matching
US8666725B2 (en) * 2004-04-16 2014-03-04 University Of Southern California Selection and use of nonstatistical translation components in a statistical machine translation framework
DE202005022113U1 (de) * 2004-10-12 2014-02-05 University Of Southern California Training für eine Text-Text-Anwendung, die eine Zeichenketten-Baum-Umwandlung zum Training und Decodieren verwendet
US8886517B2 (en) 2005-06-17 2014-11-11 Language Weaver, Inc. Trust scoring for language translation systems
US8676563B2 (en) * 2009-10-01 2014-03-18 Language Weaver, Inc. Providing human-generated and machine-generated trusted translations
US7653531B2 (en) * 2005-08-25 2010-01-26 Multiling Corporation Translation quality quantifying apparatus and method
US10319252B2 (en) 2005-11-09 2019-06-11 Sdl Inc. Language capability assessment and training apparatus and techniques
US7536295B2 (en) * 2005-12-22 2009-05-19 Xerox Corporation Machine translation using non-contiguous fragments of text
US20070239631A1 (en) * 2006-03-28 2007-10-11 Nokia Corporation Method, apparatus and computer program product for generating a graphical image string to convey an intended message
US8943080B2 (en) * 2006-04-07 2015-01-27 University Of Southern California Systems and methods for identifying parallel documents and sentence fragments in multilingual document collections
US7542893B2 (en) * 2006-05-10 2009-06-02 Xerox Corporation Machine translation using elastic chunks
US8886518B1 (en) 2006-08-07 2014-11-11 Language Weaver, Inc. System and method for capitalizing machine translated text
US8521506B2 (en) * 2006-09-21 2013-08-27 Sdl Plc Computer-implemented method, computer software and apparatus for use in a translation system
US9122674B1 (en) 2006-12-15 2015-09-01 Language Weaver, Inc. Use of annotations in statistical machine translation
WO2008083503A1 (en) * 2007-01-10 2008-07-17 National Research Council Of Canada Means and method for automatic post-editing of translations
US7890521B1 (en) * 2007-02-07 2011-02-15 Google Inc. Document-based synonym generation
US8615389B1 (en) 2007-03-16 2013-12-24 Language Weaver, Inc. Generation and exploitation of an approximate language model
US8831928B2 (en) * 2007-04-04 2014-09-09 Language Weaver, Inc. Customizable machine translation service
JP2008276517A (ja) * 2007-04-27 2008-11-13 Oki Electric Ind Co Ltd 訳文評価装置、訳文評価方法およびプログラム
US8825466B1 (en) 2007-06-08 2014-09-02 Language Weaver, Inc. Modification of annotated bilingual segment pairs in syntax-based machine translation
US8185377B2 (en) * 2007-08-11 2012-05-22 Microsoft Corporation Diagnostic evaluation of machine translators
US8209164B2 (en) 2007-11-21 2012-06-26 University Of Washington Use of lexical translations for facilitating searches
TWI457868B (zh) * 2008-03-12 2014-10-21 Univ Nat Kaohsiung 1St Univ Sc 機器翻譯譯文之自動修飾方法
US20100017293A1 (en) * 2008-07-17 2010-01-21 Language Weaver, Inc. System, method, and computer program for providing multilingual text advertisments
US9262403B2 (en) 2009-03-02 2016-02-16 Sdl Plc Dynamic generation of auto-suggest dictionary for natural language translation
GB2468278A (en) * 2009-03-02 2010-09-08 Sdl Plc Computer assisted natural language translation outputs selectable target text associated in bilingual corpus with input target text from partial translation
KR20100113749A (ko) * 2009-04-14 2010-10-22 한국전자통신연구원 클라이언트 단말기, 게임 서비스 장치 및 게임 서비스 시스템 및 그 방법
US8185373B1 (en) * 2009-05-05 2012-05-22 The United States Of America As Represented By The Director, National Security Agency, The Method of assessing language translation and interpretation
US8990064B2 (en) 2009-07-28 2015-03-24 Language Weaver, Inc. Translating documents based on content
US8380486B2 (en) * 2009-10-01 2013-02-19 Language Weaver, Inc. Providing machine-generated translations and corresponding trust levels
US8566078B2 (en) * 2010-01-29 2013-10-22 International Business Machines Corporation Game based method for translation data acquisition and evaluation
US10417646B2 (en) 2010-03-09 2019-09-17 Sdl Inc. Predicting the cost associated with translating textual content
US9128929B2 (en) 2011-01-14 2015-09-08 Sdl Language Technologies Systems and methods for automatically estimating a translation time including preparation time in addition to the translation itself
US10140320B2 (en) 2011-02-28 2018-11-27 Sdl Inc. Systems, methods, and media for generating analytical data
US11003838B2 (en) 2011-04-18 2021-05-11 Sdl Inc. Systems and methods for monitoring post translation editing
US20120303352A1 (en) * 2011-05-24 2012-11-29 The Boeing Company Method and apparatus for assessing a translation
US8694303B2 (en) 2011-06-15 2014-04-08 Language Weaver, Inc. Systems and methods for tuning parameters in statistical machine translation
US9984054B2 (en) 2011-08-24 2018-05-29 Sdl Inc. Web interface including the review and manipulation of a web document and utilizing permission based control
CN103034627B (zh) * 2011-10-09 2016-05-25 北京百度网讯科技有限公司 计算句子相似度的方法和装置以及机器翻译的方法和装置
US9213695B2 (en) * 2012-02-06 2015-12-15 Language Line Services, Inc. Bridge from machine language interpretation to human language interpretation
US8942973B2 (en) 2012-03-09 2015-01-27 Language Weaver, Inc. Content page URL translation
JP5915326B2 (ja) * 2012-03-29 2016-05-11 富士通株式会社 機械翻訳装置、機械翻訳方法及び機械翻訳プログラム
US9189476B2 (en) * 2012-04-04 2015-11-17 Electronics And Telecommunications Research Institute Translation apparatus and method thereof for helping a user to more easily input a sentence to be translated
US10261994B2 (en) 2012-05-25 2019-04-16 Sdl Inc. Method and system for automatic management of reputation of translators
US9081762B2 (en) * 2012-07-13 2015-07-14 Enyuan Wu Phrase-based dictionary extraction and translation quality evaluation
US9152622B2 (en) 2012-11-26 2015-10-06 Language Weaver, Inc. Personalized machine translation via online adaptation
US10025776B1 (en) * 2013-04-12 2018-07-17 Amazon Technologies, Inc. Language translation mediation system
US9213694B2 (en) 2013-10-10 2015-12-15 Language Weaver, Inc. Efficient online domain adaptation
KR20160105215A (ko) * 2015-02-27 2016-09-06 삼성전자주식회사 텍스트 처리 장치 및 방법
US10467114B2 (en) 2016-07-14 2019-11-05 International Business Machines Corporation Hierarchical data processor tester
US10635863B2 (en) 2017-10-30 2020-04-28 Sdl Inc. Fragment recall and adaptive automated translation
US10817676B2 (en) 2017-12-27 2020-10-27 Sdl Inc. Intelligent routing services and systems
US11256867B2 (en) 2018-10-09 2022-02-22 Sdl Inc. Systems and methods of machine learning for digital assets and message creation
CN114881053B (zh) * 2022-06-17 2025-01-28 西安邮电大学 面向神经机器翻译系统的句子粒度蜕变测试方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5731083A (en) * 1980-07-31 1982-02-19 Sharp Corp Electronic interpreter
JPS5840684A (ja) * 1981-09-04 1983-03-09 Hitachi Ltd 自然言語間の自動翻訳方式
JPS58101365A (ja) * 1981-12-14 1983-06-16 Hitachi Ltd 機械翻訳システム
JPH0664585B2 (ja) * 1984-12-25 1994-08-22 株式会社東芝 翻訳編集装置
US5005127A (en) * 1987-10-26 1991-04-02 Sharp Kabushiki Kaisha System including means to translate only selected portions of an input sentence and means to translate selected portions according to distinct rules
US5140522A (en) * 1988-10-28 1992-08-18 Kabushiki Kaisha Toshiba Method and apparatus for machine translation utilizing previously translated documents
NL8900587A (nl) * 1989-03-10 1990-10-01 Bso Buro Voor Systeemontwikkel Werkwijze voor het bepalen van de semantische verwantheid van lexicale componenten in een tekst.

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8606559B2 (en) 2008-09-16 2013-12-10 Electronics And Telecommunications Research Institute Method and apparatus for detecting errors in machine translation using parallel corpus
JP2012079107A (ja) * 2010-10-01 2012-04-19 Nippon Telegr & Teleph Corp <Ntt> 翻訳品質自動評価装置とその方法、及び語順最適化機械翻訳学習装置とプログラム
JP2015191430A (ja) * 2014-03-28 2015-11-02 株式会社ゼンリンデータコム 翻訳装置、翻訳方法及び翻訳プログラム
JP2018022269A (ja) * 2016-08-02 2018-02-08 国立研究開発法人情報通信研究機構 自動翻訳システム、自動翻訳方法、およびプログラム
JP2023066183A (ja) * 2021-10-28 2023-05-15 株式会社川村インターナショナル 言語資産管理システム、言語資産管理方法、及び、言語資産管理プログラム

Also Published As

Publication number Publication date
US5408410A (en) 1995-04-18

Similar Documents

Publication Publication Date Title
JPH05298360A (ja) 翻訳文評価方法、翻訳文評価装置、翻訳文評価機能付き機械翻訳システムおよび機械翻訳システム評価装置
JP3266246B2 (ja) 自然言語解析装置及び方法並びに自然言語解析用知識ベース構築方法
US7788083B2 (en) Systems and methods for the generation of alternate phrases from packed meaning
JP2783558B2 (ja) 要約生成方法および要約生成装置
US5010486A (en) System and method for language translation including replacement of a selected word for future translation
EP1351158A1 (en) Machine translation
US20040254781A1 (en) Machine translation
JPH083815B2 (ja) 自然言語の共起関係辞書保守方法
JPH1011447A (ja) パターンに基づく翻訳方法及び翻訳システム
JP2005251115A (ja) 連想検索システムおよび連想検索方法
JPH03172966A (ja) 類似文書検索装置
JPH05314166A (ja) 電子化辞書および辞書検索装置
WO2007105202A2 (en) Automatic reusable definitions identification (rdi) method
JP2004513458A (ja) ユーザが変更可能な翻訳のウエイト
Thomas Choosing headwords from language-for-special-purposes (LSP) collocations for entry into a terminology data bank (term bank)
Andonovski et al. Bilingual lexical extraction based on word alignment for improving corpus search
JP2609173B2 (ja) 用例主導型機械翻訳方法
Orliac et al. Collocation extraction for machine translation
Abdulrahman et al. A language model for spell checking of educational texts in Kurdish (Sorani)
KR102017227B1 (ko) 과학문서의 핵심어구 추출방법 및 장치
Tratz Semantically-enriched parsing for natural language understanding
KR20020036059A (ko) 사전 뜻풀이말에서 추출된 의미정보를 기반으로하는 의미중의성 해결 방법
JP3085394B2 (ja) 複数文翻訳における訳語選択方法およびこれを用いた機械翻訳システム
JP2840258B2 (ja) 機械翻訳システムの対訳辞書及び共起関係辞書の作成方法
JPH0561902A (ja) 機械翻訳システム