JP3539479B2

JP3539479B2 - 翻訳装置及び翻訳方法並びに翻訳プログラムを記録した記録媒体

Info

Publication number: JP3539479B2
Application number: JP06544599A
Authority: JP
Inventors: 毅九津見
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 1999-03-11
Filing date: 1999-03-11
Publication date: 2004-07-07
Anticipated expiration: 2019-03-11
Also published as: EP1037153A2; JP2000259635A; US6385569B1; EP1037153A3

Description

【０００１】
【発明の属する技術分野】
本発明は、単語辞書に登録されていない接頭辞・接尾辞と語基からなる派生語を抽出して訳語を生成する翻訳装置及び翻訳方法並びに翻訳プログラムを記録した記録媒体に関する。
【０００２】
【従来の技術】
近年、英日翻訳等の翻訳装置の要望が高くなり、種々開発されている。従来の翻訳装置は、例えば、キーボードなどの入力手段からソース言語（原語）を記憶手段に入力し、この入力されたソース言語を、単語辞書、文法規則および木構造変換規則を記憶したテーブルを利用して、翻訳処理手段によってターゲット言語（目的語）に翻訳するものである。
このとき、単語辞書に登録されていない原語は、通常、未知語として処理されるので、後から未知語について別の字典などを参照して翻訳する必要があった。
【０００３】
しかし、未知語の中には、既知の単語（語基）に接頭語や接尾語を付加した派生語があり、派生語を構成する語基が単語辞書に登録されており、派生語に含まれる接頭語、接尾語の解析が可能であれば、語基の意味と、接頭語や接尾語の意味から派生語の意味も推定することができる。
【０００４】
例えば、特開昭６１−２６８８０２０号公報に記載によれば、単語辞書と接辞辞書とを備え、入力された原文中に未知語が検出された際、その未知語が、既知語に接頭辞または接尾辞が連結した派生語であるか否かを調べ、派生語として認識されたものに対して、条件に従って、特に、目的語（訳語）生成用の文法情報をも付与した文法的性質、意味的性質または訳語等を推定する構成にして、解析結果や翻訳結果の確実性を向上させることができる派生語処理方式が提案されている。
【０００５】
【発明が解決しようとする課題】
しかしながら、上記の特開昭６１−２６８８０２０号公報に記載の派生語処理方式では、以下に示すように、派生語の構成によっては、適切な訳語が得られないという問題がある。
（１）接辞が複数含まれる派生語の場合、接辞を正確に抽出する機能がないため、例えば、“exportable”という単語を翻訳すると、接頭辞“ex”と既知語“portable”からなる派生語であると認識され、訳語「前携帯用の」として翻訳される可能性がある。
しかし、“exportable”という英単語は、既知語“export”と接尾辞“able”からなる派生語と認識する方が正しい。
【０００６】
（２）語基の表記に接尾語の表記が一部分が含まれる場合、語基を正確に抽出する機能がないため、“noter ”という単語を翻訳すると、単語“not ”と接尾辞“er”からなる派生語であると認識される可能性がある。
しかし、“noter ”という英単語は、既知語“note”と接尾辞“er”からなる派生語と認識する方が正しい。
【０００７】
（３）接辞の訳語が画一的に登録されているため、例えば、接頭辞“non ”の訳語が「非」と定められていると、“nonremunerative ”という英単語は、接頭辞“non ”と既知語“remunerative”からなる派生語と認識され、その訳語は、“non ”の訳語「非」と“remunerative”の訳語「利益がある」が連結された「非利益がある」となり、これは不自然な訳語となる。
語基の訳の形から、“non ”の訳語は、「〜がある」を「〜がない」に置換して、“nonremunerative ”という英単語は、「利益がない」と翻訳される方が日本語として自然な訳語となる。
【０００８】
本発明は、以上の事情を考慮してなされたものであり、例えば、単語辞書にない入力原語から接辞と語基の組み合わせが複数存在する派生語を認識した際、本来の接辞と語基とからなる正確な派生語を抽出し、自然な訳語を生成することができる翻訳装置及び翻訳方法並びに翻訳プログラムを記録した記録媒体を提供する。
【０００９】
【課題を解決するための手段】
この発明は、単語辞書と、接辞辞書と、第１言語である原語を入力する入力部と、単語辞書を参照し、入力原語を第２言語である訳語に変換する変換部と、単語辞書及び接辞辞書を参照し、変換部によって訳語に変換されない入力原語から接辞と語基との組合せからなる１または複数個の派生語を認識する認識部と、認識部が認識した派生語に、複数の接辞を含むものが存在する場合に、接頭語と接辞語との長さ情報を比較する接辞処理条件に基づいて一つの接辞を決定する接辞決定部と、接辞決定部によって決定された接辞とこれに対応する語基のそれぞれの訳語を連結して前記認識された派生語の訳語を生成する派生語訳生成部とを備えたことを特徴とする翻訳装置を提供するものである。
【００１０】
本発明によれば、ソース言語の言語的特性情報から付与された接辞処理条件に基づいて接辞を決定する手段を備えることによって、単語辞書にない入力原文から接辞と語基の組み合わせが複数存在する派生語でも、その中から最適な接辞を決定しこれに対応する語基とから正確な派生語を認識し、自然な訳語を生成することができる。
【００１１】
【発明の実施の形態】
なお、本発明において、第１言語の単語に対する第２言語の訳語、品詞情報、文法情報などを登録した単語辞書、接頭辞情報、接尾辞情報、接辞処理条件などを登録した接辞辞書、接辞訳変更情報テーブルは、例えば、本体と分離可能な磁気テープやカセットテープ等のテープ系、フロッピーディスクやハードディスク等の磁気ディスクやＣＤ−ＲＯＭ／ＭＯ／ＭＤ／ＤＶＤ等の光ディスクのディスク系、ＩＣカード（メモリカードも含む）／光カード等のカード系、あるいはマスクＲＯＭ、ＥＰＲＯＭ、ＥＥＰＲＯＭ、フラッシュＲＯＭ等による半導体メモリを含めた固定的にプログラムを担持する記憶媒体で構成してもよい。
入力部は、例えば、キーボード、マウス、ペン・タブレット等の入力装置、通信装置、記憶媒体読取装置などで構成してもよい。
変換部、認識部、派生語訳生成部、接辞決定部は、例えば、ＣＰＵ、ＲＯＭ、ＲＡＭ、Ｉ／Ｏポートからなるコンピュータで構成してもよい。
変換部、認識部、派生語訳生成部、接辞決定部は、形態素解析部、構文解析部、構文変換部、派生語処理部、ターゲット言語生成部として機能する。
【００１２】
なお、本発明において、接辞は、接頭語、接尾語のことをいう。また、語基は、その派生語の基本的な意味をもつ単語であり、派生語は、「接頭語＋語基」、「語基＋接尾語」、「接頭語＋語基＋接尾語」の形の単語をいう。
前記接辞処理条件が、接辞の長さ情報であってもよいし、語基の動詞の変化形情報であってもよいし、語基の品詞情報であってもよい。これらの情報を組み合わせてもよい。また、前記接辞処理条件が、接辞と語基間のハイフン情報であってもよい。
【００１３】
前記認識部が一つの接辞に対して複数の語基がある派生語を認識した際、言語的特性情報から付与された動詞の変化形情報に基づいて一つの語基を決定する語基決定部をさらに備え、前記派生語訳生成部は、語基決定部によって決定された語基とこれに対応する接辞とからなる派生語の訳語を生成する構成にしてもよい。
なお、この構成において、語基決定部は、ＣＰＵで構成してもよい。
この構成によれば、ソース言語の言語的特性情報から付与された動詞の変化形情報に基づいて派生語の語基を決定するよう構成したことにより、派生語に対して接辞が一意に定まっているがこれに連結し得る語基が複数通り存在する場合でも、その中から最適の語基が決定されるので、派生語の派生語を形態素解析がより正確に行える。
【００１４】
前記接辞辞書は、語基の品詞とその活用形に対応して接辞の訳語を変更するための接辞訳変更情報を記憶した接辞訳変更情報テーブルをさらに備え、前記派生語訳生成部は、接辞訳変更情報に基づいて語基の訳語に対応して接辞の訳語を変更する構成にしてもよい。
なお、この構成において、接辞訳変更情報テーブルはＲＯＭで構成してもよい。
この構成によれば、派生語の訳語を生成する際、語基の訳語に対応して接辞の訳語を変更することができるので、派生語としてより自然な訳文を生成することができる。
【００１５】
前記派生語訳生成部は、一度訳語を生成した派生語を既知語として処理する構成にしてもよい。
【００１６】
以下、図に示す実施例に基づいて本発明を詳述する。なお、これによって本発明は限定されることはない。
【００１７】
図１は本発明の一実施例である翻訳装置の構成を示すブロック図である。本実施例では、説明をわかりやすくするためにソース言語（原語）が英語であり、ターゲット言語（目的語）が日本語であるような機械翻訳装置を例にとり説明するが、ソース言語（原語）及びターゲット言語（目的語）はそれ以外の独語、仏語、スペイン語、蘭語、露語、中国語、などの言語を対象とした機械翻訳装置であってもよい。
図１において、１はコピュータのＣＰＵ（中央処理装置）からなる制御部を示し、制御部１は、プログラムメモリに記憶された制御プログラムにより各部を制御する。
【００１８】
２はキーボード、マウス、ペン、タブレット、スキャナ、文字認識装置などの入力装置や、通信回線と接続されている通信装置、記憶媒体読取装置などからなる入力部を示し、入力部２は、翻訳言語の指定、原語の入力、翻訳開始の指示の他、通信、プログラムのインストールなどを行う。
【００１９】
３はＣＲＴ（陰極線管）ディスプレイ、ＬＣＤ（液晶ディスプレイ）、ＰＤ（プラズマディスプレイ）などからなる表示装置３ａや、サーマルプリンタ、レーザプリンタなどからなる印字装置、または通信回線と接続されている通信装置３ｃで構成される出力部を示し、出力部３は、入力部２による入力結果、制御部１の制御により翻訳結果を表示装置３ａに表示したり、印字装置３ｂを介して印字したり、通信装置３ｃを介して送信する。
４はバスラインを示し、制御プログラムデータ及びアドレスデータが転送される。
【００２０】
５はマスクＲＯＭ、ＥＰＲＯＭ、ＥＥＰＲＯＭ、フラッシュＲＯＭ等による半導体メモリ、あるいは磁気テープやカセットテープ等のテープ系、フロッピーディスクやハードディスク等の磁気ディスクやＣＤ−ＲＯＭ／ＭＯ／ＭＤ／ＤＶＤ等の光ディスクのディスク系、ＩＣカード（メモリカードも含む）／光カード等のカード系などを含めた記憶媒体からなるプログラムメモリを示し、プログラムメモリ５は、形態素解析部５ａ、構文解析部５ｂ、構文変換部５ｃ、ターゲット言語生成部５ｄ、派生語処理部５ｅ、接辞決定部５ｆ、語基決定部５ｇ、派生語訳生成部５ｈとして機能する各制御プログラムを記憶している。
【００２１】
特に、形態素解析部５ａ、構文解析部５ｂ、構文変換部５ｃ、ターゲット言語生成部５ｄは、入力された第１言語の原語を第２言語である訳語（ターゲット言語）に変換する変換部として機能する。
制御部１の制御動作に応じてプログラムメモリ５から制御プログラムを読み出して各部を制御することにより本発明の翻訳装置を実現する。
【００２２】
６はマスクＲＯＭ、ＥＰＲＯＭ、ＥＥＰＲＯＭ、フラッシュＲＯＭ等による半導体メモリ、あるいは磁気テープやカセットテープ等のテープ系、フロッピーディスクやハードディスク等の磁気ディスクやＣＤ−ＲＯＭ／ＭＯ／ＭＤ／ＤＶＤ等の光ディスクのディスク系、ＩＣカード（メモリカードも含む）／光カード等のカード系などを含めた記憶媒体からなるテーブルメモリを示し、テーブルメモリ６は、第１言語に対応する第２言語を記憶した単語辞書テーブル６ａ、言語的特性情報から付与された文法規則を記憶した文法規則テーブル６ｂ、翻訳規則を記憶した翻訳規則テーブル６ｃ、言語的特性情報から付与された動詞の規則変化形情報を記憶した動詞規則変化形テーブル６ｄ、言語的特性情報から付与された接辞処理条件や語基の品詞とその活用形に対応して接辞の訳語を変更するための接辞訳変更情報を記憶した接辞テーブル（接頭辞テーブル、接尾辞テーブル、接頭辞処理パターンテーブル、接尾辞処理パターンテーブル）６ｅとして機能する各テーブルを記憶している。
【００２３】
また、接辞処理条件として、接辞の長さ情報、語基の動詞の変化形情報、語基の品詞情報、接辞と語基間のハイフン情報であってもよい。
【００２４】
７はマスクＲＡＭ、ＥＥＰＲＯＭ、フラッシュＲＯＭ等による半導体メモリ、あるいは磁気テープやカセットテープ等のテープ系、フロッピーディスクやハードディスク等の磁気ディスクやＭＯ／ＭＤ／ＤＶＤ等の光ディスクのディスク系、ＩＣカード（メモリカードも含む）／光カード等のカード系などを含めた記憶媒体からなるバッファメモリを示し、バッファメモリ７は、原文バッファ７ａ、辞書検索バッファ７ｂ、変換前構文バッファ７ｃ、変換後構文バッファ７ｄ、訳文バッファ７ｅ、マッチ接頭辞バッファ７ｆ、マッチ接尾辞バッファ７ｇ、語基バッファ７ｈ、語基用辞書検索バッファ７ｉとして機能する領域に備えている。
制御部１は、翻訳処理、派生語処理の進行に応じて処理したデータを各バッファに記憶する。一度訳語が生成された派生語を、既知語として処理する。
【００２５】
８はマスクＲＯＭ、ＥＰＲＯＭ、ＥＥＰＲＯＭ、フラッシュＲＯＭ等による半導体メモリ、あるいは磁気テープやカセットテープ等のテープ系、フロッピーディスクやハードディスク等の磁気ディスクやＣＤ−ＲＯＭ／ＭＯ／ＭＤ／ＤＶＤ等の光ディスクのディスク系、ＩＣカード（メモリカードも含む）／光カード等のカード系などを含めた本体と分離可能なメディアで構成した固定的にプログラムを担持する記憶媒体を示し、記憶媒体８に本発明の機械翻訳プログラムを記憶し、入力部２の記憶媒体読取装置によりバッファメモリ７の予備領域に翻訳プログラムをインストールすることにより本発明の翻訳機能を実現してもよい。
また、この記憶媒体は、本翻訳装置がインターネットを含めた外部の通信ネットワークとの接続が可能な通信装置を備えている場合には、その通信装置を介して通信ネットワークからプログラムをダウンロードするように流動的にプログラムを担持する媒体であってもよい。尚、このように通信ネットワークからプログラムをダウンロードする場合には、そのダウンロード用プログラムは予め本体装置に格納しておくか、あるいは別な記録媒体からインストールされるものであってもよい。尚、記録媒体に格納されている内容としてはプログラムに限定されず、データであってもよい。
【００２６】
本発明の別の観点によれば、単語辞書６と、接辞辞書６と、第１言語である原語を入力する入力部２とを備えた翻訳装置にコンピュータで読み取り可能な翻訳プログラムを記憶した記憶媒体を用いることにより、コピュータ１に、単語辞書６を参照させ、入力原語を第２言語である訳語に変換させ、単語辞書及び接辞辞書を参照させ、訳語に変換されない入力原語から接辞と語基とからなる派生語を認識させ、認識された派生語の接辞に対応した訳語と語基に対応した訳語を連結して一つの派生語の訳語を生成させ、複数の接辞が含まれる派生語が認識された際、言語的特性情報から付与された接辞処理条件に基づいて一つの接辞を決定させ、決定された接辞とこれに対応する語基とからなる派生語の訳語を生成させることができる。
【００２７】
図２は図１の翻訳装置による各翻訳処理の手順を示すブロック図である。図２に示すように、機械翻訳処理方法の１つとして、構文トランスファー方式がある。この方式は、入力されたソース言語の原文に対して、Ｓ１で、辞書検索・形態素解析を行い、Ｓ２で、構文解析を行い、各解析を進めて、ソース言語の構文構造を得て、Ｓ３で、これをターゲット言語の構文構造木に変換し、Ｓ４で、各解析結果から、訳語を選択し、Ｓ５で、ターゲット言語を生成する方式である。
【００２８】
ここで、図２に示すＳ１、Ｓ２の各処理について説明する。
Ｓ１の［辞書検索・形態素解析］
形態素解析部５ａは、単語辞書テーブル６ａ、文法規則テーブル６ｂ、翻訳規則テーブル６ｃを用いて、入力された原文から単語を検索し、入力された原文を各形態素列（単語列）に分割し、この各単語に対する品詞などの文法情報および訳語を得て、さらに、動詞規則変化形テーブル６ｄを用いて、時制・人称・数などを解析する。
【００２９】
Ｓ２の［構文解析］
構文解析部５ｂは、文法規則テーブル６ｂを用いて、形態素解析された単語間の係り受けなどの文章の構造を解析し、構造解析木を決定する。
【００３０】
図３は本実施例の翻訳処理（１）の手順を示すフローチャートである。図３を用いて、図２に示すＳ１の辞書検索・形態素解析処理の手順を説明する。
Ｓ１１で、原文が原文バッファ７ａに入力されると、まず、単語ごとに分割が行われ、全文単語数が求められる。辞書検索の動作に移り、単語位置変数であるｎに１がセットされる。
Ｓ１２で、ｎ番目の単語の辞書検索が試みられてからいずれかの処理経路を通ってＳ１９の処理に至り、ｎが全文単語数に達していなければ、Ｓ２０で、ｎを１増加し、Ｓ１２の処理に至るという動作が繰り返し行われる。
【００３１】
Ｓ１２で、ｎ番目の単語を辞書検索を行って、辞書検索が成功した場合は、Ｓ１４で、辞書データの単語を辞書検索バッファ７ｂに格納し、Ｓ１９の処理に至る。
また、Ｓ１２で、ｎ番目の単語を辞書検索を行って、辞書検索が失敗し、既知語が検索できなかった場合は、Ｓ１５で、ｎ番目の単語の派生語処理を行う。
【００３２】
この派生語処理に成功した場合は、Ｓ１７で、派生語に関する情報を辞書検索バッファ７ｂに格納し、Ｓ１９の処理に至る。
Ｓ１５で、派生語処理に失敗した場合は、Ｓ１８で、ｎ番目の単語を未知語として扱い辞書検索バッファ７ｂに格納する。
Ｓ１９で、ｎが全文単語数に達していたら、辞書検索・形態素解析処理を終了し、図２に示すＳ２の構文解析処理に移る。
【００３３】
［実施例１］
実施例１では、例えば、“exportable”、“uncleared ”、“nonradioactive”という３種類の英単語（ソース言語）の派生語処理の手順について説明する。
ここでは、ソース言語の特質を考慮して適切な接辞を選ぶ例（その１）として接辞の長さに関して、英単語“exportable”の派生語処理を行う。
【００３４】
図４は本実施例の翻訳処理（２）の手順を示すフローチャートである。また、図４は、図３のＳ１５の「ｎ番目の単語の派生語処理」を詳細に示したものであり、入力単語１個あたりの派生語処理の動作手順を示す。
Ｓ１０１で、語基バッファ７ｈがクリアされる。次に、Ｓ１０２に進み、接頭辞マッチング処理が行われる。
Ｓ１０１とＳ１０２の処理間で、接頭辞にハイフンが付いているか否かを判定するＳ２０１の処理を設定してもよい。接頭辞にハイフンが付いている場合は、接頭辞が決定されたものと見なし、Ｓ１０９の接頭辞処理に進む。接頭辞にハイフンが付いていない場合は、Ｓ１０２の処理に進む。
【００３５】
図５は本実施例の翻訳処理（３）の手順を示すフローチャートである。また、図５は図４のＳ１０１の「接頭辞マッチング処理」を詳細に示したものである。図５において、
Ｓ３０１で、接頭辞テーブルのポインタ変数ｎｐに１がセットされる。
Ｓ３０２で、マッチ接頭辞バッファ７ｆがクリアされる。
Ｓ３０３で、接頭辞テーブルのｎｐ番目のレコードの接頭辞とのマッチングが試みられてから、いずれかの処理経路を通ってＳ３０７の処理に至り、ｎｐが接頭辞テーブルの終端に達していなければ、Ｓ３０８で、ｎｐを１増加し、Ｓ３０３の処理に至るという動作が繰り返し行われる。
【００３６】
単語“exportable”の場合、図１１に示す接頭辞テーブルを参照して、ＩＤ（レコード番号）が１の接頭辞“ex”とマッチするので、ｎｐが１のときに、Ｓ３０３からＳ３０４に進み、ＩＤの１番目の接頭辞“ex”がマッチ接頭辞バッファ７ｆにセットされる。
Ｓ３０５で、入力語“exportable”が接頭辞“ex”のついた派生語であるとした場合の語基を求め、その結果、“portable”という文字列が語基バッファ７ｈにセットされる。
【００３７】
Ｓ３０６で、接頭辞と語基とを関連づけるため、マッチ接頭辞バッファ７ｆの１番目のレコードの「語基ポインタ」欄に、語基バッファ７ｈのうち“portable”が格納されているレコードの番号である“１”を格納する。この結果、マッチ接尾辞バッファ７ｆは、図１７に示すような記憶内容になる。
入力語“exportable”に対して図１１の接頭辞テーブル中の接頭辞でマッチするものは上記の“ex”だけなので、図５の接頭辞マッチング処理は終わり、図４に示す処理に戻り、Ｓ１０２からＳ１０３の処理に進み、接尾辞マッチング処理が行われる。
Ｓ１０２とＳ１０３の処理間で、接尾辞にハイフンが付いているか否かを判定するＳ２０２の処理を設定してもよい。接尾辞にハイフンが付いている場合は、接尾辞が決定されたものと見なし、Ｓ１０７の接尾辞処理に進む。接尾辞にハイフンが付いていない場合は、Ｓ１０３の処理に進む。
【００３８】
図６は本実施例の翻訳処理（４）の手順を示すフローチャートである。また、図６は図４のＳ１０３の「接尾辞マッチング処理」を詳細に示したものである。図６において、
Ｓ４０１で、接尾辞テーブルポインタ変数ｎｓに１がセットされ、次に、Ｓ４０２に進み、マッチ接尾辞バッファ７ｇがクリアされる。
Ｓ４０３で、接尾辞テーブルのｎｓ番目のレコードの接尾辞とのマッチングが試みられてから、いずれかの経路を通ってＳ４０７に至り、ｎｓが接尾辞テーブルの終端に達していなければ、Ｓ４０８でｎｓを１増加し、Ｓ４０３の処理に至るという動作が繰り返し行われる。
【００３９】
単語“exportable”の場合、図１２の接尾辞テーブルを参照して、ＩＤ( レコード番号) が１の接尾辞“able”とマッチするので、ｎｓが１のときに、Ｓ４０３からＳ４０４に進み、ＩＤの１番目の接尾辞“able”がマッチ接頭辞バッファ７ｇにセットされる。
【００４０】
Ｓ４０５で、入力語“exportable”が接尾辞“able”のついた派生語であるとした場合の語基を、ＩＤの１番目の接尾辞“able”の「連結条件」欄を参照して求め、その結果、“exportable”から接尾辞“able”を単純に除去した“export”という文字列と、「連結条件」に従って語基の末尾の“e ”が除去された可能性があると見なして、末尾に“e ”を補った“exporte ”いう文字列とが、語基バッファ７ｈにセットされる。
【００４１】
Ｓ４０６で、接尾辞と語基とを関連づけるため、マッチ接尾辞バッファ７ｇの１番目のレコードの「語基ポインタ」欄に、語基バッファ７ｈのうち“export”および“exporte ”が格納されているレコードの番号である“２”と“３”を格納する。
この結果、マッチ接尾辞バッファ７ｇは、図１８に示すような記憶内容になる。そして、語基バッファ７ｈは、図１９に示すような記憶内容になる。
【００４２】
入力語“exportable”に対して、図１２の接尾辞テーブル中の接尾辞でマッチするものは上記の“able”だけなので、図６の接尾辞マッチング処理は終わり、図４の処理に戻り、Ｓ１０３からＳ１０４の処理に進む。
【００４３】
図４の処理において、接頭辞・接尾辞それぞれマッチング候補が存在するかが判定される。
Ｓ１０４で、接頭辞が判定される。上記したように、Ｓ１０２の処理結果、図１７に示すように、マッチ接頭辞バッファに接頭辞“ex”が格納されたので、接頭辞は存在し、Ｓ１０５の処理に進む。
Ｓ１０５で、接尾辞が判定される。上記したように、Ｓ１０３の処理の結果、図１８に示すように、マッチ接尾辞バッファに接尾辞“able”が格納されたので、接尾辞は存在し、Ｓ１１１に進む。
【００４４】
この時点で、入力単語に対しては、接頭辞・接尾辞ともマッチするものが存在しており、そのどちらを処理するかが以下の処理で決定される。
Ｓ１１１で、言語的特性に基づいた判定の一つとして、マッチ接尾辞バッファ７ｇに格納されている接尾辞が動詞の規則変化形と同じかどうかが、図１６の規則変化形テーブルを参照して判定される。
この場合、接尾辞“able”は、図１６の規則変化形のいずれとも一致しないので、Ｓ１１１からＳ１１２の処理に進む。
【００４５】
Ｓ１１２で、言語的特性に基づいた判定の一つとして、マッチした接頭辞とマッチした接尾辞の長さの比較が行われる。ここで、接頭辞と接尾辞の長さが同じか、接尾辞の方が長いと、Ｓ１１７に進み、接尾辞処理が行われる。
一方、接頭辞の方が長いと、Ｓ１１３に進み、接頭辞処理が行われる。この場合、接頭辞“ex”より接尾辞“able”の方が長いので、Ｓ１１７に進む。
【００４６】
図８は本実施例の翻訳処理（６）の動作手順を示すフローチャートである。また、図８は図４のＳ１０７・Ｓ１１５・Ｓ１１７の「接尾辞処理」を詳細に示したものである。図８において、
Ｓ６０１で、マッチ接尾辞バッファポインタ変数ｍｓに１がセットされる。
Ｓ６０２で、語基用辞書検索バッファ７ｉがクリアされる。
Ｓ６０３で、マッチ接尾辞バッファの１番目の接尾辞である“able”に対応する語基バッファの語基である“export”と“exporte ”をそれぞれキーとして辞書検索される。
【００４７】
この結果、図１５のような辞書データのもとでは、“export”では辞書検索が成功するが“exporte ”では辞書検索は失敗し、語基用辞書検索バッファ７ｉには“export”の辞書検索結果が図２０に示すように格納される。
“export”に関して辞書検索が成功したので、Ｓ６０５に進み、言語的特性に基づいた判定の一つとして、検索した単語の品詞が調べられる。
【００４８】
この場合、検索された単語に否定詞も前置詞も代名詞も存在しないので、語基用辞書検索バッファ７ｉから消去されるデータはなく、Ｓ６１０に進む。
そして、派生語“exportable”に対する派生語訳生成が行われるが、この詳細な動作手順については実施例３で詳述する。
この結果、辞書検索バッファ７ｂには、入力語“exportable”に対して、既知語“export”と接尾辞“able”からなる派生語としての情報が、図２１に示すように格納される。
【００４９】
本実施例のように、入力単語に対して、接頭辞・接尾辞ともマッチするものが存在している場合に、接辞の長さ等の言語的特性に基づいた判定を行った結果、入力語“exportable”を、接頭辞“ex”と既知語“portable”からなると見なすような不適切な判定を防止することができる。
【００５０】
ここでは、ソース言語の特質を考慮して適切な接辞を選ぶ例（その２）として、動詞の規則変化形等に関して、単語“uncleared ”の派生語処理を行う。
図４において、
Ｓ１０１で、語基バッファ７ｈがクリアされる。
Ｓ１０２で、接頭辞マッチング処理、Ｓ１０３で、接尾辞マッチング処理が行われる。各マッチング処理の詳細な動作は、単語“exportable”の場合と同様であるのでここでは割愛する。
【００５１】
この結果、図２２に示すように、マッチ接頭辞バッファ７ｆには接頭辞“un”が格納されており、図２３に示すように、マッチ接尾辞バッファ７ｇには接尾辞“ed”が格納されている。そして図２４に示すように、語基バッファ７ｈには接頭辞“un”に対応する語基“cleared ”と、接尾辞“ed”に対応する語基“unclear ”とが格納されている。
【００５２】
このように、入力単語“uncleared ”に対しては、接頭辞・接尾辞ともマッチするものが存在しているので、単語“exportable”の場合と同様に、Ｓ１０３→Ｓ１０４→Ｓ１０５→Ｓ１１１の処理に進む。
【００５３】
Ｓ１１１で、言語的特性に基づいた判定の一つとして、マッチ接尾辞バッファ７ｇに格納されている接尾辞が動詞の規則変化形と同じかどうかが、図１６の規則変化形テーブルを参照して判定される。
このような判定を行うのは、動詞の規則変化形と同じ末尾に付いた単語が、接尾辞つき単語としてでなく、動詞の変化形として処理できるなら、その方が一般に望ましい場合が多いからである。この場合、接尾辞“ed”は、図１６に示す動作の規則変化形の１つと一致するので、Ｓ１１１からＳ１１３の処理に進み、接頭辞処理が行われる。
【００５４】
図７は本実施例の翻訳処理（５）の手順を示すフローチャートである。また、図７は図４のＳ１０９・Ｓ１１３・Ｓ１１９の「接頭辞処理」を詳細に示したものである。図７において、
Ｓ５０１で、マッチ接尾辞バッファポインタ変数ｍｐに１がセットされる。
Ｓ５０２で、語基用辞書検索バッファ７ｉがクリアされる。
Ｓ５０３で、マッチ接尾辞バッファの１番目の接尾辞である“un”に対応する語基バッファの語基である“cleared ”をキーとして辞書検索される。
【００５５】
この結果、図１５のような単語辞書テーブルの単語データでは、“clear ”の過去形または過去分詞形として辞書検索が成功し、語基用辞書検索バッファ７ｉには“cleared ”の辞書検索結果が図２５に示すように格納される。
“cleared ”に関して辞書検索が成功したのでＳ５０５に進み、検索された単語の品詞が調べられる。この場合、検索された単語に否定詞も前置詞も代名詞も存在しないので、語基用辞書検索バッファから消去されるデータはなく、Ｓ５１０に進む。そして、派生語“uncleared ”に対する派生語訳生成が行われる。
この結果、辞書検索バッファ７ｂには、入力語“uncleared ”に対して、接頭辞“un”と既知語“cleared ”とからなる派生語としての情報が、図２６に示すように格納される。
【００５６】
以上のように、入力単語に対して、接頭辞・接尾辞ともマッチするものが存在している場合に、もし接辞の長さだけで判定した場合は、入力語“uncleared ”を既知語“unclear ”と接尾辞“ed”からなると見なし、その結果訳語が、例えば「はっきりしなくされた」のような訳になるところを、本実施例のように、接辞の長さによる判定に動詞の規則変化形を加えた接辞を優先する等の言語的特性に基づいた判定を行った結果、不適切な判定を防止することができる。
【００５７】
なお、ソース言語の特質の考慮として、上記実施例では「接辞の長さ」、「動詞の規則変化形」を利用したが、本発明により利用できるソース言語の特質はこれらに限られるものではない。
【００５８】
上記のように、本実施例による派生語処理部は、入力単語に対して接頭辞・接尾辞ともマッチするものが存在している場合に、言語的特性に基づいて適切な接辞を選択する機能を有しているが、このように選択された接辞が必ずしも正しくない場合があるので、その場合の動作について説明する。
【００５９】
次に、処理失敗後のバックアップ処理により成功する例について説明する。
ここでは、単語“nonradioactive”の派生語処理を説明する。図４において、
Ｓ１０１で、語基バッファ７ｈがクリアされる。
Ｓ１０２で、接頭辞マッチング処理が行われる。
Ｓ１０３で、接尾辞マッチング処理が行われる。
各マッチング処理の詳細な動作は、前記の単語“exportable”の場合と同様であるのでここでは割愛する。
【００６０】
この結果、図２７に示すように、マッチ接頭辞バッファ７ｆには接頭辞“non ”が格納されており、図２８に示すように、マッチ接尾辞バッファ７ｇには接尾辞“ive ”が格納されている。そして、図２９に示すように、語基バッファには接頭辞“non ”に対応する語基“radioactive ”と、接尾辞“ive ”に対応する語基“nonradioact ”とが格納されている。
このように、入力単語“nonradioactive”に対しては、接頭辞・接尾辞ともマッチするものが存在しているので、単語“exportable”の場合と同様に、図４のＳ１０３→Ｓ１０４→Ｓ１０５→Ｓ１１１の処理に進む。
【００６１】
Ｓ１１１で、マッチ接尾辞バッファ７ｇに格納されている接尾辞が動詞の規則変化形と同じかどうかが判定される。この場合、接尾辞“ive ”は図１６の規則変化形のいずれとも一致しないので、Ｓ１１１からＳ１１２に進む。
Ｓ１１２で、マッチした接頭辞とマッチした接尾辞の長さの比較が行われる。この場合、接頭辞“non ”と接尾辞“ive ”の長さが同じなので、Ｓ１１７の処理に進む。
【００６２】
図８の処理に移り、Ｓ６０１で、マッチ接尾辞バッファのポインタ変数ｍｓに１がセットされ、Ｓ６０２で、語基用辞書検索バッファ７ｉがクリアされる。
次に、Ｓ６０３に進み、マッチ接尾辞バッファの１番目の接尾辞である“ive ”に対応する語基バッファの語基である“nonradioact ”をキーとして辞書検索される。
【００６３】
この結果、図１５のような単語辞書テーブルの単語データのもとでは、“nonradioact ”では、図３０のように未知語しか存在せず、辞書検索が失敗するので、Ｓ６０８に進むが、図２８に示すように、マッチ接尾辞バッファ７ｇの２番目のレコードは空であるので、接尾辞処理は失敗に終わる。
接尾辞処理が失敗したので、図４の処理に戻り、Ｓ１１７→Ｓ１１８→Ｓ１１９の処理に進み、今度は接頭辞処理が行われる。
【００６４】
図７の処理に移り、Ｓ５０１で、マッチ接頭辞バッファのポインタ変数ｍｐに１がセットされ、Ｓ５０２で、語基用辞書検索バッファ７ｉがクリアされる。
Ｓ５０３に進み、マッチ接頭辞バッファの１番目の接尾辞である“non ”に対応する語基バッファの語基である“radioactive ”をキーとして辞書検索される。
この結果、図１５のような単語辞書テーブルの辞書データのもとでは、辞書検索が成功し、語基用辞書検索バッファ７ｉには“radioactive ”の辞書検索結果が、図３１に示すように格納される。
【００６５】
単語“radioactive ”に関して辞書検索が成功したので、Ｓ５０５に進み、検索された単語の品詞が調べられる。この場合、検索された単語に否定詞も前置詞も代名詞も存在しないので、語基用辞書検索バッファから消去されるデータはなく、Ｓ５１０に進み、派生語“nonradioactive”に対する派生語訳生成が行われる。
【００６６】
この結果、辞書検索バッファ７ｂには、入力語“nonradioactive”に対して、接頭辞“non ”と既知語“radioactive ”とからなる派生語としての情報が、図３２に示すように格納される。
以上のように、本実施例の派生語処理部では、最初に選択した接辞が誤っていた場合でも、適切な回復処理を行うことができる。
【００６７】
実施例１によれば、原文中の未知語を形態素解析する際に、ソース言語の言語的特性情報に基づいて接辞を決定するよう構成したことにより、原文中の未知語に対して接辞と語基の組み合わせが複数通り存在する場合でも、その中から最適である可能性が高い接辞と語基の組み合わせを選択し、原文の解析がより正確に行えるという利点がある。
【００６８】
［実施例２］
実施例２として、単語“noter ”の派生語処理を例にとり、本発明の特徴を説明する。
図４において、Ｓ１０１で、語基バッファ７ｈがクリアされる。Ｓ１０２で、接頭辞マッチング処理が行われる。
次に、図５の処理に移り、Ｓ３０１で、接頭辞テーブルのポインタ変数ｎｐに１がセットされ、Ｓ３０２で、マッチ接頭辞バッファ７ｆがクリアされる。以下、前記したように、ｎｐを１ずつ増加しながら動作が繰り返し行われる。
【００６９】
単語“noter ”の場合、図１１に示す接頭辞テーブルを参照して、マッチする接頭辞が存在しない。よって、マッチ接頭辞バッファ７ｆには情報がセットされずに、ｎｐが接頭辞テーブルの終端に達した際に、図５の接頭辞マッチング処理は終わり、図４の処理に戻り、Ｓ１０２からＳ１０３に進み、接尾辞マッチング処理が行われる。
【００７０】
図６の処理に移り、Ｓ４０１で、接尾辞テーブルのポインタ変数ｎｓに１がセットされ、Ｓ５０２でマッチ接尾辞バッファ７ｇがクリアされる。以下、前記したように、ｎｓを１ずつ増加しながら動作が繰り返し行われる。
単語“noter ”の場合、図１２に示す接尾辞テーブルを参照して、ＩＤ（レコード番号）が４の接尾辞“er”とマッチするので、ｎｓが４のときに、Ｓ４０３からＳ４０４に進み、図１２の４番目の接尾辞“er”がマッチ接頭辞バッファ７ｇにセットされる。
【００７１】
Ｓ４０５で、入力語“noter ”が接尾辞“er”のついた派生語であるとした場合の語基を、図１２の４番目の接尾辞“er”の「連結条件」欄を参照して求め、その結果、“noter ”から接尾辞“er”を単純に除去した“not ”という文字列と、「連結条件」に従って語基の末尾の“e ”が除去された可能性があると見なして、末尾に“e ”を補った“note”いう文字列とが、語基バッファ７ｈにセットされる。
【００７２】
Ｓ４０６で、接尾辞と語基とを関連づけるため、マッチ接尾辞バッファ７ｇの１番目のレコードの「語基ポインタ」欄に、語基バッファ７ｈのうち“not ”および“note”が格納されているレコードの番号である“１”と“２”を格納する。この結果、マッチ接尾辞バッファ７ｇは、図３３に示すような記憶内容になる。そして語基バッファ７ｈは、図３４に示すような記憶内容になる。
【００７３】
入力語“noter ”に対して図１２の接尾辞テーブル中の接尾辞でマッチするものは上記の“er”だけなので、図６の接尾辞マッチング処理は終わり、図４に戻り、Ｓ１０３からＳ１０４の処理に進む。
次に、接頭辞・接尾辞それぞれマッチング候補が存在するかが判定される。この場合、入力単語“noter ”に対しては、マッチする接頭辞は存在せず、マッチする接尾辞のみ存在するので、図４のＳ１０３→Ｓ１０４→Ｓ１０６→Ｓ１０７の処理に進む。
【００７４】
図８の処理に移り、Ｓ６０１で、マッチ接尾辞バッファのポインタ変数ｍｓに１がセットされ、６０２で、語基用辞書検索バッファ７ｉがクリアされる。
Ｓ６０３に進み、マッチ接尾辞バッファの１番目の接尾辞である“er”に対応する語基バッファの語基である“not ”と“note”をそれぞれキーとして辞書検索される。
この結果、図１５のような単語辞書テーブルの辞書データのもとでは“not ”、“note”共に辞書検索が成功し、語基用辞書検索バッファ７ｉに“not ”と“note”の辞書検索結果が図３５に示すように格納される。
【００７５】
辞書検索が成功したので、Ｓ６０５に進み、言語的特性に基づいた判定の一つとして、索いた単語の品詞が調べられる。この場合、“not ”は品詞が否定詞なので、Ｓ６０６に進み、“not ”に関する情報が語基用辞書検索バッファから消去され、その結果、図３６に示すように、語基用辞書検索バッファ７ｉは“note”に関する情報のみが残る。
そして、Ｓ６０７に進み、語基用辞書検索バッファ７ｉには情報が残っているので、Ｓ６１０に進み、派生語“noter ”に対する派生語訳生成が行われる。
【００７６】
この結果、辞書検索バッファ７ｂには、入力語“noter ”に対して、既知語“note”と接尾辞“er”とからなる派生語としての情報が、図３７に示すように格納される。
以上のように、入力単語に対して、同一の接辞にマッチする語基が複数存在している場合に、本実施例のように、品詞等の言語的特性に基づいた判定を行った結果、入力語“noter ”を、既知語“not ”と接尾辞“er”からなると見なすような不適切な判定を防止することができる。
【００７７】
実施例２によれば、原文中の未知語を形態素解析する際に、ソース言語の言語的特性情報に基づいて語基を決定するように構成したことにより、原文中の未知語に対して接辞が一意に定まっているが、これに連結し得る語基が複数通り存在する場合でも、その中から最適である可能性が高い語基を選択し、原文の解析がより正確に行えるという利点がある。
【００７８】
［実施例３］
実施例３として、接頭辞処理について“nonradioactive”、“nonremunerative ”という２個の英単語、接尾辞処理について“amiableness ”、“abidingness ”という２個の英単語の派生語訳生成処理を例にとり、本発明の特徴を説明する。
【００７９】
［接頭辞処理］
ここでは、単語“nonradioactive”の派生語訳生成処理を説明する。
この単語については、前記したように、図４において、Ｓ１０１→Ｓ１０２→Ｓ１０３→Ｓ１０４→Ｓ１０５→Ｓ１１１→Ｓ１１２→Ｓ１１７→Ｓ１１８→Ｓ１１９の処理へと進み、接頭辞“non ”と既知語“radioactive ”からなる派生語としての処理が行われる。
次に、図７の処理に移り、Ｓ５０１→Ｓ５０２→Ｓ５０３→Ｓ５０４→Ｓ５０５→Ｓ５１０の処理へと進んで、接頭辞つき派生語訳語生成処理に移る。
このとき、語基用辞書検索バッファ７ｉは、図３１のような記憶内容になる。
【００８０】図９は本実施例の翻訳処理（７）の手順を示すフローチャートである。また、図９は図７のＳ５１０の「接頭辞つき派生語訳生成」を詳細に示したものである。図９において、
Ｓ７０１で、現在選ばれている接頭辞に関して接頭辞テーブルの「処理パターンテーブル」欄に値があるか否かがチェックされる。
この場合、選ばれている接頭辞が“non ”で、図１１の接頭辞テーブルの“non ”の処理パターンテーブル欄には“101 ”という値が存在しているので、Ｓ７０２に進む。
【００８１】
Ｓ７０２で、接頭辞処理パターンテーブルのポインタ変数ｐｐに１がセットされる。この時点で、接頭辞処理パターンテーブルとして、図１３に示す接頭辞処理パターン１０１のものが選ばれる。
Ｓ７０３で、接頭辞処理パターンテーブル１０１のｐｐ番目のレコードの「条件」が語基用辞書検索バッファ７ｉの訳語欄の訳語「放射性の」と合致するかどうかの調査が試みられ、合致しなければ、Ｓ７０３→Ｓ７０４→Ｓ７０５→Ｓ７０３の処理へと進み、これが合致するか、あるいはｐｐが接頭辞処理パターンテーブル１０１のレコード数に達するまで、ｐｐを１ずつ増加しながら調査が繰り返して行われる。
【００８２】
訳語「放射性の」の場合、図１３の接頭辞処理パターンテーブル１０１を参照して、ＩＤ（レコード番号）が１の条件「名詞＋“の”」とマッチするので、ｐｐが１の時に、Ｓ７０３からＳ７０４に進み、図１３のＩＤ１の処理「“非”＋語基の訳語」という操作を、文字列「放射性の」に施し、その結果として生成された文字列「非放射性の」が、辞書検索バッファ７ｂの訳語欄に、図３２のように格納される。
【００８３】
次に、単語“nonremunerative ”の派生語訳生成処理を説明する。
この単語については、図１１の接頭辞テーブルや図１２の接尾辞テーブルを参照した結果、図４において、Ｓ１０１→Ｓ１０２→Ｓ１０３→Ｓ１０４→Ｓ１０５→Ｓ１１１→Ｓ１１２→Ｓ１１７→Ｓ１１８→Ｓ１１９の処理へと進み、接頭辞“non ”と既知語“remunerative”からなる派生語としての処理が行われる。次に、図７の処理に移り、Ｓ５０１→Ｓ５０２→Ｓ５０３→Ｓ５０４→Ｓ５０５→Ｓ５１０の処理へと進んで、接頭辞つき派生語訳生成処理に入る。このとき、語基用辞書検索バッファ７ｉは図３８のような記憶内容になる。
【００８４】
図９の処理に移り、この場合、選ばれている接頭辞が前記同様“non ”であるので、Ｓ７０１からＳ７０２→Ｓ７０３の処理に進み、接頭辞処理パターンテーブルとして、図１３に示す接頭辞処理パターン１０１が選ばれ、語基用辞書検索バッファ７ｉの訳語欄の訳語「利益がある」が接頭辞処理パターンテーブル１０１のいずれのレコード順と合致するか調査していく、Ｓ７０３からの繰り返し動作に移る。
【００８５】
訳語「利益がある」の場合、図１３の接頭辞処理パターンテーブルを参照して、ＩＤ（レコード番号）が５の条件「格助詞＋“ある”」とマッチするので、ｐｐが５のときに、Ｓ７０３からＳ７０４の処理に進み、図１３のＩＤ１の処理「“ある”を“ない”に置換」という操作を、文字列「利益がある」に施し、その結果として生成された文字列「利益がない」が、辞書検索バッファ７ｂの訳語欄に、図３９のように格納される。
【００８６】
以上のように、同じ接頭辞“non ”のついた派生語であっても、語基の訳語によって接頭辞部分を訳し分けることにより、より自然な訳語を得ることができる。
【００８７】
［接尾辞処理］
単語“amiableness ”の派生語訳生成処理を説明する。
この単語については、図１１の接頭辞テーブルや図１２の接尾辞テーブルを参照した結果、図４において、Ｓ１０１→Ｓ１０２→Ｓ１０３→Ｓ１０４→Ｓ１０６→Ｓ１０９の処理へと進み、既知語“amiable ”と接尾辞“ness”からなる派生語としての処理が行われる。
次に、図８の処理に移り、Ｓ６０１→Ｓ６０２→Ｓ６０３→Ｓ６０４→Ｓ６０５→Ｓ６１０の処理へと進んで、接尾辞つき派生語訳語生成処理に移る。このとき、語基用辞書検索バッファ７ｉは、図４０のような記憶内容になる。
【００８８】
図１０は本実施例の翻訳処理（８）の手順を示すフローチャートである。また、図１０は図８のＳ６１０の「接尾辞つき派生語訳生成」、「接頭辞つき派生語訳生成」を詳細に示したものである。図１０において、
Ｓ８０１で、現在選ばれている接尾辞に関して接尾辞テーブルの「処理パターンテーブル」欄に値があるかがチェックされる。この場合、選ばれている接頭辞が“ness”で、図１２の接尾辞テーブルの“ness”の処理パターンテーブル欄には“203 ”という値が存在しているので、Ｓ８０２に進む。
【００８９】
Ｓ８０２で、接尾辞処理パターンテーブルのポインタ変数ｐｓに１がセットされる。この時点で、接尾辞処理パターンテーブルとして、図１４に示す接尾辞処理パターンテーブル２０３が選ばれる。
Ｓ８０３で、接尾辞処理パターンテーブル２０３のｐｓ番目のレコードの「条件」が語基用辞書検索バッファ７ｉの訳語欄の訳語「感じがよい」と合致するかどうかの調査が試みられ、合致しなければ、Ｓ８０３→Ｓ８０４→Ｓ８０５→Ｓ８０３の処理に進み、これが合致するか、あるいはｐｓが接尾辞処理パターンテーブル２０３のレコード数に達するまで、ｐｓを１ずつ増加しながら調査が繰り返して行われる。
【００９０】
訳語「感じがよい」の場合、図１４の処理パターンテーブルを参照して、ＩＤ（レコード番号）が１の条件「“｛が｜の｝”+ 形容詞( “ない”以外) 」とマッチするので、ｐｓが１の時に、Ｓ８０３からＳ８０４の処理に進み、図１４のＩＤ１の処理「“の”＋形容詞の語幹＋“さ”」という操作を、文字列「感じがよい」に施し、その結果として生成された文字列「感じのよさ」が、辞書検索バッファ７ｂの訳語欄に、図４１のように格納される。
【００９１】
次に、単語“nonremunerative ”の派生語訳語生成処理を説明する。
この単語については、図１１の接頭辞テーブルや図１２の接尾辞テーブルを参照した結果、図４において、Ｓ１０１→Ｓ１０２→Ｓ１０３→Ｓ１０４→Ｓ１０６→Ｓ１０９の処理へと進み、既知語“abiding ”と接尾辞“ness”からなる派生語としての処理が行われる。
次に、図８の処理に移り、Ｓ６０１→Ｓ６０２→Ｓ６０３→Ｓ６０４→Ｓ６０５→Ｓ６１０の処理へと進んで、接尾辞つき派生語訳語生成処理に移る。このとき、語基用辞書検索バッファ７ｉは図４２のような記憶内容になる。
【００９２】
図１０の処理に移り、この場合、選ばれている接尾辞が前記同様“ness”であるので、Ｓ８０１からＳ８０２→Ｓ８０３の処理に進み、接尾辞処理パターンテーブルとして、図１４に示す接尾辞処理パターンテーブル２０３が選ばれ、語基用辞書検索バッファ７ｉの訳語欄の訳語「永続的な」が、接尾辞処理パターンテーブル２０３のいずれのレコード順と合致するか調査していく、Ｓ８０３からの繰り返し動作に移る。
【００９３】
訳語「永続的な」の場合、図１４に示す接尾辞処理パターンテーブルを参照して、ＩＤ（レコード番号）が３の条件「“｛的な｜的｝”」とマッチするので、ｐｓが３のときに、Ｓ８０３からＳ８０４の処理に進み、図１４のＩＤ３の処理「“｛的な｜的｝”を“性”に置換」という操作を、文字列「永続的な」に施し、その結果として生成された文字列「永続性」が、辞書検索バッファ７ｂの訳語欄に、図４３のように格納される。
【００９４】
以上のように、同じ接尾辞“ness”のついた派生語であっても、語基の訳語によって接尾辞部分の訳し方を訳し分けることにより、より自然な訳語を得ることができる。
【００９５】
実施例３によれば、派生語として処理された原文中の未知語の訳語を生成する際に、語基の訳語によって接辞部分を訳し分ける派生語訳生成部を構成したことにより、語基の訳語と接辞の訳語を単純に連接した形の訳語以外の訳語を生成することが可能となり、ターゲット言語としてより自然な訳文を生成することができるという利点がある。
【００９６】
【発明の効果】
本発明によれば、原文中の未知語を形態素解析する際に、ソース言語の言語的特性情報に基づいて接辞を決定するよう構成したことにより、原文中の未知語に対して接辞と語基の組み合わせが複数通り存在する場合でも、その中から最適である可能性が高い接辞と語基の組み合わせを選択し、原文の解析がより正確に行えるという利点がある。
【図面の簡単な説明】
【図１】本発明の一実施例である翻訳装置の構成を示すブロック図である。
【図２】本実施例の翻訳装置による各翻訳処理の手順を示すブロック図である。
【図３】本実施例の翻訳処理（１）の手順を示すフローチャートである。
【図４】本実施例の翻訳処理（２）の手順を示すフローチャートである。
【図５】本実施例の翻訳処理（３）の手順を示すフローチャートである。
【図６】本実施例の翻訳処理（４）の手順を示すフローチャートである。
【図７】本実施例の翻訳処理（５）の手順を示すフローチャートである。
【図８】本実施例の翻訳処理（６）の手順を示すフローチャートである。
【図９】本実施例の翻訳処理（７）の手順を示すフローチャートである。
【図１０】本実施例の翻訳処理（８）の手順を示すフローチャートである。
【図１１】本実施例の接頭辞テーブルの記憶内容を示す図である。
【図１２】本実施例の接尾辞テーブルの記憶内容を示す図である。
【図１３】本実施例の接頭辞処理パターンテーブルを示す図である。
【図１４】本実施例の接尾辞処理パターンテーブルを示す図である。
【図１５】本実施例の単語辞書テーブルの記憶内容を示す図である。
【図１６】本実施例の動詞規則変化形テーブルの記憶内容を示す図である。
【図１７】本実施例のマッチ接頭辞バッファの記憶内容（１）を示す図である。
【図１８】本実施例のマッチ接尾辞バッファの記憶内容（１）を示す図である。
【図１９】本実施例の語基バッファの記憶内容（１）を示す図である。
【図２０】本実施例の語基用辞書検索バッファの記憶内容（１）を示す図である。
【図２１】本実施例の辞書検索バッファの記憶内容（１）を示す図である。
【図２２】本実施例のマッチ接頭辞バッファの記憶内容（２）を示す図である。
【図２３】本実施例のマッチ接尾辞バッファの記憶内容（２）を示す図である。
【図２４】本実施例の語基バッファの記憶内容（２）を示す図である。
【図２５】本実施例の語基用辞書検索バッファの記憶内容（２）を示す図である。
【図２６】本実施例の辞書検索バッファの記憶内容（２）を示す図である。
【図２７】本実施例のマッチ接頭辞バッファの記憶内容（３）を示す図である。
【図２８】本実施例のマッチ接尾辞バッファの記憶内容（３）を示す図である。
【図２９】本実施例の語基バッファの記憶内容（３）を示す図である。
【図３０】本実施例の語基用辞書検索バッファの記憶内容（３）を示す図である。
【図３１】本実施例の辞書検索バッファの記憶内容（３）を示す図である。
【図３２】本実施例の辞書検索バッファの記憶内容（４）を示す図である。
【図３３】本実施例のマッチ接尾辞バッファの記憶内容（４）を示す図である。
【図３４】本実施例の語基バッファの記憶内容（４）を示す図である。
【図３５】本実施例の語基用辞書検索バッファの記憶内容（４）を示す図である。
【図３６】本実施例の語基用辞書検索バッファの記憶内容（５）を示す図である。
【図３７】本実施例の辞書検索バッファの記憶内容（５）を示す図である。
【図３８】本実施例の語基用辞書検索バッファの記憶内容（６）を示す図である。
【図３９】本実施例の辞書検索バッファの記憶内容（６）を示す図である。
【図４０】本実施例の語基用辞書検索バッファの記憶内容（７）を示す図である。
【図４１】本実施例の辞書検索バッファの記憶内容（７）を示す図である。
【図４２】本実施例の語基用辞書検索バッファの記憶内容（８）を示す図である。
【図４３】本実施例の辞書検索バッファの記憶内容（８）を示す図である。
【符号の説明】
１制御部
２入力部
３出力部
４バスライン
５プログラムメモリ
５ａ形態素解析部
５ｂ構文解析部
５ｃ構文変換部
５ｄターゲット言語生成部
５ｅ派生語処理部
５ｆ接辞決定部
５ｇ語基決定部
５ｈ派生語訳生成部
６テーブルメモリ
６ａ単語辞書テーブル
６ｂ文法規則テーブル
６ｃ翻訳規則テーブル
６ｄ動詞規則変化形テーブル
６ｅ接辞テーブル（接頭辞テーブル、接尾辞テーブル、接頭辞処理パターンテーブル、接尾辞処理パターンテーブル、）
７バッファメモリ
７ａ原文バッファ
７ｂ辞書検索バッファ
７ｃ変換前構文バッファ
７ｄ変換後構文バッファ
７ｅ訳文バッファ
７ｆマッチ接頭辞バッファ
７ｇマッチ接尾辞バッファ
７ｈ語基バッファ
７ｉ語基用辞書検索バッファ

Claims

単語辞書と、
接辞辞書と、
第１言語である原語を入力する入力部と、
単語辞書を参照し、入力原語を第２言語である訳語に変換する変換部と、
単語辞書及び接辞辞書を参照し、変換部によって訳語に変換されない入力原語から接辞と語基との組合せからなる１または複数個の派生語を認識する認識部と、
認識部が認識した派生語に、複数の接辞を含むものが存在する場合に、接頭語と接辞語との長さ情報を比較する接辞処理条件に基づいて一つの接辞を決定する接辞決定部と、
接辞決定部によって決定された接辞とこれに対応する語基のそれぞれの訳語を連結して前記認識された派生語の訳語を生成する派生語訳生成部とを備えたことを特徴とする翻訳装置。
前記接辞辞書は、語基の品詞とその活用形に対応して接辞の訳語を変更するための接辞訳変更情報を記憶した接辞訳変更情報テーブルをさらに備え、前記派生語訳生成部は、接辞訳変更情報に基づいて語基の訳語に対応して接辞の訳語を変更することを特徴とする請求項１に記載の翻訳装置。
単語辞書と、接辞辞書と、第１言語である原語を入力する入力部と、単語辞書を参照し、入力原語を第２言語である訳語に変換する変換部と、
認識部と、接辞決定部と、派生語訳生成部とを備え、
前記認識部が、単語辞書及び接辞辞書を参照し、変換部によって訳語に変換されない入力原語から接辞と語基との組合せからなる１または複数個の派生語を認識し、
認識部が認識した派生語に複数の接辞を含むものが存在する場合に、前記接辞決定部が接頭語と接辞語との長さ情報を比較する接辞処理条件に基づいて一つの接辞を決定し、
派生語訳生成部が、接辞決定部によって決定された接辞とこれに対応する語基のそれぞれの訳語を連結して前記認識された派生語の訳語を生成することを特徴とする翻訳方法。
単語辞書と、接辞辞書と、第１言語である原語を入力する入力部とを備えた翻訳装置に用いられ、コンピュータで読み取り可能な翻訳プログラムを記憶した媒体であって、前記コンピュータに、単語辞書を参照させ、入力原語を第２言語である訳語に変換させる機能と、
単語辞書及び接辞辞書を参照し、訳語に変換されない入力原語から接辞と語基との組合せからなる１または複数個の派生語を認識させる機能と、
認識された派生語に、複数の接辞を含むものが存在する場合に、接頭語と接辞語との長さ情報を比較する接辞処理条件に基づいて一つの接辞を決定させる機能と、
接辞決定部によって決定された接辞とこれに対応する語基のそれぞれの訳語を連結して前記認識された派生語の訳語を生成させる機能とを実現させるためのプログラムを記憶した記憶媒体。