JPH0232467A - Machine translation method - Google Patents
Machine translation methodInfo
- Publication number
- JPH0232467A JPH0232467A JP63182709A JP18270988A JPH0232467A JP H0232467 A JPH0232467 A JP H0232467A JP 63182709 A JP63182709 A JP 63182709A JP 18270988 A JP18270988 A JP 18270988A JP H0232467 A JPH0232467 A JP H0232467A
- Authority
- JP
- Japan
- Prior art keywords
- word
- pattern
- sentence
- input sentence
- variable
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 64
- 238000000059 patterning Methods 0.000 claims description 9
- 238000010586 diagram Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
Landscapes
- Machine Translation (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は、機械翻訳方式に関し、特に同一文章および同
型文章を効率的に翻訳するのに好適な機械翻訳方式に関
するものである。DETAILED DESCRIPTION OF THE INVENTION [Field of Industrial Application] The present invention relates to a machine translation method, and particularly to a machine translation method suitable for efficiently translating identical sentences and sentences of the same type.
従来の機械翻訳処理では、予め登録された辞書情報や文
法規則等のデータを用いて、入力文に対して一文毎に構
文解析、訳語生成等の処理を行い訳文を生成している(
特開昭58−4068.4号公報、同59−12157
4号公報参照)6入力テキストには、一般にそのテキス
トの分野が限定されるほど、同一文章や同型文章が数多
く含まれるが、−文毎に翻訳処理を行う従来の処理では
、そのような入力テキスト文の重複をチエツクする機能
は備わっていない。そのため、同、−文章や同型文章が
出現しても、再度、文法規則等のデータを用いて翻訳す
るという無駄な処理が行われていた。In conventional machine translation processing, data such as pre-registered dictionary information and grammatical rules are used to perform syntax analysis, translation generation, etc. on each input sentence to generate a translated sentence (
JP-A-58-4068.4, JP-A No. 59-12157
(Refer to Publication No. 4) 6 In general, the more limited the field of the text is, the more the same or isomorphic sentences are included in the input text. There is no function to check for duplicate text sentences. Therefore, even if a same-sentence or a same-type sentence appears, a wasteful process of translating it again using data such as grammatical rules is performed.
〔発明が解決しようとするi!KM )上記従来技術に
おいては、既に一度翻訳済の文章と同一な文章や同型な
文章が再度入カテキスト文中に現われた際にも、辞書情
報や文法規則等のデータを用いての翻訳処理を重複して
行わねばならず、そのためにムダな処理時間がかかり、
翻訳処理全体の処理効率の低下を招くという課題があっ
た・
本発明の目的は、このような従来の課題を解決し、入力
テキスト文中の同一文章、同型文章に対する翻訳処理の
重複実行を防止させ、同テキストに対する翻訳処理全体
に要するCPU時間を短縮し、翻訳の処理効率を向上さ
せる機械翻訳方式を提供することにある。[The invention tries to solve i! KM) In the above conventional technology, even when a sentence that is the same as a sentence that has already been translated or a sentence that is isomorphic appears again in the input text, translation processing using data such as dictionary information and grammatical rules is not performed. This process has to be repeated, which results in wasted processing time.
There was a problem that the processing efficiency of the entire translation process decreased.The purpose of the present invention is to solve this conventional problem and prevent duplicate execution of translation processes for the same sentence or isomorphic sentence in an input text sentence. An object of the present invention is to provide a machine translation method that reduces the CPU time required for the entire translation process for the same text and improves the processing efficiency of translation.
上記課題を解決するため、本発明の機械翻訳方式は、予
め辞書に登録済の単語情報や文法規則等のデータを用い
て翻訳処理を行う機械翻訳方式において、入力された翻
訳対象の入力テキスト文中の「数値からなる単語」を変
数単語とみなし特別記号に置換して入力文をパターン化
する手段と、上記変数単語をメモリに一時的に記憶させ
る手段と、既に登録済の典型パターンファイルを用いて
上記入力文のパターンと典型パターンとを比較マツチン
グする手段と、該マツチした典型パターンに対応する訳
文パターンを上記典型パターンファイルから抽出する手
段と、該抽出された訳文パターン内の特別記号をメモリ
内の前記変数単語に置換することにより、入力文に対応
した訳文を生成する手段とを有することに特徴がある。In order to solve the above problems, the machine translation method of the present invention is a machine translation method that performs translation processing using data such as word information and grammatical rules registered in advance in a dictionary. A means for patterning an input sentence by regarding the "words consisting of numerical values" as variable words and replacing them with special symbols, a means for temporarily storing the variable words in memory, and using an already registered typical pattern file. means for comparing and matching the pattern of the input sentence and the typical pattern; means for extracting a translation pattern corresponding to the matched typical pattern from the typical pattern file; and a memory for storing special symbols in the extracted translation pattern. The present invention is characterized in that it includes means for generating a translated sentence corresponding to an input sentence by replacing the variable word with the variable word in the input sentence.
また、上記パターン化された入力文が、既に登録済の典
型パターンとマツチしなかった際、随時、上記入力文の
パターンをディスプレイ装置に表示する手段と、上記入
力文のパターンに対応する訳文パターンを入力装置から
入力する手段と、上記入力文のパターンと該訳文パター
ンとを対応させて、上記典型パターンファイルに新規に
登録する手段を追加したことに特徴がある。Further, means for displaying the pattern of the input sentence on a display device whenever the patterned input sentence does not match the already registered typical pattern, and a translated sentence pattern corresponding to the pattern of the input sentence. The present invention is characterized by the addition of means for inputting from an input device, and means for registering a new pattern in the typical pattern file in association with the pattern of the input sentence and the translated sentence pattern.
さらに、上記パターン化された入力文が、既に登録済の
典型パターンとマツチしなかった際、上記入力文のパタ
ーンをメモリに一時格納しておき、後で一括してディス
プレイ装置に表示する手段と、上記入力文のパターンに
対応する訳文パターンを入力装置から入力する手段と、
上記入力文のパターン群と訳文パターン群を各々対応さ
せて、上記典型パターンファイルに新規に登録する手段
を追加したことにも特徴がある6
入力文のパターン化処理手段として、上記入力文中の各
単語の大文字/小文字の表記に着目し、該入力文中の文
頭単語を除く大文字で始まる単語を変数単語とみなし特
別記号に置換し、該変数単語をメモリに記憶させて行う
手段や、上記入力文中から抽出した単語に対して、その
単語の属性条件を設定し辞書引きを行い該単語の属性を
調べることによって、該条件にマツチした単語を変数単
語とみなし特別記号に置換し、変数単語をメモリに記憶
させて行う手段、さらに上記入力文中の単語間の組み合
わせに着目し、ある指定された単語の前、または、後の
いずれか一方に位置する単語を変数単語とみなし特別記
号に置換し、該変数単語をメモリに記憶させて行う手段
を有することにも特徴がある。Further, when the patterned input sentence does not match the already registered typical pattern, the input sentence pattern is temporarily stored in memory and later displayed all at once on the display device. , means for inputting a translation pattern corresponding to the input sentence pattern from an input device;
Another feature is that a means for newly registering the above-mentioned input sentence pattern group and translation sentence pattern group in the above-mentioned typical pattern file is added. A method that focuses on the notation of uppercase/lowercase letters of words, treats words starting with a capital letter other than the first word in the input sentence as variable words and replaces them with special symbols, and stores the variable words in memory, or By setting attribute conditions for the word extracted from , and checking the attributes of the word by looking it up in a dictionary, the words that match the conditions are regarded as variable words and replaced with special symbols, and the variable words are stored in memory. Furthermore, by focusing on the combinations of words in the input sentence, the words located either before or after a specified word are regarded as variable words and replaced with special symbols, Another feature is that it has means for storing the variable words in a memory.
典型パターンと入力文のパターンとの比較マツチング手
段として、上記パターン化された入力文の文頭単語の第
一文字に着目し、既にアルファベット類にソートして既
に登録済の典型パターンファイルを用いて、該ファイル
内の各パターンの第一文字目と上記入力文の第一文字と
を比較する手段や、上記パターン化された入力文中の指
定された位置単語に着目し、既に指定された位置単語を
キーワードとしてもつ登録済の典型パターンファイルを
用いて、該単語とファイル内のキーワードとを比較する
手段を有することにも特徴がある。As a means of comparison and matching between a typical pattern and an input sentence pattern, we focus on the first letter of the first word of the patterned input sentence, and use a typical pattern file that has already been sorted into alphabets and registered. A means of comparing the first character of each pattern in the file with the first character of the above input sentence, and focusing on the specified position word in the patterned input sentence, and using the already specified position word as a keyword. Another feature is that it has means for comparing the word with a keyword in the file using a registered typical pattern file.
訳文生成手段として、上記入力文のパターンに対応して
抽出した訳文パターン内の特別記号を、メモリ内の変数
単語に置換する際、変数単語の辞書引きを行い該変数単
語の訳語を選出して、上記特別記号を該訳語に置換する
ことによって、入力文に対応した訳文を生成する手段や
、上記入力文のパターンに対応して抽出した訳文パター
ン中の特別記号をメモリ内の該変数単語の訳語に置換す
ることにより、入力文に対応した訳語を生成する手段を
有することにも特徴がある。As a translation generation means, when replacing a special symbol in a translation pattern extracted corresponding to the input sentence pattern with a variable word in memory, the variable word is looked up in a dictionary and the translation of the variable word is selected. , a means for generating a translated sentence corresponding to the input sentence by replacing the above special symbol with the corresponding translation word, and a means for generating a translated sentence corresponding to the input sentence by replacing the special symbol in the translated sentence pattern extracted corresponding to the above input sentence pattern with the corresponding variable word in memory. Another feature is that it has means for generating a translated word corresponding to an input sentence by replacing it with a translated word.
本発明により、機械翻訳処理において、入力テキスト内
に出現する同一文章や同型文章に対して、辞書情報、文
法規則等のデータを用いた翻訳処理の重複実行を防ぎ、
同テキストの翻訳処理全体に要するCPU時間を短縮し
、翻訳の処理効率を向上させることができる。According to the present invention, in machine translation processing, redundant execution of translation processing using data such as dictionary information and grammatical rules is prevented for the same sentences or isomorphic sentences appearing in input text,
It is possible to reduce the CPU time required for the entire translation process of the same text, and improve the translation processing efficiency.
以下、本発明の一実施例を、図面により詳細に説明する
。Hereinafter, one embodiment of the present invention will be described in detail with reference to the drawings.
本実施例では、英語から日本語への機械翻訳処理方式に
ついて述べる。In this embodiment, a machine translation processing method from English to Japanese will be described.
第1図は1本発明の一実施例を示す機械翻訳方式の全体
構成図である。FIG. 1 is an overall configuration diagram of a machine translation system showing an embodiment of the present invention.
第1図において、1はプロセッサ、2は典型パターンを
格納している典型パターンファイル、3はメモリ、4は
英日辞書ファイル、5は英文テキストファイル、6はデ
ィスプレイ装置、7はキーボード等の入力装置、8は英
日文法規則ファイル、11は入力テキスト文中の「数値
からなる単語」を変数単語とみなし特別記号に置換して
入力文ををパターン化する入力文パターン化処理部、1
2は典型パターンファイル2を用いて入力文のパターン
と典型パターンとの比較マツチングを行う比較処理部、
13は訳文パターン内の特別記号をメモリ内の変数単語
に置換して入力文に対応した訳文を生成する訳文生成処
理部、14は典型パターンの登録を行う典型パターン登
録処理部である。In FIG. 1, 1 is a processor, 2 is a typical pattern file storing typical patterns, 3 is a memory, 4 is an English-Japanese dictionary file, 5 is an English text file, 6 is a display device, and 7 is an input device such as a keyboard. 8 is an English-Japanese grammar rule file; 11 is an input sentence patterning processing unit that regards "words consisting of numerical values" in an input text sentence as variable words and replaces them with special symbols to pattern the input sentence; 1
2 is a comparison processing unit that performs comparison and matching between the input sentence pattern and the typical pattern using the typical pattern file 2;
Reference numeral 13 denotes a translation generation processing unit that replaces special symbols in the translation pattern with variable words in memory to generate a translation corresponding to the input sentence, and 14 a typical pattern registration processing unit that registers typical patterns.
上述したファイルは、磁気ディスク、フロッピーディス
ク、または光ディスク等の媒体に格納されている。The above-mentioned files are stored on a medium such as a magnetic disk, a floppy disk, or an optical disk.
第2図は、本実施例における機械翻訳処理のフローチャ
ートである。これは、第1図の構成における翻訳処理の
フローである。以下、第2図のフローに従って、本実施
例の動作を説明する。FIG. 2 is a flowchart of machine translation processing in this embodiment. This is the flow of translation processing in the configuration of FIG. The operation of this embodiment will be explained below according to the flow shown in FIG.
まず、翻訳対象の英文テキス1−が英文テキストファイ
ル5よりメモリ3内に取り込まれる(ステップ101)
。First, the English text 1- to be translated is imported into the memory 3 from the English text file 5 (step 101).
.
プロセッサ1の入力文パターン化処理部11において、
当該英文テキストより入力テキスト文を一文毎に取り出
し、該入力テキスト文中の数値のみで表記されている単
語を抽出して5順次特別な記号に置換する(ステップ1
02)。−人カテキスト文内に何単語も出現した場合に
は、その都度。In the input sentence patterning processing unit 11 of the processor 1,
Extract the input text sentence by sentence from the English text, extract the words written only with numerical values in the input text sentence, and replace them with special symbols in sequence (Step 1).
02). - Each time multiple words appear in a text sentence.
特別記号の番号を変えて該単語と置換する。−単語も照
合しない場合には、入力テキスト文はそのままとする。Change the number of the special symbol and replace it with the word. - If no words are matched, leave the input text as is.
置換された元の変数単語は、該入力テキストに対応づけ
て、メモリ3に一時的に格納される。本実施例では、抽
出した単語を特別記号「$$」に置換する。第3図に当
該単語を特別記号に置換する前の入力テキスト文と置換
した後の入力テキスト文の一例を示す。The replaced original variable word is temporarily stored in the memory 3 in association with the input text. In this embodiment, the extracted word is replaced with a special symbol "$$". FIG. 3 shows an example of an input text sentence before the word is replaced with a special symbol, and an example of an input text sentence after the word is replaced.
次に、プロセッサ1の典型パターンとの比較処理部12
において、置換した英文テキストを一人カテキスト文毎
に、典型パターンファイル2内に予め登録しである典型
パターンと比較マツチングする(ステップ103)。典
型パターンファイル2のアクセスは、入力テキスト文中
の該特別記号の位置に着目して、当該入力テキスト文中
の何単語目に該特別記号があるかをチエツクすることに
より、典型パターンファイル2内の大量の典型パターン
を絞り込んだ上で、典型パターンをアクセスする方式を
とる。これにより、全ての典型パターンにアクセスする
のに比べて、より早く目的の典型パターンをアクセスで
きる。Next, the comparison processing unit 12 with the typical pattern of the processor 1
In step 103, the replaced English text is compared and matched with a typical pattern registered in advance in the typical pattern file 2 for each one-person catechist sentence. The typical pattern file 2 can be accessed by focusing on the position of the special symbol in the input text sentence and checking in which word in the input text sentence the special symbol is located. After narrowing down the typical patterns, a method is used to access the typical patterns. As a result, the target typical pattern can be accessed more quickly than when all typical patterns are accessed.
第4図は、典型パターンファイル2.および当該入力テ
キスト文の例である。ここでは、特別記号が当該入力テ
キスト文中の第4番目の単語であることに着目して、典
型パターンファイル2内のアクセスする範囲を絞って、
当該入力テキスト文にマツチする典型パターンを検出し
ている。FIG. 4 shows typical pattern file 2. and an example of the input text sentence. Here, focusing on the fact that the special symbol is the fourth word in the input text sentence, we narrow down the range to be accessed in the typical pattern file 2, and
A typical pattern that matches the input text sentence is detected.
典型パターンファイル2内に、当該入力テキスト文のパ
ターンと一致する典型パターンが検出できた場合は、プ
ロセッサ1の訳文生成処理部13は第5図に示すような
、典型パターンファイル2内の該典型パターン対応の訳
語パターンを抽出し、該訳語パターン内の特別記号を、
メモリ3に格納しである当該入力テキスト文内の特別記
号に置換する前の変数単語に置換する(ステップ104
)。If a typical pattern that matches the pattern of the input text sentence is detected in the typical pattern file 2, the translation generation processing unit 13 of the processor 1 generates the typical pattern in the typical pattern file 2 as shown in FIG. Extract the translated word pattern that corresponds to the pattern, and use the special symbols in the translated word pattern as
The special symbol in the input text sentence stored in the memory 3 is replaced with the variable word before being replaced (step 104
).
第6図は、−人カテキスト文の本実施例に沿った移行図
である。ここで、(a)は特別記号に置換する前の入力
テキスト文、(b)は置換後の入力テキスト文、(C)
は置換後の入力テキス1〜文をもとに、典型パターンフ
ァイル2よりアクセスし、抽出した典型パターン、(d
)は該典型パターンに対応した訳文パターン、(、)は
該訳文パターン内の特別記号を元の変数単語に置換して
作成した訳文である。下線部は置換部分を示す。FIG. 6 is a transition diagram of the -human text sentence according to this embodiment. Here, (a) is the input text sentence before replacing with special symbols, (b) is the input text sentence after replacement, (C)
is a typical pattern, (d
) is a translation pattern corresponding to the typical pattern, and (,) is a translation created by replacing special symbols in the translation pattern with the original variable words. The underlined part indicates the replaced part.
また、典型パターンファイル2をアクセスした結果、当
該入力テキスト文とは一致しなかった場合には、特別単
語に置換する前の当該入力テキスト文に対し、英日辞書
ファイル4に登録済の辞書情報、および、英日文法規則
ファイル8に登録済の文法規則等のデータを用いて、構
文解析、中間語表現、訳文生成等の各処理を経た従来の
翻訳処理を行い、訳文を生成する(ステップ105)。In addition, if the typical pattern file 2 is accessed and there is no match with the input text sentence, the dictionary information registered in the English-Japanese dictionary file 4 is added to the input text sentence before replacing it with the special word. , and the data of grammar rules registered in the English-Japanese grammar rule file 8 are used to perform conventional translation processing such as syntactic analysis, intermediate language expression, and translation generation to generate a translation (step 105).
本実施例では、典型パターンファイル2内の典型パター
ンとマツチングしなかった入力テキスト文に対して従来
の翻訳処理を行っているが、第7図のフローに示すよう
に、置換後の当該入力テキスト文の典型パターンと典型
パターンファイル2がマツチングしなかった時点で、デ
ィスプレイ装置6に表示して(ステップ201)、キー
ボード等の入力装置7から対応する訳語パターンを入力
して(ステップ202)、典型パターンファイル2に置
換後の入力テキスト文のパターンとともに登録する(ス
テップ203)ことにより、典型パターンファイル2を
随時、更新する処理を本実施例に追加する別方式が考え
られる(ステップ106)。In this embodiment, conventional translation processing is performed on the input text sentences that are not matched with the typical pattern in the typical pattern file 2, but as shown in the flowchart of FIG. When the typical pattern of the sentence and the typical pattern file 2 are not matched, the typical pattern is displayed on the display device 6 (step 201), the corresponding translated word pattern is inputted from the input device 7 such as a keyboard (step 202), and the typical pattern file 2 is displayed. Another method can be considered in which a process of updating the typical pattern file 2 at any time is added to the present embodiment by registering it together with the pattern of the input text sentence after replacement in the pattern file 2 (step 203) (step 106).
また、ステップ106方式の拡充方式として、マツチし
なかった置換後の入力テキスト文のパターンを、−時的
にメモリ3に蓄えておき、後で一括して対応する訳文パ
ターンを入力して、典型パターンファイル2にWtaす
る方式も考えられる。In addition, as an expansion method of the step 106 method, patterns of input text sentences after replacement that are not matched can be temporarily stored in the memory 3, and the corresponding translation patterns can be input all at once later. A method of adding Wta to pattern file 2 is also considered.
以上が一実施例であるが、他にいろいろな拡充方式が考
えられる。Although the above is one example, various other expansion methods are possible.
変数単語の置換方式に関しては、前記実施例で説明した
数値変数の置換方式以外に、入力テキスト文中の単語の
大文字/小文字の表記に着目して固有名詞等の変数単語
を置換する方式が考えられる。第8図は、同置換方式の
フローチャートである。Regarding the variable word replacement method, in addition to the numerical variable replacement method explained in the above embodiment, a method that replaces variable words such as proper nouns by paying attention to the uppercase/lowercase letters of the words in the input text sentence can be considered. . FIG. 8 is a flowchart of the replacement method.
すなわち、入力された入力テキスト文を単語毎に分割し
、該単語群のうち文頭単語を除く大文字で始まる単語を
抽出して(ステップ301)、当該単語を変数単語とみ
なし、特別記号に置換(ステップ302)する(ステッ
プ102’)。That is, the input text sentence is divided into words, and words starting with a capital letter excluding the first word of the sentence are extracted from the word group (step 301), and the words are regarded as variable words and replaced with special symbols ( Step 302) (Step 102').
また、上記ステップ102′方式では、単に大文字で始
まる単語を抽出したが、さらに、「地名単語」などの細
かい条件が加わった単語を抽出する場合には、該単語の
属性情報を調べる必要がある。そこで、上記ステップ1
02′の方式に、さらに辞書引きを取り入れる方式が考
えられる。第9図は、同置換方式のフローチャートであ
る。In addition, in the above step 102' method, words starting with a capital letter are simply extracted, but when further extracting words with detailed conditions such as "place name word", it is necessary to check the attribute information of the word. . Therefore, step 1 above
A method that further incorporates dictionary lookup into the method of 02' can be considered. FIG. 9 is a flowchart of the replacement method.
すなわち、上記ステップ102′で抽出した該単語に対
し、プロセッサ1が英日辞書ファイル4の辞書引きを行
い(ステップ401)、該単語が地名の属性情報を持つ
ことをチエツクした上で(ステップ402)、該単語を
変数単語とみなし特別記号に置換(ステップ403)す
る(ステップ102″)。That is, the processor 1 performs a dictionary lookup in the English-Japanese dictionary file 4 for the word extracted in step 102' (step 401), checks that the word has attribute information of a place name, and then performs a dictionary lookup in the English-Japanese dictionary file 4 (step 402). ), the word is regarded as a variable word and replaced with a special symbol (step 403) (step 102'').
さらに、入力テキスト文中の単語の組み合わせによって
変数単語を抽出して置換する別方式も考えられる。第1
0図に示すような天気報道関係の英文テキスト文の場合
、rt h eJとrAreaJの間の単語は地名であ
ると必然的に決まってくるため、該入力テキスト文と「
the」とrAreaJがマツチすれば、その間の単語
を変数単語とみなし特別記号に置換することができる。Furthermore, another method may be considered in which variable words are extracted and replaced based on a combination of words in the input text sentence. 1st
In the case of an English text sentence related to weather reporting as shown in Figure 0, the word between rth eJ and rAreaJ is inevitably determined to be a place name, so the input text sentence and "
If "the" and rAreaJ match, the words between them can be regarded as variable words and replaced with special symbols.
第11図は、同置換方式のフローチャートである。FIG. 11 is a flowchart of the replacement method.
すなわち、入力テキスト文を単語分割し、指定した単語
と決まった位置関係にある単語を抽出して(ステップ5
01)、当該単語を変数単語とみなし、特別記号に置換
(ステップ502)する(ステップ102”)。That is, the input text sentence is divided into words, and words that have a fixed positional relationship with the specified word are extracted (step 5).
01), the word is regarded as a variable word and replaced with a special symbol (step 502) (step 102'').
ステップ104において、訳文パターン内の特別記号を
元の入力テキスト文中の変数単語に置き換える方式しこ
関しては、本実施例では、該当単語をそのまま置換した
が、英日辞書ファイル4の辞書引きを行い、変数単語の
訳語を置換する方式が考えられる。第12図は、同置換
方式のフローチャートである。In step 104, regarding the method of replacing special symbols in the translation pattern with variable words in the original input text sentence, in this embodiment, the corresponding words are replaced as they are, but the dictionary lookup in the English-Japanese dictionary file 4 is used. One possible method is to replace the translated words of the variable words. FIG. 12 is a flowchart of the replacement method.
すなわち、第12図(a)に示すように、上記ステップ
102#方式に加えて、テキスト文中の変数単語を特別
記号に置換した後、辞書引きを行った際に該当単語の訳
語を選出しくステップ601)。That is, as shown in FIG. 12(a), in addition to the above step 102# method, after replacing variable words in the text sentence with special symbols, a step is performed to select the translation of the corresponding word when looking up the dictionary. 601).
当該変数単語に対応させてメモリ3に菩えておく(ステ
ップ602)方式(ステップ104’)と、第12図(
b)に示すように、訳語パターンの特別記号の置換時に
改めて辞書引きを行いCステップ701)、当該変数単
語の訳語を選出する(ステップ702)方式(ステップ
104“)の2通りが考えられる。There is a method (step 602) in which the word is stored in the memory 3 in correspondence with the variable word (step 104'), and a method (step 104') in FIG.
As shown in b), there are two possible methods: one is to look up the dictionary again when replacing the special symbol in the translated word pattern (step 701), and the other is to select a translated word for the variable word (step 702) (step 104'').
また、典型パターンファイル2のアクセス方式は、本実
施例では特別記号の位置に着目することでアクセスする
範囲を絞り込み、より早くマツチする典型パターンを探
し出す方式を用いたが、次に述べるような別の方式も考
えられる。In addition, in this embodiment, the access method for the typical pattern file 2 is to narrow down the range to be accessed by focusing on the position of the special symbol and search for a typical pattern that matches more quickly. The following method is also possible.
ステップ103のアクセス方式の他に、入力テキスト文
の文頭単語の一文字目に着目し、該文字をキーとしてア
ルファベット類にソートした典型パターンファイル2と
のマツチングを行い、典型パターンファイル2を絞り込
んでから、典型パターンをアクセスする方式が考えられ
る。In addition to the access method in step 103, focus on the first character of the first word of the input text sentence, use this character as a key to match with the typical pattern file 2 sorted alphabetically, narrow down the typical pattern file 2, and then , a method of accessing typical patterns can be considered.
また、入力テキスト文中の予め指定された位置にある単
語(複数でも可)に着目して、該単語をキーワードとし
て典型パターンファイル2とのマツチングを行うことに
より、典型パターンファイル2を絞り込んでから、典型
パターンをアクセスする方式が考えられる。Further, by focusing on a word (or words) at a pre-specified position in the input text sentence and performing matching with the typical pattern file 2 using the word as a keyword, the typical pattern file 2 is narrowed down, and then One possible method is to access typical patterns.
第13図では、入力テキスト文中の2番目の位置にある
単語と5番目の位置にある単語に着目して、予め2番目
の単語と5番目の単語をキーワードとして備えている典
型パターンファイル2とのマツチングを行い、典型パタ
ーンファイル2を絞り込んでいる。但し、この時にキー
ワードとする単語の数は、多いほど典型パターンファイ
ル2を絞り込む効果は大きいが、その反面、キーワード
のマツチングに時間がかかるので、入力テキスト文の長
さによって適当な数を設定することが大切である。In FIG. 13, focusing on the word at the second position and the word at the fifth position in the input text sentence, a typical pattern file 2 is created that has the second word and the fifth word as keywords in advance. The typical pattern file 2 is narrowed down by matching. However, the greater the number of words used as keywords at this time, the greater the effect of narrowing down the typical pattern file 2, but on the other hand, it takes time to match the keywords, so set an appropriate number depending on the length of the input text sentence. That is important.
なお、上記の各実施例で示した方式は、現在行われてい
る機械翻訳方式をなんら排除するものでない。本実施例
では、英日機械翻訳方式について述べたが、適用分野等
を十分に考慮することによって、日英機械翻訳および、
他言語の機械翻訳方式にも適用可能゛である。また、本
実施例では、機械翻訳方式を説明したが、ステップ10
1〜1o4までの処理を−ツールとして、従来の機械翻
訳方式に導入することも可能である。さらに、本実施例
では、適用分野として、天気報道関係の文章を取り上げ
たが、それ以外にマニュアル文、経済文等の定型的文章
の翻訳処理に対しても、本方式は有効である。Note that the methods shown in each of the above embodiments do not exclude the currently used machine translation methods. In this example, the English-Japanese machine translation method was described, but by fully considering the application field etc., Japanese-English machine translation and
It is also applicable to machine translation methods for other languages. In addition, in this embodiment, a machine translation method has been explained, but step 10
It is also possible to introduce the processes from 1 to 1o4 into a conventional machine translation method as a tool. Further, in this embodiment, although the application field is text related to weather reporting, this method is also effective for translation processing of other standard texts such as manual texts and economic texts.
以上説明したように、本発明によれば、入力テキスト文
中に繰返し出現する同一文章や同型文章に対しては、辞
書情報、文法規則等のデータを用いる従来の翻訳処理を
行わないですむために、入力テキスト全体に対する翻訳
処理を著しく高速化することができる。また、典型パタ
ーンファイルを順次、更新することによって、大量の文
章を翻訳するほど翻訳時間を短縮できる。さらに、同一
文章、同型文章の出現頻度は翻訳対象文の分野を限定す
るほどその傾向が高くなるので、分野を限定した入力文
の翻訳処理の高速化には特に多大な効果を上げることが
できる。As explained above, according to the present invention, in order to avoid performing conventional translation processing using data such as dictionary information and grammatical rules for the same sentence or isomorphic sentence that repeatedly appears in the input text sentence, Translation processing for the entire text can be significantly sped up. Furthermore, by sequentially updating the typical pattern files, the translation time can be reduced as more texts are translated. Furthermore, the frequency of appearance of identical sentences and isomorphic sentences increases as the field of the target sentence is limited, so it can be especially effective in speeding up the translation process of input sentences in a limited field. .
第1図は本発明の一実施例を示す機械翻訳方式の全体構
成図、第2図は本発明の一実施例の処理の流れを示すフ
ローチャート、第3図は本発明における入力テキスト文
の変数単語の一置換例を示す図、第4図は本発明におけ
る典型パターンファイルの一部、および、入力テキスト
文の一例を示す図、第5図は本発明における典型パター
ンファイルの内部構造の一例を示す図、第6図は本発明
における一実施例に沿った入力テキスト文から訳文が得
られるまでの処理の移行図、第7図、第8図、第9図、
第11図および第12図は本発明の他の実施例に沿った
処理動作を示すフローチャート、第10図は本発明の他
の実施例における入力テキスト文中の変数単語の置換方
式の一例を示す図、第13図は本発明における典型パタ
ーンファイルのアクセス方式の一例を示す図である。
1:プロセッサ、2:典型パターンファイル、3:メモ
リ、4:英日辞書ファイル、5:英文テキストファイル
、6:ディスプレイ装置、7:キーボード等の入力装置
、8:英日文法規則ファイル、11:入力文パターン化
処理部、12:典型パターンの比較処理部、
13:訳文生成処理部。
14:典型パターン登録処理部。
第
図
第
牛
図
第
図
第
○
図Fig. 1 is an overall configuration diagram of a machine translation method showing an embodiment of the present invention, Fig. 2 is a flow chart showing the processing flow of an embodiment of the present invention, and Fig. 3 is a variable of an input text sentence in the present invention. FIG. 4 is a diagram showing a part of a typical pattern file in the present invention and an example of an input text sentence; FIG. 5 is a diagram showing an example of the internal structure of a typical pattern file in the present invention. 6 is a transition diagram of the process from an input text sentence to obtaining a translated sentence according to an embodiment of the present invention, FIG. 7, FIG. 8, FIG. 9,
11 and 12 are flowcharts showing processing operations according to another embodiment of the present invention, and FIG. 10 is a diagram showing an example of a method for replacing variable words in an input text sentence in another embodiment of the present invention. , FIG. 13 is a diagram showing an example of a typical pattern file access method according to the present invention. 1: Processor, 2: Typical pattern file, 3: Memory, 4: English-Japanese dictionary file, 5: English text file, 6: Display device, 7: Input device such as keyboard, 8: English-Japanese grammar rule file, 11: Input sentence patterning processing unit, 12: Typical pattern comparison processing unit, 13: Translation generation processing unit. 14: Typical pattern registration processing section. Fig. Cow Fig. Fig. ○
Claims (1)
を用いて翻訳処理を行う機械翻訳方式において、入力さ
れた翻訳対象の入力テキスト文中の「数値からなる単語
」を変数単語とみなし特別記号に置換して入力文をパタ
ーン化する手段と、上記変数単語をメモリに一時的に記
憶させる手段と、既に登録済の典型パターンファイルを
用いて上記入力文のパターンと典型パターンとを比較マ
ッチングする手段と、該マッチした典型パターンに対応
する訳文パターンを上記典型パターンファイルから抽出
する手段と、該抽出された訳文パターン内の特別記号を
メモリ内の前記変数単語に置換することにより、入力文
に対応した訳文を生成する手段とを有することを特徴と
する機械翻訳方式。 2、上記パターン化された入力文が、既に登録済の典型
パターンとマッチしなかった際、随時、上記入力文のパ
ターンをディスプレイ装置に表示する手段と、上記入力
文のパターンに対応する訳文パターンを入力装置から入
力する手段と、上記入力文のパターンと該訳文パターン
とを対応させて、上記典型パターンファイルに新規に登
録する手段を追加したことを特徴とする特許請求の範囲
第1項記載の機械翻訳方式。 3、上記パターン化された入力文が、既に登録済の典型
パターンとマッチしなかった際、上記入力文のパターン
をメモリに一時格納しておき、後で一括してディスプレ
イ装置に表示する手段と、上記入力文のパターンに対応
する訳文パターンを入力装置から入力する手段と、上記
入力文のパターン群と訳文パターン群を各々対応させて
、上記典型パターンファイルに新規に登録する手段を追
加したことを特徴とする特許請求の範囲第1項記載の機
械翻訳方式。 4、上記入力文中の各単語の大文字/小文字の表記に着
目し、該入力文中の文頭単語を除く大文字で始まる単語
を変数単語とみなし特別記号に置換し、該変数単語をメ
モリに記憶させることによって入力文をパターン化する
手段を有することを特徴とする特許請求の範囲第1項記
載の機械翻訳方式。 5、上記入力文中から抽出した単語に対して、その単語
の属性条件を設定し辞書引きを行い該単語の属性を調べ
ることによって、該条件にマッチした単語を変数単語と
みなし特別記号に置換し、変数単語をメモリに記憶させ
ることによって入力文をパターン化する手段を有するこ
とを特徴とする特許請求の範囲第4項記載の機械翻訳方
式。 6、上記入力文中の単語間の組み合わせに着目し、ある
指定された単語の前、または、後のいずれか一方に位置
する単語を変数単語とみなし特別記号に置換し、該変数
単語をメモリに記憶させることによって入力文をパター
ン化する手段を有することを特徴とする特許請求の範囲
第1項記載の機械翻訳方式。 7、上記パターン化された入力文の文頭単語の第一文字
に着目し、既にアルファベット順にソートして既に登録
済の典型パターンファイルを用いて、該ファイル内の各
パターンの第一文字目と上記入力文の第一文字とを比較
する手段を有することを特徴とする特許請求の範囲第1
項記載の機械翻訳方式。 8、上記パターン化された入力文中の指定された位置単
語に着目し、既に指定された位置単語をキーワードとし
てもつ登録済の典型パターンファイルを用いて、該単語
とファイル内のキーワードとを比較する手段を有するこ
とを特徴とする特許請求の範囲第1項記載の機械翻訳方
式。 9、上記入力文のパターンに対応して抽出した訳文パタ
ーン内の特別記号を、メモリ内の変数単語に置換する際
、変数単語の辞書引きを行い該変数単語の訳語を選出し
て、上記特別記号を該訳語に置換することによって、入
力文に対応した訳文を生成する手段を有することを特徴
とする特許請求の範囲第1項記載の機械翻訳方式。 10、上記入力文から抽出した変数単語に対して辞書引
きを行う際に、該変数単語の訳語を選出しメモリに記憶
させる手段と、上記入力文のパターンに対応して抽出し
た訳文パターン中の特別記号をメモリ内の該変数単語の
訳語に置換することにより、入力文に対応した訳語を生
成する手段を有することを特徴とする特許請求の範囲第
5項記載の機械翻訳方式。[Claims] 1. In a machine translation method that performs translation processing using data such as word information and grammatical rules registered in advance in a dictionary, "words consisting of numerical values" in an input text sentence to be translated means for patterning the input sentence by regarding it as a variable word and replacing it with a special symbol; means for temporarily storing the variable word in memory; and means for patterning the input sentence using an already registered typical pattern file. means for comparing and matching with a typical pattern; means for extracting a translation pattern corresponding to the matched typical pattern from the typical pattern file; and replacing special symbols in the extracted translation pattern with the variable word in memory. A machine translation method comprising means for generating a translated sentence corresponding to an input sentence. 2. means for displaying the pattern of the input sentence on a display device whenever the patterned input sentence does not match the already registered typical pattern; and a translated sentence pattern corresponding to the pattern of the input sentence. Claim 1 further includes means for inputting from an input device, and means for newly registering the pattern of the input sentence and the translated sentence pattern in the typical pattern file in correspondence with each other. machine translation method. 3. means for temporarily storing the pattern of the input sentence in memory and displaying it all at once on a display device when the patterned input sentence does not match the already registered typical pattern; , a means for inputting a translation pattern corresponding to the input sentence pattern from the input device, and a means for newly registering the input sentence pattern group and the translation pattern group in correspondence with each other in the typical pattern file. A machine translation method according to claim 1, characterized in that: 4. Paying attention to the uppercase/lowercase letters of each word in the input sentence, consider words in the input sentence that begin with a capital letter, excluding the first word, to be variable words and replace them with special symbols, and store the variable words in memory. 2. The machine translation method according to claim 1, further comprising means for patterning an input sentence by . 5. For the word extracted from the above input sentence, set the attribute condition of the word, look it up in a dictionary, check the attribute of the word, and then consider the word that matches the condition as a variable word and replace it with a special symbol. 5. The machine translation method according to claim 4, further comprising means for patterning an input sentence by storing variable words in a memory. 6. Focusing on the combinations of words in the input sentence above, consider the words located either before or after a specified word as variable words and replace them with special symbols, and store the variable words in memory. 2. The machine translation system according to claim 1, further comprising means for patterning input sentences by storing them. 7. Focusing on the first letter of the first word of the patterned input sentence, using a typical pattern file that has already been sorted in alphabetical order and registered, the first letter of each pattern in the file and the above input sentence are Claim 1, characterized in that it has means for comparing the first character of
Machine translation method described in section. 8. Focusing on the specified position word in the patterned input sentence, compare the word with the keyword in the file using a registered typical pattern file that already has the specified position word as a keyword. A machine translation system according to claim 1, characterized in that the machine translation system comprises means. 9. When replacing the special symbol in the translation pattern extracted corresponding to the input sentence pattern with the variable word in memory, look up the variable word in the dictionary, select the translation of the variable word, and replace the special symbol with the variable word in the memory. 2. The machine translation method according to claim 1, further comprising means for generating a translated sentence corresponding to an input sentence by replacing symbols with the translated word. 10. When performing a dictionary lookup for the variable word extracted from the input sentence, a means for selecting a translation of the variable word and storing it in memory; 6. The machine translation method according to claim 5, further comprising means for generating a translated word corresponding to the input sentence by replacing a special symbol with a translated word of the variable word in the memory.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63182709A JPH0232467A (en) | 1988-07-21 | 1988-07-21 | Machine translation method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63182709A JPH0232467A (en) | 1988-07-21 | 1988-07-21 | Machine translation method |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH0232467A true JPH0232467A (en) | 1990-02-02 |
Family
ID=16123063
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP63182709A Pending JPH0232467A (en) | 1988-07-21 | 1988-07-21 | Machine translation method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0232467A (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0477838A (en) * | 1990-07-13 | 1992-03-11 | Fujitsu Ltd | Abnormal message detection processing device |
EP0562818A2 (en) * | 1992-03-23 | 1993-09-29 | International Business Machines Corporation | System for pattern based text translation |
JPH06236395A (en) * | 1993-02-10 | 1994-08-23 | Nec Corp | Word processor with translation conversion function |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5731083A (en) * | 1980-07-31 | 1982-02-19 | Sharp Corp | Electronic interpreter |
JPS58175076A (en) * | 1982-04-07 | 1983-10-14 | Toshiba Corp | Processing device of natural language |
-
1988
- 1988-07-21 JP JP63182709A patent/JPH0232467A/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5731083A (en) * | 1980-07-31 | 1982-02-19 | Sharp Corp | Electronic interpreter |
JPS58175076A (en) * | 1982-04-07 | 1983-10-14 | Toshiba Corp | Processing device of natural language |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0477838A (en) * | 1990-07-13 | 1992-03-11 | Fujitsu Ltd | Abnormal message detection processing device |
EP0562818A2 (en) * | 1992-03-23 | 1993-09-29 | International Business Machines Corporation | System for pattern based text translation |
EP0562818A3 (en) * | 1992-03-23 | 1994-02-09 | Ibm | |
JPH06236395A (en) * | 1993-02-10 | 1994-08-23 | Nec Corp | Word processor with translation conversion function |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6269189B1 (en) | Finding selected character strings in text and providing information relating to the selected character strings | |
US5890103A (en) | Method and apparatus for improved tokenization of natural language text | |
US6539348B1 (en) | Systems and methods for parsing a natural language sentence | |
US5303150A (en) | Wild-card word replacement system using a word dictionary | |
JPS63231674A (en) | Word processing system | |
EP0686286A1 (en) | Text input transliteration system | |
JP2001043236A (en) | Synonym extracting method, document retrieving method and device to be used for the same | |
Doush et al. | A novel Arabic OCR post-processing using rule-based and word context techniques | |
JP5107556B2 (en) | Improved Chinese-English translation tool | |
Kazman | Structuring the text of the Oxford English Dictionary through finite state transduction | |
Yeshambel et al. | Evaluation of corpora, resources and tools for Amharic information retrieval | |
JPH0232467A (en) | Machine translation method | |
JPS6118072A (en) | Automatic registration method of dictionary data | |
Nguyen et al. | An in-depth analysis of OCR errors for unconstrained Vietnamese handwriting | |
JP3483585B2 (en) | Document search device and document search method | |
Pantelia | ‘Noûs, INTO CHAOS’: THE CREATION OF THE THESAURUS OF THE GREEK LANGUAGE | |
JP2002073656A (en) | Method and device for normalizing and developing different notation, method and device for retrieving document by using the method, and program recording medium | |
JPH10283368A (en) | Information processor and method therefor | |
KR20020059555A (en) | Searching engine and searching method | |
JPH07244669A (en) | Document retrieval system | |
JPH0258166A (en) | Knowledge search method | |
Alam et al. | Improving accessibility of archived raster dictionaries of complex script languages | |
JP3316884B2 (en) | Language translator | |
JPH11203281A (en) | Electronic dictionary retrieving device and medium stored with control program for the device | |
JPH02110771A (en) | Telegraph machine |