[go: up one dir, main page]

JP2001175655A - Machine translation equipment - Google Patents

Machine translation equipment

Info

Publication number
JP2001175655A
JP2001175655A JP35889099A JP35889099A JP2001175655A JP 2001175655 A JP2001175655 A JP 2001175655A JP 35889099 A JP35889099 A JP 35889099A JP 35889099 A JP35889099 A JP 35889099A JP 2001175655 A JP2001175655 A JP 2001175655A
Authority
JP
Japan
Prior art keywords
language
translation
conversion
unit
source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP35889099A
Other languages
Japanese (ja)
Inventor
Shunkitsu Kaku
俊桔 郭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP35889099A priority Critical patent/JP2001175655A/en
Publication of JP2001175655A publication Critical patent/JP2001175655A/en
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【課題】 コンピュータを使用して、表意言語間での入
力文書を自動的に翻訳する機械翻訳装置を提供する。 【解決手段】 ソース言語文をソース言語解析部でソー
ス言語品詞分解樹に品詞分解し、シンタクティック・セ
マンティック差異調整部がソース・オブジェクト言語間
のセマンティック、シンタクティック構造の差異を調整
し、翻訳言語選択部が品詞分解樹におけるそれぞれの単
一言語を順に検出する。次いで、未知語彙翻訳言語決定
部がそれらを英文字列に変換し、その他の言語の翻訳言
語参照辞書を参照して対応する言語及び関連する情報を
検出する。オブジェクト言語生成部が一つのオブジェク
ト言語文を生成した後に翻訳文が出力される。
(57) [Summary] [PROBLEMS] To provide a machine translation apparatus for automatically translating an input document between ideographic languages using a computer. A source language sentence is decomposed into a source language part-of-speech decomposition tree by a source language analysis unit, a syntactic / semantic difference adjustment unit adjusts semantic and syntactic structure differences between source object languages, and a translation language The selection unit sequentially detects each single language in the part-of-speech decomposition tree. Next, the unknown vocabulary translation language determination unit converts them into English character strings, and refers to the translation language reference dictionary of another language to detect the corresponding language and related information. After the object language generating unit generates one object language sentence, a translated sentence is output.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、未知語彙の翻訳に
関わる問題を解決するために、コンピュータを用いて入
力文書を翻訳し、翻訳の質を高める機械翻訳装置に関す
る。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a machine translation apparatus for translating an input document using a computer to improve the quality of translation, in order to solve a problem relating to translation of an unknown vocabulary.

【0002】[0002]

【従来の技術】20世紀は知識拡張の時代である。誰
も、社会から取り残されないように、大量の知識を蓄積
し続ける。しかしこれらの知識の源は必ずしも国内に由
来するとは限らない。新しい知識の大部分が国外からも
やってくる。そのため、外国語で文書を読むより母国語
で文書を読む方が容易であり、より能率が上がるので、
文書翻訳は重要である。文書翻訳の質と能率を改善する
ため、翻訳の仕事をするのに、人よりコンピュータを使
用するのが最近の傾向である。そのような翻訳装置は一
般に機械翻訳装置として知られている。そのような機械
翻訳装置において、翻訳されるべき入力言語はソース言
語として知られ、一方入力言語から翻訳された出力言語
はオブジェクト言語として知られている。例えば、日中
機械翻訳装置のソース言語は日本語であり、オブジェク
ト言語は中国語である。
2. Description of the Related Art The twentieth century is the age of knowledge expansion. Nobody continues to accumulate a great deal of knowledge so that it is not left behind by society. However, these sources of knowledge are not always domestic. Most of the new knowledge comes from abroad. Therefore, it is easier and more efficient to read documents in your native language than in foreign languages,
Document translation is important. To improve the quality and efficiency of document translation, the recent trend is to use computers rather than people to do the translation work. Such a translator is generally known as a machine translator. In such a machine translator, the input language to be translated is known as the source language, while the output language translated from the input language is known as the object language. For example, the source language of the Sino-Japanese machine translation device is Japanese, and the object language is Chinese.

【0003】一般的に言えば、機械翻訳装置は図12に
示されているように、本質的に、次の三つの部分を含
む。(1)ソース言語解析部:解析辞書を参照して、入
力言語から、形態解析及びシンタクティックかつセマン
ティック解析を通じて、依存性構造・品詞分解樹のよう
な品詞分解樹を形成する(変形し変形された関係が樹に
おける位置関係によって表現される)。(2)中間構造
変換部:差異調整変換辞書を参照して、ソース言語の品
詞分解樹(ソース言語中間構造としても知られている)
を調整し、オブジェクト言語中間構造に変換し、続いて
翻訳言語選択変換辞書を参照し、各ノードに対する翻訳
言語を逐次的に決定し、関連する情報を検索する。
(3)オブジェクト言語生成部:オブジェクト言語シン
タックスを参照して、オブジェクト言語中間構造から、
ノードに対する情報を逐次的に検出し、オブジェクト言
語文を生成する。単数及び複数形の処理、句読点の指定
のような、オブジェクト言語の形態処理が行われた後、
オブジェクト文が出力される。
Generally speaking, as shown in FIG. 12, a machine translation apparatus essentially includes the following three parts. (1) Source language analysis unit: forms a part-of-speech decomposition tree such as a dependency structure / part-of-speech decomposition tree from an input language by referring to an analysis dictionary through morphological analysis and syntactic and semantic analysis. Relationship is represented by a positional relationship in the tree). (2) Intermediate structure conversion unit: referring to the difference adjustment conversion dictionary, the part-of-speech decomposition tree of the source language (also known as the source language intermediate structure)
Is adjusted and converted into an object language intermediate structure. Then, the translation language for each node is sequentially determined by referring to the translation language selection conversion dictionary, and related information is searched.
(3) Object language generation unit: Referring to the object language syntax, from the object language intermediate structure,
Information for the nodes is sequentially detected to generate an object language sentence. After morphological processing of the object language, such as singular and plural processing and punctuation specification,
An object statement is output.

【0004】従来技術の一例が特許第2814634号
公報に開示されている。そのブロックダイアグラムを図
13に示す。図13に示したように、1は、ソース言語
語彙とそれに関連する情報を記憶する解析辞書を表す。
2は、ソース言語とオブジェクト言語の間のシンタクテ
ィック、セマンティック及び概念差異に関する情報を記
憶する差異調整変換辞書を表す。3は、ソース言語語
彙、及びオブジェクト言語の翻訳言語と関連する情報を
記憶する翻訳言語選択変換辞書を表す。10は、ソース
言語文を入力するための入力部を表す。
[0004] An example of the prior art is disclosed in Japanese Patent No. 2814634. The block diagram is shown in FIG. As shown in FIG. 13, reference numeral 1 denotes an analysis dictionary that stores source language vocabulary and information related thereto.
2 represents a difference adjustment translation dictionary that stores information on syntactic, semantic and conceptual differences between the source language and the object language. Reference numeral 3 denotes a translation language selection conversion dictionary that stores information related to the source language vocabulary and the translation language of the object language. Reference numeral 10 denotes an input unit for inputting a source language sentence.

【0005】15は、解析辞書1のシンタクティック及
びセマンティック情報を参照して、入力部10から入力
されたソース言語文を樹構造に品詞分解するためのソー
ス言語解析・中間構造生成部を表す。20は、差異調整
変換辞書2を参照して、ソース言語解析・中間構造生成
部15から入力されたソース言語中間構造をオブジェク
ト言語中間構造に変換するためのシンタクティック・セ
マンティック差異調整部を表す。25は、翻訳言語選択
変換辞書3とシンタクティック・セマンティック差異調
整部20から入力されたオブジェクト言語中間構造の付
随関係を参照して、各ノードを支配するセマンティック
支配符号とセマンティック符号を決定するためのセマン
ティック符号・セマンティック支配符号選択部を表す。
Reference numeral 15 denotes a source language analysis / intermediate structure generation unit for decomposing the source language sentence input from the input unit 10 into a part of speech with reference to the syntactic and semantic information of the analysis dictionary 1. Reference numeral 20 denotes a syntactic / semantic difference adjustment unit for converting the source language intermediate structure input from the source language analysis / intermediate structure generation unit 15 into an object language intermediate structure with reference to the difference adjustment conversion dictionary 2. Reference numeral 25 denotes a semantic dominating code that governs each node and a semantic code that determines the semantic code that governs each node with reference to the association between the translation language selection conversion dictionary 3 and the object language intermediate structure input from the syntactic and semantic difference adjusting unit 20. Represents a semantic code / semantic dominant code selector.

【0006】30は、翻訳言語選択変換辞書3を参照し
て、セマンティック符号・セマンティック支配符号選択
部25から入力されるオブジェクト言語中間構造の各ノ
ードのセマンティック支配符号とセマンティック符号を
探索キーとして利用し、各ノードに対するオブジェクト
言語翻訳言語を決定するための翻訳言語選択部を表す。
35は、オブジェクト言語中間構造が翻訳言語選択部3
0から入力された後、各ノードに対する情報とオブジェ
クト言語構造を参照して、オブジェクト言語文を生成す
るためのオブジェクト言語生成部を表す。
Reference numeral 30 refers to the translation language selection conversion dictionary 3 and uses the semantic dominant code and semantic code of each node of the object language intermediate structure input from the semantic code / semantic dominant code selecting unit 25 as search keys. , A translation language selection unit for determining an object language translation language for each node.
35 is the object language intermediate structure whose translation language selection unit 3
After input from 0, the object language generating unit for generating an object language sentence by referring to the information for each node and the object language structure.

【0007】40は、オブジェクト言語生成部35にお
いて生成されたオブジェクト言語文を関連する出力装置
に出力するための出力部を表す。45は中間処理結果を
格納するためのバッファ領域を表す。
Reference numeral 40 denotes an output unit for outputting the object language sentence generated by the object language generation unit 35 to an associated output device. Reference numeral 45 denotes a buffer area for storing intermediate processing results.

【0008】ソース文の品詞分解の間に解析辞書におい
て定義されていない語彙(一般に未知語彙として知られ
ている)がソース言語文に見つかれば、これらの未知語
彙に関してソース言語解析・中間構造生成部はこれら未
知語彙の品詞を予測するか、人によって指定されたもの
を利用して、従来技術の上記例に従って言語解析部の正
常な動作を維持する。しかし、翻訳言語を選択すると
き、翻訳言語選択辞書にそれ自身に対応する語彙見出し
がないので、それに対する翻訳言語が見つからない。そ
のため、ソース言語の語彙項目が翻訳言語にそのまま使
われる。一例として、日中機械翻訳を取れば、もし入力
日本語文が「この領域ではストレージと呼んでいる」で
あり、「ストレージ」が未知語彙であれば、翻訳結果は
「在這個領域中一般稱之為ストレージ」となる。その
他、日本電子情報電気通信協会によって編集され、オー
ム社によって出版された武則牧夫著「機械翻訳」におい
ては未知語彙は上記のように処理され記載がなされてい
る。
If a vocabulary that is not defined in the analysis dictionary (generally known as an unknown vocabulary) is found in the source language sentence during the part-of-speech decomposition of the source sentence, the source language analysis / intermediate structure generation unit performs processing on these unknown vocabulary. Predicts the part of speech of these unknown vocabularies or uses those specified by humans to maintain the normal operation of the linguistic analyzer in accordance with the above example of the prior art. However, when selecting a translation language, there is no vocabulary heading corresponding to itself in the translation language selection dictionary, so a translation language for it cannot be found. Therefore, the vocabulary item of the source language is used as it is in the translated language. As an example, if we take a Japanese-Chinese machine translation, if the input Japanese sentence is "This area is called storage" and if "Storage" is an unknown vocabulary, the translation result will be "General Storage ". In addition, in “Machine Translation” by Makio Takenori, edited by the Japan Electronic Information and Telecommunications Association and published by Ohmsha, the unknown vocabulary is processed and described as described above.

【0009】[0009]

【発明が解決しようとする課題】従来技術の上記機械翻
訳装置は下記の問題がある。 1.一般的に言えば、機械翻訳装置のユーザはソース言
語にそれほど堪能ではないので、もし翻訳されたテキス
トにソース言語が入り交じっていると、ユーザには何ら
役立つところがない。
The prior art machine translation apparatus has the following problems. 1. Generally speaking, users of machine translators are not very proficient in the source language, so if the translated text is intermingled with the source language, there is no use for the user.

【0010】2.ソース言語とオブジェクト言語が、中
国語にはBIG5符号、日本語にはシフトJIS符号と
いうように、同じ文字符号を使用するかもしれないの
で、同じ出力装置が同じ符号を区別することができな
い。そのため間違った文字を出力するかもしれない。こ
れは機械翻訳の質に対し大きなマイナス効果をもたら
す。 3.もしユーザが翻訳中に必要な情報を登録しなければ
ならないならば、自働機械翻訳能率が劇的に減少する。
[0010] 2. Since the source language and the object language may use the same character code such as BIG5 code for Chinese and Shift JIS code for Japanese, the same output device cannot distinguish the same code. It may output wrong characters. This has a significant negative effect on the quality of machine translation. 3. If the user has to register the necessary information during translation, the efficiency of automatic machine translation is dramatically reduced.

【0011】従って、本発明の主な目的は従来技術に伴
う上記のような問題点を克服することができる機械翻訳
装置を提供することである。
Accordingly, it is a primary object of the present invention to provide a machine translation apparatus which can overcome the above-mentioned problems associated with the prior art.

【0012】[0012]

【課題を解決するための手段】本発明によれば、本発明
に関わる機械翻訳装置は次の構成部分からなる:ソース
言語の各語彙項目、及び対応するシンタクティック・マ
ーカー、使用頻度、および語彙項目表音記号を格納する
ための解析辞書、変換前の主動詞、変換前の助動詞のク
ラス、変換前の他の項目集合、及び変換後の主動詞、変
換後の助動詞のクラス、及び変換後の他の項目集合を格
納するための差異調整変換辞書、ソース言語語彙項目、
シンタクティック・マーカー、セマンティック符号、及
び対応するオブジェクト言語翻訳言語を格納するための
翻訳言語選択変換辞書、ソース言語マーカー列、可能な
対応する英文字列、及びソース言語マーカー列と可能な
対応する英文字列にそれぞれ対応する重みを格納するた
めの英文字変換表、他の言語文字列、シンタクティック
・マーカー、及び対応するオブジェクト言語翻訳言語を
格納するための他の言語の翻訳言語参照辞書、入力部か
ら入力されたソース言語文に従って、解析辞書を参照し
て分節化過程を実行し関連する情報を検出し、さらにソ
ース言語シンタクティック・ルールを参照し、ソース言
語品詞分解樹を生成するためのソース言語解析部、ソー
ス言語品詞分解樹の主動詞に基づき、差異調整変換辞書
を参照して、変換前の主動詞、変換前の助動詞のクラ
ス、変換前の他の項目集合、及び変換後の主動詞、変換
後の助動詞のクラス、及び変換後の他の項目集合が見つ
けられた後、照合手段と置き換え手段を用いて、ソース
言語品詞分解樹を探索し、オブジェクト言語の樹状中間
構造に変換するためのシンタクティック・セマンティッ
ク差異調整部、逐次的に、各ノード及びそのシンタクテ
ィックかつセマンティック情報を、オブジェクト言語中
間構造から、探索項目として検出し、翻訳言語選択変換
辞書を参照して、対応する翻訳言語を検出するための翻
訳言語選択部、オブジェクト言語中間構造を探索して未
知語彙の語彙項目をそれぞれ検出し、英文字変換表を参
照して、すべての可能な英文字列及びれらの合併された
重みを検索した後、他の言語の翻訳言語参照辞書を参照
して、各英文字列を探索項目として用いて、最大の合併
された重みを持つ翻訳言語を検出するための未知語彙翻
訳言語決定部、そしてオブジェクト言語中間構造の各ノ
ード情報とソース言語シンタックスを参照して、ソース
言語文構造を順々に生成した後、線形接近法を用いて、
オブジェクト言語文を生成するためのオブジェクト言語
生成部。
According to the present invention, a machine translator according to the present invention comprises the following components: each vocabulary item in a source language, and corresponding syntactic markers, frequency of use, and vocabulary. Analysis dictionary for storing item phonetic symbols, main verb before conversion, class of auxiliary verb before conversion, other item set before conversion, main verb after conversion, class of auxiliary verb after conversion, and after conversion Difference adjustment conversion dictionary for storing other itemsets of the source language vocabulary items,
A translation language selection conversion dictionary for storing syntactic markers, semantic codes, and corresponding object language translation languages, source language marker sequences, possible corresponding English character strings, and source language marker sequences and corresponding corresponding English characters An English character conversion table for storing weights corresponding to the respective character strings, translation language reference dictionaries of other languages for storing other language character strings, syntactic markers, and corresponding object language translation languages, input According to the source language sentence input from the part, the segmentation process is executed by referring to the analysis dictionary to detect related information, and further, the source language syntactic rule is referred to generate the source language part-of-speech decomposition tree. Source language analysis unit, based on the main verb of the source language part-of-speech decomposition tree, refers to the difference adjustment conversion dictionary and converts After the main verb, the class of the auxiliary verb before the conversion, the other item set before the conversion, and the main verb after the conversion, the class of the auxiliary verb after the conversion, and the other item set after the conversion are found, the matching means Using replacement means, search the source language part-of-speech decomposition tree, syntactic semantic difference adjustment unit for converting to a tree-like intermediate structure of the object language, sequentially, each node and its syntactic and semantic information, A translation language selection unit for detecting as a search item from the object language intermediate structure, referring to the translation language selection conversion dictionary, and detecting a corresponding translation language, searching for an object language intermediate structure to find a vocabulary item of an unknown vocabulary After detecting each and referring to the English character conversion table to find all possible English character strings and their combined weights, By referring to the reference dictionary, using each English character string as a search item, an unknown vocabulary translation language determination unit for detecting a translation language having the largest merged weight, and each node information of the object language intermediate structure After sequentially generating source language sentence structures with reference to the source language syntax, using a linear approach,
An object language generator for generating an object language sentence.

【0013】本発明の機械翻訳装置によれば、ソース言
語文が入力部から入力されると、この文をソース言語解
析部が解析辞書を参照して、ソース言語品詞分解樹に品
詞分解する。シンタクティック・セマンティック差異調
整部が、差異調整変換辞書を参照して、ソース言語品詞
分解樹のソース言語に関連する差異を調整し、オブジェ
クト言語の樹状中間構造を形成した後、翻訳言語選択部
がオブジェクト言語の中間構造における各ノードのソー
ス言語語彙項目及び関連する情報を探索項目として用い
て翻訳言語選択変換辞書を参照して翻訳言語を検出す
る。
According to the machine translation apparatus of the present invention, when a source language sentence is input from the input unit, the source language analysis unit refers to the analysis dictionary and parses the sentence into a source language part-of-speech decomposition tree. The syntactic / semantic difference adjustment unit refers to the difference adjustment conversion dictionary, adjusts the difference related to the source language of the source language part-of-speech decomposition tree, and forms a tree-like intermediate structure of the object language. Uses the source language vocabulary item of each node in the intermediate structure of the object language and related information as a search item and refers to a translation language selection conversion dictionary to detect a translation language.

【0014】次いで、翻訳言語決定部が、ソース言語中
間構造の未知語彙項目を順番に検出し、このソース言語
中間構造を、英文字変換表を参照して、可能な英文字列
及び合併された重みに変換する。その後、オブジェクト
言語生成部が、オブジェクト言語中間構造とオブジェク
ト言語シンタックスを参照して、オブジェクト言語シン
タクティック樹を生成する。線形接近法を用いて、オブ
ジェクト言語文が得られた後、オブジェクト言語文は出
力部から出力される。
Next, the translation language determining unit sequentially detects the unknown vocabulary items of the source language intermediate structure, and refers to the alphabetical character conversion table to convert this source language intermediate structure into possible English character strings and merged. Convert to weight. Thereafter, the object language generating unit generates an object language syntactic tree with reference to the object language intermediate structure and the object language syntax. After the object language sentence is obtained using the linear approach, the object language sentence is output from the output unit.

【0015】[0015]

【発明の実施の形態】図1は、本発明に関わる日中機械
翻訳の好ましい実施例のシステム・ブロックダイアグラ
ムである。100はソース言語文を入力するための入力
部を表す。260は、ソース言語の各語彙項目、及び対
応するシンタクティック・マーカー、使用頻度、および
仮名表音記号を格納するための解析辞書を表す。解析辞
書260の図式的構造概念ダイアグラムは図7に示され
ている。200は,解析辞書260を参照して、入力部
100から入力されたソース言語文の分節化処理を実行
し、関連する情報を検出し、さらにソース言語シンタク
ティック・ルールを参照し、ソース言語品詞分解樹を生
成するためのソース言語解析部を表す。このプロセス・
フローチャートは図2に示されている。
FIG. 1 is a system block diagram of a preferred embodiment of Japanese-to-Japanese machine translation according to the present invention. 100 denotes an input unit for inputting a source language sentence. Reference numeral 260 represents an analysis dictionary for storing each vocabulary item of the source language, and corresponding syntactic markers, usage frequencies, and kana phonetic symbols. A schematic structural conceptual diagram of the analysis dictionary 260 is shown in FIG. 200 refers to the analysis dictionary 260, executes segmentation processing of the source language sentence input from the input unit 100, detects related information, further refers to the source language syntactic rule, and executes the source language part of speech. Represents a source language analyzer for generating a decomposition tree. This process
The flowchart is shown in FIG.

【0016】350は、変換前の主動詞、変換前の助動
詞のクラス、変換前の他の項目集合、及び変換後の主動
詞、変換後の助動詞のクラス、及び変換後の他の項目集
合を格納するための差異調整変換辞書を表す。差異調整
変換辞書350の図式的構造概念は図8に示されてい
る。300は、ソース言語品詞分解樹の主動詞に基づ
き、差異調整変換辞書350を参照して、変換前の主動
詞、変換前の助動詞のクラス、変換前の他の項目集合、
及び変換後の主動詞、変換後の助動詞のクラス、及び変
換後の他の項目集合が見つけられた後、照合手段と置き
換え手段を用いて、ソース言語品詞分解樹を探索し、オ
ブジェクト言語の樹状中間構造に変換するためのシンタ
クティック・セマンティック差異調整部を表す。
Reference numeral 350 denotes a main verb before conversion, a class of auxiliary verb before conversion, another item set before conversion, a main verb after conversion, a class of auxiliary verb after conversion, and another item set after conversion. Indicates a difference adjustment conversion dictionary to be stored. The schematic structural concept of the difference adjustment conversion dictionary 350 is shown in FIG. Reference numeral 300 denotes a main verb before conversion, a class of auxiliary verb before conversion, another item set before conversion, and
After the main verb after the conversion, the class of the auxiliary verb after the conversion, and the other item set after the conversion are found, the collating unit and the replacing unit are used to search the source language part-of-speech decomposition tree to find the object language tree. FIG. 9 shows a syntactic and semantic difference adjuster for converting to a symmetric intermediate structure. FIG.

【0017】450は、ソース言語語彙項目、シンタク
ティック・マーカー、セマンティック符号、及び対応す
るオブジェクト言語翻訳言語を格納するための翻訳言語
選択変換辞書を表す。翻訳言語選択変換辞書450の図
式的構造概念は図9に示されている。400は、逐次的
に、各ノード及びそのシンタクティックかつセマンティ
ック情報を、オブジェクト言語中間構造から、探索項目
として検出し、翻訳言語選択変換辞書450を参照し
て、対応する翻訳言語を検出するための翻訳言語選択部
を表す。このプロセス・フローチャートは図4に示され
ている。
Reference numeral 450 denotes a translation language selection conversion dictionary for storing source language vocabulary items, syntactic markers, semantic codes, and corresponding object language translation languages. The schematic structural concept of the translation language selection conversion dictionary 450 is shown in FIG. 400 sequentially detects each node and its syntactic and semantic information from the object language intermediate structure as a search item, and refers to the translation language selection conversion dictionary 450 to detect a corresponding translation language. Represents a translation language selection unit. This process flowchart is shown in FIG.

【0018】540は、ソース言語マーカー列、可能な
対応する英文字列、及びソース言語マーカー列と可能な
対応する英文字列にそれぞれ対応する重みを格納するた
めの英文字変換表を表す。英文字変換表540の図式的
構造概念は図10に示されている。550は、他の言語
文字列、シンタクティック・マーカー、及び対応するオ
ブジェクト言語翻訳言語を格納するための他の言語の翻
訳言語参照辞書を表す。他の言語の翻訳言語参照辞書5
50の図式的構造概念は図11に示されている。
Reference numeral 540 represents an English character conversion table for storing a source language marker string, a possible corresponding English character string, and a weight corresponding to each of the source language marker string and a possible corresponding English character string. The schematic structural concept of the English character conversion table 540 is shown in FIG. 550 represents a translation language reference dictionary of another language for storing other language strings, syntactic markers, and corresponding object language translation languages. Translation language reference dictionary 5 for other languages
The schematic structural concept of 50 is shown in FIG.

【0019】500は、オブジェクト言語中間構造を探
索して未知語彙の語彙項目をそれぞれ検出し、英文字変
換表540を参照して、すべての可能な英文字列及びれ
らの合併された重みを検索した後、他の言語の翻訳言語
参照辞書550を参照して、各英文字列を探索項目とし
て用いて、最大の合併された重みを持つ翻訳言語を検出
するための未知語彙翻訳言語決定部を表す。そのプロセ
ス・フローチャートは図5に示されている。
The search unit 500 searches the object language intermediate structure to detect vocabulary items of unknown vocabulary, and refers to the English character conversion table 540 to find all possible English character strings and their combined weights. After the search, referring to the translation language reference dictionary 550 of another language, using each English character string as a search item, an unknown vocabulary translation language determination unit for detecting a translation language having the maximum merged weight Represents The process flowchart is shown in FIG.

【0020】600は、オブジェクト言語中間構造の各
ノード情報とソース言語シンタックスを参照して、ソー
ス言語文構造を順々に生成した後、線形接近法を用い
て、オブジェクト言語文を生成するためのオブジェクト
言語生成部を表す。そのプロセス・フローダイアグラム
は図6に示されている。700は、例えばモニタから構
成される出力部を表す。800は、中間処理結果を格納
するためのバッファ領域を表す。
Reference numeral 600 denotes a method for sequentially generating source language sentence structures with reference to each node information of the object language intermediate structure and the source language syntax, and then generating an object language sentence using a linear approach. Represents an object language generation unit. The process flow diagram is shown in FIG. An output unit 700 includes, for example, a monitor. Reference numeral 800 denotes a buffer area for storing intermediate processing results.

【0021】図2は、ソース言語解析部のプロセス・フ
ローチャートである。ステップS201において、ソー
ス言語文が入力部100から入力された後、ステップS
205において、解析辞書260が参照され、形態解析
が行われる。ステップS210において、ソース言語の
セマンティック及びシンタクティック解析が、形態解析
の結果を用いて行われ、ソース言語フレーズ構造が生成
された後、ステップS215において、このソース言語
フレーズ構造は、例えば依存性構造・品詞分解樹の様
な、ソース言語品詞分解樹として知られているところの
ソース言語中間構造に変換される。本プロセスはステッ
プS215が実行された後終了する。
FIG. 2 is a process flowchart of the source language analysis unit. In step S201, after a source language sentence is input from the input unit 100,
At 205, the morphological analysis is performed with reference to the analysis dictionary 260. In step S210, the semantic and syntactic analysis of the source language is performed using the result of the morphological analysis, and the source language phrase structure is generated. In step S215, the source language phrase structure includes, for example, the dependency structure It is converted into a source language intermediate structure, known as a source language part-of-speech tree, such as a part-of-speech tree. The process ends after step S215 has been performed.

【0022】図3は、シンタクティック・セマンティッ
ク差異調整部のプロセス・フローチャートである。ステ
ップS301において、ソース言語中間構造がソース言
語解析部200から入力された後、ステップS305に
おいて、品詞分解樹の主動詞が探索項目として用いられ
て、差異調整変換辞書350が参照され、変換前と変換
後の情報が検出され、照合置換手段が用いられて、フレ
ーズ構造の差異が調整される。
FIG. 3 is a process flowchart of the syntactic semantic difference adjusting unit. In step S301, after the source language intermediate structure is input from the source language analysis unit 200, in step S305, the main verb of the part-of-speech decomposition tree is used as a search item, and the difference adjustment conversion dictionary 350 is referred to. The converted information is detected, and the difference in the phrase structure is adjusted by using the collating and replacing means.

【0023】その後、ステップS310において、品詞
分解樹の主要動詞が探索項目として用いられて、差異調
整変換辞書350が参照され、変換前と変換後の情報が
検出され、照合置換手段が用いられて概念の差異が調整
される。次いで、ステップS315において、品詞分解
樹の主要動詞が探索項目として用いられて、差異調整変
換辞書350が参照され、変換前と変換後の情報が検出
され、照合置換手段が用いられて、ソース言語の慣例句
(諺)が対応するオブジェクト言語の構造に変換され
る。本プロセスはステップS315の後終了する。
Thereafter, in step S310, the main verb of the part-of-speech decomposition tree is used as a search item, the difference adjustment conversion dictionary 350 is referred to, the information before and after conversion is detected, and the collating and replacing means is used. Conceptual differences are adjusted. Next, in step S315, the main verb of the part-of-speech decomposition tree is used as a search item, the difference adjustment conversion dictionary 350 is referred to, information before and after conversion is detected, and the collating and replacing unit is used to check the source language. Is translated into the corresponding object language structure. The process ends after step S315.

【0024】図4は、翻訳言語選択部のプロセス・フロ
ーチャートである。ステップS401において、ソース
言語中間構造がシンタクティック・セマンティック差異
調整部300から入力された後、ステップS405にお
いて、各ノードが上端から下端に向かって、左端から右
端に向かって、逐次的に検出される。それから、ステッ
プS410において、未処理のノードが存在するかどう
かが判定される。もし答えがノーであれば、ソース言語
がオブジェクト言語中間構造に変換され、本プロセスは
終了する。
FIG. 4 is a process flowchart of the translation language selection unit. After the source language intermediate structure is input from the syntactic and semantic difference adjusting unit 300 in step S401, in step S405, each node is sequentially detected from the upper end to the lower end and from the left end to the right end. . Then, in step S410, it is determined whether an unprocessed node exists. If the answer is no, the source language is converted to an object language intermediate structure and the process ends.

【0025】もしステップS410において、答えがイ
エスであれば、ステップS415において、翻訳言語選
択変換辞書450が、ソース言語語彙項目、語彙クラ
ス、及びセマンティック符号に基づいて、対応する翻訳
言語を見つけるため探索される。その後、ステップS4
20において、翻訳言語が存在するかどうかが判定され
る。もし答えがイエスであれば、本プロセスはステップ
S405に戻る。そうでなければ、プロセスはステップ
S425に進み、ソース言語の語彙項目が翻訳言語とし
て使用される。その後、本プロセスはステップS405
に戻る。
If the answer is yes in step S410, then in step S415, the translation language selection conversion dictionary 450 searches for a corresponding translation language based on the source language vocabulary item, vocabulary class, and semantic code. Is done. Then, step S4
At 20, it is determined whether a translated language is present. If the answer is yes, the process returns to step S405. Otherwise, the process proceeds to step S425, where the vocabulary item of the source language is used as the translation language. Thereafter, the process proceeds to step S405
Return to

【0026】図5は、未知語彙翻訳言語決定部のプロセ
ス・フローチャートである。ステップS501におい
て、オブジェクト言語中間構造が、翻訳言語選択部40
0から入力された後、ステップS505において、未処
理ノード(すなわちその翻訳言語がオブジェクト言語で
はない)が、上端から下端に向かって、左端から右端に
向かって、逐次的に検出される。それから、本プロセス
はステップS510に進み、未処理のノードが存在する
かどうかが判定される。もし答えがノーであれば、本プ
ロセスは終了する。
FIG. 5 is a process flowchart of the unknown vocabulary translation language determination unit. In step S501, the object language intermediate structure is
After input from 0, in step S505, unprocessed nodes (that is, the translation language is not an object language) are sequentially detected from the upper end to the lower end, from the left end to the right end. Then, the process proceeds to step S510, where it is determined whether there is an unprocessed node. If the answer is no, the process ends.

【0027】そうでなければ、ステップS515におい
て、このノードが処理されるべき未知語彙であるかどう
かが判定される。もし答えがノーであれば、本プロセス
はステップS505に戻る。もし答えがイエスであれ
ば、本プロセスはステップS520に進み、このノード
が片仮名の未知語彙であるかどうかが判定される。もし
ノーであれば、本プロセスはステップS505に戻る。
もしイエスであれば、本プロセスはステップS525に
進み、この片仮名を探索項目として、英文字変換表54
0が参照され、すべての可能な英文字列候補及びそれら
の合併された重みが検出される。
Otherwise, in step S515, it is determined whether this node is an unknown vocabulary to be processed. If the answer is no, the process returns to step S505. If the answer is yes, the process proceeds to step S520, and it is determined whether or not this node is a katakana unknown vocabulary. If no, the process returns to step S505.
If yes, the process proceeds to step S525, in which the katakana is set as a search item and the English character conversion table 54 is used.
0 is referenced to find all possible English string candidates and their merged weights.

【0028】その後、ステップS530において、各候
補英文字列の処理(例えば、反復日本語子音に関して
は、対応する英文字は一度だけ繰り返されなければなら
ない)が実行される。それから、ステップS535にお
いて、各候補英文字列とシンタクティック・マーカーを
探索項目として、他の言語の翻訳言語参照辞書550が
参照され、対応する翻訳言語が検出される。ステップS
535の後、ステップS540において、翻訳言語を持
った候補文字列が「0」であるかどうかが判定される。
もしイエスであれば、ステップS550において、比較
手段によって、最大の重みを持った英文字列Aが決定さ
れる。それから、ステップS555において、この文字
列Aが翻訳言語を持つかどうかが判定される。もし、文
字列Aが翻訳言語を持たなければ、ステップS560に
おいて、文字列Aが翻訳言語として、対応するノードに
格納され、本プロセスは、引き続く処理のためステップ
S505に戻る。
Thereafter, in step S530, processing of each candidate English character string (eg, for repeated Japanese consonants, the corresponding English character must be repeated only once) is performed. Then, in step S535, the translation language reference dictionary 550 of another language is referred to using each candidate English character string and syntactic marker as search items, and the corresponding translation language is detected. Step S
After 535, it is determined in step S540 whether or not the candidate character string having the translation language is “0”.
If yes, in step S550, the comparing means determines the English character string A having the largest weight. Then, in step S555, it is determined whether or not the character string A has a translation language. If the character string A does not have a translation language, in step S560, the character string A is stored in the corresponding node as a translation language, and the process returns to step S505 for subsequent processing.

【0029】もし,ステップS555において、文字列
Aが翻訳言語を持つならば、ステップS565におい
て、この翻訳言語が対応するノードに格納され、本プロ
セスは引き続く処理のため、ステップS505に進む。
もし、ステップS540において、翻訳言語を持った候
補文字列が「0」でなければ、ステップS545におい
て、候補英文字列が「1」であるかどうかが判定され
る。もし答えがノーであれば、本プロセスはステップS
550に進む。そうでなければ、本プロセスはステップ
S565に進む。
If the character string A has a translation language in step S555, this translation language is stored in the corresponding node in step S565, and the process proceeds to step S505 for subsequent processing.
If the candidate character string having the translation language is not “0” in step S540, it is determined in step S545 whether the candidate English character string is “1”. If the answer is no, the process proceeds to step S
Proceed to 550. Otherwise, the process proceeds to step S565.

【0030】図6は、オブジェクト言語生成部のプロセ
ス・フローチャートである。ステップS601におい
て、オブジェクト言語中間構造が未知語彙翻訳言語決定
部500から入力された後、ステップS605におい
て、名詞節、動詞節、分詞節等の種々のオブジェクト言
語節が、オブジェクト言語中間構造に基づいて生成され
る。その後、ステップS610において、オブジェクト
言語文が参照されて一つの単文が生成される。
FIG. 6 is a process flowchart of the object language generator. In step S601, after the object language intermediate structure is input from the unknown vocabulary translation language determining unit 500, in step S605, various object language clauses such as noun clauses, verb clauses, and participle clauses are converted based on the object language intermediate structure. Generated. Then, in step S610, one simple sentence is generated by referring to the object language sentence.

【0031】次いで、ステップS615において、この
単文が参照されて、複文が生成される。ステップS61
5の後、ステップS620において、オブジェクト言語
及び、そのノードの関連する諸性質が参照され、命令
節、受動節、等のオブジェクト言語特別節が生成され
る。それから、ステップS625において、標準記号
が、オブジェクト言語文において生成された後、オブジ
ェクト言語が、線形接近法によって、オブジェクト言語
フレーズ構造から検出され本プロセスは終了する。
Next, in step S615, this single sentence is referred to to generate a compound sentence. Step S61
After step 5, in step S620, the object language and the related properties of the node are referred to, and special object language clauses such as a command clause and a passive clause are generated. Then, in step S625, after the standard symbols are generated in the object language sentence, the object language is detected from the object language phrase structure by the linear approach, and the process ends.

【0032】本発明の日中翻訳の好ましい実施例の動作
を、次の例においてさらに説明する。一つの日本語文
「この領域ではストレージと呼んでいる」が、入力部1
00から入力される。それから、ソース言語解析部20
0において、解析辞書が参照され、品詞分解プロセスが
実行された後、依存性構造によって、[表1]に示したソ
ース言語中間結果が得られる。各ノードの、語彙クラ
ス、セマンティック符号、助動詞、助詞、格マーカー等
の、関連情報は、この依存性構造において、括弧の中に
示されている。
The operation of the preferred embodiment of the Japanese-Chinese translation of the present invention is further described in the following example. One Japanese sentence “This area is called storage” is input unit 1
Input from 00. Then, the source language analysis unit 20
At 0, after the parsing dictionary is referenced and the part-of-speech decomposition process is performed, the dependency structure yields the source language intermediate results shown in [Table 1]. Relevant information for each node, such as vocabulary class, semantic code, auxiliary verb, particle, case marker, etc., is shown in parentheses in this dependency structure.

【0033】[0033]

【表1】 [Table 1]

【0034】その後、差異構造の調整がシンタクティッ
ク・セマンティック差異調整部300によって実行され
る。差異調整変換辞書350が参照され、構造の調整は
不要であると判定される。この中間構造の各ノードの日
本語語彙項目及びシンタクティックかつセマンティック
情報が探索項目として用いられて、翻訳言語選択変換辞
書450が参照され、翻訳言語選択部400から対応す
る翻訳言語が逐次的に検出される。従って、[表2]に示
したオブジェクト言語中間構造が得られる。。
Thereafter, the adjustment of the difference structure is executed by the syntactic / semantic difference adjustment unit 300. The difference adjustment conversion dictionary 350 is referred to, and it is determined that the structure adjustment is unnecessary. Using the Japanese vocabulary item and syntactic and semantic information of each node of this intermediate structure as search items, the translation language selection conversion dictionary 450 is referred to, and the corresponding translation language is sequentially detected from the translation language selection unit 400. Is done. Accordingly, the object language intermediate structure shown in [Table 2] is obtained. .

【0035】[0035]

【表2】 [Table 2]

【0036】その後、未知語彙翻訳言語決定部500に
おいて、未知語彙ノード(ストレージ)が中間言語構造
を探索することによって発見される。その可能な英文字
列及び、重みはこの語彙項目を探索項目として、英文字
変換表540が参照されて、次のように得られる。
Thereafter, in the unknown vocabulary translation language determining section 500, the unknown vocabulary node (storage) is found by searching the intermediate language structure. The possible English character strings and weights are obtained as follows by referring to the English character conversion table 540 using this vocabulary item as a search item.

【0037】ス → s2 ト → t2、to1 レ → la 2, le, 1, ra 1, ra
i 0 ジ → g 2, ge 1, di 0
S → s2 → t2, to1 → la2, le, 1, ra1, ra
i0 di → g2, ge1, di0

【0038】候補文字列及び合併された重みは、上に示
された英文字列の結合から得られ、下に示されている。 stlag 8, stlage 7, stladi
6,stleg 7, stlege 6, stl
edi 5,strag 7, strage 6,
stradi 5,straig 6, straig
e 5, straidi 4,stolag 7,
stolage 6, stolade 5,stol
eg 6, stolage 5, dtoladi
5,storag 6, storage 5, st
oradi 4,storaig 5, storai
ge 4, storaidi 3.
The candidate strings and the merged weights are obtained from combining the English strings shown above and are shown below. stag 8, stag 7, stladi
6, stage 7, stage 6, stl
edi 5, storage 7, storage 6,
strati 5, straig 6, straig
e 5, straidi 4, stolag 7,
storage 6, storage 5, stol
eg 6, storage 5, dtoladi
5, storage 6, storage 5, st
oradi 4, storage5, storage
ge 4, storaidi 3.

【0039】次に、上に示した英文字列を探索項目とし
て、他の言語の翻訳言語参照辞書550が参照され、た
だ「storage」のみが翻訳言語として指定されて
いる「記憶體」に翻訳することができるこが発見され
る。従って、オブジェクト言語中間言語は[表3]に示す
ように変化する。
Next, using the English character string shown above as a search item, a translation language reference dictionary 550 of another language is referred to, and only "storage" is translated into "memory" designated as a translation language. Discover what you can do. Therefore, the object language intermediate language changes as shown in [Table 3].

【0040】[0040]

【表3】 [Table 3]

【0041】 続いて、オブジェクト言語中間構造及び
中国語シンタックスが参照されて、オブジェクト言語生
成部600において中国語フレーズ構造が生成される。
それから、指示代名詞「這」の数量詞「個」及び格マー
カー「loc」と「opponent」の不変化詞
「在」と「為」が生成され、翻訳された中国文「在這個
領域稱為記憶體」が線形接近法(リーフノードの中国語
翻訳言語を左から右に向かって順に検出すること)を用
いて得られる。最後に、中国語文が出力部700から出
力される。
Subsequently, with reference to the object language intermediate structure and the Chinese syntax, the object language generation unit 600 generates a Chinese phrase structure.
Then, the quantifier "individual" of the demonstrative pronoun "craw" and the invariants "in" and "in" of the case markers "loc" and "opponent" are generated and translated into the translated Chinese sentence "in crawling individual area name storage memory". Is obtained using the linear approach (detecting the Chinese translation languages of leaf nodes in order from left to right). Finally, the Chinese sentence is output from the output unit 700.

【0042】[0042]

【発明の効果】以上のことから、本発明の機械翻訳装置
は、従来技術に伴う問題を克服することができる。すな
わち、本発明の利点は: (1)未知語彙の翻訳言語を、オブジェクト言語または
英文字列を使用して翻訳することができるので、ソース
テキストに不慣れなユーザがソーステキストを容易に理
解することができる。このことは自動機械翻訳の質を劇
的に改善する。 (2)未知語彙の翻訳言語はオブジェジェクト言語また
は英文字列を用いて翻訳されるので、出力の間に符号領
域における衝突によって、間違った文字が出力されるこ
とはない。従って、出力の質が大いに改善される。 (3)未知言語の処理のため手作業が不要なため、自働
機械翻訳の能率が劇的に増加する。
As described above, the machine translation apparatus of the present invention can overcome the problems associated with the prior art. That is, the advantages of the present invention are as follows: (1) A translation language of an unknown vocabulary can be translated using an object language or an English character string, so that a user unfamiliar with the source text can easily understand the source text. Can be. This dramatically improves the quality of automatic machine translation. (2) Since the translation language of an unknown vocabulary is translated using an object language or an English character string, a wrong character is not output due to a collision in a code area during output. Thus, the output quality is greatly improved. (3) The efficiency of automatic machine translation is dramatically increased because no manual work is required for processing unknown languages.

【0043】以上、本発明を最も実用的であり好ましい
実施例と見なされるものに関して説明したが、本発明は
開示した実施例に限定されるものではなく、最も幅広い
解釈の精神と範囲に含み得る種々の改変、および同等な
改変を包括するものと意図している。例えば、重みの動
的な計算を、重みの静的な計算の代わりに用いることが
できる。
While the present invention has been described in terms of what is considered to be the most practical and preferred embodiment, the present invention is not limited to the disclosed embodiment, but may be within the broadest spirit and scope of interpretation. It is intended to cover various modifications and equivalent modifications. For example, a dynamic calculation of weights can be used instead of a static calculation of weights.

【図面の簡単な説明】[Brief description of the drawings]

【図1】 本発明に関わる好ましい実施例のシステム・
ブロック図を示す。
FIG. 1 shows a system according to a preferred embodiment of the present invention;
FIG.

【図2】 本発明の好ましい実施例に関わるソース言語
解析部のプロセス・フローチャートを示す。
FIG. 2 shows a process flowchart of a source language analysis unit according to a preferred embodiment of the present invention.

【図3】 本発明の好ましい実施例に関わるシンタクテ
ィック・セマンティック差異調整部のプロセス・フロー
チャートを示す。
FIG. 3 shows a process flow chart of a syntactic semantic difference adjuster according to a preferred embodiment of the present invention.

【図4】 本発明の好ましい実施例に関わる翻訳言語選
択部のプロセス・フローチャートを示す。
FIG. 4 shows a process flowchart of a translation language selection unit according to a preferred embodiment of the present invention.

【図5】 本発明の好ましい実施例に関わる未知語彙翻
訳言語決定部のプロセス・フローチャートを示す。
FIG. 5 shows a process flowchart of an unknown vocabulary translation language determination unit according to a preferred embodiment of the present invention.

【図6】 本発明の好ましい実施例に関わるオブジェク
ト言語生成部のプロセス・フローチャートを示す。
FIG. 6 shows a process flowchart of an object language generator according to a preferred embodiment of the present invention.

【図7】 本発明の好ましい実施例に関わる解析辞書の
構造を示す概略図である。
FIG. 7 is a schematic diagram showing a structure of an analysis dictionary according to a preferred embodiment of the present invention.

【図8】 本発明の好ましい実施例に関わる差異調整変
換辞書の構造を示す概略図である。
FIG. 8 is a schematic diagram showing a structure of a difference adjustment conversion dictionary according to a preferred embodiment of the present invention.

【図9】 本発明の好ましい実施例に関わる翻訳言語選
択変換辞書の構造を示す概略図である。
FIG. 9 is a schematic diagram showing a structure of a translation language selection conversion dictionary according to a preferred embodiment of the present invention.

【図10】 本発明の好ましい実施例に関わる英文字変
換表の構造を示す概略図である。
FIG. 10 is a schematic diagram showing a structure of an English character conversion table according to a preferred embodiment of the present invention.

【図11】 本発明の好ましい実施例に関わる他の言語
の翻訳言語参照辞書の構造を示す概略図である。
FIG. 11 is a schematic diagram showing a structure of a translation language reference dictionary of another language according to the preferred embodiment of the present invention.

【図12】 従来の機械翻訳装置の構造を示すブロック
図である。
FIG. 12 is a block diagram showing the structure of a conventional machine translation device.

【図13】 従来の機械翻訳装置のシステム・ブロック
図を示す。
FIG. 13 shows a system block diagram of a conventional machine translation apparatus.

【符号の説明】[Explanation of symbols]

100 入力部 260 解析辞
書 200 ソース言語解析部 350 差異調
整変換辞書 300 シンタクティック・セマンティック差異調整部 450 翻訳言語選択変換辞書 400 翻訳言
語選択部 540 英文字変換表 550 他の言
語の翻訳言語参照辞書 500 未知語彙翻訳言語決定部 600 オブジ
ェクト言語生成部 700 出力部 800 バッフ
ァ領域
REFERENCE SIGNS LIST 100 Input unit 260 Analysis dictionary 200 Source language analysis unit 350 Difference adjustment conversion dictionary 300 Syntactic / semantic difference adjustment unit 450 Translation language selection conversion dictionary 400 Translation language selection unit 540 English character conversion table 550 Translation language reference dictionary for other languages 500 Unknown vocabulary translation language determination unit 600 Object language generation unit 700 Output unit 800 Buffer area

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】 入力部と記憶部と出力部とを有する機械
翻訳装置であって、 ソース言語の各語彙項目、及び対応するシンタクティッ
ク・マーカー、使用頻度、および語彙項目表音記号を格
納するための解析辞書、 変換前の主動詞、変換前の助動詞のクラス、変換前の他
の項目集合、及び変換後の主動詞、変換後の助動詞のク
ラス、及び変換後の他の項目集合を格納するための差異
調整変換辞書、 ソース言語語彙項目、シンタクティック・マーカー、セ
マンティック符号、及び対応するオブジェクト言語翻訳
言語を格納するための翻訳言語選択変換辞書、ソース言
語マーカー列、可能な対応する英文字列、及びソース言
語マーカー列と可能な対応する英文字列にそれぞれ対応
する重みを格納するための英文字変換表、 他の言語文字列、シンタクティック・マーカー、及び対
応するオブジェクト言語翻訳言語を格納するための他の
言語の翻訳言語参照辞書、 前記入力部から入力されたソース言語文に従って、前記
解析辞書を参照して分節化過程を実行し関連する情報を
検出し、さらにソース言語シンタクティック・ルールを
参照し、ソース言語品詞分解樹を生成するためのソース
言語解析部、 前記ソース言語品詞分解樹の主動詞に基づき、前記差異
調整変換辞書を参照して、変換前の主動詞、変換前の助
動詞のクラス、変換前の他の項目集合、及び変換後の主
動詞、変換後の助動詞のクラス、及び変換後の他の項目
集合が見つけられた後、照合手段と置き換え手段を用い
て、前記ソース言語品詞分解樹を探索し、オブジェクト
言語の樹状中間構造に変換するためのシンタクティック
・セマンティック差異調整部、 逐次的に、各ノード及びそのシンタクティックかつセマ
ンティック情報を、オブジェクト言語の前記樹状中間構
造から、探索項目として検出し、前記翻訳言語選択変換
辞書を参照して、対応する翻訳言語を検出するための翻
訳言語選択部、 オブジェクト言語の前記樹状中間構造を探索して未知語
彙の語彙項目をそれぞれ検出し、前記英文字変換表を参
照して、すべての可能な英文字列及びれらの合併された
重みを検索した後、前記他の言語の翻訳言語参照辞書を
参照して、各英文字列を探索項目として用いて、最大の
合併された重みを持つ翻訳言語を検出するための未知語
彙翻訳言語決定部、 オブジェクト言語の前記樹状中間構造の各ノード情報と
ソース言語シンタックスを参照して、ソース言語文構造
を順々に生成した後、線形接近法を用いて、オブジェク
ト言語文を生成するためのオブジェクト言語生成部から
構成されてなる機械翻訳装置。
1. A machine translation apparatus having an input unit, a storage unit, and an output unit, and stores each vocabulary item of a source language, a corresponding syntactic marker, a use frequency, and a vocabulary item phonetic symbol. For analysis, main verb before conversion, class of auxiliary verb before conversion, other item set before conversion, main verb after conversion, class of auxiliary verb after conversion, and other item set after conversion Translation dictionary, source language vocabulary item, syntactic marker, semantic code, and translation language selection translation dictionary for storing the corresponding object language translation language, source language marker sequence, possible corresponding English characters Conversion table for storing the weights corresponding to the columns and the corresponding corresponding English character strings with the source language marker strings, other language character strings, A translation language reference dictionary of another language for storing a tick marker and a corresponding object language translation language; and performing a segmentation process by referring to the analysis dictionary according to a source language sentence input from the input unit. A source language analysis unit for detecting relevant information, further referring to source language syntactic rules, and generating a source language part-of-speech decomposition tree, based on the main verb of the source language part-of-speech decomposition tree, To find the main verb before conversion, the class of auxiliary verb before conversion, other itemsets before conversion, the main verb after conversion, the class of auxiliary verbs after conversion, and other itemsets after conversion. After that, a syntactic and a syntactic method for searching the source language part-of-speech decomposition tree using a matching unit and a replacing unit and converting it into a tree-like intermediate structure of an object language are used. A mantic difference adjustment unit, sequentially detecting each node and its syntactic and semantic information as a search item from the tree-like intermediate structure of the object language, and referring to the translation language selection conversion dictionary, A translation language selection unit for detecting a translation language, searching the tree-like intermediate structure of the object language to detect a vocabulary item of an unknown vocabulary, and referring to the English character conversion table to find all possible English characters After searching the columns and the merged weights of these, the translation language having the maximum merged weight is determined by using each English character string as a search item by referring to the translation language reference dictionary of the other language. An unknown vocabulary translation language determining unit for detecting, referring to each node information of the tree-like intermediate structure of the object language and a source language syntax, sequentially converting a source language sentence structure; After produced, using a linear approach, consisting consist object language generation unit for generating an object language sentence translation apparatus.
JP35889099A 1999-12-17 1999-12-17 Machine translation equipment Pending JP2001175655A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP35889099A JP2001175655A (en) 1999-12-17 1999-12-17 Machine translation equipment

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP35889099A JP2001175655A (en) 1999-12-17 1999-12-17 Machine translation equipment

Publications (1)

Publication Number Publication Date
JP2001175655A true JP2001175655A (en) 2001-06-29

Family

ID=18461637

Family Applications (1)

Application Number Title Priority Date Filing Date
JP35889099A Pending JP2001175655A (en) 1999-12-17 1999-12-17 Machine translation equipment

Country Status (1)

Country Link
JP (1) JP2001175655A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109829173A (en) * 2019-01-21 2019-05-31 中国测绘科学研究院 A kind of English place name interpretation method and device

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109829173A (en) * 2019-01-21 2019-05-31 中国测绘科学研究院 A kind of English place name interpretation method and device
CN109829173B (en) * 2019-01-21 2023-09-29 中国测绘科学研究院 A method and device for translating English place names

Similar Documents

Publication Publication Date Title
JP4544674B2 (en) A system that provides information related to the selected string
JP2515726B2 (en) Information retrieval method and device
US20070021956A1 (en) Method and apparatus for generating ideographic representations of letter based names
US20070011132A1 (en) Named entity translation
JP2000132550A (en) Chinese language generator for machine translation
JP2005520251A (en) Translate named entities
WO2003056450A1 (en) Syntax analysis method and apparatus
Sawalha et al. Fine-grain morphological analyzer and part-of-speech tagger for Arabic text
Uchimoto et al. Text generation from keywords
JPH0981568A (en) Chinese generator for machine translation
CN100454294C (en) Equipment for translating Japanese into Chinese
JP2001175655A (en) Machine translation equipment
Tsai et al. Applying an NVEF Word-Pair Identifier to the Chinese Syllable-to-Word Conversion Problem
Lin et al. A mandarin to taiwanese min nan machine translation system with speech synthesis of taiwanese min nan
Xu et al. Partitioning parallel documents using binary segmentation
JP4635585B2 (en) Question answering system, question answering method, and question answering program
May et al. Surprise! What's in a Cebuano or Hindi Name?
Szpektor et al. Cross lingual and semantic retrieval for cultural heritage appreciation
JP5039114B2 (en) Machine translation apparatus and program
JP4262529B2 (en) Full-text search device, method, program, and recording medium
Samir et al. Training and evaluation of TreeTagger on Amazigh corpus
JP4812811B2 (en) Machine translation apparatus and machine translation program
JP2005275524A (en) Retrieval request understanding keyword extension system using co-occurrence verb information
JPH0561902A (en) Mechanical translation system
JP3680489B2 (en) Machine translation apparatus and computer-readable recording medium recording machine translation processing program