[go: up one dir, main page]

JPH05120336A - Machine translation communication system - Google Patents

Machine translation communication system

Info

Publication number
JPH05120336A
JPH05120336A JP3284467A JP28446791A JPH05120336A JP H05120336 A JPH05120336 A JP H05120336A JP 3284467 A JP3284467 A JP 3284467A JP 28446791 A JP28446791 A JP 28446791A JP H05120336 A JPH05120336 A JP H05120336A
Authority
JP
Japan
Prior art keywords
unknown word
server computer
file
client computer
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3284467A
Other languages
Japanese (ja)
Inventor
Hideki Yamamoto
秀樹 山本
Hisaaki Matsushita
久明 松下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP3284467A priority Critical patent/JPH05120336A/en
Publication of JPH05120336A publication Critical patent/JPH05120336A/en
Pending legal-status Critical Current

Links

Landscapes

  • Information Transfer Between Computers (AREA)
  • Computer And Data Communications (AREA)
  • Machine Translation (AREA)

Abstract

PURPOSE:To realize the machine translation communication system which can improve operation convenience of users by reducing communication quantity until obtaining the final translated result completely composed of translated words rather than the conventional quantity even when a source sentence contains unknown words. CONSTITUTION:When the source sentence contains the unknown words unregistered on dictionary files 13 and 14, a server computer 3 transmits the unknown words and a source sentence document ID to a client computer 2 while storing the source sentence in a source sentence file 11 as it is. The client computer 2 fetches unknown word registration information, which is required for registering the received unknown words on the user dictionary file 14, by an unknown word registration part 7 and transmits the fetched information to the server computer 3 together with the source sentence document ID. After the received unknown word registration information is registered on the user dictionary file 14, the server computer retrieves the source sentence of the received ID from the source sentence file 11, translates the source sentence by a machine translation part 12 and transmits the translated result to the client computer 2.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、ある計算機がネットワ
ークを介して接続された他の計算機に翻訳を依頼して翻
訳結果を受け取る機械翻訳通信システムに関するもので
ある。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a machine translation communication system in which a computer requests another computer connected via a network for translation and receives a translation result.

【0002】[0002]

【従来の技術】機械翻訳装置が発達してきたが、そのシ
ステムや辞書を搭載するには能力が不足の計算機が多
く、また、機械翻訳装置もまだまだ高価なものである。
そこで、機械翻訳装置を搭載した計算機(以下、サーバ
計算機と呼ぶ)を、コンピュータネットワークのノード
としておき、機械翻訳装置を搭載していない他の計算機
(以下、クライアント計算機と呼ぶ)がこのサーバ計算
機に翻訳を依頼して翻訳結果を受け取る機械翻訳通信シ
ステムが既に提案されている。例えば、文献『西野文
人、中村直人共著、「機械翻訳電子メールシステム」、
情報処理学会研究会報告、自然言語処理75−5、19
90年1月18日』に機械翻訳通信システムが既に開示
されている。
2. Description of the Related Art Although a machine translation device has been developed, many computers lack the ability to mount the system and a dictionary, and the machine translation device is still expensive.
Therefore, a computer equipped with a machine translation device (hereinafter referred to as a server computer) is set as a node of a computer network, and another computer not equipped with a machine translation device (hereinafter referred to as a client computer) becomes this server computer. A machine translation communication system has already been proposed which requests a translation and receives a translation result. For example, "Fumito Nishino and Naoto Nakamura," Machine Translation E-mail System ",
IPSJ Technical Report, Natural Language Processing 75-5, 19
A machine translation communication system has already been disclosed in "January 18, 1990".

【0003】この文献に記載のものは、クライアント計
算機が翻訳したい文書を予めファイルとして持ってお
き、そのファイルを電子メールでサーバ計算機に送り、
サーバ計算機が送られた文書を翻訳して翻訳結果を送り
主であるクライアント計算機に電子メールで返信するも
のである。
The document described in this document holds a document to be translated by the client computer in advance as a file, and sends the file to the server computer by e-mail.
The server computer translates the sent document and sends the translation result back to the client computer as the sender by e-mail.

【0004】[0004]

【発明が解決しようとする課題】しかしながら、従来の
機械翻訳通信システムでは、クライアント計算機が送っ
た文章の中にサーバ計算機の機械翻訳装置の辞書に含ま
れていない単語(未知語)があった場合に、サーバ計算
機の機械翻訳装置は、その未知語又はその未知語を含む
文を翻訳できないまま、クライアント計算機に翻訳結果
を返送してしまう。このとき、クライアント計算機を操
作するユーザは、返送されてきた翻訳結果を見て初めて
サーバ計算機の機械翻訳装置の辞書に登録されていない
未知語があることが認識し、その未知語をサーバ計算機
の機械翻訳装置に登録する操作を行ない、その後に再び
翻訳を希望する文書を送り直すことを行なっていた。
However, in the conventional machine translation communication system, when a sentence sent by the client computer includes a word (unknown word) that is not included in the dictionary of the machine translation device of the server computer. In addition, the machine translation device of the server computer returns the translation result to the client computer without being able to translate the unknown word or the sentence including the unknown word. At this time, the user operating the client computer recognizes that there is an unknown word not registered in the dictionary of the machine translation device of the server computer for the first time after seeing the returned translation result, and the unknown word is stored in the server computer. The operation of registering in the machine translation device was performed, and then the document desired to be translated was sent again.

【0005】従って、以下のような問題が生じていた。 (1) クライアント計算機は、同じ文書を2度サーバ計算
機に送らなければならないため、通信効率が悪く通信コ
ストが高くなってしまう。 (2) サーバ計算機も、辞書の登録の前後で翻訳結果を2
度クライアント計算機に送ることになり、通信効率が悪
く通信コストが高くなってしまう。 (3) クライアント計算機側で、ユーザが返送されてきた
翻訳結果の全文を見てサーバ計算機の機械翻訳装置の辞
書に登録されていない未知語を見つけなければならず、
また、未知語が含まれていることを認識しなければなら
ず、ユーザの負担が大きい。
Therefore, the following problems have occurred. (1) The client computer has to send the same document to the server computer twice, resulting in poor communication efficiency and high communication cost. (2) The server computer also outputs the translation result before and after registering the dictionary.
Each time it is sent to the client computer, the communication efficiency becomes poor and the communication cost becomes high. (3) On the client computer side, the user must look at the full text of the translation result returned and find an unknown word that is not registered in the dictionary of the machine translation device of the server computer.
In addition, it is necessary to recognize that an unknown word is included, which imposes a heavy burden on the user.

【0006】実際上、クライアント計算機がサーバ計算
機に翻訳を依頼する文章の数は1文とは限らず、多くの
文であることが多く、上述の問題は大きな問題である。
In practice, the number of sentences the client computer requests the server computer to translate is not limited to one sentence, but is often many sentences, and the above problem is a serious problem.

【0007】本発明は、以上の点を考慮してなされたも
のであり、原文に未知語が含まれていた場合に、全て訳
語でなる最終的な翻訳結果を得るまでの通信量を従来よ
り少なくできる、また未知語処理についてのユーザの使
い勝手を向上できる機械翻訳通信システムを提供しよう
としたものである。
The present invention has been made in consideration of the above points, and when the original sentence contains unknown words, the communication amount until the final translation result including all translated words is obtained, compared with the conventional method. It is an object of the present invention to provide a machine translation communication system that can reduce the number and improve the usability of a user for processing unknown words.

【0008】[0008]

【課題を解決するための手段】かかる課題を解決するた
め、本発明においては、システム辞書ファイル及びユー
ザ辞書ファイルを用いて機械翻訳を行なう機械翻訳部を
備えたサーバ計算機と、このサーバ計算機にネットワー
クを介して原文を与えて翻訳を依頼し、サーバ計算機が
得た翻訳結果をネットワークから受信するクライアント
計算機とを有する機械翻訳通信システムにおいて、サー
バ計算機が原文にシステム辞書ファイル及びユーザ辞書
ファイルに登録されていない未知語があることを認識し
た場合には、以下のように処理することとした。
In order to solve such a problem, according to the present invention, a server computer equipped with a machine translation unit for performing machine translation using a system dictionary file and a user dictionary file, and a network for this server computer. In a machine translation communication system that has a client computer that gives a source text via a computer, requests translation, and receives a translation result obtained by the server computer from a network, the server computer is registered in the source text in the system dictionary file and the user dictionary file. When it is recognized that there is an unknown word that has not been processed, the following processing is performed.

【0009】すなわち、クライアント計算機からサーバ
計算機に送られてきた原文中に、システム辞書ファイル
及びユーザ辞書ファイルに登録されていない未知語があ
った場合に、サーバ計算機は、受信した原文を格納した
まま、その未知語を抜き出して原文文書の識別子と共に
クライアント計算機に送信する。
That is, when an unknown word which is not registered in the system dictionary file and the user dictionary file is included in the original sentence sent from the client computer to the server computer, the server computer keeps the received original sentence. , The unknown word is extracted and transmitted to the client computer together with the identifier of the original document.

【0010】このとき、クライアント計算機は、送信さ
れてきた未知語をユーザ辞書ファイルに登録するために
必要な未知語登録情報を未知語登録部によって取り込ん
で、原文文書の識別子と共にサーバ計算機に送信する。
At this time, the client computer takes in the unknown word registration information necessary for registering the transmitted unknown word in the user dictionary file by the unknown word registration unit and transmits it to the server computer together with the identifier of the original document. ..

【0011】この送信情報を受信すると、サーバ計算機
は、送信されてきた未知語登録情報をユーザ辞書ファイ
ルに登録し、その後、送信されてきた原文文書の識別子
に係る原文を機械翻訳部によって翻訳して、得られた翻
訳結果をクライアント計算機に送信する。
Upon receiving this transmission information, the server computer registers the transmitted unknown word registration information in the user dictionary file, and thereafter, the machine translation unit translates the original sentence associated with the transmitted original document identifier. Then, the obtained translation result is transmitted to the client computer.

【0012】[0012]

【作用】本発明は、サーバ計算機が原文にシステム辞書
ファイル及びユーザ辞書ファイルに登録されていない未
知語があることを認識した場合には、以下のように処理
することとし、未知語に対する訳語を含む最終的な翻訳
結果を得るための通信量の削減を計り、また、ユーザが
容易に未知語の存在及びその用語を認識できることを計
った。
According to the present invention, when the server computer recognizes that the original sentence contains an unknown word which is not registered in the system dictionary file and the user dictionary file, the processing is performed as follows, and the translated word for the unknown word is determined. In addition, we tried to reduce the amount of communication to obtain the final translation result, including that the user could easily recognize the existence of unknown words and their terms.

【0013】すなわち、原文中にシステム辞書ファイル
及びユーザ辞書ファイルに登録されていない未知語があ
った場合に、サーバ計算機は、未知語をそのままとした
翻訳結果を送信するのではなく、原文を格納したまま
で、原文中の未知語を抜き出して原文文書の識別子と共
にクライアント計算機に送信する。
That is, when there is an unknown word in the original sentence that is not registered in the system dictionary file and the user dictionary file, the server computer stores the original sentence instead of transmitting the translation result in which the unknown word is left as it is. As it is, unknown words in the original text are extracted and transmitted to the client computer together with the identifier of the original text document.

【0014】このとき、クライアント計算機は、送信さ
れてきた未知語をユーザ辞書ファイルに登録するために
必要な未知語登録情報を未知語登録部によって取り込ん
で、原文文書の識別子と共にサーバ計算機に送信する。
ここで、原文がサーバ計算機に格納されたままであるの
で、クライアント計算機が原文を再度送信する必要はな
い。
At this time, the client computer takes in the unknown word registration information necessary for registering the transmitted unknown word in the user dictionary file by the unknown word registration unit and transmits it to the server computer together with the identifier of the original document. ..
Here, since the original text remains stored in the server computer, the client computer does not need to send the original text again.

【0015】未知語登録情報を受信すると、サーバ計算
機は、送信されてきた未知語登録情報をユーザ辞書ファ
イルに登録し、その後、送信されてきた原文文書の識別
子に係る格納状態にある原文を機械翻訳部によって翻訳
して、得られた翻訳結果をクライアント計算機に送信す
る。
When the unknown word registration information is received, the server computer registers the transmitted unknown word registration information in the user dictionary file, and then stores the original text in the storage state related to the transmitted original text document identifier as a machine. The translation unit translates and the obtained translation result is transmitted to the client computer.

【0016】[0016]

【実施例】以下、本発明の一実施例を図面を参照しなが
ら詳述する。ここで、図1がこの実施例である機械翻訳
通信システムの全体構成を示すものである。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment of the present invention will be described in detail below with reference to the drawings. Here, FIG. 1 shows the entire configuration of the machine translation communication system according to this embodiment.

【0017】図1において、この機械翻訳通信システム
は、ネットワーク1に、機械翻訳を依頼する複数(図1
では1個を取り出して示している)のクライアント計算
機2と、機械翻訳構成が搭載されている少なくとも1個
のサーバ計算機3とが接続されて構成されている。クラ
イアント計算機2及びサーバ計算機3は、実際上ワーク
ステーションやパーソナルコンピュータ等で構成されて
おり、機能的には図1に示す構成を有する。
In FIG. 1, this machine translation communication system requests a plurality of machine translation requests to the network 1 (see FIG. 1).
1 is taken out and shown) and at least one server computer 3 in which the machine translation configuration is installed are connected. The client computer 2 and the server computer 3 are actually composed of workstations, personal computers, etc., and functionally have the structure shown in FIG.

【0018】クライアント計算機2は、利用者が翻訳し
たい原文を入力するための文書入力部4、入力された原
文を格納する文書ファイル5、格納された翻訳依頼原文
等を当該クライアント計算機2からサーバ計算機3に送
信したりサーバ計算機3から当該クライアント計算機2
に送信されてきた翻訳結果等を受信したりするための文
書通信部6、未知語に対する登録処理を行なう未知語登
録部7、サーバ計算機3から与えられた翻訳結果を格納
する翻訳結果ファイル8、及び、翻訳結果をユーザに提
示する翻訳結果出力部9から構成される。
The client computer 2 includes a document input unit 4 for inputting an original sentence to be translated by a user, a document file 5 for storing the input original sentence, a stored translation request original sentence, etc. from the client computer 2 to the server computer. 3 to the client computer 2 from the server computer 3
A document communication unit 6 for receiving the translation result and the like transmitted to the server, an unknown word registration unit 7 for registering an unknown word, a translation result file 8 for storing the translation result given from the server computer 3, And a translation result output unit 9 for presenting the translation result to the user.

【0019】他方、サーバ計算機3は、クライアント計
算機2から当該サーバ計算機3に送信されてきた翻訳依
頼原文等を受信したり、当該サーバ計算機3からクライ
アント計算機2に翻訳結果等を送信したりするための文
書通信部10、文書識別情報(以下、文書IDと略す)
を付与された原文を格納するための原文ファイル11、
原文ファイル11に格納された原文を翻訳するための機
械翻訳部12、機械翻訳部12が翻訳時に使用するシス
テム辞書を格納するシステム辞書ファイル13、利用者
が任意に単語を登録する機械翻訳部12が翻訳時に使用
するユーザ辞書ファイル14、機械翻訳部12が原文フ
ァイル11の原文を翻訳しているときに見付かった未知
語を格納するための未知語ファイル15、及び、機械翻
訳部12が原文ファイル11の原文を翻訳して得た翻訳
結果(翻訳文)を格納する翻訳結果ファイル16からな
る。
On the other hand, the server computer 3 receives the translation request original text or the like transmitted from the client computer 2 to the server computer 3 or transmits the translation result or the like from the server computer 3 to the client computer 2. Document communication unit 10, document identification information (hereinafter, abbreviated as document ID)
A source text file 11 for storing the source text with
A machine translation unit 12 for translating the original text stored in the original text file 11, a system dictionary file 13 for storing a system dictionary used by the machine translation unit 12 for translation, and a machine translation unit 12 for a user to arbitrarily register words. User dictionary file 14 used by the machine translation unit 12, an unknown word file 15 for storing an unknown word found when the machine translation unit 12 is translating the original sentence of the original sentence file 11, and the machine translation unit 12 is an original sentence file. The translation result file 16 stores a translation result (translation sentence) obtained by translating the 11 original sentences.

【0020】クライアント計算機2の文書通信部6、及
び、サーバ計算機3の文書通信部10は、送受信電文に
応じた処理を行なうものである。この実施例の特徴であ
る未知語処理に関して言えば、サーバ計算機3の文書通
信部10は未知語情報送信部10a及び未知語登録情報
受信部10bを備え、クライアント計算機2の文書通信
部6は未知語情報受信部6a及び未知語登録情報送信部
6bを備えている。未知語情報送信部10aは、機械翻
訳部12から未知語情報の送信が指示されたときに未知
語ファイル15に格納されている未知語の情報を文書I
Dを付与してクライアント計算機2に送信するものであ
る。未知語情報受信部6aは、サーバ計算機3から与え
られた未知語情報を未知語登録部7に与えるものであ
る。未知語登録情報送信部6bは、未知語登録部7によ
って訳語情報等が明らかにされた未知語の情報(以下、
未知語登録情報と呼ぶ)に文書IDを付与してサーバ計
算機3に送信するものである。未知語登録情報受信部1
0bは、クライアント計算機2から与えられた未知語登
録情報をユーザ辞書ファイル14に格納させるものであ
る。従って、未知語登録情報は、ユーザ辞書ファイル1
4に登録するのに必要な情報からなる。
The document communication unit 6 of the client computer 2 and the document communication unit 10 of the server computer 3 perform processing according to the transmitted / received message. Regarding the unknown word processing which is the feature of this embodiment, the document communication unit 10 of the server computer 3 includes an unknown word information transmission unit 10a and an unknown word registration information reception unit 10b, and the document communication unit 6 of the client computer 2 is unknown. A word information receiving unit 6a and an unknown word registration information transmitting unit 6b are provided. The unknown word information transmission unit 10a outputs the information of the unknown word stored in the unknown word file 15 to the document I when the machine translation unit 12 instructs to transmit the unknown word information.
D is added and transmitted to the client computer 2. The unknown word information receiving unit 6a gives the unknown word information given from the server computer 3 to the unknown word registering unit 7. The unknown word registration information transmitting unit 6b uses the unknown word registration unit 7 to identify the unknown word information (hereinafter, translated word information and the like) (hereinafter,
The document ID is added to the unknown word registration information) and transmitted to the server computer 3. Unknown word registration information receiving unit 1
0b stores the unknown word registration information given from the client computer 2 in the user dictionary file 14. Therefore, the unknown word registration information is stored in the user dictionary file 1
It consists of the information necessary to register in 4.

【0021】図2は、この実施例の機械翻訳通信システ
ムの処理の流れを示すフローチャートである。以下、こ
の図2を参照しながら、クライアント計算機2が翻訳結
果を最終的に出力するまでの処理を説明する。
FIG. 2 is a flow chart showing the processing flow of the machine translation communication system of this embodiment. The process until the client computer 2 finally outputs the translation result will be described below with reference to FIG.

【0022】ユーザは、翻訳を希望する原文を文書入力
部4を介して入力して文書ファイル5に格納させる。文
書入力部4は入力が終了すると、文書通信部10にその
ことを伝え、文書通信部10は文書ファイル5に格納さ
れている原文に文書IDを付与し、また、当該電文が翻
訳依頼電文であることをヘッダ等で明らかにしてサーバ
計算機3に送信する(ステップ100)。
The user inputs the original sentence desired to be translated through the document input unit 4 and stores it in the document file 5. When the input is completed, the document input unit 4 notifies the document communication unit 10 of that fact, and the document communication unit 10 assigns the document ID to the original sentence stored in the document file 5, and the message is a translation request message. It is made clear in a header or the like to transmit the information to the server computer 3 (step 100).

【0023】サーバ計算機3の文書通信部10によって
受信された原文及び文書IDは、原文ファイル11に格
納される(ステップ101)。このような格納動作が終
了すると、文書通信部10から原文の受信終了情報が機
械翻訳部12に与えられ、このとき、機械翻訳部12は
原文ファイル11に格納された原文をシステム辞書ファ
イル13及びユーザ辞書ファイル14を使用しながら翻
訳する(ステップ102)。そして、機械翻訳部12
は、原文にシステム辞書ファイル13及びユーザ辞書フ
ァイル14に登録されていない未知語が存在するか否か
を判別する(ステップ103)。
The original text and the document ID received by the document communication unit 10 of the server computer 3 are stored in the original text file 11 (step 101). When such a storing operation ends, the document communication unit 10 gives the machine translation unit 12 reception end information of the original sentence, and at this time, the machine translation unit 12 translates the original sentence stored in the original sentence file 11 into the system dictionary file 13 and The user dictionary file 14 is used for translation (step 102). And the machine translation unit 12
Determines whether or not there is an unknown word in the original sentence that is not registered in the system dictionary file 13 and the user dictionary file 14 (step 103).

【0024】その結果、原文に未知語が含まれていない
と判別すると、機械翻訳部12は得られた翻訳結果(目
的言語文)を翻訳結果ファイル16に格納した後、その
旨を文書通信部10に伝え、文書通信部10は、翻訳結
果にクライアント計算機2から与えられた文書IDを付
与し、かつ当該電文が翻訳結果電文であることをヘッダ
等で明らかにしてクライアント計算機2に送信する(ス
テップ104、105)。
As a result, when it is determined that the original sentence does not include an unknown word, the machine translation unit 12 stores the obtained translation result (target language sentence) in the translation result file 16 and then notifies the document communication unit to that effect. 10, the document communication unit 10 assigns the document ID given from the client computer 2 to the translation result, clarifies that the message is a translation result message with a header or the like, and sends it to the client computer 2 ( Steps 104, 105).

【0025】クライアント計算機2の文書通信部6は、
当該電文を受信したときには翻訳結果及び文書IDを翻
訳結果ファイル8に格納し、格納し終えたときに翻訳結
果出力部9を起動し、翻訳結果出力部9は翻訳結果ファ
イル8に格納された翻訳結果を文書ファイル5に格納さ
れている原文と対応させてユーザに提示する(ステップ
106、107)。
The document communication unit 6 of the client computer 2 is
When the message is received, the translation result and the document ID are stored in the translation result file 8, and when the storage is completed, the translation result output unit 9 is activated, and the translation result output unit 9 causes the translation result file 8 to translate. The result is presented to the user in association with the original text stored in the document file 5 (steps 106 and 107).

【0026】他方、機械翻訳部12は原文に未知語が含
まれていると判断すると、原文中の未知語を未知語ファ
イル15に格納させ、当該処理を行なった旨を文書通信
部10に伝える(ステップ108)。このとき、文書通
信部10の未知語情報送信部10aは、未知語ファイル
15に格納された原文中の未知語のリストに今処理対象
の文書IDを付与し、かつ当該電文が未知語情報電文で
あることをヘッダ等で明らかにしてクライアント計算機
2に送信する(ステップ109)。
On the other hand, when the machine translation unit 12 determines that the original sentence contains an unknown word, it stores the unknown word in the original sentence in the unknown word file 15 and informs the document communication unit 10 that the processing has been performed. (Step 108). At this time, the unknown word information transmission unit 10a of the document communication unit 10 assigns the document ID of the current processing target to the list of unknown words in the original sentence stored in the unknown word file 15, and the electronic message is an unknown word information electronic message. It is clarified by a header or the like and transmitted to the client computer 2 (step 109).

【0027】クライアント計算機2側では、文書通信部
6の未知語情報受信部6aがサーバ計算機2から送られ
てきた未知語情報を未知語登録部7に与え、未知語登録
部7はその未知語情報をユーザに提示して訳語や品詞等
のユーザ辞書ファイル14に登録するのに必要な情報を
入力させ、このようにして得られた未知語登録情報を文
書通信部6に与える(ステップ110)。文書通信部6
の未知語登録情報送信部6bは、この未知語登録情報に
文書IDを付与し、かつ当該電文が未知語登録情報電文
であることをヘッダ等で明らかにしてサーバ計算機3に
送信する(ステップ111)。
On the client computer 2 side, the unknown word information receiving unit 6a of the document communication unit 6 gives the unknown word information sent from the server computer 2 to the unknown word registration unit 7, and the unknown word registration unit 7 receives the unknown word. Information is presented to the user and the information necessary for registering the translated word, the part of speech, etc. in the user dictionary file 14 is input, and the unknown word registration information obtained in this way is given to the document communication section 6 (step 110). .. Document communication unit 6
The unknown word registration information transmission unit 6b assigns a document ID to the unknown word registration information, clarifies that the electronic message is an unknown word registration information electronic message with a header or the like, and transmits it to the server computer 3 (step 111). ).

【0028】サーバ計算機3側において、文書通信部1
0の未知語登録情報受信部10bは、受信した電文に含
まれている未知語登録情報を取り出してユーザ辞書ファ
イル14に登録させると共に、この電文に含まれている
文書IDを機械翻訳部12に与えて機械翻訳部12にそ
の文書IDを有する原文を原文ファイル11から検索さ
せて翻訳処理を再起動させる(ステップ112、11
3)。機械翻訳部12は、システム辞書ファイル13及
びユーザ辞書ファイル14(未知語だった単語について
このときには登録されている)を使って、検索された原
文を翻訳する(ステップ114)。
On the server computer 3 side, the document communication unit 1
The unknown word registration information receiving unit 10b of 0 takes out the unknown word registration information included in the received electronic message and registers it in the user dictionary file 14, and the machine translation unit 12 receives the document ID included in the electronic message. It is given to cause the machine translation unit 12 to retrieve the original sentence having the document ID from the original sentence file 11 and restart the translation process (steps 112, 11).
3). The machine translation unit 12 translates the searched original sentence using the system dictionary file 13 and the user dictionary file 14 (the unknown word is registered at this time) (step 114).

【0029】このようにして得られた翻訳結果について
は未知語が含まれているか否かを確認する必要がないの
で、機械翻訳部12は上述したステップ104に進んで
直ちに得られた翻訳結果を翻訳結果ファイル16に格納
させる。これ以降の処理は、上述したステップ105〜
107の通りである。
Since it is not necessary to confirm whether or not an unknown word is included in the translation result obtained in this way, the machine translation unit 12 proceeds to step 104 described above and immediately obtains the translation result obtained. The translation result file 16 is stored. Subsequent processing is the above-mentioned steps 105 to 105.
It is as 107.

【0030】次に、図3(A)に示す原文が入力された
として、上述した一連の処理を説明する。クライアント
計算機2において、図3(A)に示す原文が入力される
と、これに文書ID(図3では「0001」)を付与し
て図3(B)に示すように電文の情報部を構成して翻訳
依頼電文をサーバ計算機3に送信する。
Next, assuming that the original sentence shown in FIG. 3A is input, the above-mentioned series of processing will be described. When the original text shown in FIG. 3A is input to the client computer 2, a document ID (“0001” in FIG. 3) is added to the original text and the information section of the electronic text is configured as shown in FIG. 3B. Then, the translation request message is transmitted to the server computer 3.

【0031】サーバ計算機3は、この翻訳依頼電文を受
信すると、この電文に含まれている文書ID及び原文を
原文ファイル11に格納させた後、機械翻訳部12によ
ってその原文をシステム辞書ファイル13及びユーザ辞
書ファイル14を用いて翻訳しようとする。ここで、図
3(A)に示す原文における単語「感性」についてシス
テム辞書ファイル13にもユーザ辞書ファイル14にも
登録されていなかったとする。この場合、サーバ計算機
3は、図3(C)に示すように、この単語「感性」を未
知語として、翻訳対象中の文書のID「0001」と共
に未知語ファイル16に登録し、その後、サーバ計算機
3はこの未知語ファイル16に登録された内容を情報部
に含む未知語情報電文をクライアント計算機2に送信す
る。
Upon receipt of this translation request message, the server computer 3 stores the document ID and the original sentence contained in this message in the original sentence file 11, and then the machine translation unit 12 stores the original sentence in the system dictionary file 13 and Try to translate using the user dictionary file 14. Here, it is assumed that the word “kansei” in the original sentence shown in FIG. 3A is not registered in the system dictionary file 13 or the user dictionary file 14. In this case, as shown in FIG. 3C, the server computer 3 registers the word “sensitivity” as an unknown word in the unknown word file 16 together with the ID “0001” of the document to be translated, and then the server. The computer 3 transmits to the client computer 2 an unknown word information electronic message including the contents registered in the unknown word file 16 in the information section.

【0032】なお、図3(A)に示す原文では単語「感
性」が2回含まれているが、未知語ファイル16に格納
する際、重複を確認しており、1個の未知語情報として
のみ未知語ファイル16に格納される。
In the original sentence shown in FIG. 3A, the word "sensitivity" is included twice, but when the word is stored in the unknown word file 16, duplication is confirmed and one unknown word information is stored. Only stored in the unknown word file 16.

【0033】未知語情報電文を受信したクライアント計
算機2は、その電文に含まれている未知語「感性」をユ
ーザに提示してユーザ辞書ファイル14に登録させるに
不足している情報(例えば訳語や品詞)をユーザに入力
させ、これによりクライアント計算機2は図3(D)に
示すような文書ID「0001」と未知語「感性」とそ
の訳語「impression」と品詞「名詞」等を情報部に含む
未知語登録情報電文をサーバ計算機3に送信する。
The client computer 2, which has received the unknown word information message, is insufficient to present the unknown word "sensitivity" included in the message to the user and register it in the user dictionary file 14 (for example, translated word or (Sentence of speech) is input by the user, whereby the client computer 2 uses the document ID “0001”, the unknown word “sensitivity”, its translation “impression”, and the part of speech “noun” in the information section as shown in FIG. The unknown word registration information message including the information is transmitted to the server computer 3.

【0034】サーバ計算機3において、この未知語登録
情報電文を受信すると、その情報部に挿入されている未
知語「感性」とその訳語「impression」と品詞「名詞」
等をユーザ辞書ファイル16に与えて登録させ、その
後、その情報部に挿入されている文書ID「0001」
を機械翻訳部12に与えて、原文ファイル11に格納さ
れている上述の図3(A)に示す原文を検索させて翻訳
させる。このときには、単語「感性」についての情報が
ユーザ辞書ファイル14に登録されているので、図3
(A)に示す原文について未知語は存在せず、未知語の
ない翻訳結果が得られ、機械翻訳部12は、図3(E)
に示すこの翻訳結果に文書ID「0001」を付与した
情報を翻訳結果ファイル16に格納する。そして、文書
通信部10は、この格納内容が情報部に挿入されている
翻訳結果電文をクライアント計算機2に送信する。
When the server computer 3 receives the unknown word registration information telegram, the unknown word "sensitivity" and its translation "impression" and the part of speech "noun" inserted in the information part are received.
Etc. to the user dictionary file 16 to be registered, and then the document ID “0001” inserted in the information section.
To the machine translation unit 12 to search and translate the original sentence shown in FIG. 3 (A) stored in the original sentence file 11. At this time, since the information about the word “kansei” is registered in the user dictionary file 14, FIG.
There are no unknown words in the original sentence shown in (A), and a translation result with no unknown words is obtained.
Information in which the document ID “0001” is added to the translation result shown in is stored in the translation result file 16. Then, the document communication unit 10 transmits the translation result electronic message in which the stored content is inserted in the information unit to the client computer 2.

【0035】かくして、図3(A)に示した原文と共に
当該翻訳結果電文に挿入されていた翻訳結果がユーザに
提示される。
Thus, the translation result inserted in the translation result message along with the original sentence shown in FIG. 3A is presented to the user.

【0036】従って、上記実施例の機械翻訳通信システ
ムによれば、サーバ計算機3において原文に未知語が存
在すると判断した場合には、サーバ計算機3から未知語
情報をクライアント計算機2に送信し、クライアント計
算機2からサーバ計算機3に未知語登録情報を送信して
ユーザ辞書ファイル14に登録させて対応するようにし
たので、従来の通信システムに比較して、クライアント
計算機2が最終的な翻訳結果を得るまでの通信量を少な
くすることができ、通信コストを軽減することができ
る。
Therefore, according to the machine translation communication system of the above embodiment, when the server computer 3 determines that an unknown word exists in the original text, the server computer 3 transmits the unknown word information to the client computer 2 and the client computer 2 sends the unknown word information to the client computer 2. Since the unknown word registration information is transmitted from the computer 2 to the server computer 3 and registered in the user dictionary file 14 so as to correspond to the unknown word registration information, the client computer 2 obtains a final translation result as compared with the conventional communication system. It is possible to reduce the communication amount up to, and it is possible to reduce the communication cost.

【0037】ここで、未知語情報及び未知語登録情報を
クライアント計算機2及びサーバ計算機3間で授受する
が、この期間、原文を原文ファイル11に格納させ続け
ると共に電文には常に文書IDを含めるようにしたの
で、未知語情報や未知語登録情報がどの文書に係るもの
であるか不明となることはなく、また、未知語を含む翻
訳結果を授受したり原文を再度授受したりすることも必
要ない。このことはまた、サーバ計算機3が未知語情報
電文を送信した後、それに対応した未知語登録情報電文
を受信するまでの間に他の文書の処理を行なうことも可
能であることを意味する。
Here, the unknown word information and the unknown word registration information are exchanged between the client computer 2 and the server computer 3. During this period, the original text is kept stored in the original text file 11 and the electronic text always includes the document ID. Therefore, it is not necessary to know which document the unknown word information or unknown word registration information pertains to, and it is also necessary to send and receive translation results including unknown words and send and receive the original text again. Absent. This also means that the server computer 3 can process other documents after transmitting the unknown word information message and before receiving the corresponding unknown word registration information message.

【0038】また、上記実施例によれば、未知語登録部
7が未知語を表示して登録情報の入力をユーザに求める
ので、未知語を含む翻訳結果全文が表示されている中か
ら未知語を認識する従来システムとは異なり、ユーザは
容易に未知語の存在及び未知語の内容を認識することが
でき、使い勝手が良いものとなる。
Further, according to the above-described embodiment, the unknown word registration unit 7 displays the unknown word and prompts the user to enter registration information. Unlike the conventional system that recognizes, the user can easily recognize the existence of the unknown word and the content of the unknown word, which is convenient.

【0039】なお、本発明に係る機械翻訳通信システム
においては、クライアント計算機の個数が任意であるだ
けでなく、サーバ計算機の個数も任意である。例えば、
特定分野毎の機械翻訳構成を別個の計算機が有する通信
システムであっても良い。このような場合、ある計算機
はサーバ計算機としてだけでなくクライアント計算機と
しても機能することがある。ネットワークも無線、有線
を問わないのは勿論である。
In the machine translation communication system according to the present invention, not only the number of client computers is arbitrary, but the number of server computers is also arbitrary. For example,
It may be a communication system in which a separate computer has a machine translation configuration for each specific field. In such a case, a computer may function as a client computer as well as a server computer. Of course, the network may be wireless or wired.

【0040】また、上記実施例においては、サーバ計算
機が一通りの翻訳処理を終了した後に未知語を含むか否
かを判断するものを示したが、形態素解析の終了時や構
文解析の終了時や意味解析の終了時等のいずれかの時点
で未知語の存在を判別するようにしても良い。
In the above embodiment, the server computer determines whether or not an unknown word is included after the completion of a series of translation processes. However, at the end of morphological analysis or at the end of syntactic analysis. The presence of the unknown word may be determined at any time such as when the semantic analysis ends.

【0041】[0041]

【発明の効果】以上のように、本発明によれば、サーバ
計算機において原文に未知語が存在すると判断した場合
には、サーバ計算機から未知語情報をクライアント計算
機に送信し、クライアント計算機からサーバ計算機に未
知語登録情報を送信してユーザ辞書ファイルに登録させ
て対応するようにしたので、翻訳結果を得るまでの全体
としての通信量を少なくすることができる、また未知語
認識に対する使い勝手を向上させることができる機械翻
訳通信システムを実現できる。
As described above, according to the present invention, when the server computer determines that an unknown word exists in the original text, the server computer transmits the unknown word information to the client computer, and the client computer transmits the unknown word information. Since the unknown word registration information is sent to and registered in the user dictionary file so that it can be handled, it is possible to reduce the communication volume as a whole until the translation result is obtained, and improve the usability for unknown word recognition. It is possible to realize a machine translation communication system capable of performing.

【図面の簡単な説明】[Brief description of drawings]

【図1】実施例の機械翻訳通信システムの構成を示すブ
ロック図である。
FIG. 1 is a block diagram showing a configuration of a machine translation communication system according to an embodiment.

【図2】その処理の流れを示すフローチャートである。FIG. 2 is a flowchart showing the flow of the processing.

【図3】ある原文が入力された場合のファイル内容等を
示す説明図である。
FIG. 3 is an explanatory diagram showing file contents and the like when a certain original sentence is input.

【符号の説明】[Explanation of symbols]

1…ネットワーク、2…クライアント計算機、3…サー
バ計算機、6…文書通信部、6a…未知語情報受信部、
6b…未知語登録情報送信部、7…未知語登録部、10
…文書通信部、10a…未知語情報送信部、10b…未
知語登録情報受信部、11…原文ファイル、12…機械
翻訳部、13…システム辞書ファイル、14…ユーザ辞
書ファイル、15…未知語ファイル、16…翻訳結果フ
ァイル。
1 ... Network, 2 ... Client computer, 3 ... Server computer, 6 ... Document communication unit, 6a ... Unknown word information receiving unit,
6b ... Unknown word registration information transmitting unit, 7 ... Unknown word registration unit, 10
Document communication unit, 10a ... Unknown word information transmitting unit, 10b ... Unknown word registration information receiving unit, 11 ... Original file, 12 ... Machine translation unit, 13 ... System dictionary file, 14 ... User dictionary file, 15 ... Unknown word file , 16 ... Translation result file.

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】 システム辞書ファイル及びユーザ辞書フ
ァイルを用いて機械翻訳を行なう機械翻訳部を備えたサ
ーバ計算機と、このサーバ計算機にネットワークを介し
て原文を与えて翻訳を依頼し、サーバ計算機が得た翻訳
結果をネットワークから受信するクライアント計算機と
を有する機械翻訳通信システムにおいて、 上記クライアント計算機から上記サーバ計算機に送られ
てきた原文中に、上記システム辞書ファイル及び上記ユ
ーザ辞書ファイルに登録されていない未知語があった場
合に、上記サーバ計算機は、上記原文を格納したまま、
その未知語を抜き出して上記原文文書の識別子と共に上
記クライアント計算機に送信し、 上記クライアント計算機は、送信されてきた未知語を上
記ユーザ辞書ファイルに登録するために必要な未知語登
録情報を未知語登録部によって取り込んで、上記原文文
書の識別子と共に上記サーバ計算機に送信し、 上記サーバ計算機は、送信されてきた未知語登録情報を
上記ユーザ辞書ファイルに登録し、その後、送信されて
きた原文文書の識別子に係る原文を上記機械翻訳部によ
って翻訳して、得られた翻訳結果を上記クライアント計
算機に送信することを特徴とした機械翻訳通信システ
ム。
1. A server computer equipped with a machine translation unit for performing machine translation using a system dictionary file and a user dictionary file, and an original sentence is given to this server computer via a network to request translation, and the server computer obtains the translation. In a machine translation communication system having a client computer that receives a translation result from a network, an unknown text that is not registered in the system dictionary file and the user dictionary file in the original text sent from the client computer to the server computer. When there is a word, the server computer stores the original text,
The unknown word is extracted and transmitted to the client computer together with the identifier of the original document, and the client computer registers unknown word registration information necessary for registering the transmitted unknown word in the user dictionary file. And sends it to the server computer together with the identifier of the original document, the server computer registers the transmitted unknown word registration information in the user dictionary file, and then the identifier of the transmitted original document. A machine translation communication system, characterized in that the original sentence according to (1) is translated by the machine translation unit, and the obtained translation result is transmitted to the client computer.
JP3284467A 1991-10-30 1991-10-30 Machine translation communication system Pending JPH05120336A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3284467A JPH05120336A (en) 1991-10-30 1991-10-30 Machine translation communication system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3284467A JPH05120336A (en) 1991-10-30 1991-10-30 Machine translation communication system

Publications (1)

Publication Number Publication Date
JPH05120336A true JPH05120336A (en) 1993-05-18

Family

ID=17678909

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3284467A Pending JPH05120336A (en) 1991-10-30 1991-10-30 Machine translation communication system

Country Status (1)

Country Link
JP (1) JPH05120336A (en)

Similar Documents

Publication Publication Date Title
US8498858B2 (en) System and method for multi-lingual translation
US6996520B2 (en) Language translation system and method using specialized dictionaries
US6738827B1 (en) Method and system for alternate internet resource identifiers and addresses
WO2001002994A1 (en) Automatic processing system for electronic foreign language communication
CN101193069A (en) Information inquiry system, instant communication robot server and information inquiry method
JP2007082238A (en) Method for interfacing with personal digital assistance and communications equipment
JP3477654B2 (en) E-mail matching method and device
JPH05120336A (en) Machine translation communication system
JP2723727B2 (en) Machine translation communication system
JP2003296327A (en) Translation server, genre-classified online machine translation method, and program therefor
EP1569131B1 (en) System and method of translation for wireless devices
JPH08278978A (en) Securities information retrieval method and securities information terminal device
KR100516302B1 (en) Method And System For Handling Wrongly Inputted Internet Address
US7343556B2 (en) Technique for processing and generating messages in multiple languages
JP3272049B2 (en) Machine translation communication system
JP2003345798A (en) Method and device for controlling translation, and its processing program
KR20010075446A (en) Method and system for alternate internet resource identifiers and addresses
JPH10301954A (en) Method and system for retrieving image
JP3434161B2 (en) Multilingual communication system
JPH09114832A (en) Machine translating communication system
JP2001273294A (en) Method, system and server for translation, recording medium and information transmitting medium
JP2002108527A (en) Method for converting data and device for the same and program
JPH10187732A (en) Multilingual communication system
JPH10289235A (en) Email device
CN115686878A (en) 5G message interaction system, method, computing device and storage medium