[go: up one dir, main page]

JP3959180B2 - 通信翻訳装置 - Google Patents

通信翻訳装置 Download PDF

Info

Publication number
JP3959180B2
JP3959180B2 JP23685098A JP23685098A JP3959180B2 JP 3959180 B2 JP3959180 B2 JP 3959180B2 JP 23685098 A JP23685098 A JP 23685098A JP 23685098 A JP23685098 A JP 23685098A JP 3959180 B2 JP3959180 B2 JP 3959180B2
Authority
JP
Japan
Prior art keywords
translation
data
information
communication
translated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP23685098A
Other languages
English (en)
Other versions
JP2000067049A (ja
Inventor
悦雄 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Solutions Corp filed Critical Toshiba Corp
Priority to JP23685098A priority Critical patent/JP3959180B2/ja
Priority to US09/379,792 priority patent/US6330529B1/en
Publication of JP2000067049A publication Critical patent/JP2000067049A/ja
Application granted granted Critical
Publication of JP3959180B2 publication Critical patent/JP3959180B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/221Parsing markup language streams
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)
  • Information Transfer Between Computers (AREA)
  • Computer And Data Communications (AREA)

Description

【0001】
【発明の属する技術分野】
本発明はインターネット上のパソコンなどの情報提供装置から提供される第一言語を第二言語に翻訳する通信翻訳装置に関する。
【0002】
【従来の技術】
近年、インターネットの普及に伴ない、インターネット上から取り込む各種言語の情報を翻訳する機械翻訳処理装置が注目されてきている。その理由は、自国語と異なる言語の文書情報をそのまま取り込むよりも、インターネット上の翻訳サーバなどで翻訳させた後、その翻訳結果である自国語の情報を取り込んだ方が文書の内容を容易、かつ、迅速に理解できるためである。
【0003】
【発明が解決しようとする課題】
しかしながら、以上のようにインターネット上の情報を翻訳サーバなどを経由して翻訳結果を取り込む場合、或いはインターネット上の情報を直接取り込んで翻訳する場合、次のような種々の問題が指摘されている。
【0004】
(1) インターネットを経由して取り込む情報は、翻訳用の情報ではなく、ホームページを見るためのインターネット専用の用法提示ツール(WWWブラウザ)に基づいて表示されることから、従来の機械翻訳エディタによって提供される種々の補助機能が受けられなく問題がある。例えば翻訳結果に対応する原文や英単語を知りたい場合にはその原文や英単語の参照が困難となったり、翻訳時に幾つかの訳語候補が出てくるが、翻訳された訳語以外の訳語が見られないといった問題がある。
【0005】
(2) インターネット上から情報を取り込んでインターネット用の情報,つまりハイパーテキスト文書などを作成する場合、各ホームページ相互間をリンクでつないでいくが、これら一連のインターネット用情報の作成作業は作成者が行なわなければならず、作成者なしではデータ作成が困難である。
【0006】
(3) また、英語しか受理できないブラウザやOSを使用しているとき、行き先(URL)アドレスを通して例えば日本語のホームページにアクセスしたとき、そのホームページの情報を表示できないばかりか、システムダウンとなることがある。これは、逆に日本語しか受理できないブラウザやOSを用いている場合でも、英語のホームページにアクセスしたときに同様の問題が生ずる。
【0007】
(4) 従来の一般的な機械翻訳処理装置は、翻訳する文書の分野を判定した後、その判定された分野に応じた辞書、文法などを用いて翻訳するので翻訳精度が向上するが、インターネット情報を翻訳する場合には情報を取得するまで、そのページがどの分野であるか判定できない問題がある。
【0008】
(5) さらに、インターネットを通してアンケートを行ったり、商品購入や種々の予約を行うことができるが、そのとき英語で記載される商品の説明を理解するために翻訳したときに商品名などの項目も同時に翻訳されてしまう。
【0009】
例えば「English 」と「Japanese」の2者択一の形で選択しサーバなどに返却すべきところ、「英語」と「日本語」に翻訳され、ここで「日本語」を選択しサーバに返却しても、サーバではEnglish とJapaneseしか受理できない問題があり、一方、ユーザ側にとっては商品の購入や予約の用を果たせない。また、ユーザ側がアンケートその他商品購入などに対し、何らかの回答その他の要望事項を日本語で入力した場合でも、サーバ側で受理できない問題がある。
【0010】
(6) ユーザどうしが互いにインターネットを介して会話をする場合、インターネット上では英語が主に使用されているので、翻訳サーバを介して会話に参加することが可能であるが、翻訳結果が悪く会話の意図がうまく伝わらず、相手に不快感を与える場合がある。
【0011】
(7) また、外国のユーザと会話をしたり、時間制限のあるサーバにアクセスする場合、相手国の時刻が分からずに迷惑をかける問題がある。
【0012】
(8) さらに、英語などの普通名詞に大文字を用いて固有名詞的に使用することがあるが、このような場合には日本語の訳文に英語のスペルを併記する技術が公知であるが、それだけでは例えば「Machine Translation system」は「機械翻訳(Machine Translation )システム」となり、意味がよくわからなる問題がある。
【0013】
本発明は上記事情に鑑みてなされたもので、インターネットを用いて相互に情報を授受するに際し言語上の違いによる障害を除去可能とする通信翻訳装置を提供することにある。
【0015】
【課題を解決するための手段】
上記課題を解決するために、請求項1に対応する発明は、ネットワーク上に提供される原文情報を翻訳処理する通信翻訳装置において、前記ネットワーク上に提供される原文情報を所要の言語に翻訳処理する翻訳処理手段と、電子文書用マークアップ言語を用いて、前記翻訳された訳語に原文情報の単語および翻訳時の解析情報を埋め込んで保存する埋込み処理手段とを設けたものである。
【0016】
また、請求項2に対応する発明は、ネットワーク上に提供される原文情報を所要の言語に翻訳処理する翻訳処理手段と、電子文書用マークアップ言語を用いて、前記翻訳された訳文中に存在する訳語および当該訳語の他の訳語情報を保存し、前記訳文のみ、または当該訳文および選択可能に他の訳語情報を表示する表示手段とを設けた通信翻訳装置である。
【0018】
このような手段を講じたことにより、翻訳結果の中に原文、その他の解析情報、他の訳語候補を表示せずに保持し、必要なときにその保持された情報を表示、選択、修正等を行うことができ、また原文や英単語を知りたいときに容易に参照できる。また、翻訳結果の他の訳語を見たいとき、他の訳語を容易に見ることができる。また、該当個所の再度翻訳を容易に行うことができる。
【0045】
【発明の実施の形態】
以下、本発明の実施の形態について図面を参照して説明する。
【0046】
(実施の形態1)
図1は本発明に係わる通信翻訳装置の一実施の形態を示す構成図である。
【0047】
この通信システムにおいては、インターネット等のネットワーク1上に、クライアントからの要求を受けてホームページを含む各種の情報(原文)を提供するパソコンなどの情報提供装置21 ,…,2n の他、この情報提供装置21 ,…,2n から提供される原文情報(第一の言語)を受信して自国語である例えば日本語(第二の言語)に翻訳処理するパソコンなどの通信翻訳装置3などが接続されている。
【0048】
この通信翻訳装置3は、翻訳指示その他必要な指示、さらに原文の情報を読み取って入力するキーボード,マウス、スキャナなどの入力部11、情報提供装置21 ,…,2n から提供される原文情報や翻訳結果等を表示するCRT,ビットマップ、ゴーグル、壁面投射などの表示部12、情報提供装置21 ,…,2n から提供される情報を翻訳処理用記録媒体13の翻訳処理プログラムに基づいて翻訳処理および必要な制御を実行するCPUをもつ翻訳処理部14、ネットワーク1へのアクセス制御,情報提供装置21 ,…,2n から提供される情報の受信制御等を行う通信制御部15、辞書・文法データを記憶する辞書・文法記憶部16および受信情報、翻訳結果の訳文その他必要なデータを記憶するデータ記憶部17によって構成されている。
【0049】
前記翻訳処理用記録媒体13は、一般的には磁気ディスクが用いられるが、それ以外には例えば磁気テープ、CD−ROM、DVD−ROM、フロッピーディスク、MO、MD、CD−R、メモリカードなどを用いてもよい。
【0050】
前記翻訳処理部14は、例えばネットワーク1から通信制御部15を介して受信される例えば英語などの原文情報を翻訳するか否かを判断する翻訳有無判断手段と、この翻訳有無判断手段によって翻訳すると判断されたとき、原文情報について辞書・文法記憶部16の辞書および文法を用いて、例えば日本語などの第二の言語に翻訳処理する翻訳処理手段と、この翻訳処理手段により翻訳された訳文および前記原文について電子文書用マークアップ言語ツール(HTML,SGML,XML,HPML等があり、以下,説明の便宜上、HTMLを用いて説明する)に基づくコメントタグを用いて例えば訳文に原文を埋込む原文埋込み処理手段とからなっている。
【0051】
なお、インターネット1から通信制御部15を介して受信される原文情報は一時的にデータ記憶部17に記憶されて翻訳処理されるが、常時は原文情報は埋込まずに訳文だけを表示し、必要な時だけ訳文に原文情報を埋込む処理をしてもよい。
【0052】
次に、CPUからなる翻訳処理部14が翻訳処理用記録媒体13から翻訳処理プログラムを読み取って翻訳処理を実行する例について図2を参照して説明する。
【0053】
表示部12に例えばブラウザなどを用いてホームページを表示し、行き先(URL)を指定すると、入力部11を介して通信制御部15はネットワーク1をアクセスし情報提供装置例えば21 に対し原文情報を要求する。ここで、情報提供装置21 から原文が提供されると、この原文をネットワーク1を介して通信制御部15で受信する。
【0054】
ここで、翻訳処理部14は、翻訳処理用記録媒体13の翻訳処理プログラムを読み取って通信制御部15から原文を読み取り、データ記憶部17に記憶する(S1)。しかる後、入力部11からの指示に基づいて翻訳が必要であるか否かを判断する(S2,翻訳有無判断機能)。翻訳が必要があると判断されたとき、辞書・文法記憶部16に記憶される翻訳対応言語の辞書および文法に従って翻訳処理を実行する(S3,翻訳処理機能)。そして、翻訳結果である訳文をHTMLのタグ(例えば改行タグ等)を用いてデータ記憶部17の例えば訳文ファイルなどに記憶する一方、当該訳文にHTMLのコメントタグを用いて原文埋め込む処理を行った後(S4,原文埋込み処理機能)、表示部12に表示する。図3は文単位の訳文に原文を埋め込んだ表示例である。
【0055】
因みに、図4(a)は通信制御部15で受信された原文情報の画面表示例であるが、従来の翻訳装置で翻訳処理したとき、図4(b)に示すような翻訳結果の訳文が表示される。一方、HTMLによるテキストデータの場合には図5(a)にようなデータとなるが、これを従来の翻訳装置で翻訳処理したとき、HTMLの場合には図4(b)ではなく図5(b)に示すような訳文データとなる。そして、この図5(b)の訳文データおよび図3の原文を含む訳文データをブラウザを用いて表示すると図5(c)に示すような画面表示例となる。つまり、図4(b)と同じ状態に表示される。
【0056】
図6は図3のデータから原文データを読み出して表示した画面例である。この画面例はバルーンにより表示されている。
【0057】
図7(a)は図5(a)の訳文データに単語単位で埋め込んでデータ記憶部17に保存した例であり、これをブラウザを用いて表示すると図7(b)のような画面例となる。これは図4(b)と同じである。しかし、図7(a)から原文データを読み出して表示すると図7(c)のような表示画面例となる。この画面例はバルーンで表示されている。
【0058】
従って、以上のような実施の形態によれば、HTMLルールのコメントタグを用いて、訳文に原文を埋め込んで記憶するとともに表示可能としたので、翻訳結果である訳文に対応する原文を参照することができる。また、訳文の単語単位に原文の単語を埋め込むことができ、各単語の訳文に対し、必要とする原文例えば英単語を表示し容易に把握することができる。
【0059】
図8は図1に示す通信システムを用いた場合の他の実施の形態例を説明する図である。
【0060】
この例は、翻訳処理部14が原文の各単語に対して辞書・文法記憶部16に記憶される辞書および文法を用いて翻訳するが、このときHTMLのコメント(←→)を用いて原文情報の単語の翻訳時に解析情報として得られる「品詞」を原文単語とともに、訳文の単語に埋め込む処理を行い、データ記憶部17の所定のファイルに記憶し、表示部12に表示する。
【0061】
その結果、図8に示すように訳文の各単語に、「原文の単語+解析情報である品詞」を付加することができる。因みに、図13の第1段目は訳文単語「この」に対して“Pren”(代名詞)、第2段目は訳文単語「システム」に対して“n ”(名詞)を埋め込むことができる。
【0062】
図9は同じく図1に示す通信システムを用いたときの他の実施の形態例を説明する図である。
【0063】
この例は、翻訳処理部14が原文の各単語に対して、辞書・文法記憶部16に記憶される辞書および文法を用いて翻訳するが、このときにはHTMLのコメントを用いて、訳語に原文の単語の翻訳時に得られる訳語の他の候補データを埋め込む処理を行い、データ記憶部17の所定のファイルに記憶し、表示部12に表示する。
【0064】
例えば訳語である「この」に対し他の候補データ「本、当」、訳語である「システム」に対して他の候補データ「装置、仕組み」を埋め込むものである。
【0065】
図10(a)は図9に示す記憶データをブラウザで表示した例であって、図4(b)と同じ表示画面例となる。また、図10(b)は図9に示す記憶データから訳語の他の候補データを読み出してポップアップメニューで表示した表示画面例である。このような表示画面例とすれば、訳語の他の候補データの中から1つを選択し、表示中の画面に反映させたり、学習させたりすることができる。
【0066】
従って、図8および図9に示すような実施の形態によれば、翻訳処理時の分析情報や他の訳語を見たいときに見ることができ、学習効果が高まり、より訳語の信頼性を上げることができる。
【0067】
なお、ユーザがネットワーク1上に提供される第一の言語情報を翻訳サーバを経由して所望の言語例えば日本語に翻訳後に受け取る通信システムにおいては、図1に示すような構成を翻訳サーバに設けてもよいことは言うまでもない。
【0068】
(実施の形態2)
図11は本発明に係わる通信翻訳装置の他の実施の形態を示す構成図である。なお、同図において図1と同一部分には同一符号を付しその詳しい説明は省略する。
【0069】
21は図1と同様にキーボード,マウスなどを有する他、少なくとも紙などに記述される情報を読み取ってイメージデータとして入力可能なOCRなどのスキャナを含む入力部、22は意味解析プログラムを記録する意味解析用記録媒体であって、これには例えばイメージデータパターンから言語データを認識するためのOCR用サブプログラム22aとこの言語データの意味概念を解析するための意味解析用サブプログラム22bとをもっている。
【0070】
23は意味解析用データ記憶部であって、これは例えばイメージデータパターンから言語データを認識するための認識用辞書23aおよび言語データとHTMLによって作成されてデータ記憶部17に格納されているハイパーテキストデータとの意味概念の関連性を解析する意味解析ルール集データ23bとを備えている。
【0071】
24はリンク処理制御部であって、これはOCR用サブプログラム22aに従ってイメージデータパターンから言語データに変換し、さらに意味解析用サブプログラム22bに従って変換された言語データと既にHTMLで作成されたハイパーテキストデータとの意味概念を比較し、これら意味概念に同一性を有するとき同一性を有するデータどうしにHTMLに基づいてリンクを張るリンク処理機能をもっている。
【0072】
次に、以上のような装置の動作について説明する。
【0073】
通信翻訳装置4において、情報提供装置例えば21 などからネットワーク1を介して提供される情報を翻訳処理する例は図1で既に述べているので、ここではその説明は省略し、以下、入力部21から入力される関連文書のリンク処理制御について、図12を参照して説明する。
【0074】
今、入力部21からリンク制御指示を受けると、リンク処理制御部24は、意味解析用記憶媒体22の意味解析プログラムに従って所定の処理を実行する。
【0075】
すなわち、入力部21である例えばスキャナを用いて図19(a)に示すように記述された文書データ「1」をイメージデータとして読み込むと、リンク処理制御部24は、その文書データのイメージデータを取り込んでデータ記憶部17に記憶した後(S11,イメージデータ取り込み機能)、このイメージデータについて認識するか否かを判断する(S12,データ認識有無判断機能)。ここで、オペレータの指示のもとに認識すると判断したとき、OCR用サブプログラム22aおよび認識用辞書23aを用いてイメージデータを言語データに変換する(S13,言語データ変換機能)。
【0076】
しかる後、リンク処理制御部24は、意味解析用サブプログラム22bに基づいて、変換された言語データについて意味解析ルール集データ23bを用いて意味概念について解析する(S14,データ意味解析機能)。そして、この言語データの意味概念と既にHTMLで作成されている例えば図13(b)のようなハイパーテキストデータ「2」の意味概念とを解析し、各データ「1」,「2」における「98年に発売予定のパソコン」と「98年新製品PC」の意味概念に同一性があるとき、HTMLルールに基づいて、データ「1」,「2」の該当する部分に対してリンクを張る処理を実行する(S15,リンク処理機能)。
【0077】
図14は図13に示す2つのデータの意味概念の解析結果を説明する図であって、これら2つの意味概念がほぼ等しいことが分かる。図15は2つのデータの意味概念の等しい部分にリンクを張った結果例を示す図である。
【0078】
従って、以上のような実施の形態によれば、従来、インターネット用情報を作成する場合にはデータ作成者がページ間のリンクをはる作業を行う必要があり、非常にデータ作成が困難であったが、本装置においては、紙などに記述されるデータを読み取り、この読み取りデータの見出しなどのデータと既に作成ずみのハイパーテキストデータ中に含まれるデータとの意味概念が等しいかを判断し、等しいと判断されたときにリンクを張るので、容易、かつ、自動的にリンクを張る作業を進めることができる。
【0079】
(実施の形態3)
図16は本発明に係わる通信翻訳装置の他の実施の形態を示す構成図である。なお、同図において図1と同一部分には同一符号を付しその詳しい説明は省略する。
【0080】
この実施の形態は、例えば英語しか受理できないブラウザやOSなどを備えた装置に対し、例えば日本語のホームページをアクセスしたときの不具合を改善する形態例である。
【0081】
なお、この通信翻訳装置とは、ネットワーク1に接続される全ての装置を対象とすることは言うまでもない。
【0082】
図16に示す通信翻訳装置3は、特に図1と比較して異なる部分を述べると、CPUで構成される翻訳処理部14aに、翻訳処理プログラムを記録する記憶媒体13の他、ネットワーク1上から通信制御部15を介して受信される情報が言語上から受理できるか否かを判定する言語受理判定プログラムを記録する言語受理判定用記録媒体31、ネットワークのホームページを見るためのブラウザ32が接続されている。
【0083】
前記翻訳処理部14aは、通信制御部15で受信された情報の言語が第一言語であるか第二言語であるかを判定する言語判定手段33と、この言語判定手段33により第一言語であると判定されたとき、システム本体の諸機能がその言語処理に適するか否かを判断する処理適否判断手段34と、各諸機能が言語処理に適しているとき、および適していないときにブラウザ32を用いて第二の言語を表示するネットデータ閲覧表示手段35とによって構成されている。
【0084】
なお、前記情報提供装置21 ,…,2n は、例えば第一言語のホームページを含むハイパーテキストデータをもつか第二言語のホームページを含むハイパーテキストデータをもつかは問わない。
【0085】
次に、以上のような通信翻訳装置の動作について図17を参照して説明する。また、図17はCPUをもつ翻訳処理部14aのコンピュータが言語受理判定用記録媒体31の言語受理判定プログラムを読み取って所定の機能を実現する一連の処理例でもある。なお、説明の便宜上、ブラウザ32等が第二言語である例えば英語のホームページの情報のみを表示できる機能をもったものとする。
【0086】
今、通信翻訳装置3が情報提供装置21 から提供される日本語のホームページを含むハイパーテキストデータを受信したとする。
【0087】
ここで、翻訳処理部14aは、言語受理判定用記録媒体31の言語受理判定プログラムを読み取り、通信制御部15で受信されたハイパーテキストデータを取り込み(S21)、そのデータが2バイトコード(日本語)であるか否かを判定する(S22,言語判定機能)。当該データが2バイトコードである場合には第一言語である日本語であると判定し、2バイトコードでない場合には第二言語である例えば英語と判定する。英語と判定されたとき、ブラウザ32が第二言語である英語で表示可能であるので、ブラウザ32を用いて情報提供装置21 から提供される情報を表示する(S26)。
【0088】
しかし、ステップS22において2バイトコードであると判定されたとき、処理適否判断機能を実現する。システムのOSが2バイトコード(日本語)を受理できるか否かを判断し(S23)、受理できる場合には引き続き、システムが2バイトコード用のフォントをインストールしているか否かを判断する(S24)。ここで、2バイトコード用のフォントがインストールされている場合、さらにブラウザ32が2バイトコードを表示できるか否かを判断する(S25)。
【0089】
以上のようにして各諸機能が全て2バイトコード用に適用できるとき、ブラウザ32を用いて情報提供装置21 から提供される情報を表示する(S26)。
【0090】
しかし、各ステップS23、S24、S25の何れかにおいて2バイトコードの適用が困難なとき、情報提供装置21 から提供される情報を翻訳処理プログラムを用いて第二言語である英語に翻訳した後(S27)、ブラウザ32を用いてホームページを含むテキストデータである情報を表示する(S26)。
【0091】
従って、以上のような実施の形態によれば、OSやブラウザが英語しか受理できないにも拘らず、インターネット上の日本語のホームページを含むテキストデータアクセスした場合、OSやブラウザの処理可能状態を判断し、処理不可能な場合には英語に翻訳して表示するので、システムダウンを起こすことなく円滑に利用できる。
【0092】
(実施の形態4)
図18は本発明に係わる通信翻訳装置の他の実施の形態を示す構成図である。なお、同図において図1と同一部分には同一符号を付しその詳しい説明は省略する。
【0093】
この実施の形態は、ネットワーク上の情報を翻訳するに先立ち、要求元リンク情報から分野を判定する形態例である。
【0094】
この通信翻訳装置において、特に図1と比較して異なるところは、情報提供装置21 ,…,2n から提供される原文情報を翻訳する翻訳処理プログラムを記録する翻訳処理用記録媒体13aと翻訳処理および必要な制御を実行するCPUで構成された翻訳処理部14bを改良したことにある。
【0095】
この翻訳処理用記録媒体13bの翻訳処理プログラムは後述する図19に示す通りであって、ネットワーク1から情報を取り込む前に要求元リンクの文字列から分野を判定する処理プログラムを規定したものである。この翻訳処理用記録媒体13aとしては、一般的にはCD−ROMを用いるが、それ以外には例えば磁気テープ、DVD−ROM、フロッピーディスク、MO、MD、CD−R、メモリカードなどを用いてもよい。
【0096】
前記翻訳処理部14bは、表示部12に表示されるハイパーテキストデータのリンク元からリンク先の情報を要求するとき、その要求元リンク部の文字列データを取出し、この文字列から分野を判定する要求元文字列分野判定手段41と、要求先の情報提供装置21 ,…,2n から提供されてくる原文情報を受信し、この原文情報を要求元文字列分野判定手段41で判定させた分野の辞書を用いて翻訳処理を実行するデータ翻訳処理手段42とが設けられている。
【0097】
次に、以上のような装置の動作について図19を参照して説明する。なお、この図19はCPUをもつ翻訳処理部14bであるコンピュータが翻訳処理用記録媒体13aの翻訳処理プログラムを読み取って所定の機能を実現する一連の処理の流れを示す図でもある。
【0098】
すなわち、この通信翻訳装置について具体的に述べると、HTMLルールに基づき、表示部12に表示されているホームページを含むハイパーテキストデータのリンク元からリンク先となるネットワーク上の他の情報提供装置例えば21 に対してデータを要求するが、このとき翻訳処理部14bは、翻訳処理プログラムに基づいて新ページ要求元リンク部の文字列を抽出し(S31,要求元リンク文字列抽出機能)、その文字列の内容を分析し、記憶部16の辞書を参照しながら分野を判定する(S32,分野判定機能)。
【0099】
一方、入力部11からの新ページの要求に基づいて、要求先(リンク先)の情報提供装置例えば21 から新ページのデータが提供され通信制御部15で受信すると、当該通信制御部15からデータをダウンロードし(S33,新データ取込み機能)、受信データを辞書・文法および判定された分野に基づいて翻訳処理する(S34,翻訳処理機能)。
【0100】
従って、図20に示すように、例えばリンク元となる文字列に「政府」という文字があり、この「政府」をクリックしてリンク先に対して次ページのデータを要求する場合、「政府」が政治分野ないし政治経済分野の語であるので、政治分野ないし政治経済分野であると判定できる。よって、リンク先の次ページのデータを受け取る前に既に分野を特定されているので、次ページのデータを受信すると同時に当該分野に基づいて翻訳処理を進めることができ、ネットワーク上の情報であっても迅速に分野を定めて翻訳処理を行うことができる。
【0101】
さらに、本発明に係わる通信翻訳装置の他の実施の形態について図21を用いて説明する。
【0102】
この通信翻訳装置は、図18とほぼ同じ構成であるので、ここではその詳しい説明は省略し、特に異なるCPUをもつ翻訳処理部14cについて説明する。
【0103】
この翻訳処理部14cは、通信制御部15を介してネットワーク1上の情報提供装置例えば21 のデータを要求し、その要求に基づいて情報提供装置21 から送られてくるデータを通信制御部15で受信すると、その受信データを取込む受信データ取込み手段51と、この受信データ取込み手段51で取込んだデータに既に分野が特定されていないとき、当該データの分野を判定するデータ分野判定手段52と、このデータ分野が判定した後、受信データとともに判定された分野も同時に保存するデータ・分野保存手段53と、以後、同種のデータを要求・受信するとき、保存されている分野情報を用いて翻訳処理する翻訳処理手段54とが設けられている。13bは図22に示す一連の処理を実行させる翻訳処理プログラムを記録する翻訳処理用記録媒体である。
【0104】
次に、この通信翻訳装置の動作について図22を参照して説明する。なお、この図22はCPUをもつ翻訳処理部14cであるコンピュータが翻訳処理用記録媒体13bの翻訳処理プログラムを読み取って所定の機能を実現する一連の処理の流れを示す図でもある。
【0105】
この翻訳処理部14cは、入力部11からデータ要求を受けると、通信制御部15を介してネットワーク1上の情報提供装置例えば21 にデータ要求を行う(S41)。データ要求後、通信制御部15が情報提供装置21 から要求データを受信すると、翻訳処理部14cは、翻訳処理プログラムに基づいて通信制御部15の受信データを取込んだ後(S42,データ取込み機能)、この受信データAに関する分野が既にデータ記憶部17に保存されているか否かを判断する(S43,同種データ分野確認機能)。
【0106】
ここで、受信データAに関する分野がデータ記憶部17に保存されている場合、この分野の辞書の他、文法を用いて、受信データを翻訳処理する。(S44,第1の翻訳処理機能)。一方、受信データに関する分野がデータ記憶部17に保存されていないとき、当該受信データのサイトの分野が保存されているか否かを判断する(S45,サイト分野確認機能)。受信データAのサイトの分野が保存されている場合、その保存されている分野情報の他、当該分野の辞書や文法を用いて、受信データを翻訳するとともに、受信データの名前と分野とを同時にデータ記憶部17に保存する(S46,データ・サイト分野保存機能)。
【0107】
ステップS45において受信データのサイトの分野が保存されていない場合、標準環境の翻訳処理手続に従って受信データを翻訳処理しながら分野を調べ、受信データ、当該受信データのサイト名および調べた分野とを同時にデータ記憶部17に保存する(S47,データ・サイト名・分野保存機能)。
【0108】
従って、以上のような実施の形態によれば、通信制御部15を介して取込んだネットワーク1上のデータに関し、受信時に受信データの分野保存を確かめ、保存されていない場合に受信データの翻訳時または翻訳後で分野が明らかになったとき、受信データと共に分野も保存するので、例えばインターネット上の同じページに再度アクセスしてデータを取得する場合、保存中の分野をそのまま有効に活用でき、迅速に受信データを翻訳できる。さらに、受信データのサイトの分野を判定し、その判定分野を有効に利用する。これは、インターネットにおいて同じページを時々更新される例が多いが、その度に何回も同じページをアクセスして分野を繰り返し判定し翻訳処理する必要がなくなり、受信データの翻訳処理の効率を上げることができる。あるサーバは一定の分野に関するデータを提供する場合が多いことを有効に利用している。
【0109】
さらに、本発明に係わる通信翻訳装置の他の実施の形態について図23を参照して説明する。
【0110】
この実施の形態は、WEBサイトが時々情報が更新されるので、オートパイロット機能を用いて、1回だけでなく、定期的に同じページをアクセスするので、1回目に判定した分野を有効に利用する例である。
【0111】
すなわち、この装置においては、予めオートパイロットプログラムを設け、このプログラムにHTMLルールのURL(行き先)と所定の期間となる取得間隔とを設定する(S51,オートパイロットプログラム記憶手段)。この状態において所定の期間の経過により1回目の取得時間になると、インターネット上のホームページををアクセスし、ページデータを受信する(S52)。このページデータに関し、デフォルト分野での翻訳を実行し(S53)、このとき分野の判定を行うとともに、その判定結果の分野を記録する(S54)。
【0112】
しかる後、次の取得時間となったとき(S55)、インターネット上の同じページのデータを受信するが、既に判定ずみで記録されている分野を使用し、受信データを翻訳する(S56)。
【0113】
従って、この実施の形態によれば、WEBサイト側は分野を急変させることなく同じ分野の最新データに変更する場合が多いので、初めてサイト側にアクセスし翻訳処理したとき、分野が分からずに翻訳精度が低下したり、翻訳に時間がかかったりするが、このとき判定された分野を記憶しておけば、2回目以降に同一サイトをアクセスしたとき、既に記憶されている分野情報を使用することにより、精度の高い翻訳処理を実施できる。オートパイロット機能などを用いることにより、同じページを定期的にアクセスする場合に非常に有効な翻訳処理であると言える。
【0114】
(実施の形態5)
図24ないし図27は本発明に係わる通信翻訳装置の説明図である。なお、これらの図において図1と同一部分には同一符号を付し、その詳しい説明は省略する。
【0115】
この実施の形態は、インターネットを通してアンケートを行ったり、商品購入や予約などのごときオンラインショッピングする場合に有効な形態例である。
【0116】
インタネットを利用した従来の翻訳処理例は、図24に示すようにユーザが例えば英語を扱うサーバ(情報提供装置)61である場合、サーバ61から英語のホームページを含むハイパーテキスト情報が提供され、通信翻訳装置62によって日本語に翻訳され、ブラウザ63にて日本語の情報としてユーザに提供される。ここで、ユーザがブラウザ63を利用して必要な情報を入力すると、それが日本語であってもそのままサーバ61に送信できるが、英語を扱うサーバ側ではその日本語を受信できないといった問題がたびたび出てくる。
【0117】
例えばサーバ61が提供するホームページには、図25(a)に示すような例えば「Japan ,UK,USA」から1つの国籍を選択する選択項目と、自由記入のコメント欄とがあるものとする。このようなホームページでは、国籍選択およびコメント記入後に「「Send」ボタンをクリックすれば、その入力内容がサーバ61に伝送できる。
【0118】
ところで、以上のようなホームページがサーバ61から提供されるが、ユーザ側が英語を理解できない場合、通信翻訳装置62を経由して図25(b)のような日本語に翻訳すれば、ユーザ側はブラウザ63にて読み取ることができる。つまり、図25(b)は図25(a)のホームページを翻訳処理した従来の画面例である。ここでは、説明文だけでなく、国籍の部分も「日本」と翻訳されている。ここで、問1において「日本」を選択しサーバに送っても、サーバ側は「Japan ,UK,USA」しか受理できないので無効となる。また、問2においてコメント欄に日本語を書き込んでサーバに送っても、サーバ側が同様にその日本語のコメントを受理できない。
【0119】
そこで、例えば選択項目など必要な項目については翻訳しないようにすれば、サーバ側において受理できない問題は解消することができる。
【0120】
図26はかかる問題を解消するための本発明に係わる通信翻訳装置の構成図である。
【0121】
この通信システムは、アンケートやショッピング情報その他必要な情報を提供する情報提供装置21 ,…,2n 、この情報提供装置21 ,…,2n から提供される例えばWEB情報をネットワーク1を通して受信した後翻訳処理する翻訳処理装置3と、情報提供装置21 ,…,2n から提供されるWEB情報を取り込んだり、このWEB情報に対するコメント等を情報提供装置21 ,…,2n に伝送するユーザ側となるブラウザ56とからなっている。
【0122】
この通信翻訳装置3は、翻訳指示その他必要な指示等を入力するキーボード,マウス、スキャナなどの入力部11、情報提供装置21 ,…,2n から提供される種々の情報や翻訳結果等を表示するCRT,ビットマップ、ゴーグル、壁面投射などの表示部12、サーバとなる情報提供装置21 ,…,2n から提供されるWEB情報を翻訳処理用記録媒体13cの翻訳処理プログラムに基づいて翻訳処理および必要な制御を実行するコンピュータからなる翻訳処理部14d、ネットワーク1へのアクセス制御,情報の受信制御等を行う通信制御部15、辞書・文法データを記憶する辞書・文法記憶部16および受信した情報,訳文その他必要な情報を記憶するデータ記憶部17によって構成されている。
【0123】
なお、翻訳処理用記録媒体13cは、一般的にはCD−ROMを用いるが、それ以外には例えば磁気テープ、DVD−ROM、フロッピーディスク、MO、MD、CD−R、メモリカードなどを用いてもよい。
【0124】
前記翻訳処理部14dは、翻訳処理用記録媒体13cに記録されるプログラムを読み取り、図27に示すような一連の処理を実行する。
【0125】
次に、以上のような装置の動作について説明する。
【0126】
翻訳処理部14dは、ブラウザ56によって情報提供装置例えば21 から提供されるWEB情報を取り込むと、翻訳処理プログラムに基づき、通信制御部15にてWEB情報を受信したか否かを判断し(S61)、その受信情報を取り込んでデータ記憶部17に記憶する(S62、情報取込み記憶手段)。しかる後、このデータ記憶部17に記憶されている受信情報に関しタグから翻訳せずに情報提供装置側に返却する特定原文項目があるか否かを判断する(S63,特定原文項目有無判断手段)。ここで、特定原文項目があれば翻訳処理を実行しないが、特定原文項目でなければ一般の翻訳処理を実行する(S64,翻訳処理手段)。そして、全部の受信情報の翻訳が完了したか否かを判断し(S65)、翻訳完了の場合にはその翻訳結果の情報を表示部12に表示する(S66、翻訳情報表示手段)。このようにして翻訳結果の情報を表示した後、ブラウザ56に送信要求を送出する(S67)。ブラウザ56は、送信要求を受けると、表示されているWEB情報を情報提供装置側に送信する。
【0127】
図28は翻訳処理されたWEB情報の表示画面である。ゆえに、ユーザはWEB情報を見て、例えば国籍、商品名等の特定の原文項目を選択し行き先を指定すれば、情報提供装置21 に送信することができる。一方、情報提供装置21 では、必要な項目について原文のまま受信できる。
【0128】
図29は本発明に係わる通信翻訳システムの一実施の形態を構成図である。
【0129】
例えばユーザは選択項目である例えば「Japan 」も理解できないことが考えられる。そこで、通信翻訳装置3では、ブラウザ56にて情報提供装置21 から取り込んだ英語のWEB情報を一旦データ記憶部17に記憶した後、WEB情報全部を翻訳した後、ブラウザ56を用いて表示する。そして、このブラウザ56にて表示後、日本語のWEB情報を情報提供装置21 に送信するとき、通信翻訳装置3で英語に翻訳した後、情報提供装置21 に送信するようにしてもよい。
【0130】
従って、このようなシステムでは、特定選択項目を含むコメント欄のコメントも含めて情報提供装置21 が扱う言語に翻訳し、情報提供装置21 に送信することができる。
【0131】
一般に、ホームページ情報のコメント自由記入欄は、本来サーバである情報提供装置21 が何らかのコメント入力を期待しているが、例えば通信翻訳装置3を介してホームページをアクセスするユーザは、もともと日本語のホームページであると誤解し、日本語を入力する可能性がある。そこで、ユーザの入力項目も例えば情報提供装置21 が扱う言語である例えば英語に翻訳し、情報提供装置21 に送信すれば、情報提供装置21 側で受理できるだけでなく、ユーザ側が誤解して日本語のコメントを記入しても問題がなくなる。
【0132】
図30ないし図32は本発明に係わる通信翻訳システムの他の実施の形態を説明する図である。
【0133】
この実施の形態は、インターネットによる会話(チャット)システムに有効な形態例である。
【0134】
このシステムは、ネットワーク1に接続される例えば英語を扱うチャット用プログラムをもつ第1の会話装置66と、同じくネットワーク1に翻訳処理用プログラムをもつ通信翻訳装置3を介して接続される例えば日本語を扱うチャット用プログラムをもつ第2の会話装置67との間で異なる言語で相互に会話を行うシステムである。
【0135】
このシステムは、図30に示すように第1の会話装置66にて英語の会話情報を入力すると、その英語の会話情報がネットワーク1を経由し通信翻訳装置3に送られる。この通信翻訳装置3は、英語の会話情報を日本語の会話情報に変換し、第2の会話装置67に送信する。この第2の会話装置67は、日本語に変換された会話情報を表示し、その日本語の会話情報に基づいて必要な情報を伝送する場合、日本語の会話情報にて通信翻訳装置3に伝送する。この通信翻訳装置3は、日本語の会話情報を英語の会話情報に翻訳し、第1の会話装置66に伝送する。この第1の会話装置66は、英語で受けた会話情報を表示し、その会話内容に基づき、引き続き、英語の会話情報を入力する。
【0136】
ところで、以上のような翻訳通信システムでは、通信翻訳装置3を介することにより、相手に不快感を与える可能性が考えられる。そこで、会話への参加時、予め通信翻訳装置3の翻訳処理ソフトを介して会話を行っていることを表示することにより、相手の理解が得やすくする。
【0137】
図31はかかる翻訳処理ソフトを介して会話をしている旨を表示する本発明に係わる通信翻訳システムの他の実施の形態を示す構成図である。
【0138】
この通信翻訳システムの一部を構成する通信翻訳装置は、第1の会話装置66から提供される第一の言語の会話情報を受信し、第二の言語の会話情報に翻訳するための第1の翻訳処理プログラムを記憶する第1の記録媒体131 と、第2の会話装置66から提供される第二の言語の会話情報を第一の言語の会話情報に翻訳するための第2の翻訳処理プログラムを記憶する記録媒体132 と、翻訳処理ソフトを介して会話をしている旨のメッセージデータを記憶するメッセージデータ記憶部68と、CPUで構成される翻訳処理部14eとが設けられている。その他の構成は図1と同様であるので、同一部分には同一符号を付している。
【0139】
前記翻訳処理部14eは、第1の会話装置66から提供されるの第一の言語の会話用情報を第1の翻訳処理プログラムに従って第二の言語に翻訳し、また前記第2の会話装置から提供される第二の言語の会話情報を前記第2の翻訳処理プログラムに従って前記第一の言語の会話情報に翻訳する翻訳処理手段と、この翻訳処理手段によって第二の言語の会話情報を第一の言語の会話情報に翻訳しているとき、翻訳された会話情報の適宜な個所または当該翻訳された会話情報の前後の何れかにメッセージデータを付加するメッセージデータ付加手段とが設けられている。
【0140】
図32は、会話ヘの参加時、翻訳処理ソフトを使用していることを表す日本語から英語に翻訳処理した表示画面例である。図示(イ)矢印の記述は翻訳処理ソフトを使用していることを示すメッセージである。
【0141】
従って、以上のような通信翻訳装置によれば、翻訳された会話情報の適宜な個所に翻訳処理ソフトを介して会話をしている旨を表示するので、第1の会話装置側である相手方の理解を容易に得やすくなる。
【0142】
なお、以上のような会話情報は1対1だけでなく、複数人による会議当の会話にも同様に適用できることは言うまでもない。
【0143】
さらに、本発明に係わる通信システムの他の例としては、国外のユーザと会話をしているとき、相手の時刻が分からず時差により不都合が生じる場合がある。
【0144】
そこで、通信翻訳装置としては、国外のユーザと会話をしているとき、相手の時刻が分からず時差により不都合が生じる場合がある。そこで、アクセス先のアドレスに含まれる地域記号(日本ならjp,イギリスならばukなど)をもとに相手の標準時を表示させることも可能である。この場合には、地域記号ごとに自身の地域の時刻を基準に各地域の時差データを保存しておけば、自身の地域の時刻とアクセス先の地域の時差とから相手の標準時を表示させることができる。
【0145】
会話以外でも、締切りのある注文などのサイトにアクセスする場合に有効である。図33はかかる時刻を表示している画面例である。
【0146】
図34は本発明に係わる通信翻訳装置の他の実施の形態を示す構成図である。
【0147】
この実施の形態は、複数の原文大文字に続いて小文字の名詞句があるとき、訳文に原文を付加する形態例である。
【0148】
この通信翻訳装置は、ネットワークへの接続有無に拘らず適用可能なものであって、特に異なるところは、翻訳処理用記録媒体13の翻訳処理プログラムおよび翻訳処理部4fであり、その他は図1と同一の構成であるので、その詳しい説明は省略する。
【0149】
前記翻訳処理用記録媒体13に格納されている翻訳処理プログラムは、具体的には図35に示すような一連の処理を実現させるためのプログラムが格納されている。
【0150】
一方、翻訳処理部4fは、翻訳処理用記録媒体13に格納される翻訳処理プログラムを読み取って所要とする機能を実現するものであって、入力部11または情報提供装置21 ,…からネットワーク1および通信制御部15を介して一時的にデータ記憶部17に格納されている原文を翻訳する翻訳処理手段71、この翻訳結果である訳文中に名詞句があるか否かを判断する名詞句有無判断手段72およびその名詞句中に複数の原文大文字に続いて小文字の名詞句(固有名詞)があれば、訳文の後に小文字の名詞句を含めて原文を付加する原文付加手段73が設けられている。
【0151】
次に、以上のような通信翻訳装置の動作について図35を参照して説明する。
【0152】
この通信翻訳装置の翻訳処理部4fは、翻訳処理が起動すると翻訳処理用記録媒体13に格納される翻訳処理プログラムを読み取り、データ記憶部17から原文Aを読み取り、この原文Aからi分目を抽出し原文単位Bとする(S71〜S73)。さらに、この原文単位Bについて辞書・文法記憶部16に格納される辞書および文法を用いて翻訳処理を実行し、翻訳結果である訳文Cを得る(S74,翻訳処理手段)。
【0153】
しかる後、翻訳結果である訳文C中に名詞句があるか否かを判断し(S75,名詞句有無判断手段)、名詞句があればその名詞句が原文大文字から始まる語句を中心とする固有名詞の可能性があるか否かを判断し、固有名詞の可能性があるとき、その原文大文字の後に続く名詞句を含めて訳文の後に原文を付加し(S76,S77、原文付加手段)、引き続き、次の(i+1)分目の翻訳処理を実行する(S78,S79)。
【0154】
その結果、従来例えば図36(a)に示すような
原文「Machine Translation system」に対し、
「機械翻訳(Machine Translation )システム」と
翻訳処理していたが、これでは意味が分かり難かったが、本発明システムでは、同図(b)に示すように、
原文「Machine Translation system」に対し、
「機械翻訳システム(Machine Translation system)」と
翻訳処理するので、意味の分かり適切な訳文に翻訳できる。
【0155】
【発明の効果】
以上説明したように本発明によれば、インターネットを用いて相互に情報を授受するに際して言語上の違いによる障害を確実に除去できる通信翻訳装置を提供できる
【図面の簡単な説明】
【図1】 本発明に係わる通信翻訳装置の一実施の形態を示す構成図。
【図2】 図1に示す装置の動作および記録媒体の発明を説明するフローチャート。
【図3】 図1に示す装置を用いて、文単位に原文を埋め込んだ画面表示例を示す図。
【図4】 原文情報および翻訳処理された従来装置の画面表示例を示す図。
【図5】 従来の装置によるHTMLのテキストデータ、そのテキストデータの翻訳データおよび画面表示例を示す図。
【図6】 図3の原文を埋め込んだデータから原文データを読み出して表示した図。
【図7】 単語単位で原文を埋め込んだ例、ブラウザで読み出して表示した例および原文を読み出した画面表示例を示す図。
【図8】 図1に示す装置で用いて、訳文の他、原文単語+翻訳上の解析情報を抽出し保存する他の実施の形態を説明する図。
【図9】 図1に示す装置で用いて、他の訳文候補を抽出して保存する更に他の実施の形態を説明する図。
【図10】 図1に示す装置で用いて、他の訳文候補を抽出して保存する更に他の実施の形態を説明する図。
【図11】 本発明に係わる通信翻訳装置の他の実施の形態を示す構成図。
【図12】 図11に示す装置の動作および記録媒体の発明を説明するフローチャート。
【図13】 既存のデータと新規入力データとの間でリンクをはるためのデータ例を説明する図。
【図14】 図13に示す既存のデータと新規入力データとの意味概念の関連性を説明する図。
【図15】 既存のデータと新規入力データとの間でリンクをはる例を説明する図。
【図16】 本発明に係わる通信翻訳装置の更に他の実施の形態を示す構成図。
【図17】 図16に示す装置の動作および記録媒体の発明を説明するフローチャート。
【図18】 本発明に係わる通信翻訳装置の更に他の実施の形態を示す構成図。
【図19】 図18に示す装置の動作および記録媒体の発明を説明するフローチャート。
【図20】 リンク先の文字列から分野を特定するための説明図。
【図21】 本発明に係わる通信翻訳装置の更に他の実施の形態を示す構成図。
【図22】 図21に示す装置の動作および記録媒体の発明を説明するフローチャート。
【図23】 図21に示す装置を用いた他の実施の形態を示すフローチャート。
【図24】 本発明に係わる通信翻訳装置の更に他の実施の形態を説明する通信翻訳システムの概略構成図。
【図25】 ホームページを翻訳した従来の表示画面例を示す図。
【図26】 図24の中の通信翻訳装置の機能構成図。
【図27】 図26に示す装置および記録媒体の発明を説明するフローチャート。
【図28】 図24に示す通信翻訳装置による翻訳画面例を示す図。
【図29】 本発明に係わる通信翻訳システムの実施の形態を示す構成図。
【図30】 本発明に係わる通信翻訳システムのさらに実施の形態を示す構成図。
【図31】 図30の通信翻訳装置の一具体例を示す構成図。
【図32】 図30の通信翻訳装置において通信翻訳を行っている旨のメッセージを相手側に表示する表示画面例を示す図。
【図33】 相手側の標準時刻を表示する表示画面例を示す図。
【図34】 本発明に係わる通信翻訳装置の機能を示すブロック構成図。
【図35】 図34に示す通信翻訳装置の動作を説明するフローチャート。
【図36】 大文字固有名詞の後に続く小文字固有名詞の場合、訳文の後に大文字を含む小文字の固有名詞の原文を付加して表示する例を示す図。
【符号の説明】
1…ネットワーク
1 ,…,2n …情報提供装置
3…通信翻訳装置
11…入力部
12…表示部
13…翻訳処理用記録媒体
14…翻訳処理部
15…通信制御部

Claims (2)

  1. ネットワーク上に提供される原文情報を翻訳処理する通信翻訳装置において、
    前記ネットワーク上に提供される原文情報を所要の言語に翻訳処理する翻訳処理手段と、電子文書用マークアップ言語を用いて、前記翻訳された訳語に原文情報の単語および翻訳時の解析情報を埋め込んで保存する埋込み処理手段とを備えたことを特徴とする通信翻訳装置。
  2. ネットワーク上に提供される原文情報を翻訳処理する通信翻訳装置において、
    前記ネットワーク上に提供される原文情報を所要の言語に翻訳処理する翻訳処理手段と、電子文書用マークアップ言語を用いて、前記翻訳された訳文中に存在する訳語および当該訳語の他の訳語情報を保存し、前記訳文のみ、または当該訳文および選択可能に他の訳語情報を表示する表示手段とを備えたことを特徴とする通信翻訳装置。
JP23685098A 1998-08-24 1998-08-24 通信翻訳装置 Expired - Lifetime JP3959180B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP23685098A JP3959180B2 (ja) 1998-08-24 1998-08-24 通信翻訳装置
US09/379,792 US6330529B1 (en) 1998-08-24 1999-08-24 Mark up language grammar based translation system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP23685098A JP3959180B2 (ja) 1998-08-24 1998-08-24 通信翻訳装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2007018323A Division JP2007164809A (ja) 2007-01-29 2007-01-29 通信翻訳装置および記録媒体

Publications (2)

Publication Number Publication Date
JP2000067049A JP2000067049A (ja) 2000-03-03
JP3959180B2 true JP3959180B2 (ja) 2007-08-15

Family

ID=17006733

Family Applications (1)

Application Number Title Priority Date Filing Date
JP23685098A Expired - Lifetime JP3959180B2 (ja) 1998-08-24 1998-08-24 通信翻訳装置

Country Status (2)

Country Link
US (1) US6330529B1 (ja)
JP (1) JP3959180B2 (ja)

Families Citing this family (57)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1139231A1 (en) * 2000-03-31 2001-10-04 Fujitsu Limited Document processing apparatus and method
US20010054011A1 (en) * 2000-06-15 2001-12-20 Nec Corporation Contents conversion fee charging system, contents conversion fee charging method and storage medium storing program for controlling same
JP2002049555A (ja) * 2000-08-02 2002-02-15 Hiromune Kaneki 付記情報の表示方法および付記情報表示用記録媒体
US20020161928A1 (en) * 2000-10-10 2002-10-31 Awele Ndili Smart agent for providing network content to wireless devices
JP2002123662A (ja) * 2000-10-16 2002-04-26 Iis:Kk コンピュータ双方向通信ネットワークによる多言語市場調査の方法及びその通信システム並びに情報記録媒体
US7493250B2 (en) * 2000-12-18 2009-02-17 Xerox Corporation System and method for distributing multilingual documents
US7050979B2 (en) * 2001-01-24 2006-05-23 Matsushita Electric Industrial Co., Ltd. Apparatus and method for converting a spoken language to a second language
US6999916B2 (en) * 2001-04-20 2006-02-14 Wordsniffer, Inc. Method and apparatus for integrated, user-directed web site text translation
US7231460B2 (en) * 2001-06-04 2007-06-12 Gateway Inc. System and method for leveraging networked computers to view windows based files on Linux platforms
AU2002316581A1 (en) 2001-07-03 2003-01-21 University Of Southern California A syntax-based statistical translation model
JP2003016023A (ja) * 2001-07-04 2003-01-17 Nec Commun Syst Ltd 原文表示付きメッセージ掲示システム
EP1288793A1 (en) * 2001-08-27 2003-03-05 Sony NetServices GmbH Translation text management system
JP2003091344A (ja) * 2001-09-19 2003-03-28 Sony Corp 情報処理装置および情報処理方法、記録媒体、データ構造、並びにプログラム
JP3836734B2 (ja) * 2002-01-31 2006-10-25 株式会社東芝 メッセージ交換支援方法およびメッセージ交換支援システムおよびプログラム
JP3809863B2 (ja) * 2002-02-28 2006-08-16 インターナショナル・ビジネス・マシーンズ・コーポレーション サーバ
WO2004001623A2 (en) 2002-03-26 2003-12-31 University Of Southern California Constructing a translation lexicon from comparable, non-parallel corpora
US6957232B2 (en) * 2002-04-05 2005-10-18 Infocus Corporation Projector control markup language
JP2006501582A (ja) * 2002-09-30 2006-01-12 チャン,ニン−ピン 電子文書のテキスト情報に関するポインタにより瞬時に起動される2ヶ国語注釈
JP2006508448A (ja) * 2002-11-28 2006-03-09 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ワードクラス情報を割り当てる方法
US20040186767A1 (en) * 2003-03-20 2004-09-23 Yue Ma System and method employing portable device for capturing and using broadcast source content to operate other digital devices
AU2003901428A0 (en) * 2003-03-24 2003-04-10 Objective Systems Pty Ltd A system and method for formatting and distributing reading material
US8170863B2 (en) * 2003-04-01 2012-05-01 International Business Machines Corporation System, method and program product for portlet-based translation of web content
US8548794B2 (en) 2003-07-02 2013-10-01 University Of Southern California Statistical noun phrase translation
US7391885B2 (en) * 2003-07-30 2008-06-24 Xerox Corporation Method for determining overall effectiveness of a document
US7171618B2 (en) * 2003-07-30 2007-01-30 Xerox Corporation Multi-versioned documents and method for creation and use thereof
US7543270B1 (en) * 2004-01-23 2009-06-02 The Math Works, Inc. Tracing output descriptions generated from corresponding input descriptions
US20050197826A1 (en) * 2004-03-02 2005-09-08 Neeman Yoni M. Embedded translation document method and system
US8296127B2 (en) 2004-03-23 2012-10-23 University Of Southern California Discovery of parallel text portions in comparable collections of corpora and training using comparable texts
US8666725B2 (en) 2004-04-16 2014-03-04 University Of Southern California Selection and use of nonstatistical translation components in a statistical machine translation framework
DE202005022113U1 (de) 2004-10-12 2014-02-05 University Of Southern California Training für eine Text-Text-Anwendung, die eine Zeichenketten-Baum-Umwandlung zum Training und Decodieren verwendet
CN101137983A (zh) * 2005-01-10 2008-03-05 梅林格有限公司 嵌入式翻译增强的搜索
US7536640B2 (en) * 2005-01-28 2009-05-19 Oracle International Corporation Advanced translation context via web pages embedded with resource information
US8886517B2 (en) 2005-06-17 2014-11-11 Language Weaver, Inc. Trust scoring for language translation systems
US8676563B2 (en) 2009-10-01 2014-03-18 Language Weaver, Inc. Providing human-generated and machine-generated trusted translations
US8265924B1 (en) * 2005-10-06 2012-09-11 Teradata Us, Inc. Multiple language data structure translation and management of a plurality of languages
US10319252B2 (en) * 2005-11-09 2019-06-11 Sdl Inc. Language capability assessment and training apparatus and techniques
US8943080B2 (en) 2006-04-07 2015-01-27 University Of Southern California Systems and methods for identifying parallel documents and sentence fragments in multilingual document collections
US8886518B1 (en) 2006-08-07 2014-11-11 Language Weaver, Inc. System and method for capitalizing machine translated text
US7801721B2 (en) * 2006-10-02 2010-09-21 Google Inc. Displaying original text in a user interface with translated text
US8433556B2 (en) 2006-11-02 2013-04-30 University Of Southern California Semi-supervised training for statistical word alignment
US9122674B1 (en) * 2006-12-15 2015-09-01 Language Weaver, Inc. Use of annotations in statistical machine translation
US8468149B1 (en) * 2007-01-26 2013-06-18 Language Weaver, Inc. Multi-lingual online community
US8615389B1 (en) 2007-03-16 2013-12-24 Language Weaver, Inc. Generation and exploitation of an approximate language model
US8831928B2 (en) 2007-04-04 2014-09-09 Language Weaver, Inc. Customizable machine translation service
US8825466B1 (en) 2007-06-08 2014-09-02 Language Weaver, Inc. Modification of annotated bilingual segment pairs in syntax-based machine translation
US8707252B1 (en) 2008-09-03 2014-04-22 Emc Corporation Techniques for automatic generation of parsing code
US8990064B2 (en) 2009-07-28 2015-03-24 Language Weaver, Inc. Translating documents based on content
US8380486B2 (en) 2009-10-01 2013-02-19 Language Weaver, Inc. Providing machine-generated translations and corresponding trust levels
US10417646B2 (en) 2010-03-09 2019-09-17 Sdl Inc. Predicting the cost associated with translating textual content
US11003838B2 (en) 2011-04-18 2021-05-11 Sdl Inc. Systems and methods for monitoring post translation editing
US8694303B2 (en) 2011-06-15 2014-04-08 Language Weaver, Inc. Systems and methods for tuning parameters in statistical machine translation
US8886515B2 (en) 2011-10-19 2014-11-11 Language Weaver, Inc. Systems and methods for enhancing machine translation post edit review processes
US8942973B2 (en) 2012-03-09 2015-01-27 Language Weaver, Inc. Content page URL translation
US10261994B2 (en) 2012-05-25 2019-04-16 Sdl Inc. Method and system for automatic management of reputation of translators
JP2014075073A (ja) * 2012-10-05 2014-04-24 Fuji Xerox Co Ltd 翻訳処理装置及びプログラム
US9152622B2 (en) 2012-11-26 2015-10-06 Language Weaver, Inc. Personalized machine translation via online adaptation
US9213694B2 (en) 2013-10-10 2015-12-15 Language Weaver, Inc. Efficient online domain adaptation

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05298360A (ja) * 1992-04-17 1993-11-12 Hitachi Ltd 翻訳文評価方法、翻訳文評価装置、翻訳文評価機能付き機械翻訳システムおよび機械翻訳システム評価装置
JP3377290B2 (ja) * 1994-04-27 2003-02-17 シャープ株式会社 イディオム処理機能を持つ機械翻訳装置
US5715466A (en) * 1995-02-14 1998-02-03 Compuserve Incorporated System for parallel foreign language communication over a computer network
JP3161942B2 (ja) * 1995-06-14 2001-04-25 シャープ株式会社 訳振り機械翻訳装置

Also Published As

Publication number Publication date
US6330529B1 (en) 2001-12-11
JP2000067049A (ja) 2000-03-03

Similar Documents

Publication Publication Date Title
JP3959180B2 (ja) 通信翻訳装置
US10796076B2 (en) Method and system for providing suggested tags associated with a target web page for manipulation by a useroptimal rendering engine
US7493560B1 (en) Definition links in online documentation
US6073143A (en) Document conversion system including data monitoring means that adds tag information to hyperlink information and translates a document when such tag information is included in a document retrieval request
US7176931B2 (en) Modifying hyperlink display characteristics
US20140122056A1 (en) Chatbot system and method with enhanced user communication
JP2003529845A (ja) ネットワーク経由の多言語翻訳を提供する方法と装置
JP2006244296A (ja) 読み上げ用ファイル作成装置、リンク読み上げ装置、及びプログラム
JPH11250105A (ja) 多言語情報検索方法およびシステム
KR100237385B1 (ko) 웹 브라우저 상의 음성 인식기 구현방법
US20140164296A1 (en) Chatbot system and method with entity-relevant content from entity
JPWO2008126862A1 (ja) 情報提供システム
US6035338A (en) Document browse support system and document processing system
Mátrai How to make an electronic library accessible
JP4048188B2 (ja) Webページ翻訳装置及びwebページ翻訳方法
KR20200034660A (ko) 쉬워진 사용자 반응
KR20120131480A (ko) 단어 학습 서비스 제공 시스템 및 방법
JP3571312B2 (ja) リンク集作成装置、リンク集作成方法、及びリンク集作成プログラム
US20020143817A1 (en) Presentation of salient features in a page to a visually impaired user
KR20000039748A (ko) 다국어 웹 문서 번역 서비스 장치 및 이를 이용한번역 서비스 방법
JP4194741B2 (ja) 画面読み上げソフトを使用する利用者に向けたWebページ案内サーバー及び方法
JP2004240859A (ja) 言い換えシステム
Vázquez A controlled language-based evaluation approach to ensure image accessibility during web localisation
KR20010015932A (ko) 음성인식을 이용한 웹브라우저상의 링크 실행방법
Ghose et al. Architecture of a web browser for visually handicapped people

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040927

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061128

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070129

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20070129

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20070220

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070508

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070514

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100518

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110518

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110518

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120518

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120518

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130518

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130518

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140518

Year of fee payment: 7

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term