JP2007052613A - 翻訳装置、翻訳システムおよび翻訳方法 - Google Patents
翻訳装置、翻訳システムおよび翻訳方法 Download PDFInfo
- Publication number
- JP2007052613A JP2007052613A JP2005236980A JP2005236980A JP2007052613A JP 2007052613 A JP2007052613 A JP 2007052613A JP 2005236980 A JP2005236980 A JP 2005236980A JP 2005236980 A JP2005236980 A JP 2005236980A JP 2007052613 A JP2007052613 A JP 2007052613A
- Authority
- JP
- Japan
- Prior art keywords
- translation
- data
- original text
- identification information
- translation data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 32
- 238000000605 extraction Methods 0.000 claims description 13
- 238000006243 chemical reaction Methods 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 14
- 230000005540 biological transmission Effects 0.000 description 13
- 230000002093 peripheral effect Effects 0.000 description 12
- 238000012015 optical character recognition Methods 0.000 description 9
- 238000013523 data management Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 238000007726 management method Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
【課題】 予め記憶手段に原稿が翻訳された翻訳データがある場合、この翻訳データを利用して利用者にデータを提供する。これにより、変換時間及び翻訳時間が必要なく、短時間で正確な翻訳データを提供できる。
【解決手段】 本発明に係る翻訳装置によれば、記憶手段に原文に対応した翻訳データが予め存在する場合(ステップS4;YES)には、その翻訳データを利用する。翻訳データはなく原文データが存在している場合、原文データを翻訳処理して翻訳データを得る(ステップS7)。原文データおよび翻訳データがない場合、原稿から得た文書データを翻訳処理し(ステップS9)、この翻訳データを利用する。
【選択図】 図5
【解決手段】 本発明に係る翻訳装置によれば、記憶手段に原文に対応した翻訳データが予め存在する場合(ステップS4;YES)には、その翻訳データを利用する。翻訳データはなく原文データが存在している場合、原文データを翻訳処理して翻訳データを得る(ステップS7)。原文データおよび翻訳データがない場合、原稿から得た文書データを翻訳処理し(ステップS9)、この翻訳データを利用する。
【選択図】 図5
Description
本発明は、高い翻訳精度で翻訳を行うことの出来る翻訳装置、翻訳システムおよび翻訳方法に関する。
近年のグローバルな情報流通、経済活動など、国境を越えた活動の広がりにより、ある言語(例えば、日本語)から別の言語(例えば、英語、中国語)へ変換する翻訳の需要が高まっている。しかし、翻訳を業者(翻訳者)に依頼すると、一般に価格が高く、また時間もかかってしまうため、コンピュータなどの機械を用いて自動的に翻訳する自動翻訳の需要が高まっている。
一般的に、自動翻訳は、文章が印刷された紙をスキャナ装置にかけてイメージ化された画像データを取得し、この画像データを文字認識(例えば、OCR(Optical Character Recognition:光学的文字認識))処理によってテキスト化した文書データに変換し、この文書データを機械翻訳のソフトウェアを用いて第1言語から第2言語に翻訳するものである。
この機械翻訳のソフトウェアは、文書解析によりテキスト化された文書データから単語単位で文字を認識させ、翻訳辞書を参照して単語の意味を導き、係り受けの関係から翻訳文を作成するといった具合で行っている。
この機械翻訳のソフトウェアは、文書解析によりテキスト化された文書データから単語単位で文字を認識させ、翻訳辞書を参照して単語の意味を導き、係り受けの関係から翻訳文を作成するといった具合で行っている。
また、機械翻訳では、その翻訳精度は翻訳辞書に記憶された単語数に依存しているため、記憶容量に対応したデータ数によって機械翻訳の精度が設定されてしまう。さらに、日本語を他の言語に翻訳する場合を考えると、日本語は主語を省略して記載する場合があるため、機械翻訳では省略されている主語を補って翻訳することは困難である。
これに対し、人による翻訳は、辞書に記憶されていない新語に対しても、翻訳者の経験によって対応させて翻訳させることもでき、前後の文章から省略されている主語を補完して翻訳することも可能である。
このように、機械翻訳による翻訳精度は、文字認識による精度と機械翻訳のソフトウェアによる精度によって決まってしまうため、人による翻訳よりも精度が落ちることになる。例えば、第2言語で記載された翻訳データを第1言語に戻す場合、2度翻訳処理を行うため、得られた文書データはかなり難解な文章となってしまい、理解できなくなってしまう虞がある。
これに対し、人による翻訳は、辞書に記憶されていない新語に対しても、翻訳者の経験によって対応させて翻訳させることもでき、前後の文章から省略されている主語を補完して翻訳することも可能である。
このように、機械翻訳による翻訳精度は、文字認識による精度と機械翻訳のソフトウェアによる精度によって決まってしまうため、人による翻訳よりも精度が落ちることになる。例えば、第2言語で記載された翻訳データを第1言語に戻す場合、2度翻訳処理を行うため、得られた文書データはかなり難解な文章となってしまい、理解できなくなってしまう虞がある。
ここで、翻訳精度を上げる技術としては、文字認識により認識した文字を翻訳する際、翻訳辞書に該当する単語が存在しない場合には、自動的に単語の修正を行う技術(特許文献1、参照)、文字列の一部或いは全部を置換したバーコードを原稿に印刷し、必要に応じて専用のバーコード読取装置を用いて、このバーコードを読取って文字列に変換する技術(特許文献2、参照)がある。
しかし、特許文献1が機械翻訳のソフトウェアの精度を上げるものであり、特許文献2がイメージデータからテキストデータに変換する文字認識の精度を上げるものである。しかし、何れの技術であっても、所詮人による翻訳精度には到達することができない。
本発明は、前述した先行技術に鑑みてなされたもので、原文に対応した翻訳データがある場合には、その翻訳データを利用することで、翻訳精度の高い翻訳装置、翻訳システムおよび翻訳方法を提供することを目的とする。
前記目的を達成するために、本発明が採用する翻訳装置は、原文を翻訳した翻訳データを、前記原文の識別情報に対応付けて記憶した記憶手段と、識別情報とともに入力された原文入力データから前記識別情報を抽出する抽出手段と、前記抽出手段により抽出された前記識別情報に対応した翻訳データが、前記記憶手段に有るか否かを判定する判定手段と、前記判定手段が翻訳データ有りと判定した場合には前記記憶手段内の翻訳データを出力し、前記判定手段が翻訳データ無しと判定した場合には前記原文入力データに対して翻訳処理を施した翻訳データを出力する翻訳データ出力手段と、を具備したことを特徴とする。
この発明によれば、原文に対応した翻訳データが予め存在する場合には、その翻訳データを利用することで、翻訳処理および文字認識処理を行う必要がなく、原文入力データから翻訳データへの翻訳精度に拘わらず、翻訳精度の高い翻訳を実現することができる。
本発明が採用する別の翻訳装置は、原文データ、またはこの原文を翻訳した翻訳データのうち、少なくとも何れか一方のデータを、前記原文の識別情報に対応付けて記憶した記憶手段と、識別情報とともに入力された原文入力データから前記識別情報を抽出する抽出手段と、前記抽出手段により抽出された前記識別情報に対応した翻訳データたまは原文データが、前記記憶手段に有るか否かを判定する判定手段と、前記判定手段が翻訳データ有りと判定した場合には前記記憶手段内の翻訳データを出力し、前記判定手段が翻訳データ無しと判定した場合には前記記憶手段内の原文データに対して翻訳処理を施した翻訳データを出力し、さらに前記判定手段が翻訳データおよび原文データのいずれも無いと判定した場合には前記原文入力データに対して翻訳処理を施した翻訳データを出力する翻訳データ出力手段と、を具備したことを特徴とする。
この発明によれば、原文に対応した翻訳データが予め存在する場合には、その翻訳データを利用することで、翻訳処理および文字認識処理を行う必要がなく、原文入力データから翻訳データへの翻訳精度に拘わらず、翻訳精度の高い翻訳を実現することができる。さらに、翻訳データが存在せずに、被翻訳文となる原文に対応した原文データが存在する場合には、この原文データを翻訳して翻訳データを得ることで、文字認識処理による文字の誤認識を防止でき、ひいては翻訳精度を高める。
上記構成において、前記判定手段により原文の識別情報に対応した翻訳データが前記記憶手段に無い場合には、前記原文データに対して翻訳処理を施した翻訳データを、前記原文の識別情報に対応した翻訳データとして前記記憶手段に更新記憶するデータ更新記憶手段を備えることが望ましい。
上記構成において、操作者の操作に応じて翻訳データを修正する翻訳データ修正手段を備え、前記データ更新記憶手段によって前記記憶手段に更新記憶される翻訳データは、前記翻訳データ修正手段によって修正されたデータであることが望ましい。
上記構成において、前記抽出手段で抽出される識別情報は、特定文字列または特定画像によって現されることが望ましい。
上記構成において、前記翻訳データ出力手段は印刷手段であり、前記印刷手段は、翻訳データの文章を印刷するとともに、翻訳データの識別情報を特定文字列または特定画像として印刷することが望ましい。
上記構成において、画像読み取り手段を備え、前記画像読み取り手段は、原文が印刷された原稿から画像を読み取って識別情報および原文入力データを生成して前記抽出手段に出力することが望ましい。
上記構成において、操作者の操作に応じて翻訳データを修正する翻訳データ修正手段を備え、前記データ更新記憶手段によって前記記憶手段に更新記憶される翻訳データは、前記翻訳データ修正手段によって修正されたデータであることが望ましい。
上記構成において、前記抽出手段で抽出される識別情報は、特定文字列または特定画像によって現されることが望ましい。
上記構成において、前記翻訳データ出力手段は印刷手段であり、前記印刷手段は、翻訳データの文章を印刷するとともに、翻訳データの識別情報を特定文字列または特定画像として印刷することが望ましい。
上記構成において、画像読み取り手段を備え、前記画像読み取り手段は、原文が印刷された原稿から画像を読み取って識別情報および原文入力データを生成して前記抽出手段に出力することが望ましい。
本発明に係る翻訳装置によれば、記憶手段に原文に対応した翻訳データが予め存在する場合には、その翻訳データを利用することで、翻訳処理および文字認識処理を行う必要がなく、原文入力データから翻訳データへの翻訳精度に拘わらず、翻訳精度の高い翻訳文を得ることができる。しかも、記憶された翻訳データを利用する場合には、変換時間及び翻訳時間が必要ないため、短時間で正確な翻訳データを得ることができる。
以下、図面を参照してこの発明の実施の形態を説明する。図1は、本実施形態による翻訳システム1の全体構成を示す図である。このシステム1は、ネットワーク300を介して接続された複合機100および翻訳サーバ200を具備している。
複合機100は、コピー、スキャナ、プリンタの機能を備える。複合機100は、ネットワーク300を介して翻訳サーバ200或いはパソコン等のユーザ端末(図示せず)に接続されている。翻訳サーバ200は、翻訳処理を専門に行うサーバ装置であり、複合機100から原文に対応するデータを受信し、受信した原文に対する翻訳データを生成して返信する機能を有する。
複合機100は、コピー、スキャナ、プリンタの機能を備える。複合機100は、ネットワーク300を介して翻訳サーバ200或いはパソコン等のユーザ端末(図示せず)に接続されている。翻訳サーバ200は、翻訳処理を専門に行うサーバ装置であり、複合機100から原文に対応するデータを受信し、受信した原文に対する翻訳データを生成して返信する機能を有する。
<1.複合機100の構成>
図2は、複合機100の機能構成を示すブロック図である。この複合機100は、読み取り部110、画像形成部120、送受信部130、印刷部140およびこれらを制御する制御部150を具備する。制御部150は、図示しないCPU,RAMおよびROMを備えており、各種処理を司る機能を有する。
図2は、複合機100の機能構成を示すブロック図である。この複合機100は、読み取り部110、画像形成部120、送受信部130、印刷部140およびこれらを制御する制御部150を具備する。制御部150は、図示しないCPU,RAMおよびROMを備えており、各種処理を司る機能を有する。
送受信部130は、翻訳サーバ200等のネットワーク300に接続された外部機器(図示せず)との間でデータの授受を行う。印刷部140は、画像形成部120で形成された画像データを受けて用紙(記録材)上に画像を印刷する。
そして、複合機100は、読み取り部110が読み取った画像データを、送受信部130を経由して外部の装置に出力することによりスキャナ機として機能する。また、読み取り部110が読み取った画像データに応じた画像を画像印刷部140から出力することによりコピー機として機能する。さらに、複合機100は、外部からデータ送受信部130を経由して受信したデータに応じた画像を画像印刷部140において出力することにより、プリンタ機として機能する。
ここで、本実施形態に用いられる原稿Mは、図1に示すように、原文と、その余白の所定位置にこの原文文書IDを示すバーコードBMとが印刷され、複合機100から出力される翻訳原稿Tには、翻訳文と、その余白の所定位置にその翻訳文書IDを示すバーコードBTが印刷される。
本実施形態による複合機100の制御部150は、各部に以下の処理を行わせる。
まず、制御部150は、利用者が図示しない入力指示装置から原稿Mの翻訳対象言語の指示を受ける。次に、読み取り部110が、原稿Mを読み取ることにより、この原稿M上に印刷された原文およびバーコードBMから原文画像データおよび識別情報の画像データを取得し、送受信部130が、この原文画像データおよび翻訳対象言語を外部の翻訳サーバ200に送信する。
一方、後述する処理を経て得られた翻訳データが翻訳サーバ200から送信されると、この翻訳データを送受信部130が受信すると、画像形成部120が、テキスト形式の翻訳データをイメージ形式の翻訳画像データに変換する。この際、翻訳データにバーコードを印刷するための識別情報を現すデータが付加されている場合には、変換したバーコードの画像データを翻訳画像データに付加する。そして、印刷部140が、この翻訳画像データを用紙に印刷して翻訳原稿Tを出力する。これにより、利用者は、翻訳対象語に翻訳された翻訳原稿Tを取得する。
まず、制御部150は、利用者が図示しない入力指示装置から原稿Mの翻訳対象言語の指示を受ける。次に、読み取り部110が、原稿Mを読み取ることにより、この原稿M上に印刷された原文およびバーコードBMから原文画像データおよび識別情報の画像データを取得し、送受信部130が、この原文画像データおよび翻訳対象言語を外部の翻訳サーバ200に送信する。
一方、後述する処理を経て得られた翻訳データが翻訳サーバ200から送信されると、この翻訳データを送受信部130が受信すると、画像形成部120が、テキスト形式の翻訳データをイメージ形式の翻訳画像データに変換する。この際、翻訳データにバーコードを印刷するための識別情報を現すデータが付加されている場合には、変換したバーコードの画像データを翻訳画像データに付加する。そして、印刷部140が、この翻訳画像データを用紙に印刷して翻訳原稿Tを出力する。これにより、利用者は、翻訳対象語に翻訳された翻訳原稿Tを取得する。
<2.翻訳サーバ200の構成>
図3は、翻訳サーバ200の機能構成を示すブロック図である。翻訳サーバ200は、文書データベース210が接続された文書管理部220,翻訳辞書部230,送受信部240およびこれらを制御する制御部250を具備する。制御部250は、図示しないCPU,RAMおよびROMを備えており、各種処理を司る機能を有する。
図3は、翻訳サーバ200の機能構成を示すブロック図である。翻訳サーバ200は、文書データベース210が接続された文書管理部220,翻訳辞書部230,送受信部240およびこれらを制御する制御部250を具備する。制御部250は、図示しないCPU,RAMおよびROMを備えており、各種処理を司る機能を有する。
送受信部240は、複合機100等のネットワーク300に接続された外部機器(図示せず)との間でデータの授受を行う。翻訳辞書部230は、制御部250からの指示に基づき、原文データを翻訳対象言語に翻訳する際に用いられるものであり、種々の言語に対する辞書を備えている。
文書データベース210には、テキスト形式の文書データ(ファイル)が文書ID毎に対応付けて格納されている。この文書データの文書データベース210への格納処理は、後述する図5のステップS8における処理のみではなく、複合機100のスキャナ機能、コピー機能、プリンタ機能を動作させた際、或いは利用者の操作処理された際に行われる。原稿の文書データ(原文データ或いは翻訳データ)を文書IDと共に文書データベース210に格納させ、自動的或いは利用者の操作によって文書データ管理部220に翻訳データの文書IDと文書名を記憶更新させる。
文書管理部220は、文書データベース210に格納されている文書データを管理するもので、図4(a)に示すような複数のデータテーブルが基準となる文書ID毎に記憶されている。このデータテーブルには、第1言語版の文書ID,文書名(ファイル名)、第2言語版の文書ID,文書名(ファイル名)、第3言語版の文書ID,文書名(ファイル名)が、文書データベース210に格納されている文書データに対応付けて書き込まれる。例えば、このデータテーブルには、日本語の○○指示書(文書ID;001−1)、英語の○○指示書(文書ID;001−2),中国語の○○指示書(文書ID;001−3)といったように記憶される。この例では、初めの3文字を共通の文字列にして各文書が関連あることを示し、添え字により文書の記載言語形式(第1言語、第2言語、第3言語)を示している。
図4(a)のデータテーブルについて説明すると、原文が日本語版の文書であった場合には、この文書の文書IDは“001−1”となり、この文書ID“001−1”に対応した文書は、英語版の文書(文書ID“001−2”)と中国語版の文書(文書ID“001−3”)となる。
また、原文が英語版の文書であった場合には、この文書の文書IDは“001−2”となり、この文書ID“001−2”に対応した文書は、日本語版の文書(文書ID“001−1”)と中国語版の文書(文書ID“001−3”)となる。
さらに、原文が中国語版の文書であった場合には、この文書の文書IDは“001−3”となり、この文書ID“001−3”に対応した文書は、日本語版の文書(文書ID“001−1”)と英語版の文書(文書ID“001−2”)となる。
さらに、図4(a)の場合には、このようなデータテーブルがn個存在する。
また、原文が英語版の文書であった場合には、この文書の文書IDは“001−2”となり、この文書ID“001−2”に対応した文書は、日本語版の文書(文書ID“001−1”)と中国語版の文書(文書ID“001−3”)となる。
さらに、原文が中国語版の文書であった場合には、この文書の文書IDは“001−3”となり、この文書ID“001−3”に対応した文書は、日本語版の文書(文書ID“001−1”)と英語版の文書(文書ID“001−2”)となる。
さらに、図4(a)の場合には、このようなデータテーブルがn個存在する。
一方、図4(b)のデータテーブルは、「日本語版」の文書が文書データベース210に格納されていない場合である。この場合であっても、原文の文書IDが“001−1”であれば、共通の基本名を検索語としてこのデータベースを抽出でき、文書データベースに英語版の文書(文書ID“001−2”)と中国語版の文書(文書ID“001−3”)が格納されている。
また、文書管理部220には、1つの基準となる文書(原文)の文書IDに対して1つのデータテーブルが形成されるため、文書管理部220では、複数のデータテーブルを備えることになる。
この図4では、便宜上、日本語版の文書ID“001−1”を原文の文書IDとしているが、抽出された文書IDが“001−2”の場合には、英語版の文書が原文となり、どの文書であっても抽出された文書IDに対応した文書が原文となる。
また、文書管理部220には、1つの基準となる文書(原文)の文書IDに対して1つのデータテーブルが形成されるため、文書管理部220では、複数のデータテーブルを備えることになる。
この図4では、便宜上、日本語版の文書ID“001−1”を原文の文書IDとしているが、抽出された文書IDが“001−2”の場合には、英語版の文書が原文となり、どの文書であっても抽出された文書IDに対応した文書が原文となる。
本実施形態による翻訳サーバ200の制御部250は、以下に述べる翻訳処理を行う。
以下、図5に示す流れ図に基づき、翻訳サーバ200の動作について説明する。
この翻訳サーバ200は、複合機100から送信された原文画像データおよびバーコードの画像データを送受信部240で受信することによって動作を開始するものである。
以下、図5に示す流れ図に基づき、翻訳サーバ200の動作について説明する。
この翻訳サーバ200は、複合機100から送信された原文画像データおよびバーコードの画像データを送受信部240で受信することによって動作を開始するものである。
複合機100からの原文画像データが送受信部240で受信されると、制御部250は、イメージ形式の原文画像データを文字認識処理(例えば、OCR処理)してテキスト形式のデータに変換する。この際、原文画像データにバーコードを示す画像データがあるため、このバーコードが文字データに変換され、このバーコードの意味する情報、即ち文書IDを抽出する(ステップS1)。
次に、制御部250は、ステップS1の処理により、バーコードによる文書IDが抽出されたか否かを判定する(ステップS2)。制御部250は、文書IDが抽出された場合には(ステップS2;YES)、ステップS3に移行する。
制御部250は、抽出された文書IDを検索キーとして、文書データ管理部220の文書IDとを照合させることにより、文書データベース210に格納されている文書データおよび翻訳データを検索して検索結果を得る(ステップS3)。
図4(a)のデータテーブルの例では、抽出された原文文書IDが“001−1”である場合には、初めの3文字を検索キーとして検索することにより、日本語の文書データを始め、英語版の翻訳データ、中国語版の翻訳データが文書データベース210に格納されていることを検索結果として得る。
図4(a)のデータテーブルの例では、抽出された原文文書IDが“001−1”である場合には、初めの3文字を検索キーとして検索することにより、日本語の文書データを始め、英語版の翻訳データ、中国語版の翻訳データが文書データベース210に格納されていることを検索結果として得る。
制御部250は、検索結果から文書データベース210に翻訳データが有るか否かを判定する(ステップS4)。翻訳対象語の翻訳データが文書データベース210に格納されていた場合には(ステップS4;YES)、文書IDに対応した翻訳データを読み出し、この翻訳データを記憶エリア(図示せず)に一時的に記憶する(ステップS5)。
翻訳データの有無は、例えば、利用者が要求する翻訳対象言語が英語の場合には、検索結果から、原文文書ID“001−1”に対して英語版の翻訳データの文書ID“001−2”があるため、英語版の翻訳データが文書データベース210に格納されていることが分かる。
翻訳データの有無は、例えば、利用者が要求する翻訳対象言語が英語の場合には、検索結果から、原文文書ID“001−1”に対して英語版の翻訳データの文書ID“001−2”があるため、英語版の翻訳データが文書データベース210に格納されていることが分かる。
一方、ステップS4で、翻訳データが文書データベース210に格納されていない場合には(ステップS4;NO)、制御部250は検索結果から文書データベース210に原文データが有るか否かを判定する(ステップS6)。原文データが文書データベース210に格納されていた場合には(ステップS6;YES)、文書IDに対応した原文データを読み出し、この原文データに基づいた翻訳処理を翻訳辞書部230を利用して行い、この処理で得られた翻訳データを記憶エリアに一時的に記憶する(ステップS7)。
さらに、制御部250は、ステップS7で得られた翻訳データを文書データベース210に格納すると共に、文書データ管理部220のデータテーブルに原文の文書IDの添え字を変えた文書IDを翻訳文の文書名(ファイル名)に対応付けて加えることによりデータベースを更新する(ステップS8)。
また、ステップS2の判定処理において受信した原文画像データから文書IDが抽出されなかった場合(ステップS2;NO)、或いはステップS6の判定処理において文書データベース210に原文データが格納されていない場合には(ステップS6;NO)、制御部250は、原文画像データをテキスト化したデータに対して翻訳処理を行い、この処理で得られた翻訳データを記憶エリアに一時的に記憶する(ステップS9)。
なお、この処理後に、文書データベース210に翻訳前の原文データを文書IDと共に格納し、文書データ管理部220に原文データを文書IDに対応した新たなデータテーブルを作成するようにしてもよい。
なお、この処理後に、文書データベース210に翻訳前の原文データを文書IDと共に格納し、文書データ管理部220に原文データを文書IDに対応した新たなデータテーブルを作成するようにしてもよい。
そして、制御部250では、3通りの処理のうち何れかの処理によって得られた翻訳データを送受信部240を介して複合機100に送信する(ステップS10)。この送信される翻訳データには、翻訳文を現すデータと共に、この翻訳文を示す文書IDが含まれている。
翻訳データを受信した複合機100では、前述した如く、複合機100の制御部150は、画像形成部120により、テキスト形式の翻訳データを翻訳データの文書IDを示すバーコードBTを含むイメージ形式の翻訳画像データに変換させる。そして、印刷部140で、この翻訳画像データの翻訳文およびバーコードを用紙に印刷させて翻訳原稿Tを出力する(図1、参照)。
このように、本実施形態による翻訳システム1では、予め翻訳サーバ200の文書データベース210に原文に対応した翻訳文を示す翻訳データが格納されている場合には、その翻訳データを複合機100に送信することにより、OCR処理や翻訳処理を省略でき、翻訳精度の高い翻訳文を利用者に提供することができる。しかも、翻訳処理を行わずに済むため、翻訳時間を大幅に短縮することが出来る。
また、翻訳データが文書データベース210に格納されていない場合であっても、原文の文書データが文書データベース210に格納されている場合には、この文書データを翻訳処理することにより、OCR処理を行わずに済むため、OCR処理による文字の誤認識を防止でき、原文をOCR処理および翻訳処理を行って得た翻訳文に比べて誤翻訳を低減することができる。
以上のように、本実施形態による翻訳システム1は、利用者に対して精度の高い翻訳文を提供することが可能となる。
以上のように、本実施形態による翻訳システム1は、利用者に対して精度の高い翻訳文を提供することが可能となる。
以上、本発明の実施形態について説明したが、本発明は上述の実施形態に限定されるものではなく、種々の態様が可能である。
前記実施形態では、複合機100の読み取り部110で、読み取った原文画像データを翻訳サーバ200に送信するようにしたが、本発明は、原稿の所定位置にバーコードが印刷されているのであれば、原稿画像データからバーコードの識別IDのみを読み取り、翻訳サーバ200に送信するようにしても良い。これにより、バーコードのデータ容量に比べて大容量となる原文画像データを送信することがなくなり、ネットワーク300を経由しての送信時間を大幅に短縮できる。
翻訳サーバ200の文書データベース210に翻訳データおよび原文データが格納されていない場合、原文画像データを再度複合機100から翻訳サーバ200に送信すればよい。
また、複合機100の読み取り部110で原稿Mを読み取った段階で、OCR処理を施してイメージ形式の原文画像データからテキスト形式の原文入力データに変換してもよい。但し、この原文入力データと予め文書データベース210に格納されている文書データとは異なったものである。
前記実施形態では、複合機100の読み取り部110で、読み取った原文画像データを翻訳サーバ200に送信するようにしたが、本発明は、原稿の所定位置にバーコードが印刷されているのであれば、原稿画像データからバーコードの識別IDのみを読み取り、翻訳サーバ200に送信するようにしても良い。これにより、バーコードのデータ容量に比べて大容量となる原文画像データを送信することがなくなり、ネットワーク300を経由しての送信時間を大幅に短縮できる。
翻訳サーバ200の文書データベース210に翻訳データおよび原文データが格納されていない場合、原文画像データを再度複合機100から翻訳サーバ200に送信すればよい。
また、複合機100の読み取り部110で原稿Mを読み取った段階で、OCR処理を施してイメージ形式の原文画像データからテキスト形式の原文入力データに変換してもよい。但し、この原文入力データと予め文書データベース210に格納されている文書データとは異なったものである。
前記本実施形態では、複合機100と翻訳サーバ200とをネットワーク300で接続する翻訳システムとして説明したが、本発明はこれに限らず、複合機100内に翻訳サーバ200の機能を備え、複合機100を翻訳装置してもよい。このような複合機100は、複合機1台で仕事をサポートできる比較的小さな会社への適用が好適である。この際、文書データベース210に格納される文書データは、図5のステップS8による記憶更新のみでなく、複合機100のスキャナ機能、コピー機能、プリンタ機能を動作させた際に、文書データベース210に格納させてもよい。この際、スキャナ・コピー・プリントされる原稿の文書データを文書IDと共に文書データベース210に格納すると共に、文書データ管理部220に翻訳データの文書IDと文書名を記憶更新するようにすればよい。
前記実施形態のデータテーブルでは、図4に示すように、共通の文字列を有する文書IDとして文書データを関連付けたが、本発明はこれに限らず、異なった文書IDであっても、1つのデータテーブルで関連付けられるようにすればよい。
本発明は、翻訳可能な言語は、第1〜第3言語の3つに限らず、2言語,4言語以上の言語に対応できることは勿論である。
本発明は、翻訳可能な言語は、第1〜第3言語の3つに限らず、2言語,4言語以上の言語に対応できることは勿論である。
前記実施形態では、原文の文書情報を文書IDとしてこの文書IDをバーコード化する構成としたが、本発明はこれに限らず、指定領域に存在する文字列或いは文書IDを書き込んだICタグ等をバーコードの代わりに用いてもよい。例えば、文字列の場合には、用紙に印刷された文章の所定領域の部分に存在する文字列を文書ID或いは文書名とし、この所定領域をOCR処理することにより文書ID或いは文書名を原文の識別情報として抽出するようにしてもよい。
また、原稿に利用者が注釈や付箋等のアノテーションを記載している場合には、読み取り部110で原稿を読み取る際に、アノテーションに記載された文字とその位置情報を算出し、翻訳サーバ200から翻訳データが返信された場合には、この翻訳データ、アノテーションの位置情報に基づき、印刷部140が翻訳文と共に、翻訳されたアノテーションを元の原稿と同じ位置に印刷させる。
ステップS8で文書データベース210に記憶更新される翻訳データは、翻訳サーバ200による機械翻訳による翻訳データを格納させるようにしたが、ここでは格納させずに、この翻訳データに基づき翻訳者が補正した翻訳データ、或いは翻訳者が原文の原稿から翻訳した翻訳データを文書データベース210に新たに格納させるようにしてもよい。
前記実施形態では、複合機100および翻訳サーバ200で翻訳システム1を構成するものとして述べたが、個人的なクライアント端末(例えば、パーソナルコンピュータ)と翻訳サーバ200とをネットワーク300を介して接続した翻訳システムとしてもよい。
このシステムでは、クライアント端末の表示部に、テキスト形式の翻訳データ或いは原文データと翻訳データとを比較させながら表示させることも可能となる。さらに、データを表示部に表示し、マウス等の領域指定手段によって文章領域を指定し、この文章領域に対応した翻訳文を表示させる等、種々の使用方法が適用できる。
このシステムでは、クライアント端末の表示部に、テキスト形式の翻訳データ或いは原文データと翻訳データとを比較させながら表示させることも可能となる。さらに、データを表示部に表示し、マウス等の領域指定手段によって文章領域を指定し、この文章領域に対応した翻訳文を表示させる等、種々の使用方法が適用できる。
なお、図1においては図面が煩雑になるのを防ぐため、複合機100および翻訳サーバ200はそれぞれ1台のみ図示されているが、翻訳システム1は、複合機100および翻訳サーバ200を複数有してもよいことは勿論である。
また、上述の実施形態においては、複合機100は制御部150が、翻訳サーバ200は制御部250がそれぞれプログラムを実行することにより実現されたが、この一部または全部をハードウェアで実現する構成としてもよい。
1…翻訳システム、100…複合機、110…読み取り部、120…画像形成部、130…送受信部、140…印刷部、150…制御部、200…翻訳サーバ、210…文書データベース、220…文書データ管理部、230…翻訳辞書部、240…送受信部、250…制御部、300…ネットワーク。
Claims (11)
- 原文を翻訳した翻訳データを、前記原文の識別情報に対応付けて記憶した記憶手段と、
識別情報とともに入力された原文入力データから前記識別情報を抽出する抽出手段と、
前記抽出手段により抽出された前記識別情報に対応した翻訳データが、前記記憶手段に有るか否かを判定する判定手段と、
前記判定手段が翻訳データ有りと判定した場合には前記記憶手段内の翻訳データを出力し、前記判定手段が翻訳データ無しと判定した場合には前記原文入力データに対して翻訳処理を施した翻訳データを出力する翻訳データ出力手段と、を具備した
ことを特徴とする翻訳装置。 - 原文データ、またはこの原文を翻訳した翻訳データのうち、少なくとも何れか一方のデータを、前記原文の識別情報に対応付けて記憶した記憶手段と、
識別情報とともに入力された原文入力データから前記識別情報を抽出する抽出手段と、
前記抽出手段により抽出された前記識別情報に対応した翻訳データたまは原文データが、前記記憶手段に有るか否かを判定する判定手段と、
前記判定手段が翻訳データ有りと判定した場合には前記記憶手段内の翻訳データを出力し、前記判定手段が翻訳データ無しと判定した場合には前記記憶手段内の原文データに対して翻訳処理を施した翻訳データを出力し、さらに前記判定手段が翻訳データおよび原文データのいずれも無いと判定した場合には前記原文入力データに対して翻訳処理を施した翻訳データを出力する翻訳データ出力手段と、を具備した
ことを特徴とする翻訳装置。 - 請求項1または2記載の翻訳装置において、
前記判定手段により原文の識別情報に対応した翻訳データが前記記憶手段に無い場合には、前記原文データに対して翻訳処理を施した翻訳データを、前記原文の識別情報に対応した翻訳データとして前記記憶手段に更新記憶するデータ更新記憶手段を備える
ことを特徴とする翻訳装置。 - 請求項3記載の翻訳装置において、
操作者の操作に応じて翻訳データを修正する翻訳データ修正手段を備え、
前記データ更新記憶手段によって前記記憶手段に更新記憶される翻訳データは、前記翻訳データ修正手段によって修正されたデータである
ことを特徴とする翻訳装置。 - 請求項1または2記載の翻訳装置において、
前記抽出手段で抽出される識別情報は、特定文字列または特定画像によって現される
ことを特徴とする翻訳装置。 - 請求項1または2記載の翻訳装置において、
前記翻訳データ出力手段は印刷手段であり、
前記印刷手段は、翻訳データの文章を印刷するとともに、翻訳データの識別情報を特定文字列または特定画像として印刷する
ことを特徴とする翻訳装置。 - 請求項1または2記載の翻訳装置において、
画像読み取り手段を備え、
前記画像読み取り手段は、原文が印刷された原稿から画像を読み取って識別情報および原文入力データを生成して前記抽出手段に出力する
ことを特徴とする翻訳装置。 - 端末装置と、前記端末装置とネットワークを介して通信するサーバ装置とを有し、
前記サーバ装置が、
原文を翻訳した翻訳データを、前記原文の識別情報に対応付けて記憶した記憶手段と、
識別情報とともに入力された原文入力データから前記識別情報を抽出する抽出手段と、
前記抽出手段により抽出された前記識別情報に対応した翻訳データが、前記記憶手段に有るか否かを判定する判定手段と、
前記判定手段が翻訳データ有りと判定した場合には前記記憶手段内の翻訳データを出力し、前記判定手段が翻訳データ無しと判定した場合には前記原文入力データに対して翻訳処理を施した翻訳データを出力する翻訳データ出力手段と、を備え、
前記端末装置が、
前記原文入力データおよび識別情報を生成する画像読み取り手段と、
前記翻訳データ出力手段によって得られる翻訳データを表示或いは印刷するデータ表示手段と、を備えた
ことを特徴とする翻訳システム。 - 端末装置と、前記端末装置とネットワークを介して通信するサーバ装置とを有し、
前記サーバ装置が、
原文データ、またはこの原文を翻訳した翻訳データのうち、少なくとも何れか一方のデータを、前記原文の識別情報に対応付けて記憶した記憶手段と、
識別情報とともに入力された原文入力データから前記識別情報を抽出する抽出手段と、
前記抽出手段により抽出された前記識別情報に対応した翻訳データたまは原文データが、前記記憶手段に有るか否かを判定する判定手段と、
前記判定手段が翻訳データ有りと判定した場合には前記記憶手段内の翻訳データを出力し、前記判定手段が翻訳データ無しと判定した場合には前記記憶手段内の原文データに対して翻訳処理を施した翻訳データを出力し、さらに前記判定手段が翻訳データおよび原文データのいずれも無いと判定した場合には前記原文入力データに対して翻訳処理を施した翻訳データを出力する翻訳データ出力手段と、を備え、
前記端末装置が、
前記原文入力データおよび識別情報を生成する画像読み取り手段と、
前記翻訳データ出力手段によって得られる翻訳データを表示或いは印刷するデータ表示手段と、を備えた
ことを特徴とする翻訳システム。 - 原文を翻訳した翻訳データを、前記原文の識別情報に対応付けて記憶手段に記憶する記憶ステップと、
識別情報とともに入力された原文入力データから前記識別情報を抽出する抽出ステップと、
前記抽出ステップにより抽出された前記識別情報に対応した翻訳データが、前記記憶手段に有るか否かを判定する判定ステップと、
前記判定ステップが翻訳データ有りと判定した場合には前記記憶手段内の翻訳データを出力し、前記判定ステップが翻訳データ無しと判定した場合には前記原文入力データに対して翻訳処理を施した翻訳データを出力する翻訳データ出力ステップと、を具備した
ことを特徴とする翻訳方法。 - 原文データ、またはこの原文を翻訳した翻訳データのうち、少なくとも何れか一方のデータを、前記原文の識別情報に対応付けて記憶手段に記憶する記憶ステップと、
識別情報とともに入力された原文入力データから前記識別情報を抽出する抽出ステップと、
前記抽出ステップにより抽出された前記識別情報に対応した翻訳データたまは原文データが、前記記憶手段に有るか否かを判定する判定ステップと、
前記判定ステップが翻訳データ有りと判定した場合には前記記憶手段内の翻訳データを出力し、前記判定ステップが翻訳データ無しと判定した場合には前記記憶手段内の原文データに対して翻訳処理を施した翻訳データを出力し、さらに前記判定ステップが翻訳データおよび原文データのいずれも無いと判定した場合には前記原文入力データに対して翻訳処理を施した翻訳データを出力する翻訳データ出力ステップと、を具備した
ことを特徴とする翻訳方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005236980A JP2007052613A (ja) | 2005-08-17 | 2005-08-17 | 翻訳装置、翻訳システムおよび翻訳方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005236980A JP2007052613A (ja) | 2005-08-17 | 2005-08-17 | 翻訳装置、翻訳システムおよび翻訳方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007052613A true JP2007052613A (ja) | 2007-03-01 |
Family
ID=37917023
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005236980A Pending JP2007052613A (ja) | 2005-08-17 | 2005-08-17 | 翻訳装置、翻訳システムおよび翻訳方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007052613A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012185741A (ja) * | 2011-03-07 | 2012-09-27 | Ricoh Co Ltd | 画像形成装置、情報処理装置、画像処理システム、及びプログラム |
WO2015045680A1 (ja) * | 2013-09-27 | 2015-04-02 | シャープ株式会社 | 翻訳装置およびその制御プログラム |
JP2016143158A (ja) * | 2015-01-30 | 2016-08-08 | パナソニックIpマネジメント株式会社 | 情報提供装置、情報提供方法、及び情報取得プログラム |
JP2017204236A (ja) * | 2016-05-13 | 2017-11-16 | 株式会社東芝 | 翻訳文提供装置、利用者端末装置およびプログラム |
-
2005
- 2005-08-17 JP JP2005236980A patent/JP2007052613A/ja active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012185741A (ja) * | 2011-03-07 | 2012-09-27 | Ricoh Co Ltd | 画像形成装置、情報処理装置、画像処理システム、及びプログラム |
WO2015045680A1 (ja) * | 2013-09-27 | 2015-04-02 | シャープ株式会社 | 翻訳装置およびその制御プログラム |
JP2015069366A (ja) * | 2013-09-27 | 2015-04-13 | シャープ株式会社 | 翻訳装置およびその制御プログラム |
JP2016143158A (ja) * | 2015-01-30 | 2016-08-08 | パナソニックIpマネジメント株式会社 | 情報提供装置、情報提供方法、及び情報取得プログラム |
JP2017204236A (ja) * | 2016-05-13 | 2017-11-16 | 株式会社東芝 | 翻訳文提供装置、利用者端末装置およびプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3213197B2 (ja) | 画像処理装置およびその制御方法 | |
JP4948586B2 (ja) | 文書画像生成装置、文書画像生成方法、コンピュータプログラム及び記録媒体 | |
US8630852B2 (en) | Image processing apparatus, speech recognition processing apparatus, control method for speech recognition processing apparatus, and computer-readable storage medium for computer program | |
US8634100B2 (en) | Image forming apparatus for detecting index data of document data, and control method and program product for the same | |
JP2006252049A (ja) | 翻訳システム、翻訳方法およびプログラム | |
JP2008146605A (ja) | 画像処理装置及びその制御方法 | |
JP2008059157A (ja) | 書類確認支援システム、書類確認支援装置およびプログラム | |
US9529792B2 (en) | Glossary management device, glossary management system, and recording medium for glossary generation | |
US9881001B2 (en) | Image processing device, image processing method and non-transitory computer readable recording medium | |
JP2006276911A (ja) | 電子機器およびプログラム | |
JP4576211B2 (ja) | 文書情報検索システム | |
JP2007052613A (ja) | 翻訳装置、翻訳システムおよび翻訳方法 | |
JP2007025980A (ja) | 情報指定システム、情報指定方法、サーバ装置、情報指定装置及び情報指定プログラム | |
JP4797507B2 (ja) | 翻訳装置、翻訳システムおよびプログラム | |
JP2006331258A (ja) | 訳振り装置、画像処理装置、プログラム、及び記録媒体 | |
JP2009223363A (ja) | 文書処理装置および文書処理プログラム | |
WO1997004409A1 (fr) | Dispositif de recherche de fichiers | |
US8031352B2 (en) | Apparatus and method for processing received data | |
JP2001326804A (ja) | 画像処理装置及び画像処理システム | |
JP4872285B2 (ja) | 文書管理装置、文書管理システムおよび文書管理方法 | |
JP2007011683A (ja) | 文書管理支援装置 | |
US20250078549A1 (en) | Information processing apparatus, information processing method, and storage medium | |
JP2010146143A (ja) | 文書処理装置及びプログラム | |
JP2008118489A (ja) | ファクシミリ配信システム及びファクシミリ装置 | |
JP2008181223A (ja) | 電子文書管理システム、電子文書管理方法、プログラムおよび記録媒体 |