JP2019109629A5 - - Google Patents
Download PDFInfo
- Publication number
- JP2019109629A5 JP2019109629A5 JP2017241114A JP2017241114A JP2019109629A5 JP 2019109629 A5 JP2019109629 A5 JP 2019109629A5 JP 2017241114 A JP2017241114 A JP 2017241114A JP 2017241114 A JP2017241114 A JP 2017241114A JP 2019109629 A5 JP2019109629 A5 JP 2019109629A5
- Authority
- JP
- Japan
- Prior art keywords
- file
- text
- image
- unit
- original image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004891 communication Methods 0.000 description 17
- 238000000034 method Methods 0.000 description 16
- 238000012545 processing Methods 0.000 description 14
- 238000013519 translation Methods 0.000 description 14
- 239000000284 extract Substances 0.000 description 9
- 230000006870 function Effects 0.000 description 8
- 238000012546 transfer Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 239000003086 colorant Substances 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Description
本発明は、テキストの翻訳機能を有する画像処理装置に関し、特に互いに異なる種類の言語からなる各テキストを比較するための技術に関する。
例えば、特許文献1に記載の技術は、機械翻訳による翻訳文を編集して対訳文を作成する際に、原文中の訳抜けの可能性がある単語を検出して提示している。
また、特許文献2に記載の技術は、画像の印刷出力を行うのに加えて、その画像に含まれる文字等に例えば文法上の誤りがあった場合に、これを検出し、それを出力画像に付記して指摘するものである。
また、特許文献3に記載の技術は、複数の翻訳結果に含まれる単語または単語列の対応関係を照合、比較、結合するものである。
ここで、1つのテキストを該テキストとは異なる種類の言語に翻訳して、各言語のテキストをそれぞれのファイルに格納しておけば、互いに異なる言語を用いるそれぞれのユーザーが、ファイルの適宜選択により実質的には同一内容のテキストを読むことができる。
ところが、各ファイルのいずれかのテキストが更新されたにもかかわらず、他のファイルのテキストが更新されなかった場合は、各ファイルのテキストに差異が生じて、各ファイルのテキストの内容が整合しなくなる。この場合、その差異を検出できるようにすることが望まれる。
しかしながら、特許文献1乃至特許文献3のいずれにおいても、互いに異なる種類の言語の各テキストを比較して、両テキストの差異を検出するものではない。
本発明は、上記の事情に鑑みなされたものであり、互いに異なる種類の言語のテキストを比較して、各テキストの内容の差異を検出し、この差異を分かり易く出力可能にすることを目的とする。
本発明の一局面にかかる画像処理装置は、互いに異なる種類の言語のテキストを有する第1ファイル及び第2ファイルを検索する検索部と、
前記第2ファイルのテキストを、前記第1ファイルのテキストと同一種類の言語に翻訳して、前記第2ファイルの翻訳テキストを生成する翻訳部と、
前記第1ファイルのテキストと、前記第2ファイルの前記翻訳テキストを比較して、この比較に基づき前記第1ファイルのテキストと前記第2ファイルのテキストの差異を検出する比較部と、
前記比較部によって検出された前記差異を前記第1ファイルのテキスト又は前記第2ファイルのテキストに記した状態で、該各テキストを併記した画像を作成して出力するための処理を行う出力部と、を備えるものである。
本発明によれば、互いに異なる種類の言語のテキストを比較して、各テキストの内容の差異を検出し、この差異を分かり易く出力することが可能になる。
以下、本発明の一実施形態について図面を参照して説明する。
図1は、本発明の画像処理装置の一実施形態を適用した画像形成装置を示す断面図である。この画像形成装置10は、例えば、コピー機能、プリンター機能、スキャナー機能、及びファクシミリ機能のような複数の機能を兼ね備えたMFP(複合機)である。この画像形成装置10は、画像読取部11と、画像形成部12とを備えている。
画像読取部11は、原稿画像を光学的に読み取るスキャナーを有し、このスキャナーの撮像素子から出力されたアナログ信号をデジタル信号に変換して、原稿画像を示す画像データを生成する。
画像形成部12は、画像読取部11で生成された画像データ又は外部から受信した画像データによって示される画像を記録紙に印刷するものであり、マゼンタ用の画像形成ユニット3M、シアン用の画像形成ユニット3C、イエロー用の画像形成ユニット3Y、及びブラック用の画像形成ユニット3Bkを備えている。各画像形成ユニット3M、3C、3Y、及び3Bkのいずれにおいても、感光体ドラム4の表面を均一帯電させ、感光体ドラム4の表面を露光して、感光体ドラム4の表面に静電潜像を形成し、感光体ドラム4の表面の静電潜像をトナー像に現像して、感光体ドラム4の表面のトナー像を、中間転写ベルト5に転写する。これにより、カラーのトナー像(画像)が中間転写ベルト5上に形成される。このカラーのトナー像は、中間転写ベルト5と2次転写ローラー6の間のニップ域Nにおいて給紙部7から搬送路8を通じて搬送されてきた記録紙Pに2次転写される。
この後、定着装置15で記録紙Pが加熱及び加圧されて、記録紙P上のトナー像が熱圧着により定着され、更に記録紙Pが排出ローラー対16を通じて排出トレイ17に排出される。
図2は、画像形成装置10の主要内部構成を示す機能ブロック図である。図2に示すように画像形成装置10は、制御ユニット31、表示部32、操作部34、タッチパネル35、ネットワーク通信部36、ファクシミリ通信部37、記憶部38、画像メモリー39、画像読取部11、及び画像形成部12などを備えている。これらの構成要素は、互いにバスを通じてデータ又は信号の送受信を可能とされている。
表示部32は、液晶ディスプレイ(LCD:Liquid Crystal Display)や有機EL(OLED:Organic Light-Emitting Diode)ディスプレイなどから構成される。
操作部34は、例えば、表示部32に表示されているGUIにおけるフォーカスを移動させる矢印キー、GUIに対して確定操作を行う決定キー、スタートキーなどを備えている。
表示部32の画面には、タッチパネル35が重ねられている。タッチパネル35は、所謂抵抗膜方式や静電容量方式などのタッチパネルであって、タッチパネル35に対するユーザーの指などの接触(タッチ)をその接触位置と共に検知し、表示部32の画面上のGUIなどに対するユーザーの指示を入力する。従って、タッチパネル35は、表示部32の画面に対するユーザー操作が入力される操作部としての役割を果たす。
ネットワーク通信部36は、ネットワークを通じて他の端末装置(図示せず)との間で各種のデータを送受信する。ファクシミリ通信部37は、画像データを、ネットワークを通じて他の画像形成装置やファクシミリ装置(図示せず)などとの間で送受信する。
記憶部38は、大容量のSSD(Solid State Drive)、HDD(Hard Disk Drive)などからなり、各種のデータやプログラムを記憶している。
画像メモリー39は、画像読取部11により読取られた原稿画像を示す画像データ、制御部41により記憶部38から読み出された画像データ、及びネットワーク通信部36により受信された画像データなどを一時的に記憶する。
制御ユニット31は、プロセッサー、RAM(Random Access Memory)、及びROM(Read Only Memory)などから構成される。プロセッサーは、CPU(Central Processing Unit)、MPU、又はASIC等である。この制御ユニット31は、制御部41、表示制御部42、通信制御部43、検索部44、レイアウト解析部45、翻訳部46、比較部47、及び出力部48を備えており、これらの構成要素は、上記のROM又は記憶部38に記憶されているプログラムが上記のプロセッサーで実行されることにより機能するか、あるいはそれぞれハード回路により構成されている。
制御部41は、画像形成装置10の全体的な動作制御を司る。表示制御部42は、表示部32を制御して、上記GUI、あるいは各種の情報などを表示部32に表示させる。通信制御部43は、ネットワーク通信部36及びファクシミリ通信部37の通信動作を制御する機能を有する。
検索部44は、操作部34又はタッチパネル35の操作により指定されたファイル又は該指定されたファイルに関連する他のファイルを記憶部38から検索して読み出す。また、検索部44は、それらのファイルを通信制御部43並びにネットワーク通信部36を通じて、ネットワーク上のストレージから検索して取得する。ネットワーク上のストレージは、サーバー、ワークステーション、PCなどにより提供される。
レイアウト解析部45は、画像メモリー39内の画像データによって示される原稿画像に対してレイアウト解析などを行って該原稿画像におけるテキスト領域、画像領域、表領域などを判定する。更に、レイアウト解析部45は、テキスト領域から文字テキストを抽出する。
記憶部38には、パターンマッチング用の複数の文字パターンを記憶した文字データベースDBが保存されている。レイアウト解析部45は、テキスト領域から、文字認識(OCR)技術により、テキスト領域に含まれる各画像をそれぞれ文字テキストに変換する。更に、文字データベースDBには、複数種の言語別に、各文字パターンが登録されているので、レイアウト解析部45は、変換した文字テキストに基づき、当該文字テキストが示す文字の言語の種類を判定する。以下、原稿画像に含まれるテキスト領域を文字テキストに変換してなる文字テキスト群をテキストという。
翻訳部46は、比較対象とするそれぞれ異なる言語からなる2つのテキストについて、一方のテキストを他方のテキストと同一の言語に翻訳して、翻訳テキストを生成する。
比較部47は、任意のテキストと、当該テキストの比較対象となる翻訳テキストとを比較して、この比較に基づき該各テキストの差異を検出する。
出力部48は、比較部47により検出された各テキストの差異を出力するための処理を行う。出力部48は、各テキストの差異(例えば、当該差異を示す画像)を、画像形成部12により記録紙に記録させる、あるいは通信制御部43並びにネットワーク通信部36によりネットワーク上の端末装置に送信させる、等の制御を行う。
このような構成の画像形成装置10において、例えば、ユーザーが、操作部34又はタッチパネル35を操作することによりコピー機能を選択して、このコピージョブの実行を指示すると、制御部41は、画像読取部11により原稿画像を読取らせて、原稿画像を示す画像データを画像メモリー39に一旦記憶させ、この画像データを画像メモリー39から画像形成部12に入力させて、画像形成部12より原稿画像を記録紙に印刷させる。
また、ユーザーが、操作部34又はタッチパネル35を操作して、予め定められた言語併記モードを選択した上で、互いに異なる種類の言語のテキストを含むそれぞれの原稿画像を有する第1ファイル及び第2ファイルの検索を指示する。なお、この時点では、第1ファイル及び第2ファイルに用いられている言語は、ユーザーが自己判断で把握しているものとする。
検索部44は、この指示に従って、第1ファイル及び第2ファイルを記憶部38又はネットワーク上のストレージから検索して画像メモリー39に記憶させる。続いて、レイアウト解析部45が、第1ファイルの原稿画像からテキスト(任意のテキスト)を抽出すると共に第2ファイルの原稿画像からテキスト(比較対象のテキスト)を抽出する。
翻訳部46は、第2ファイルのテキストを第1ファイルのテキストと同一種類の言語に翻訳して、第2ファイルについて翻訳テキストを生成する。比較部47は、第1ファイルのテキストと、第2ファイルの翻訳テキストを比較して、この比較に基づき第1ファイルのテキストと第2ファイルのテキストの差異を検出する。
出力部48は、当該検出された差異を第1ファイルのテキスト又は前記第2ファイルのテキストに記した状態で、例えば、該各テキストを併記して出力する。
例えば、検索部44は、図3に示すような原稿画像G1からなる第1ファイルと原稿画像G2からなる第2ファイルを記憶部38から読み出し、又はネットワーク上のストレージから取得して、画像メモリー39に記憶させる。
レイアウト解析部45は、画像メモリー39内の第1ファイルの原稿画像G1に対してレイアウト解析などを施して、各テキスト領域X1及び各画像領域Z1などを判定する。レイアウト解析部45は、各テキスト領域X1別に、複数の文字テキストからなるテキストT1を、上述した文字テキスト変換によりテキスト領域X1から抽出する。
そして、レイアウト解析部45は、画像メモリー39内の第2ファイルの原稿画像G2に対してレイアウト解析などを施して、各テキスト領域X2及び各画像領域Z2などを判定し、各テキスト領域X2別に、複数の文字テキストからなるテキストT2を、上述した文字テキスト変換によりテキスト領域X2から抽出する。
また、レイアウト解析部45は、第1ファイルの原稿画像G1における各テキスト領域X1の位置と第2ファイルの原稿画像G2における各テキスト領域X2の位置に基づき、各テキスト領域X1のテキストT1と各テキスト領域X2のテキストT2との対応関係、すなわち、各テキスト領域X1のテキストT1のいずれと、各テキスト領域X2のテキストT2のいずれが比較対象とされる関係であるか、を検出する。
レイアウト解析部45による解析により、例えば、図3に示すように、第1ファイルの原稿画像G1には、日本語の複数のテキスト領域X1及び複数の画像領域Z1が含まれ、また第2ファイルの原稿画像G2には、英語の複数のテキスト領域X2及び複数の画像領域Z2が含まれていることが解析される。
ここでは、原稿画像G1における日本語の各テキストT1と原稿画像G2における英語の各テキストT2を例示しているが、日本語と英語を直接比較することができない。このため、翻訳部46は、レイアウト解析部45による解析結果に基づいて、第2ファイルの英語の各テキストT2を、第1ファイルの各テキストT1と同一言語である日本語に翻訳して、第2ファイルの英語の各テキストT2について、それぞれの翻訳テキストを生成する。
そして、比較部47は、第1ファイルの各テキストT1別に、テキストT1と該テキストT1に対応するテキストT2を翻訳した翻訳テキストを比較して、この比較に基づきテキストT1とテキストT2の差異を検出する。例えば、比較部47は、第1ファイルのテキストT1には記載されていない単語を、当該テキストT1に対応する、第2ファイルのテキストT2についての翻訳テキストから抽出して、第2ファイルのテキストT2から当該抽出した単語に対応する単語を検出し、この検出した単語を差異として検出する。あるいは、比較部47は、第2ファイルのテキストT2についての翻訳テキストに記載されていない単語を第1ファイルのテキストT1から検出し、この検出した単語を差異として検出する。
出力部48は、例えば、図3に示すように原稿画像G1と原稿画像G2を横に並べて併記した上で、原稿画像G1における日本語のテキストT1に対してその差異を記し、或いは、原稿画像G2における英語のテキストT2に対してその差異を記した画像を作成する。例えば、出力部48は、テキストT1又はテキストT2における差異として検出された単語に対して下線又は枠を付し、或いは、該単語を他の単語とは異なる色で表示する等の異なる形態とした画像を作成する。
ここで、出力部48は、図3に示すように原稿画像G1及び原稿画像G2に多くの画像領域が含まれている場合は、上記のように原稿画像G1と原稿画像G2を併記した画像を作成することが好ましい。これにより、原稿画像G1及び原稿画像G2をそれらの体裁を損なうことのない画像を作成できる。
また、原稿画像G1及び原稿画像G2に含まれる画像領域の数が少ない場合には、出力部48は、原稿画像G1と原稿画像G2を併記した画像を作成する代わりに、原稿画像G1から日本語の各テキストT1のみを抽出すると共に、原稿画像G2から英語の各テキストT2のみを抽出して、各テキストT1と各テキストT2を併記し、テキストT1又はテキストT2の少なくとも一方において、差異として検出された単語に対して下線又は枠を付し、或いは、該単語を他の単語とは異なる色で示す等の異なる形態とした画像を作成するようにしてもよい。これにより、原稿画像G1及び原稿画像G2が混在する場合よりも、各テキストT1と各テキストT2の比較が容易になる。
図4は、第1ファイルの原稿画像と第2ファイルの原稿画像の他の例を示している。第1ファイルの原稿画像G1には、表領域H1、日本語の複数のテキスト領域X1、及び1つの画像領域Z1が含まれ、また第2ファイルの原稿画像G2には、表領域H2、英語の複数のテキスト領域X2、及び1つの画像領域Z2が含まれるものとする。
ここでも、検索部44が第1ファイル及び第2ファイルを検索して画像メモリー39に記憶させる。レイアウト解析部45は、第1ファイルの原稿画像G1に対してレイアウト解析などを施して、表領域H1、各テキスト領域X1、及び画像領域Z1を判定すると共に、第2ファイルの原稿画像G2に対してレイアウト解析などを施して、表領域H2、各テキスト領域X2、及び画像領域Z2を判定し、各テキストT1及び各テキストT2をそれぞれのテキスト領域X1、X2から抽出し、また各テキスト領域X1のテキストT1と各テキスト領域X2のテキストT2との対応関係を検出する。
翻訳部46は、第2ファイルの各テキストT2を第1ファイルの各テキストT1と同一種類の日本語に翻訳して、それぞれの翻訳テキストを生成する。比較部47は、第1ファイルの各テキストT1別に、テキストT1と該テキストT1に対応するテキストT2を翻訳した翻訳テキストを比較して、この比較に基づきテキストT1とテキストT2の差異を検出する。出力部48は、原稿画像G1と原稿画像G2を横に並べて併記して、日本語のテキストT1又は英語のテキストT2の少なくとも何れか一方に、差異として検出された単語を下線又は枠等や、異なる色表示で示した画像を作成する。
また、図4に示すように第1ファイルの原稿画像G1及び第2ファイルの原稿画像G2を併記する代わりに、図5に示すように第1ファイルの日本語の各テキストT1と第2ファイルの英語の各テキストT2を交互に併記してもよい。図5では、日本語のテキストT1毎に、テキストT1と該テキストT1に対応する英語のテキストT2を上下に並べて併記している。また、出力部48は、日本語のテキストT1又は英語の各テキストT2の少なくとも一方において、差異として検出された単語を下線又は枠や異なる色表示で示した画像を作成する。この場合、出力部48は、原稿画像G1又は原稿画像G2のいずれかの表領域及び画像領域を用いて、当該第1ファイルの日本語の各テキストT1と第2ファイルの英語の各テキストT2を交互に併記した画像を作成する。
図6は、第1ファイルの原稿画像と第2ファイルの原稿画像について、別の例を示している。図6には、出力部48が、第1ファイルの原稿画像G1と第2ファイルの原稿画像G2を横に並べて併記し、また日本語の各テキストT1又は英語の各テキストT2の少なくとも一方において、差異として検出された単語を下線又は枠や異なる色表示で示した画像を作成した例を示している。
これらの原稿画像G1及び原稿画像G2に含まれている画像領域の数が少ないため、出力部48は、原稿画像G1と原稿画像G2を併記する代わりに、原稿画像G1における各テキストT1と原稿画像G2における各テキストT2を抽出して併記し、画像領域を表示する画像の作成を省略するようにしても構わない。
図7は、第1ファイルの原稿画像と第2ファイルの原稿画像について、更に別の例を示している。図7には、出力部48が、第1ファイルの原稿画像G1と第2ファイルの原稿画像G2を横に並べて併記した画像を作成した例を示している。この例では、第1ファイルの原稿画像G1には、3つの表示欄Rからなる表領域H1が含まれ、それぞれの表示欄Rには、日本語の複数のテキスト領域X1及び複数の画像領域Z1が含まれている。同様に、第2ファイルの原稿画像G2には、3つの表示欄Rからなる表領域H2が含まれ、それぞれの表示欄Rには、英語の複数のテキスト領域X2及び複数の画像領域Z2が含まれている。この例では、出力部48は、日本語の各テキストT1又は英語の各テキストT2の少なくとも一方において、差異として検出された単語を下線又は枠や異なる色表示で示した画像を作成する。
ここで、出力部48は、これらの原稿画像G1と原稿画像G2を横に並べて併記する代わりに、原稿画像G1における各テキストT1と原稿画像G2における各テキストT2を抽出して併記し、各表示欄Rにおける画像領域を表示する画像の作成を省略するようにしても構わない。
次に、上記のように第1ファイル及び第2ファイルを検索して、第1ファイルのテキストと第2ファイルのテキストの差異を検出して出力するための処理手順を、図8A及び図8Bに示すフローチャートなどを参照して説明する。
まず、ユーザーが、操作部34及びタッチパネル35を操作して、図9に示すような言語併記モードの選択画面D1の表示指示を入力すると、この表示指示に従って、制御部41は、その選択画面D1を、表示制御部42を通じて表示部32に表示させる。この言語併記モードの選択画面D1には、言語併記モードのオンオフを指示するためのチェックボックスCH11、CH12、バックキーBK、及びネクストキーNXが表示されている。ユーザーが、操作部34又はタッチパネル35を操作して、言語併記モードのオンを指示するためのチェックボックスCH11にチェックを入れて、ネクストキーNXを指示すると、制御部41は、言語併記モードを受け付ける(S101)。
制御部41は、言語併記モードを受け付けると、表示制御部42は、設定画面D1を非表示として、代わりに、図10に示すような言語併記モードの設定画面D2を表示部32に表示させる(S102)。この言語併記モードの設定画面D2には、互いに異なる種類の言語の2つのテキストをそれぞれ格納した第1ファイル及び第2ファイルの有無を指示するための各チェックボックスCH21、CH22、第1ファイル及び第2ファイルに格納されている原稿画像におけるテキスト領域、画像領域、表領域の有無を指示するための各チェックボックスCH23、CH24、CH25、言語併記モードの適用範囲(例えば原稿画像の頁)を指示するための各チェックボックスCH26、CH27、及び第1ファイルのテキストと第2ファイルのテキストの差異を通知するか否かを指示するためのチェックボックスCH28、バックキーBK、及びネクストキーNXが表示されている。
図10には、言語併記モードの設定画面D2として、デフォルト設定として、第1ファイル及び第2ファイルの両方有に対応するチェックボックスCH21がユーザーにより操作され、第1ファイル及び第2ファイルに格納されている原稿画像におけるテキスト領域、画像領域、表領域の有に対応する各チェックボックスCH23、CH24、CH25が操作され、言語併記モードの適用範囲として全範囲を指示するチェックボックスCH26が操作され、第1ファイルのテキストと第2ファイルのテキストの差異の通知に対応するチェックボックスCH28が操作され、これら操作された各箇所にチェックを示す画像が表示された例を示している。ユーザーは、操作部34又はタッチパネル35を操作して、任意のチェックボックスを操作することで、各チェックボックスに対応付けられた上記各指示が入力され、制御部41に受け付けられる。
そして、ユーザーが、操作部34又はタッチパネル35を操作して、ネクストキーNXを指定すると、制御部41は、言語併記モードの設定画面D2における設定に基づき言語併記モードを実行する指示が入力され、制御部41が当該実行指示を受け付ける。
続いて、ユーザーが、操作部34又はタッチパネル35を操作して、互いに異なる種類の言語のテキストを含む第1ファイルの名称及び第2ファイルの名称を入力して、第1ファイル及び第2ファイルを指定すると、検索部44は、第1ファイル及び第2ファイルを記憶部38から検索する(S103)。あるいは、ユーザーが、操作部34又はタッチパネル35を操作して、第1ファイルの名称を入力して、第1ファイルを指定すると、検索部44は、第1ファイルを記憶部38から検索し、更に、第1ファイルの名称などに基づき該第1ファイルに関連する第2ファイルを記憶部38から検索する。なお、表示制御部42が、記憶部38に予め記憶されている複数のファイルを示す一覧を表示部32に表示させて、ユーザーが、操作部34又はタッチパネル35を操作して、この一覧において、第1ファイル及び第2ファイル、又は第1ファイルを選択して指定可能とし、当該指定を制御部41が受け付けるようにしてもよい。
このとき、検索部44は、第1ファイル及び第2ファイルを記憶部38から検索することができないか、又は第1ファイルのみを記憶部38から検索して読み出すと(S103「No」)、第1ファイル及び第2ファイルをネットワーク上のストレージから検索するか、又は第1ファイルの名称などに基づき該第1ファイルに関連する第2ファイルをネットワーク上のストレージから検索する(S104、S105)。そして、検索部44が、ストレージにアクセスできないか(S104「No」)、第1ファイル及び第2ファイルをストレージから検索できない場合(S103で第1ファイルのみを記憶部38から検索して読み出しているときは、第2ファイルをストレージから検索できない場合)は(S105「No」)、表示制御部42は、言語併記モードの終了通知のメッセージを表示部32に表示させ(S106)、図8A及び図8Bの処理を終了する。
また、検索部44が、ストレージにアクセスして(S104「Yes」)、第1ファイル及び第2ファイルをストレージから検索できた場合(S103で第1ファイルのみを記憶部38から検索して読み出しているときは、第2ファイルをストレージから検索できた場合)は(S105「Yes」)、表示制御部42は、第1ファイル及び第2ファイル(S103で第1ファイルのみを記憶部38から検索して読み出しているときは、第2ファイルのみ)を表示部32に表示させる(S107)。このとき、ユーザーが、第1ファイル及び第2ファイル(S103で第1ファイルのみを記憶部38から検索して読み出しているときは第2ファイルのみ)を選択するための操作を、操作部34等を介して行わなければ(S108「No」)、表示制御部42は、言語併記モードの終了通知のメッセージを表示部32に表示させ(S106)、図8A及び図8Bの処理を終了する。
また、ユーザーが、操作部34又はタッチパネル35を操作して、第1ファイル及び第2ファイル(S103で第1ファイルのみを記憶部38から検索して読み出しているときは第2ファイルのみ)を選択して、制御部41が当該選択を受け付けると(S108「Yes」)、検索部44は、ストレージから検索した第1ファイル及び第2ファイルの両方(S103で第1ファイルのみを記憶部38から検索して読み出しているときは、第2ファイルのみ)を取得する。
従って、検索部44が第1ファイル及び第2ファイルを記憶部38から検索により読み出せたか(S103「Yes」)、あるいはユーザーが操作部34又はタッチパネル35を操作して、第1ファイル及び第2ファイルの両方の選択(S103で第1ファイルのみを記憶部38から検索して読み出しているときは第2ファイルの選択)が制御部41に受け付けられると(S108「Yes」)、第1ファイル及び第2ファイルの両方(S103で第1ファイルのみを記憶部38から検索して読み出しているときは第2ファイルのみ)が取得されることとなる。
なお、ユーザーによる操作部34等を介した上記設定画面D2の操作により、上記言語併記モードが適用される範囲が入力されると、制御部41は当該範囲の指定を受け付ける。検索部44は、当該指示が示す適用範囲に従って、記憶部38内の第1ファイルから該適用範囲に対応する頁の原稿画像を読出して画像メモリー39に記憶させると共に、記憶部38内の第2ファイルから該適用範囲に対応する頁の原稿画像を読出して画像メモリー39に記憶させる(S109)。
そして、レイアウト解析部45は、画像メモリー39内の第1ファイルの原稿画像及び第2ファイルの原稿画像別に、原稿画像に対してレイアウト解析などを行って該原稿画像におけるテキスト領域、画像領域、表領域などを逐次判定し、それぞれのテキスト領域から上記文字テキスト変換によりテキストを抽出すると共に、当該抽出した各テキストが示す文字の言語を判定する(S110)。また、レイアウト解析部45は、第1ファイルの原稿画像における各テキスト領域の位置と第2ファイルの原稿画像における各テキスト領域の位置に基づき、第1ファイルの各テキスト領域のテキストと第2ファイルの各テキスト領域のテキストとの対応関係を検出する。
翻訳部46は、第2ファイルの各テキストを、第1ファイルの各テキストと同一の言語に翻訳して、第2ファイルの各テキストについてそれぞれ翻訳テキストを生成し、これらの翻訳テキストを第2ファイルの各テキストに対応付けて記憶部38に記憶させる(S111)。
比較部47は、第1ファイルの各テキストに対応する、第2ファイルにおけるそれぞれのテキストを上記対応関係に基づいて特定し、第1ファイルの各テキストと、第1ファイルの各テキストに対応するそれぞれの第2ファイルのテキストの翻訳テキストとを比較する(S112)。比較部47は、この比較に基づき第1ファイルのテキストと第2ファイルのテキストの差異の有無を逐次判定する(S113)。
比較部47は、差異が有れば(S113「有」)、この差異を記憶部38に記憶されている上記第1ファイルの各テキスト、又は第2ファイルの各テキストのいずれかに記して、該各テキストを対応付ける(S114)。例えば、比較部47は、第1ファイルのテキストには記載されていない単語を翻訳テキストから抽出して、第2ファイルのテキストからその抽出した単語に対応する単語を差異として求め、その求めた単語を第2ファイルのテキストに記して、当該第1ファイルのテキストと第2ファイルのテキストを対応付ける。あるいは、比較部47は、翻訳テキストに記載されていない単語を差異として第1ファイルのテキストから求め、この求めた単語を第1ファイルのテキストに記して、当該第1ファイルのテキストと第2ファイルのテキストを対応付ける。
また、比較部47は、第1ファイルのテキストと第2ファイルのテキストの差異が無ければ(S113「無」)、差異を記すことなく、当該記憶部38に記憶されている第1ファイルのテキストと第2ファイルのテキストを対応付ける(S115)。
そして、比較部47は、第1ファイルの各テキストのうちに翻訳テキストと比較されていないテキストが残っているか否かを判定し(S116)、残っていると判定すると(S116「Yes」)、S112〜S116の処理を繰り返し、
未だ比較していない第1ファイルの各テキストとこれに対応する翻訳テキストとを比較する。一方、比較部47は、残っていないと判定すると(S116「No」)、S112〜S116の処理を終了して、S117に移行する。
未だ比較していない第1ファイルの各テキストとこれに対応する翻訳テキストとを比較する。一方、比較部47は、残っていないと判定すると(S116「No」)、S112〜S116の処理を終了して、S117に移行する。
制御部41は、S112〜S116の処理が終了すると、記憶部38に記憶されている第1ファイルの各テキストと、当該各テキストに対応付けられた第2ファイルのそれぞれのテキストとを参照して、第1ファイルのテキスト及びこれに対応付けられた第2ファイルのテキストについてS114で差異として求められた単語の数を検出する。そして、制御部41は、単語の数が予め設定された判定値Q(Q=0又は整数。本実施形態では0とする)以下であるか否かを判定する(S117)。制御部41は、単語の数が判定値Q以下であると判定すると(S117「Yes」)、第1ファイルの各テキストと第2ファイルの各テキストが一致する旨を示すメッセージを、表示制御部42が表示部32に表示させる(S118)。出力部48は、第1ファイルの各テキストと第2ファイルの各テキストを併記した画像を作成し、当該画像を出力するための処理を行う(S119)。
また、制御部41は、単語の数が判定値Qを超えていると判定すると(S117「No」)、第1ファイルの各テキストと第2ファイルの各テキストが一致しない旨を示すメッセージを、表示制御部42が表示部32に表示させる(S120)。出力部48は、各差異となる単語別に、その単語を第1ファイルのテキスト又は第2ファイルのテキストに記した状態で、第1ファイルの各テキストと第2ファイルの各テキストを併記した画像を作成して、当該画像を出力するための処理を行う(S121)。
なお、上記S117において、制御部41が、単語の数が予め設定された判定値Qを上記0ではなく、例えば、5などの整数値にして上記判定を行うと、当該整数値が示す数以下しか差異がない場合には、第1ファイルの各テキストと第2ファイルの各テキストが一致したものとして、上記メッセージを表示制御部42が表示部32に表示させることができる。異なる言語からなる文章の一方を翻訳して変換し、同一の言語に揃えたとしても、変換後の文章の内容が、変換していない方の文章に完全に一致しないこともある。このため、このように判定値Qを変更することにより、第1ファイルの各テキストと第2ファイルの各テキストとが一致すると判断する基準を、ユーザーが求めるレベルに調整することが可能になる。
出力部48の処理による、第1ファイルの各テキストと第2ファイルの各テキストの出力形態は、図3〜図7に示した通りである。例えば、出力部48は、第1ファイルの原稿画像における各画像領域の数又は第2ファイルの原稿画像における各画像領域の数が予め設定された規定値S1(例えば、3)以下であるか否かを判定する。出力部48は、各画像領域の数が規定値S1を超えると判定すると、図3に示すように第1ファイルの原稿画像と第2ファイルの原稿画像を画像メモリー39から読み出して併記し、差異となる単語を記憶部38から逐次読み出して、該各原稿画像のテキストにおけるその差異となる単語に対して下線又は枠を付したり、該単語を他の単語とは異なる色で示した画像を作成する。
また、出力部48は、第1ファイルの原稿画像における各画像領域の数又は第2ファイルの原稿画像における各画像領域の数が規定値S1以下であると判定すると、第1ファイルの原稿画像から日本語の各テキストを抽出すると共に、第2ファイルの原稿画像から英語の各テキストを抽出して、第1ファイルの各テキストと第2ファイルの各テキストを併記し、差異となる単語を記憶部38から逐次読み出して、該各テキストにおけるその差異となる単語に対して下線又は枠を付したり、該単語を他の単語とは異なる色で示した画像を作成する。
また、出力部48は、図4に示すように第1ファイルの原稿画像と第2ファイルの原稿画像を画像メモリー39から読み出して併記し、差異となる単語を記憶部38から逐次読み出して、該各原稿画像のテキストにおけるその差異となる単語に対して下線又は枠を付したり、該単語を他の単語とは異なる色で示した画像を作成する。あるいは、出力部48は、図5に示すように第1ファイルのテキスト毎に、第1ファイルのテキストと該テキストに対応する第2ファイルのテキストを上下に並べて併記し、差異となる単語を記憶部38から逐次読み出して、該各元テキストにおけるその差異となる単語を下線又は枠や色で示した画像を作成する。
また、出力部48は、図6に示すように第1ファイルの原稿画像と第2ファイルの原稿画像を横に並べて併記し、第1ファイルのテキスト又は第2ファイルのテキストにおける差異となる単語を下線又は枠や色表示で示した画像を作成するようにしてもよい。
また、出力部48は、図7に示すように第1ファイルの原稿画像における各表領域と第2ファイルの原稿画像における各表領域を横に並べて併記し、第1ファイルのテキスト又は第2ファイルのテキストにおける差異となる単語を下線又は枠や色表示で示した画像を作成するようにしてもよい。
このように本実施形態では、第2ファイルのテキストを第1ファイルのテキストと同一の言語に翻訳して翻訳テキストを生成し、第1ファイルのテキストと、当該第2ファイルの翻訳テキストを比較することにより、この比較に基づき第1ファイルのテキストと第2ファイルのテキストの差異を検出する。これにより、言語が異なる各テキストの差異を容易に確認することができる。本実施形態によれば、例えば、一方のテキストのみが更新された場合に、更新の内容が両テキストに反映されているかの確認作業が容易となる。また上記のように検出される差異を視認することで、ユーザーは、各テキストの一方に対する他方の翻訳精度を確認することも可能になる。
また、本実施形態によれば、出力部48が、各テキストを併記し、各テキストのいずれかに該各テキストの差異を記した画像を作成するので、出力された当該画像を視認することで、ユーザーは、両テキストを容易に比較することができる。
また、本実施形態によれば、出力部48は、第1ファイルの原稿画像における各画像領域の数又は第2ファイルの原稿画像における各画像領域の数が規定値S1を超える場合に、原稿画像G1と原稿画像G2を併記した画像を作成するので、画像領域を記さないことにより原稿画像G1と原稿画像G2の体裁が崩れる事態を低減できる。また、出力部48は、該各画像領域の数が規定値S1以下の場合に、原稿画像G1と原稿画像G2を併記する代わりに、原稿画像G1における日本語の各テキストT1と原稿画像G2における英語の各テキストT2を抽出して併記しているので、画像領域を記さないことにより原稿画像G1と原稿画像G2の体裁が崩れない場合に限って、画像領域を記さないようにして、ユーザーが、各テキストT1と各テキストT2の差異を容易に確認可能となる。
なお、上記実施形態では、比較部47は、第2ファイルについて翻訳テキストを作成するようにしているが、第2ファイルはそのままのテキストを用い、第1ファイルのテキストを翻訳して翻訳テキストを作成し、第1及び第2ファイルを比較するようにしてもよい。
また、上記実施形態では、レイアウト解析部45が、第1ファイル及び第2ファイルに格納されているそれぞれの原稿画像からテキスト領域を判定し、判定したテキスト領域からテキストを抽出して、当該抽出した第1ファイル及び第2ファイルのテキストが互いに比較対象とされるが、レイアウト解析部45の処理によることなく、第1ファイル及び第2ファイルが当初からそれぞれテキストデータを有しており、当該テキストデータ部分を比較対象のテキストとして、比較部47が上述した比較を行うようにしてもよい。
また、第1ファイルのテキスト及び第2ファイルのテキストとして、種々の言語を適用することが可能である。
また、出力部48は、差異の数を計数し、この差異の数が予め設定された閾値以下の場合に、差異別に、差異を第1ファイルのテキスト又は第2ファイルのテキストに記した状態で、該各テキストを併記した画像を作成し、差異の数が閾値を超える場合に、差異別に、差異を第1ファイルのテキスト又は第2ファイルのテキストに記して、差異が記された方のテキストのみを示す画像を作成するようにしてもよい。この場合は、差異の数が多いときには、差異が記された方のテキストのみをユーザーが確認することとなり、ユーザーは差異を容易に確認できる。
また、出力部48は、互いに対応する第1ファイルのテキストと第2ファイルのテキストのいずれかに差異が記されている場合に、該各テキストを併記した画像を作成し、互いに対応する第1ファイルのテキストと第2ファイルのテキストのいずれにも差異が記されていない場合には、該各テキストの画像の作成を省略してもよい。
また、第1ファイルのテキストと第2ファイルのテキストの併記方向を、ユーザーが任意に設定できるようにしてもよい。例えば、図10に示す言語併記モードの設定画面D2において、併記方向を上下方向及び左右方向のいずれかに設定するための2つのチェックボックスを表示して、操作部34又はタッチパネル35の操作により該各チェックボックスのいずれかをユーザーが操作する。そして、出力部48は、操作されたチェックボックスに応じた、第1ファイルのテキストと第2ファイルのテキストの併記方向を受け付け、この受け付けた併記方向に従って、併記方向を上下方向及び左右方向のいずれかに設定する。
更に、言語併記モードの設定画面D2において、第1ファイルのテキストと第2ファイルのテキストの併記の順番を設定することができるようにしてもよい。
また、出力部48は、第1ファイルのテキストと第2ファイルのテキストの併記方向を左右方向に設定した状態で、第1ファイルのテキストと第2ファイルのテキストの少なくとも一方の左右方向長さが予め設定された規定長さを超えた場合に、各テキストの併記方向を上下方向に変更してもよい。この場合は、各テキストの少なくとも一方の左右方向長さが長くなり過ぎて、各テキストを左右方向に併記することが困難になったときに、各テキストの併記方向が上下方向に変更されるので、各テキストの併記を維持することができる。
また、図1乃至図10を用いて説明した上記実施形態の構成及び処理は、本発明の一例に過ぎず、本発明を当該構成及び処理に限定する趣旨ではない。
10 画像形成装置
11 画像読取部
12 画像形成部
31 制御ユニット
32 表示部
34 操作部
35 タッチパネル
36 ネットワーク通信部
37 ファクシミリ通信部
38 記憶部
39 画像メモリー
41 制御部
42 表示制御部
43 通信制御部
44 検索部
45 レイアウト解析部
46 翻訳部
47 比較部
48 出力部
11 画像読取部
12 画像形成部
31 制御ユニット
32 表示部
34 操作部
35 タッチパネル
36 ネットワーク通信部
37 ファクシミリ通信部
38 記憶部
39 画像メモリー
41 制御部
42 表示制御部
43 通信制御部
44 検索部
45 レイアウト解析部
46 翻訳部
47 比較部
48 出力部
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017241114A JP6885319B2 (ja) | 2017-12-15 | 2017-12-15 | 画像処理装置 |
CN201811493374.6A CN110012190B (zh) | 2017-12-15 | 2018-12-07 | 图像处理装置 |
US16/216,313 US10902223B2 (en) | 2017-12-15 | 2018-12-11 | Image processing apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017241114A JP6885319B2 (ja) | 2017-12-15 | 2017-12-15 | 画像処理装置 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2019109629A JP2019109629A (ja) | 2019-07-04 |
JP2019109629A5 true JP2019109629A5 (ja) | 2020-06-18 |
JP6885319B2 JP6885319B2 (ja) | 2021-06-16 |
Family
ID=66816118
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017241114A Expired - Fee Related JP6885319B2 (ja) | 2017-12-15 | 2017-12-15 | 画像処理装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US10902223B2 (ja) |
JP (1) | JP6885319B2 (ja) |
CN (1) | CN110012190B (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6885318B2 (ja) * | 2017-12-15 | 2021-06-16 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置 |
JP7484198B2 (ja) * | 2020-02-03 | 2024-05-16 | 富士フイルムビジネスイノベーション株式会社 | 文書処理装置およびプログラム |
CN112183122A (zh) * | 2020-10-22 | 2021-01-05 | 腾讯科技(深圳)有限公司 | 文字识别方法和装置、存储介质及电子设备 |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6981225B1 (en) * | 2000-01-31 | 2005-12-27 | Intel Corporation | Indicating the differences between Internet web pages |
US6519557B1 (en) * | 2000-06-06 | 2003-02-11 | International Business Machines Corporation | Software and method for recognizing similarity of documents written in different languages based on a quantitative measure of similarity |
JP2004199483A (ja) | 2002-12-19 | 2004-07-15 | Fuji Xerox Co Ltd | 画像出力装置 |
ITPD20040222A1 (it) * | 2004-08-31 | 2004-11-30 | Techmind Srl | Procedimento di traduzione automatica da una prima lingua ad una seconda lingua ed apparecchiatura per attuare il procedimento |
US20080168151A1 (en) * | 2005-06-22 | 2008-07-10 | Tele Atlas North America, Inc. | System and method for automatically executing corresponding operations using peer groups |
US7813918B2 (en) * | 2005-08-03 | 2010-10-12 | Language Weaver, Inc. | Identifying documents which form translated pairs, within a document collection |
GB2433403B (en) * | 2005-12-16 | 2009-06-24 | Emil Ltd | A text editing apparatus and method |
TW200910875A (en) * | 2007-08-29 | 2009-03-01 | Inventec Appliances Corp | Method and system for instantly translating text within an image |
JP2010176543A (ja) * | 2009-01-30 | 2010-08-12 | Toshiba Corp | 翻訳装置、方法、及びプログラム |
CN102053991B (zh) * | 2009-10-30 | 2014-07-02 | 国际商业机器公司 | 用于多语言文档检索的方法及系统 |
JP2012118883A (ja) | 2010-12-02 | 2012-06-21 | Nec Corp | 翻訳装置、翻訳システム、翻訳方法および翻訳プログラム |
US8856674B2 (en) * | 2011-09-28 | 2014-10-07 | Blackberry Limited | Electronic device and method for character deletion |
US9081769B2 (en) * | 2011-11-25 | 2015-07-14 | Google Inc. | Providing translation assistance in application localization |
JP5909123B2 (ja) * | 2012-03-21 | 2016-04-26 | 株式会社東芝 | 機械翻訳装置、機械翻訳方法およびプログラム |
US8892596B1 (en) * | 2012-08-08 | 2014-11-18 | Google Inc. | Identifying related documents based on links in documents |
JP6056489B2 (ja) | 2013-01-15 | 2017-01-11 | 富士通株式会社 | 翻訳支援プログラム、方法、および装置 |
JP2014194668A (ja) * | 2013-03-28 | 2014-10-09 | Fujitsu Ltd | 翻訳支援装置、翻訳支援システムおよび翻訳支援プログラム |
JP6379787B2 (ja) * | 2013-11-08 | 2018-08-29 | 株式会社リコー | 画像処理システム、画像処理装置、画像処理方法及びプログラム |
US20150199339A1 (en) * | 2014-01-14 | 2015-07-16 | Xerox Corporation | Semantic refining of cross-lingual information retrieval results |
US9788153B1 (en) * | 2014-03-28 | 2017-10-10 | Symantec Corporation | Techniques for mobile geofencing |
JP6122814B2 (ja) * | 2014-07-17 | 2017-04-26 | 富士フイルム株式会社 | 情報処理装置、プログラム、及びデジタル検版方法 |
CA3045008A1 (en) * | 2016-02-29 | 2017-09-08 | Smart Lamp, Inc. D/B/A Lampix | Method and apparatus for providing user interfaces with computerized systems and interacting with a virtual environment |
US9710703B1 (en) * | 2016-07-15 | 2017-07-18 | StradVision, Inc. | Method and apparatus for detecting texts included in a specific image |
US10460192B2 (en) * | 2016-10-21 | 2019-10-29 | Xerox Corporation | Method and system for optical character recognition (OCR) of multi-language content |
JP6885318B2 (ja) * | 2017-12-15 | 2021-06-16 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置 |
-
2017
- 2017-12-15 JP JP2017241114A patent/JP6885319B2/ja not_active Expired - Fee Related
-
2018
- 2018-12-07 CN CN201811493374.6A patent/CN110012190B/zh not_active Expired - Fee Related
- 2018-12-11 US US16/216,313 patent/US10902223B2/en not_active Expired - Fee Related
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6885318B2 (ja) | 画像処理装置 | |
JP2019109628A5 (ja) | ||
US7797150B2 (en) | Translation system using a translation database, translation using a translation database, method using a translation database, and program for translation using a translation database | |
CN108132762B (zh) | 图像处理装置以及图像形成装置 | |
JP2006350551A (ja) | 文書変換装置、文書変換方法、文書変換システム、文書処理装置および情報処理装置 | |
US10755092B2 (en) | Image forming apparatus that gives color respectively different from one another to text area for each of various kinds of languages or selectively deletes text area for each of various kinds of language | |
CN110012190B (zh) | 图像处理装置 | |
JP2019109629A5 (ja) | ||
US20200213459A1 (en) | Image forming apparatus for forming image on recording sheet | |
US10095383B2 (en) | Display/input device, image forming apparatus, and method for controlling a display/input device | |
US11297199B2 (en) | Image processing apparatus that generates cover page from source image | |
JP6791028B2 (ja) | 画像形成システム及び画像形成方法 | |
JP7363188B2 (ja) | 画像読取装置及び画像形成装置 | |
EP3547036A1 (en) | Image forming device | |
JP7115162B2 (ja) | 電子機器、画像形成装置、電子メール作成支援方法、及び電子メール作成支援プログラム | |
US11849086B2 (en) | Image processing apparatus capable of extracting portion of document image specified by preset index and subjecting character string in extracted portion to processing associated with index | |
JP6702262B2 (ja) | 画像形成装置及び画像形成システム | |
JP7419942B2 (ja) | 画像処理装置及び画像形成装置 | |
JP6624027B2 (ja) | 画像処理装置及び画像形成装置 | |
JP2020086536A (ja) | 電子機器及び画像形成装置 | |
WO2021033603A1 (ja) | 画像読取装置 | |
JP2012247918A (ja) | ファイル名作成装置およびファイル名作成プログラム | |
JP2024124216A (ja) | 原稿頁順編集装置 | |
JP2025040863A (ja) | 画像処理装置 | |
JP2018093336A5 (ja) |