[go: up one dir, main page]

JP4377494B2 - 情報入力装置 - Google Patents

情報入力装置 Download PDF

Info

Publication number
JP4377494B2
JP4377494B2 JP30140099A JP30140099A JP4377494B2 JP 4377494 B2 JP4377494 B2 JP 4377494B2 JP 30140099 A JP30140099 A JP 30140099A JP 30140099 A JP30140099 A JP 30140099A JP 4377494 B2 JP4377494 B2 JP 4377494B2
Authority
JP
Japan
Prior art keywords
character recognition
image
processing
document image
instruction button
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP30140099A
Other languages
English (en)
Other versions
JP2001126026A (ja
Inventor
信久 依田
竜也 原口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba TEC Corp
Original Assignee
Toshiba Corp
Toshiba TEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba TEC Corp filed Critical Toshiba Corp
Priority to JP30140099A priority Critical patent/JP4377494B2/ja
Priority to US09/664,071 priority patent/US6917438B1/en
Publication of JP2001126026A publication Critical patent/JP2001126026A/ja
Priority to US10/934,435 priority patent/US7081975B2/en
Application granted granted Critical
Publication of JP4377494B2 publication Critical patent/JP4377494B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/96Management of image or video recognition tasks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • General Business, Economics & Management (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Character Discrimination (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Character Input (AREA)
  • Image Input (AREA)

Description

【0001】
【発明の属する技術分野】
この発明は、例えば、デジタル複写機などのネットワーク型スキャナによりスキャンした文書画像をデータベースに登録し、後にデータベースに登録した文書画像を検索する情報入力装置に関する。
【0002】
【従来の技術】
従来、情報入力装置は、文書画像を読取って登録し、この登録した文書画像を後に検索するようになっている。
【0003】
ディジタル複写機からスキャン読込みした文書画像を属性情報と共にサーバ装置に送られて、文書管理システムに登録し、その後検索を行うことができるものがある。
【0004】
このような従来技術としては、ディジタル複合機に備えたスタートボタンをオンすると、画像入力手段によって画像データが生成されるとともに、属性情報生成手段によって属性情報が生成される。この画像データおよび属性情報は、転送手段によってアドレス格納手段に格納されるネットワークアドレスに向けて転送され、サーバ装置の記憶手段に保存される。この画像データおよび属性情報は、サーバ装置の公開手段によって公開され、閲覧装置の閲覧手段によって閲覧されるというものがある(特開平10−312456号)。
【0005】
また、文書にヘッダーシートとトレーラシートを配置して読み込んで、登録データベースと画像データベースとの対応づけをしながら登録するものがある。
【0006】
このような従来技術としては、文書画像を登録する画像ファイル装置への画像登録方式であって、該画像ファイル装置は、登録した文書を検索するための登録データベースと、該登録した文書を画像で保有する画像データベースと、該登録データベースと該画像データベースとの対応付けに用いる接続データを登録する登録事項データベースと、文書を入力しそれらの画像データを得る入力手段と、画像データから英数字その他の記号を認識する認識手段と、前記複数のデータベース、前記入力手段及び前記認識手段を制御しデータを処理する制御手段とを有し、画像登録に際し、降べき若しくは昇べきの順序に並んだ合本形式の文書、又は、共通事項を含む複数の単票形式の文書の前後に、それぞれ、ヘッダーシートとトレーラシートを配置し、予め該ヘッダーシートには、前記合本若しくは前記単票の別を示す記号、前記文書が片面若しくは両面に著わされているかの別を示す記号、前記文書が両面に著わされている場合には表若しくは裏の別を示す記号、又は、前記降べき若しくは昇べきの順序を示す記号を記入する第1の記入枠と、前記文書の分類若しくは文書番号が著わされる少なくとも2つの第2の記入枠と、前記ヘッダーシート若しくは前記トレーラシートの別を示す記号を記入する第3の記入枠が、少なくとも設けられており、前記ヘッダーシート、前記合本形式の文書若しくは前記単票形式の文書、前記トレーラシートの順序で、前記入力手段により入力し、前記認識手段により前記記入枠に記入された記号を認識し、前記登録データベースと前記画像データベースに格納された文書の対応付けを行う画像登録方式(特開昭62−267876号、特公平8−27831号)。
【0007】
上記のような従来の技術では、文書画像を任意のフォルダ内への登録する処理と、この登録した文書画像に対するOCR処理(文字認識処理)の処理結果の全文検索用データベースへの登録処理と別々に行わなければならない。このため、OCR処理は、一旦、文書画像を登録した後の処理となり、文書画像の登録と文書画像の検索用の文字認識処理とを行う操作が煩雑である。
【0008】
また、先行技術では、登録する文書画像の検索用にOCR処理を行う場合、種々の文書画像の種類に応じて、OCR処理効率の向上を目的とした処理条件が設定がされている操作ボタンが予め作成しておきおことができないため、OCR処理を実行する際に、種々の操作ボタンから文書画像の用途に適した操作ボタンを選択することはできない。
【0009】
従って、上記したような従来技術においては、スキャンした文書画像に対して自動的にOCR処理を施す場合にそのOCR処理の向上を目的とした各種設定手段が利用者からみて文書画像のスキャン入力操作と別であったので、その結果、スキャン後の修正に手間がかかったり、本来得られるべき文字認識精度が得られないなどの問題がある。
【0010】
【発明が解決しようとする課題】
上記したように、従来は、スキャンした文書画像に対して自動的に文字認識処理を施す場合に、その文字認識処理の向上を目的とした各種設定手段が利用者からみて文書画像のスキャン入力操作と別であったので、その結果として文書画像を登録する操作やスキャン後の修正に手間がかかったり、本来得られるべき文字認識精度が得られないなどの問題点がある。
【0011】
この発明は、上記の問題を解決するためになされたものであり、利用者にとって使いやすくかつ最大限の文字認識精度を達成させて、文書画像の登録後に文書画像を効率よく検索可能な情報入力装置を提供することを目的とする。
【0012】
【課題を解決するための手段】
この発明の情報入力装置は、画像を読取る読取手段、この読取手段により読取った画像を文字認識処理する文字認識手段、この文字認識手段による文字認識の処理結果を記憶するデータベース、種々の指示ボタンを表示する表示手段、この表示手段により表示される指示ボタンに対応させて、文書画像の登録先と、上記文書画像に対する文字認識処理の設定とを管理する管理手段、およびこの管理手段により管理される上記指示ボタンが指示された際に、上記管理手段により指示ボタンに対応する設定内容に基いて、上記読取手段により文書画像を読取り、この読取った文書画像に対して上記文字認識手段により文字認識処理を実行し、上記文書画像の登録処理と上記文書画像に対する文字認識の処理結果を前記データベースに登録する処理とを一括して実行する実行手段から構成されている。
【0014】
この発明の情報入力装置は、外部装置から送信された画像を蓄積する蓄積手段、画像を読取る読取手段、この読取手段により読取った画像あるいは上記蓄積手段により蓄積されている画像を文字認識処理する文字認識手段、この文字認識手段による文字認識の処理結果を記憶するデータベース、種々の指示ボタンを表示する表示手段、この表示手段により表示される指示ボタンに対応させた文書画像の登録先と、上記文書画像に対する文字認識処理の設定とを管理する管理手段、およびこの管理手段により管理される上記指示ボタンが指示された際に、上記管理手段により指示ボタンに対応する設定内容に基いて、上記読取手段により画像を読取り、この読取った画像に上記蓄積手段により蓄積されている画像を添付した文書画像に対して上記文字認識手段により文字認識処理を実行し、上記文書画像の登録処理と上記文書画像に対する文字認識の処理結果を前記データベースに登録する処理とを一括して実行する実行手段から構成されている。
【0015】
この発明の情報入力装置は、画像を読取る読取手段、この読取手段により読取った画像を文字認識処理する文字認識手段、この文字認識手段による文字認識の処理結果を記憶するデータベース、種々の指示ボタンを表示する表示手段、この表示手段により表示される指示ボタンに対応させて、文書画像の登録先と、上記文書画像に対する文字認識処理の設定とを管理する管理手段、およびこの管理手段により管理される上記指示ボタンが指示された際に、上記管理手段による指示ボタンに対応する設定内容に基いて、上記読取手段により文書画像を読取り、この読取った文書画像に対して上記文字認識手段により文字認識処理を実行し、上記読取画像の登録処理と上記指示ボタンに対応する設定内容を示す情報を追加した上記文書画像に対する文字認識の処理結果を前記データベースに登録する処理とを一括して実行する実行手段から構成されている。
【0016】
この発明の情報入力装置は、画像を読取る読取手段、この読取手段により読取った画像を文字認識処理する文字認識手段、この文字認識手段による文字認識の処理結果を記憶するデータベース、種々の指示ボタンを表示する表示手段、この表示手段により表示される指示ボタンに対応させて、文書画像の登録先と、上記文書画像に対する文字認識処理の設定とを管理する管理手段、およびこの管理手段により管理される上記指示ボタンが指示された際に、上記管理手段により指示ボタンに対応する設定内容に基いて、上記読取手段により文書画像を読取り、この読取った文書画像に対して上記文字認識手段により文字認識処理を実行して、さらに、文字認識処理結果に文章解析処理を施し、上記文書画像の登録処理と、上記文章解析処理により得られた複数の認識候補を文字認識の処理結果として前記データベースに登録する処理とを一括して実行する実行手段から構成されている。
【0017】
この発明の情報入力装置は、画像を読取る読取手段、この読取手段により読取った画像を文字認識処理する文字認識手段、この文字認識手段による文字認識の処理結果を記憶するデータベース、種々の指示ボタンを表示する表示手段、この表示手段により表示される指示ボタンに対応させて、文書画像の登録先と、上記文書画像に対する文字認識処理の設定とを管理する管理手段、この管理手段により管理される上記指示ボタンが指示された際に、上記管理手段により指示ボタンに対応する設定内容に基いて、上記読取手段により画像を読取り、この読取った画像から文書画像ごとに分割するセパレータであることを示す情報を検出してセパレータを認識する検出手段、およびこの検出手段により検出したセパレータを示す情報を削除し、このセパレータごとに分割されるそれぞれの文書画像に対して上記文字認識手段により文字認識処理を実行し、上記文書画像の登録処理と上記文書画像に対する文字認識の処理結果を前記データベースに登録する処理とを一括して実行する実行手段から構成されている。
【0018】
この発明の情報入力装置は、画像を読取る読取手段、この読取手段により読取った画像を文字認識処理する文字認識手段、この文字認識手段による文字認識の処理結果を記憶するデータベース、種々の指示ボタンを表示する表示手段、この表示手段により表示される指示ボタンに対応させて、文書画像の登録先と、上記文書画像に対する文字認識処理の設定とを管理する管理手段、この管理手段により管理される上記指示ボタンが指示された際に、上記管理手段により指示ボタンに対応する設定内容に基いて、上記読取手段により文書画像を読取り、この読取った文書画像に対して上記文字認識手段により文字認識処理を実行し、上記文書画像の登録処理と上記文書画像に対する文字認識の処理結果を前記データベースに登録する処理とを一括して実行する実行手段、およびこの実行手段により登録される文書画像と共に文字認識の処理結果を示すデータを印刷する印刷手段から構成されている。
【0019】
この発明の情報入力装置は、画像を読取る読取手段、この読取手段により読取った画像を文字認識処理する文字認識手段、この文字認識手段による文字認識の処理結果を記憶するデータベース、種々の指示ボタンを表示する表示手段、この表示手段により表示される指示ボタンに対応させて、文書画像の登録先と、上記文書画像に対する文字認識処理の設定とを管理する管理手段、この管理手段により管理される上記指示ボタンが指示された際に、上記管理手段により指示ボタンに対応する設定内容に基いて、上記読取手段により文書画像を読取り、この読取った文書画像に対して上記文字認識手段により文字認識処理を行う処理手段、上記読取手段により読取った文書画像のデータサイズが所定の許容制限値を越えたか否かを判断する判断手段、この判断手段により読取った画像のデータサイズが所定の許容制限値を越えていると判断した場合、上記指示ボタンに対応する文書画像の登録先に、上記読取手段により読取った画像を登録せずに、上記処理手段による文字認識処理の結果のみを登録する第1の実行手段、およびこの判断手段により読取った画像のデータサイズが所定の許容制限値を越えていないと判断した場合、上記管理手段により指示ボタンに対応する設定内容に基いて、上記文書画像の登録処理と上記文書画像に対する文字認識の処理結果を前記データベースに登録する処理とを一括して実行する第2の実行手段から構成されている。
【0020】
【発明の実施の形態】
以下、この発明の第1〜第8の実施の形態について図面を参照して説明する。
【0021】
図1、図2は、この発明の情報入力装置に係わる第1〜第7の実施の形態のネットワークシステムの構成例を示すものである。このネットワークシステムは、情報入力装置としてのネットワークスキャナ(デジタル複写機)1、検索用パーソナルコンピュータ(外部装置)2、文書管理サーバ3、LAN4から構成されている。
【0022】
ネットワークスキャナ1は、図1に示すように、制御部11、画像入力部12、OCR処理部(文字認識手段)13、表示部14、管理部15などからなっている。このネットワークスキャナ1は、利用者が紙などの文書(書類)の画像をスキャンして電子化するための装置である。
【0023】
上記制御部11は、スキャナ全体を制御するものである。上記画像入力部12は、紙などの文書(書類)を光学的に走査して画像を読取るものである。上記OCR処理部13は、読取った画像から文字や記号などの文字認識処理(OCR処理)を行う。上記表示部14は、図示しない操作パネル上に設けられる。この表示部14には、タッチパネル14aが内蔵され、操作案内や設定内容が表示されるとともに、操作指示を入力する指示ボタンが表示される。上記管理部15は、上記指示ボタンに割り当てられた処理内容を指定する設定内容などを管理する管理テーブル15aを有している。
【0024】
また、上記ネットワークスキャナ1は、図1で画像入力装置として説明しているが、図2に示すように、例えば、デジタル複写機1のような画像の入力機能と印刷機能等が物理的に一体化された機器であっても良い。この場合、デジタル複写機1の主な構成としては、図2に示すように、上記図1のネットワークスキャナの構成に加えて、コピー用紙などの被画像形成媒体上に画像を形成するプリンタ部16を有するものとなる。
【0025】
上記ネットワークスキャナ(デジタル複写機)1は、LAN4に接続し、同じLAN4上に文書管理サーバ3と検索用パーソナルコンピュータ2が接続されている。上記検索用パーソナルコンピュータ2は、表示部2aや操作部などを有し、上記文書管理サーバ3に記憶されている文書画像を検索するものである。
【0026】
上記文書管理サーバ3は、ネットワークスキャナ1から入力した文書画像を格納し管理する装置である。この文書管理サーバ3には、画像をフォルダで管理する画像管理用の画像データベース(DB)3と、テキストデータで与えられるデータを記憶する全文検索用データベース(DB)3とを備えている。上記画像データベース3では、文書画像をフォルダ内の書類メタファとして管理し、フォルダがツリー構造を形成するようになっている。
【0027】
上記全文検索用データベース3では、画像に対するOCR処理の処理結果として得られる文字あるいは文字候補の文字コードなどからなるテキストデータを記憶する。この全文検索データベース3に記憶されるテキストデータは、上記検索用パーソナルコンピュータ2によってキーワードがテキストデータ内に含まれるか否かにより検索する際に利用される。
【0028】
まず、第1の実施の形態について説明する。
【0029】
図3は、ネットワークスキャナ1の表示部14でタッチパネル14aにより指示ボタンを表示した例を示す。この表示例では、4つの指示ボタン51〜54と、画像の読取を開始を指示する読取スタートボタン55とがあり、さらに、操作案内が表示されている。
【0030】
上記指示ボタン51〜54は、それぞれ上記管理テーブル15aで管理されている設定内容に基く処理の実行を指示するものである。つまり、これらの指示ボタン51〜54が指示されると、上記管理テーブル15aの設定内容に基いて、文書(書類)の画像をスキャン(読取)入力し、入力した画像に対してOCR処理を行い、スキャン入力した画像を書類として登録するとともに、OCR処理の処理結果を登録するようになっている。
【0031】
上記指示ボタン51は、「営業日報(表紙OCR)」と表示される指示ボタンである。この指示ボタン51には、スキャンした文書画像(書類)を文書管理サーバ3の画像データベース32の「営業日報」というフォルダに登録する処理と、スキャンした書類の表紙(1ページ目)のみをOCR処理して処理結果を全文検索データベース31に登録する処理とが設定されている。従って、この指示ボタン51が指示されると、スキャンした画像は、「営業日報」というフォルダ内に新規書類として登録されるとともに、OCR処理されて処理結果が全文検索データベース31に登録される。
【0032】
上記指示ボタン52は、「営業見積り(全頁OCR)」と表示される指示ボタンである。この指示ボタン52は、スキャンした文書画像を画像データベース32内の「営業見積り」というフォルダ内に新規書類として登録する処理と共に、全頁にわたりOCR処理をし、その結果を全文検索データベース31に登録する処理を実行する。
【0033】
上記指示ボタン53は、「精算レシート(表紙OCR)」と表示され、精算レシートを登録するための指示ボタンである。この指示ボタン53は、スキャンした画像を「精算レシート」というフォルダ内に新規書類として登録する処理とともに、スキャンした表紙(1ページ目)のみをOCR処理してその結果を全文検索データベース31に登録する処理を実行する。
【0034】
上記指示ボタン54は、「取引き先地図(表紙OCR)」と表示され、上記指示ボタン51〜53と同じ要領で、読取った画像を取引先地図を登録するための指示ボタンである。この指示ボタン54は、スキャンした画像を「取引き先地図」というフォルダ内に新規書類として登録する処理とともに、スキャンした表紙(1ページ目)のみをOCR処理してその結果を全文検索データベース31に登録する処理を実行する。
【0035】
また、図3に示すように、表示画面の左下には、利用者に対する指示メッセージを表示する。この図3に示す表示例では、「文書をセットして、処理ボタンを押して、読取スタートしてください。」という操作案内を表示している。また、表示画面の右下には、選択された処理ボタンの設定内容に基づいて文書画像を読み取って登録する処理を開始するための「読取Start」と表示される指示ボタン55がある。
【0036】
このような表示画面により利用者は、入力しようとする文書の登録先に合わせて指示ボタン51〜54から指示ボタンを選択し、指示ボタン55を押下することにより処理を実行する。この時、読取る文書画像のうちOCR処理するページ範囲は、指示ボタン51〜54にそれぞれ対応して登録先ごとに管理部15の管理テーブル15aで設定してある。
【0037】
また、図4は、入力する書類の言語や印刷文字の状態に合わせて指示ボタンを選択できる表示画面の表示例を示す。図4に示すように、この表示例では、指示ボタン61〜64は、スキャンする文書の登録先フォルダが「契約書」であり、契約書をスキャン入力する際に、いずれかの指示ボタンを1つ選択することを想定している。文書画像を装置にセットしてから文書を登録する処理を実行するまでの操作手順は図2と同様である。
【0038】
例えば、スキャンしようとしている契約書が和文で書かれていて、文字ピッチが固定の場合には「和文 固定ピッチ」と表示されている指示ボタン61を選択することになる。それ以外の文字ピッチを使った和文契約書の場合には「和文 標準ピッチ」と表示されている指示ボタン62を選択する。
【0039】
一方、スキャンしようとしている契約書が英文契約書の場合、文字ピッチがプロポーショナルの場合には「English Proportional」と表示されている指示ボタン63を選択する。また、文字ピッチが固定ピッチの場合には「English FIXED Font」と表示されている指示ボタン64を選択する。
【0040】
このように、入力しようとする書類の特徴に合った指示ボタンを選択することにより、入力した文書画像に対してその特徴に合わせたOCR処理を施すことが可能になり、文字認識効率が向上する効果がある。
【0041】
また、この第1の実施の形態では、表示部14のタッチパネル14aを用いて表示する指示ボタンは、利用者が作成画面を使って任意に作成できる。図5は、指示ボタンの作成画面の入力表示例を示す。この図5では、図3で説明した「営業日報」ボタンの作成画面について示している。また、この作成画面により作成された指示ボタンの設定内容は、ボタンの属性として管理部15の管理テーブル15aに書込まれることにより管理される。
【0042】
図5に示すように、指示ボタンの作成画面には、パネル名、ボタン名、登録先フォルダ名、OCR処理の有無、文字認識で利用する辞書、確認印刷、書類セパレータ識別、書類自動分割、OCR設定の言語、OCR設定の文字ピッチ、OCR設定の処理範囲などの設定項目が表示される。
【0043】
上記パネル名の項目は、作成する指示ボタンが属するパネル名(表示画面名)を設定する。上記ボタン名の項目は、作成する指示ボタンのボタン名を設定するものであり、ボタン名が指示ボタンとして表示される。
【0044】
上記登録先フォルダ名の項目は、この指示ボタンを選択して入力した画像の登録先のフォルダ名を指定する。上記OCR処理の有無の項目は、入力した文書画像に対してOCR処理をするかしないかを指定する。
【0045】
上記文字認識で利用する辞書の項目は、OCR処理する場合に使用する辞書の種別を指定する。上記確認印刷の項目は、登録した文書画像を確認の目的で印刷するかしないかを指定する。上記書類セパレータ識別の項目は、複数の書類をまとめて入力し、セパレータ識別により書類の切れ目を自動的に認識するかしないかを指定する。
【0046】
上記書類自動分割の項目は、セパレータを検出した場合に書類を自動的に分割して登録するかしないかを指定する。上記OCR設定の言語、文字ピッチ、および処理範囲の各項目は、OCR処理環境として文書が書かれている言語、文字ピッチの種別、および処理ページ範囲をそれぞれ指定する。
【0047】
図6は、第1の実施の形態での処理を説明するためのフローチャートである。すなわち、図6は、上記したような図3、あるいは図4に示す表示画面の指示ボタンの指示に基づいて文書(書類)をスキャンしてフォルダ内に登録するまでの処理の流れを示す。
【0048】
まず、利用者は、利用する指示ボタンが属するパネル名(表示画面名)を指定する。すると、表示部14のタッチパネル14aにより指定されたパネル名に属する指示ボタンが表示される。この画面から利用者が指示ボタンを選択する(ステップ1)。すると、制御部11は、選択された指示ボタンに対応するボタンの属性を管理部15の管理テーブル15aから読み出す(ステップ2)。
【0049】
制御部11は、管理テーブル15aより読み出した内容に基いて画像を入力するための環境を設定する(ステップ3)。そして、利用者が読取スタートを指示する指示ボタンを押下すると、制御部11は、画像入力部12により画像の入力を開始する(ステップ4)。
【0050】
また、制御部11は、管理部15の管理テーブル15aから読み出した指示ボタンに対するOCR処理における設定内容に基づいてOCR処理の環境(モード)を設定する(ステップ5)。制御部11は、画像が入力されると、設定されたOCR処理の環境で入力した画像に対するOCR処理を実行する(ステップ6)。
【0051】
この際、OCR処理を実行する範囲は、管理テーブル15aで設定される内容に基いて設定される。例えば、OCR処理を実行する範囲としては、読取としての複数ページの画像に対して、全文(全ページ)、表紙(1ページ目)のみ、あるいは指定ページから指定ページまでの間のページなどのページごとに設定される。
【0052】
このような読取った画像に対するOCR処理が完了すると、制御部11は、指示ボタンに対応して管理テーブル15aで指定されている画像データベース32内のフォルダに文書画像を登録する(ステップ7)。そして、制御部11は、OCR処理結果としてのテキストデータ(テキスト文書)を上記画像格納場所(フォルダ)情報と共に全文検索データベース31に登録する(ステップ8)。
【0053】
以上のOCR処理結果と画像の登録とが完了すると、制御部11は、処理結果を後述する動作ログテーブル15bに書き込み(ステップ9)、指示ボタンに対する処理を終了する。
【0054】
上記のように、1回のスキャン操作でスキャンした文書について、OCR処理を介した全文検索用データベースへの登録処理と、登録先フォルダの指定によるフォルダツリー型検索用データベースへの登録処理とを一括して実行することを指定する指示ボタンを設けたものである。
【0055】
これにより、読取った画像のフォルダへの登録処理と読取った画像に対するOCR処理により得られるテキストデータの登録処理とを1つの指示ボタンへの指示で一括して実行することができる。
【0056】
さらに、登録した文書を検索する際に、仮にOCR処理での文字認識のエラーが部分的にあっても、検索のキーワードをテキストデータの全文にわたって検索するため、文書画像を検索するという観点では影響が大きくなく、文書画像の検索における効率を向上できる。
【0057】
また、OCR処理によるテキストデータの全文検索に加えて、フォルダ検索でも文書画像を検索でき、システム全体として文書画像(書類)を確実に検索できる。
【0058】
次に、第2の実施の形態について説明する。
【0059】
この発明の第2の実施の形態では、文字認識処理の過程で利用する辞書を指示ボタンに割り当てておく。これにより、利用者が書類をスキャンする時に指定した指示ボタンに基づいてそのスキャン文書に最適な辞書を使って文字を認識することが可能になる。
【0060】
OCR処理では、文字を最終的に正しく認識するために、文字の形を解析した認識処理に加えて、認識した文字により構成される単語や文章を解析して文字候補を確定する方式(文章解析)がとられることが多いが、その時に重要なのが書類の内容に合わせた辞書を利用することである。
【0061】
例えば、住所を記した文章や医療などの専門技術情報を記した書類では、日常的に使用しない用語が多く、いわゆる一般的な辞書を使用して解析しても正しく認識できない場合が多い。このため、OCR処理の対象となる文書に応じた辞書を利用すると、認識率を向上できる。
【0062】
図7は、入力した書類に対してOCR処理するために利用する辞書別に指示ボタン71〜74を表示した例を示す。図7において、例えば、「顧客登録」と表示される指示ボタン71を使って住所録等の書類をスキャンすると住所および氏名に関する辞書を使用して文字を認識する。また、「経営資料登録」と表示される指示ボタン72を使って経営資料をスキャンして登録する際には、経営や経済に関する辞書を利用する。
【0063】
また、図7に示すような指示ボタン71〜74は、図8に示すような管理テーブル15aにより管理される。図8に示すように、管理テーブル15aでは、各指示ボタンに対応して、ボタン番号、ボタン名称、確認印刷、セパレータ識別、書類分割、利用辞書、OCR言語、OCRピッチ、OCR処理対象範囲の各項目が設定される。
【0064】
上記利用辞書の項目では、文書に応じた辞書が指定される。例えば、顧客登録という指示ボタン71には、氏名および住所の辞書が設定され、経営資料登録という指示ボタン72には、経営および経済の辞書が設定され、建築資料登録という指示ボタン73には、建築の辞書が設定され、医療資料登録という指示ボタン74には、医療の辞書が設定されている。
【0065】
図9は、図7で「顧客登録」と表示される指示ボタン71を作成する際の作成画面の表示例を示す。この表示例は、上記図6の指示ボタンの作成画面と同様な項目を指定するようになっている。また、図9に示す例では、パネル名がOCR処理付きとなっており、ボタン名が顧客登録、登録先フォルダ名が顧客リスト、文字認識に利用される辞書が氏名用の辞書と、住所用の辞書と指定されている。このように作成された指示ボタンに対応する設定内容は、図8に示すような管理部15の管理テーブル15aの内容に反映される。
【0066】
また、図10は、一旦、文書管理サーバ3に登録した文書画像を検索用パーソナルコンピュータ2で検索するための表示部2aの画面表示例を示すものである。すなわち、利用者は、検索用パーソナルコンピュータ2の表示部2aを用いて、文書管理サーバ3に登録済みの文書を画像データベース32からフォルダツリーで検索できると共に、全文検索データベース31からテキストデータで全文検索も可能になっている。
【0067】
フォルダツリーによる検索では、画像データベース32に登録されているフォルダがツリー構造で検索用パーソナルコンピュータ2の表示画面に表示され、利用者は目的とするフォルダを選択する。
【0068】
また、全文(自然言語)検索では、利用者がキーワードとなる任意の言葉(文字、単語、文章など)を入力するだけで全文検索データベース31を使って該当する文書画像のテキストデータを全文検索する。
【0069】
つまり、利用者が検索したい文書のキーワードとなる単語や文章などを検索用パーソナルコンピュータ2に入力すると、検索用パーソナルコンピュータ2は、全文検索データベース32に登録されているOCR処理の結果としてのテキストデータの全文において上記キーワードを全て検索し、上記キーワードが含まれる文書画像を検索結果として一覧表示する。
【0070】
この際、検索のキーワードがより多く含まれるものを検索結果とするようにしても良いし、文書中に含まれるキーワードの個数に応じて順序表示するようにしても良い。
【0071】
上記フォルダツリー表示で検索、または全文検索機能による検索で検索結果としての文書画像が得られた場合、検索用パーソナルコンピュータ2は、図9に示すように、検索結果の文書画像の一覧を表示する。
【0072】
これにより、文書画像が登録されるフォルダのフォルダ名あるいは管理構造から所望の文書画像を検索することができるとともに、文書画像に含まれるキーワードを用いて所望の文書画像を検索することができる。
【0073】
図11は、この第2の実施の形態における処理を説明するためのフローチャートである。
【0074】
まず、利用者は、利用する指示ボタンが属するパネル名(表示画面名)を指定する。すると、表示部14のタッチパネル14aにより指定されたパネル名に属する指示ボタンが表示される。この画面から利用者が指示ボタンを選択する(ステップ11)。すると、制御部11は、選択された指示ボタンに対応するボタンの属性を管理部15の管理テーブル15aから読み出す(ステップ12)。
【0075】
制御部11は、管理テーブル15aより読み出した内容に基いて画像を入力するための環境を設定する(ステップ13)。また、制御部11は、管理テーブル15aから読み出した設定内容に基いて、OCR処理の環境(モード)とOCR処理のための辞書を設定する(ステップ14)。
【0076】
そして、利用者が読取スタートを指示する指示ボタンを押下すると、制御部11は、画像入力部12により画像の入力を開始する(ステップ15)。
【0077】
制御部11は、画像が入力されると、設定されたOCR処理の環境で入力した画像に対し、上記ステップ14で設定した辞書を用いてOCR処理を実行する(ステップ16)。
【0078】
このような読取った画像に対するOCR処理が完了すると、制御部11は、指示ボタンに対応して管理テーブル15aで指定されている画像データベース32内のフォルダに文書画像を登録する(ステップ17)。そして、制御部11は、OCR処理結果としてのテキストデータ(テキスト文書)を上記画像格納場所(フォルダ)情報と共に全文検索データベース31に登録する(ステップ18)。
【0079】
以上のOCR処理結果と画像の登録とが完了すると、制御部11は、処理結果を後述する動作ログテーブル15bに書き込み(ステップ19)、指示ボタンに対する処理を終了する。
【0080】
上記のように、スキャン文書に対するOCR処理条件と登録先フォルダとを共に指示ボタンに対応づけて設定し、OCR処理を実行する際に、処理対象とする書類の種類に応じた設定のOCR処理条件に基づいてOCR処理を実行するように指示ボタンを使い分けるようにしたものである。
【0081】
これにより、処理する書類の種類に応じて、種々のOCR処理の条件を指示ボタンに対応づけて設定でき、これらの指示ボタンを使い分けることによりOCR処理精度の向上が図れる。
【0082】
また、OCR処理に用いる日本語や英語などの言語、標準ピッチや固定ピッチなどの文字ピッチ、あるいは住所、医療や技術などの登録する文書の用途などの分野別にOCR処理条件を設定するようにしたものである。
【0083】
これにより、1つの指示ボタンに指示で文書画像の登録処理と、文書画像に対するOCR処理結果とを登録することができ、かつ、登録する文書の種類に応じた精度の高いOCR処理を実現できる。
【0084】
また、OCR処理条件のうちOCR処理に用いる辞書を登録する文書の種類に合わせて設定するようにしたものである。
【0085】
これにより、登録する文書の種類に応じた文字の認識精度が高いOCR処理を実現できる。
【0086】
次に、第3の実施の形態について説明する。
この第3の実施の形態では、図2に示すようなネットワークスキャナとして用いられるデジタル複写機1のような画像印刷と画像入力との2つの機能を併せ持つ装置を想定している。この場合、OCR処理を施すページを利用者がLANを介してデジタル複写機1に送信し、そのページをデジタル複写機1で読取った画像にスキャン文書として添付するところに特徴がある。
【0087】
デジタル複写機1では、プライベート印刷という機能を有している。このプライベート印刷は、外部機器からデジタル複写機に送信した画像を利用者がデジタル複写機で印刷指示を行った際に、印刷する機能である。
【0088】
すなわち、利用者がパーソナルコンピュータなどの外部機器からデジタル複写機にプライベート印刷の指示とともに、画像データを文字コードで送信する。すると、デジタル複写機は、外部機器から送信された文字コードを画像データに変換して一旦蓄積しておく。この後、利用者がデジタル複写機の操作パネルで送信した画像データの印刷を指示すると、蓄積した画像データの印刷を実行するものである。
【0089】
この第3の実施の形態では、上記プライベート印刷機能を利用して、ネットワークスキャナ1としてのデジタル複写機1で読取り処理する画像に、外部機器から送信した画像を添付して文書画像とする。そして、この文書画像の登録処理とOCR処理を介した処理結果としえのテキストデータを登録処理とを実行する。
【0090】
図12は、第3の実施の形態における処理の流れを示すフローチャートである。以下の動作では、文書画像の表紙となるページをプライベート印刷機能でデジタル複写機1に送信し、2ページ目以降の文書画像をデジタル複写機1で読取る場合の例について説明する。
【0091】
まず、利用者は、OCR処理して文書画像を登録するための指示ボタン(パネルボタン)を作成する(ステップ21)。一方、利用者は、LAN4に接続されている外部機器としての自分用のパーソナルコンピュータ(検索用パーソナルコンピュータ)2などで文書画像の表紙となるページを作成する。このページは、例えば、利用者が入力した文章などであり、このページを外部に送信する場合、このページのデータが文字コードで送信される。
【0092】
このような表紙となるページを作成すると、利用者は、そのページを指定して検索用パーソナルコンピュータ2からプライベート印刷の指示を出す(ステップ22)。すると、検索用パーソナルコンピュータ2は、プライベート印刷の指示とともに、プライベート印刷の対象となるページを文字コードでデジタル複写機1へ送信する。
【0093】
デジタル複写機1がプライベート印刷の対象するページを受信すると、制御部11は、受信したページの文字コードを画像データとしてイメージ変換し、図示しないメモリに蓄積する(ステップ23)。
【0094】
その後、利用者は、デジタル複写機1の前にきて、2ページ目以降のスキャン登録したい文書画像を画像入力部12にセットする(ステップ24)。そして、利用者は文書画像をスキャンする前に、上記ステップ21で作成した指示ボタンを選択する(ステップ25)。
【0095】
すると、制御部11は、表示部14に「プライベート印刷からの自動添付」という案内と指示ボタンを表示する。この表示により利用者が、「プライベート印刷からの自動添付」を選択すると(ステップ26)、制御部11は、プライベート印刷可能な画像の一覧を表示させる。利用者は、一覧表示された画像の一覧から表紙としたいページをタッチパネル14aにより選択する(ステップ27)。さらに、利用者が読取スタートボタンを押すと(ステップ28)、制御部11は、セットされた文書画像の読み取り処理を実行する。
【0096】
この読取処理によりセットされた文書画像を読取ると、上記ステップ27でプライベート印刷可能な文書画像から選択されたページをその文書画像の先頭ページとして電子的に追加する(ステップ29)。この文書画像に対して、制御部11は、予め指示ボタンに対する設定で指定されたOCR処理のページ範囲についてOCR処理を実行する(ステップ30)。
【0097】
この文書画像に対するOCR処理が完了すると、制御部11は、指示ボタンに対応して指定されている画像データベース32内のフォルダに文書画像を登録する(ステップ32)。そして、制御部11は、OCR処理結果としてのテキスト文書を上記画像格納場所(フォルダ)情報と共に全文検索データベース31に登録する(ステップ33)。文書画像の登録とOCR処理結果とが完了すると、制御部11は、処理結果を動作ログを管理部15に書き込み(ステップ34)、指示ボタンに対する処理を終了する。
【0098】
また、上記第3の実施の形態では、プライベート印刷として外部装置から送信された表紙となるページデータの文字コードをイメージ化し、画像データとして他の文書ページの先頭に添付してOCR処理をしているが、そもそも、外部装置から送信された文字コードをイメージ化せずに、印刷のために送られてきた文字コードのページデータをそのまま全文検索データベース31に登録するようにしても良い。
【0099】
この場合、プライベート印刷として外部装置から送信された文字コードのページデータは、文書画像として画像データベース32に登録する際に、イメージ化して画像データとして登録する。
【0100】
上記のように、表紙頁のみを外部機器からプライベート印刷モードで印刷指示し、印刷指示された画像を印刷せずに電子的に表紙として登録する文書画像に添付して、それ以降となるページをスキャンする。これにより得られる文書画像全体に対して、指示ボタンに対応して設定されたページ範囲をOCR処理し、上記文書画像をフォルダに登録するとともに、OCR処理の結果としてのテキストデータを全文検索データベースに登録するようにしたものである。
【0101】
これにより、別の外部機器などで作成したページを、スキャナで実際に読取る文書画像に添付して文書画像として登録することができ、添付したいページを紙などに一旦印刷して改めて文書として読取処理する手間を省くことができ、紙を無駄にすることがない。
【0102】
次に、第4の実施の形態について説明する。
この第4の実施の形態では、文書をスキャンするために利用した指示ボタンに関する情報をテキストデータとしてOCR処理結果に添付して登録するところにある。
【0103】
図13は、第4の実施の形態における処理の流れを示すフローチャートである。
【0104】
まず、利用者は、利用する指示ボタンが属するパネル名を指定する。すると、表示部14のタッチパネル14aにより指定されたパネル名に属する指示ボタンが表示される。この画面から利用者が指示ボタンを選択する(ステップ41)。すると、制御部11は、選択された指示ボタンに対応するボタンの属性を管理部15の管理テーブル15aから読み出す(ステップ42)。
【0105】
制御部11は、管理テーブル15aより読み出した内容に基いて画像を入力するための環境を設定する(ステップ43)。そして、利用者が読取スタートを指示する指示ボタンを押下すると、制御部11は、画像入力部12により画像の入力を開始する(ステップ44)。
【0106】
また、制御部11は、管理テーブル15aから読み出したボタンに対するOCR処理における設定内容に基づいてOCR処理の環境(モード)を設定する(ステップ45)。制御部11は、画像が入力されると、設定されたOCR処理の環境で入力した画像に対するOCR処理を実行する(ステップ46)。
【0107】
入力した画像に対するOCR処理が完了すると、制御部11は、指示ボタンに対応して指定されている画像データベース32内のフォルダに文書画像を登録する(ステップ47)。
【0108】
制御部11は、指示された指示ボタンに関するボタン名、ボタン属性値などを管理部15の管理テーブル15aから読み出す(ステップ48)。制御部11は、この読み出したボタン属性をOCR処理結果テキストに追加する(ステップ49)。
【0109】
そして、制御部11は、OCR処理結果としてのテキスト文書を上記画像格納場所(フォルダ)情報と共に全文検索データベース31に登録する(ステップ50)。OCR処理結果と画像の登録とが完了すると、制御部11は、処理結果を動作ログとして管理部15に書き込み(ステップ51)、指示ボタンに対する処理を終了する。
【0110】
上記のように、ネットワークスキャナ1の表示部14で表示する指示ボタンのボタン名、指示ボタンを表示する表示画面名、あるいは利用者名などの指示ボタンに対応する設定内容を画像の文字認識結果としてのテキストと共に全文検索データベースに登録するようにしたものである。
【0111】
これにより、文書画像に対してOCR処理したテキストデータだけでなく、この文書画像の登録時に係わる種々のデータや設定値などを全文検索データベースに登録することができ、文書画像を検索する際の手がかりとなる情報を増やすことができ、全文検索における効率を向上することができる。
【0112】
次に、第5の実施の形態について説明する。
【0113】
この第5の実施の形態の特徴は、OCR処理に関する最終処理結果ではなく、OCR処理における複数の認識候補すべてを全文検索データベース31に登録するところにある。これにより、全文検索する際の検索操作効率が上がる。
【0114】
図14は、第5の実施の形態における処理の流れを説明するためのフローチャートを示す。
【0115】
まず、利用者は、利用する指示ボタンが属するパネル名を指定する。すると、表示部14のタッチパネル14aにより指定されたパネル名に属する指示ボタンが表示される。この画面から利用者が指示ボタンを選択する(ステップ61)。すると、制御部11は、選択された指示ボタンに対応するボタンの属性を管理部15の管理テーブル15aから読み出す(ステップ62)。
【0116】
制御部11は、管理テーブル15aより読み出した内容に基いて画像を入力するための環境を設定する(ステップ63)。そして、利用者が読取スタートを指示する指示ボタンを押下すると、制御部11は、画像入力部12により画像の入力を開始する(ステップ64)。
【0117】
また、制御部11は、管理部15の管理テーブル15aから読み出したボタンに対するOCR処理における設定内容に基づいてOCR処理の環境(モード)を設定する(ステップ65)。制御部11は、画像が入力されると、設定されたOCR処理の環境で入力した画像に対するOCR処理を実行する(ステップ66)。
【0118】
入力した画像に対するOCR処理が完了すると、制御部11は、指示ボタンに対応して指定されている画像データベース32内のフォルダに文書画像を登録する(ステップ67)。
【0119】
制御部11は、上記ステップ66で、OCR処理された結果に対して、さらに文章解析処理を実行する(ステップ68)。制御部11は、この文章解析処理の結果として複数の認識候補も含めてOCR処理結果のテキスト文書に追加する(ステップ69)。
【0120】
制御部11は、文章解析処理による認識候補も含めたOCR処理結果としてのテキスト文書を上記画像格納場所(フォルダ)情報と共に全文検索データベース31に登録する(ステップ70)。OCR処理結果と画像の登録とが完了すると、制御部11は、処理結果を動作ログとして管理部15に書き込み(ステップ71)、指示ボタンに対する処理を終了する。
【0121】
上記のように、OCR処理結果に文章解析処理を施した後、変更候補(複数の認識候補)を含む文字列を画像の認識結果としてのテキスト文書に追加して全文検索データベースに登録するようにしたものである。
【0122】
これにより、あいまい登録の全文検索データベースへの応用による全文検索の効率を向上、つまり、複数の認識候補に対して全文検索を実行でき、検索効率を向上できる。
【0123】
次に、第6の実施の形態について説明する。
【0124】
この第6の実施の形態の特徴は、複数の文書を一括して読取る場合に、文書の区切りページとなるページセパレータ(セパレータ)を自動認識するために使用される領域または文字を削除するところにある。本来、書類の区切りの認識を目的としたページセパレータの画像データは、書類の全文検索処理には不要である。これらの画像データを削除することにより、書類の全文検索データベースへの登録を目的とした文字認識処理の処理効率が向上する。
【0125】
上記ページセパレータは、特定の領域に記号や文字などが記載されている場合や、特定の文字列が記載されている場合に認識される。このようなページセパレータの認識処理をOMR処理とする。
【0126】
例えば、特定の領域に記号が記載されたページセパレータを認識する場合、読取った画像において予めページセパレータを示すものとして設定されている特定の領域に記号が存在していた際に、ページセパレータを認識する。また、特定の文字例が記載されたページセパレータを認識する場合、読取った画像に対するOCR処理の結果、予めページセパレータを示す文字列として設定されている文字列が認識された際に、ページセパレータを認識する。
【0127】
図15は、第6の実施の形態における処理の流れを示すフローチャートである。
【0128】
まず、利用者は、利用する指示ボタンが属するパネル名を指定する。すると、表示部14のタッチパネル14aにより指定されたパネル名に属する指示ボタンが表示される。この画面から利用者が指示ボタンを選択する(ステップ81)。すると、制御部11は、選択された指示ボタンに対応するボタンの属性を管理部15の管理テーブル15aから読み出す(ステップ82)。
【0129】
制御部11は、管理テーブル15aより読み出した内容に基いて画像を入力するための環境を設定する(ステップ83)。そして、利用者が読取スタートを指示する指示ボタンを押下すると、制御部11は、画像入力部12により画像の入力を開始する(ステップ84)。
【0130】
また、制御部11は、ページセパレータを認識するための処理(OMR処理)の環境(モード)を設定する(ステップ85)。
【0131】
ここで、ページセパレータが特定の領域に付与される図形や記号などで示される場合、OMR処理によるページセパレータ処理に関して、セパレータとして認識したページのなかで認識要因となった領域をページの背景色で塗りつぶす(領域を削除する)(ステップ86)。
【0132】
制御部11は、管理部15の管理テーブル15aから読み出したボタンに対するOCR処理における設定内容に基づいてOCR処理の環境(モード)を設定する(ステップ87)。制御部11は、設定されたOCR処理の環境で入力した画像に対するOCR処理を実行する(ステップ88)。
【0133】
入力した画像に対するOCR処理が完了すると、制御部11は、指示ボタンに対応して指定されている画像データベース32内のフォルダに、上記OMR処理で分割された書類ごとに文書画像を登録する(ステップ89)。
【0134】
ここで、ページセパレータが特定のキー文字列で示される場合、OMR処理によるページセパレータ処理に関して、セパレータとして認識したページのなかにある認識要因となったキー文字列を削除する(ステップ90)。
【0135】
制御部11は、OCR処理結果としてのテキスト文書を上記画像格納場所(フォルダ)情報と共に全文検索データベース31に登録する(ステップ91)。OCR処理結果と画像の登録とが完了すると、制御部11は、処理結果を動作ログとして管理部15に書き込み(ステップ92)、指示ボタンに対する処理を終了する。
【0136】
上記のように、1度のスキャンからOCR処理を以下の2つのステップに分けて一括実行することを指示する指示ボタンを設定する。
【0137】
ステップ1:スキャン画像から書類の範囲(ページ範囲)を特定して自動分割するためのOCR処理(セパレータ検出と文書ページ分割)
ステップ2:特定し分割した各書類に対して、認識処理のための情報を削除した上で、検索キー(全文検索用を含む)を抽出して登録するためのOCR処理を実行
そして、上記ステップ1の結果、各書類の先頭ページを認識するための内部処理に使用したキー文字列、つまりセパレータページを示す情報をステップ2で1ページ目のOCR処理結果から削除した上で、全文検索データベースにOCR処理結果を登録する。
【0138】
これにより、本来、文書(書類)の内容とは関係ない情報を削除することにより、それらの情報をデータベースに登録しないことになり、全文検索処理における検索効率が向上する
次に、第7の実施の形態について説明する。
【0139】
この第7の実施の形態の特徴は、スキャンした画像に関する確認印刷機能をOCR処理結果の確認のために応用したものであり、スキャンした各文書画像に加えて、OCR処理結果をページに印刷する。
【0140】
図16は、処理結果を確認印刷した結果の例を示すものである。
【0141】
図16に示すように、処理結果の確認印刷結果は、ページの左側にスキャンした文書画像が印刷され、右側にそのページの文字認識結果として得られたテキストが印刷される。これにより、スキャンしたその場で画像を表示する機能を持たないネットワークスキャナやデジタル複写機では、読み込んだ画像とそれに対するOCR処理結果を印刷して確認できるので、画像の再入力の必要性等がその場で判断でき、大変効果的である。
【0142】
図17は、第7の実施の形態における処理の流れを示すフローチャートである。
【0143】
まず、利用者は、利用する指示ボタンが属するパネル名を指定する。すると、表示部14のタッチパネル14aにより指定されたパネル名に属する指示ボタンが表示される。この画面から利用者が確認印刷が指定されている指示ボタンを選択する(ステップ101)。すると、制御部11は、選択された指示ボタンに対応するボタンの属性を管理部15の管理テーブル15aから読み出す(ステップ102)。
【0144】
制御部11は、管理テーブル15aより読み出した内容に基いて画像を入力するための環境を設定する(ステップ103)。そして、利用者が読取スタートを指示する指示ボタンを押下すると、制御部11は、画像入力部12により画像の入力を開始する(ステップ104)。
【0145】
また、制御部11は、管理部15の管理テーブル15aから読み出したボタンに対するOCR処理における設定内容に基づいてOCR処理の環境(モード)を設定する(ステップ105)。制御部11は、画像が入力されると、設定されたOCR処理の環境で入力した画像に対するOCR処理を実行する(ステップ106)。
【0146】
入力した画像に対するOCR処理が完了すると、制御部11は、確認印刷する画像とOCR処理結果テキストを印刷する(ステップ107)。
【0147】
制御部11は、指示ボタンに対応して指定されている画像データベース32内のフォルダに文書画像を登録する(ステップ108)。これとともに、制御部11は、OCR処理結果としてのテキスト文書を上記画像格納場所(フォルダ)情報と共に全文検索データベース31に登録する(ステップ109)。
【0148】
OCR処理結果と画像の登録とが完了すると、制御部11は、処理結果を後述する動作ログテーブルに書き込み(ステップ110)、指示ボタンに対する処理を終了する。
【0149】
上記のように、スキャン画像の確認印刷機能を有し、この確認印刷を実行する際に、各文書画像と共にOCR認識結果であるテキストも印刷するようにしたものである。
【0150】
これにより、スキャンしたその場で画像を表示する機能を持たないネットワークスキャナやデジタル複写機では読み込んだ画像とそれに対するOCR結果を印刷して確認できるので、画像の再入力の必要性等がその場で判断できる。
【0151】
次に、第8の実施の形態について説明する。
【0152】
この第8の実施の形態では、図18に示すように、ネットワークスキャナ1が1文書あたりのスキャンデータ量に関する最大制限値を管理する許容最大値部116と、スキャンした文書画像が所定の許容制限値を越えたかを判別する機能を有するサイズ判断部117とがネットワークスキャナ1に備わっていることを想定している。
【0153】
この第8の実施の形態で想定するネットワークスキャナ1としてのデジタル複写機では、利用者が文書(書類)を気軽にスキャンし、電子化した上でデータをネットワーク上の他の機器に転送するが、利用の仕方によっては大量の画像データをスキャンして大量のデータをネットワークに通信することによりネットワーク全体に悪影響を及ぼすことが考えられる。このような事態を未然に防ぐために、スキャンする1書類あたりのデータ量の最大値を予めネットワークスキャナに設定しておく機能が大変有効である。
【0154】
しかしながら、データ量が最大値を越えた場合には再度スキャンする等の操作が必要であり、さらに効率的な操作環境を提供していることが求められている。この第8の発明の実施の形態では、スキャンした画像の1文書あたりのデータ量が最大値を越えた場合に、それらの画像のOCR処理結果であるテキストデータのみを登録し、同時にデータ量が最大値を越えたので画像自身は登録しなかった旨のメッセージを管理部15に動作ログとして格納するところを特徴としている。
【0155】
図18に示すように、このネットワークシステムでは、ネットワークスキャナ1がスキャンする1書類あたりのデータ量の最大値を許容最大値部116で管理し、スキャンした時のデータサイズが上記許容最大値部116で管理するデータ量の最大値を越えたかをサイズ判断部117が判断するようになっている。
【0156】
また、ネットワークスキャナ1では、1つの指示に対する処理が終了するごとにその処理結果を示す動作ログを上記管理部15に記憶している。この動作ログは、図20に示すように、処理日時、イベントレベル、および動作内容の項目からなっている。
【0157】
上記処理日時には、処理を実行した日時が記憶される。上記イベントレベルには、処理が正常に終了した場合、正常終了と記憶され、処理がエラーであった場合には、エラーの度合いに応じて警告などのエラーのレベルを示す内容が記憶される。
【0158】
上記動作内容には、実行した処理の内容が記憶される。処理が正常終了の場合には、例えば「営業日報(山田)に文書を登録しました。」などの処理内容が記憶される。また、処理がエラーであった場合には、例えば「入力画像サイズが許容サイズ(2MB)を越えたため、OCR処理結果のみを営業日報(山田)に登録しました。」などのエラー内容とエラーに伴って実行した処理内容が記憶される。
【0159】
従って、1文書画像のデータサイズが上記許容最大値部116で管理するデータ量の最大値を越えた場合、制御部11は、図20に示すように、管理部15に動作ログとしてエラー内容を記憶する。このような動作ログにより、処理内容を後で確認できるようになっている。
【0160】
図15は、第8の実施の形態における処理の流れを示すフローチャートである。
【0161】
まず、利用者は、利用する指示ボタンが属するパネル名を指定する。すると、表示部14のタッチパネル14aにより指定されたパネル名に属する指示ボタンが表示される。この画面から利用者が指示ボタンを選択する(ステップ121)。すると、制御部11は、選択された指示ボタンに対応するボタンの属性を管理部15の管理テーブル15aから読み出す(ステップ122)。
【0162】
制御部11は、管理テーブル15aより読み出した内容に基いて画像を入力するための環境を設定する(ステップ123)。そして、利用者が読取スタートを指示する指示ボタンを押下すると、制御部11は、画像入力部12により画像の入力を開始する(ステップ124)。
【0163】
また、制御部11は、管理部15の管理テーブル15aから読み出したボタンに対するOCR処理における設定内容に基づいてOCR処理の環境(モード)を設定する(ステップ125)。制御部11は、画像が入力されると、設定されたOCR処理の環境で入力した画像に対するOCR処理を実行する(ステップ126)。
【0164】
制御部11は、サイズ判定部 により入力した画像の1書類あたりのデータサイズが許容最大値を越えているか否かを判断する(ステップ127)。この判断によりデータサイズが許容最大値を越えている場合、制御部11は、指示ボタンで指定されたフォルダに、画像入力サイズが制限を越えたといる説明文と、OCR処理結果を登録する(ステップ128)。また、データサイズが越えていないと判断した場合、制御部11は、指示ボタンに対応して指定されている画像データベース32内のフォルダに文書画像を登録する(ステップ129)。
【0165】
そして、制御部11は、OCR処理結果としてのテキスト文書を上記画像格納場所(フォルダ)情報と共に全文検索データベース31に登録する(ステップ130)。OCR処理結果と画像の登録とが完了すると、制御部11は、処理結果を図8に示すように、動作ログとして管理部15に書き込み(ステップ131)、指示ボタンに対する処理を終了する。
【0166】
上記のように、スキャンした画像のデータサイズが所定の許容制限値を越えた場合、画像は登録せずに認識結果のテキストのみを登録する。また、その措置を動作ログに記録するようにしたものである。
【0167】
これにより、データサイズが大きすぎて画像を登録できない場合にも、再入力しなくても必要最小限のテキスト情報のみを登録できる。
【0168】
上記のように、この発明によれば、デジタル複写機のスキャナ機能をを含むネットワーク型スキャナを利用して、それをOCR処理と組み合わせて文書管理サーバに登録して文書画像を管理するシステムにおいて、利用者による操作環境の向上とOCR処理の性能を向上させることができる。
【0169】
また、この発明では、スキャン入力した文書画像に対してOCR処理を施し、画像をフォルダ構造で画像を管理する画像管理データベースで利用者に指定された任意のフォルダ内に登録すると同時に、そのOCR処理結果を全文検索用データベースに登録し、検索時には画像管理データベースと全文検索データベースいずれからも画像を検索でき、表示することができる。
【0170】
また、この発明では、スキャン入力する文書画像に対するOCR処理効果(処理速度や例えば処理時に利用する専門用語辞書の自動選択による文字認識率、)を向上させる目的で、例えば言語の種類や文字ピッチの種別、さらにはその文書が関連する分野別(住所、医療など)または用途別にユーザが入力する前に予めボタンを作成し、それをパネルに表示して、入力時に選択することができる。
【0171】
また、この発明では、OCR処理に関連する設定と文書画像の登録先場所(サーバ、フォルダ名など)を一括して1つのパネルボタンに設定でき、ユーザはスキャナ装置を利用する時にパネル上のボタンを選択するだけで、スキャンする画像に対する処理を一意に決定することができる。
【0172】
また、図1、図2および図18で示したシステム構成では、ネットワークスキャナ1と文書管理サーバ2はお互いネットワークを隔てたところに配置されているが、例えば文書管理サーバ2で示された機能がネットワークスキャナ1に内蔵されているようにしても良い。
【0173】
【発明の効果】
以上詳述したように、この発明によれば、利用者にとって使いやすくかつ最大限の文字認識精度を達成させて、文書画像の登録後に文書画像を効率よく検索可能な情報入力装置を提供できる。
【図面の簡単な説明】
【図1】この発明の第1〜第7の実施の形態に係わるネットワークシステムの概略構成を示すブロック図。
【図2】この発明の第1〜第7の実施の形態に係わるネットワークシステムの概略構成を示すブロック図。
【図3】指示ボタンの表示例を示す図。
【図4】指示ボタンの表示例を示す図。
【図5】指示ボタンの作成例を示す図。
【図6】第1の実施の形態における処理の流れを示すフローチャートである。
【図7】指示ボタンの表示例を示す図。
【図8】管理テーブルの内容を説明するための図。
【図9】用途別の指示ボタンの作成例を示す図。
【図10】文書画像の検索画面の例を示す図。
【図11】第2の実施の形態における処理の流れを示すフローチャート。
【図12】第3の実施の形態における処理の流れを示すフローチャート。
【図13】第4の実施の形態における処理の流れを示すフローチャート。
【図14】第5の実施の形態における処理の流れを示すフローチャート。
【図15】第6の実施の形態における処理の流れを示すフローチャート。
【図16】処理結果の確認印刷の例を示す図。
【図17】第7の実施の形態における処理の流れを示すフローチャート。
【図18】この発明の第1〜第7の実施の形態に係わるネットワークシステムの概略構成を示すブロック図。
【図19】第8の実施の形態における処理の流れを示すフローチャート。
【図20】動作ログの記憶例を示す図。
【符号の説明】
1…ネットワークスキャナ(デジタル複写機)
2…検索用パーソナルコンピュータ
2a…表示部
3…文書管理サーバ
4…LAN
11…制御部
12…画像入力部
13…OCR処理部
14…表示部
14a…タッチパネル
15…管理部
15a…管理テーブル
16…プリンタ部
31…全文検索データベース
32…画像データベース
116…許容最大値部
117…サイズ判断部

Claims (10)

  1. 画像を読取る読取手段と、
    この読取手段により読取った画像を文字認識処理する文字認識手段と、
    この文字認識手段による文字認識の処理結果を記憶するデータベースと、
    種々の指示ボタンを表示する表示手段と、
    この表示手段により表示される指示ボタンに対応させて、文書画像の登録先と、上記文書画像に対する文字認識処理の設定とを管理する管理手段と、
    この管理手段により管理される上記指示ボタンが指示された際に、上記管理手段により指示ボタンに対応する設定内容に基いて、上記読取手段により文書画像を読取り、この読取った文書画像に対して上記文字認識手段により文字認識処理を実行し、上記文書画像の登録処理と上記文書画像に対する文字認識の処理結果を前記データベースに登録する処理とを一括して実行する実行手段と、
    を具備したことを特徴とする情報入力装置。
  2. 上記管理手段は、上記指示ボタンに対応して上記読取手段により読取る画像に対する文字認識処理の範囲の設定を管理することを特徴とする、上記請求項1に記載の情報入力装置。
  3. 上記管理手段は、上記指示ボタンに対応して上記読取手段で読取る画像の種類に応じた文字の言語を前記文字認識処理の設定として管理することを特徴とする上記請求項1に記載の情報入力装置。
  4. 上記管理手段は、上記指示ボタンに対応して上記読取手段で読取る画像の種類に応じた文字認識処理に使用する辞書を前記文字認識処理の設定として管理することを特徴とする上記請求項に記載の情報入力装置。
  5. 外部装置から送信された画像を蓄積する蓄積手段と、
    画像を読取る読取手段と、
    この読取手段により読取った画像あるいは上記蓄積手段により蓄積されている画像を文字認識処理する文字認識手段と、
    この文字認識手段による文字認識の処理結果を記憶するデータベースと、
    種々の指示ボタンを表示する表示手段と、
    この表示手段により表示される指示ボタンに対応させた文書画像の登録先と、上記文書画像に対する文字認識処理の設定とを管理する管理手段と、
    この管理手段により管理される上記指示ボタンが指示された際に、上記管理手段により指示ボタンに対応する設定内容に基いて、上記読取手段により画像を読取り、この読取った画像に上記蓄積手段により蓄積されている画像を添付した文書画像に対して上記文字認識手段により文字認識処理を実行し、上記文書画像の登録処理と上記文書画像に対する文字認識の処理結果を前記データベースに登録する処理とを一括して実行する実行手段と、
    を具備したことを特徴とする情報入力装置。
  6. 画像を読取る読取手段と、
    この読取手段により読取った画像を文字認識処理する文字認識手段と、
    この文字認識手段による文字認識の処理結果を記憶するデータベースと、
    種々の指示ボタンを表示する表示手段と、
    この表示手段により表示される指示ボタンに対応させて、文書画像の登録先と、上記文書画像に対する文字認識処理の設定とを管理する管理手段と、
    この管理手段により管理される上記指示ボタンが指示された際に、上記管理手段による指示ボタンに対応する設定内容に基いて、上記読取手段により文書画像を読取り、この読取った文書画像に対して上記文字認識手段により文字認識処理を実行し、上記読取画像の登録処理と上記指示ボタンに対応する設定内容を示す情報を追加した上記文書画像に対する文字認識の処理結果を前記データベースに登録する処理とを一括して実行する実行手段と、
    を具備したことを特徴とする情報入力装置。
  7. 画像を読取る読取手段と、
    この読取手段により読取った画像を文字認識処理する文字認識手段と、
    この文字認識手段による文字認識の処理結果を記憶するデータベースと、
    種々の指示ボタンを表示する表示手段と、
    この表示手段により表示される指示ボタンに対応させて、文書画像の登録先と、上記文書画像に対する文字認識処理の設定とを管理する管理手段と、
    この管理手段により管理される上記指示ボタンが指示された際に、上記管理手段により指示ボタンに対応する設定内容に基いて、上記読取手段により文書画像を読取り、この読取った文書画像に対して上記文字認識手段により文字認識処理を実行して、さらに、文字認識処理結果に文章解析処理を施し、上記文書画像の登録処理と、上記文章解析処理により得られた複数の認識候補を文字認識の処理結果として前記データベースに登録する処理とを一括して実行する実行手段と、
    を具備したことを特徴とする情報入力装置。
  8. 画像を読取る読取手段と、
    この読取手段により読取った画像を文字認識処理する文字認識手段と、
    この文字認識手段による文字認識の処理結果を記憶するデータベースと、
    種々の指示ボタンを表示する表示手段と、
    この表示手段により表示される指示ボタンに対応させて、文書画像の登録先と、上記文書画像に対する文字認識処理の設定とを管理する管理手段と、
    この管理手段により管理される上記指示ボタンが指示された際に、上記管理手段により指示ボタンに対応する設定内容に基いて、上記読取手段により画像を読取り、この読取った画像から文書画像ごとに分割するセパレータであることを示す情報を検出してセパレータを認識する検出手段と、
    この検出手段により検出したセパレータを示す情報を削除し、このセパレータごとに分割されるそれぞれの文書画像に対して上記文字認識手段により文字認識処理を実行し、上記文書画像の登録処理と上記文書画像に対する文字認識の処理結果を前記データベースに登録する処理とを一括して実行する実行手段と、
    を具備したことを特徴とする情報入力装置。
  9. 画像を読取る読取手段と、
    この読取手段により読取った画像を文字認識処理する文字認識手段と、
    この文字認識手段による文字認識の処理結果を記憶するデータベースと、
    種々の指示ボタンを表示する表示手段と、
    この表示手段により表示される指示ボタンに対応させて、文書画像の登録先と、上記文書画像に対する文字認識処理の設定とを管理する管理手段と、
    この管理手段により管理される上記指示ボタンが指示された際に、上記管理手段により指示ボタンに対応する設定内容に基いて、上記読取手段により文書画像を読取り、この読取った文書画像に対して上記文字認識手段により文字認識処理を実行し、上記文書画像の登録処理と上記文書画像に対する文字認識の処理結果を前記データベースに登録する処理とを一括して実行する実行手段と、
    この実行手段により登録される文書画像と共に文字認識の処理結果を示すデータを印刷する印刷手段と、
    を具備したことを特徴とする情報入力装置。
  10. 画像を読取る読取手段と、
    この読取手段により読取った画像を文字認識処理する文字認識手段と、
    この文字認識手段による文字認識の処理結果を記憶するデータベースと、
    種々の指示ボタンを表示する表示手段と、
    この表示手段により表示される指示ボタンに対応させて、文書画像の登録先と、上記文書画像に対する文字認識処理の設定とを管理する管理手段と、
    この管理手段により管理される上記指示ボタンが指示された際に、上記管理手段により指示ボタンに対応する設定内容に基いて、上記読取手段により文書画像を読取り、この読取った文書画像に対して上記文字認識手段により文字認識処理を行う処理手段と、
    上記読取手段により読取った文書画像のデータサイズが所定の許容制限値を越えたか否かを判断する判断手段と、
    この判断手段により読取った画像のデータサイズが所定の許容制限値を越えていると判断した場合、上記指示ボタンに対応する文書画像の登録先に、上記読取手段により読取った画像を登録せずに、上記処理手段による文字認識処理の結果のみを登録する第1の実行手段と、
    この判断手段により読取った画像のデータサイズが所定の許容制限値を越えていないと判断した場合、上記管理手段により指示ボタンに対応する設定内容に基いて、上記文書画像の登録処理と上記文書画像に対する文字認識の処理結果を前記データベースに登録する処理とを一括して実行する第2の実行手段と、
    を具備したことを特徴とする情報入力装置。
JP30140099A 1999-10-22 1999-10-22 情報入力装置 Expired - Fee Related JP4377494B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP30140099A JP4377494B2 (ja) 1999-10-22 1999-10-22 情報入力装置
US09/664,071 US6917438B1 (en) 1999-10-22 2000-09-18 Information input device
US10/934,435 US7081975B2 (en) 1999-10-22 2004-09-07 Information input device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP30140099A JP4377494B2 (ja) 1999-10-22 1999-10-22 情報入力装置

Publications (2)

Publication Number Publication Date
JP2001126026A JP2001126026A (ja) 2001-05-11
JP4377494B2 true JP4377494B2 (ja) 2009-12-02

Family

ID=17896423

Family Applications (1)

Application Number Title Priority Date Filing Date
JP30140099A Expired - Fee Related JP4377494B2 (ja) 1999-10-22 1999-10-22 情報入力装置

Country Status (2)

Country Link
US (2) US6917438B1 (ja)
JP (1) JP4377494B2 (ja)

Families Citing this family (72)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8539334B2 (en) 2000-12-27 2013-09-17 Tractmanager, Inc. Document management system having automatic notifications
US10114821B2 (en) * 2000-12-27 2018-10-30 Tractmanager, Inc. Method and system to access to electronic business documents
US6957384B2 (en) 2000-12-27 2005-10-18 Tractmanager, Llc Document management system
JP4006239B2 (ja) * 2002-02-21 2007-11-14 株式会社日立製作所 文書の検索方法および検索システム
JP4227500B2 (ja) * 2003-11-21 2009-02-18 キヤノン株式会社 履歴管理システム、履歴管理方法、プログラム及び記録媒体
US8693043B2 (en) * 2003-12-19 2014-04-08 Kofax, Inc. Automatic document separation
JP2005288946A (ja) * 2004-04-01 2005-10-20 Riso Kagaku Corp 印刷装置及びその制御方法
JP2006065477A (ja) * 2004-08-25 2006-03-09 Fuji Xerox Co Ltd 文字認識装置
US20060053137A1 (en) * 2004-09-09 2006-03-09 Murata Kikai Kabushikia Kaisha Two-dimensional code information handling device
JP4574313B2 (ja) * 2004-10-04 2010-11-04 キヤノン株式会社 画像処理装置および方法
JP2006115424A (ja) * 2004-10-18 2006-04-27 Sharp Corp 画像処理装置、画像処理装置の転送制御方法、画像処理装置の出力制御方法、画像処理装置の制御プログラム、画像処理装置の制御プログラムを記録した記録媒体
JP4724428B2 (ja) * 2004-10-26 2011-07-13 キヤノン株式会社 画像読み取り装置および画像処理方法
US7675641B2 (en) * 2004-10-28 2010-03-09 Lexmark International, Inc. Method and device for converting scanned text to audio data via connection lines and lookup tables
JP4681870B2 (ja) * 2004-12-17 2011-05-11 キヤノン株式会社 画像処理装置、画像処理方法、コンピュータプログラム
US7933048B2 (en) 2005-01-31 2011-04-26 Canon Kabushiki Kaisha Image reading apparatus, server apparatus, and image processing system
JP2006211527A (ja) * 2005-01-31 2006-08-10 Nec Corp 携帯電話機
US20060206805A1 (en) * 2005-03-10 2006-09-14 Kabushiki Kaisha Toshiba Document managing apparatus
JP2006260080A (ja) * 2005-03-16 2006-09-28 Toshiba Corp 光学的文字認識システムおよび光学的文字認識方法
US9769354B2 (en) 2005-03-24 2017-09-19 Kofax, Inc. Systems and methods of processing scanned data
US9137417B2 (en) 2005-03-24 2015-09-15 Kofax, Inc. Systems and methods for processing video data
JP4872285B2 (ja) * 2005-09-14 2012-02-08 富士ゼロックス株式会社 文書管理装置、文書管理システムおよび文書管理方法
US7734092B2 (en) * 2006-03-07 2010-06-08 Ancestry.Com Operations Inc. Multiple image input for optical character recognition processing systems and methods
US20070226321A1 (en) * 2006-03-23 2007-09-27 R R Donnelley & Sons Company Image based document access and related systems, methods, and devices
US8233751B2 (en) * 2006-04-10 2012-07-31 Patel Nilesh V Method and system for simplified recordkeeping including transcription and voting based verification
US8014040B2 (en) * 2006-04-21 2011-09-06 Microsoft Corporation Dynamic scanner system
US20070247655A1 (en) * 2006-04-21 2007-10-25 Microsoft Corporation Dynamic printer system
US8115948B2 (en) * 2006-04-21 2012-02-14 Microsoft Corporation Interactive paper system
JP4769655B2 (ja) * 2006-07-28 2011-09-07 キヤノン株式会社 スキャン装置及びデータ登録方法
US8498878B2 (en) * 2006-10-06 2013-07-30 EDCO Group Inc. Intelligent medical chart capture system
JP2008131189A (ja) * 2006-11-17 2008-06-05 Ricoh Co Ltd ドキュメント管理システム、ドキュメント管理方法及びドキュメント管理プログラム
JP4986583B2 (ja) * 2006-11-20 2012-07-25 株式会社沖データ 画像処理装置、及び画像処理システム
US20080151302A1 (en) * 2006-12-07 2008-06-26 Samsung Electronics Co., Ltd. Image forming apparatus and method of controlling the same
US20080174806A1 (en) * 2007-01-24 2008-07-24 Harpreet Singh System and method for accessing electronic documents via a document processing device
JP5268274B2 (ja) 2007-03-30 2013-08-21 キヤノン株式会社 検索装置、方法、プログラム
JP4943917B2 (ja) * 2007-03-30 2012-05-30 本田技研工業株式会社 溶接装置及び溶接方法
US9685094B2 (en) * 2007-09-26 2017-06-20 Verizon Patent And Licensing Inc. Text to training aid conversion system and service
WO2010065787A2 (en) * 2008-12-04 2010-06-10 Curna, Inc. Treatment of tumor suppressor gene related diseases by inhibition of natural antisense transcript to the gene
US8774516B2 (en) 2009-02-10 2014-07-08 Kofax, Inc. Systems, methods and computer program products for determining document validity
US9349046B2 (en) 2009-02-10 2016-05-24 Kofax, Inc. Smart optical input/output (I/O) extension for context-dependent workflows
US8958605B2 (en) 2009-02-10 2015-02-17 Kofax, Inc. Systems, methods and computer program products for determining document validity
US9576272B2 (en) 2009-02-10 2017-02-21 Kofax, Inc. Systems, methods and computer program products for determining document validity
US9767354B2 (en) 2009-02-10 2017-09-19 Kofax, Inc. Global geographic information retrieval, validation, and normalization
CA2752237C (en) * 2009-02-12 2020-03-24 Opko Curna, Llc Treatment of brain derived neurotrophic factor (bdnf) related diseases by inhibition of natural antisense transcript to bdnf
JP5264574B2 (ja) * 2009-03-11 2013-08-14 キヤノン株式会社 画像処理装置、システム及び画像処理方法
US20100331043A1 (en) * 2009-06-23 2010-12-30 K-Nfb Reading Technology, Inc. Document and image processing
JP5057186B2 (ja) * 2010-06-29 2012-10-24 ブラザー工業株式会社 画像読取装置、スキャナドライバ、及び画像格納方法
EP2740052A4 (en) * 2011-08-05 2015-04-08 Blackberry Ltd SYSTEM AND METHOD FOR TEXT SEARCH AND TEXT DISPLAY FOUND IN INCREASED REALITY
US9058580B1 (en) 2012-01-12 2015-06-16 Kofax, Inc. Systems and methods for identification document processing and business workflow integration
US9165188B2 (en) 2012-01-12 2015-10-20 Kofax, Inc. Systems and methods for mobile image capture and processing
US9058515B1 (en) 2012-01-12 2015-06-16 Kofax, Inc. Systems and methods for identification document processing and business workflow integration
US10146795B2 (en) 2012-01-12 2018-12-04 Kofax, Inc. Systems and methods for mobile image capture and processing
US9483794B2 (en) 2012-01-12 2016-11-01 Kofax, Inc. Systems and methods for identification document processing and business workflow integration
JP6140946B2 (ja) * 2012-07-26 2017-06-07 キヤノン株式会社 文字認識システム及び文字認識装置
JP6012503B2 (ja) * 2013-02-20 2016-10-25 三菱電機株式会社 データ処理装置およびデータ処理方法
JP2016517587A (ja) 2013-03-13 2016-06-16 コファックス, インコーポレイテッド モバイル装置を用いて取込まれたデジタル画像におけるオブジェクトの分類
US9208536B2 (en) 2013-09-27 2015-12-08 Kofax, Inc. Systems and methods for three dimensional geometric reconstruction of captured image data
US9355312B2 (en) 2013-03-13 2016-05-31 Kofax, Inc. Systems and methods for classifying objects in digital images captured using mobile devices
US20140316841A1 (en) 2013-04-23 2014-10-23 Kofax, Inc. Location-based workflows and services
WO2014179752A1 (en) 2013-05-03 2014-11-06 Kofax, Inc. Systems and methods for detecting and classifying objects in video captured using mobile devices
JP2016538783A (ja) 2013-11-15 2016-12-08 コファックス, インコーポレイテッド モバイル映像データを用いて長尺文書の合成画像を生成するためのシステムおよび方法
US9760788B2 (en) 2014-10-30 2017-09-12 Kofax, Inc. Mobile document detection and orientation based on reference object characteristics
JP2016159245A (ja) * 2015-03-03 2016-09-05 株式会社東芝 配達物処理装置、および配達物処理プログラム
US10242285B2 (en) 2015-07-20 2019-03-26 Kofax, Inc. Iterative recognition-guided thresholding and data extraction
US9779296B1 (en) 2016-04-01 2017-10-03 Kofax, Inc. Content-based detection and three dimensional geometric reconstruction of objects in image and video data
US9881225B2 (en) * 2016-04-20 2018-01-30 Kabushiki Kaisha Toshiba System and method for intelligent receipt processing
JP6635624B2 (ja) * 2016-11-10 2020-01-29 株式会社オプティム 情報処理装置、情報処理システム、情報処理方法およびプログラム
JP6512236B2 (ja) * 2017-04-12 2019-05-15 カシオ計算機株式会社 情報処理装置及びプログラム
JP6953230B2 (ja) * 2017-08-22 2021-10-27 キヤノン株式会社 スキャン画像にファイル名等を設定するための装置、その制御方法及びプログラム
US11132407B2 (en) * 2017-11-28 2021-09-28 Esker, Inc. System for the automatic separation of documents in a batch of documents
US10803350B2 (en) 2017-11-30 2020-10-13 Kofax, Inc. Object detection and image cropping using a multi-detector approach
JP7650630B2 (ja) * 2020-09-02 2025-03-25 東芝テック株式会社 画像処理装置、情報処理プログラム及び画像処理方法
CN115457557B (zh) * 2022-09-21 2024-03-05 惠州市学之友电子有限公司 一种扫描式翻译笔控制方法及装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62253032A (ja) * 1986-04-24 1987-11-04 松下電工株式会社 リラツクス度検知装置
JPH0827831B2 (ja) 1986-05-16 1996-03-21 株式会社日立製作所 画像登録方式
JPH0194379A (ja) * 1987-10-07 1989-04-13 Alpine Electron Inc 地図の表示方式
JPH06268786A (ja) * 1993-03-11 1994-09-22 Canon Inc カラーファクシミリ装置
JPH0916717A (ja) * 1995-07-04 1997-01-17 Oki Electric Ind Co Ltd 文書読取装置
CN1287322C (zh) * 1995-07-31 2006-11-29 富士通株式会社 文件媒体处理方法
JPH10312456A (ja) 1997-03-12 1998-11-24 Matsushita Electric Ind Co Ltd ディジタル複合機および画像管理システム
JPH11272794A (ja) * 1998-03-24 1999-10-08 Sanyo Electric Co Ltd レシートデータ処理装置
JP2000339077A (ja) 1999-05-27 2000-12-08 Toshiba Tec Corp 画像処理システム

Also Published As

Publication number Publication date
US20050024679A1 (en) 2005-02-03
JP2001126026A (ja) 2001-05-11
US7081975B2 (en) 2006-07-25
US6917438B1 (en) 2005-07-12

Similar Documents

Publication Publication Date Title
JP4377494B2 (ja) 情報入力装置
JP4118349B2 (ja) 文書選択等の方法及び文書サーバ
US8229905B2 (en) Adaptive document management system using a physical representation of a document
US8634100B2 (en) Image forming apparatus for detecting index data of document data, and control method and program product for the same
US20060085442A1 (en) Document image information management apparatus and document image information management program
US20060062453A1 (en) Color highlighting document image processing
JPH0749941A (ja) ディジタル走査文書の自動的な作成、識別、経路指定および保存のための方法とシステムと装置
US20020174271A1 (en) Publication confirming method, publication information acquisition apparatus, publication information providing apparatus and database
AU2008205134B2 (en) A document management system
US8531726B2 (en) Image read processing device and image read processing method
US11657367B2 (en) Workflow support apparatus, workflow support system, and non-transitory computer readable medium storing program
JP2004214991A (ja) 文書画像データ管理システム、文書画像データ管理プログラム、文書画像データ管理装置及び文書画像データ管理方法
JP2001256256A (ja) 電子文書検索装置および電子文書検索方法
US20250014375A1 (en) Information processing apparatus, control method for information processing apparatus, and storage medium
JP7533044B2 (ja) プログラムおよびデバイス
JP4827519B2 (ja) 画像処理装置、画像処理方法、およびプログラム
JP2001005831A (ja) ファイリング方法及びそれを格納した記録媒体
JPH1063813A (ja) イメージ文書管理方法及びその装置
JPH07146875A (ja) 情報検索装置
JP2009199404A (ja) 情報処理システム及びプログラム
JP2010273088A (ja) 紙文書来歴管理システム
JPH09204511A (ja) ファイリング装置
JP2007052614A (ja) 文書管理装置、文書管理システムおよび文書管理方法
JP2004078343A (ja) 文書管理システム
JP2024084452A (ja) 情報処理装置とその制御方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061013

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20061013

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090521

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090602

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090729

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090908

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090911

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120918

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120918

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130918

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees