[go: up one dir, main page]

JP5900204B2 - 文書処理装置及びプログラム - Google Patents

文書処理装置及びプログラム Download PDF

Info

Publication number
JP5900204B2
JP5900204B2 JP2012154697A JP2012154697A JP5900204B2 JP 5900204 B2 JP5900204 B2 JP 5900204B2 JP 2012154697 A JP2012154697 A JP 2012154697A JP 2012154697 A JP2012154697 A JP 2012154697A JP 5900204 B2 JP5900204 B2 JP 5900204B2
Authority
JP
Japan
Prior art keywords
document
time
schedule
attribute
schedule information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012154697A
Other languages
English (en)
Other versions
JP2014016879A (ja
Inventor
辰臣 喜多
辰臣 喜多
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2012154697A priority Critical patent/JP5900204B2/ja
Publication of JP2014016879A publication Critical patent/JP2014016879A/ja
Application granted granted Critical
Publication of JP5900204B2 publication Critical patent/JP5900204B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、文書処理装置及びプログラムに関する。
特許文献1には、携帯電話機のカメラで文書を撮影すると、撮影された画像がデータベースに送信され、データベースにてその画像に近い内容を文書データが検索され、その文書データが携帯電話機に返信され、画面表示されるシステムが開示されている。
特許文献2には、デジタルカメラで撮影された画像データに、GPSから得た位置情報を付加し、パソコンの画像管理プログラムにより、画像データの位置情報から、撮影された場所の地名やそれに関連した情報やファイルが格納されているインターネットのホームページのURL(Uniform Resource Locator)を表示して、該ホームページを閲覧して必要な情報やファイルをユーザの指示でダウンロードすることができる画像処理方法が開示されている。
特開2007−264992号公報 特開2004−023449号公報
ところで、営業員等が客先に訪問したときに、客先から紙文書を受け取ることがあり、このような紙文書をスキャナ等で電子化して(営業員等が所属する)社内の文書DB(データベース)に保存して管理することもよく行われている。この場合、文書DBに保管したスキャン文書の検索のために、営業員等がそのスキャン文書に対して客先の名称等の属性情報を設定することが多い。
本発明は、スキャン装置などで紙文書を電子データとした文書画像に対して、当該紙文書を入手した活動に関わるデータに基づいて、当該文書画像に対応する属性情報を関連づけられるようにすることを目的とする。
請求項1に係る発明は、少なくとも1枚で構成される紙文書に対して、当該紙文書の少なくとも一部を第一の撮像装置で画像生成した第一の文書画像と当該紙文書のうち前記第一の文書画像よりも多くの部分を第二の撮像装置で画像生成した第二の文書画像とを比較し、互いに対応する前記第一の文書画像と前記第二の文書画像とのペアを特定する特定手段と、前記特定されたペアに含まれる前記第一の文書画像から画像生成日時の情報を抽出する日時抽出手段と、スケジュール管理システムに登録された活動の予定情報の中から、予定日時が前記抽出された画像生成日時に類似する予定情報を検索する予定検索手段と、前記検索された予定情報に含まれるあらかじめ定められた注目属性項目の属性値に基づき、前記特定されたペアに含まれる前記第二の文書画像に付与すべき付与対象属性値を判定する判定手段と、前記特定されたペアに含まれる前記第二の文書画像を、前記判定された付与対象属性値と関連づけて、データベースに登録する登録手段と、を備える文書処理装置である。
請求項2に係る発明は、前記判定手段は、前記予定検索手段により検索された予定情報の中に、前記特定されたペアに含まれる前記第一の文書画像の前記画像生成日時に該当する予定日時を持つ予定情報がある場合は、当該該当する予定日時を持つ予定情報に含まれる前記注目属性項目を、前記付与対象属性値と判定する、ことを特徴とする請求項1に記載の文書処理装置である。
請求項3に係る発明は、前記判定手段は、前記予定検索手段により検索された予定情報の中に、前記特定されたペアに含まれる前記第一の文書画像の前記画像生成日時に該当する予定日時を持つ予定情報がない場合は、前記検索された各予定情報を、前記画像生成日時に対する予定日時の近さの順に並べた選択リストをユーザに提示して選択を受け、前記ユーザが前記選択リストから選択した予定情報に含まれる前記注目属性項目を、前記付与対象属性値と判定する、ことを特徴とする請求項2に記載の文書処理装置である。
請求項4に係る発明は、前記判定手段は、前記予定検索手段により検索された各予定情報に含まれる前記注目属性項目の属性値毎に、当該属性値を前記注目属性項目の値として含む前記予定情報の予定日時と前記抽出された画像生成日時との第一の類似度と、当該属性値に関連づけて前記データベースに登録されている第二の文書画像と前記特定されたペアに含まれる前記第一の文書画像との第二の類似度とに基づいて、当該属性値についての評価値を計算し、計算した評価値に基づいて、前記属性値の中から前記付与対象属性値を選択する、ことを特徴とする請求項1に記載の文書処理装置である。
請求項5に係る発明は、前記判定手段は、前記各属性値を前記評価値の高い順に並べた選択リストをユーザに提示して選択を受け、前記ユーザが前記選択リストから選択した属性値を、前記付与対象属性値と判定する、ことを特徴とする請求項4に記載の文書処理装置である。
請求項6に係る発明は、ユーザの認証が成功した場合に当該ユーザからの前記第一の文書画像又は前記第二の文書画像の入力を受け付ける認証手段、を更に備え、前記予定検索手段は、前記スケジュール管理システムに登録された予定情報のうち、前記特定手段が特定した前記ペアに含まれる前記第一の文書画像又は前記第二の文書画像を入力したユーザに関連する予定情報を対象として、前記画像生成日時に該当する予定情報を検索する、ことを特徴とする請求項1〜5のいずれか1項に記載の文書処理装置である。
請求項7に係る発明は、コンピュータを、少なくとも1枚で構成される紙文書に対して、当該紙文書の少なくとも一部を第一の撮像装置で画像生成した第一の文書画像と当該紙文書のうち前記第一の文書画像よりも多くの部分を第二の撮像装置で画像生成した第二の文書画像とを比較し、互いに対応する前記第一の文書画像と前記第二の文書画像とのペアを特定する特定手段、前記特定されたペアに含まれる前記第一の文書画像から画像生成日時の情報を抽出する日時抽出手段、スケジュール管理システムに登録された活動の予定情報の中から、予定日時が前記抽出された画像生成日時に類似する予定情報を検索する予定検索手段、前記検索された予定情報に含まれるあらかじめ定められた注目属性項目の属性値に基づき、前記特定されたペアに含まれる前記第二の文書画像に付与すべき付与対象属性値を判定する判定手段、前記特定されたペアに含まれる前記第二の文書画像を、前記判定された付与対象属性値と関連づけて、データベースに登録する登録手段、として機能させるためのプログラムである。
請求項1又は7に係る発明によれば、当該紙文書を入手した活動に関わるデータに基づき、生成した文書画像の日時情報に応じて当該文書画像の属性値を関連づけることができる。
請求項2に係る発明によれば、予定日時に該当する時間内に第二の文書画像の元の紙文書の画像を撮影するという規則にユーザが従っていれば、第二の文書画像に対応する属性値をユーザが指定せずとも、当該属性値を関連づけることができる。
請求項3に係る発明によれば、予定日時に該当する時間内に、元の紙文書について第一の撮像装置で第一の文書画像を生成することができなかった場合に、ユーザがその紙文書に対応する第二の文書画像に属性値を関連づける作業を支援することができる。
請求項4に係る発明によれば、画像生成日時に基づく情報と画像の情報の双方の情報に応じた類似度を用いて属性値を第二の文書画像に関連づけることができる。
請求項5に係る発明によれば、画像生成日時に基づく情報と画像の情報の双方の情報に応じた評価値だけでは属性値が判別できない場合等に、ユーザが第二の文書画像に属性値を関連づける作業を支援することができる。
請求項6に係る発明によれば、スケジュール管理システムに複数人のユーザの予定情報が登録されている場合でも、第二の文書画像に対応するユーザの予定情報を求め、その予定情報の属性値を第二の文書画像に関連づけることができる。
実施形態のスキャン文書処理装置を含むシステム構成の例を示す図である。 スケジューラに登録された予定情報の一例を説明するための図である。 文書DBで管理される各文書ファイルの入手元属性(「お客様情報」)のデータの一例を示す図である。 写真登録部の構成の一例を示す図である。 写真一時記憶部に記憶されるデータの一例を示す図である。 スキャン文書一時記憶部に記憶されるデータの一例を示す図である。 スキャン文書登録処理部の構成の一例を示す図である。 スキャン文書登録処理部の処理手順の一例を示す図である。 スキャン文書登録処理部の処理手順の変形例の要部を示す図である。 スキャン文書登録処理部の処理手順の別の変形例の要部を示す図である。 図10の手順においてユーザに問合せを行う場合の手順の例を示す図である。
図1に示すシステムは、スキャン文書処理装置10、スケジューラ20、カメラ付き携帯端末30、スキャナ40、文書DB50を含んでいる。このシステムは、個人から企業等の組織まで、様々な規模の対象に適用し得るが、以下では典型的な例として企業に導入される場合を代表に取り上げて説明する。この例では、カメラ付き携帯端末30以外のものは、典型的には企業の社内ネットーワーク(例えばイントラネット)に接続される。
スケジューラ20は、企業に所属する各従業員(以下「ユーザ」と呼ぶ)のスケジュール(予定)を管理するためのシステムである。各ユーザは、スケジューラ20に対して予定情報を登録すると共に、登録した情報を閲覧することで、予定の事前確認や過去の行動の振り返り等を行う。スケジューラ20に登録される予定情報には、その予定を登録したユーザのID、その予定の開始及び終了の日時、その予定にて訪問する訪問先(以下では「お客様」と呼ぶ場合もある)を示す情報等が含まれる。登録される訪問先を示す情報は、典型的には、少なくともスケジューラ20内で一意に定められた当該訪問先の識別情報である。例えばスケジューラ20が、予定の入力画面にて訪問先の選択肢を提示し、それら選択肢の中からユーザが当該予定に係る訪問先を選択することで、訪問先の情報がスケジューラ20に登録される。
図2に、スケジューラ20に登録されたデータの一例を示す。この例は、ある一人のユーザ(ユーザID「001」)のある1日の予定を示している。図における1行の情報が1つの予定情報である。この予定情報には、「お客様名称」(すなわち訪問先の識別情報)、訪問開始時刻(すなわち予定の開始日時)、及び訪問終了時刻(予定の終了日時)が含まれる。この例では、社員「001」は、2012年3月12日に、3つの会社を訪問する予定となっている。
また、スケジューラ20に登録される予定情報には、その予定に参加する(そのユーザ以外の)参加者の識別情報や、自由に記入されたメモ情報等が含まれていてもよい。
カメラ付き携帯端末30は、デジタルスチルカメラの機能を備えた端末装置であり、例えばスマートフォンやカメラ付き携帯電話機がその典型例である。カメラ付き携帯端末30は撮像装置の一例である。また、カメラ付き携帯端末30はデジタルカメラそのものであってもよい。ここで、カメラ付き携帯端末30は、カメラ機能による撮影操作により得られた画像のファイルに、当該端末30が備える時計機能により得たその撮影操作の日時(以下「撮影日時」と呼ぶ)の情報を書き込む(例えばExif形式で。ExifはExchangeable image file formatの略)。カメラ付き携帯端末30による撮影により得られたデジタル写真画像ファイルは、文書画像の一例である。
スキャナ40は、紙書類を読み取って電子データ化する装置である。スキャナ40は、撮像装置の一例である。スキャナ40は、読み取り専用の装置であってもよいし、読み取り以外に印刷等の機能も兼ね備えたいわゆるデジタル複合機等の装置であってもよい。スキャナ40は、直接、又は接続先のパーソナルコンピュータ(以下「PC」と略す)を介して、社内のネットワークに接続されている。例えば、ユーザが訪問先で入手した紙文書を電子データ化する場合に、スキャナ40が利用される。スキャナ40は、自動原稿送り装置等を利用して一括して読み取った複数ページからなる文書の各ページの画像データを1つの文書ファイル(例えばPDF形式。PDFは、Portable Documet Formatの略)にまとめる。スキャナ40によるスキャン処理により生成されたスキャン文書ファイルは、文書画像の一例である。スキャナ40が作成した文書ファイル(以下「スキャン文書」と呼ぶ)は、再利用や社内での共同利用のために、スキャン文書処理装置10を介して文書DB50に登録される場合もある。
文書DB50は、社内で利用される文書ファイルを保存するとともに、各ユーザからの利用のために提供するデータベースである。文書DB50は、登録された文書ファイル群を例えばディレクトリ構造等の情報整理構造に従って整理して保存すると共に、保存した文書ファイル群に対する各ユーザのアクセス権を管理し、そのアクセス権に従って各ユーザからの文書ファイルの利用を制限する。
また、文書DB50は、登録した文書ファイルに対応づけて、その文書ファイルの属性情報を管理する。属性情報には、1以上の属性項目が含まれる。属性項目には、例えば作成者、作成日時、更新者、更新日時、登録者、登録日時、バージョン、文書の種別、文書の入手元等があるが、これらに限定されるものではない。また、属性情報がそれら例示したすべての属性項目を含んでいなくてもよい。文書ファイルに対する属性情報の関連づけの仕方は特に限定されない。例えば、属性情報を文書ファイルと一体化(例えば文書ファイルと属性情報とを1つのファイルにまとめる)することで属性情報を文書毎に分散管理してもよいし、文書DB50が各文書ファイルの属性情報を中央で一括管理してもよい。図3に、文書DB50が集中管理する、各文書ファイルの入手元属性(すなわち「お客様情報」)の管理テーブルの例を示す。この例では、各文書ファイルの識別情報(「文書ID」)に対応づけて、その文書ファイルの入手元の識別情報(お客様企業の名称又は識別情報)が登録されている。
また、属性情報の一部を集中管理し、別の一部を各文書ファイルに組み込んで分散管理すると行った折衷方式でもよい。また、文書DB50のディレクトリ構造を文書ファイルの特定の属性項目に応じたものとし、各文書ファイルをその特定の属性項目の値に対応するディレクトリに格納する方式を採用する場合もある。この方式では、文書ファイルのその特定の属性項目の値が、その文書ファイルの格納先のディレクトリにより表される。
文書DB50が管理する各文書ファイルの属性情報は、例えば、文書ファイルの検索におけるキーとして利用される。
スキャン文書処理装置10は、スキャナ40により読み取られたスキャン文書を文書DB50に対して登録する際に、そのスキャン文書に属性情報を付与するための処理を実行する。特に、この実施形態では、スケジューラ20に登録された情報を用いた属性付与処理を実行する。付与する属性の一例は、例えばスキャン文書の入手元(例えば訪問した客先企業で資料を入手した場合、その客先企業)の情報である。
スキャン文書処理装置10は、そのようなスケジューラ20の情報を利用した属性付与のために、ユーザのカメラ付き携帯端末30が撮影した写真画像ファイル内の撮影時刻情報を利用する。すなわち、この実施形態では、ユーザが訪問先で紙の資料を入手した場合、その訪問中、又はその訪問の用件が終わった後すぐに、その紙資料の代表的なページ(例えば最初のページ)をカメラ付き携帯端末30で撮影する。撮影した写真画像のファイルには、その撮影日時の情報が組み込まれる。その写真画像のファイルをスキャン文書処理装置10に渡せば、スキャン文書処理装置10は、スキャナ40等から入力されたスキャン文書群の中から、その写真画像に似た内容のページを持つスキャン文書を探すと共に、スケジューラ20に登録された当該ユーザの予定情報の中からその写真画像ファイル内の撮影日時に該当する予定情報を探し、その予定情報から訪問先の情報を取得する。そして、見つけたスキャン文書を、取得した訪問先の情報を入手元属性として付与しつつ、文書DB50に登録する。
スキャン文書処理装置10は、ユーザ認証部11、写真登録部12、写真一時記憶部14、スキャン文書一時記憶部16、及びスキャン文書登録処理部18を有する。
ユーザ認証部11は、カメラ付き携帯端末30で撮影された写真画像のファイル、及びスキャナ40が紙文書を読み取ることで作成したスキャン文書を入力しようとするユーザに対して、既存の、又はこれから開発されるユーザ認証技術を用いて、ユーザ認証を行う。このユーザ認証により、そのユーザの識別情報(ユーザID)が特定される。スキャン文書処理装置10は、ユーザ認証が成功してはじめて、写真画像ファイル及びスキャン文書の入力を許可する。
写真登録部12は、写真画像ファイルの登録を受け付ける手段である。写真画像ファイルは、それを作成したカメラ付き携帯端末30から(例えば無線通信ネットワーク等を介して)直接、又はそのカメラ付き携帯端末30からその写真画像ファイルを受け取った他の装置(例えば撮影者のPC)から、写真登録部12へと入力される。写真登録部12は、例えばウェブサービスの形で実装される。この例では、カメラ付き携帯端末30又はPCからそのウェブサービスのURL(端末30等にあらかじめ設定しておけばよい)にアクセスして、写真画像ファイルをそのウェブサービスに送る。なお、このアクセスの際にユーザ認証部11によるユーザ認証が行われ、その認証が成功した場合にのみ、写真登録部12が写真画像ファイルの入力を受け付ける。写真登録部12は、入力された写真画像ファイルを、ユーザ認証により特定された、送信元ユーザのユーザIDに対応づけて、写真一時記憶部14に登録する。
図4に、写真登録部12の内部構成の一例を示す。この例では、写真登録部12は、ユーザID取得部122と写真格納処理部124を備える。カメラ付き携帯端末30等から写真登録部12に写真画像ファイル100の登録要求があった場合、その要求のために携帯端末30等から送られてくるログイン情報110(例えばユーザIDとパスワードの組)を用いてユーザ認証部11がユーザ認証処理を行う。このユーザ認証が成功すると、写真登録部12は携帯端末30等からの写真画像ファイル100の入力を受け付ける。この場合、写真登録部12のユーザID取得部122が、ユーザ認証部11から送信元ユーザのユーザIDを取得する。そして、写真格納処理部124が、そのユーザIDを、携帯端末30等から入力された写真画像ファイル100と対応づけて、写真一時記憶部14に登録する。
写真一時記憶部14は、入力された写真画像ファイルを一時的に記憶するための装置である。この実施形態では、入手した紙文書の写真画像や、その紙文書に対応するスキャン文書がどのようなタイミングでスキャン文書処理装置10に入力されてもよいようにするため、随時入力された写真画像ファイルを写真一時記憶部14に蓄積しておき、同様に随時入力されスキャン文書一時記憶部16に蓄積されるスキャン文書群と照合することで、同一の紙文書に由来する写真画像ファイルとスキャン文書のペアを特定するという構成を採用している。すなわち、本実施形態では、写真画像ファイルとスキャン文書とを1つのインタフェースを介して同時に入力する等といった操作上の制約がない。
図5に、写真一時記憶部14に記憶されるデータの一例を示す。この例では、記憶した写真画像ファイルのIDに対応づけて、その写真画像ファイルの撮影者(すなわちその画像ファイルを装置10に入力したユーザ)のIDが記憶されている。各写真画像ファイルは、その写真画像ファイルIDに対応づけて記憶されている。
図1の説明に戻ると、スキャン文書一時記憶部16は、スキャナ40等から入力されたスキャン文書を一時的に蓄積する。このスキャン文書の入力要求に際し、ユーザ認証部11が要求元ユーザの認証を行い、認証に成功した場合にスキャン文書の入力を受け付ける。入力されたスキャン文書は、認証により判明した入力者のユーザIDに対応づけて、スキャン文書一時記憶部16に蓄積される(図6参照)。
スキャン文書登録処理部18は、スキャン文書一時記憶部16に蓄積された各スキャン文書を、スケジューラ20から求めた当該文書の入手元等の属性を付与して、文書DB18に登録する。このスキャン文書登録処理部18の機能構成の一例を図7に示す。
図7に例示するスキャン文書登録処理部18のユーザ識別部181は、写真一時記憶部14から取り出す写真画像ファイル100に対応するユーザID115を求める。日時情報検出部182は、写真画像ファイル100に含まれている撮影日時の値を検出する。
マッチング処理部184は、写真一時記憶部14内の各写真画像ファイル100と、スキャン文書一時記憶部16内の各スキャン文書200とのマッチング(対応づけ)を行う。すなわち、各写真画像ファイル100の写真画像と、各スキャン文書200の例えば代表ページの画像とを比較することで、同一の紙文書に由来する(すなわち同一の紙文書を撮影・スキャンして得られたものである)写真画像ファイル100とスキャン文書200とのペアを求める。例えば文書の最初のページのような特徴的なページを代表ページとし、ユーザが訪問先から受け取った紙文書の代表ページをカメラ付き携帯端末30で撮影する等のルールをあらかじめ取り決めておけば、写真画像と各スキャン文書の代表ページの画像とを比較することで、写真画像に対応するスキャン文書が判別される。写真画像とスキャン文書の画像とのマッチングは、既存の、又はこれから開発されるマッチング技術を用いて行えばよい。なお、代表ページを定めず、写真画像を各スキャン文書内の全ページの画像と総当たりで比較してもよいが、検索所要時間や精度等の観点でいえば、代表ページを定めておいた方がよい。
スケジューラ検索部186は、日時情報検出部182が検出した写真画像ファイル100の撮影日時と、ユーザ識別部181が識別したその写真画像ファイル100の入力者のユーザIDと、をキーとしてスケジューラ20を検索する。すなわち、スケジューラ20から、その入力者の、その撮影日時に該当する予定情報を検索する。ここで、「撮影日時に該当する予定情報」とは、原理的には、予定時間、すなわち予定開始日時から予定終了日時までの時間内に、撮影日時を含んでいる予定情報のことである。ただし、予定した訪問の間には受け取った紙資料を撮影できず、訪問の後に撮影することになることも多いと考えられるので、実用上は、その予定時間の後にあらかじめ設定した許容時間を足した時間をその予定情報に対応する時間とし、ある写真画像の撮影日時がその対応時間内にあれば、当該写真画像はその予定情報に対応していると判定するようにしてもよい。また、予定時間の前後に許容時間を設けてもよい。
本実施形態では、このようにして検索された予定情報が、それら写真画像及びスキャン文書の元である紙文書の入手元に訪問したというイベントを表しているとみなし、その予定情報に含まれる属性情報を、そのスキャン文書に付与する。この属性付与のために、属性抽出部188が、検索された予定情報の中から、付与対象としてあらかじめ定められた属性項目の値を抽出する。付与対象の属性項目は、例えば訪問先(「お客様」)の識別情報であり、この情報をスキャン文書の入手元属性(「お客様情報」)とする。なお、これは一例に過ぎず、予定情報に含まれる訪問先以外の属性項目(例えば参加者、予定の種別(会議なのか商談なのか等))の値を付与対象の属性項目として抽出してもよい。抽出する属性項目の数は1つに限らず、複数であってもよい。
登録部189は、マッチング処理部184が求めた写真画像に対応するスキャン文書を、その写真画像の撮影日時に基づいて検索した予定情報から抽出した付与対象属性項目の値を付与しつつ、文書DB50に登録する。スキャン文書に対する属性項目の値の付与は、文書DB50におけるその属性項目の管理の仕方に従って行う。例えば、文書DB50がその属性項目の値に応じたディレクトリに文書ファイルを格納するという方式を採用している場合は、登録部189は、文書DB50内の、抽出された属性項目の値に対応するディレクトリにそのスキャン文書を登録する。また、その属性項目の値が集中管理される場合は、登録部189は、文書DB50内のその属性項目を管理するテーブルに、そのスキャン文書のIDとその属性項目の値とを対応づけて登録する。
次に、図8を参照して、スキャン文書登録処理部18の処理手順の一例を説明する。この手順では、マッチング処理部184がスキャン文書一時記憶部16内にスキャン文書があるかどうかを判定し(S10)、あればそのうちの1つを取り出す(S12)。次に、取り出したスキャン文書の画像(例えば代表ページの画像)に類似する写真画像を写真一時記憶部14から検索する(S14)。このステップでは、例えばそのスキャン文書の入力者のユーザIDをスキャン文書一時記憶部16から求め、そのユーザIDに基づいて、比較する写真画像を絞り込んでもよい。一つの例では、スキャン文書の入力者と同一人が入力した写真画像のみを比較対象として、その中からスキャン文書の画像に類似する写真画像を検索する。(写真画像のアップロードが遅れている等の理由で)類似する写真画像が見つからなかった場合(S16の判定結果がNo)、S10で取り出したスキャン文書をスキャン文書一時記憶部16に戻し(S18)、S10に戻る。ここで、戻したスキャン文書はあらかじめ定めた時間の間はS10で再度マッチング処理の対象に選ばれることがないように制御してもよい。
S16で類似する写真画像が見つかった場合は、この写真画像とS12で取り出したスキャン文書とが、互いに対応するペアを形成する。
次に、ユーザ識別部181及び日時情報検出部182がそのペア内の写真画像の撮影者及び撮影日時を特定する(S20)。そして、スケジューラ検索部186が、その撮影者のユーザID及び撮影日時をキーとしてスケジューラ検索部186を検索し、撮影者の予定情報のうち、その撮影日時に該当する予定情報を求める(S22)。なお、S22では、撮影者の代わりに、又は撮影者に加えて、当該スキャン文書をスキャン文書処理装置10に入力した入力者の予定情報を検索対象に含めてもよい。また、それら撮影者又は入力者の予定情報だけでなく、それら撮影者又は入力者を「参加者」属性に含んだ他の人の予定情報を検索対象に含めてもよい。
次に属性抽出部188が、検索された予定情報の中から付与対象属性項目(例えば訪問先の「お客様情報」)の値を抽出し(S24)、登録部189が、そのスキャン文書をその属性項目値と対応づけて文書DB50に登録する(S26)。この登録の後、そのスキャン文書及びS14で検索された類似写真画像を、スキャン文書一時記憶部16及び写真一時記憶部14から削除する。また、撮影者(及びスキャン文書の入力者)に対して、スキャン文書を文書DB50に登録した旨の通知を例えば電子メールを用いて送付してもよい(S28)。この通知には、例えば、そのスキャン文書に対して付与した属性値を表示したり、文書DB50内のそのスキャン文書へのリンクを含めたりするなどにより、自動付与した属性値がもし誤っていた場合の変更操作をやりやすくしてもよい。
図8の例は、スキャン文書一時記憶部16内のスキャン文書を基準として処理を行ったが、写真一時記憶部14内の写真画像を基準として同様の処理を実行してもよい。また、それら両者を併用してもよい。
また、スキャン文書処理装置10に写真画像ファイル又はスキャン文書が入力されたときに、その入力された写真画像ファイル又はスキャン文書を対象としてS12以下の処理を実行してもよい。
また、以上の例では、スケジューラ20に登録された予定情報の属性のうち「訪問先」をスキャン文書に付与する付与対象属性としたが、これは一例に過ぎない。「訪問先」以外の属性を付与対象属性としてもよい。また、予定情報の属性のうち複数の属性を付与対象属性としてもよい。
図8の手順は、ユーザが、スケジューラ20に登録した予定に対してあらかじめ定めた許容時間以内に、その予定で入手した紙文書の写真を撮影した場合(スキャン文書処理装置10への写真画像のアップロードは許容時間経過後でもよい)には有効である。しかし、何らかの事情でユーザがルール通りに許容時間内に紙文書の写真を登録できない場合もあり得る。そのような場合を考慮した変形例を以下に説明する。
図9に示す変形例の処理手順は、図8の手順のうちS24及びS26に置き換わるものである。この手順の前提として、スケジューラ検索部186は、S16で特定されたペア内の写真画像又はスキャン文書の入力者に関連する予定情報(その入力者自身の予定情報又はその入力者を参加者として含む予定情報)の中から、その写真画像の撮影日時に類似する(すなわち「近い」)予定時間を持ついくつかの予定情報を検索するものとする。例えば、撮影日時を基準としたあらかじめ定めた時間範囲(例えば「撮影日時と同日」又は「撮影日時の前後3時間」等)内に含まれる予定時間を有する予定情報をすべて求める。あるいは、それら予定情報の中から、その予定時間がその撮影日時に近い順に、あらかじめ定めた数の予定情報を求める。
図9の手順では、スキャン文書処理装置10の登録部189は、スケジューラ検索部186が検索した予定情報群の中に、S16で特定されたペア内の写真画像の撮影日時に該当する予定情報(すなわち「予定時間+許容時間」内にその撮影日時を含む予定情報)があるかどうかを判定する(S30)。そのような予定情報があれば(S30の判定結果がYes)、登録部189は、その予定情報の注目属性項目の属性値を、そのペア内のスキャン文書に付与すべき付与対象の属性値と判定し(S32)、そのスキャン文書をその付与対象属性値と関連づけて文書DB50に登録する(S42)。
一方、S30の判定結果が否定(No)の場合、登録部189は、スケジューラ検索部186が検索した予定情報を、予定時間が撮影日時に近い順に順位付けして並べたリストを作成し、そのリストを含んだ選択用のウェブページを生成する(S34)。このウェブページには、そのペア内の写真画像又はスキャン文書(又はその両方)を含める。そして、その選択用ウェブページのURLを含んだ電子メールを当該写真画像の撮影者(又はペア内のスキャン文書の入力者)に送信し(S36)、その撮影者等がそのウェブページ内のリストから、そのペアに該当する予定情報を選択するのを待つ(S38)。撮影者等からそのウェブページ上での選択結果が送られてくると、登録部189は、選択された予定情報内の注目属性項目の属性値を付与対象属性値と判定し(S40)、そのスキャン文書をその付与対象属性値と関連づけて文書DB50に登録する(S42)。
図9は、撮影時刻だけでは付与対象属性値を判定できない場合に、必ずユーザの判断を仰ぐというものではあった。これに対し、既登録の類似スキャン文書に付された注目属性項目の属性値を考慮することでできるだけ自動判定を目指す処理の例を、図10に示す。図10に示す変形例の処理手順は、図8の手順のうちS24及びS26に置き換わるものである。図10の手順の前提は、図9の場合と同様である。
図10の手順では、登録部189は、スケジューラ検索部186が検索した各予定情報の注目属性項目の属性値毎に、S50〜S54の処理を行う。例えば、3つの予定情報が検索され、それら各予定情報の注目属性項目「訪問先」の属性値がそれぞれ「A社」、「B社」、「C社」であれば、それら属性値「A社」、「B社」、「C社」のそれぞれについてS50〜S54の処理を行う。
すなわち、登録部189は、当該属性値を含む予定情報の予定時間と、写真画像の撮影日時との類似度(「時間類似度」と呼ぶ)を計算する(S50)。時間類似度は、予定時間が撮影日時に近いほど高くなるよう定める。また、登録部189は、文書DB50に登録されているスキャン文書の中から、当該属性値が付与されたスキャン文書を検索し、検索したスキャン文書の画像(例えば代表ページの画像)と写真画像との類似度(「画像類似度」と呼ぶ)を計算する(S52)。そして、登録部189は、時間類似度と画像類似度とを総合することで、ペア内のスキャン文書に対する当該属性値の適合度合いを示す評価値を計算する(S54)。時間類似度と画像類似度から評価値を求める計算の仕方は特に限定されるものではなく、例えば両者の足し算又は両者のかけ算等でもよい。
このようにして属性値毎に評価値が求められると、評価値に基づいてそれら属性値の中から付与対象属性値を判定する(S56)。単純な例では、評価値が最高である属性値を付与対象属性値と判定すればよい。
また、誤判定を極力減らすために、上位の評価値の間にあまり差がない場合に、ユーザ(撮影者等)の判断を仰ぐようにしてもよい。すなわち、この例では、最高の評価値とその次に高い評価値との差があらかじめ定めた閾値以上であれば、その最高の評価値を持つ属性値を付与対象属性値と判定する。逆に、最高の評価値からみてその閾値以内の範囲内に別の評価値が存在する場合、図11の手順を実行する。図11の手順では、登録部189は、最高の評価値に対応する属性値、及びこれから閾値以内にある別の評価値に対応する属性値を、評価値の高い順に順位付けして並べたリストを作成し、そのリストを含んだ選択用のウェブページを生成する(S560)。そして、その選択用ウェブページのURLを含んだ電子メールを当該写真画像の撮影者(又はペア内のスキャン文書の入力者)に送信し(S562)、その撮影者等からの選択結果の通知を待つ(S564)。撮影者等がそのウェブページ上に表示されたリストから写真画像等に対応する属性値を選択し、その選択結果を返信すると、登録部189は、選択された予定情報内の注目属性項目の属性値を付与対象属性値と判定する(S566)。
登録部189は、スキャン文書を、以上のようにして判定した付与対象属性値を付与しつつ、文書DB50に登録する(S56)。
以上に示した実施形態及び変形例は、企業のように複数の個人を含む組織に本発明を適用した場合の例であったが、本発明はそのような組織に限らず個人に対しても適用可能である。個人に適用する場合には、アップロードされる写真画像やスキャン文書、スケジューラ20内の予定情報が誰のものであるかを考慮して絞り込みを行うといった処理は必要ない。
以上に例示したスキャン文書処理装置は、例えば、汎用のコンピュータに上述の各機能モジュールの処理を表すプログラムを実行させることにより実現される。ここで、コンピュータは、例えば、ハードウエアとして、CPU等のマイクロプロセッサ、ランダムアクセスメモリ(RAM)およびリードオンリメモリ(ROM)等のメモリ(一次記憶)、HDD(ハードディスクドライブ)を制御するHDDコントローラ、各種I/O(入出力)インタフェース、ローカルエリアネットワークなどのネットワークとの接続のための制御を行うネットワークインタフェース等が、たとえばバスを介して接続された回路構成を有する。また、そのバスに対し、例えばI/Oインタフェース経由で、CDやDVDなどの可搬型ディスク記録媒体に対する読み取り及び/又は書き込みのためのディスクドライブ、フラッシュメモリなどの各種規格の可搬型の不揮発性記録媒体に対する読み取り及び/又は書き込みのためのメモリリーダライタ、などが接続されてもよい。上に例示した各機能モジュールの処理内容が記述されたプログラムがCDやDVD等の記録媒体を経由して、又はネットワーク等の通信手段経由で、ハードディスクドライブ等の固定記憶装置に保存され、コンピュータにインストールされる。固定記憶装置に記憶されたプログラムがRAMに読み出されCPU等のマイクロプロセッサにより実行されることにより、上に例示した機能モジュール群が実現される。また、以上に例示したスキャン文書処理装置の構成要素群を、ネットワークを介して相互に通信可能な複数のコンピュータに分散して実装し、それら分散された構成要素群がネットワークを介して相互に通信することで、上述したスキャン文書処理装置の機能を実現するようにしてもよい。
なお、以上の例では、「第一の撮像装置」としてカメラ付きの携帯端末30を用い、「第二の撮像装置」としてスキャナ40を用いたが、これは一例に過ぎない。例えば、「第一の撮像装置」は、紙文書の少なくとも一部に対する画像生成(例えば撮影)を行った日時を、生成した画像(すなわち「第一の文書画像」)に例えば属性情報として持たせることができる装置であれば、どのような装置を用いてもよい。「第一の撮像装置」が紙文書のうちの代表的な一部(例えば表示ページ)を画像生成するものであるのに対し、「第二の撮像装置」は、紙文書のうち保存すべき部分(前述した「代表的な一部」を含んだ、「代表的な一部」よりも多くの部分)のページを画像データ化するものであればよい。
10 スキャン文書処理装置、11 ユーザ認証部、12 写真登録部、14 写真一時記憶部、16 スキャン文書一時記憶部、18 スキャン文書登録処理部、20 スケジューラ、30 カメラ付き携帯端末、40 スキャナ、50 文書DB、100 写真画像ファイル、110 ログイン情報、122 ユーザID取得部、124 写真格納処理部、181 ユーザ識別部、182 日時情報検出部、184 マッチング処理部、186 スケジューラ検索部、188 属性抽出部、189 登録部、200 スキャン文書。

Claims (7)

  1. 少なくとも1枚で構成される紙文書に対して、当該紙文書の少なくとも一部を第一の撮像装置で画像生成した第一の文書画像と当該紙文書のうち前記第一の文書画像よりも多くの部分を第二の撮像装置で画像生成した第二の文書画像とを比較し、互いに対応する前記第一の文書画像と前記第二の文書画像とのペアを特定する特定手段と、
    前記特定されたペアに含まれる前記第一の文書画像から画像生成日時の情報を抽出する日時抽出手段と、
    スケジュール管理システムに登録された活動の予定情報の中から、予定日時が前記抽出された画像生成日時に類似する予定情報を検索する予定検索手段と、
    前記検索された予定情報に含まれるあらかじめ定められた注目属性項目の属性値に基づき、前記特定されたペアに含まれる前記第二の文書画像に付与すべき付与対象属性値を判定する判定手段と、
    前記特定されたペアに含まれる前記第二の文書画像を、前記判定された付与対象属性値と関連づけて、データベースに登録する登録手段と、
    を備える文書処理装置。
  2. 前記判定手段は、前記予定検索手段により検索された予定情報の中に、前記特定されたペアに含まれる前記第一の文書画像の前記画像生成日時に該当する予定日時を持つ予定情報がある場合は、当該該当する予定日時を持つ予定情報に含まれる前記注目属性項目を、前記付与対象属性値と判定する、ことを特徴とする請求項1に記載の文書処理装置。
  3. 前記判定手段は、前記予定検索手段により検索された予定情報の中に、前記特定されたペアに含まれる前記第一の文書画像の前記画像生成日時に該当する予定日時を持つ予定情報がない場合は、前記検索された各予定情報を、前記画像生成日時に対する予定日時の近さの順に並べた選択リストをユーザに提示して選択を受け、前記ユーザが前記選択リストから選択した予定情報に含まれる前記注目属性項目を、前記付与対象属性値と判定する、ことを特徴とする請求項2に記載の文書処理装置。
  4. 前記判定手段は、
    前記予定検索手段により検索された各予定情報に含まれる前記注目属性項目の属性値毎に、当該属性値を前記注目属性項目の値として含む前記予定情報の予定日時と前記抽出された画像生成日時との第一の類似度と、当該属性値に関連づけて前記データベースに登録されている第二の文書画像と前記特定されたペアに含まれる前記第一の文書画像との第二の類似度とに基づいて、当該属性値についての評価値を計算し、計算した評価値に基づいて、前記属性値の中から前記付与対象属性値を選択する、
    ことを特徴とする請求項1に記載の文書処理装置。
  5. 前記判定手段は、前記各属性値を前記評価値の高い順に並べた選択リストをユーザに提示して選択を受け、前記ユーザが前記選択リストから選択した属性値を、前記付与対象属性値と判定する、ことを特徴とする請求項4に記載の文書処理装置。
  6. ユーザの認証が成功した場合に当該ユーザからの前記第一の文書画像又は前記第二の文書画像の入力を受け付ける認証手段、を更に備え、
    前記予定検索手段は、前記スケジュール管理システムに登録された予定情報のうち、前記特定手段が特定した前記ペアに含まれる前記第一の文書画像又は前記第二の文書画像を入力したユーザに関連する予定情報を対象として、前記画像生成日時に該当する予定情報を検索する、
    ことを特徴とする請求項1〜5のいずれか1項に記載の文書処理装置。
  7. コンピュータを、
    少なくとも1枚で構成される紙文書に対して、当該紙文書の少なくとも一部を第一の撮像装置で画像生成した第一の文書画像と当該紙文書のうち前記第一の文書画像よりも多くの部分を第二の撮像装置で画像生成した第二の文書画像とを比較し、互いに対応する前記第一の文書画像と前記第二の文書画像とのペアを特定する特定手段、
    前記特定されたペアに含まれる前記第一の文書画像から画像生成日時の情報を抽出する日時抽出手段、
    スケジュール管理システムに登録された活動の予定情報の中から、予定日時が前記抽出された画像生成日時に類似する予定情報を検索する予定検索手段、
    前記検索された予定情報に含まれるあらかじめ定められた注目属性項目の属性値に基づき、前記特定されたペアに含まれる前記第二の文書画像に付与すべき付与対象属性値を判定する判定手段、
    前記特定されたペアに含まれる前記第二の文書画像を、前記判定された付与対象属性値と関連づけて、データベースに登録する登録手段、
    として機能させるためのプログラム。
JP2012154697A 2012-07-10 2012-07-10 文書処理装置及びプログラム Active JP5900204B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012154697A JP5900204B2 (ja) 2012-07-10 2012-07-10 文書処理装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012154697A JP5900204B2 (ja) 2012-07-10 2012-07-10 文書処理装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2014016879A JP2014016879A (ja) 2014-01-30
JP5900204B2 true JP5900204B2 (ja) 2016-04-06

Family

ID=50111481

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012154697A Active JP5900204B2 (ja) 2012-07-10 2012-07-10 文書処理装置及びプログラム

Country Status (1)

Country Link
JP (1) JP5900204B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016009361A (ja) * 2014-06-25 2016-01-18 カシオ計算機株式会社 情報処理装置及びプログラム
JP6372276B2 (ja) * 2014-09-24 2018-08-15 富士通株式会社 情報処理システム、データ記憶方法及びプログラム
WO2021229822A1 (ja) * 2020-05-15 2021-11-18 ファーストアカウンティング株式会社 電子データ判定システム、電子データ判定装置、電子データ判定方法、電子データ判定プログラム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09212516A (ja) * 1996-01-31 1997-08-15 Sanyo Electric Co Ltd 情報管理装置
JP2002245035A (ja) * 2001-02-15 2002-08-30 Ricoh Co Ltd 文書管理装置
JP2003231586A (ja) * 2002-02-06 2003-08-19 Ishikawajima Harima Heavy Ind Co Ltd 貯槽とその貯槽を備えた船舶
US20060085442A1 (en) * 2004-10-20 2006-04-20 Kabushiki Kaisha Toshiba Document image information management apparatus and document image information management program
JP4576211B2 (ja) * 2004-11-22 2010-11-04 日立オムロンターミナルソリューションズ株式会社 文書情報検索システム
JP2007066065A (ja) * 2005-08-31 2007-03-15 Ricoh Co Ltd 情報表示システム、情報表示装置、情報表示方法、並びにプログラムおよび記録媒体
JP5063229B2 (ja) * 2007-07-12 2012-10-31 キヤノン株式会社 露光装置及びデバイス製造方法

Also Published As

Publication number Publication date
JP2014016879A (ja) 2014-01-30

Similar Documents

Publication Publication Date Title
JP4797925B2 (ja) 情報処理プログラムおよび情報処理システム
US7752187B2 (en) Document management system, document management method, and recording medium storing program for document management
US9088676B2 (en) Information processing apparatus, information processing method, and computer readable medium
JP6380465B2 (ja) 文書を分析・ルーティングするシステム及び方法
US8767237B2 (en) Printing authentication system, printing device, device management apparatus and non-transitory computer readable recording medium
JP2014048724A (ja) 画像形成装置およびその制御方法、並びにプログラム
JP2009205220A (ja) 情報検索システム、情報検索方法、情報検索プログラム及び記録媒体
JP5900204B2 (ja) 文書処理装置及びプログラム
US20200358913A1 (en) Information processing apparatus, and non-transitory computer readable medium
JP5458861B2 (ja) 文書検索装置、プログラム、文書登録装置、および文書検索システム
JP2009075637A (ja) データ管理システム、データ提供システム及びプログラム
JP6390158B2 (ja) 情報処理システム、情報処理方法、及びプログラム
CN113014743B (zh) 图像处理装置及认证方法
JP3870662B2 (ja) 文書管理システム及び装置
JP4916936B2 (ja) コンテンツ管理システム
JP4407436B2 (ja) 画像出力装置および画像出力方法
JP2007081652A (ja) 送信機能付き共有情報処理装置、画像形成装置
JP2005100187A (ja) 画像処理装置
JP2007058532A (ja) 情報処理システム、情報処理装置および方法、プログラム、並びに、記録媒体
JP6259242B2 (ja) 名刺管理システム、名刺管理方法および名刺管理プログラム
JP2017041128A (ja) プログラム及び情報処理装置
JP6720734B2 (ja) 画像処理装置及び画像処理プログラム
JP7286449B2 (ja) 情報処理装置、情報処理装置の制御方法、及びプログラム
US20240168687A1 (en) Related information providing method for image processing, image processing system, and image processing device
JP2009134675A (ja) コンテンツ交換装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150306

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160128

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160209

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160222

R150 Certificate of patent or registration of utility model

Ref document number: 5900204

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350