[go: up one dir, main page]

JP7354697B2 - 情報処理装置、及び情報処理プログラム - Google Patents

情報処理装置、及び情報処理プログラム Download PDF

Info

Publication number
JP7354697B2
JP7354697B2 JP2019158714A JP2019158714A JP7354697B2 JP 7354697 B2 JP7354697 B2 JP 7354697B2 JP 2019158714 A JP2019158714 A JP 2019158714A JP 2019158714 A JP2019158714 A JP 2019158714A JP 7354697 B2 JP7354697 B2 JP 7354697B2
Authority
JP
Japan
Prior art keywords
order
information processing
item
recognition results
confirmation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019158714A
Other languages
English (en)
Other versions
JP2021039428A (ja
Inventor
重和 笹川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2019158714A priority Critical patent/JP7354697B2/ja
Priority to CN202010151590.3A priority patent/CN112449071A/zh
Priority to US16/831,246 priority patent/US11671540B2/en
Publication of JP2021039428A publication Critical patent/JP2021039428A/ja
Application granted granted Critical
Publication of JP7354697B2 publication Critical patent/JP7354697B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00405Output means
    • H04N1/00408Display of information to the user, e.g. menus
    • H04N1/00411Display of information to the user, e.g. menus the display also being used for user input, e.g. touch screen
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00405Output means
    • H04N1/00408Display of information to the user, e.g. menus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/106Display of layout of documents; Previewing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00405Output means
    • H04N1/00408Display of information to the user, e.g. menus
    • H04N1/00413Display of information to the user, e.g. menus using menus, i.e. presenting the user with a plurality of selectable options
    • H04N1/00437Intelligent menus, e.g. anticipating user selections

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • User Interface Of Digital Computer (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、情報処理装置、及び情報処理プログラムに関する。
特許文献1には、端末装置の表示手段で表示を行いつつ媒体に記入されたデータを入力する際のデータ入力画面の表示方法において、表示手段にイメージ表示エリアと項目入力エリアから成る画面を表示し、前記イメージ表示エリアにスキャナで読み取った媒体のイメージのうちの入力すべき少なくとも1つの項目を含む部分を表示すると共に、項目入力エリアには入力すべき項目別の入力用フィールドを表示し、項目入力エリアの1つの入力用フィールドにデータが入力される毎にイメージ表示エリアに表示されるイメージを自動的にスクロールして、次の入力すべき項目を含むイメージの一部分を表示することを特徴とするデータ入力画面の表示方法が開示されている。
特開2000-347777号公報
OCR(Optical Character Recognition)処理で読み取った書類の項目を確認して訂正する場合において、訂正する項目に関連する箇所を確認しながら、ユーザによって異なる順番で項目を確認及び訂正することがある。
しかしながら、書類に並んでいる順番で項目を表示すると、訂正する項目に関連する箇所を確認しながら訂正を行う場合において、関連する箇所間の移動が多くなるため、確認する作業が煩雑になり、確認する作業の負担を軽減することが困難であった。
本発明は、書類を確認する作業において、書類に並んでいる順番で項目を表示する場合と比較して、項目を確認する作業の負担を軽減することができる情報処理装置及び情報処理プログラムを提供することを目的とする。
第1の態様の情報処理装置は、プロセッサを備え、プロセッサは、項目に対して記載欄が設けられた書類を認識した結果である認識結果を項目毎に表示し、表示された認識結果を確認した順番である確認順を項目毎に取得し、取得した確認順を用いて、認識結果を表示する順番である表示順を変更する制御を行う。
第2の態様の情報処理装置は、第1の態様に係る情報処理装置において、プロセッサは、表示順と、確認順とが異なる場合、取得した確認順を表示順に反映させるか否かを選択させる。
第3の態様の情報処理装置は、第2の態様に係る情報処理装置において、プロセッサは、確認順を表示順に反映して、認識結果を複数回表示させた結果、各々の認識結果の表示順が予め定めた回数同一であった場合、各々の認識結果の表示順を次回以降の表示順に反映するか否かを選択させる。
第4の態様の情報処理装置は、第1の態様から第3の態様までのいずれか1つの態様に係る情報処理装置において、プロセッサは、各々の認識結果が有する関係性に基づいて、認識結果を関連付けて表示する制御を行う。
第5の態様の情報処理装置は、第4の態様に係る情報処理装置において、関係性は、各々の認識結果が有する従属関係である。
第6の態様の情報処理装置は、第5の態様に係る情報処理装置において、プロセッサは、各々の認識結果の確認順が前後関係を有する場合、従属関係として、各々の認識結果を関連付ける。
第7の態様の情報処理装置は、第1の態様から第6の態様までのいずれか1つの態様に係る情報処理装置において、プロセッサは、予め定められた順番で表示する方法、及び表示順を変更して表示する方法を切り替えて、認識結果を表示する。
第8の態様の情報処理装置は、第1の態様から第7の態様までのいずれか1つの態様に係る情報処理装置において、プロセッサは、確認順を取得するか否かを切り替えて、認識結果を表示する。
第9の態様の情報処理装置は、第1の態様から第8の態様までのいずれか1つの態様に係る情報処理装置において、プロセッサは、書類を読み取った画像データを表示し、表示された画像データにおいて、確認した認識結果に対応した箇所と、未だ確認していない箇所とを区分して表示する。
第10の態様の情報処理プログラムは、コンピュータに項目に対して記載欄が設けられた書類を認識した結果である認識結果を項目毎に表示し、表示された認識結果を確認した順番である確認順を項目毎に取得し、取得した確認順を用いて、認識結果を表示する順番である表示順を変更する制御を行うことを実行させる。
第1の態様の情報処理装置及び第10の態様の情報処理プログラムによれば、書類を確認する作業において、書類に並んでいる順番で項目を表示する場合と比較して、項目を確認する作業の負担を軽減することができる。
第2の態様の情報処理装置によれば、取得した確認順を前記表示順に反映させるか否かを選択できない場合と比較して、よりユーザの好みに応じた表示順で表示することができる。
第3の態様の情報処理装置によれば、次回以降の前記表示順に反映するか否かを選択させない場合と比較して、頻繁に確認する順番をより表示順に反映することができる。
第4の態様の情報処理装置によれば、より確認する作業の負担を軽減することができる。
第5の態様の情報処理装置によれば、従属関係を用いらない場合と比較して、ユーザの作業の負担をより軽減することができる。
第6の態様の情報処理装置によれば、関連する項目を明確に定義することができる。
第7の態様の情報処理装置によれば、表示する順番を切り替えることができない場合と比較して、より確認する作業の負担を軽減することができる。
第8の態様の情報処理装置によれば、確認順を取得するか否かを切り替えることができない場合と比較して、現在適用されている表示順を変更することなく、より確認する作業の負担を軽減することができる。
第9の態様の情報処理装置によれば、確認した認識結果に対応した箇所と、未だ確認していない箇所とを区分して表示しない場合と比較して、表示された項目を確認する作業の進捗状況を確認しやすくなる。
各実施形態に係る情報処理システムの構成の一例を示す概略図である。 各実施形態に係る情報処理装置のハードウェア構成の一例を示すブロック図である。 各実施形態に係る情報処理装置の機能的な構成の一例を示すブロック図である。 第一実施形態に係る情報処理装置が表示する確認訂正画面の一例を示す模式図である。 各実施形態に係る項目毎の認識結果の関係性の説明に供する情報処理装置が表示する確認訂正画面の一例を示す模式図である。 第一実施形態に係る情報処理の一例を示すフローチャートである。 第二実施形態に係る情報処理装置が表示する確認訂正画面の一例を示す模式図である。 第二実施形態に係る情報処理の一例を示すフローチャートである。
[第1実施形態]
以下、図面を参照して、本開示の技術を実施するための形態例を詳細に説明する。なお、本実施形態に係る情報処理装置3は、一例として、書類を読み取ったデータを管理するサーバである形態について説明する。しかし、これに限定されない。情報処理装置3は、例えばプリント機能、コピー機能、スキャン機能、及びファクシミリ機能等の機能を有する複合機に搭載されてもよいし、スキャナが接続されたパーソナルコンピュータ等の端末に搭載されてもよい。
図1は、本実施形態に係る情報処理システム1の構成の一例を示す概略図である。図1に示すように、本実施形態に係る情報処理システム1は、複合機2、情報処理装置3、及び端末4がネットワークに接続されて構成されている。
複合機2は、スキャン機能を有し、項目に対して記載欄が設けられた書類をスキャンし、スキャンした画像データを情報処理装置3に送信する。
情報処理装置3は、複合機2によって読み取られた画像データから項目毎にスキャンした画像データと、項目毎にOCR処理によって認識した結果(以下、「認識結果」という)である文字列とを抽出する。また、情報処理装置3は、書類をスキャンした画像データと、画像データから抽出した項目毎の画像データと、画像データから抽出した文字列を端末4に送信する。
端末4は、情報処理装置3から受信した、画像データと、項目毎の画像データと、項目毎の文字列とを表示する。ユーザは、端末4を操作し、項目毎の画像データと、項目毎の文字列とを確認及び訂正する処理(以下、「確認訂正処理」という。)を行う。
なお、本実施形態では、スキャンした項目毎の画像データ、及び項目毎の認識結果を端末4に表示する形態について説明した。しかし、これに限定されない。情報処理装置3は、モニターが接続されており、情報処理装置3にスキャンした項目毎の画像データ、及び項目毎の認識結果を表示する形態であってもよい。
以下では、説明を簡単にするために、情報処理装置3は、スキャンした項目毎の画像データ、及び項目毎の認識結果を表示するモニターを備え、ユーザによって情報処理装置3を介して確認訂正処理が行われる形態について説明する。
図2は、本実施形態に係る情報処理装置3のハードウェア構成の一例を示すブロック図である。図2に示すように、本実施形態に係る情報処理装置3は、CPU(Central Processing Unit)11、ROM(Read Only Memory)12、RAM(Random Access Memory)13、ストレージ14、入力部15、モニター16、及び通信インターフェース(通信I/F)17を含んで構成されている。CPU11、ROM12、RAM13、ストレージ14、入力部15、モニター16、及び通信I/F17の各々はバス18により相互に接続されている。ここで、CPU11は、プロセッサの一例である。
CPU11は、情報処理装置3の全体を統括し、制御する。ROM12は、本実施形態で用いる情報処理プログラムを含む各種プログラム及びデータ等を記憶している。RAM13は、各種プログラムの実行時のワークエリアとして用いられるメモリである。CPU11は、ROM12に記憶されたプログラムをRAM13に展開して実行することにより、項目毎の画像データ等の抽出し、記憶する処理を行う。ストレージ14は、一例としてHDD(Hard Disk Drive)、SSD(Solid State Drive)、又はフラッシュメモリ等である。なお、ストレージ14には、情報処理プログラム等を記憶してもよい。入力部15は、文字及び選択等の入力を受け付けるキーボード及びマウス等である。モニター16は、画像データ等を表示する。通信I/F17は、データの送受信を行う。
次に、図3を参照して、情報処理装置3の機能構成について説明する。図3は、本実施形態に係る情報処理装置3の機能的な構成の一例を示すブロック図である。
図3に示すように、情報処理装置3は、表示部21、取得部22、制御部23、受付部24、及び記憶部25を有する。CPU11が情報処理プログラムを実行することで、表示部21、取得部22、制御部23、受付部24、及び記憶部25として機能する。
表示部21は、項目に対して記載欄が設けられた書類を認識した結果である認識結果を項目毎に表示する。
取得部22は、表示された項目毎の認識結果を確認した順番(以下、「確認順」という。)を項目毎に取得する。
制御部23は、取得した確認順を用いて、項目毎の認識結果を表示する順番(以下、「表示順」という。)を変更する制御を行う。制御部23は、各々の認識結果が有する関係性に基づいて、認識結果を関連付けて表示する制御を行う。なお、上述した関係性とは、各々の認識結果が有する従属関係である。具体的には、制御部23は、各々の認識結果の確認順が前後関係を有する場合、従属関係として、各々の認識結果を関連付ける。
制御部23は、予め定められた順番で表示する方法と、表示順を変更して表示する方法とを切り替えて認識結果を表示する制御を行い、確認順を取得するか否かを切り替えて認識結果を表示する制御を行う。制御部23は、書類を読み取った画像データを表示し、表示された画像データにおいて、確認した認識結果に対応した箇所と、未だ確認していない箇所とを区分して表示する制御を行う。
受付部24は、表示順と、確認順とが異なる場合、取得した確認順を表示順に反映させるか否かの選択を受け付ける。受付部24は、確認順を表示順に反映して、認識結果を複数回表示させた結果、各々の認識結果の表示順が予め定めた回数同一であった場合、各々の認識結果の表示順を次回以降の表示順に反映するか否かの選択を受け付ける。
記憶部25は、取得した画像データ、項目毎の画像データ、項目毎の認識結果、訂正された項目毎の確認結果、及び項目毎の確認順を記憶する。
次に、情報処理装置3の作用について説明する前に、図4から図5を参照して、情報処理装置3が行う確認順を取得して認識結果の表示順を変更するための手法について説明する。
次に、図4を参照して、確認訂正処理を行う際の確認訂正処理画面について説明する。図4は、本実施形態に係る情報処理装置3が表示する確認訂正画面の一例を示す模式図である。
情報処理装置3は、図4に示すように、確認訂正画面40に、取得した画像データ41と、確認訂正表示領域42における項目毎の画像データ43と、項目毎の認識結果44とを表示する。項目毎の認識結果44をクリックすることで、入力可能な状態となり、認識結果44に表示されている文字列が訂正される。また、マウス等によって操作されるカーソル45が、認識結果44が表示されている箇所と重なると、認識結果44が表示されている箇所の表示の色が変化する(以下、「マウスオーバー」という。)。情報処理装置3は、項目毎の認識結果44がマウスオーバーの状態になった順番を項目毎に取得し、確認順として記憶する。例えば、「児童氏名1」、「児童続柄1」、「児童生年月日1」の順番で、カーソル45を重ね、マウスオーバーになった場合、情報処理装置3は、確認順として、「児童氏名1」を「1」、「児童続柄1」を「2」、「児童生年月日1」を「3」として記憶する。
情報処理装置3は、項目毎の確認順を用いて、項目の確認順及び参照関係を学習する。例えば、情報処理装置3は、項目毎の確認順と、項目毎の表示順とが異なる場合、項目毎の確認順、確認される頻度が高い項目、及び項目間の確認順の前後関係等を学習して、表示順を変更する学習モデルを作成する。情報処理装置3は、作成した学習モデルをOCR処理を行った書類毎に記憶する。情報処理装置3は、作成した学習モデルを用いて、次回以降に同一の書類についてOCR処理が行われた場合、認識結果の表示順を変更して表示する。
なお、本実施形態では認識結果44が表示されている箇所にカーソル45を重ねる形態について説明した。しかし、これに限定されない。例えば、ヘッドマウントディスプレイ等に項目毎の画像データ43と、項目毎の認識結果44とを表示し、項目毎の認識結果44に向けている視線を検知して、確認順を取得してもよい。また、タブレット等の携帯端末に表示し、タップされた項目毎の認識結果44を検知して、確認順を取得してもよい。
情報処理装置3は、取得した確認順を用いて学習し、表示順の変更を行う。一例として、図4に示すように、確認訂正画面40では、項目毎の画像データ43と、項目毎の認識結果44とを縦に一列に並べて表示している。しかし、これに限定されない。項目毎が有する関係性に応じて、項目毎の画像データ43と、項目毎の認識結果44とを並列に表示してもよい。
次に、図5を参照して、確認訂正処理を行う際に、項目毎の画像データ43と、項目毎の認識結果44とを並列に表示する確認訂正処理画面について説明する。図5は、本実施形態に係る項目毎の認識結果44の関係性の説明に供する情報処理装置3が表示する確認訂正画面の一例を示す模式図である。
情報処理装置3は、図5に示すように、確認訂正画面40に、取得した画像データ41と、確認訂正表示領域42に項目毎の画像データ43と、項目毎の認識結果44とを表示する。例えば、情報処理装置3は、「受給者氏名」、「児童氏名1」、「児童続柄1」、「児童生年月日1」、「受給者氏名」、「児童氏名2」、「児童続柄2」、「児童生年月日2」の順番で確認順を取得し、学習モデルに反映した場合について説明する。項目を複数回確認した場合、情報処理装置3は、複数回確認した項目と、当該項目と前後関係を有する項目とを関連付けを行う。
まず、情報処理装置3は、「児童氏名1」、「児童続柄1」、「児童生年月日1」が「受給者氏名」に従属する項目として関連付けを行い、同様に「児童氏名2」、「児童続柄2」、「児童生年月日2」が「受給者氏名」に従属する項目として関連付けを行う。次に、情報処理装置3は、上位の項目として、「受給者氏名」を表示し、「受給者氏名」に従属する項目として、「児童氏名1」、「児童続柄1」、及び「児童生年月日1」と、「児童氏名2」、「児童続柄2」、及び「児童生年月日2」とを並べて表示する。これにより、情報処理装置3は、関連する項目を並列に表示する処理を行う。
なお、本実施形態では、項目が複数回確認された場合、関連付けを行う形態について説明した。しかし、これに限定されない。項目間で前後関係を有する頻度が高い項目を関連があるとして、関連付けを行ってもよいし、関連付けを行う項目の従属関係をファイル等に定義して記憶しておいてもよい。
また、本実施形態では、項目毎の認識結果間の関係性として、従属関係を有する形態について説明した。しかし、これに限定されない。同一項目に対して異なる内容が記載された項目を同種関係で関連付けを行ってもよい。例えば、「児童氏名1」と、「児童氏名2」とは、同一の「児童氏名」という種類を示すが異なる内容が記載されている。情報処理装置3は、同一の種類の項目を関連付けて、並列に表示する形態としてもよい。また、本実施形態では、関連する項目を並列に表示する形態について説明した。しかし、これに限定されない。例えば、各々の項目が連結して、項目間の関連を示すネットワークグラフ等の二次元的に描画するグラフを用いてもよいし、複数の項目が交差しないように連結し、各々の項目の関連を示す力学モデル等の三次元的に描画するグラフを用いて表示してもよい。
また、本実施形態では、確認順を用いて、表示順を変更する形態について説明した。しかし、これに限定されない。同一の表示順で複数回認識結果を表示させた場合、認識結果の表示順を次回以降の表示順に反映してもよいし、表示順を反映するか否かを選択できるようにしてもよい。具体的には、「受給者氏名」、「児童氏名1」、「児童生年月日1」の順番で予め定められた回数表示した場合、ユーザは、「受給者氏名」、「児童氏名1」、「児童生年月日1」の順番を次回以降の表示順に反映するか否かを選択する。情報処理装置3は、反映が選択された場合、次回以降の項目毎の認識結果44を表示する際に、「受給者氏名」、「児童氏名1」、「児童生年月日1」の順番で、項目毎の画像データ43及び項目毎の認識結果44を表示する。
次に、図6を参照して、本実施形態に係る情報処理プログラムの作用について説明する。まず、図6は、本実施形態に係る情報処理の一例を示すフローチャートである。CPU11がROM12又はストレージ14から情報処理プログラムを読み出し、実行することによって、図6に示す情報処理が実行される。図6に示す情報処理は、例えば、ユーザによって情報処理プログラムの実行指示が入力された場合、情報処理が実行される。
ステップS101において、CPU11は、画像データが入力されたか否かの判定を行う。画像データが入力された場合(ステップS101:YES)、CPU11は、ステップS102に移行する。一方、画像データが入力されていない場合(ステップS101:NO)、CPU11は、画像データが入力されるまで待機する。ここで、画像データの入力と共に、書類の種類に関する情報、学習モデルの使用の有無、確認順を学習する有無、及び設定情報の入力がなされる。
ステップS102において、CPU11は、入力された画像データからOCR処理によって認識結果を取得する。
ステップS103において、CPU11は、学習モデルを使用して表示順を変更するか否かの判定を行う。学習モデルを使用して表示順を変更する場合(ステップS103:YES)、CPU11は、ステップS105に移行する。一方、学習モデルを使用しない場合(ステップS103:NO)、CPU11は、ステップS104に移行する。
ステップS104において、CPU11は、設定情報に定義された表示順で項目毎の画像データ43及び項目毎の認識結果44を表示する。なお、本実施形態では、学習モデルを使用しない場合、設定情報に設定された表示順で表示する形態について説明した。しかし、これに限定されない。学習モデルを使用しない場合、予め定められた表示順で表示する形態としてもよい。例えば、書類に記載されている順番で表示してもよい。
ステップS105において、CPU11は、入力された画像データに適合する学習モデルがあるか否かの判定を行う。入力された画像データに適合する学習モデルがある場合(ステップS105:YES)、CPU11は、ステップS106に移行する。一方、入力された画像データに適合する学習モデルがない場合(ステップS105:NO)、CPU11は、ステップS104に移行する。
ステップS106において、CPU11は、学習モデルを用いて表示順を算出し、算出した表示順を用いて項目毎の画像データ43及び項目毎の認識結果44を表示する。ここで、ユーザは、表示された項目毎の画像データ43及び項目毎の認識結果44の確認訂正処理を行う。
ステップS107において、CPU11は、確認された項目毎の認識結果44の確認順として、ユーザの操作によって、マウスオーバーの状態となった項目毎の認識結果44、及びマウスオーバーの状態となった順番を取得する。
ステップS108において、CPU11は、ユーザによる確認訂正が終了したか否かの判定を行う。確認訂正が終了した場合(ステップS108:YES)、CPU11は、ステップS109に移行する。一方、確認訂正が終了していない場合(ステップS108:NO)、CPU11は、ステップS107に移行する。
ステップS109において、CPU11は、取得した確認順を用いて学習し、学習モデルを作成するか否かの判定を行う。確認順を学習する場合(ステップS109:YES)、CPU11は、ステップS110に移行する。一方、CPU11は、確認順を学習しない場合(ステップS109:NO)、CPU11は、情報処理を終了する。なお、本実施形態では、確認順を学習する有無を予め入力する形態について説明した。しかし、これに限定されない。表示順と、確認順とが異なる場合、確認順を学習モデルに反映するか否かを選択させてもよい。
ステップS110において、CPU11は、取得した確認順を記憶する。
ステップS111において、CPU11は、同一の書類を示す画像データ毎に記憶した確認順を用いて、学習モデルを生成する。なお、本実施形態に係る学習モデルは、同一の書類を示す画像データ毎に学習モデルを生成する形態について、説明した。しかし、これに限定されない。学習モデルは、ユーザ毎に作成してもよいし、ユーザ毎、かつ同一の書類を示す画像データ毎に作成してもよい。
ステップS112において、CPU11は、生成した学習モデル、及び表示順を記憶する。
以上説明したように、本実施形態によれば、認識結果44を確認する確認順を取得し、取得した学習モデルを生成することで表示順が変更される。したがって、書類を確認する作業において、書類に並んでいる順番で項目を表示する場合と比較して、項目を確認する作業の負担が軽減される。
[第2実施形態]
第1実施形態では、確認訂正画面40に表示される項目毎の画像データ43と、項目毎の認識結果44との表示順を変更して表示、及び項目毎の画像データ43と、項目毎の認識結果44とを並列に表示する形態について説明した。本実施形態では、確認訂正画面40に表示される画像データ41の表示を変更する形態について説明する。なお、本実施形態に係る情報処理システム1の構成を示す概略図(図1参照)、情報処理装置3のハードウェア構成を示すブロック図(図2参照)、情報処理装置3の機能的な構成を示すブロック図(図3参照)は、第1実施形態と同様であるため、説明を省略する。また、情報処理装置3が表示する確認訂正画面40の模式図(図4参照)、及び認識結果44の関係性の説明に供する情報処理装置3が表示する確認訂正画面40の模式図(図5参照)は、第1実施形態と同様であるため、説明を省略する。
図7を参照して、確認訂正処理を行う際の確認訂正画面40について説明する。図7は、本実施形態に係る情報処理装置3が表示する確認訂正画面40の一例を示す模式図である。なお、図7における図4に示す確認訂正画面40と同一の構成については、図4と同一の符号を付して、その説明を省略する。
情報処理装置3は、図7に示すように、確認訂正画面40に、取得した画像データ41と、確認訂正表示領域42における項目毎の画像データ43と、項目毎の認識結果44と、取得した画像データ41における未確認領域46と、確認済領域47とを表示する。
未確認領域46は、まだ確認されていない項目毎の認識結果44に対応した画像データ41における領域を縦線の網掛けで示し、確認済領域47は、確認が行われた項目毎の認識結果44に対応した画像データ41における領域を格子状の網掛けで示している。情報処理装置3は、項目毎の認識結果44の確認が行われた場合、項目毎の認識結果44の確認が行われた項目に対応する画像データ41の領域の表示を変更する。例えば、図7に示すように、情報処理装置3は、確認訂正表示領域42において、「児童氏名1」が確認されたと判定した場合、画像データ41における「児童氏名1」に対応する領域の表示を未確認領域46から確認済領域47に変更する。
なお、本実施形態では、未確認領域46を縦線の網掛けで表示し、確認済領域47を格子状の網掛けで表示する形態について説明した。しかし、これに限定されない。未確認領域46、確認済領域47、及びその他の領域において、色を変更して表示してもよいし、未確認領域46、及び確認済領域47の一方を網掛けして表示してもよい。
次に、図8を参照して、本実施形態に係る情報処理プログラムの作用について説明する。図8は、第2実施形態に係る情報処理の一例を示すフローチャートである。CPU11がROM12又はストレージ14から情報処理プログラムを読み出し、実行することによって、図8に示す情報処理が実行される。図8に示す情報処理は、例えば、ユーザによって情報処理プログラムの実行指示が入力された場合、情報処理が実行される。なお、図8における図6に示す情報処理と同一のステップについては、図6と同一の符号を付して、その説明を省略する。
ステップS113において、CPU11は、確認訂正画面40に表示される画像データ41の項目毎の認識結果44に対応する領域に未確認領域46を示す表示をする。
ステップS114において、CPU11は、確認訂正画面40に表示される画像データ41において、マウスオーバーの状態になった項目毎の認識結果44に対応する領域に確認済領域47を示す表示をする。
以上説明したように、本実施形態によれば、確認訂正画面40に表示される画像データ41において、確認が行われた項目に対応する領域の表示を変更することで、表示順を変更した項目の確認作業の進捗状況が確認され、より確認する作業の負担が軽減される。
なお、本実施形態では、確認訂正処理が完了した後に、確認順を学習する形態について説明した。しかし、これに限定されない。確認訂正処理を行っている際に、項目毎の認識結果44を確認する度に確認順を取得して、確認順を学習する形態としてもよい。
その他、上記実施形態で説明した情報処理装置3の構成は、一例であり、主旨を逸脱しない範囲内において状況に応じて変更してもよい。
また、上記実施形態で説明したプログラムの処理の流れも、一例であり、主旨を逸脱しない範囲内において不要なステップを削除したり、新たなステップを追加したり、処理順序を入れ替えたりしてもよい。
なお、上記各実施形態において、プロセッサとは、広義的なプロセッサを指し、例えば CPU( Central Processing Unit)等の汎用的なプロセッサや、例えば GPU(Graphics Processing Unit)、ASIC(Application Specific Integrated Circuit)、FPGA(Field Programmable Gate Array)、及びプログラマブル論理デバイス等の専用のプロセッサを含むものである。
また、上記各実施形態におけるプロセッサの動作は、1つのプロセッサによって成すのみでなく、物理的に離れた位置に存在する複数のプロセッサが協働して成すものであってもよい。また、プロセッサの各動作の順序は上記各実施形態において記載した順序のみに限定されるものではなく、適宜変更してもよい。
また、上記各実施形態では、情報処理のプログラムがストレージ14に予め記憶(インストール)されている態様を説明したが、これに限定されない。プログラムは、CD-ROM(Compact Disc Read Only Memory)、DVD-ROM(Digital Versatile Disc Read Only Memory)、及びUSB(Universal Serial Bus)メモリ等の記録媒体に記録された形態で提供されてもよい。また、プログラムは、ネットワークを介して外部装置からダウンロードされる形態としてもよい。
1 情報処理システム
2 複合機
3 情報処理装置
4 端末
11 CPU
12 ROM
13 RAM
14 ストレージ
15 入力部
16 モニター
17 通信I/F
18 バス
21 表示部
22 取得部
23 制御部
24 受付部
25 記憶部
31 書類設定部
32 画像入力部
33 書類認識処理部
34 確認訂正部
35 データ記憶部
36 操作学習部
40 確認訂正画面
41 画像データ
42 確認訂正表示領域
43 項目毎の画像データ
44 項目毎の認識結果
45 カーソル
46 未確認領域
47 確認済領域

Claims (11)

  1. プロセッサを備え、前記プロセッサは、
    項目に対して予め情報が記載される記載欄が設けられた書類を認識した結果である認識結果を項目毎に表示し、
    表示された前記認識結果が選択されることで確認された順番である確認順を項目毎に取得し、
    取得した前記確認順を用いて、前記認識結果を表示する順番である表示順を変更する制御を行う、
    情報処理装置。
  2. プロセッサを備え、前記プロセッサは、
    項目に対して記載欄が設けられた書類を認識した結果である認識結果を項目毎に表示し、
    表示された前記認識結果を確認した順番である確認順を項目毎に取得し、
    取得した前記確認順を用いて、前記認識結果を表示する順番である表示順を変更する制御を行い、
    前記表示順と、前記確認順とが異なる場合、取得した確認順を前記表示順に反映させるか否かを選択させる、
    情報処理装置。
  3. 前記プロセッサは、前記確認順を前記表示順に反映して、前記認識結果を複数回表示させた結果、各々の前記認識結果の前記表示順が予め定めた回数同一であった場合、各々の前記認識結果の前記表示順を次回以降の前記表示順に反映するか否かを選択させる請求項2に記載の情報処理装置。
  4. 前記プロセッサは、各々の前記認識結果が有する関係性に基づいて、前記認識結果を関連付けて表示する制御を行う請求項1から請求項3のいずれか1項に記載の情報処理装置。
  5. 前記関係性は、各々の前記認識結果が有する従属関係である請求項4に記載の情報処理装置。
  6. 前記プロセッサは、各々の前記認識結果の前記確認順が前後関係を有する場合、前記従属関係として、各々の前記認識結果を関連付ける請求項5に記載の情報処理装置。
  7. 前記プロセッサは、予め定められた順番で表示する方法、及び前記表示順を変更して表示する方法を切り替えて、前記認識結果を表示する請求項1から請求項6のいずれか1項に記載の情報処理装置。
  8. 前記プロセッサは、前記確認順を取得するか否かを切り替えて、前記認識結果を表示する請求項1から請求項7のいずれか1項に記載の情報処理装置。
  9. 前記プロセッサは、前記書類を読み取った画像データを表示し、表示された前記画像データにおいて、確認した前記認識結果に対応した箇所と、未だ確認していない箇所とを区分して表示する請求項1から請求項8のいずれか1項に記載の情報処理装置。
  10. コンピュータに
    項目に対して予め情報が記載される記載欄が設けられた書類を認識した結果である認識結果を項目毎に表示し、
    表示された前記認識結果が選択されることで確認された順番である確認順を項目毎に取得し、
    取得した前記確認順を用いて、前記認識結果を表示する順番である表示順を変更する制御を行う、
    ことを実行させる情報処理プログラム。
  11. コンピュータに、
    項目に対して記載欄が設けられた書類を認識した結果である認識結果を項目毎に表示し、
    表示された前記認識結果を確認した順番である確認順を項目毎に取得し、
    取得した前記確認順を用いて、前記認識結果を表示する順番である表示順を変更する制御を行い、
    前記表示順と、前記確認順とが異なる場合、取得した確認順を前記表示順に反映させるか否かを選択させる、
    ことを実行させる情報処理プログラム。
JP2019158714A 2019-08-30 2019-08-30 情報処理装置、及び情報処理プログラム Active JP7354697B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2019158714A JP7354697B2 (ja) 2019-08-30 2019-08-30 情報処理装置、及び情報処理プログラム
CN202010151590.3A CN112449071A (zh) 2019-08-30 2020-03-06 信息处理装置以及记录媒体
US16/831,246 US11671540B2 (en) 2019-08-30 2020-03-26 Information processing apparatus and non-transitory computer readable medium for changing display order of recognition results based on previous checking order

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019158714A JP7354697B2 (ja) 2019-08-30 2019-08-30 情報処理装置、及び情報処理プログラム

Publications (2)

Publication Number Publication Date
JP2021039428A JP2021039428A (ja) 2021-03-11
JP7354697B2 true JP7354697B2 (ja) 2023-10-03

Family

ID=74680384

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019158714A Active JP7354697B2 (ja) 2019-08-30 2019-08-30 情報処理装置、及び情報処理プログラム

Country Status (3)

Country Link
US (1) US11671540B2 (ja)
JP (1) JP7354697B2 (ja)
CN (1) CN112449071A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7116369B2 (ja) * 2020-12-11 2022-08-10 大日本印刷株式会社 印刷用画像の審査を支援するための情報処理装置、方法、プログラム、及び情報処理システム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008090687A (ja) 2006-10-03 2008-04-17 Pca Corp プログラム及び表示方法
JP2009122722A (ja) 2007-11-09 2009-06-04 Fujitsu Ltd 帳票認識プログラム、帳票認識装置および帳票認識方法
JP2011060185A (ja) 2009-09-14 2011-03-24 Toshiba Corp データエントリシステムおよびデータエントリ方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08335152A (ja) * 1995-06-07 1996-12-17 Canon Inc 文書処理装置
JP2000347777A (ja) 1999-06-08 2000-12-15 Oki Electric Ind Co Ltd データ入力画面の表示方法
EP1398726B1 (en) * 2002-09-11 2008-07-30 Samsung Electronics Co., Ltd. Apparatus and method for recognizing character image from image screen
US20080212901A1 (en) * 2007-03-01 2008-09-04 H.B.P. Of San Diego, Inc. System and Method for Correcting Low Confidence Characters From an OCR Engine With an HTML Web Form
US20100017742A1 (en) * 2008-07-20 2010-01-21 Rhodes Gary J Form input skip-field software tool
US9275029B2 (en) * 2009-12-02 2016-03-01 International Business Machines Corporation Automated form layout based upon usage patterns
US9405426B2 (en) * 2010-03-01 2016-08-02 Salesforce.Com, Inc. Method and system for providing an adaptive input user interface for data entry applications
JP5672953B2 (ja) * 2010-10-26 2015-02-18 株式会社リコー 画像処理装置、画像処理方法及び画像処理プログラム
JP5914442B2 (ja) * 2013-09-30 2016-05-11 株式会社沖データ データ処理装置及び方法、並びに、画像処理装置
CN105630271B (zh) * 2014-10-31 2019-03-01 国际商业机器公司 用于电子表单数据输入的方法和装置
US10607041B2 (en) * 2017-11-07 2020-03-31 Bank Of America Corporation Reinforcement learning based document scanner
US11188837B2 (en) * 2019-02-01 2021-11-30 International Business Machines Corporation Dynamic field entry permutation sequence guidance based on historical data analysis
US11087187B2 (en) * 2019-02-26 2021-08-10 Logistimo India Private Limited System and method for improving recognition of characters

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008090687A (ja) 2006-10-03 2008-04-17 Pca Corp プログラム及び表示方法
JP2009122722A (ja) 2007-11-09 2009-06-04 Fujitsu Ltd 帳票認識プログラム、帳票認識装置および帳票認識方法
JP2011060185A (ja) 2009-09-14 2011-03-24 Toshiba Corp データエントリシステムおよびデータエントリ方法

Also Published As

Publication number Publication date
US20210067641A1 (en) 2021-03-04
JP2021039428A (ja) 2021-03-11
CN112449071A (zh) 2021-03-05
US11671540B2 (en) 2023-06-06

Similar Documents

Publication Publication Date Title
JP4819560B2 (ja) 表示制御装置、画像処理装置、インターフェース画面、表示制御方法
JP4818791B2 (ja) 表示制御装置、画像処理装置、表示制御方法
CN107979709A (zh) 图像处理装置、系统、控制方法和计算机可读介质
KR102090973B1 (ko) 정보 처리장치, 정보 처리방법, 및 기억매체
JP2007279828A (ja) 帳票処理装置、帳票様式作成装置、帳票、帳票処理用のプログラム、帳票様式作成用のプログラム
JP4807999B2 (ja) 画像表示装置、画像表示方法、画像形成装置、画像形成方法、および、それらの方法をコンピュータに実行させるプログラム
CN102694940B (zh) 信息处理装置及其控制方法
JP6500582B2 (ja) 画面表示装置及びプログラム
CN111695568A (zh) 信息处理装置、机器学习装置以及信息处理方法
JP7354697B2 (ja) 情報処理装置、及び情報処理プログラム
JP5589309B2 (ja) 表示制御装置、画像処理装置、及びプログラム
JP2015167001A (ja) 情報処理プログラム、情報処理装置、情報処理システム、情報処理方法、画像処理装置及び画像処理システム
US8947754B2 (en) Image processing device displaying a preview image and image processing method and program displaying a preview image
JPWO2016170691A1 (ja) 入力処理プログラム、入力処理装置、入力処理方法、文字特定プログラム、文字特定装置、及び文字特定方法
JP6680052B2 (ja) 表データ変換方法、プログラム、画像読取装置
JP7375308B2 (ja) 情報処理装置及びプログラム
JP2008092451A (ja) スキャナシステム
CN113449732A (zh) 信息处理装置、图像读取装置、记录介质、信息处理方法
US10404872B2 (en) Multi-function device with selective redaction
JP7508913B2 (ja) 情報処理装置及びプログラム
JP6680203B2 (ja) 編集支援装置及び編集支援方法
JP7404943B2 (ja) 情報処理装置及び情報処理プログラム
JP5528410B2 (ja) ビューワ装置、サーバ装置、表示制御方法、電子コミック編集方法及びプログラム
US20250030808A1 (en) Image processing apparatus, method of controlling the same, and storage medium
JP7581645B2 (ja) 情報処理装置、文字認識システムおよびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220721

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230620

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230627

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230809

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230822

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230904

R150 Certificate of patent or registration of utility model

Ref document number: 7354697

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150