JP6917688B2 - 帳票読取装置、帳票読取方法、プログラム、および帳票読取システム - Google Patents
帳票読取装置、帳票読取方法、プログラム、および帳票読取システム Download PDFInfo
- Publication number
- JP6917688B2 JP6917688B2 JP2016172284A JP2016172284A JP6917688B2 JP 6917688 B2 JP6917688 B2 JP 6917688B2 JP 2016172284 A JP2016172284 A JP 2016172284A JP 2016172284 A JP2016172284 A JP 2016172284A JP 6917688 B2 JP6917688 B2 JP 6917688B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- unit
- data
- item name
- coordinate range
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Character Input (AREA)
Description
定型帳票は、あらかじめ帳票読取システムに帳票の定義情報が登録された帳票であり、非定型帳票は、あらかじめ帳票読取システムに帳票の定義情報が登録されていない帳票である。
なお、クリーンデータとは、オペレータによる確認、確定が行われ、文字認識結果の誤りを訂正された後のエントリ情報のことである。
これに対して、健康診断結果通知書は、例えば、医療機関毎に書式が異なる非定型な書類であり、かつ複数書類の読み取りが必要となることが多い。したがって、事前に帳票の定義情報を登録することが困難である。すなわち、帳票の形式を事前に入手することは困難である。また、多数の定義情報を事前に登録しておくことになるため多大な時間と労力がかかる。このように、複数の非定型の帳票から適正なエントリ情報を作成するのは容易ではない。
携帯端末10は、例えば、タブレット端末であり、画像取得部としてのカメラ部11、タッチパネル12、帳票読取処理部13、メモリ14、通信インターフェース15(以下「通信I/F15」と称す)などを備える。
帳票読取処理部13は、カメラ部11による帳票読み取り処理を制御するものであり、カメラ部11に読み取られる帳票の画像の適否を判定し、画像が不適な場合にタッチパネル12上に警告表示を行う。
帳票読取処理部13は、この警告後、画像が不適な状態が解消されるかを確認する。画像が不適な状態が解消されたら、オペレータの操作を待つこと無く、自動的に撮影できる。
白飛びとは、画像の少なくとも一部の領域が、カメラ部11の階調の上限を超えていることをいう。この一部の領域内は均一な階調(上限)となり、その領域内に文字、イメージが有ったとしても、後の文字認識等の処理が行えなくなる。
白飛びは、画像上に階調上限の連続領域が存在するか否かによって検出できる。
サイズ不良は、画像全体に占める帳票の面積の割合を算出し、この割合が適正範囲から外れているか否かによって検出できる。例えば、画像から帳票の輪郭を抽出することによって、帳票の面積を求めることができる。
傾きは、画像全体に対する、帳票の傾きを算出し、この値が適正範囲から外れているか否かによって検出できる。例えば、画像から帳票の輪郭を抽出することによって、帳票の傾きを求めることができる。帳票読取処理部13は、傾き補正処理が困難な場合に、オペレータに対して警告を発することとできる。
手振れは、カメラ部11で撮像している帳票の画像が時間的に変化するか否かによって検出できる。
通信I/F15は、ネットワークNETを通じて、データサーバ30aに帳票の画像を送信する。
外部サーバ50は、データサーバ30aからエントリ情報を受け取り、例えば、保険の査定に利用する。
図4は、エントリ項目DB32aに記憶されるエントリ項目の一例を表す。ここでは、健康診断のエントリ項目として、身長、体重、最大血圧、最小血圧等が示される。
ターゲット文字列は、探索部31bがエントリ項目を探索するために用いられる。すなわち、ターゲット文字列のいずれかに一致する文字列は、エントリ項目に対応すると判断できる。
なお、このOCRの要、不要については、設定により適宜に変更できる。
通信I/F35aは、処理サーバ30bと通信する。
先に文字イメージの関連付けについて、説明する。
関連付け部32bは、帳票の画面への入力により、エントリ項目に対応する読取り対象が指定された場合(データの選択)、探索部31bによって探索された項目名(ターゲット文字列)を選択されたデータと関連付ける。すなわち、関連付け部32bは、選択されたデータに対応する領域の画像を切り取り、その座標を特定し、切り取られた画像、その座標、対応するエントリ項目を関連付けられた情報としてメモリ等に記憶する。
データイメージの場合、一般にデータイメージ(データ)およびエントリ項目を選択することで、関連付けがなされる。
すなわち、関連付け部32bは、項目名および帳票の画像の範囲を選択する情報に基づいて、前記選択範囲の画像を切り取り、前記選択された項目名と関連付け、メモリに記憶する。
図5〜図7は、マーキング用画面の一例を表す。
マーキング用画面は、帳票画像71を表示する欄と、エントリ項目指定欄72とを有する。エントリ項目指定欄72は、エントリ項目を指定するために用いられる。
マーキング用画面を用いて、複数のデータを効率的に選択できる。この詳細は後述する。
データ確定用画面は、エントリ項目欄81、文字イメージ欄82,認識文字欄83を有する。
エントリ項目欄81に、エントリ項目の名称が表される。
文字イメージ欄82は、帳票の画像から切り出されたイメージを表す欄であり、認識文字欄83はイメージを文字認識した結果の文字を表す欄である。
文字イメージ欄82と認識文字欄83を見比べることで、文字認識の誤りを容易に見つけることができる。文字認識に誤りがあった場合、その認識文字欄83を指定してキーボード等から文字を入力することで、容易に誤りを訂正できる。
データイメージ欄84は、帳票の画像から切り出されたX線写真等のイメージを表す欄である。
また、移動する線の方向に応じて、異なる入力とすることができる。
例えば、画面上を所定の基準方向(例えば、縦方向)に滑らせることで、複数のデータ(複数の文字列)を選択できる。
また、画面上を所定の基準方向と垂直な方向(例えば、横方向)に滑らせることで、1のデータ(1の文字列)の範囲を指定できる。
さらに、画面上を所定の基準方向と斜めの方向に滑らせることで、画像(イメージ)の範囲を指定できる。この場合、斜めの線の始点、終点を対角線とする矩形の領域が選択される。
ペンの先端の形状に限らず、例えば、選択モード、解除モードを指定する入力によって、文字列やイメージを適宜に選択したり、選択を解除したりすることが可能となる。
入力部42cは、結果の欄を訂正する情報を受け取る第2の入力部として機能する。
図9、帳票読取システム1の全体的な動作(概要動作)を表す。
オペレータが携帯端末10を操作することによって、カメラ部11が帳票を撮影し、メモリ14に記憶される。
その後、メモリ14に記憶された帳票の画像は、ネットワークNETを介して、通信I/F15からデータサーバ30aに送られ、帳票画像DB31aに記憶される。
マーキングおよび文字認識は、基本的にはマーキング用クライアント40bからの入力によって、処理サーバ30bで実行される。
マーキング用クライアント40bからの入力によって、処理サーバ30bの表示制御部35bは、帳票画像DB31aに蓄積されている一つ以上の帳票画像71を読み込み、タッチパネル41bに表示する。
一般に、帳票画像71のサムネイルが表示され、その中から所望のサムネイルが選択される。
指定されたサムネイルに対応する帳票画像71を含むマーキング用画面がタッチパネル41b上に表示される(図5〜図7参照)。
マーキング用画面は、帳票画像71、エントリ項目指定欄72を有し、帳票画像71上のエントリ項目に対応する文字列(ターゲット文字列、図5では「身長」、「体重」)がハイライト表示される。
このとき、関連する一連の帳票の全領域に対して、ターゲット文字列の探索、その座標の特定が行われる。
帳票画像71上で複数文字列の座標範囲(複数のOCR箇所)が指定される(マーキング)。
例えば、図5の「今回の結果」から「30.7」に至る複数の文字列を入力ペンで縦になぞる。この結果、「今回の結果」を始点とし「30.7」を終点とする座標範囲が指定される。
指定された座標範囲がエントリ項目と対応するか否かが確認される。この確認結果は、タッチパネル41b上でも表示される。
例えば、図12に示すようにハイライト表示されたターゲット文字列(ここでは、「身長」、「体重」)に対応する箇所の文字列(ここでは、「173.0」,「93.2」)がハイライト表示され、かつこの両者が関連付けられていることが線分で表される。
なお、この関連付け表示は、線分に限らず、両者に関連付けがあることを連想される表示であれば、適宜に利用できる。
a)関連付け部32bは指定した座標範囲に対応するエントリ項目(ターゲット文字列)があるかを判定する(ステップS31)。
指定した座標範囲と対応する位置(例えば、指定した座標範囲の左側)にハイライトされたターゲット文字列があるか否かが判定される。
なお、エントリ項目の一部(胸部X線、心電図)は、図4に示すようにOCR不要であるため、これらに対応する座標範囲が指定されても、この判定対象からは除外される。
指定した座標範囲全体を処理するまで(残りの文字列がなくなるまで)、以上が繰り返され(ステップS34)、エントリ項目とこれに対応するOCR対象の組み合わせが定まる。
文字認識部33bは、文字DB33aを用いて切り出された文字画像を文字認識する。関連付け部32bは、文字認識の結果をエントリ項目と対応付けてメモリ等に記憶させる。
エントリ項目には、イメージのみを必要とし、文字認識を必要としないものがある。このような対象には、帳票画像71上のイメージを指定し、エントリ項目と関連付けて記憶される。
例えば、帳票画像71上を斜めに入力ペンを走らせることで、イメージの範囲を指定する。
この前後に、エントリ項目指定欄72上のエントリ項目を指定することで、入力イメージ、エントリ項目の指定、関連付けを行える。
データ確定用クライアント40cにおいて、作成されたエントリ情報を確認・確定できる。
(1)データ確定画面の表示(ステップS18)
データ確定用クライアント40cの表示部41cにデータ確定用画面が表示される。
(2)OCR結果の確定(ステップS19)
オペレータは、文字イメージ欄82と認識文字欄83を見比べることで、文字認識の誤りを容易に見つけることができる。
文字認識に誤りがあった場合、その認識文字欄83を指定してキーボード等から入力することで、容易に誤りを訂正できる。
このように、対応するデータの文字列が間違って選択されている場合、次のようにして訂正できる。
データの文字列の選択を解除する。例えば、タッチパネル41bの「前回」の検査結果の欄上をペンの他端(選択解除側)で縦方向になぞる。この結果、図6に示すようなターゲット文字列のみがハイライト表示された状態となる。
正しい文字列の範囲を指定する。例えば、図6の「前回」の検査結果の欄をペンの先端で縦方向になぞる。
この結果、図14に示すように、ターゲット文字列および対応するデータの文字列の双方がハイライト表示された状態となり、OCR処理して、エントリ情報を作成できる。
例えば、ペンを画像上の横方向に滑らせることで、1のデータ(1の文字列)の範囲を指定できる。そして、エントリ項目指定欄72をタッチすることで、エントリ項目と文字列の対応付けを行い、OCR処理して、エントリ情報を作成しできる。
すなわち、帳票画像上からエントリ項目に対応するターゲット文字列が自動的に探索されるため、エントリ項目を目視で探し、選択する必要がなくなる。そして、座標範囲を指定するだけで、その範囲内の文字イメージが切り出され、エントリ項目と自動的に関連付けられる。
10 携帯端末
11 カメラ部
12 タッチパネル
13 帳票読取処理部
14 メモリ
15 通信I/F
20 画像読取装置
30a データサーバ
31a 帳票画像DB
32a エントリ項目DB
33a 文字DB
34a エントリ情報DB
35a 通信I/F
30b 処理サーバ
31b 探索部
32b 関連付け部
33b 文字認識部
34b エントリ情報作成部
35b 表示制御部
36b 通信I/F
40a エントリ用クライアント
41a 表示部
42a 入力部
43a 通信I/F
40b マーキング用クライアント
41b タッチパネル
42b 入力部
43b 通信I/F
40c データ確定用クライアント
41c 表示部
42c 入力部
43c 通信I/F
50 外部サーバ
71 帳票画像
72 エントリ項目指定欄
81 エントリ項目欄
82 文字イメージ欄
83 認識文字欄
84 データイメージ欄
Claims (18)
- 項目名と、この項目名に対応するデータと、を含む帳票の画像を記憶する記憶部と、
前記帳票の画像から所定の項目名を探索する探索部と、
前記帳票の画像および前記探索された項目名を表示する表示制御部と、
前記表示された前記帳票の画像上のデータの座標範囲を選択する情報を受け取る入力部と、
前記選択されたデータの座標範囲と前記探索された項目名を関連付ける関連付け部と、
前記関連付けられたデータの座標範囲を文字認識する文字認識部と、
を具備する帳票読取装置。 - 前記入力部が、複数のデータの座標範囲を選択する情報を受け取る
請求項1に記載の帳票読取装置。 - 前記複数のデータの座標範囲の選択が、前記画像の所定の基準方向に沿った入力である、
請求項2に記載の帳票読取装置。 - 前複数のデータの座標範囲を選択する情報は、
前記帳票の画像上の少なくとも2点を指定する情報である
請求項2または3に記載の帳票読取装置。 - 前記関連付け部が、前記選択されたデータの画像を切り取って、前記探索された項目名と関連付け、
前記文字認識部が、前記切り取られた画像を文字認識する
請求項1に記載の帳票読取装置。 - 前記関連付け部が、前記選択されたデータの座標範囲と前記探索された項目名とが対応することを確認し、対応することが確認されたデータの座標範囲と項目名を関連付ける
請求項1に記載の帳票読取装置。 - 前記関連付け部が、前記選択されたデータの座標範囲と前記探索された項目名それぞれの画像上の座標に基づいて、対応を確認する
請求項6に記載の帳票読取装置。 - 前記入力部が、項目名および前記帳票の画像の範囲を選択する情報を受け取り、
前記関連付け部が、前記選択範囲の画像を切り取り、前記選択された項目名と関連付ける
請求項1記載の帳票読取装置。 - 前記画像の範囲の選択が、前記所定の基準方向に対して斜めの方向に沿った入力である、
請求項8記載の帳票読取装置。 - 前記表示制御部が、前記探索された項目名をハイライトして前記帳票の画像を表示させる
請求項1記載の帳票読取装置。 - 前記表示制御部が、前記関連付けられた項目名およびデータをハイライトして前記帳票の画像を表示させる
請求項10に記載の帳票読取装置。 - 前記入力部が、前記帳票の画像上の項目名の選択を解除する情報を受け取り、
前記表示制御部が、前記項目名のハイライトを解除する
請求項10または11に記載の帳票読取装置。 - 前記表示制御部に制御されて画像を表示する表示部をさらに具備し、
前記入力部が、前記表示部上の座標を連続して入力可能なタッチ入力機構である
請求項1記載の帳票読取装置。 - 前記複数の所定の項目名の欄と、前記選択されたデータの欄と、前記選択されたデータを文字認識した結果の欄とを有する画像を表示させる第2の表示制御部と、
前記結果の欄を訂正する情報を受け取る第2の入力部と、をさらに具備し、
前記第2の表示制御部が、前記結果の欄に訂正された情報を表示させる
請求項1記載の帳票読取装置。 - 前記帳票の画像を光学的に読み取る読み取り部と、
前記読み取る帳票の画像の白飛び、サイズ不良、傾き、手振れの少なくとも何れかを検出する検出部と、
をさらに具備する請求項1記載の帳票読取装置。 - 項目名と、この項目名に対応するデータと、を含む帳票の画像を記憶するステップと、
前記帳票の画像から所定の項目名を探索するステップと、
前記帳票の画像および前記探索された項目名を表示するステップと、
前記表示された前記帳票の画像上のデータの座標範囲を選択する情報を受け取るステップと、
前記選択されたデータの座標範囲と前記探索された項目名を関連付けるステップと、
前記関連付けられたデータの座標範囲を文字認識するステップと、
を具備する帳票読取方法。 - コンピュータを、
項目名と、この項目名に対応するデータと、を含む帳票の画像を記憶する記憶部と、
前記帳票の画像から所定の項目名を探索する探索部と、
前記帳票の画像および前記探索された項目名を表示する表示制御部と、
前記表示された前記帳票の画像上のデータの座標範囲を選択する情報を受け取る入力部と、
前記選択されたデータの座標範囲と前記探索された項目名を関連付ける関連付け部と、
前記関連付けられたデータの座標範囲を文字認識する文字認識部と、
として機能させるプログラム。 - 端末装置と、文字認識装置とを備える帳票読取システムであって、
前記端末装置は、
項目名と、この項目名に対応するデータと、を含む帳票の画像を光学的に読み取る読み取り部と、
前記読み取られた帳票の画像の白飛び、サイズ不良、傾き、手振れの少なくとも何れかを検出する検出部と、
前記読み取った帳票の画像を前記文字認識装置に送信する送信部と、を備え、
前記文字認識装置は、
前記読み取られた帳票の画像を受信する受信部と、
前記帳票の画像から所定の項目名を探索する探索部と、
前記帳票の画像および前記探索された項目名を表示する表示制御部と、
前記表示された前記帳票の画像上のデータの座標範囲を選択する情報を受け取る入力部と、
前記選択されたデータの座標範囲と前記探索された項目名を関連付ける関連付け部と、
前記関連付けられたデータの座標範囲を文字認識する文字認識部と、を備える
帳票読取システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016172284A JP6917688B2 (ja) | 2016-09-02 | 2016-09-02 | 帳票読取装置、帳票読取方法、プログラム、および帳票読取システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016172284A JP6917688B2 (ja) | 2016-09-02 | 2016-09-02 | 帳票読取装置、帳票読取方法、プログラム、および帳票読取システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018037036A JP2018037036A (ja) | 2018-03-08 |
JP6917688B2 true JP6917688B2 (ja) | 2021-08-11 |
Family
ID=61567471
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016172284A Active JP6917688B2 (ja) | 2016-09-02 | 2016-09-02 | 帳票読取装置、帳票読取方法、プログラム、および帳票読取システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6917688B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6899603B1 (ja) * | 2020-05-15 | 2021-07-07 | 株式会社ダブルスタンダード | 情報処理装置、情報処理方法及び情報処理プログラム |
JP2022011034A (ja) | 2020-06-29 | 2022-01-17 | キヤノン株式会社 | データ入力支援装置、データ入力支援方法及びプログラム |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10240960A (ja) * | 1997-02-27 | 1998-09-11 | Daitetsuku:Kk | 図形選択方法 |
JP2007233913A (ja) * | 2006-03-03 | 2007-09-13 | Fuji Xerox Co Ltd | 画像処理装置及びプログラム |
JP2013196479A (ja) * | 2012-03-21 | 2013-09-30 | Toshiba Corp | 情報処理システム、情報処理プログラム、情報処理方法 |
US9317764B2 (en) * | 2012-12-13 | 2016-04-19 | Qualcomm Incorporated | Text image quality based feedback for improving OCR |
JP5959460B2 (ja) * | 2013-03-22 | 2016-08-02 | 株式会社エヌ・ティ・ティ・データ | データ処理装置、データ処理方法及びプログラム |
JP6109688B2 (ja) * | 2013-09-06 | 2017-04-05 | 株式会社東芝 | 帳票読取装置およびプログラム |
JP6230878B2 (ja) * | 2013-11-06 | 2017-11-15 | 株式会社東芝 | 帳票読取装置、プログラムおよび帳票読取システム |
-
2016
- 2016-09-02 JP JP2016172284A patent/JP6917688B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018037036A (ja) | 2018-03-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230005285A1 (en) | Multi-page document recognition in document capture | |
US20150205777A1 (en) | Automated form fill-in via form retrieval | |
US9916627B1 (en) | Methods systems and articles of manufacture for providing tax document guidance during preparation of electronic tax return | |
US20150169944A1 (en) | Image evaluation apparatus, image evaluation method, and non-transitory computer readable medium | |
US10084936B2 (en) | Display system including an image forming apparatus and a display apparatus | |
JP6917688B2 (ja) | 帳票読取装置、帳票読取方法、プログラム、および帳票読取システム | |
JP6230878B2 (ja) | 帳票読取装置、プログラムおよび帳票読取システム | |
US10839502B2 (en) | Photography session assistant | |
JPH0991410A (ja) | パノラマ画像合成システム | |
JP2017199288A (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP4474231B2 (ja) | 文書リンク情報取得システム | |
JP2016200899A (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP5115350B2 (ja) | 帳票イメージファイリングシステム | |
US11163992B2 (en) | Information processing apparatus and non-transitory computer readable medium | |
JP2006277001A (ja) | 入力イメージ表示方法および入力イメージ表示プログラム | |
JP2017097859A (ja) | 情報処理装置と、その処理方法及びプログラム | |
JP2019179461A (ja) | 手帳管理装置、手帳管理プログラム及び手帳管理方法 | |
JP6582954B2 (ja) | 書画カメラ装置、切り抜き支援方法及びプログラム | |
US11914654B2 (en) | Document management apparatus, document management system, and non-transitory computer readable medium storing program | |
JP2017220266A (ja) | 帳票読取装置、プログラムおよび帳票読取方法 | |
US20210287003A1 (en) | Information processing apparatus and non-transitory computer readable medium | |
JP6697829B2 (ja) | モバイル端末、画像処理方法、および、プログラム | |
JP6188342B2 (ja) | 携帯型表示装置 | |
JP6350104B2 (ja) | 電子カルテシステムへの登録画像候補の抽出プログラム、抽出装置及び抽出方法 | |
JP2016126763A (ja) | 情報処理システムと、その処理方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20170914 Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20170914 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20170914 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190802 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200904 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201020 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20201216 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210219 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210622 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210720 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6917688 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |