JP4347675B2 - 帳票ocrプログラム、方法及び装置 - Google Patents
帳票ocrプログラム、方法及び装置 Download PDFInfo
- Publication number
- JP4347675B2 JP4347675B2 JP2003407836A JP2003407836A JP4347675B2 JP 4347675 B2 JP4347675 B2 JP 4347675B2 JP 2003407836 A JP2003407836 A JP 2003407836A JP 2003407836 A JP2003407836 A JP 2003407836A JP 4347675 B2 JP4347675 B2 JP 4347675B2
- Authority
- JP
- Japan
- Prior art keywords
- item name
- item
- frame
- ocr
- recognized
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 90
- 235000016496 Panda oleosa Nutrition 0.000 description 3
- 240000000220 Panda oleosa Species 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000013500 data storage Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000003936 working memory Effects 0.000 description 1
Images
Landscapes
- Character Input (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Description
11 メインユニット
16 帳票
21 CPU
22 RAM
27 HDD
35 帳票イメージデータ
36 全面OCR結果ファイル
37 項目定義ファイル
38 項目名枠特定データファイル
39 再OCR項目定義ファイル
41 再OCRエリアデータファイル
42 部分OCR結果ファイル
Claims (12)
- 複数の項目に関して、その記入欄と予めプリントされた項目名とが配列され、前記記入欄と項目名とがそれぞれ罫線によって区画された帳票を読み取った帳票イメージから、その記入欄内の文字を認識する帳票OCR処理をコンピュータに実行させる帳票OCRプログラムにおいて、
予め項目名を定義した項目定義データから所望の第1項目名を読み出し、読み出された第1項目名と、前記帳票イメージから認識した認識文字とを照合することにより、前記第1項目名を取り囲む前記第1項目名枠を特定する項目名枠特定処理ステップと、
この後、特定された項目名枠からそれに対応する記入欄の位置を特定する記入欄特定処理ステップとからなり、
前記項目名枠特定処理ステップは、前記第1項目名と一致する認識文字が無い場合に、予め前記項目定義データとして定義された前記第1項目名の近傍の項目名との相対位置情報を参照して、前記第1項目名の近傍の項目名である第2項目名と一致する認識文字を調べることにより第2項目名の第2項目名枠を特定し、前記相対位置情報に基づいて、特定された第2項目名枠の位置から前記第1項目名枠を推定するサブステップを含むことを特徴とする帳票OCRプログラム。 - 前記第1項目名の推定に使用される前記第2項目名の範囲は、帳票の全面を分割した複数のエリアのうち特定のエリアに含まれる項目名に限定されることを特徴とする請求項1記載の帳票OCRプログラム。
- 前記各エリアは、帳票の筆記方向に沿って分割されることを特徴とする請求項2記載の帳票OCRプログラム。
- 前記エリアは、各エリアに含まれる項目名によって論理的に定義されることを特徴とする請求項2又は3記載の帳票OCRプログラム。
- 複数の項目に関して、その記入欄と予めプリントされた項目名とが配列され、前記記入欄と項目名とがそれぞれ罫線によって区画された帳票を読み取った帳票イメージから、その記入欄内の文字を認識する帳票OCR方法において、
予め項目名を定義した項目定義データから所望の第1項目名を読み出し、読み出された第1項目名と、前記帳票イメージから認識した認識文字とを照合することにより、前記第1項目名を取り囲む前記第1項目名枠を特定する項目名枠特定処理ステップと、
この後、特定された項目名枠からそれに対応する記入欄の位置を特定する記入欄特定処理ステップとからなり、
前記項目名枠特定処理ステップは、前記第1項目名と一致する認識文字が無い場合に、予め前記項目定義データとして定義された前記第1項目名の近傍の項目名との相対位置情報を参照して、前記第1項目名の近傍の項目名である第2項目名と一致する認識文字を調べることにより第2項目名の第2項目名枠を特定し、前記相対位置情報に基づいて、特定された第2項目名枠の位置から前記第1項目名枠を推定するサブステップを含むことを特徴とする帳票OCR方法。 - 前記第1項目名の推定に使用される前記第2項目名の範囲は、帳票の全面を分割した複数のエリアのうち特定のエリアに含まれる項目名に限定されることを特徴とする請求項5記載の帳票OCR方法。
- 前記各エリアは、帳票の筆記方向に沿って分割されることを特徴とする請求項6記載の帳票OCR方法。
- 前記エリアは、各エリアに含まれる項目名によって論理的に定義されることを特徴とする請求項6又は7記載の帳票OCR方法。
- 複数の項目に関して、その記入欄と予めプリントされた項目名とが配列され、前記記入欄と項目名とがそれぞれ罫線によって区画された帳票を読み取った帳票イメージから、その記入欄内の文字を認識する帳票OCR装置において、
予め項目名を定義した項目定義データから所望の第1項目名を読み出し、読み出された第1項目名と、前記帳票イメージから認識した認識文字とを照合することにより、前記第1項目名を取り囲む前記第1項目名枠を特定する項目名枠特定処理部と、
前記項目名枠特定処理部によって特定された項目名枠からそれに対応する記入欄の位置を特定する記入欄特定処理部とからなり、
前記項目名枠特定処理部は、前記第1項目名と一致する認識文字が無い場合に、予め前記項目定義データとして定義された前記第1項目名の近傍の項目名との相対位置情報を参照して、前記第1項目名の近傍の項目名である第2項目名と一致する認識文字を調べることにより第2項目名の第2項目名枠を特定し、前記相対位置情報に基づいて、特定された第2項目名枠の位置から前記第1項目名枠を推定することを特徴とする帳票OCR装置。 - 前記第1項目名の推定に使用される前記第2項目名の範囲は、帳票の全面を分割した複数のエリアのうち特定のエリアに含まれる項目名に限定されることを特徴とする請求項9記載の帳票OCR装置。
- 前記各エリアは、帳票の筆記方向に沿って分割されることを特徴とする請求項10記載の帳票OCR装置。
- 前記エリアは、各エリアに含まれる項目名によって論理的に定義されることを特徴とする請求項10又は11記載の帳票OCR装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003407836A JP4347675B2 (ja) | 2003-12-05 | 2003-12-05 | 帳票ocrプログラム、方法及び装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003407836A JP4347675B2 (ja) | 2003-12-05 | 2003-12-05 | 帳票ocrプログラム、方法及び装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005165978A JP2005165978A (ja) | 2005-06-23 |
JP4347675B2 true JP4347675B2 (ja) | 2009-10-21 |
Family
ID=34729760
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003407836A Expired - Fee Related JP4347675B2 (ja) | 2003-12-05 | 2003-12-05 | 帳票ocrプログラム、方法及び装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4347675B2 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4754889B2 (ja) * | 2005-07-01 | 2011-08-24 | 株式会社日立エンジニアリング・アンド・サービス | 文字列抽出方法および装置 |
JP5810568B2 (ja) * | 2011-03-17 | 2015-11-11 | 富士通株式会社 | 情報処理装置、プログラム、およびデータの抽出方法 |
JP5003837B2 (ja) * | 2011-08-26 | 2012-08-15 | 富士ゼロックス株式会社 | 画像処理装置及びプログラム |
JP6247103B2 (ja) * | 2014-01-16 | 2017-12-13 | グローリー株式会社 | 帳票項目認識方法、帳票項目認識装置及び帳票項目認識プログラム |
JP6303531B2 (ja) * | 2014-01-22 | 2018-04-04 | 富士ゼロックス株式会社 | 画像処理装置及び画像処理プログラム |
CN112528886B (zh) * | 2020-12-16 | 2024-09-17 | 中国平安财产保险股份有限公司 | Ocr信息检测识别方法、装置、终端及存储介质 |
JP7452809B1 (ja) | 2023-08-09 | 2024-03-19 | ファーストアカウンティング株式会社 | 情報処理装置、情報処理方法及びプログラム |
-
2003
- 2003-12-05 JP JP2003407836A patent/JP4347675B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2005165978A (ja) | 2005-06-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4347677B2 (ja) | 帳票ocrプログラム、方法及び装置 | |
US8467614B2 (en) | Method for processing optical character recognition (OCR) data, wherein the output comprises visually impaired character images | |
US6782144B2 (en) | Document scanner, system and method | |
US9613267B2 (en) | Method and system of extracting label:value data from a document | |
JP4996940B2 (ja) | 帳票認識装置およびそのプログラム | |
KR100412317B1 (ko) | 문자인식/수정방법및장치 | |
US8208737B1 (en) | Methods and systems for identifying captions in media material | |
CN102289667A (zh) | 对经历光学字符识别(ocr)过程的文本文档中出现的错误的用户纠正 | |
WO2007117334A2 (en) | Document analysis system for integration of paper records into a searchable electronic database | |
US11475688B2 (en) | Information processing apparatus and information processing method for extracting information from document image | |
JP2008145611A (ja) | 情報処理装置、プログラム | |
JP2008021068A (ja) | 帳票認識装置及び帳票認識プログラム | |
CN112084748A (zh) | 一种文本比对方法 | |
CN113806472A (zh) | 一种对文字图片和图像型扫描件实现全文检索的方法及设备 | |
JP2012181653A (ja) | 採点方法、採点方法のプログラム及び採点システム | |
JP4347675B2 (ja) | 帳票ocrプログラム、方法及び装置 | |
KR20180126352A (ko) | 이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치 | |
JP2009093305A (ja) | 帳票認識装置 | |
JP4983464B2 (ja) | 帳票画像処理装置及び帳票画像処理プログラム | |
US7133556B1 (en) | Character recognition device and method for detecting erroneously read characters, and computer readable medium to implement character recognition | |
JP3435374B2 (ja) | 文字読取装置および文字認識方法 | |
JPH08320914A (ja) | 表認識方法および装置 | |
JP5134383B2 (ja) | Ocr装置、証跡管理装置及び証跡管理システム | |
JP6007720B2 (ja) | 情報処理装置及び情報処理プログラム | |
WO2007070010A1 (en) | Improvements in electronic document analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060413 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20061220 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090128 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090323 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090422 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090608 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090708 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090716 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120724 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120724 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130724 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |