JP4461769B2 - 文書検索・閲覧手法及び文書検索・閲覧装置 - Google Patents
文書検索・閲覧手法及び文書検索・閲覧装置 Download PDFInfo
- Publication number
- JP4461769B2 JP4461769B2 JP2003368304A JP2003368304A JP4461769B2 JP 4461769 B2 JP4461769 B2 JP 4461769B2 JP 2003368304 A JP2003368304 A JP 2003368304A JP 2003368304 A JP2003368304 A JP 2003368304A JP 4461769 B2 JP4461769 B2 JP 4461769B2
- Authority
- JP
- Japan
- Prior art keywords
- document
- ocr
- data
- document image
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 65
- 238000012545 processing Methods 0.000 claims description 99
- 238000004458 analytical method Methods 0.000 claims description 36
- 230000008569 process Effects 0.000 claims description 27
- 238000000547 structure data Methods 0.000 claims description 25
- 238000003860 storage Methods 0.000 claims description 13
- 238000004364 calculation method Methods 0.000 claims description 3
- 230000008859 change Effects 0.000 claims description 3
- 238000012015 optical character recognition Methods 0.000 description 124
- 238000000605 extraction Methods 0.000 description 25
- 230000006870 function Effects 0.000 description 15
- 230000000694 effects Effects 0.000 description 10
- 238000007689 inspection Methods 0.000 description 10
- 208000027418 Wounds and injury Diseases 0.000 description 9
- 238000004891 communication Methods 0.000 description 9
- 230000006378 damage Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 238000007796 conventional method Methods 0.000 description 6
- 208000014674 injury Diseases 0.000 description 6
- 230000002411 adverse Effects 0.000 description 4
- 238000012937 correction Methods 0.000 description 4
- 201000010099 disease Diseases 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000004040 coloring Methods 0.000 description 3
- 230000000877 morphologic effect Effects 0.000 description 3
- 239000003086 colorant Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000010422 painting Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Landscapes
- Character Discrimination (AREA)
- Character Input (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
図9について説明する。図9は、本特許で提案する手法を用いた文書処理の閲覧システムの一画面構成例を示したものである。ここでは、レセプト文書の閲覧システムを例としている。まず始めに、紙レセプトをOCRで読取り、文書画像とOCR付加データを出力する。このシステムでは文書画像の全面表示と、部分表示の切り替えが可能となっており、部分表示を行う場合は、OCR付加データ中の文書構造データを使って当該欄の座標データを取得し、その部分領域を表示する。0901は1枚の文書画像を表示したブロックになる。0902には表示している文書画像の名前、0903にはレセプトの傷病名欄、0909にはレセプトの摘要欄が表示されている。一般に文書点検では文書画像の全面を表示する必要は無く、点検に必要な領域に限って、複数文書を並べて表示することで、点検の効率化を図ることができる。この他にもOCR付加データ中の文書構造データを用いることにより、PDA等の携帯情報端末機器のような狭い画面上への表示に適合するよう文書配置構造を修正することが考えられる。例えば、ニ段組のような形態の文書であれば、各段ごとに文書を細かく分割し、これを縦に並べて配置して、上下スクロールのみを使った閲覧ができるようにするといった機能が実現できる。あるいは、文書処理業務をサポートする上で、マウスカーソルで欄の中をクリックすると、当該欄に応じたヘルプや業務ノウハウが表示されるなどの機能が実現できる。
0201…画像入力部,0202…文書構造解析部,0203…文字行抽出部,0204…文字列仮説作成部,0205…文字列表記解析部,0206…文字列仮説/テキスト選択部,0207…テキスト出力部,0208…文字列仮説出力部,0209…データ登録部,0210…文書処理部
0301…入力データ群,0302…データ読込部,0303…擬似カラー処理部,0304…データベース登録部,0305…付加情報データベース,0306…画像情報埋込部,0307…付加情報付き文書画像ファイル,0308…文書処理部
0501…処理対象とする文書画像の例
0601…文書構造解析の結果(傷病名欄),0602…文書構造解析の結果(診療日欄),0603…文書構造解析の結果(摘要欄),0604…文書構造解析の結果(診療日数欄),0605…文書構造解析の結果(点数欄),0606…文書構造解析の結果(行抽出),0607…行抽出の結果1(印刷活字行の例),0608…行抽出の結果2(手書文字行の例)
0801…文字列仮説上の文字パタン,0802…文字列仮説上のパタン境界,0803…文字列仮説上の文字識別結果,0804…文字列仮説上の文字識別類似度,0805…文字列仮説上から検索された単語
0901…部分縦覧表示された文書画像の部分領域群,0902…部分縦覧表示されている文書画像の名前,0903…部分縦覧表示されている文書画像の傷病名欄,0904…部分縦覧表示されている文書画像の摘要欄,1001…文書画像中から検索を行うキーワードのリスト,1002…文書画像中に見つかったキーワード(下線で表示)
1101…文書画像の検索ルールのリスト,1102…文書画像中から抽出された重要キーワードのリスト,1103…指定ルールに条件が一致した文書画像のリスト,1104…文書画像中で検索ルールが一致した箇所,1105…検索ルールに適合した重要キーワード(下線で表示)
1401…文書構造解析の結果得られた傷病名欄の位置,1402…文書構造解析の結果得られた摘要欄の位置,1403…傷病名欄を強調表示した結果,1404…摘要欄を強調表示した結果,1405…始めに傷病名欄を強調表示した結果,1406…次に摘要欄を強調表示した結果
1501…OCR装置部における画像入力装置,1502…OCR装置部における操作端末装置,1503…OCR装置部における表示端末装置,1504…OCR装置部における外部記憶装置,1505…OCR装置部におけるメモリ,1506…OCR装置部におけるCPU,1507…OCR装置部における通信装置,1508…OCR装置部における通信バス,1509…ネットワーク部,1510…文書画像処理装置部における操作端末装置,1511…文書画像処理装置部における表示端末装置,1512…文書画像処理装置部における外部記憶装置,1513…文書画像処理装置部におけるメモリ,1514…文書画像処理装置部におけるCPU,1515…文書画像処理装置部における通信装置,1516…文書画像処理装置部における通信バス。
Claims (2)
- 紙文書を光学的に読み取って生成される文書画像データに文字認識処理を行うOCR装置であって、
文書構造解析に用いられる文書構造辞書および文字識別に用いられる文字識別辞書を記憶する記憶装置と、
上記文書画像データを入力する画像入力部と、
演算部とを有し、
上記演算部は、上記文書構造辞書を用いて上記文書画像データの枠構造解析および読取対象枠の特定を行って文書構造データを生成し、上記文字識別辞書を用いて上記特定された読取対象枠について文字認識処理を行って読取結果テキストを生成し、上記文書画像データと対応付けて、上記文書構造データを含むOCR付加データを出力し、
該OCR装置は、上記文書画像データおよび上記OCR付加データを同一のファイルに登録して装置外部に出力する機能を有し、
上記ファイルは複数のデータブロックと該複数のデータブロックのそれぞれに対応するタグとを含むタグ形式の画像ファイルであって、上記OCR付加データを格納する少なくとも1つの上記データブロックと、該データブロックに格納されたデータがOCR付加データであることを示す情報を含むタグとを有することを特徴とするOCR装置であって、
上記演算部は、上記文書構造データに基づいて上記文書画像データ中の秘匿が必要な箇所を特定し、該秘匿が必要な箇所について上記文書画像データの各画素のカラー値を他のカラー値に変更し、該他のカラー値を表示する際に用いられる表示色と該他のカラー値との対応を作成する擬似カラー化処理を行い、
上記文書画像データを該他のカラー値を含むように更新し、
上記表示色と該他のカラー値との対応を含むカラーマップテーブルと、擬似カラー値及び閲覧許諾条件を最低限含む閲覧属性情報とを、上記文書画像データと対応付けて出力することを特徴とするOCR装置。 - OCR装置で行われる文書読取処理結果を入力情報として文書処理を行う文書処理装置であって、
上記文書読取処理結果の入力を受ける入力部と、上記文書読取処理結果に関する表示を行う表示部と、ユーザ入力を受け付けるユーザ入力部と、演算部とを有し、
上記文書読取処理結果は、紙文書を光学的に読み取って生成される文書画像データと、
該文書画像データの枠構造を含む文書構造データを含むOCR付加データとが、同一のファイルに登録されてなるものであり、
上記ファイルは複数のデータブロックと該複数のデータブロックのそれぞれに対応するタグとを含むタグ形式の画像ファイルであって、上記OCR付加データを格納する少なくとも1つの上記データブロックと、該データブロックに格納されたデータがOCR付加データであることを示す情報を含むタグとを有するものであり、
上記演算部は、上記ユーザ入力部から入力される指示に基づいて、上記OCR付加データを用いて上記文書読取処理結果に含まれる情報を選択的に上記表示部に表示させることを特徴とする文書処理装置であって、
上記文書画像データの一部の領域は擬似カラー化処理が行われており、
上記OCR付加データは、上記擬似カラー化処理が行われた領域における各画素のカラー値と表示色との対応関係を含むカラーマップテーブルを含み、
上記演算部は、上記カラーマップテーブルを参照して上記擬似カラー化処理が行われた領域の表示色をユーザからの閲覧状態の指定に応じて決定し、上記表示部は上記決定された表示色を用いて上記文書画像データを表示することを特徴とする文書処理装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003368304A JP4461769B2 (ja) | 2003-10-29 | 2003-10-29 | 文書検索・閲覧手法及び文書検索・閲覧装置 |
CNB2004100048717A CN100351839C (zh) | 2003-10-29 | 2004-02-10 | 文档检索·阅览方法以及文档检索·阅览装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003368304A JP4461769B2 (ja) | 2003-10-29 | 2003-10-29 | 文書検索・閲覧手法及び文書検索・閲覧装置 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2005135041A JP2005135041A (ja) | 2005-05-26 |
JP2005135041A5 JP2005135041A5 (ja) | 2006-01-05 |
JP4461769B2 true JP4461769B2 (ja) | 2010-05-12 |
Family
ID=34646007
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003368304A Expired - Fee Related JP4461769B2 (ja) | 2003-10-29 | 2003-10-29 | 文書検索・閲覧手法及び文書検索・閲覧装置 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP4461769B2 (ja) |
CN (1) | CN100351839C (ja) |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007058605A (ja) | 2005-08-24 | 2007-03-08 | Ricoh Co Ltd | 文書管理システム |
JP4909576B2 (ja) | 2005-11-29 | 2012-04-04 | 株式会社リコー | 文書編集装置、画像形成装置およびプログラム |
WO2007094078A1 (ja) * | 2006-02-14 | 2007-08-23 | Hitachi, Ltd. | 文字列検索方法およびその装置 |
JP2008070831A (ja) * | 2006-09-15 | 2008-03-27 | Ricoh Co Ltd | 文書表示装置及び文書表示プログラム |
US8726178B2 (en) | 2006-11-10 | 2014-05-13 | Ricoh Company, Ltd. | Device, method, and computer program product for information retrieval |
CN101226595B (zh) | 2007-01-15 | 2012-05-23 | 夏普株式会社 | 文档图像处理装置以及文档图像处理方法 |
CN101226596B (zh) | 2007-01-15 | 2012-02-01 | 夏普株式会社 | 文档图像处理装置以及文档图像处理方法 |
US8261200B2 (en) * | 2007-04-26 | 2012-09-04 | Fuji Xerox Co., Ltd. | Increasing retrieval performance of images by providing relevance feedback on word images contained in the images |
JP2008310525A (ja) * | 2007-06-13 | 2008-12-25 | Canon Inc | 情報処理装置、情報処理方法、及び、情報処理プログラム |
JP5134383B2 (ja) * | 2008-01-29 | 2013-01-30 | 株式会社日立製作所 | Ocr装置、証跡管理装置及び証跡管理システム |
CN102637159B (zh) * | 2011-02-11 | 2014-12-10 | 汉王科技股份有限公司 | 文档显示方法及装置 |
CN102750541B (zh) * | 2011-04-22 | 2015-07-08 | 北京文通科技有限公司 | 一种文档图像分类识别方法及装置 |
JP2013130997A (ja) * | 2011-12-21 | 2013-07-04 | Kyocera Document Solutions Inc | 画像形成装置 |
JP6174466B2 (ja) * | 2013-11-22 | 2017-08-02 | 日立オムロンターミナルソリューションズ株式会社 | 帳票認識装置、帳票認識方法、及びプログラム |
CN105608131A (zh) * | 2015-12-17 | 2016-05-25 | 山东尚德软件股份有限公司 | 一种档案信息检索及利用电子化的实现方法 |
CN107180039A (zh) * | 2016-03-09 | 2017-09-19 | 腾讯科技(深圳)有限公司 | 一种基于图片的文字信息识别方法及装置 |
CN105956098B (zh) * | 2016-05-03 | 2019-04-12 | 华中师范大学 | 一种纸质印刷品与电子资源的关联方法及系统 |
JP6579331B2 (ja) * | 2016-07-28 | 2019-09-25 | 京セラドキュメントソリューションズ株式会社 | 画像形成装置、文書電子化プログラムおよび文書電子化方法 |
CN107291949B (zh) * | 2017-07-17 | 2020-11-13 | 绿湾网络科技有限公司 | 信息搜索方法及装置 |
CN109389114B (zh) * | 2017-08-08 | 2021-12-03 | 富士通株式会社 | 文本行获取装置和方法 |
JP7003577B2 (ja) * | 2017-10-31 | 2022-01-20 | 京セラドキュメントソリューションズ株式会社 | 文書管理システム及び文書管理方法 |
JP6996234B2 (ja) * | 2017-10-31 | 2022-01-17 | 京セラドキュメントソリューションズ株式会社 | 文書管理システム及び文書管理方法 |
CN112868001B (zh) * | 2018-10-04 | 2024-04-26 | 株式会社力森诺科 | 文档检索装置、文档检索程序、文档检索方法 |
JP6963126B2 (ja) * | 2019-02-14 | 2021-11-05 | 昭和電工株式会社 | 文書検索装置、文書検索システム、文書検索プログラム及び文書検索方法 |
CN111027080B (zh) * | 2019-11-26 | 2021-11-19 | 中国人民解放军战略支援部队信息工程大学 | 基于ooxml复合文档源文件数据区位置排列次序的信息隐藏方法及系统 |
JP7543788B2 (ja) * | 2020-08-31 | 2024-09-03 | 株式会社リコー | 表示装置、入力方法、プログラム |
CN112115892A (zh) * | 2020-09-24 | 2020-12-22 | 科大讯飞股份有限公司 | 一种关键要素抽取方法、装置、设备及存储介质 |
CN113254396B (zh) * | 2021-06-23 | 2021-09-24 | 昌和云科技有限公司 | 一种多部门的案件协同管理系统 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3152871B2 (ja) * | 1995-11-10 | 2001-04-03 | 富士通株式会社 | ラティスをキーとした検索を行う辞書検索装置および方法 |
JPH09319824A (ja) * | 1996-05-30 | 1997-12-12 | Hitachi Ltd | 帳票認識方法 |
JP2973944B2 (ja) * | 1996-06-26 | 1999-11-08 | 富士ゼロックス株式会社 | 文書処理装置および文書処理方法 |
JP2000172779A (ja) * | 1998-12-03 | 2000-06-23 | Toshiba Corp | Ocrシステム及び同システムに適用する読取制御情報の作成方法 |
JP3709305B2 (ja) * | 1999-07-01 | 2005-10-26 | 日立オムロンターミナルソリューションズ株式会社 | 地名文字列照合方法、地名文字列照合装置、地名文字列認識装置及び郵便物区分システム |
JP4159720B2 (ja) * | 2000-03-15 | 2008-10-01 | 株式会社リコー | 表認識方法と表認識装置と文字認識装置及び表認識プログラムを記録した記憶媒体 |
-
2003
- 2003-10-29 JP JP2003368304A patent/JP4461769B2/ja not_active Expired - Fee Related
-
2004
- 2004-02-10 CN CNB2004100048717A patent/CN100351839C/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2005135041A (ja) | 2005-05-26 |
CN100351839C (zh) | 2007-11-28 |
CN1612154A (zh) | 2005-05-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4461769B2 (ja) | 文書検索・閲覧手法及び文書検索・閲覧装置 | |
JP4402138B2 (ja) | 画像処理装置、画像処理方法、コンピュータプログラム | |
US5960448A (en) | System and method for displaying a graphically enhanced view of a region of a document image in which the enhanced view is correlated with text derived from the document image | |
US5708766A (en) | Filing device | |
JP5376795B2 (ja) | 画像処理装置、画像処理方法、そのプログラム及び記憶媒体 | |
JPH11161681A (ja) | 検索結果を表示するための装置および方法、並びに、検索結果を出力するために一連の命令を記録したコンピュータ読み取り可能な記録媒体 | |
JP5380040B2 (ja) | 文書処理装置 | |
US11741735B2 (en) | Automatically attaching optical character recognition data to images | |
CN113806472A (zh) | 一种对文字图片和图像型扫描件实现全文检索的方法及设备 | |
US6535652B2 (en) | Image retrieval apparatus and method, and computer-readable memory therefor | |
JP2007058605A (ja) | 文書管理システム | |
JP2012234344A (ja) | 帳票上の文字を認識する文字認識装置、マスク処理方法、および、マスク処理プログラム | |
JP2006065477A (ja) | 文字認識装置 | |
JP2008129793A (ja) | 文書処理システムおよび装置および方法、およびプログラムを記録した記録媒体 | |
CN119129529A (zh) | Pdf文档的转换方法、装置、设备、存储介质及产品 | |
JP2000322417A (ja) | 画像ファイリング装置及び方法及び記憶媒体 | |
JP2007241355A (ja) | 画像処理装置及び画像処理プログラム | |
WO2022004097A1 (ja) | 情報処理装置、情報処理方法、及びコンピュータプログラム | |
JP4517821B2 (ja) | 画像処理装置及びプログラム | |
EP4095716A1 (en) | Information processing apparatus, program, and information processing method | |
JP4892600B2 (ja) | 画像処理装置 | |
CN110727820B (zh) | 一种为图片获得标签的方法和系统 | |
JPH11187231A (ja) | 画像検索装置及び画像検索方法 | |
JPH10154157A (ja) | 電子ファイリングシステム | |
WO2021117128A1 (ja) | 帳票画像処理システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20051114 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20051114 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20060421 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090226 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090310 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090428 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090623 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20090915 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091203 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20091222 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100126 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100208 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130226 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130226 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140226 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |