[go: up one dir, main page]

JP3072518B2 - Recognition result display device - Google Patents

Recognition result display device

Info

Publication number
JP3072518B2
JP3072518B2 JP1093632A JP9363289A JP3072518B2 JP 3072518 B2 JP3072518 B2 JP 3072518B2 JP 1093632 A JP1093632 A JP 1093632A JP 9363289 A JP9363289 A JP 9363289A JP 3072518 B2 JP3072518 B2 JP 3072518B2
Authority
JP
Japan
Prior art keywords
area
image
keyword
identification
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP1093632A
Other languages
Japanese (ja)
Other versions
JPH02271470A (en
Inventor
啓嗣 小島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP1093632A priority Critical patent/JP3072518B2/en
Publication of JPH02271470A publication Critical patent/JPH02271470A/en
Application granted granted Critical
Publication of JP3072518B2 publication Critical patent/JP3072518B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、自動説明機や自動発表機などに利用され、
光学文字読取装置(OCR)で認識された文字等の認識結
果を表示するための認識結果表示装置に関する。
DETAILED DESCRIPTION OF THE INVENTION [Industrial Application Field] The present invention is used for automatic explanation machines, automatic announcement machines, etc.
The present invention relates to a recognition result display device for displaying a recognition result of a character or the like recognized by an optical character reading device (OCR).

〔従来の技術〕[Conventional technology]

従来、光学文字読取装置では、読取った原稿上の文字
等をパターン認識し、その認識結果をディスプレイに表
示したり、あるいは音声合成によって音声出力するよう
になっていた。
2. Description of the Related Art Conventionally, in an optical character reading apparatus, a character or the like on a read original is subjected to pattern recognition, and the recognition result is displayed on a display or output as voice by voice synthesis.

〔発明が解決しようとする課題〕[Problems to be solved by the invention]

しかしながら、上述した従来の認識結果表示装置で
は、認識結果を単にディスプレイ等に表示したり音声出
力するだけであり、原稿上の図や表などの画像情報を認
識結果と組合せて原稿上の本文の流れに沿って原稿上の
図や表などの画像をディスプレイに表示しながら、認識
結果を表示したり、音声出力したりすることができなか
った。
However, the above-described conventional recognition result display device merely displays the recognition result on a display or outputs sound, and combines image information such as figures and tables on the document with the recognition result to form the text on the document. While displaying images such as figures and tables on a document along a flow on a display, it was not possible to display a recognition result or output a sound.

このため原稿の内容を把握しにくくまたこれを相手に
効率良く伝えることができないという欠点があった。
For this reason, there are drawbacks that it is difficult to grasp the contents of the manuscript and it is not possible to efficiently communicate the contents to the other party.

本発明は、認識結果と画像情報とを組合せて原稿の内
容を把握し易くしさらには原稿の内容を相手に効率良く
伝えることの可能な認識結果表示装置を提供することを
目的としている。
SUMMARY OF THE INVENTION It is an object of the present invention to provide a recognition result display device which makes it easy to grasp the contents of a document by combining a recognition result and image information, and which can efficiently transmit the contents of the document to a partner.

〔課題を解決するための手段〕[Means for solving the problem]

上記目的を達成するために、本発明は、認識結果を出
力しながら、認識結果中のキーワードに対応して画像を
表示するようになっていることを特徴としたものであ
る。
In order to achieve the above object, the present invention is characterized in that an image is displayed corresponding to a keyword in the recognition result while outputting the recognition result.

〔作用〕[Action]

上記のような構成の認識結果表示装置では、認識結果
をディスプレイに表示したりあるいは認識結果を音声で
発生しながら、認識結果中の図,表などのキーワードに
対応して画像をデイスプレイに表示する。
In the recognition result display device having the above configuration, while displaying the recognition result on the display or generating the recognition result by voice, an image is displayed on the display in accordance with the keyword such as a figure or a table in the recognition result. .

〔実施例〕〔Example〕

以下、本発明の一実施例を図面に基づいて説明する。 Hereinafter, an embodiment of the present invention will be described with reference to the drawings.

第1図は本発明の認識結果表示装置の一例の構成図で
ある。
FIG. 1 is a configuration diagram of an example of a recognition result display device of the present invention.

第1図に示す装置は、原稿を読取るスキャナ1と、全
体の処理制御を行なう中央演算処理部2と、光学文字読
取に関するプログラムが格納されているROM3と、音声合
成に関するプログラムが格納されているROM4と、スキャ
ナ1で読取られたオリジナル画像が記憶されるオリジナ
ル画像メモリ5と、オリジナル画像中の座標値並びにテ
キスト領域,イメージ領域の付加情報を格納するRAM6
と、認識用の辞書7と、キーワードテーブル8と、音声
発生部9と、データ格納RAM10とを備えている。
The apparatus shown in FIG. 1 stores a scanner 1 for reading an original, a central processing unit 2 for controlling the entire processing, a ROM 3 in which a program relating to optical character reading is stored, and a program relating to speech synthesis. ROM 4, an original image memory 5 for storing an original image read by the scanner 1, and a RAM 6 for storing coordinate values in the original image and additional information of a text area and an image area.
, A dictionary 7 for recognition, a keyword table 8, a voice generator 9, and a data storage RAM 10.

次に、このような構成の装置の動作を第2図のフロー
チャートを用いて説明する。
Next, the operation of the apparatus having such a configuration will be described with reference to the flowchart of FIG.

第2図のステップS1では、スキャナ1によって原稿か
ら画像を読取りオリジナル画像メモリ5にオリジナル画
像として記憶する。次いでステップS2ではオリジナル画
像メモリ5に記憶されたオリジナル画像から、文字が存
在するテキスト領域と図,表,写真等が存在するイメー
ジ領域とを識別し、ステップS3では各領域ごとにそれぞ
れの画像,情報をRAM6内に保存する。
In step S1 of FIG. 2, an image is read from a document by the scanner 1 and stored in the original image memory 5 as an original image. Next, in step S2, a text area where characters are present and an image area where figures, tables, photographs, etc. are present are identified from the original image stored in the original image memory 5, and in step S3, each image, Save the information in RAM6.

ステップS2における領域の識別すなわち領域の分け方
には自動とマニュアルの2つの仕方がある。
There are two methods of identifying the area in step S2, that is, dividing the area, automatic and manual.

自動的に領域を識別する場合には、画像の状態,例え
ば黒画素の連結量を見てテキスト領域かイメージ領域か
を識別する。イメージ領域と判断された領域について
は、その領域内かあるいはその周辺に第3図の例に示す
ようなキーワードKWをキーワードテーブル8を参照して
探し、そのキーワードKWの次の文字との組み合わせをイ
メージに情報(図1,表1など)として付ける必要があ
る。なおキーワードを見出すことができなかったときの
ために、利用者に問い合わせるなどの機能も必要であ
る。
In the case of automatically identifying an area, a text area or an image area is identified by checking the state of an image, for example, the connection amount of black pixels. For the area determined to be an image area, a keyword KW as shown in the example of FIG. 3 is searched for in or around the area by referring to the keyword table 8, and a combination with the next character of the keyword KW is searched. It must be attached to the image as information (Figure 1, Table 1, etc.). It is also necessary to provide a function for inquiring a user when a keyword cannot be found.

これに対してマニュアルで領域を識別する場合には、
マウスやカーソルなどを利用して、テキスト領域かイメ
ージ領域かを指定する。例えば矩形領域の左上と右下の
位置を指定して画像を囲み、領域を指定する。次いで利
用者にイメージに対応する情報(図1,表1など)を入力
してもらう。
On the other hand, when manually identifying the area,
Specify the text area or image area using the mouse or cursor. For example, the image is surrounded by specifying the upper left and lower right positions of the rectangular area, and the area is specified. Next, the user inputs information corresponding to the image (FIG. 1, Table 1, etc.).

第4図は上述した領域識別処理の具体例を示した図で
あって、オリジナル画像OGをテキスト領域画像TXとイメ
ージ領域画像IMとに分けた状態が示されており、イメー
ジ領域画像IMの各画像IM1,IM2にはそれぞれ“図1",“図
2"の情報I1,I2が付加されている。
FIG. 4 is a diagram showing a specific example of the above-described region identification processing, in which the original image OG is divided into a text region image TX and an image region image IM. Images IM 1 and IM 2 have “Figure 1” and “Figure
2 ”information I 1 and I 2 are added.

このようにして領域識別処理を行なった後、ステップ
S4,S5,S6のテキスト領域の認識処理を辞書7を用いて行
なう。なおステップS4乃至S6に示されている認識処理で
は、ある単位で認識しながらキーワードを探すようにし
ている。すなわちステップS4では、ある単位例えばワー
ドや行単位で認識を行ない認識結果を表示したり、ROM4
に従って音声合成し、音声発生部9から音声出力させる
一方で、ステップS5ではその認識結果中に第3図に示す
ように登録されているキーワードがあるかないかを判別
し、キーワードを検出したときにはそのキーワードの次
に示されている数字などの組み合わせパターンと保存さ
れているイメージに付加された情報とを比較し、一致し
たものをステップS6においてディスプレイに表示する。
なおイメージのディスプレイ表示時間は、次のイメージ
までとするのが妥当である。
After performing the region identification processing in this manner, the step
The recognition process of the text area of S4, S5, S6 is performed using the dictionary 7. In the recognition processing shown in steps S4 to S6, a keyword is searched for while recognizing a certain unit. That is, in step S4, recognition is performed in a unit, for example, a word or a line, and a recognition result is displayed.
In step S5, it is determined whether or not there is a keyword registered in the recognition result as shown in FIG. 3, and if a keyword is detected, The combination pattern such as the number indicated next to the keyword is compared with the information added to the stored image, and a match is displayed on the display in step S6.
It is appropriate that the display time of the image is set to the next image.

このようにして、本実施例では、図や表などの画像を
本文の流れにそってディスプレイに表示しながら、認識
結果を表示したり、認識結果を音声合成して音声出力す
るようにしているので、自動説明機に適用した場合に、
原稿の内容を効率良く把握し相手方に伝えることが可能
となる。
In this manner, in the present embodiment, while displaying images such as figures and tables on the display along the flow of the text, the recognition result is displayed, and the recognition result is synthesized and output as voice. So, when applied to an automatic explanation machine,
The contents of the manuscript can be efficiently grasped and transmitted to the other party.

〔発明の効果〕〔The invention's effect〕

以下に説明したように、本発明によれば、認識結果を
出力しながら、認識結果中のキーワードに対応して画像
を表示するようになっているので、例えば自動説明機に
適用した場合に図や表などを本文の流れに沿ってディス
プレイで見ることができて、原稿の内容を把握し易く原
稿の内容を相手に効率良く伝えることができる。
As described below, according to the present invention, while outputting a recognition result, an image is displayed corresponding to a keyword in the recognition result. Tables and tables can be viewed on the display along the flow of the text, so that the contents of the document can be easily grasped and the contents of the document can be efficiently transmitted to the other party.

【図面の簡単な説明】[Brief description of the drawings]

第1図は本発明の認識結果表示装置の一例の構成図、第
2図は第1図に示す装置の処理の一例を示すフローチャ
ート、第3図はキーワードを示す図、第4図は領域識別
処理の具体例を説明するための図である。 1……スキャナ、2……中央演算処理部、 3,4……ROM、5……オリジナル画像メモリ、 6……RAM、7……辞書、 8……キーワードテーブル、9……音声発生部、 10……データ格納RAM
FIG. 1 is a block diagram showing an example of a recognition result display device according to the present invention, FIG. 2 is a flowchart showing an example of processing of the device shown in FIG. 1, FIG. 3 is a diagram showing keywords, and FIG. It is a figure for explaining the example of processing. 1, scanner 2, central processing unit 3, 4, ROM 5, original image memory 6, RAM 7, dictionary 8, keyword table 9, sound generator 9, 10 Data RAM

Claims (4)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】複数種の領域識別用キーワードが予め登録
されているキーワード登録手段と、入力画像からテキス
ト領域とイメージ領域とを識別する領域識別手段と、イ
メージ領域と識別された領域については、その領域内か
あるいはその周辺の任意の位置にキーワード登録手段に
登録されている複数種の領域識別用キーワードのうちの
いずれかの領域識別用キーワードがあるかを検出し、領
域識別用キーワードがあると検出されたときには、検出
された領域識別用キーワードをイメージ領域の画像情報
と対応付ける対応付け手段と、領域識別手段によって識
別されたテキスト領域に対して文字認識処理と行なう認
識処理手段と、認識処理手段によって文字認識処理され
たテキスト領域における文字認識結果とイメージ領域の
画像情報とを表示する表示手段とを有し、前記認識識別
手段からのテキスト領域における文字認識結果の表示を
行いながら、テキスト領域における文字認識結果が領域
識別用キーワードに一致したときには前記対応付け手段
により該領域識別用キーワードに対応付けられた画像情
報を表示することを特徴とする認識結果表示装置。
1. A keyword registration means in which a plurality of types of area identification keywords are registered in advance, an area identification means for identifying a text area and an image area from an input image, and an area identified as an image area It detects whether there is any one of a plurality of types of area identification keywords registered in the keyword registration means in the area or at an arbitrary position around the area, and there is an area identification keyword. When it is detected that the detected area identification keyword is associated with the image information of the image area, a recognition processing means for performing a character recognition process on the text area identified by the area identification means, Display the character recognition result in the text area that has been subjected to the character recognition processing by the means and the image information in the image area Display means for displaying the character recognition result in the text area from the recognition and identification means, and when the character recognition result in the text area matches the keyword for area identification, A recognition result display device for displaying image information associated with a keyword.
【請求項2】複数種の領域識別用キーワードが予め登録
されているキーワード登録手段と、入力画像からテキス
ト領域とイメージ領域とを識別する領域識別手段と、イ
メージ領域と識別された領域については、その領域内か
あるいはその周辺の任意の位置にキーワード登録手段に
登録されている複数種の領域識別用キーワードのうちの
いずれかの領域識別用キーワードがあるかを検出し、領
域識別用キーワードがあると検出されたときには、検出
された領域識別用キーワードをイメージ領域の画像情報
と対応付ける対応付け手段と、領域識別手段によって識
別されたテキスト領域に対して文字認識処理を行なう認
識処理手段と、認識処理手段によって文字認識処理され
たテキスト領域における文字認識結果を音声合成して出
力する音声発生手段と、イメージ領域の画像情報を表示
する表示手段とを有し、前記認識処理手段からのテキス
ト領域における文字認識結果の音声出力を行いながら、
テキスト領域における文字認識結果が領域識別用キーワ
ードに一致したときには前記対応付け手段により該領域
識別用キーワードに対応付けられた画像情報を表示する
ことを特徴とする認識結果表示装置。
2. A keyword registration means in which a plurality of types of area identification keywords are registered in advance, an area identification means for identifying a text area and an image area from an input image, and an area identified as an image area includes: It detects whether there is any one of a plurality of types of area identification keywords registered in the keyword registration means in the area or at an arbitrary position around the area, and there is an area identification keyword. When it is detected, an associating means for associating the detected area identification keyword with the image information of the image area; a recognition processing means for performing a character recognition process on the text area identified by the area identification means; Means for synthesizing and outputting a character recognition result in a text area subjected to character recognition processing by means When, and display means for displaying the image information of the image area, while the audio output of the character recognition result in the text area from the recognition processing means,
A recognition result display device, wherein when the character recognition result in the text region matches the region identification keyword, the association means displays image information associated with the region identification keyword.
【請求項3】領域識別手段によって入力画像からテキス
ト領域とイメージ領域とを識別し、領域識別手段によっ
てイメージ領域と判断された領域については、イメージ
領域と判断された領域内かあるいはその周辺の任意の位
置にキーワード登録手段に予め登録されている複数種の
領域識別用キーワードのうちのいずれかの領域識別用キ
ーワードがあるかを検出し、領域識別用キーワードがあ
ると検出されたときには、検出された領域識別用キーワ
ードをイメージ領域の画像情報と対応付け、また、領域
識別手段によってテキスト領域と判断された領域に対し
ては認識処理手段によって文字認識処理を行ない、前記
認識処理手段からのテキスト領域における文字認識結果
の表示を行いながら、テキスト領域における文字認識結
果が領域識別用キーワードに一致したときには該領域識
別用キーワードに対応付けられた画像情報を表示するこ
とを特徴とする認識結果表示方法。
3. A text region and an image region are discriminated from an input image by a region discriminating means, and an area determined as an image region by the region discriminating means is located within or around the image discriminated region. Of the plurality of types of area identification keywords registered in advance in the keyword registration means at the position of, and if it is detected that there is an area identification keyword, it is detected. The area identification keyword is associated with the image information of the image area, and a character recognition process is performed by the recognition processing unit on the area determined to be a text area by the area identification unit. While displaying the result of character recognition in the Recognition result display method characterized by displaying the image information associated with the keyword region identification when they match a word.
【請求項4】領域識別手段によって入力画像からテキス
ト領域とイメージ領域とを識別し、領域識別手段によっ
てイメージ領域と判断された領域については、イメージ
領域と判断された領域内かあるいはその周辺の任意の位
置にキーワード登録手段に予め登録されている複数種の
領域識別用キーワードのうちのいずれかの領域識別用キ
ーワードがあるかを検出し、領域識別用キーワードがあ
ると検出されたときには、検出された領域識別用キーワ
ードをイメージ領域の画像情報と対応付け、また、領域
識別手段によってテキスト領域と判断された領域に対し
ては認識処理手段によって文字認識処理を行ない、前記
認識処理手段からのテキスト領域における文字認識結果
を音声合成して音声出力しながら、テキスト領域におけ
る文字認識結果が領域識別用キーワードに一致したとき
には該領域識別用キーワードに対応付けられた画像情報
を表示することを特徴とする認識結果表示方法。
4. A text region and an image region are discriminated from an input image by a region discriminating means, and an area determined as an image region by the region discriminating means is located in or around the image discriminated region. It is detected whether or not any of the plurality of types of area identification keywords registered in advance in the keyword registration means is present at the position, and if it is detected that there is an area identification keyword, it is detected. The area identification keyword is associated with the image information of the image area, and a character recognition process is performed by the recognition processing unit on the area determined to be a text area by the area identification unit. The character recognition result in the text area is Recognition result display method characterized by displaying the image information associated with the keyword region identification when they match a frequency identification keywords.
JP1093632A 1989-04-13 1989-04-13 Recognition result display device Expired - Fee Related JP3072518B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1093632A JP3072518B2 (en) 1989-04-13 1989-04-13 Recognition result display device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1093632A JP3072518B2 (en) 1989-04-13 1989-04-13 Recognition result display device

Publications (2)

Publication Number Publication Date
JPH02271470A JPH02271470A (en) 1990-11-06
JP3072518B2 true JP3072518B2 (en) 2000-07-31

Family

ID=14087713

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1093632A Expired - Fee Related JP3072518B2 (en) 1989-04-13 1989-04-13 Recognition result display device

Country Status (1)

Country Link
JP (1) JP3072518B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04253289A (en) * 1991-01-29 1992-09-09 Nec Corp Character recognizing device
CA2066559A1 (en) * 1991-07-29 1993-01-30 Walter S. Rosenbaum Non-text object storage and retrieval

Also Published As

Publication number Publication date
JPH02271470A (en) 1990-11-06

Similar Documents

Publication Publication Date Title
US10741167B2 (en) Document mode processing for portable reading machine enabling document navigation
US6002798A (en) Method and apparatus for creating, indexing and viewing abstracted documents
US9626000B2 (en) Image resizing for optical character recognition in portable reading machine
US8150107B2 (en) Gesture processing with low resolution images with high resolution processing for optical character recognition for a reading machine
US8531494B2 (en) Reducing processing latency in optical character recognition for portable reading machine
US7505056B2 (en) Mode processing in portable reading machine
US8626512B2 (en) Cooperative processing for portable reading machine
US8186581B2 (en) Device and method to assist user in conducting a transaction with a machine
US20160344860A1 (en) Document and image processing
US20100201793A1 (en) Portable reading device with mode processing
US20060006235A1 (en) Directed reading mode for portable reading machine
JPH07143330A (en) Image synthesizing method and image recording device
WO2005096760A2 (en) Portable reading device with mode processing
JP3072518B2 (en) Recognition result display device
JPH0388062A (en) Device for preparing document
JP2000029983A (en) Document reader device
CN112487804A (en) Chinese novel speech synthesis system based on semantic context scene
JP2747046B2 (en) Document creation device and control device
JP2001209645A (en) Filing system
JPH05347666A (en) Electronic conference system
JPH09282456A (en) Picture labeling device and picture retrieval device
JPH069026B2 (en) Information transmission device
JP2024071951A (en) Information processing apparatus, information processing method, and program
CN118277598A (en) Picture browsing method, device, equipment and computer readable storage medium
JP3157534B2 (en) Table recognition method

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees