[go: up one dir, main page]

JP2007081841A - 画像読取装置 - Google Patents

画像読取装置 Download PDF

Info

Publication number
JP2007081841A
JP2007081841A JP2005267073A JP2005267073A JP2007081841A JP 2007081841 A JP2007081841 A JP 2007081841A JP 2005267073 A JP2005267073 A JP 2005267073A JP 2005267073 A JP2005267073 A JP 2005267073A JP 2007081841 A JP2007081841 A JP 2007081841A
Authority
JP
Japan
Prior art keywords
image data
page number
page
reading
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005267073A
Other languages
English (en)
Inventor
Shoji Inoue
省次 井上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2005267073A priority Critical patent/JP2007081841A/ja
Publication of JP2007081841A publication Critical patent/JP2007081841A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Facsimiles In General (AREA)

Abstract

【課題】 ユーザに不便を強いることなく、複数ページに渡る文書を好適な態様で出力する。
【解決手段】 画像読取装置100は、画像読取部1と、情報抽出部2と、記憶部3と、UI部4と、画像出力部5と、制御部6とを備える。制御部6は、画像読取部1に複数枚の文書を読み取らせて画像データを生成させ、情報抽出部2に各画像データからページ番号を抽出させる。制御部6は、このページ番号が不規則的に増加あるいは減少したことを検知すると、この部分においてページの欠落が生じていると判断する。そして、欠落箇所に相当するページが読み取られたときには、制御部6は各画像データのページ番号を基準に、画像データ全体を適切な順番にソートして出力する。
【選択図】 図1

Description

本発明は、画像を光学的に読み取る画像読取装置に係り、特に、書籍や資料を読み取る際のユーザの利便性を向上させるための技術に関する。
書籍や資料等の複数ページに渡る文書をスキャナや複写機で読み取るときには、ユーザは1ページずつページを変えながら読み取る必要がある。このような単調な作業を延々と繰り返していると、人間は往々にしてミスをしてしまう。ここでいうミスとは、例えば、必要なページを飛ばしてしまったり、同じページを繰り返し読み取ってしまったり、あるいは必要なページの読み取りは終わったのに不必要なページまで読み取ってしまう、といった類のものである。一般に、このようなミスは自分でも気付かないうちに行ってしまうため、その発見は困難である。
また、スキャナや複写機の一部には、複数ページの文書を連続的に読み取る自動原稿送り装置(ADF)を備えるものがある。ADFは大量の文書を読み取るときに大きな威力を発揮するが、複数枚の文書を重ねて供給してしまう、いわゆる「重送」を生じさせることがあり、かかる場合には一部ページが欠落して読み取られてしまうことになる。
特許文献1には、これらの不都合を回避するものとして、連続コピー時に各々の文書からページ数を読み取り、そのページ数が連続的に増加していない場合には、連続コピーの完了後にユーザに通知する技術が開示されている。このような技術を用いれば、ユーザは欠落しているページを容易に認識することができるので、欠落しているページを追加コピーして補うことができる。
特開2002−139965号公報
しかしながら、上述の特許文献1に記載の技術を用いた場合、欠落しているページを補完するためには、(1)文書の中から欠落しているページの原稿を探し出し、(2)探し出した原稿をコピーし、(3)複数ページの複写物の中からページの欠落した箇所を特定し、(4)(2)でコピーされた複写物を(3)で特定した箇所に挿入する、という極めて煩雑な作業をユーザが行う必要がある。特に、ページの欠落した箇所を特定するという(2)の作業は、文書が膨大なページ数に渡るときには困難を極める。
また、特許文献1に記載の技術においては、各ページの比較をページ番号を基準に行っているため、ページ番号が表示されていない文書に対しては何ら効果を奏さないという不都合もある。
本発明は上述の事情に鑑みてなされたものであり、その目的は、ユーザにかかる不便を強いることなく、複数ページに渡る文書を好適な態様で出力することにある。
上述の目的を達成するために、本発明に係る画像読取装置は、ページ番号が表示されている複数枚の原稿を1枚ずつ読み取って、各原稿を表す画像データを順次生成する読取手段と、前記読取手段により生成された画像データからページ番号を抽出する抽出手段と、前記抽出手段が、第1の画像データから第1のページ番号を抽出し、その直後に第2の画像データから第2のページ番号を抽出したときに、前記第1のページ番号と前記第2のページ番号との差が1でない場合には、前記第2の画像データを削除する削除手段と、前記読取手段により生成され、かつ、前記削除手段により削除されない画像データを出力する出力手段とを備える。
または、本発明に係る画像読取装置は、ページ番号が表示されている複数枚の原稿を1枚ずつ読み取って、各原稿を表す画像データを順次生成する読取手段と、前記読取手段により生成された画像データからページ番号を抽出する抽出手段と、前記抽出手段による抽出結果が、Nを3以上の整数、dを正または負の整数、Pを2dより大である整数としたときに、(N−2)枚目のページ番号が(P−2d)、(N−1)枚目のページ番号が(P−d)であり、かつ、N枚目のページ番号がPでない場合に、当該N枚目の画像データを削除する削除手段と、前記読取手段により生成され、かつ、前記削除手段により削除されない画像データを出力する出力手段とを備える。
かかる画像読取装置によれば、ページ番号が不規則に増加(ないし減少)したことを検出すると、このページ番号が抽出された画像データは削除される。つまり、出力手段により出力されるのは、ページ番号が規則的に増加(ないし減少)している画像データのみとなる。
また、本発明に係る画像読取装置は、ページ番号が表示されている複数枚の原稿を1枚ずつ読み取って、各原稿を表す画像データを順次生成する読取手段と、前記読取手段により生成された画像データからページ番号を抽出する抽出手段と、前記抽出手段が、第1の画像データから第1のページ番号を抽出し、その直後に第2の画像データから第2のページ番号を抽出したときに、前記第1のページ番号と前記第2のページ番号とが同一でなく、かつ、その差が1でない場合に、前記第1のページ番号より大きく前記第2のページ番号より小さい値か、あるいは前記第2のページ番号より大きく前記第1のページ番号より小さい値を記憶する第2の記憶手段と、前記抽出手段によりページ番号を抽出された画像データについて、そのページ番号が前記第2の記憶手段に記憶された値に一致するか否かを判断する判断手段と、前記判断手段の判断結果が肯定的である場合に、前記第1の記憶手段から各ページの画像データとページ番号とを読み出し、ページ番号が増加あるいは減少するような順番で画像データを出力する出力手段とを備える。
または、本発明に係る画像読取装置は、ページ番号が表示されている複数枚の原稿を1枚ずつ読み取って、各原稿を表す画像データを順次生成する読取手段と、前記読取手段により生成された画像データからページ番号を抽出する抽出手段と、前記読取手段により生成された画像データと、前記抽出手段により抽出された当該画像データのページ番号とを関連付けて記憶する第1の記憶手段と、前記抽出手段による抽出結果が、Nを3以上の整数、dを正または負の整数、Pを2dより大である整数としたときに、(N−2)枚目のページ番号が(P−2d)、(N−1)枚目のページ番号が(P−d)であり、かつ、N枚目のページ番号がPでない場合に、(P−d)より大きくN枚目のページ番号より小さい値か、あるいはN枚目のページ番号より大きく(P−d)より小さい値を記憶する第2の記憶手段と、前記抽出手段によりページ番号を抽出された画像データについて、そのページ番号が前記第2の記憶手段に記憶された値に一致するか否かを判断する判断手段と、前記判断手段の判断結果が肯定的である場合に、前記第1の記憶手段から各ページの画像データとページ番号とを読み出し、ページ番号が増加あるいは減少するような順番で画像データを出力する出力手段とを備える。
かかる画像読取装置によれば、ページ番号が不規則に増加(ないし減少)し、読み取られたページに欠落が生じている場合であっても、その後に欠落箇所に相当する画像データが入力されれば、画像データはソート(並び替え)されてページ番号が規則的に増加(ないし減少)するような順番で出力される。
また、本発明に係る画像読取装置は、文書を表す複数枚の原稿であって、かつ、文書の区切りを示す文字または番号である区分情報が表示されている原稿を1枚ずつ読み取り、各原稿を表す画像データを順次生成する読取手段と、前記読取手段により生成された画像データから前記区分情報を抽出する抽出手段と、Nを2以上の整数としたときに、前記抽出手段によりN枚目において抽出された区分情報が(N−1)枚目において抽出された区分情報と異なる場合に、文書の区切りの変化をユーザに通知する通知手段と、前記抽出手段により区分情報を抽出された画像データを出力する出力手段とを備える。
なお、この画像読取装置は、前記抽出手段によりN枚目において抽出された区分情報が(N−1)枚目において抽出された区分情報と異なる場合に、当該N枚目の画像データを削除する削除手段を備える構成であることが望ましい。
かかる画像読取装置によれば、文書の区切りを示す章番号や章タイトル等の区分情報を抽出することにより、文書の区切りをユーザに通知することが可能となる。そのため、たとえ文書にページ番号が表示されていない場合であっても、ユーザが気付かないうちに文書の不要な箇所までをも読み取ってしまうといった不都合を解消することができる。
以上のように、本発明によれば、ユーザに不便を強いることなく、複数ページに渡る文書を好適な態様で出力することが可能となる。
[1.構成]
以下においては、本発明の好適な実施形態を例示し、図面を参照しつつ詳細に説明する。図1は、本発明の一実施形態に係る画像読取装置100を示したブロック図である。画像読取装置100は、画像読取部1と、情報抽出部2と、記憶部3と、UI(User Interface)部4と、画像出力部5と、制御部6とを備える。
画像読取部1はいわゆるスキャナの機能を有しており、プラテンガラスに載置された原稿を光学的に読み取って、原稿を表す画像データを生成する。なお、画像読取部1は、複数ページの原稿を1枚ずつ連続的に読み取る、いわゆるADF(Auto Document Feeder)を備えるものであってもよい。画像読取部1がADFを備えていない場合には、ユーザがページを1枚ずつ読み取らせればよい。
情報抽出部2は画像読取部1により生成された画像データにOCR(Optical Character Recognition)処理を施し、各々の画像データからページ番号や章番号等の識別情報を抽出する。情報抽出部2は、識別情報を画像データの任意の位置から抽出することができるが、識別情報の位置があらかじめ決められている原稿を読み取り対象としている場合には、その位置だけにOCR処理を施してもよい。例えば、原稿のいわゆるフッタ領域や、原稿の下部または下部中央に相当する位置にだけOCR処理を施してもよい。また、読み取り対象となる位置は、ユーザが指定できるように構成してもよい。このような構成とすれば、識別情報を高精度に抽出することが可能となる。
記憶部3はハードディスク等の記憶装置であり、種々のデータを記憶することができる。UI部4はタッチパネル、スピーカおよびボタンを備えた入力装置であり、ユーザに各種の情報を通知するとともにユーザからの入力を受け付ける。画像出力部5は画像データをプリンタや記憶装置等の外部装置に出力する。制御部6はCPU(Central Processing Unit)やRAM(Random Access Memory)、ROM(Read Only Memory)等を備えた演算処理装置であり、ROMに記憶されたプログラムを実行することによって読み取りから出力に至るまでの各部の動作を制御する。
[2.動作]
以上の構成のもと、画像読取装置100は原稿を読み取って外部装置に出力する。このとき、画像読取装置100は画像データから識別情報を抽出し、抽出した情報に基づいてその後の動作を決定する。そこで、以下では識別情報に応じた動作例を挙げ、画像読取装置100の動作について説明する。ここでは、画像読取装置100が原稿を連続的に読み取る場合の動作を説明する。
[2−1.動作例1]
ここでは、識別情報がページ番号であって、ページの欠落があった場合の動作について説明する。ここで、「ページの欠落」とは、例えば1(ページ)、2(ページ)、3(ページ)、5(ページ)…、というように、ページ番号の増加が不規則になった場合を意味するものである。もちろん、ページ番号が規則的に増加する場合だけでなく、規則的に減少する場合も含むことができる。
なお、例えば書籍を見開きの状態、すなわち左右のページが向かい合う状態で読み取ろうとした場合、片側のページ番号について見れば、このページ番号は2(ページ)、4(ページ)、6(ページ)…、というように増加していく。同様に、両面コピーされている原稿の一方の面だけを連続的に読み取ろうとした場合にも、ページ番号は2(ページ)、4(ページ)、6(ページ)…、というように増加していく。このような場合も、ページ番号は規則的に増加していると言える。つまり、上述の「ページの欠落」を一般化すると、「それまで等差で増加(あるいは減少)していたページ番号が等差で増加(あるいは減少)しなかった場合」と言い換えることができる。
図2および図3は、本動作例において画像読取装置100が行う処理を示したフローチャートであり、以下、これらの図に沿って説明する。はじめに、画像読取装置100の制御部6は、画像データを生成して記憶する一連の処理(以下「画像データ記憶処理」という。)を行う(S101)。この画像データ記憶処理を詳細に示したのが図3である。すなわち、このステップにおいて、制御部6は画像読取部1に原稿を読み取らせて画像データを生成し(S1)、読み取った原稿が何枚目の原稿であるかをカウントし(S2)、生成された画像データのページ番号を情報抽出部2に抽出させ(S3)、画像データとページ番号とを記憶部3に記憶させる(S4)。なお、以下においては、ステップS2においてカウントされたカウント値をN、ステップS3において抽出されるN枚目のページ番号をPとする。そして記憶部3は、各々の画像データについて、カウント値Nとページ番号Pとを関連付けながら記憶していく。
画像データを記憶したら、制御部6は直前のカウント値Nが2より大きいか否かを判断する(S102)。この処理を行う理由は、少なくとも2ページ分のページ番号を抽出した後でなければ、ページ番号がどのように増減しているかを特定することができない(後述する値dを算出することができない)からである。そのため、直前のカウント値Nが2以下であれば(S102;NO)、制御部6は画像データ記憶処理を再度行う。
直前のカウント値Nが2より大きい場合、すなわち3ページ分以上の画像データが生成されている場合には(S102;YES)、N枚目に読み取られた画像データのページ番号Pと(N−1)枚目に読み取られた画像データのページ番号PN−1の差分が決められた値dであるか否かを判断する(S103)。
なお、値dの算出は、(N−1)枚目に読み取られた画像データのページ番号PN−1から(N−2)枚目に読み取られた画像データのページ番号PN−2を減算することにより求められる。すなわち、ページ番号Pを等差数列であると考えれば、値dはこの等差数列の公差に相当するものである。例えば、ページ番号が1ずつ規則的に増加する場合の値dは「1」、ページ番号が2ずつ規則的に減少する場合の値dは「−2」、といった具合になる。また、値dをあらかじめ決められた値(例えば「1」)とする場合には、値dを算出する必要はなく、そのためステップS102の処理も省略可能である。
ステップS103において、ページ番号の差分「P−PN−1」が値dに等しい場合には(S103;YES)、制御部6はページ番号の増加(あるいは減少)が規則的であると判断し、UI部4のタッチパネルにページ番号Pを表示させる(S104)。一方、ページ番号の差分「P−PN−1」が値dと異なる場合には(S103;NO)、制御部6は欠落しているページに相当するページ番号Pを推測し、これをRAMに一時的に記憶する(S105)。ページ番号Pは、例えば、(N−1)枚目に読み取られた画像データのページ番号PN−1から値dを減算したり、N枚目に読み取られた画像データのページ番号Pに値dを加算することによって得られる。このとき制御部6は、例えば「ページの欠落がありました。」といった内容の警告をUI部4を介してユーザに通知する(S106)。
その後、制御部6は引き続き画像データ記憶処理を実行する(S107)。この処理はステップS101の処理と同様である。続いて、制御部6はステップS103と同様の要領でページ番号の差分の判断を行う(S108)。このときの判断が肯定的であれば(S108;YES)、制御部6はUI部4のタッチパネルにページ番号Pを表示させる(S109)。この処理はステップS104と同様の処理である。一方、このときの判断が否定的であれば(S108;NO)、制御部6はRAMに記憶されているページ番号Pと直前のページ番号Pとが一致するか否かを判断する(S110)。
これらのページ番号が一致する場合(S110;YES)、欠落していたページがユーザによる割り込み等により補完されたことを意味しているので、制御部6はUI部4のタッチパネルにページ番号Pを表示させる(S109)。一方、これらのページ番号が一致しない場合(S110;NO)、ページの欠落が再び生じたことを意味している。そこで、ページ番号が一致しない場合には、上述したステップS105、S106と同様の処理を実行する(S111、S112)。
以上の処理が終了したら、制御部6は全ての原稿を読み取ったか否かを判断する(S113)。この処理は、画像読取部1がADFを備えている場合であれば、ADFに原稿が載置されているかを判断すればよく、画像読取部1がADFを備えていない場合であれば、原稿の読み取りが所定の時間以上行われていないかを判断すればよい。読み取るべき原稿が残っている場合には(S113;NO)、制御部6は上述のステップS107からの処理を繰り返す。一方、全ての原稿を読み取った場合には(S113;YES)、制御部6は記憶部3に記憶された画像データをソートし、そのページ番号が規則的に増加または減少するような順番で出力する(S114)。
画像読取装置100がこのような処理を行うことで、ユーザはページの欠落を瞬時に知ることが可能となる。このとき、ユーザは欠落した箇所の原稿を容易に特定することができるので、原稿を1ページ分戻して読み取らせたり、重送されてしまった原稿を割り込ませたりすることによって、欠落したページを補完することができる。また、画像読取装置100は画像データをソートしてから出力するので、原稿を割り込ませるのはいかなるタイミングであってもよい。ゆえに、この画像読取装置100によれば、ユーザに不便を強いることなく、複数ページに渡る文書を適切な順番で出力することが可能となる。
[2−2.動作例2]
上述の動作例1においては、「それまで等差で増加(あるいは減少)していたページ番号が等差で増加(あるいは減少)しなかった場合」に、ページに欠落が生じているとみなして処理を行った。しかしながら、「それまで等差で増加(あるいは減少)していたページ番号が等差で増加(あるいは減少)しなかった場合」には、例えば1(ページ)、2(ページ)、3(ページ)、3(ページ)…、というように、同じページ番号が続けて抽出された場合も含まれている。そこで以下では、このようにページに重複が生じた場合の動作について説明する。
図4は、本動作例において画像読取装置100が行う処理を示したフローチャートであり、以下、この図に沿って説明する。はじめに、画像読取装置100の制御部6は、上述の第1動作例と同様の画像データ記憶処理を行う(S201)。画像データを記憶したら、制御部6は直前のカウント値Nが1より大きいか否かを判断する(S202)。この処理を行う理由は、少なくとも2ページ分のページ番号を抽出しなければ、ページ番号の重複を判断することができないからである。そのため、直前のカウント値Nが1であれば(S202;NO)、制御部6は画像データ記憶処理を再度行う。
直前のカウント値Nが1より大きい場合、すなわち2ページ分以上の画像データが生成されている場合には(S202;YES)、N枚目に読み取られた画像データのページ番号Pと(N−1)枚目に読み取られた画像データのページ番号PN−1が等しいか否かを判断する(S203)。P=PN−1でない場合(S203;NO)、制御部6はページが重複していないと判断し、UI部4のタッチパネルにページ番号Pを表示させる(S204)。
一方、P=PN−1である場合には(S203;YES)、制御部6はページの重複が生じていると判断し、例えば「ページの重複がありました。」といった内容の警告をUI部4を介してユーザに通知する(S205)。このときUI部4のタッチパネルに表示されるのは、例えば図5のような画面である。ここで、制御部6はページ番号が重複した画像データを削除するか否かをユーザに問い合わせ(S206)、ユーザの選択に応じてその後の処理を異ならせる。
このとき、ユーザが重複したページを削除する旨の指示を入力したときには(S206;YES)、制御部6は重複していると判断されたページ番号の画像データのいずれか一方を削除する(S207)。一方、ユーザが重複したページを削除しない旨の指示を入力したときには(S206;NO)、制御部6は重複したページをそのままにしておく。
以上の処理が終了したら、制御部6は全ての原稿を読み取ったか否かを判断する(S208)。この処理は、画像読取部1がADFを備えている場合であれば、ADFに原稿が載置されているかを判断すればよく、画像読取部1がADFを備えていない場合であれば、原稿の読み取りが所定の時間以上行われていないかを判断すればよい。読み取るべき原稿が残っている場合には(S208;NO)、制御部6は上述のステップS201からの処理を繰り返す。一方、全ての原稿を読み取った場合には(S208;YES)、制御部6は記憶部3に記憶された画像データを読み取った順番で出力する(S209)。
画像読取装置100がこのような処理を行うことで、ユーザはページの重複を瞬時に知り、不要であれば削除することが可能となる。ゆえに、この画像読取装置100によれば、ユーザに不便を強いることなく、複数ページに渡る文書を適切な順番で出力することが可能となる。
なお、画像読取装置100の実際の処理においては、ページの欠落と重複は同時に考慮すべきものである。そのため、本動作例の処理と上述の動作例1の処理とは、実際には同時にあるいは組み合わされて実行されることが望ましい。上述したように、ページの欠落とページの重複は、ともに「それまで等差で増加(あるいは減少)していたページ番号が等差で増加(あるいは減少)しなかった場合」であるという点で共通であり、ページ番号が直前のページ番号と同一である場合のみがページの重複である。このことを利用すれば、ページの欠落とページの重複は1回の処理で判別することが可能である。
[2−3.動作例3]
上述の動作例2においては、ページ番号が同一の画像データが存在する場合に、これを同一ページの原稿であるとみなし、一方を削除する処理を行った。しかしながら、ページ番号が同一の画像データは必ずしも同一ページの原稿であるとは限らず、例えば、ページ番号自体に誤りがあり、本来は同一のページでないのに同じページ番号が付与されてしまっている場合も考えられる。このような場合に、ページ番号が同一の画像データのいずれか一方が削除されてしまうと、ユーザが必要とする情報が失われてしまう可能性もある。本動作例は、このような場合の不都合を解消することを目的としたものである。
図6は、本動作例において画像読取装置100が行う処理を示したフローチャートであり、以下、この図に沿って説明するが、本動作例の一部の処理は上述の動作例2と同様である。そこで、同図においては、動作例2と同様の処理を行うステップには図4と同様の符号を付し、これらのステップの説明を適宜省略する。
ステップS203において、ページが重複していると判断された場合には(S203;YES)、制御部6はページ番号が同一である画像データどうしの類似度を判断する処理を行う(S211)。具体的な処理は特に限定されないが、例えば、制御部6は2つの画像データを画素単位で比較していき、各画素の色差の程度によって類似度を判断してもよいし、あるいは、画像データに含まれる文字や図形等の形状を認識し、2つの画像データでその類似度を判断してもよい。
この判断結果に基づき、制御部6は画像データが同一であるか否か、換言すれば画像データが同一の原稿から生成されたか否かを判断する(S212)。ここで、2つの画像データが同一であると判断された場合には(S212;YES)、制御部6は同一であると判断された画像データのいずれか一方を削除する(S207)。2つの画像データは同一であるから、削除する画像データはどちらでもよい。
一方、2つの画像データが同一でないと判断された場合には(S212;NO)、制御部6は、例えば「ページ番号が同一の画像データがあります。」といった内容の警告をUI部4を介してユーザに通知する(S213)。このときUI部4のタッチパネルに表示されるのは、例えば図7のような画面である。制御部6はページ番号が同一である2つの画像データを表示させ、いずれかの画像データを削除するか、あるいはいずれも削除しないかをユーザに問い合わせる(S214)。
このとき、ユーザがいずれか一方の画像データを削除する旨の指示を入力したときには(S214;YES)、制御部6は指示された画像データを削除する(S215)。一方、ユーザが削除しない旨の指示を入力したときには(S214;NO)、制御部6はページ番号が同一の画像データを削除せずにそのままにしておく。
このような処理を行うことで、画像読取装置100は、原稿そのものが同一である画像データについては削除し、ページ番号が同一でありながらもその内容が異なる画像データについては、削除の可否の判断をユーザに委ねることができる。ゆえに、この画像読取装置100によれば、ユーザに不便を強いることなく、複数ページに渡る文書を出力することが可能となる。
[2−4.動作例4]
上述した動作例1から3は、いずれも、識別情報がページ番号である場合の例であった。しかし、本実施形態の画像読取装置100は、章番号や章タイトルについても、ページ番号と同様の要領で抽出することが可能である。そこで以下では、章番号や章タイトルを識別情報とした場合の動作について説明する。
ここでまず、章番号や章タイトルについて図8および図9を参照しながら説明する。章番号とは、例えば図8(a)において「4.」と表示されている文字列のことであり、この文字列は「第4章」であることを意味している。同様に、図8(b)において「5.」と表示されている文字列は「第5章」であることを意味している。また、章タイトルとは、例えば図8(a)において「基礎編」と表示されている文字列や、図8(b)において「応用編」と表示されている文字列のことである。情報抽出部2はこのような文字列を識別情報として認識し、抽出する。
なお、文書によっては、例えば図9に示されている「4.1.」、「4.2.」といった文字列のように、同一の章をさらに細かく区分しているものもある。本実施形態の情報抽出部2は、これらの文字列を区別して認識するものとする。すなわち、図9(a)の「4.1.」であれば「第4章第1節」、図9(b)の「4.2.」であれば「第4章第2節」というように、それぞれを異なるものとして識別する。そこで以下では、上述した章や節を表す識別情報を「区分情報」と総称する。すなわち区分情報とは、原稿である文書の区分(区切り)を表す情報のことである。
なお、上述の図8および図9においては、章番号や章タイトルがヘッダ領域に表示されている態様を示したが、区分情報の表示されている位置はこのような位置に限定されるわけではない。区分情報はその他の位置にあってもよいし、ページ毎に位置が異なっていてもよい。
図10は、本動作例において画像読取装置100が行う処理を示したフローチャートであり、以下、この図に沿って説明する。はじめに、画像読取装置100の制御部6は、上述の第1動作例と同様の画像データ記憶処理を行う(S301)。画像データを記憶したら、制御部6は直前のカウント値Nが1より大きいか否かを判断する(S302)。直前のカウント値Nが1であれば(S302;NO)、制御部6はUI部4のタッチパネルにその区分情報を表示させ(S306)、画像データを出力する(S307)。その後、制御部6は画像データ記憶処理を再度行う。
直前のカウント値Nが1より大きい場合、すなわち2ページ分以上の画像データが生成されている場合には(S302;YES)、N枚目に読み取られた画像データの区分情報と(N−1)枚目に読み取られた画像データの区分情報が同一であるか否かを判断する(S303)。互いの区分情報が同一であると判断された場合(S303;YES)、制御部6は文書の区切りに変化がないと判断し、UI部4のタッチパネルにその区分情報を表示させる(S306)。その後、制御部6は直前に生成された画像データを出力し(S307)、画像データ記憶処理を再度行う。
一方、互いの区分情報が同一でないと判断された場合には(S303;NO)、制御部6は文書の区切りに変化が生じたと判断し、例えば「第4章が終了しました。」といった内容の警告をUI部4を介してユーザに通知する(S304)。このときUI部4のタッチパネルに表示されるのは、例えば図11のような画面である。ここで、制御部6はその後も原稿の読み取りを続けるか否かをユーザに問い合わせる(S305)。
ユーザが原稿の読み取りを続ける旨の指示を入力した場合には(S305;NO)、制御部6は直前に生成された画像データを出力し(S307)、画像データ記憶処理を再度行う。一方、ユーザが原稿の読み取りを終了する旨の指示を入力した場合には(S305;YES)、制御部6は画像の読み取りを終了させる。例えば、画像読取部1がADFを備える構成である場合、このときADFには読み取り前の原稿が残っていることもあるが、このような場合であっても制御部6は画像の読み取りを終了させる。
このような処理を行うことで、画像読取装置100は、章番号や章タイトル等の区分情報に基づいて文書の区切りを検出し、これをユーザに通知して判断させることが可能となる。ゆえに、この画像読取装置100によれば、ページ番号が表示されていない文書であっても、不要な部分を読み取ることなく、必要な部分だけを出力することができる。
[3.変形例]
以上においては、一の好適な実施形態を挙げて本発明を説明したが、本発明は上述した形態に限定されるものではなく、種々の変形が可能である。以下にその変形の例を説明する。
上述の実施形態においては、情報抽出部2はOCR処理を施して識別情報を抽出すると説明したが、2つの識別情報が同一であるか否かの判定においては、必ずしもOCR処理である必要はない。例えば、識別情報の位置に相当する画像の差違を検出し、その差違が所定のレベル以内であればこれらの識別情報が同一であると判断してもよい。
また、上述の実施形態においては、画像読取部1がADFを備える場合についても説明しているが、もちろん、画像読取部1がDADF(Duplex Auto Document Feeder)を備える構成であってもよい。このような態様であれば、両面コピーされた複数枚の文書の読み取りも行うことが可能となる。
また、上述の動作例1においては、ページの欠落があった場合に、欠落しているページの読み取りを待ってからソートして出力すると説明したが、ページの欠落を検出した場合には、直前に読み取られた画像データを削除し、動作を一旦停止させてもよい。このような態様であっても、欠落箇所を特定することは可能である。また、欠落しているページがない場合や、欠落しているページより前に複数ページの画像データが存在する場合には、画像データを順次出力していっても問題はない。
本発明の一実施形態に係る画像読取装置を示したブロック図である。 画像読取装置が行う画像データ記憶処理を示したフローチャートである。 画像読取装置が行う処理を示したフローチャートである(動作例1)。 画像読取装置が行う処理を示したフローチャートである(動作例2)。 画像読取装置のUI部に表示される画面を例示した図である。 画像読取装置が行う処理を示したフローチャートである(動作例3)。 画像読取装置のUI部に表示される画面を例示した図である。 原稿の区分情報を説明するための図である。 原稿の区分情報を説明するための図である。 画像読取装置が行う処理を示したフローチャートである(動作例4)。 画像読取装置のUI部に表示される画面を例示した図である。
符号の説明
100…画像読取装置、1…画像読取部、2…情報抽出部、3…記憶部、4…UI部、5…画像出力部、6…制御部

Claims (8)

  1. ページ番号が表示されている複数枚の原稿を1枚ずつ読み取って、各原稿を表す画像データを順次生成する読取手段と、
    前記読取手段により生成された画像データからページ番号を抽出する抽出手段と、
    前記抽出手段が、第1の画像データから第1のページ番号を抽出し、その直後に第2の画像データから第2のページ番号を抽出したときに、前記第1のページ番号と前記第2のページ番号との差が1でない場合には、前記第2の画像データを削除する削除手段と、
    前記読取手段により生成され、かつ、前記削除手段により削除されない画像データを出力する出力手段と
    を備えることを特徴とする画像読取装置。
  2. ページ番号が表示されている複数枚の原稿を1枚ずつ読み取って、各原稿を表す画像データを順次生成する読取手段と、
    前記読取手段により生成された画像データからページ番号を抽出する抽出手段と、
    前記抽出手段が、第1の画像データから第1のページ番号を抽出し、その直後に第2の画像データから第2のページ番号を抽出したときに、前記第1のページ番号と前記第2のページ番号とが同一でなく、かつ、その差が1でない場合に、前記第1のページ番号より大きく前記第2のページ番号より小さい値か、あるいは前記第2のページ番号より大きく前記第1のページ番号より小さい値を記憶する第2の記憶手段と、
    前記抽出手段によりページ番号を抽出された画像データについて、そのページ番号が前記第2の記憶手段に記憶された値に一致するか否かを判断する判断手段と、
    前記判断手段の判断結果が肯定的である場合に、前記第1の記憶手段から各ページの画像データとページ番号とを読み出し、ページ番号が増加あるいは減少するような順番で画像データを出力する出力手段と
    を備えることを特徴とする画像読取装置。
  3. ページ番号が表示されている複数枚の原稿を1枚ずつ読み取って、各原稿を表す画像データを順次生成する読取手段と、
    前記読取手段により生成された画像データからページ番号を抽出する抽出手段と、
    前記抽出手段による抽出結果が、Nを3以上の整数、dを正または負の整数、Pを2dより大である整数としたときに、(N−2)枚目のページ番号が(P−2d)、(N−1)枚目のページ番号が(P−d)であり、かつ、N枚目のページ番号がPでない場合に、当該N枚目の画像データを削除する削除手段と、
    前記読取手段により生成され、かつ、前記削除手段により削除されない画像データを出力する出力手段と
    を備えることを特徴とする画像読取装置。
  4. ページ番号が表示されている複数枚の原稿を1枚ずつ読み取って、各原稿を表す画像データを順次生成する読取手段と、
    前記読取手段により生成された画像データからページ番号を抽出する抽出手段と、
    前記読取手段により生成された画像データと、前記抽出手段により抽出された当該画像データのページ番号とを関連付けて記憶する第1の記憶手段と、
    前記抽出手段による抽出結果が、Nを3以上の整数、dを正または負の整数、Pを2dより大である整数としたときに、(N−2)枚目のページ番号が(P−2d)、(N−1)枚目のページ番号が(P−d)であり、かつ、N枚目のページ番号がPでない場合に、(P−d)より大きくN枚目のページ番号より小さい値か、あるいはN枚目のページ番号より大きく(P−d)より小さい値を記憶する第2の記憶手段と、
    前記抽出手段によりページ番号を抽出された画像データについて、そのページ番号が前記第2の記憶手段に記憶された値に一致するか否かを判断する判断手段と、
    前記判断手段の判断結果が肯定的である場合に、前記第1の記憶手段から各ページの画像データとページ番号とを読み出し、ページ番号が増加あるいは減少するような順番で画像データを出力する出力手段と
    を備えることを特徴とする画像読取装置。
  5. 文書を表す複数枚の原稿であって、かつ、文書の区切りを示す文字または番号である区分情報が表示されている原稿を1枚ずつ読み取り、各原稿を表す画像データを順次生成する読取手段と、
    前記読取手段により生成された画像データから前記区分情報を抽出する抽出手段と、
    Nを2以上の整数としたときに、前記抽出手段によりN枚目において抽出された区分情報が(N−1)枚目において抽出された区分情報と異なる場合に、文書の区切りの変化をユーザに通知する通知手段と、
    前記抽出手段により区分情報を抽出された画像データを出力する出力手段と
    を備えることを特徴とする画像読取装置。
  6. 前記抽出手段によりN枚目において抽出された区分情報が(N−1)枚目において抽出された区分情報と異なる場合に、当該N枚目の画像データを削除する削除手段を備える
    ことを特徴とする請求項5に記載の画像読取装置。
  7. 前記削除手段が画像データを削除したときに、前記読取手段による読み取りを停止させる停止手段を備える
    ことを特徴とする請求項1、3および6のいずれかに記載の画像読取装置。
  8. 前記停止手段による停止の可否をユーザが選択するための入力手段を備える
    ことを特徴とする請求項7に記載の画像読取装置。
JP2005267073A 2005-09-14 2005-09-14 画像読取装置 Pending JP2007081841A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005267073A JP2007081841A (ja) 2005-09-14 2005-09-14 画像読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005267073A JP2007081841A (ja) 2005-09-14 2005-09-14 画像読取装置

Publications (1)

Publication Number Publication Date
JP2007081841A true JP2007081841A (ja) 2007-03-29

Family

ID=37941670

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005267073A Pending JP2007081841A (ja) 2005-09-14 2005-09-14 画像読取装置

Country Status (1)

Country Link
JP (1) JP2007081841A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010010821A (ja) * 2008-06-24 2010-01-14 Kyocera Mita Corp 画像読取り装置および画像形成装置
JP2011010030A (ja) * 2009-06-25 2011-01-13 Oki Data Corp 画像読み取り装置及び画像処理システム
CN104252095A (zh) * 2013-06-25 2014-12-31 卡西欧计算机株式会社 书画摄像机系统以及图像读取方法
US8953225B2 (en) 2011-07-29 2015-02-10 Brother Kogyo Kabushiki Kaisha Image reading device
JP2016032945A (ja) * 2015-11-27 2016-03-10 カシオ計算機株式会社 書画カメラシステム及び画像読み取り方法
JP2018006946A (ja) * 2016-06-30 2018-01-11 京セラドキュメントソリューションズ株式会社 画像形成装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010010821A (ja) * 2008-06-24 2010-01-14 Kyocera Mita Corp 画像読取り装置および画像形成装置
JP2011010030A (ja) * 2009-06-25 2011-01-13 Oki Data Corp 画像読み取り装置及び画像処理システム
US8953225B2 (en) 2011-07-29 2015-02-10 Brother Kogyo Kabushiki Kaisha Image reading device
CN104252095A (zh) * 2013-06-25 2014-12-31 卡西欧计算机株式会社 书画摄像机系统以及图像读取方法
JP2015006754A (ja) * 2013-06-25 2015-01-15 カシオ計算機株式会社 書画カメラシステム及び画像読み取り方法
US9760787B2 (en) 2013-06-25 2017-09-12 Casio Computer Co., Ltd. Document camera system and method for reading image
JP2016032945A (ja) * 2015-11-27 2016-03-10 カシオ計算機株式会社 書画カメラシステム及び画像読み取り方法
JP2018006946A (ja) * 2016-06-30 2018-01-11 京セラドキュメントソリューションズ株式会社 画像形成装置

Similar Documents

Publication Publication Date Title
EP3355567B1 (en) Image processing apparatus and method for controlling image processing apparatus
US20180220015A1 (en) Image processing apparatus, method for controlling the image processing apparatus, and storage medium
US8726178B2 (en) Device, method, and computer program product for information retrieval
US20190245989A1 (en) Image forming apparatus that selectively displays executed jobs, method of controlling same, and storage medium
CN101178725B (zh) 用于信息检索的设备和方法
CN100411418C (zh) 以预定次序打印扫描文档的成像设备及其方法
JPH0675962A (ja) 空マルチメディアデータオブジェクトの自動検出/処理方法及び装置
US20130061134A1 (en) Storage Device Storing Page Processing Program and Information Processing Apparatus
JP4482590B2 (ja) 画像読取装置、画像読取方法、画像形成装置およびプログラム
US8947718B2 (en) Data processing apparatus
JP2006189924A (ja) 画像表示プログラム及び画像表示装置
JP2007081841A (ja) 画像読取装置
US10225418B2 (en) Image forming apparatus, display control method, and storage medium for displaying an image based on a touch operation
US10356261B2 (en) Image-forming apparatus with document reading unit that automatically feeds and reads documents
JP2017072941A (ja) 文書振り分けシステム、情報処理方法及びプログラム
JP5298997B2 (ja) 文書画像編集装置、文書画像編集方法、文書画像編集プログラム、及びその方法をコンピュータに実行させるプログラムを記憶したコンピュータ読み取り可能な記録媒体
JP4040905B2 (ja) 縮小画像表示装置、方法、プログラムおよびプログラムを記録した記録媒体
JPWO2018142474A1 (ja) 画像形成装置
JP2009251168A (ja) 画像形成装置
JP2008278307A (ja) 画像読取システム及び原稿読取システムの制御方法
JP2007187735A (ja) 画像形成装置
JP2007281825A (ja) 画像処理装置及びプログラム
US20250238176A1 (en) Image processing apparatus for outputting image data, method for controlling image processing apparatus, and storage medium
JP2004206521A (ja) 文書検索装置および文書検索プログラム
JP4960401B2 (ja) 画像表示プログラム及び画像表示装置