JP2019198072A - 画像読取装置 - Google Patents
画像読取装置 Download PDFInfo
- Publication number
- JP2019198072A JP2019198072A JP2019088685A JP2019088685A JP2019198072A JP 2019198072 A JP2019198072 A JP 2019198072A JP 2019088685 A JP2019088685 A JP 2019088685A JP 2019088685 A JP2019088685 A JP 2019088685A JP 2019198072 A JP2019198072 A JP 2019198072A
- Authority
- JP
- Japan
- Prior art keywords
- image reading
- unit
- image
- read
- display
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012545 processing Methods 0.000 description 30
- 238000000034 method Methods 0.000 description 27
- 230000003287 optical effect Effects 0.000 description 27
- 238000012015 optical character recognition Methods 0.000 description 25
- 238000013519 translation Methods 0.000 description 24
- 230000006870 function Effects 0.000 description 18
- 230000008569 process Effects 0.000 description 17
- 238000004891 communication Methods 0.000 description 11
- 230000006854 communication Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 5
- 238000003058 natural language processing Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 3
- 238000009966 trimming Methods 0.000 description 3
- 241000282376 Panthera tigris Species 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000007175 bidirectional communication Effects 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000005286 illumination Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000003825 pressing Methods 0.000 description 2
- 210000003813 thumb Anatomy 0.000 description 2
- 208000010415 Low Vision Diseases 0.000 description 1
- 101100268556 Mus musculus App gene Proteins 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 210000003811 finger Anatomy 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000004303 low vision Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
Images
Landscapes
- Facsimile Scanning Arrangements (AREA)
- Facsimiles In General (AREA)
Abstract
【課題】走査式の画像読取部を備えた画像読取装置の提供【解決手段】画像読取装置1は、被読取媒体からの情報を走査によって読み取る装置であって、被読取媒体の画像を連続的に読み取る画像読取部4と、画像読取部4が連続的に読み取った画像を記憶する記憶部と、画像読取部4が読み取った画像を表示可能であって表示面1Aに設けられた表示部3と、画像読取部4と、記憶部と、表示部4とを制御する制御部と、を有し、画像読取部4は、表示面1Aと交差する読取面1Bに設けられていることを特徴としている。【選択図】図1
Description
本発明は画像読取装置に関し、特に被読取媒体上を走査することにより画像を読取る画像読取装置に関する。
従来より、接触式の画像読取部を備えた画像読取装置が知られている(例えば、特許文献1)。表示部の裏面には、シート状でかつ透過型のフォトアレイセンサからなる画像読取部が設けられている。画像読取部には光源部が積層され、光源部からの光の反射光から画像を読取っている。画像読取装置では、例えば画像読取部を被読取媒体である名刺等の上に載置し、スキャンすることで名刺を読取ることができる。
また、他の先行技術においては、ペン型スキャナの読取結果をスマートフォン等の端末に送信し、当該結果を外部サーバに送信するスキャンシステムが知られている(例えば、特許文献2)。スキャンシステムでは、スキャン対象の媒体における種類の異なるデータを適切な形式に変換し保存している。
また、電子書籍等を購入する際には、スマートフォンやタブレット等の端末で電子書籍を検索し、所望の電子書籍を購入する。電子書籍とは、紙とインクを利用した印刷物ではなく、電子機器のディスプレイで読むことができる出版物であり、具体的には電子データとして適宜の記憶媒体に記憶し、その記憶媒体を前記電子機器に装着することにより読むことができる。
実店舗における書籍の購入と電子書籍における書籍の購入との最大の違いは、実物が陳列されている中から所望の書籍を選択するか、所望の電子書籍のみを検索でヒットさせて選択するかという点にある。電子書籍の販売において、ユーザが実店舗に近い感覚で書籍を購入することができる書籍販売システムが知られている(例えば、特許文献3)。このような書籍販売システムでは、端末のディスプレイには書籍を陳列した書棚が表示され、端末はサーバから書籍背表紙画像を含む信号を受信し、複数の背表紙が書棚に陳列されていることを模した画像が形成されている。書棚に配置されたディスプレイの周囲は、書籍が陳列された書棚であり、ディスプレイには書棚に書籍が陳列されているのと同様の画像を表示できる。これにより、周囲の書棚とディスプレイ画像の区別がつきにくくなり、ユーザは書棚に陳列された書籍に接するのに近い感覚で、ディスプレイに表示された背表紙画像に接することができる。
さらに、スマートフォンに搭載されているカメラで文字列の含まれる光景を撮影し、ユーザが画像のトリミング処理をすることにより文字列を読み込ませることができる。
しかしながら、特許文献1に記載の画像読取装置では、端末の裏面に被読取媒体上に照射された光の反射光から画像を読み取る透明なシート状の画像読取部が設けられているため、名刺や図表などの広い面積の画像を読取るには適していたが書籍の文字列など細い領域を読取るには適していなかった。特に、読み取った文字列に対してOCR処理を行う際は、広い面積でスキャンを行うと周囲の文字を誤って読み取ってしまう可能性があった。この場合には、誤って読み取った文字が読取結果にノイズとして表れてしまい、適切な状態で文字認識処理を行うことが難しかった。また、端末の裏面に画像読取部が設けられているため、被読取媒体を読取る際は端末を被読取媒体上に載置する必要がある。さらに、画像読取部の面積分でしか読取ができないため、より広い面積を読取ることが難しかった。
また、特許文献2に記載のスキャンシステムでは、ペン型スキャナとスマートフォンとが別体であるため、ペン型スキャナで被読取媒体上を走査させた後にスマートフォンで所定の操作を行う必要があり、画像の読取からサーバの送信までユーザに手間が掛かっていた。
また、特許文献3に記載の方法では、ユーザはディスプレイ上では実店舗に近い感覚で電子書籍を購入することができるが、小さいディスプレイ上では表現できる本棚も限られるとともに電子書籍を検索する際の文字入力はユーザの負担となっていた。書店にて電子書籍を購入する際は、スマートフォンから電子書籍のサイトにアクセスし書籍名称を入力することで検索していたが、文字入力の手間等からさらなる簡便なシステムが求められていた。また、書籍に限らず新聞記事や古書など目の前に存在している読み物をスマートフォン等で検索したい場合には、新聞記事のタイトルや古書の題号を入力する必要があり必ずしもユーザにとって使いやすいとは言えなかった。
さらに、スマートフォンに搭載されているカメラで文字列を読み込むときは、撮影のため静止しなければならず、ピント合わせに時間がかかっていた。さらにカメラでの撮影ではデジタルズーム等を活用しても細長い文字列のみを撮影することは難しく、広範囲な撮影がなされるため、特定の文字列のみを読み込むときは撮影された画像のトリミングの手順が必要となり、作業に手間が掛かっていた。
そこで、本発明は、走査式の画像読取部を備えた画像読取装置を提供することを目的とする。
上記課題を解決するために第1の発明は、被読取媒体からの情報を走査によって読み取る画像読取装置であって、前記被読取媒体の画像を読み取る画像読取部と、前記画像読取部が読み取った前記画像を記憶する記憶部と、前記画像読取部が読み取った前記画像を表示可能であって表示面に設けられた表示部と、前記画像読取部と、前記記憶部と、前記表示部とを制御する制御部と、を有し、前記画像読取部は、前記表示面と交差する読取面に設けられていることを特徴とする画像読取装置を提供している。
第2の発明では、第1の発明に記載された画像読取装置であって、前記読取面が前記被読取媒体と当接して前記画像読取部が前記被読取媒体の画像を読み取り、前記読取面は、前記表示面に対して略直交し、前記読取面と前記被読取媒体とを当接させたとき、前記表示面は前記被読取媒体に対して略直交し、前記被読取媒体からの情報を読み取るときは、前記表示面に略直交する方向である読取方向に走査することを特徴としている。
第3の発明では、第1の発明または第2の発明に記載された画像読取装置であって、前記表示部は、接触することにより操作されるタッチパネルであって、前記制御部は、前記表示部に、指標と、第1領域と、第2領域と、を描画し、前記指標は、前記画像読取部の走査量に応じて前記表示部内を移動し、前記制御部は、前記第1領域が操作されたときは第1の機能を実行し、前記第2領域が操作されたときは第1の機能とは異なる第2の機能を実行することを特徴としている。
なお、表示部には、第1領域と第2領域のみ描画されていてもよく、第1領域と、第2領域と、第1領域及び第2領域に隣接する無反応領域と、が描画されていてもよい。
第4の発明では、第1の発明から第3の発明のいずれかに記載された画像読取装置であって、前記表示部が設けられている本体部と、前記画像読取部が設けられている回動支持部と、をさらに有し、前記回動支持部は、前記本体部に対して、少なくとも1つの回動軸を中心に回動可能であることを特徴としている。
第1の発明によると、画像読取部が表示面と交差する面である読取面に設けられているため、画像読取装置を被読取媒体に対して立設した状態で画像読取部と被読取媒体とを当接させることができる。これにより画像読取装置が把持し易くなるため、被読取媒体上を走査させるとき画像読取装置を円滑に移動させることができ、画像読取部の読取エラー等を抑制することができる。また、読取面は表示面と交差する面であるため、画像読取部が画像読取装置の厚みに相当する面に設けられることとなる。一般には、スマートフォン等の端末における側面である読取面は表示部が設けられている面及びその裏面と比較して薄いため、画像読取部が読取可能な領域が狭くなる。これにより、画像読取部で書籍を1行ごとに走査させ読取るとき、隣の行の文字列を認識することなく精度の高い文字認識が可能となる。さらに、画像読取部は被読取媒体と直接当接させて走査させることにより画像を読取るため、スマートフォン等に搭載されているカメラ等によって画像を読取る場合と比べて、焦点調整や振動制御によるボケ抑制などの光学素子が不要になるとともに、絞りやシャッター速度などの露光条件の設定も不要となる。これにより、ユーザは簡易な操作で文字列等の読取を行うことができる。また、スマートフォン等に搭載されているカメラ等によって画像を読取る場合には、不要な文字列も読取ってしまうため、トリミングなどの画像処理が必要となるが、本件発明においてはこのような画像処理が不要となる。これにより、ユーザは簡易に文字列等を読取ることができる。さらに、フラットヘッドスキャナーやハンディスキャナーに用いられる機械走査などの機構が不要となるため、低コストで画像読取装置を実現することができる。画像読取部を読取面に設けることにより複雑な光学集光の機構を小型化することができるため、コンパクトな画像読取装置を実現することができる。
第2の発明によると、読取面が被読取媒体と当接して画像を読取るため、画像読取装置が被読取媒体と常に当接した状態となり安定して精度良く画像を読取ることができる。また、画像読取端末で被読取媒体の画像を読取っているとき表示面は被読取媒体に対して略直交しているため、ユーザは表示面を見ながら読取作業を行うことができ、操作性に優れた画像読取装置を実現できる。さらに、読取方向が表示面に略直交する方向であるため、画像読取装置を安定的に把持することができ読取エラー等を抑制することができる。また、ユーザは表示部を見ながら読取作業を行うことができる。
第3の発明によると、指標が画像読取部の走査量に応じて表示部内を移動するため、画像読取装置を卓上などで動かすことによって表示部に表示された指標の位置を移動させることができる。また、第1領域が操作されたときは第1の機能を実行し、第2領域が操作されたときは第1の機能とは異なる第2の機能を実行するため、第1の機能を左クリックとして第2の機能を右クリックとすると、画像読取装置に光学式マウスとしての機能を持たせることができる。これにより、画像読取装置の操作性を向上させることができる。例えば、画像読取部が回動することにより、使用者が見やすいよう表示部を使用者の方向に向けたままの状態で、縦書き、横書き双方の文章の読み取りをなすことができる。従来の画像読取装置は表示部に直接タッチするタッチパネルであるため、細かな操作が難かった。しかし、本発明によると、画像読取装置を移動させることによって指標を移動させるため、ズーム、範囲選択、図形の作成などの操作性が改善された。また、一般には、スマートフォン等の端末における側面である読取面は表示部が設けられている面及びその裏面と比較して薄い形状となっているが、この性質を活かし、画像読取装置の使用用途に適した形の姿勢を選択できる。文章読取り時には画像読取装置を立設した状態で使用することで、把持し易く円滑動作が可能で、かつ書籍等との接触面が小さいため目的とする文章の読み取り部分をピンポイントで細かく的確に指定できるようにする一方、マウスアプリ使用時には画像読取装置を卓上等で伏せて使用することで、机等との接触面を大きくし、より安定的な状態での精緻なポインタ操作による、細かい作業をすることができる。
第4の発明によると、画像読取部が設けられている回動支持部を有しているため、画像読取部が本体部に対して回動することができる。これにより、必要に応じて様々な状態で画像読取部を使用することができる。また、回動支持部は本体部に対して少なくとも1つの回動軸を中心に回動可能であるため、複数の回動軸を中心に回動可能とすることにより、画像読取部をユーザの所望の位置に配置することができる。これにより、操作性の高い画像読取装置を実現することができる。
これにより、本発明によって走査式の画像読取部を備えた画像読取装置を提供することができる。
本発明の第1の実施の形態による画像読取装置1を図1乃至図14に基づき説明する。図1に示すように、前後上下左右方向を定義する。以下の説明において、直交、垂直、平行とは、略直交、略垂直、略平行の概念を含むものとする。
[ハードウェア構成]
図1及び図2に示すように、画像読取装置1はスマートフォン又はタブレット等の端末であって、制御部2と、表示部3と、画像読取部4と、通信部5と、記憶部6と、操作部7と、電源部8と、音声出力部9と、を備えている。制御部2はCPU及びメモリから構成され、記憶部6に記憶されているオペレーティングシステムやプログラムをメモリ上にロードし、プログラムに含まれる様々な指令を実行する。画像読取装置1は、表示部3が設けられている表示面1Aと、表示面1Aと直交(交差)する面であって画像読取部4が設けられている読取面1Bと、を備えている。
図1及び図2に示すように、画像読取装置1はスマートフォン又はタブレット等の端末であって、制御部2と、表示部3と、画像読取部4と、通信部5と、記憶部6と、操作部7と、電源部8と、音声出力部9と、を備えている。制御部2はCPU及びメモリから構成され、記憶部6に記憶されているオペレーティングシステムやプログラムをメモリ上にロードし、プログラムに含まれる様々な指令を実行する。画像読取装置1は、表示部3が設けられている表示面1Aと、表示面1Aと直交(交差)する面であって画像読取部4が設けられている読取面1Bと、を備えている。
画像読取部4は、光源41と、イメージセンサ42と、センサ43と、光学レンズ群44と、を備えている。図1に示すように、画像読取部4は画像読取装置1において表示部3が設けられている表示面1Aと交差(直交)する面に設けられている。換言すると、画像読取部4の上面及び下面以外の側面である前面の左寄りに設けられている。読取面1Bは、表示面1Aと、画像読取装置1の前面と、画像読取装置1の右面と、画像読取装置1の左面と、画像読取装置1の後面と、のすべての面と交差している。
画像読取部4は、スキャン対象となる被読取媒体10(図12)上を読取方向Rに沿って走査することにより、被読取媒体10をスキャンする機能を備える。画像読取部4は、ユーザの操作に応じて被読取媒体10の任意の部分をスキャンし、スキャンした部分が電子画像化された画像情報を生成する。ユーザが画像読取部4と被読取媒体10とを当接させた状態で画像読取装置1を走査させることにより、画像読取部4が連続的に被読取媒体10を読取り、複数の画像情報を生成し、当該画像情報を結合して記憶部6に記憶する。ここで、スキャン対象となる被読取媒体は、典型的には、紙書籍である。ユーザは、電子化された情報として紙書籍の一部を取得したい場合、紙書籍中の任意の部分(本文、題号、ページ番号、図など)を、画像読取装置1で読み取る。
図3に示すように、光源41はLED等で構成された照明用光源であって、読取面1B近傍に設けられていて開口近傍を所定の時間間隔で照射する。光学レンズ群44は、開口端部から望まれる一定領域内の2次元画像を光路45で示すようにイメージセンサ42において逆向きに結像する。ここで、一定領域は、光源41によって照射される照明領域内の領域であって、被読取媒体10の画像を読取るスキャン領域となる。光学レンズ群44には、前後方向の移動を可能とする焦点調節機構が設けられていて、イメージセンサ42上に画像を結像するように焦点距離の調節を行うことができる。
イメージセンサ42は、光学レンズ群によって結像された像を光電変換し、画像情報を生成する。換言すると、イメージセンサ42は被読取媒体10の一部(例えば、紙書籍の紙面の一部)を撮像し、その一部を電子化された画像として画像情報を生成し、制御部2に出力する。画像情報が示す1つの画像は、例えば、被読取媒体10に記載された文章の一部の文字列、又は図面の一部を示す画像となる。イメージセンサ42は、所定時間間隔毎にスキャンして連続的に画像情報を取得する。制御部2に出力された複数の画像情報は互いに結合されて文字列情報又は図形情報となる。イメージセンサ42が画像情報を取得する時間間隔は、画像読取装置1を被読取媒体10で走査させる走査速度に応じて任意に設定することができる。
イメージセンサ42の露光時間中に入力画像が移動すると、その移動した距離の分だけ画像情報がぶれる現象が発生する。そこで、本実施の形態の光源41は、1回の照射時間を短くすることにより取り込む画像のブレを最小限に抑えている。光源41の照射動作時間及びイメージセンサ42の画像取得時間の間隔は、走査速度に応じて任意に設定することができる。
光源41は、LED、有機EL、無機ELのいずれであってもよく、その他の光源を用いることもできる。光源41の色は、白色であってもよく、赤色(Red)、緑色(Green)、青色(Blue)の3色であってもよい。RGBの3色を用いることによりカラーでの読取が可能となる。本実施の形態においては、画像が認識できれば光源の色は限定されない。画像読取装置1で被読取媒体10を読取る際は、画像読取部4と被読取媒体10とが密着するため、外部光を遮断して光源41からの光のみを検出することができる。これにより、外部光による輝度ムラや色ムラが発生し難く再現性の高い画像検知が可能となる。
制御部2は、生成された文字列情報または図形情報を処理方法に応じた所定の情報形式に変換する。情報を変換するための所定の処理として、光学文字認識処理(OCR処理)、JPG化(Joint Photographic experts Group)、pdf出力(Portable Document Format)等がある。
センサ43は、画像読取部4の被読取媒体10への接触・非接触を検出するための検出センサである。センサ43は、近接センサ、圧力センサ、マイクロスイッチなどを用いることができる。
通信部5は、図4に示すように、画像読取装置1を外部ネットワーク20と任意の無線通信を介して双方向通信可能に接続する。無線通信には、3G(Third Generation)、4G(Fourth Generation)、LTE(Long Term Evolutaion)などの移動体通信であってもよく、Bluetooth(登録商標)、無線LAN(Local Area Network)などの近距離無線通信であってもよい。
画像読取装置1は、外部ネットワーク20を介して、書籍サーバ21と、検索サーバ22と、デジタルアーカイブサーバ23と、翻訳サーバ24と、接続されている。
記憶部6は、オペレーティングシステムやプログラム等が記憶されるHDD(Hard Disk Drive)又はSSD(Solid State Drive)から構成される。本発明を実行するためのプログラム及び各種データは、ホストコンピューター(サーバ)が備えている記憶媒体からネットワークを介して記憶部6に配信してもよい。
操作部7は、各種情報を入力するために設けられていて、本実施の形態では表示部3におけるタッチパネルである。操作部は、ボタンやキーであってもよく、画像読取装置1に無線又は有線で接続されたキーボードやタッチパッドであってもよい。電源部8は、充電可能なバッテリーであって、画像読取装置1の各部に電源を供給している。
音声出力部9は、画像読取装置1が備えるスピーカーであって制御部2によって制御される。画像読取装置1が備える図示せぬ、カメラ、LEDライト、加速度センサ、GPS(Global Positioning System)などの位置情報検出機能も必要に応じて画像読取装置1の機能として利用することができる。画像読取装置1には、様々なメディアを挿入可能なカードスロット部が設けられていてもよい。カードスロット部に挿入されたメディアは記憶部6の容量を拡張する事が出来き、また他のカードスロットを持った装置とのデータ交換にも活用する事ができる。
[書籍アプリ]
画像読取装置1の記憶部6には、各種アプリケーションがインストールされている。各アプリケーションにおける画像読取部4の動作について説明する。なお、各種アプリケーションは、外部ネットワーク20に接続されることによりウェブブラウザを介して外部サーバから配信されるウェブアプリケーションであってもよい。
画像読取装置1の記憶部6には、各種アプリケーションがインストールされている。各アプリケーションにおける画像読取部4の動作について説明する。なお、各種アプリケーションは、外部ネットワーク20に接続されることによりウェブブラウザを介して外部サーバから配信されるウェブアプリケーションであってもよい。
画像読取装置1にインストールされている書籍アプリについて、図5乃至図7に基づいて説明する。書籍アプリとは、画像読取部4で読み取った書籍のタイトルに基づいて電子書籍を検索・購入するためのアプリケーションである。書籍アプリを起動すると(S1:YES)、書籍アプリの画面が表示部3に表示され読取待機状態となる。読取待機状態では、制御部2が、センサ43の被読取媒体10への接触に基づいて、画像読取が開始されたか否かを判断する(S2)。制御部2は、センサ43が被読取媒体10に接触したと判断すると(S2:YES)、光源41が所定時間間隔で点灯しイメージセンサ42が被読取媒体10からの反射光を読取ることよって画像読取が行われる(S3)。このとき、画像読取部4が読み取った画像情報は制御部2によって連続的に結合されるとともに、OCR処理される(S4)。OCR処理は公知の処理であって、必要に応じて輪郭補正やコントラスト補正等の前処理を行った後に文字認識を実行する。制御部2は、本発明の文字認識部に相当する。
OCR処理された文字列情報は、外部ネットワーク20を介して通信部5によって書籍サーバ21に送信される(S5)。ここで、イメージセンサ42の画像取得の時間間隔は、画像読取部4が被読取媒体10上を走査して1文字読み取る程度の時間間隔である。換言すると、画像読取部4が1文字読取る毎にOCR処理を行い(S4)、当該処理結果を書籍サーバ21に送信する(S5)。
図6に示すように、OCR結果である文字列情報は書籍サーバ21に送信され(S11)、書籍サーバ21における書籍データベースを参照し(S12)、文字列が一致する書籍タイトルを抽出する(S13)。抽出された書籍のリストは、書籍サーバ21から外部ネットワーク20を介して画像読取装置1に送信される(S14、S5)。制御部2は、書籍サーバ21から受信した抽出結果を表示部3に表示する(S6)。
制御部2は、画像読取が終了したか否か、つまりセンサ43が被読取媒体10と離間したか否かを判断する(S7)。制御部2は、画像読取が終了していないと判断した場合には(S7:NO)、再びS3に戻ってS3からS6のプロセスを繰り返し実行する。制御部2は、画像読取が終了したと判断した場合には(S7:YES)、次のステップに進む。
ユーザは、画像読取装置1で書籍の表紙や背表紙からタイトルをスキャンすることができる。例えば、書籍「我輩は虎である」のタイトルを画像読取装置1でスキャンしたときの表示部3を図7に示す。制御部2は、画像読取部4が1文字読み取る毎にS3からS6のステップを繰り返し実行するため、表示部3には読取が進むごとに検索結果が絞られて表示される。
図7(a)は、書籍タイトル「我輩は」まで読み取ったときの表示部3である。表示部3には、読取結果31と、検索結果32と、詳細結果33と、購入ボタン34と、スキャン表示35と、が表示されている。検索結果32及び詳細結果33には、読取結果31と一致する書籍タイトルの一覧が表示される。検索結果32には4件と表示され、先頭の文字列が「我輩は」と一致する書籍が詳細結果33に表示されている。詳細結果33に隣接するように、各詳細結果33に対応する購入ボタン34が表示される。ユーザはこの段階で所望の書籍が詳細結果33に表示されている場合には、画像読取部4と被読取媒体10とを離間させて読取を完了し(S7:YES)、所望の詳細結果33に対応する購入ボタン34を押下することにより(S8:YES)、電子書籍購入手続に進む(S9)。電子書籍の購入手続は、公知の電子書籍購入と同様に、予め登録しておいたユーザのクレジットカード等からの引き落とし等によって行われる。
ユーザが書籍タイトルの読取をさらに進めたときの表示部3を図7(b)に示す。読取結果31には、書籍タイトルである「我輩は虎である」が表示され、検索結果32には1件、詳細結果33には読取結果31と一致する書籍タイトルが表示されている。書籍タイトルの読取が完了しているため、画像読取部4と被読取媒体10とは離間しており、スキャン表示35は表示されていない。ユーザは、購入ボタン34を押下することにより(S8:YES)、電子書籍の購入手続に進む(S9)。
書籍アプリでは、電子書籍の購入の他に、電子書籍の購読や定期購読などを行うことができる。再び電子書籍を検索する場合には、(S10:NO)、画像読取部4を被読取媒体10に当接させ書籍タイトルの読取を開始する(S2:YES)。書籍アプリを終了することにより(S10:YES)、本フローは終了する。
書籍アプリでは、通信部5が書籍サーバ21にOCR結果を送信したが、デジタルアカイブモードを設け、デジタルアーカイブサーバ23にOCR結果を送信してもよい。このときは、図4と略同一のフローとなるが、購入手続(S9)が不要となりデジタルアーカイブのダウンロード手続となる。
[テキストデータ出力アプリ]
次にテキストデータ出力アプリについて、図8及び図12を参照して説明する。テキストデータ出力アプリは、画像読取部4が読み取った読取結果に基づいて表示部3上でのテキストデータ表示を行う。テキストデータ出力アプリを起動すると(S61:YES)、テキストデータ出力アプリの画面が表示部3に表示され読取待機状態となる。読取待機状態では、制御部2が、センサ43の被読取媒体10への接触に基づいて、画像読取が開始されたか否かを判断する(S62)。制御部2は、センサ43が被読取媒体10に接触したと判断すると(S62:YES)、光源41が所定時間間隔で点灯し画像読取部4によって画像読取が開始される(S63)。
次にテキストデータ出力アプリについて、図8及び図12を参照して説明する。テキストデータ出力アプリは、画像読取部4が読み取った読取結果に基づいて表示部3上でのテキストデータ表示を行う。テキストデータ出力アプリを起動すると(S61:YES)、テキストデータ出力アプリの画面が表示部3に表示され読取待機状態となる。読取待機状態では、制御部2が、センサ43の被読取媒体10への接触に基づいて、画像読取が開始されたか否かを判断する(S62)。制御部2は、センサ43が被読取媒体10に接触したと判断すると(S62:YES)、光源41が所定時間間隔で点灯し画像読取部4によって画像読取が開始される(S63)。
画像読取が開始されると、制御部2は所定時間間隔でOCR処理を行い(S64)、処理結果を図12に示すように表示部3上にテキストデータとして表示する(S65)。表示部3は一般的な形式のテキストエディタ、ワープロ、ウェブブラウザ等のテキストデータ処理ソフトが表示され、読み取られたテキストデータがウィンドウ上に表示される。表示部3上にテキストデータのみが表示されてもよい。また後述のマウスアプリと組み合わせて使用してもよい。OCR処理は制御部2によって実行されたが、外部ネットワーク20を介して外部サーバによって実行されてもよい。これにより、アプリケーションのアップデート等を実行することなく精度の高い処理を実行することができる。
制御部2は、画像読取が終了したか否か、つまりセンサ43が被読取媒体10と離間したか否かを判断する(S66)。制御部2は、画像読取が終了していないと判断した場合には(S66:NO)、再びS63に戻って画像読取を継続する。ふたたびS63からS65までを実行する間隔は、時間に基づいて設定されてもよく、読み込んだ文字数に基づいて設定されてもよい。図12にテキストデータ出力アプリを起動した状態で被読取媒体10の文章を読取っている状態を示す。表示部3には、テキストデータとしての被読取媒体10の文章が表示されている。制御部2は、画像読取が終了したと判断した場合には(S66:YES)、テキストデータ出力アプリを終了したか否かを判断する(S67)。テキストデータ出力アプリを終了していない場合は再びS52に戻り(S67:NO)、テキストデータ出力アプリを終了した場合は本フローが終了する(S67:YES)。
[検索アプリ]
次に検索アプリについて、図9及び図10を参照して説明する。検索アプリは、画像読取部4が読み取った読取結果に基づいてウェブ検索や地図検索を行う。検索アプリを起動すると(S21:YES)、検索モードを選択する画面が表示部3に表示される(S22)。本実施の形態では、検索アプリはウェブ検索モードと、地図検索モードと、を備えている。ウェブ検索モードでは画像読取部4の読取結果をウェブ検索することができ、地図検索モードでは画像読取部4の読取結果を地図検索することができる。いずれかのモードが選択されると、読取待機状態となる。読取待機状態では、制御部2が、センサ43の被読取媒体10への接触に基づいて、画像読取が開始されたか否かを判断する(S23)。制御部2は、センサ43が被読取媒体10に接触したと判断すると(S23:YES)、光源41が所定時間間隔で点灯し画像読取部4によって画像読取が開始される(S24)。
次に検索アプリについて、図9及び図10を参照して説明する。検索アプリは、画像読取部4が読み取った読取結果に基づいてウェブ検索や地図検索を行う。検索アプリを起動すると(S21:YES)、検索モードを選択する画面が表示部3に表示される(S22)。本実施の形態では、検索アプリはウェブ検索モードと、地図検索モードと、を備えている。ウェブ検索モードでは画像読取部4の読取結果をウェブ検索することができ、地図検索モードでは画像読取部4の読取結果を地図検索することができる。いずれかのモードが選択されると、読取待機状態となる。読取待機状態では、制御部2が、センサ43の被読取媒体10への接触に基づいて、画像読取が開始されたか否かを判断する(S23)。制御部2は、センサ43が被読取媒体10に接触したと判断すると(S23:YES)、光源41が所定時間間隔で点灯し画像読取部4によって画像読取が開始される(S24)。
制御部2は、画像読取が終了したか否か、つまりセンサ43が被読取媒体10と離間したか否かを判断する(S25)。制御部2は、画像読取が終了していないと判断した場合には(S25:NO)、再びS24に戻って画像読取を継続する。制御部2は、画像読取が終了したと判断した場合には(S25:YES)、次のステップに進む。このとき画像読取部4が読み取った画像情報は制御部2によって連続的に結合されるとともにOCR処理される(S26)。OCR処理された文字列情報は、外部ネットワーク20を介して通信部5によって検索サーバ22に送信され(S27)、その結果が表示部3に表示される(S28)。
図10(a)は、OCR処理の結果をウェブ検索モード選択時における、検索サーバ22からの受信結果を表示したときの表示部3である。表示部3にはウェブブラウザが表示され、読取結果51と、検索結果52と、サイドバー53と、を備えている。ユーザは、読取結果51を選択することにより所望のURLにアクセスすることができる。
図10(b)は、OCR処理の結果を地図検索モード選択時における、検索サーバ22からの受信結果を表示したときの表示部3である。表示部3には、読取結果54と、現在地55と、拡大・縮小ボタン56と、が表示されている。ユーザは、スクロール操作等によって地図を任意に移動させることができる。
[音声出力アプリ]
次に音声出力アプリについて、図11を参照して説明する。音声出力アプリは、画像読取部4が読み取った読取結果に基づいて音声出力部9からの音声出力を行う。音声出力アプリを起動すると(S31:YES)、音声出力アプリの画面が表示部3に表示され読取待機状態となる。読取待機状態では、制御部2が、センサ43の被読取媒体10への接触に基づいて、画像読取が開始されたか否かを判断する(S32)。制御部2は、センサ43が被読取媒体10に接触したと判断すると(S32:YES)、光源41が所定時間間隔で点灯し画像読取部4によって画像読取が開始される(S33)。
次に音声出力アプリについて、図11を参照して説明する。音声出力アプリは、画像読取部4が読み取った読取結果に基づいて音声出力部9からの音声出力を行う。音声出力アプリを起動すると(S31:YES)、音声出力アプリの画面が表示部3に表示され読取待機状態となる。読取待機状態では、制御部2が、センサ43の被読取媒体10への接触に基づいて、画像読取が開始されたか否かを判断する(S32)。制御部2は、センサ43が被読取媒体10に接触したと判断すると(S32:YES)、光源41が所定時間間隔で点灯し画像読取部4によって画像読取が開始される(S33)。
画像読取が開始されると、制御部2は所定時間間隔でOCR処理を行い(S34)、この処理結果に対して公知の自然言語処理を行う。自然言語処理では、OCR処理結果のテキスト文字列に対して形態素解析を用いることによって文章を形態素に分割して単語毎に区切り、各単語を正規化する。単語の正規化では、文字種の統一や表記揺れの吸収など単語の置き換え処理を行う。このとき、数字の置換、辞書を用いた単語の統一を行っても良い。ストップワードを除去した後、処理結果を音声出力部9から音声出力する(S36)。OCR処理及び自然言語処理は制御部2によって実行されたが、外部ネットワーク20を介して外部サーバによって実行されてもよい。これにより、アプリケーションのアップデード等を実行することなく精度の高い処理を実行することができる。
制御部2は、画像読取が終了したか否か、つまりセンサ43が被読取媒体10と離間したか否かを判断する(S37)。制御部2は、画像読取が終了していないと判断した場合には(S37:NO)、再びS33に戻って画像読取を継続する。ふたたびS33からS36までを実行する間隔は、時間に基づいて設定されてもよく、読み込んだ文字数に基づいて設定されてもよく、自然言語処理の解析結果に基づいて設定されてもよい。制御部2は、画像読取が終了したと判断した場合には(S37:YES)、音声出力アプリを終了したか否かを判断する(S38)。音声出力アプリを終了していない場合は再びS32に戻り(S38:NO)、音声出力アプリを終了した場合は本フローが終了する(S38:YES)。
[拡大アプリ]
次に、拡大アプリについて図13を参照して説明する。拡大アプリを起動しセンサ43と被読取媒体10とを接触させ読取方向Rに走査すると、画像読取部4が読み取った画像がそのまま表示部3に拡大して表示される。具体的には、表示部3には「我輩は」が部分的に表示されている。画像読取部4が読み取った画像をOCR処理してテキストデータ化し、表示部3に表示してもよい。
次に、拡大アプリについて図13を参照して説明する。拡大アプリを起動しセンサ43と被読取媒体10とを接触させ読取方向Rに走査すると、画像読取部4が読み取った画像がそのまま表示部3に拡大して表示される。具体的には、表示部3には「我輩は」が部分的に表示されている。画像読取部4が読み取った画像をOCR処理してテキストデータ化し、表示部3に表示してもよい。
[翻訳アプリ]
次に翻訳アプリについて、図14を参照して説明する。翻訳アプリは、画像読取部4が読み取った読取結果を所定の言語に翻訳して表示部3に表示する。翻訳アプリを起動すると(S41:YES)、翻訳アプリの画面が表示部3に表示され読取待機状態となる。読取待機状態では、制御部2が、センサ43の被読取媒体10への接触に基づいて画像読取が開始されたかを判断する(S42)。制御部2は、センサ43が被読取媒体10に接触したと判断すると(S42:YES)、光源41が所定時間間隔で点灯し画像読取部4によって画像読取が開始される(S43)。
次に翻訳アプリについて、図14を参照して説明する。翻訳アプリは、画像読取部4が読み取った読取結果を所定の言語に翻訳して表示部3に表示する。翻訳アプリを起動すると(S41:YES)、翻訳アプリの画面が表示部3に表示され読取待機状態となる。読取待機状態では、制御部2が、センサ43の被読取媒体10への接触に基づいて画像読取が開始されたかを判断する(S42)。制御部2は、センサ43が被読取媒体10に接触したと判断すると(S42:YES)、光源41が所定時間間隔で点灯し画像読取部4によって画像読取が開始される(S43)。
画像読取が開始されると、制御部2は所定時間間隔でOCR処理を行い(S44)、この処理結果に対して公知の翻訳処理を行う(S45)。翻訳処理では、OCRの処理結果を、外部ネットワーク20を介して翻訳サーバ24に送信する。翻訳サーバ24によって翻訳された結果は、通信部5が受信する。制御部2は、翻訳結果が音声出力するように設定されているか否かを判断する(S46)。翻訳結果が音声出力するように設定されていない場合には(S46:NO)、制御部2は表示部3に翻訳サーバ24からの翻訳結果を表示する(S47)。翻訳結果が音声出力するように設定されている場合には(S46:YES)、制御部2は表示部3に翻訳サーバ24からの翻訳結果を音声出力部9から音声出力する(S48)。このとき、翻訳サーバ24からの受信結果は、S35と同様に自然言語処理を実行した後に音声出力される。この自然言語処理は制御部2によって実行されたが、外部ネットワーク20を介して外部サーバによって実行されてもよい。
制御部2は、画像読取が終了したか否か、つまりセンサ43が被読取媒体10と離間したか否かを判断する(S49)。制御部2は、画像読取が終了していないと判断した場合には(S49:NO)、再びS43に戻って画像読取を継続する。制御部2は、画像読取が終了したと判断した場合には(S49:YES)、翻訳アプリを終了したか否かを判断する(S50)。翻訳アプリを終了していない場合は再びS42に戻り(S50:NO)、翻訳アプリを終了した場合は本フローが終了する(S50:YES)。
このような構成によると、画像読取部4が表示面1Aと直交する前面である読取面1Bに設けられているため、画像読取装置1を被読取媒体10に対して立設した状態で画像読取部4と被読取媒体10とを当接させることができる。これにより画像読取装置1が把持し易くなるため、被読取媒体10上を走査させるとき画像読取装置1を円滑に移動させることができ、画像読取部4の読取エラー等を抑制することができる。また、読取面1Bは表示面1Aと直交する前面であるため、画像読取部4が画像読取装置1の厚みに相当する面に設けられることとなる。一般には、スマートフォン等の端末における側面である読取面1Bは表示部3が設けられている面及びその裏面と比較して薄いため、画像読取部4が読取可能な領域が狭くなる。これにより、画像読取部4で書籍を1行ごとに走査させ読取るときに隣の行の文字列を認識することなく精度の高い文字認識が可能となる。さらに、画像読取部4は被読取媒体10と直接当接させて走査させることにより画像を読取るため、スマートフォン等に搭載されているカメラ等によって画像を読取る場合と比べて、焦点調整や振動制御によるボケ抑制などの光学素子が不要になるとともに、絞りやシャッター速度などの露光条件の設定も不要となる。これにより、ユーザは簡易な操作で文字列等の読取を行うことができる。また、スマートフォン等に搭載されているカメラ等によって画像を読取る場合には、不要な文字列も読取ってしまうため、始点と終点を指定するなどの画像処理が必要となるが、画像読取装置1においてはこのような画像処理が不要となる。これにより、ユーザは簡易に文字列等を読取ることができる。さらに、フラットヘッドスキャナーやハンディスキャナーに用いられる機械走査となどの機構が不要となるため、低コストで画像読取装置1を実現することができる。画像読取部4を読取面1Bに設けることにより複雑な光学集光の機構を小型化することができるため、コンパクトな画像読取装置1を実現することができる。
このような構成によると、読取面1Bが被読取媒体10と当接して当該被読取媒体10上を走査することにより文字列等の画像を読取るため、画像読取装置1が被読取媒体10と常に当接した状態となり安定して精度良く画像を読取ることができる。また、画像読取装置1で被読取媒体10の画像を読取っているとき表示面1Aはユーザ側を向いているため、ユーザは表示部3を見ながら読取作業を行うことができ、操作性に優れた画像読取装置1を実現できる。さらに、読取方向Rが表示面1Aに略直交する方向であるため、画像読取装置1を安定的に把持することができ読取エラー等を抑制することができる。また、ユーザは表示部3を見ながら読取作業を行うことができる。
このような構成によると、画像読取部4が画像読取装置1の前側側面の左寄りに設けられているため、右手で画像読取装置1を把持しながら右手の親指で表示部3を操作することができる。これにより、画像読取部4の読取作業時における操作性を改善することができる。また、読取方向Rが上下方向であるため、画像読取部4の被読取媒体10の文字列に対する位置決めがし易い。
このような構成によると、画像読取部4が読み取った画像を認識する制御部2を備えているため、走査によって連続的に取得した画像から文字列を認識することができる。これにより、文字列の入力インターフェースとして画像読取部を用いることができるため、ユーザはフリック入力やフルキー入力等によって文字列を入力することなく、また起点・終点指定の画像処理を介することなく、的確に目的とする文字列を指定し、簡易な操作で文字列を入力できる。また、使用者が習熟していない言語であって、フリック入力やフルキー入力による入力方法がわからない言語であっても、画像読取部4で読取ることにより、的確簡便に目的とする文字列をテキストデータとして入力することができる。例えば中国語のピンインや字画入力法を理解しない者であっても書籍中の任意の中国語文章をテキストデータ形式で簡便に入力することが可能となり、日本語の漢字の読みを知らない者でも書籍中の任意の文章を簡便にテキストデータ形式で入力することが可能となる。さらに、認識した文字列を外部サーバに送信することにより、当該文字列による電子書籍の購入、ウェブ検索、地図検索、翻訳などさまざまな用途に用いることができる。例えば、外国においてガイドブック等に記載された入力方法や読み方が不明な文字であっても、その場で容易に画像読取装置1に入力し、地図検索、翻訳等を行うことができる。また,例えば商業チラシに詳細説明のウェブサイトやキャンペーンサイトのURLを記載しておき、チラシ受領者に各サイトの閲覧を促す場合、先行技術であるQRコード(登録商標)と比べ、チラシ作成者はコード作成の専用ソフトを用いずとも、ワープロソフト等のより広く普及した汎用ソフトで誘導チラシを作成でき、ユーザはカメラ起動、構図・ピント合わせ・撮影をするという動作を介さず、より簡易な操作で目的サイトに到達できる。
このような構成によると、書籍アプリでは制御部2が1文字ずつ文字を認識する毎に書籍サーバ21と通信するため、被読取媒体10を走査させながら表示部3に書籍サーバ21との通信結果を表示させることができる。これにより、例えば書籍のタイトル等を検索する場合には、タイトルの一部が合致する書籍が順次表示部に表示されることとなり、ユーザにとって使い勝手のよい画像読取装置1を実現することができる。
このような構成によると、音声出力アプリでは制御部2が認識した文字列を音声として出力する音声出力部9を備えているため、文字列の入力インターフェースとして画像読取部4を利用しつつ読取結果を音声として得ることができる。これにより、書籍の文字が細かく読み難い場合に、画像読取部4で文字列を読取って制御部2で文字列に変換し音声出力部9で出力することにより書籍の内容を耳で聞くことができる。また、ユーザがロービジョンなどの視覚障害者の場合であっても、音声出力部9からの音声を聞くことにより読書等を楽しむことができる。
このような構成によると、拡大アプリでは画像読取部4が読み取った画像を表示部3に拡大して表示するため、画像読取装置1に拡大鏡の役割を持たせることができる。これにより、書籍の文字が細かく読み難い場合に、表示部3を見ることで書籍の文字を判断することができる。
このような構成によると、読取面1Bは画像読取装置1の側面を切り欠いた面取りのような形状をなしており、当該読取面1Bに画像読取部4が配置されているため、文章を読取る際の始点と終点とを容易に指定することができる。
[第2の実施の形態]
次に、第2の実施の形態の画像読取装置201について、図15及び図16を参照して説明する。上述の実施の形態と同一の構成については、同一の符号を付し説明を省略する。第1の実施の形態では画像読取装置1の前面の左寄りに画像読取部4を設け読取方向Rが上下方向だったが、第2の実施の形態では画像読取装置201の前側の側面の右側寄りに画像読取部204を設け読取方向Rが左右方向となっている。
次に、第2の実施の形態の画像読取装置201について、図15及び図16を参照して説明する。上述の実施の形態と同一の構成については、同一の符号を付し説明を省略する。第1の実施の形態では画像読取装置1の前面の左寄りに画像読取部4を設け読取方向Rが上下方向だったが、第2の実施の形態では画像読取装置201の前側の側面の右側寄りに画像読取部204を設け読取方向Rが左右方向となっている。
画像読取装置201は、タッチパネルである表示部203と、画像読取部204と、を備えている。画像読取部204は、第1の実施の形態と同様に、読取対象となる被読取媒体10上を読取方向R(左右方向)に沿って走査することにより、被読取媒体10をスキャンする機能を備える。画像読取部204は、光源241と、図示せぬイメージセンサ及び光学レンズ群と、センサ243と、を備えている。画像読取部204は画像読取装置201において前側の側面に設けられている。画像読取装置201は、表示部203が設けられている表示面201Aと、表示面201Aと交差(直交)する面であって画像読取部204が設けられている読取面201Bと、を備えている。
図16に示すように、画像読取装置201で被読取媒体10を読み取る際は、画像読取部204と被読取媒体10とを当接させた状態で画像読取装置201を読取方向Rに沿って移動させる。画像読取装置201は、画像読取装置1及び画像読取装置101と比較して画像読取部の上下方向の幅は第1の形態と同様であり、不要な文字列を読みこまない点は第1の形態の場合と同様であるが、進行方向である左右方向の長さが長く、被読取媒体10との接触面積が大きいために、把持して操作した際の姿勢が安定的である。そのため、画像読取装置201が被読取媒体10上を安定的に移動することができる。これにより、画像読取部204による読取エラー等を抑制することができる。
[第3の実施の形態]
次に、第3の実施の形態の画像読取装置301について、図17乃至図19を参照して説明する。第2の実施の形態では画像読取装置201の前側の側面に画像読取部204を設けていたが、第3の実施の形態では画像読取装置301の前側の側面に回動支持部305を設け、回動支持部305に画像読取部304が設けられている。
次に、第3の実施の形態の画像読取装置301について、図17乃至図19を参照して説明する。第2の実施の形態では画像読取装置201の前側の側面に画像読取部204を設けていたが、第3の実施の形態では画像読取装置301の前側の側面に回動支持部305を設け、回動支持部305に画像読取部304が設けられている。
画像読取装置301は、本体部302と、タッチパネルである表示部303と、画像読取部304と、本体部302に対して矢印L1の方向に回動可能な回動支持部305と、を備えている。本体部302の上面である表示面301Aには表示部303が設けられていて、前右部には回動支持部305が設けられている。本体部302の回動支持部305と前後方向において対向する面には、回動支持部305が本体部302に対して回動したとき両者が当接しないように湾曲部302Aが形成されている。湾曲部302Aは、回動支持部305から離れるように円弧状に湾曲して後方に窪んでいる。当接を防止するための湾曲は、回動支持部305の本体部302との対向面に面取り状に設けてもよい。回動支持部305は、表示面301Aと交差(直交)する面であって画像読取部304が設けられている読取面301Bを有している。回動支持部305は、矢印L1で示すように、回動軸306を中心に本体部302に対して回動可能である。回動軸306は略円筒形状であって左右方向に延び、回動支持部305の左端面から左方向に延出している。回動軸306は、本体部302によって回動可能に支持されている。画像読取部304の読取方向Rは図17に示す状態では上下方向であるが、本体部302を回転させることにより所望の方向に設定することができる。
画像読取部304は、第1の実施の形態と同様に、スキャン対象となる被読取媒体10(図16)上を読取方向Rに沿って走査することにより、被読取媒体10をスキャンする機能を備える。画像読取部304は、光源341と、図示せぬイメージセンサ及び光学レンズ群と、センサ343と、を備えている。画像読取装置301では、イメージセンサ及び光学レンズ群などの光学素子は左右方向に並んで配置されている。詳細には、光源341から照射された光は、図示せぬミラーによって反射されて左方向に進み、回動軸306を通過して光学レンズ群によってイメージセンサ上に結像される。
[マウスアプリ]
図18及び図19を参照して画像読取装置301を用いたマウスアプリについて説明する。マウスアプリは、画像読取部304によって画像読取装置301の移動を検出に応じて表示部303に表示された矢印を移動させるためのアプリである。
図18及び図19を参照して画像読取装置301を用いたマウスアプリについて説明する。マウスアプリは、画像読取部304によって画像読取装置301の移動を検出に応じて表示部303に表示された矢印を移動させるためのアプリである。
マウスアプリを起動すると、図19に示すマウスウィンドウが表示される。マウスウィンドウには、右クリック領域310と、左クリック領域311と、タッチしても無反応な無反応領域312と、矢印313と、背景314と、が表示される。マウスウィンドウの背景314は、他のアプリの画面、例えば、図10(a)に示すような検索結果画面が表示されている。矢印313は、本発明の指標に相当する。右クリック領域310は本発明の第1領域及び第2領域のいずれか一方に相当し、左クリック領域311は本発明の第1領域及び第2領域の他方に相当する。矢印313は、本発明の指標に相当する。
ユーザは、マウスアプリを起動し、デスク320の上に画像読取装置301を載置して回動支持部305を回動軸306を中心に略90°回転させ、画像読取部304とデスク320とを対向させる。この状態で画像読取装置301をデスク320に対して移動させることにより、画像読取部304が画像読取装置301の移動量及び移動方向を検出し、表示部303に表示された矢印313が移動する。ユーザは、右クリック領域310及び左クリック領域311を押下することにより、表示部303に表示された矢印313を、あたかも画像読取装置301を光学式マウスとして扱うように操作することができる。
なお、マウスウィンドウには、右クリック領域310と、左クリック領域311と、右クリック領域310及び左クリック領域311と隣接する無反応領域312と、を設けたが、右クリック領域と左クリック領域とを隣接させて無反応領域を設けなくてもよい。また、右クリック領域と左クリック領域とを離間させて配置してもよい。
このような構成によると、正確なポイント操作が可能となりスマートフォン上で指でタッチパネル操作をするよりも、正確かつ容易に作画ソフトによる図面作成・編集やワープロソフトによる文書編集を行うことができる。また、入力済のデキストデータを容易に編集することができる。例えば、第1の実施の形態の画像読取部4によって入力されたテキスト編集を行う際、このようなマウスアプリを使用することにより、容易に文書編集を行うことができる。
このような構成によると、画像読取部304が設けられている回動支持部305を有しているため、画像読取部304が本体部302に対して回動することができる。これにより、必要に応じて様々な状態で画像読取部304を使用することができる。また、回動支持部305は本体部302に対して回動軸306を中心に回動可能であるため、画像読取部304をユーザの所望の位置に配置することができる。これにより、操作性の高い画像読取装置301を実現することができる。例えば、一般には、スマートフォン等の端末における側面である読取面は表示部が設けられている面及びその裏面と比較して薄い形状となっているが、この性質を活かし、画像読取装置の使用用途に適した形の姿勢を選択できる。すなわち、文章読取り時には画像読取装置を立設した状態で使用することで、把持し易く円滑動作が可能で、かつ書籍等との接触面が小さいため目的とする文章の読み取り部分をピンポイントで細かく的確に指定できるようにする一方、マウスアプリ使用時には画像読取装置を卓上等で伏せて使用することで、机等との接触面を大きくし、より安定的な状態での精緻なポインタ操作による、細かい作業をすることができる。
このような構成によると、矢印313が画像読取部304の走査量に応じて表示部303内を移動するため、画像読取装置301を用いて表示部303に表示された矢印313の位置を動かすことができる。また、右クリック領域310と、左クリック領域311と、を備えることにより、画像読取装置301に光学式マウスとしての機能を持たせることができる。これにより、画像読取装置の操作性を向上させることができる。また、右クリック領域310と左クリック領域311とに隣接する無反応領域312が規定されているため、誤って右クリック領域310もしくは左クリック領域311を押下することを低減できる。
[第4の実施の形態]
次に、第4の実施の形態の画像読取装置401について、図20を参照して説明する。第3の実施の形態では画像読取装置301の前側の側面に本体部302に対して左右方向に延びる回動軸306を中心に回動可能な回動支持部305を設けていたが、第4の実施の形態では画像読取装置401の前側の側面に本体部402に対して前後方向に延びる回動軸406を中心に回動可能な回動支持部405を設けている。
次に、第4の実施の形態の画像読取装置401について、図20を参照して説明する。第3の実施の形態では画像読取装置301の前側の側面に本体部302に対して左右方向に延びる回動軸306を中心に回動可能な回動支持部305を設けていたが、第4の実施の形態では画像読取装置401の前側の側面に本体部402に対して前後方向に延びる回動軸406を中心に回動可能な回動支持部405を設けている。
画像読取装置401は、本体部402と、タッチパネルである表示部403と、画像読取部404と、本体部402に対して矢印L2の方向に回動可能な回動支持部405と、を備えている。本体部402の上面である表示面401Aには表示部403が設けられていて、前右部には回動支持部405が設けられている。本体部402の回動支持部405と左右方向において対向する面には、回動支持部405が本体部402に対して回動したとき両者が当接しないように湾曲部402Aが形成されている。湾曲部402Aは、回動支持部405から離れるように円弧状に湾曲して左方向に窪んでいる。当接を防止するための湾曲は、回動支持部405の本体部402との対向面に面取り状に設けてもよい。回動支持部405の前面には、表示面401Aと交差(直交)する面であって画像読取部404が設けられている読取面401Bが設けられている。画像読取部404の読取方向Rは図20に示す状態では上下方向であるが、本体部402を回転させることにより所望の方向に設定することができる。
画像読取部404は、第1の実施の形態と同様に、スキャン対象となる被読取媒体10(図16)上を読取方向Rに沿って走査することにより、被読取媒体10をスキャンする機能を備える。画像読取部404は、光源441と、図示せぬイメージセンサ及び光学レンズ群と、センサ443と、を備えている。画像読取装置401では、イメージセンサ及び光学レンズ群などの光学素子は前後方向に並んで配置されている。詳細には、光源441から照射された光は、回動軸406を通過して光学レンズ群によってイメージセンサ上に結像される。回動支持部405は、矢印L2で示すように、回動軸406を中心に本体部402に対して回動可能である。回動軸406は略円筒形状であって前後方向に延び、回動支持部405の後面から後方に延出している。回動軸406は、本体部402によって回動可能に支持されている。
このような構成によると、画像読取部404が設けられている回動支持部405を有しているため、画像読取部404が本体部402に対して回動することができる。これにより、必要に応じて様々な状態で画像読取部404を使用することができる。また、回動支持部405は本体部402に対して回動軸406を中心に回動可能であるため、画像読取部404をユーザの所望の位置に配置することができる。これにより、操作性の高い画像読取装置401を実現することができる。例えば、画像読取部が回動することにより、使用者が見やすいよう表示部を使用者の方向に向けたままの状態で、縦書き、横書き双方の文章の読み取りをなすことができる。
[第5の実施の形態]
次に、第5の実施の形態の画像読取装置501について、図21を参照して説明する。第4の実施の形態では画像読取装置401の前側の側面に本体部402に対し前後方向に延びる回動軸406を中心に回動可能な回動支持部405を設けていたが、第5の実施の形態では画像読取装置501の前側の側面に本体部502に対して矢印L1及び矢印L2の方向に回動可能な回動支持部505を設けている。
次に、第5の実施の形態の画像読取装置501について、図21を参照して説明する。第4の実施の形態では画像読取装置401の前側の側面に本体部402に対し前後方向に延びる回動軸406を中心に回動可能な回動支持部405を設けていたが、第5の実施の形態では画像読取装置501の前側の側面に本体部502に対して矢印L1及び矢印L2の方向に回動可能な回動支持部505を設けている。
画像読取装置501は、本体部502と、タッチパネルである表示部503と、画像読取部504と、本体部502に対して矢印L1及び矢印L2の方向に回動可能な回動支持部505と、本体部502と回動支持部505とを繋ぐヒンジ部507と、を備えている。本体部502の上面である表示面501Aには表示部503が設けられていて、前右部には回動支持部505が設けられている。画像読取部504は、第1の実施の形態と同様に、スキャン対象となる被読取媒体10(図16)上を読取方向Rに沿って走査することにより、被読取媒体10をスキャンする機能を備える。画像読取部504は、光源541と、図示せぬイメージセンサ及び光学レンズ群と、センサ543と、を備えている。画像読取装置501では、イメージセンサ及び光学レンズ群などの光学素子は前後方向に並んで配置されている。詳細には、光源541から照射された光は、後述の回動軸506Aを通過して光学レンズ群によってイメージセンサ上に結像される。
回動支持部505の前面には、表示面501Aと交差(直交)する面であって画像読取部504が設けられている読取面501Bが設けられている。本体部502の回動支持部505と前後方向において対向する面には、回動支持部505が本体部502に対して矢印L1の向きに回動したとき両者が当接しないように湾曲部502Aが形成されている。本体部502の回動支持部505と左右方向において対向する面には、回動支持部505が本体部502に対して矢印L2の向きに回動したとき両者が当接しないように湾曲部502Bが形成されている。湾曲部502Aは回動支持部505から離れるように円弧状に湾曲して後方に窪み、湾曲部502Bは回動支持部505から離れるように円弧状に湾曲して左方向に窪んでいる。当接を防止するための湾曲は、回動支持部505の本体部502との対向面に面取り状に設けてもよい。
回動支持部505は、矢印L1で示すように回動軸506Aを中心に本体部502に対して回動可能であるとともに、矢印L2で示すように回動軸506Bを中心に本体部502に対して回動可能である。回動支持部505は、ヒンジ部507を介して本体部502に接続されている。ヒンジ部507の後面には後方に延出する回動軸506Aが延出している。回動軸506Aは略円筒形状であって、本体部502によって回動可能に支持されている。ヒンジ部507は、回動軸506Bを中心に回動可能に回動支持部505に接続されている。回動支持部505が矢印L1の方向に回動するときは回動支持部505が回動軸506Bを中心に回動し、回動支持部505が矢印L2の方向に回動するときは回動支持部505が回動軸506Aを中心に回動する。画像読取部504の読取方向Rは図21に示す状態では上下方向であるが、本体部502を回転させることにより所望の方向に設定することができる。
このような構成によると、画像読取部504が設けられている回動支持部505及びヒンジ部507を有しているため、画像読取部504が本体部502に対して回動することができる。これにより、必要に応じて様々な状態で画像読取部504を使用することができる。また、回動支持部505は本体部402に対して回動軸506A及び回動軸506Bを中心に回動可能であるため、画像読取部504をユーザの所望の位置に配置することができる。これにより、操作性の高い画像読取装置501を実現することができる。例えば、画像読取部が回動することにより、使用者が見やすいよう表示部を使用者の方向に向けたままの状態で、縦書き、横書き双方の文章の読み取りをなすことができる。また、一般には、スマートフォン等の端末における側面である読取面は表示部が設けられている面及びその裏面と比較して薄い形状となっているが、この性質を活かし、画像読取装置の使用用途に適した形の姿勢を選択できる。例えば、文章読取り時には画像読取装置を立設した状態で使用することで、把持し易く円滑動作が可能で、かつ書籍等との接触面が小さいため目的とする文章の読み取り部分をピンポイントで細かく的確に指定できるようにする一方、マウスアプリ使用時には画像読取装置を卓上等で伏せて使用することで、机等との接触面を大きくし、より安定的な状態での精緻なポインタ操作による、細かい作業をすることができる。
[第6の実施の形態]
次に、第6の実施の形態の画像読取装置601について、図22を参照して説明する。上述の実施の形態と同一の構成については、同一の符号を付し説明を省略する。第6の実施の形態では、第2の実施の形態の画像読取装置201と同様に画像読取装置601の読取方向Rが前後方向に設定されている。
次に、第6の実施の形態の画像読取装置601について、図22を参照して説明する。上述の実施の形態と同一の構成については、同一の符号を付し説明を省略する。第6の実施の形態では、第2の実施の形態の画像読取装置201と同様に画像読取装置601の読取方向Rが前後方向に設定されている。
画像読取装置601は、タッチパネルである表示部603と、画像読取部604と、を備えている。画像読取部604は、読取対象となる被読取媒体10上を前後方向の読取方向Rに沿って走査することにより、被読取媒体10をスキャンする機能を備える。画像読取部604は、光源641と、図示せぬイメージセンサ及び光学レンズ群と、センサ643と、を備えている。画像読取部604は画像読取装置601において前側の側面左寄りに設けられている。画像読取装置601は、表示部603が設けられている表示面601Aと、表示面601Aと交差(直交)する面であって画像読取部604が設けられている読取面601Bと、を備えている。
画像読取装置601の側面はR状に湾曲していて、画像読取部604の周縁には表示面601Aと直交する面である読取面601Bが設けられている。画像読取装置601を被読取媒体10に載置したときには、読取面601Bが被読取媒体10に当接するとともに画像読取装置601の前面のもっとも突起している箇所が被読取媒体10に当接する。これにより、画像読取装置601を被読取媒体10上に安定して載置することができる。また、画像読取装置601の側面がR状に湾曲していても読取面601Bを被読取媒体10に密着させて当接させることができ、精度良く画像を読取ることができる。また、読取面601Bが突起しているため操作時に画像読取部604の位置を確認しやすく、目的とする文字列に画像読取部604をピンポイントで当接させることができ、操作性を改善することができる。
[第7の実施の形態]
次に、第7の実施の形態の画像読取装置701について、図23及び図24を参照して説明する。上述の実施の形態と同一の構成については、同一の符号を付し説明を省略する。第6の実施の形態では画像読取装置601の前面に画像読取部604が設けられていたが、第7の実施の形態では画像読取装置701の隅が斜めにカットされたような形状を成しており、当該平面に画像読取部704が設けられている。
次に、第7の実施の形態の画像読取装置701について、図23及び図24を参照して説明する。上述の実施の形態と同一の構成については、同一の符号を付し説明を省略する。第6の実施の形態では画像読取装置601の前面に画像読取部604が設けられていたが、第7の実施の形態では画像読取装置701の隅が斜めにカットされたような形状を成しており、当該平面に画像読取部704が設けられている。
画像読取部704は、光源741と、図示せぬイメージセンサ及び光学レンズ群と、センサ743と、を備えている。画像読取装置701は、表示部703が設けられている表示面701Aと、表示面701Aと交差(直交)する面であって画像読取部704が設けられている読取面701Bと、を備えている。画像読取部704は画像読取装置701の側面に設けられている。詳細には、平面視において、画像読取装置701の右前方向の角は斜めにカットされた面取りのような形状をなし、当該カットされた平面である読取面701Bに画像読取部704が設けられている。画像読取装置701は、タッチパネルである表示部703と、画像読取部704と、を備えている。画像読取部704は、読取対象となる被読取媒体10上を読取面701Bと平行な読取方向Rに沿って走査することにより、被読取媒体10をスキャンする機能を備える。
図24に示すように、画像読取装置701で被読取媒体10を読み取る際は、画像読取部704と被読取媒体10とを当接させた状態で画像読取装置701を読取方向Rに沿って移動させる。画像読取装置701は、不要な文字列を読みこまない点は他の実施の形態の場合と同様であるが、読取面701Bが画像読取装置701の角の位置にあるため、目的とする文字列に画像読取部704をピンポイントで当接させることができ、操作性を改善することができる。
本発明による画像読取装置は、上述した実施の形態に限定されず、特許請求の範囲に記載された発明の要旨の範囲内で種々の変更が可能である。
上述の実施の形態では、OCR処理は画像読取装置1に設けられた制御部2が実行していたが、これに限定されない。例えば、外部ネットワーク20を介して接続される外部サーバによってOCR処理が実行されてもよい。
上述の実施の形態では、各種アプリケーションをインストールすることにより様々な処理が実行されたが、ウェブブラウザ上で画像読取部4を制御してもよい。図25に示すように、ウェブブラウザには、URL(Uniform Resource Locator)表示部81と、URL82と、スキャンボタン83と、設定ボタン84と、記事85と、が表示されている。ユーザは、スキャンボタン83を押下することにより、画像読取部4が起動して読取待機状態となる。被読取媒体とセンサ43セとが当接すると、画像読取部4が被読取媒体に記載されたURLを読取り、OCR処理することにより文字認識してURL表示部81に読取ったURLを入力する。これにより、URLを打ち込むことなく画像読取部4で読取ることで簡易にURLの入力が可能となる。このとき、スキャンボタンを表示することなく、設定ボタン84を押下したときに表示されるウィンドウにスキャン開始ボタンを設けてもよい。また、画像読取部4でURLを読取るとき、読取結果を随時URL表示部に入力し、プルダウンメニューによって複数の候補を表示し、ユーザが所望のアドレスを選択してもよい。
書籍アプリでは、外部ネットワーク20を介して書籍サーバ21と双方向通信することにより書籍購入を行ったが、同様のフローにより電子記事を購入することも可能である。画像読取部4が読み取った記事のタイトル等に基づいて外部サーバと通信を行い、電子記事を購入してもよい。
第4の実施の形態では、画像読取装置301にマウスアプリをインストールしたが、他の実施の形態の画像読取装置であってもマウスアプリを使用することができる。例えば、無反応領域を設けたマウスアプリを図12に示す状態で使用した場合、親指の部分に無反応領域が位置することとなり、誤って表示部を操作することを防止できる。また図17に示す状態でテキストデータ出力アプリを起動し、さらにマウスアプリを使用した場合、入力されたテキストデータを即座に画面上でポインタを用いて正確に範囲指定し、カット・アンド・ペーストなどの編集ができる。
1、201、301、401、501、601、701 画像読取装置
1A、201A、301A、401A、501A、601A,701A 表示面
1B、201B、301B、401B、501B、601B、701B 読取面
2 制御部
3、203、303、403、503、603、703 表示部
4、204、304、404、504、604、704 画像読取部
6 記憶部
9 音声出力部
20 外部ネットワーク
21 書籍サーバ
22 検索サーバ
41、241、341、441、541、641、741 光源
42 イメージセンサ
43、243、343、443、543、743 センサ
60 端末
61A 端末表示面
63 端末表示部
306,406、506A、506B 回動軸
R 読取方向
1A、201A、301A、401A、501A、601A,701A 表示面
1B、201B、301B、401B、501B、601B、701B 読取面
2 制御部
3、203、303、403、503、603、703 表示部
4、204、304、404、504、604、704 画像読取部
6 記憶部
9 音声出力部
20 外部ネットワーク
21 書籍サーバ
22 検索サーバ
41、241、341、441、541、641、741 光源
42 イメージセンサ
43、243、343、443、543、743 センサ
60 端末
61A 端末表示面
63 端末表示部
306,406、506A、506B 回動軸
R 読取方向
Claims (4)
- 被読取媒体からの情報を走査によって読み取る画像読取装置であって、
前記被読取媒体の画像を読み取る画像読取部と、
前記画像読取部が読み取った前記画像を記憶する記憶部と、
前記画像読取部が読み取った前記画像を表示可能であって表示面に設けられた表示部と、
前記画像読取部と、前記記憶部と、前記表示部とを制御する制御部と、を有し、
前記画像読取部は、前記表示面と交差する読取面に設けられていることを特徴とする画像読取装置。 - 前記画像読取部は、前記読取面と前記被読取媒体とが当接することにより前記画像を読み取り、
前記読取面は、前記表示面に対して略直交し、
前記読取面と前記被読取媒体とを当接させたとき、前記表示面は前記被読取媒体に対して略直交し、
前記被読取媒体からの情報を読み取るときは、前記表示面に略直交する方向である読取方向に走査することを特徴とする請求項1に記載の画像読取装置。 - 前記表示部は、接触することにより操作されるタッチパネルであって、
前記制御部は、前記表示部に、指標と、第1領域と、第2領域と、を描画し、
前記指標は、前記画像読取部の走査量に応じて前記表示部内を移動し、
前記制御部は、前記第1領域が操作されたときは第1の機能を実行し、前記第2領域が操作されたときは第1の機能とは異なる第2の機能を実行することを特徴とする請求項1または2に記載の画像読取装置。 - 前記表示部が設けられている本体部と、
前記画像読取部が設けられている回動支持部と、をさらに有し、
前記回動支持部は、前記本体部に対して、1つの回動軸を中心に回動可能であることを特徴とする請求項1から3のいずれか1項に記載の画像読取装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018090270 | 2018-05-08 | ||
JP2018090270 | 2018-05-08 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2019198072A true JP2019198072A (ja) | 2019-11-14 |
Family
ID=68538014
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019088685A Pending JP2019198072A (ja) | 2018-05-08 | 2019-05-08 | 画像読取装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2019198072A (ja) |
-
2019
- 2019-05-08 JP JP2019088685A patent/JP2019198072A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10769431B2 (en) | Handheld device for capturing text from both a document printed on paper and a document displayed on a dynamic display device | |
KR101257206B1 (ko) | 렌더링된 문서를 식별하기 위한 디바이스 및 방법 | |
JP5529082B2 (ja) | レンダリングされた文書からのハンドヘルド装置を用いたデータ取得 | |
US9143638B2 (en) | Data capture from rendered documents using handheld device | |
CN1595944B (zh) | 信息处理装置、信息处理方法及软件产品 | |
US7812860B2 (en) | Handheld device for capturing text from both a document printed on paper and a document displayed on a dynamic display device | |
KR102147935B1 (ko) | 데이터 처리 방법 및 그 전자 장치 | |
JP2011008752A (ja) | ドキュメント操作システム、ドキュメント操作方法およびそのためのプログラム | |
US20100128994A1 (en) | Personal dictionary and translator device | |
KR20140030361A (ko) | 휴대단말기의 문자 인식장치 및 방법 | |
JP2010536188A6 (ja) | レンダリングされた文書からのハンドヘルド装置を用いたデータ取得 | |
US20090182548A1 (en) | Handheld dictionary and translation apparatus | |
EP2793458B1 (en) | Apparatus and method for auto-focusing in device having camera | |
JP6036856B2 (ja) | 電子制御装置、制御方法、及び制御プログラム | |
JP2019198072A (ja) | 画像読取装置 | |
JP2012008733A (ja) | カード情報管理装置 | |
KR20100124952A (ko) | 문자인식을 이용한 휴대형 단말기의 증강현실 기반 실시간 ar컨텐츠 제공시스템 및 그 방법 | |
WO2021084761A1 (ja) | 画像読取装置 | |
KR20200098933A (ko) | 펜 타입 텍스트 번역 장치 및 방법 | |
KR101178302B1 (ko) | 헨드헬드 디바이스를 사용한, 렌더링된 문서로부터의데이터 캡쳐 | |
Lieberman et al. | An interface for mutual disambiguation of recognition errors in a multimodal navigational assistant | |
JP2016177363A (ja) | 情報処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20190515 |