JP7118729B2 - 情報処理装置、情報処理方法及びプログラム - Google Patents
情報処理装置、情報処理方法及びプログラム Download PDFInfo
- Publication number
- JP7118729B2 JP7118729B2 JP2018092340A JP2018092340A JP7118729B2 JP 7118729 B2 JP7118729 B2 JP 7118729B2 JP 2018092340 A JP2018092340 A JP 2018092340A JP 2018092340 A JP2018092340 A JP 2018092340A JP 7118729 B2 JP7118729 B2 JP 7118729B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- transformation
- information
- feature point
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Graphics (AREA)
- Geometry (AREA)
- Artificial Intelligence (AREA)
- Image Analysis (AREA)
- Character Input (AREA)
Description
そこで、本発明は、複数フレームの画像に対するトラッキング処理の精度を向上させることができる情報処理装置を提案することを目的とする。
図1は、第1実施形態にかかる情報処理装置の外観の一例を示す図である。なお、本実施形態では、情報処理装置として、カメラ機能付きのモバイル端末(携帯端末)を例にする。図1には、モバイル端末100の前面部(左図)及び背面部(中央図)と、被写体103(右図)とが示されている。図1に示すように、モバイル端末100の前面部には、タッチパネル101が設けられている。タッチパネル101は、画像(動画)等の情報を表示する表示部としての機能と、ユーザのタッチ操作に応じて指示を入力する入力部としての機能とを有する。モバイル端末100の背面部には、紙文書等の被写体103を撮影して撮影画像を取り込むカメラ102が設けられている。モバイル端末100のユーザが、後述するモバイルアプリケーション(以下、モバイルアプリと呼ぶ)を起動させ、カメラ102を使用して被写体103を撮影することによって、処理を開始することができる。図1に示す被写体103は、A4サイズの注文書(紙文書)である。なお、被写体103は、紙文書だけに限らず、様々なサイズの名刺、写真、カードなどであってもよい。モバイルアプリは、カメラ102によって取り込まれた被写体103の画像(本実施形態では動画)を、タッチパネル101に出力(表示)する。
次に、モバイル端末100のCPU201がモバイルアプリ302を実行することにより実現される、トラッキング処理について図9を用いて説明する。例えば、ユーザがモバイル端末100を操作してモバイルアプリ302を起動し、さらに被写体103に対してカメラ102を接近させて撮影を開始すると、図9に示すフローが開始される。
次に、図9に示すS907の処理(変換行列の作成/更新処理)の詳細について、図10を用いて説明する。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
Claims (9)
- 被写体を動画撮影して得られる画像をフレーム単位で入力する入力手段と、
被写体の全体を予め撮影して得られる全体画像から抽出される特徴点と、被写体を撮影して得られる第1の画像から抽出される特徴点とを比較する特徴点比較を実行して、前記全体画像における座標系と前記第1の画像における座標系との間の座標変換に用いる第1の変換情報を導出する第1の導出手段と、
前記第1の画像に続いて順次入力される複数の画像に対して、前記第1の画像から抽出される特徴点の位置を追跡する特徴点追跡を実行して、前記第1の画像の座標系と、前記複数の画像のうちの第2の画像の座標系との間の座標変換に用いる第2の変換情報を導出する第2の導出手段と、
前記第1の変換情報と前記第2の変換情報とを合成して、前記全体画像における座標系と第2の画像における座標系との間の座標変換に用いる第3の変換情報を導出する第3の導出手段と、
を備え、
前記第1の導出手段は、前記第1の変換情報を導出してから、前記入力手段に所定数のフレームの画像が入力された場合に、前記全体画像から抽出される特徴点と前記入力手段に入力された新たなフレームの画像の特徴点とを比較する特徴点比較を実行して、新たな前記第1の変換情報の導出を開始する
ことを特徴とする情報処理装置。 - 前記第2の導出手段は、
前記入力手段に前記第1の画像が入力されてから前記第1の導出手段によって前記第1の変換情報が導出されるまでの間、前記入力手段に新たなフレームの画像が入力される毎に、該画像を前記第2の画像として前記第2の変換情報を導出する
ことを特徴とする請求項1に記載の情報処理装置。 - 前記第3の導出手段は、
前記第3の変換情報を導出した後に、前記入力手段に新たなフレームの画像が入力された場合には、前記新たなフレームの画像の座標系と、前記新たなフレームの直前のフレームの画像の座標系との間の座標変換に用いる変換情報を導出し、該変換情報と前記第3の変換情報とを用いて、新たな前記第3の変換情報を導出する
ことを特徴とする請求項2に記載の情報処理装置。 - 前記第1の画像と前記第2の画像との差異を導出する差異導出手段をさらに備え、
前記第2の導出手段は、
前記差異導出手段が導出した差異が一定以上でない場合には、前記第1の画像と前記第2の画像とに対して前記特徴点追跡を実行して、前記第2の変換情報を導出する
ことを特徴とする請求項2または請求項3に記載の情報処理装置。 - 前記第1の画像と前記第2の画像との差異を導出する差異導出手段をさらに備え、
前記第2の導出手段は、
前記差異導出手段が導出した差異が一定以上である場合には、前記第1の画像から前記第2の画像までの各フレームの画像に対して前記特徴点追跡を実行して、前記第2の変換情報を導出する
ことを特徴とする請求項2または請求項3に記載の情報処理装置。 - 被写体上の文字認識処理が適用される対象領域を前記全体画像における座標系で表した領域情報と、前記第3の変換情報とに基づいて、前記第2の画像上に前記対象領域をマッピングする描画手段と、
前記対象領域がマッピングされた前記第2の画像を表示するための情報を表示手段に出力する出力手段と、をさらに備える
ことを特徴とする請求項1から請求項5のうちのいずれか1項に記載の情報処理装置。 - 前記被写体が所定のフォーマットの紙文書である
ことを特徴とする請求項1から請求項6のうちのいずれか1項に記載の情報処理装置。 - 被写体を動画撮影して得られる画像をフレーム単位で入力する入力ステップと、
被写体の全体を予め撮影して得られる全体画像から抽出される特徴点と、被写体を撮影して得られる第1の画像から抽出される特徴点とを比較する特徴点比較を実行して、前記全体画像における座標系と前記第1の画像における座標系との間の座標変換に用いる第1の変換情報を導出する第1の導出ステップと、
前記第1の画像に続いて順次入力される複数の画像 に対して、前記第1の画像から抽出される特徴点の位置を追跡する特徴点追跡を実行して、前記第1の画像の座標系と、前記複数の画像のうちの第2の画像 の座標系との間の座標変換に用いる第2の変換情報 を導出する第2の導出ステップと、
前記第1の変換情報 と前記第2の変換情報 とを合成して、前記全体画像における座標系と第2の画像における座標系との間の座標変換に用いる第3の変換情報を導出する第3の導出ステップと、
を含み、
前記第1の導出ステップでは、前記第1の変換情報を導出してから、前記入力ステップで所定数のフレームの画像が入力された場合に、前記全体画像から抽出される特徴点と前記入力ステップで入力された新たなフレームの画像の特徴点とを比較する特徴点比較を実行して、新たな前記第1の変換情報の導出を開始する
ことを特徴とする情報処理方法。 - コンピュータを、請求項1から請求項7のうちのいずれか1項に記載の情報処理装置と
して機能させるためのプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018092340A JP7118729B2 (ja) | 2018-05-11 | 2018-05-11 | 情報処理装置、情報処理方法及びプログラム |
US16/398,702 US10872263B2 (en) | 2018-05-11 | 2019-04-30 | Information processing apparatus, information processing method and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018092340A JP7118729B2 (ja) | 2018-05-11 | 2018-05-11 | 情報処理装置、情報処理方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019197489A JP2019197489A (ja) | 2019-11-14 |
JP7118729B2 true JP7118729B2 (ja) | 2022-08-16 |
Family
ID=68463733
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018092340A Active JP7118729B2 (ja) | 2018-05-11 | 2018-05-11 | 情報処理装置、情報処理方法及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US10872263B2 (ja) |
JP (1) | JP7118729B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7552048B2 (ja) * | 2020-03-25 | 2024-09-18 | 日本電気株式会社 | 画像処理装置、画像処理方法、プログラム |
CN113642584B (zh) * | 2021-08-13 | 2023-11-28 | 北京百度网讯科技有限公司 | 文字识别方法、装置、设备、存储介质和智能词典笔 |
US11763073B2 (en) * | 2021-08-20 | 2023-09-19 | Sap Se | Multi-dimensional table reproduction from image |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009020890A (ja) | 2007-07-11 | 2009-01-29 | Ricoh Co Ltd | 電子書類を認識及び追跡する方法及びシステム |
JP2017072560A (ja) | 2015-10-09 | 2017-04-13 | ソニー株式会社 | 情報処理装置、位置および/または姿勢の推定方法、およびコンピュータプログラム |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3747737B2 (ja) * | 2000-05-10 | 2006-02-22 | 日本電気株式会社 | 広域精細画像生成方法及びシステム並びにコンピュータ可読記録媒体 |
US20070031063A1 (en) * | 2005-08-05 | 2007-02-08 | Hui Zhou | Method and apparatus for generating a composite image from a set of images |
US7978932B2 (en) * | 2007-08-02 | 2011-07-12 | Mauna Kea Technologies | Robust mosaicing method, notably with correction of motion distortions and tissue deformations for in vivo fibered microscopy |
WO2014064783A1 (ja) * | 2012-10-24 | 2014-05-01 | 株式会社モルフォ | 画像処理装置、画像処理方法、画像処理プログラム及び記録媒体 |
EP2979225B1 (en) * | 2013-03-28 | 2018-08-29 | Intuit Inc. | Method and system for creating optimized images for data identification and extraction |
JP6450589B2 (ja) * | 2014-12-26 | 2019-01-09 | 株式会社モルフォ | 画像生成装置、電子機器、画像生成方法及びプログラム |
US10091391B2 (en) * | 2015-11-10 | 2018-10-02 | Bidirectional Display, Inc. | System and method for constructing document image from snapshots taken by image sensor panel |
US10924620B2 (en) * | 2017-05-26 | 2021-02-16 | Fuji Xerox Co., Ltd. | Document reading guidance for operator using feature amount acquired from image of partial area of document |
JP2019012361A (ja) * | 2017-06-29 | 2019-01-24 | キヤノン株式会社 | 情報処理装置、プログラム及び情報処理方法 |
-
2018
- 2018-05-11 JP JP2018092340A patent/JP7118729B2/ja active Active
-
2019
- 2019-04-30 US US16/398,702 patent/US10872263B2/en not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009020890A (ja) | 2007-07-11 | 2009-01-29 | Ricoh Co Ltd | 電子書類を認識及び追跡する方法及びシステム |
JP2017072560A (ja) | 2015-10-09 | 2017-04-13 | ソニー株式会社 | 情報処理装置、位置および/または姿勢の推定方法、およびコンピュータプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2019197489A (ja) | 2019-11-14 |
US10872263B2 (en) | 2020-12-22 |
US20190347503A1 (en) | 2019-11-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5906493B2 (ja) | 画像処理装置、画像処理方法、画像処理プログラム及び記録媒体 | |
JP6147273B2 (ja) | ノイズに対して堅牢な画像レジストレーション方法およびシステム | |
JP6976733B2 (ja) | 画像処理装置、画像処理方法、およびプログラム | |
JP4781233B2 (ja) | 画像処理装置、撮像装置、及び画像処理方法 | |
JP2019012361A (ja) | 情報処理装置、プログラム及び情報処理方法 | |
JP7118729B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
KR20150126768A (ko) | 이미지 합성 방법 및 그 전자 장치 | |
US10586099B2 (en) | Information processing apparatus for tracking processing | |
JP2013005258A (ja) | ブレ補正装置、ブレ補正方法及び帳票 | |
JP2016212784A (ja) | 画像処理装置、画像処理方法 | |
US10643095B2 (en) | Information processing apparatus, program, and information processing method | |
JP2018046337A (ja) | 情報処理装置、プログラム及び制御方法 | |
JP4145014B2 (ja) | 画像処理装置 | |
US10999513B2 (en) | Information processing apparatus having camera function, display control method thereof, and storage medium | |
JP2019220073A (ja) | 物体追跡装置、物体追跡システム、および物体追跡方法 | |
JP4017578B2 (ja) | 手ぶれ補正装置、手ぶれ補正方法および手ぶれ補正プログラムを記録した記録媒体 | |
JP6669390B2 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
JP2019106008A (ja) | 推定装置、推定方法、及び推定プログラム | |
JP2021077283A (ja) | 情報処理装置、情報処理方法、及びプログラム | |
JP2012014268A (ja) | 情報処理装置およびその制御方法 | |
JP5563390B2 (ja) | 画像処理装置およびその制御方法、及びプログラム | |
JP2020204887A (ja) | 画像処理装置及びその制御方法並びにプログラム | |
JP2020201713A (ja) | 画像選択方法、画像選択プログラム、および画像選択装置 | |
CN116758205B (zh) | 数据处理方法、装置、设备及介质 | |
JP6150419B2 (ja) | カメラおよびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210510 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220408 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220419 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220620 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220705 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220803 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7118729 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |