JP4474231B2 - 文書リンク情報取得システム - Google Patents
文書リンク情報取得システム Download PDFInfo
- Publication number
- JP4474231B2 JP4474231B2 JP2004232891A JP2004232891A JP4474231B2 JP 4474231 B2 JP4474231 B2 JP 4474231B2 JP 2004232891 A JP2004232891 A JP 2004232891A JP 2004232891 A JP2004232891 A JP 2004232891A JP 4474231 B2 JP4474231 B2 JP 4474231B2
- Authority
- JP
- Japan
- Prior art keywords
- unit
- link information
- character
- link
- pattern
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
好ましくは、前記文書リンク情報データベース部は、英文とそのリンクデータを対応付けて格納する。
各文に含まれる各形態素の配置情報を関連付けて保持する文書リンク情報データベースを格納する記憶装置と、該画像撮影部で撮影された画像から利用者により指定された着目形態素パターンとその着目形態素パターンの周辺の形態素パターンに関して文字認識処理を行い、各形態素の文字コードを出力する文字認識部と、
利用者により指定された着目形態素パターンと該着目形態素パターンの周辺に存在する形態素パターンに関して相対的な配置情報を抽出する抽出部と、該着目形態素パターンと該着目形態素パターンの周辺に存在する形態素パターンに関して、該文字認識部より得られた文字コードと、該抽出部より得られた該相対的な配置情報を用いて該文書リンク情報データベースを検索する検索部と、を有し、該検索部より得られたリンク情報を参照してリンク先のデータを該表示部に表示することを特徴とする文書リンク情報取得システムである。
を有し、該検索部より得られたリンク情報を参照してリンク先のデータを該表示部に表示するする文書リンク情報取得システムである。
更に本発明は、上記文書リンク情報取得システムにおいて、前記抽出部の機能を実現するためのコンピュータ上で実行可能なプログラムとして把握される。
好ましい例では、該文書リンク情報データベースの検索の結果、該着目文字パターンを含む1又は複数のリンク情報の候補となる文を該表示部に表示するステップと、複数の候補の場合、該複数の候補の中から利用者により該入力部を介して指定された候補に対応するリンク情報を参照してリンク先のデータを該文書リンク情報データベースから得るステップと、を更に有し、該文書リンク情報データベースから得られたリンク先のデータと該文とを対応させて該表示部に表示するする。
これにより、従来のように2次元コード等の特別なコードやURL等のリンク情報を表す文字列を紙面に印刷する場合に比べて紙面のレイアウトの自由度が大きくなる。さらに、文全体を撮影する場合に比べて、撮影された画像はリンク情報参照対象文の任意の一部を含んでいれば良いので、撮影の自由度が大きくなり、利用者の使い勝手が大幅に向上する。
単語の配置情報の例として、部分画像に含まれる単語の相対的な位置関係を表す角度情報を抽出する手順に関しては、例えば、利用者が指定する着目単語”as”と着目単語の上下左右など周りに存在する複数の単語(以下では周辺単語と呼ぶ)に関して文字認識処理により単語の文字コードと各単語の矩形重心座標をそれぞれ抽出する。その後、着目単語の矩形重心から各周辺単語の矩形重心に線分1101〜1105を引きその線分間の角度1106〜1110を計算する。この角度計算は任意の周辺単語重心間について計算してよい。この重心間角度は画像のスケールに依存しないので安定した配置情報となりうる。(これらについては、図11を参照して詳しく後述される。)
以下、図1〜14を参照して第1の実施形態について詳細に説明する。
“as”から“we”への矩形重心ベクトル :a=(x、y)=(330-400、225-300)=(-70、-75)
“as”から“have”への矩形重心ベクトル:b=(x、y)=(470-400、225-300)=(+70、-75)
ベクトルa、b間の余弦=a・b/(‖a‖‖b‖)=0.07
次に、相違度が閾値以下かどうかを判断し(1005)、閾値以下であればステップ1006に進み、閾値を超えていればステップ1007に進む。ステップ1006では、英文データ格納部901において”as”レコード919以降の単語データを検索し、文末の記号である”.”(ピリオド)を含むレコード922を検索する。そして、ピリオドの後ろに格納されているリンクデータへのポインタを取得して、リンク参照候補文検索結果データ183に格納する。
1300は入力画像の着目単語である”as”を含む行画像を示し、1301は着目単語であることを示す矩形である。1302はリンクDB184を検索した結果、着目単語”as”が存在する位置を示しており、この例では24ページ、5行目の左から3単語目に着目単語”as”が存在することを示している。また、ここでアンダーラインが表示されているが、このアンダーラインが引かれた文字を選択すると、対応するリンク(URL)データをアクセスした結果を表示することができるというハイパーリンクを表しており、このリンクを選択すると図12の1214に格納されているポインタを参照してリンクデータをアクセスした結果が表示できるようになっている。
Claims (14)
- 画像撮影部と、利用者に操作されて情報を入力する入力部と、表示部を有する携帯情報端末を用いて、該画像撮影部で撮影された画像に含まれる文字に基づき、リンク情報を取得し、そのリンク情報を参照してリンク先のデータを該表示部に表示する文書リンク情報取得システムにおいて、
単語からなる文とリンク情報を対応付けて保持すると共に、該文に含まれる各単語の配置情報を関連付けて保持する文書リンク情報データベースを格納する記憶装置と、該画像撮影部で撮影された画像から利用者により指定された着目単語パターンとその着目単語パターンの周辺の単語パターンを対象として文字認識処理を行い、該単語パターンの文字コードを出力する文字認識部と、
利用者により指定された着目単語パターンと該着目単語パターンの周辺の単語パターンに関して相対的な配置情報を抽出する抽出部と、
該着目単語パターンと該着目単語パターンの周辺の単語パターンに関して、該文字認識部より得られた該文字コードと、該抽出部より得られた該相対的な配置情報を用いて該文書リンク情報データベースを検索する検索部と、
を有し、該検索部より得られたリンク情報を参照してリンク先のデータを該表示部に表示することを特徴とする文書リンク情報取得システム。 - 前記文書リンク情報データベース部は、英文とそのリンクデータを対応付けて格納することを特徴とする請求項1記載の文書リンク情報取得システム。
- 前記文書リンク情報データベース部は、スペースで区切られた単語からなる文とリンク情報を対応付けて格納することを特徴とする請求項1記載の文書リンク情報取得システム。
- 該相対的な配置情報は、利用者により指定された着目単語パターンの矩形重心から着目単語パターンの各周辺単語パターンの矩形重心に線分を引き、それらの線分間の角度であることを特徴とする請求項1記載の文書リンク情報取得システム。
- 該相対的な配置情報は、利用者により指定された着目単語パターンが含まれる行、および、着目単語パターンの各周辺単語パターンが含まれる行の相対的な配置情報であることを特徴とする請求項1記載の文書リンク情報取得システム。
- 画像撮影部と、利用者に操作されて情報を入力する入力部と、該画像撮影部で撮影された画像に含まれる文字に基づき、リンク情報を取得する処理を行うリンク情報取得部と該リンク情報取得部により得られたリンク情報を参照してリンク先のデータを表示する表示部とを有する携帯情報端末を用いた文書リンク情報取得システムにおいて、
文書中の各文とリンク情報を対応付けて格納すると共に、各文に含まれる各形態素の配置情報を関連付けて保持する文書リンク情報データベースを格納する記憶装置と、
該画像撮影部で撮影された画像から利用者により指定された着目形態素パターンとその着目形態素パターンの周辺の形態素パターンに関して文字認識処理を行い、各形態素の文字コードを出力する文字認識部と、
利用者により指定された着目形態素パターンと該着目形態素パターンの周辺に存在する形態素パターンに関して相対的な配置情報を抽出する抽出部と、
該着目形態素パターンと該着目形態素パターンの周辺に存在する形態素パターンに関して、該文字認識部より得られた文字コードと、該抽出部より得られた該相対的な配置情報を用いて該文書リンク情報データベースを検索する検索部と、
を有し、該検索部より得られたリンク情報を参照してリンク先のデータを該表示部に表示することを特徴とする文書リンク情報取得システム。 - 画像撮影部と、利用者に操作されて情報を入力する入力部と、表示部を有する携帯情報端末を用いて、該画像撮影部で撮影された画像に含まれる文字に基づき、リンク情報を取得し、そのリンク情報を参照してリンク先のデータを該表示部に表示する文書リンク情報取得システムにおいて、
単語からなる文とリンク情報を対応付けて保持すると共に、該文に含まれる各文字の配置情報を関連付けて保持する文書リンク情報データベースを格納する記憶装置と、
該画像撮影部で撮影された画像から利用者により指定された着目文字パターンとその着目文字パターンの周辺の文字パターンを対象として文字認識処理を行い、該文字パターンの文字コードを出力する文字認識部と、
利用者により指定された着目文字パターンと該着目文字パターンの周辺の文字パターンに関して相対的な配置情報を抽出する抽出部と、
該着目文字パターンと該着目文字パターンの周辺の文字パターンに関して、該文字認識部より得られた該文字コードと該抽出部より得られた該相対的な配置情報を用いて、該文書リンク情報データベースを検索する検索部と、
を有し、該検索部より得られたリンク情報を参照してリンク先のデータを該表示部に表示することを特徴とする文書リンク情報取得システム。 - 前記文書リンク情報データベースを格納する記憶装置、及び前記検索部を備えるサーバを有する文書リンク情報取得システムであって、
該携帯情報端末の該文字認識部より得られた該文字コードと、該抽出部より得られた該相対的な配置情報を、ネットワークを介して該サーバに送信し、該サーバにおいて該検索部により該文書リンク情報データベースを検索した結果得られたリンク情報を、該ネットワークを介して該携帯情報端末に送信することを特徴とする請求項1乃至7のいずれかの文書リンク情報取得システム。 - 前記文字認識部、前記抽出部、前記文書リンク情報データベースを格納する記憶装置、及び前記検索部を備えるサーバを有する文書リンク情報取得システムであって、
該携帯情報端末の該画像撮影部より得られた画像をネットワークを介して該サーバに送信し、該サーバにおいて該検索部により該文書リンク情報データベースを検索した結果得られたリンク情報を、該ネットワークを介して該携帯情報端末に送信することを特徴とする請求項1乃至7のいずれかの文書リンク情報取得システム。 - 前記文書リンク情報データベースは、単語が含まれる文を検索するための単語インデックス部と、該文に含まれる単語の幾何学情報と単語の文字コードを格納した文データ格納部と、各文に対応するリンク情報を格納したリンク情報格納部を有することを特徴とする請求項1乃至9のいずれかの文書リンク情報取得システム。
- 画像撮影部と、利用者に操作されて情報を入力する入力部と、表示部と、端末制御部と、を有する携帯情報端末であって、
前記端末制御部は、
該画像撮影部で撮影された画像から利用者により指定された着目単語パターンとその着目単語パターンの周辺の単語パターンを対象として文字認識処理を行い、該単語パターンの文字コードを出力する文字認識部と、
利用者により指定された着目単語パターンと該着目単語パターンの周辺の単語パターンに関して相対的な配置情報を抽出する抽出部と、
該着目単語パターンと該着目単語パターンの周辺の単語パターンに関して、該文字認識部より得られた該文字コード及び該抽出部より得られた該相対的な配置情報を用いて、単語からなる文とリンク情報を対応付けて保持され、該文に含まれる各単語の配置情報を関連付けて保持された文書リンク情報データベースを検索する検索部と、を有し、
前記検索部より得られたリンク情報を参照してリンク先のデータを前記表示部に表示することを特徴とする携帯情報端末。 - 請求項8又は9のシステムにおいて使用されるサーバ。
- 画像撮影部と、利用者に操作されて情報を入力する入力部と、表示部と、端末制御部と、を有する携帯情報端末を用いて、該画像撮影部で撮影された画像に含まれる文字に基づき、リンク情報を取得し、そのリンク情報を参照してリンク先のデータを該表示部に表示する文書リンク情報取得方法において、
前記端末制御部による、
該画像撮影部で撮影された画像から利用者により指定された着目文字パターンとその着目文字パターンの周辺の文字パターンを対象として文字認識処理を行い、該文字パターンの文字コードを出力するステップと、
利用者により指定された着目文字パターンと該着目文字パターンの周辺の文字パターンに関して相対的な配置情報を抽出するステップと、
該着目文字パターンと該着目文字パターンの周辺の文字パターンに関して、該文字認識部より得られた該文字コードと該抽出部より得られた該相対的な配置情報を用いて、単語からなる文とリンク情報を対応付けて保持され、該文に含まれる各文字の配置情報を関連付けて保持された文書リンク情報データベースを検索するステップと、
該検索の結果得られたリンク情報を参照してリンク先のデータを該表示部に表示するステップと、を有する文書リンク情報取得方法。 - 該文書リンク情報データベースの検索の結果、該着目文字パターンを含む1又は複数のリンク情報の候補となる文を該表示部に表示するステップと、
複数の候補の場合、該複数の候補の中から利用者により該入力部を介して指定された候補に対応するリンク情報を参照してリンク先のデータを該文書リンク情報データベースから取得するステップと、を更に有し、
該文書リンク情報データベースから得られたリンク先のデータと該文の少なくとも一部とを対応させて該表示部に表示することを特徴とする請求項13の文書リンク情報取得方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004232891A JP4474231B2 (ja) | 2004-08-10 | 2004-08-10 | 文書リンク情報取得システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004232891A JP4474231B2 (ja) | 2004-08-10 | 2004-08-10 | 文書リンク情報取得システム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2006053622A JP2006053622A (ja) | 2006-02-23 |
JP2006053622A5 JP2006053622A5 (ja) | 2007-06-14 |
JP4474231B2 true JP4474231B2 (ja) | 2010-06-02 |
Family
ID=36031085
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004232891A Expired - Lifetime JP4474231B2 (ja) | 2004-08-10 | 2004-08-10 | 文書リンク情報取得システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4474231B2 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8825682B2 (en) * | 2006-07-31 | 2014-09-02 | Ricoh Co., Ltd. | Architecture for mixed media reality retrieval of locations and registration of images |
JP4825717B2 (ja) * | 2007-03-30 | 2011-11-30 | 富士通株式会社 | 文書収集方法、文書収集プログラム及び文書収集装置 |
JP4852058B2 (ja) * | 2008-02-25 | 2012-01-11 | 富士フイルム株式会社 | 携帯電話用ファイル生成サーバ,その動作制御方法およびその制御プログラム |
JP5384315B2 (ja) * | 2009-08-04 | 2014-01-08 | 日本電信電話株式会社 | 検索装置及び方法及びプログラム |
JP5330169B2 (ja) * | 2009-09-10 | 2013-10-30 | ヤフー株式会社 | コンテンツデータ提供装置 |
WO2013115203A1 (ja) * | 2012-01-30 | 2013-08-08 | 日本電気株式会社 | 情報処理システム、情報処理方法、情報処理装置およびその制御方法と制御プログラム、通信端末およびその制御方法と制御プログラム |
CN111460205A (zh) * | 2020-04-03 | 2020-07-28 | 湖州市超视科技有限公司 | 一种基于边缘计算的化妆品包装说明质检检测系统 |
-
2004
- 2004-08-10 JP JP2004232891A patent/JP4474231B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP2006053622A (ja) | 2006-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111507251B (zh) | 试题图像中作答区域的定位方法、装置、电子设备及计算机存储介质 | |
US10073859B2 (en) | System and methods for creation and use of a mixed media environment | |
US20200065601A1 (en) | Method and system for transforming handwritten text to digital ink | |
US8521737B2 (en) | Method and system for multi-tier image matching in a mixed media environment | |
US9171202B2 (en) | Data organization and access for mixed media document system | |
US8600989B2 (en) | Method and system for image matching in a mixed media environment | |
US8195659B2 (en) | Integration and use of mixed media documents | |
US20070047002A1 (en) | Embedding Hot Spots in Electronic Documents | |
JP2011008752A (ja) | ドキュメント操作システム、ドキュメント操作方法およびそのためのプログラム | |
JP4594952B2 (ja) | 文字認識装置及び文字認識方法 | |
CN111160333A (zh) | Ar眼镜及其文本翻译方法、装置和计算机可读存储介质 | |
JP2021043478A (ja) | 情報処理装置、その制御方法及びプログラム | |
JP5661549B2 (ja) | 帳票上の文字を認識する文字認識装置、マスク処理方法、および、マスク処理プログラム | |
JP4474231B2 (ja) | 文書リンク情報取得システム | |
JP4177325B2 (ja) | 画像処理装置、画像処理プログラム及び画像処理方法 | |
JP2008282094A (ja) | 文字認識処理装置 | |
JP2006048324A (ja) | 文書翻訳システム | |
JP2018181243A (ja) | 情報処理装置、情報処理装置の制御方法及びプログラム | |
JP5298830B2 (ja) | 画像処理プログラム、画像処理装置及び画像処理システム | |
JP5277750B2 (ja) | 画像処理プログラム、画像処理装置及び画像処理システム | |
JP5105440B2 (ja) | 情報処理装置、文字認識方法、文字認識プログラム、および、文字認識プログラムを記録した、コンピュータ読取り可能な記録媒体 | |
JP2006106931A (ja) | 文字列探索装置、探索方法およびこの方法のプログラム | |
JP7231529B2 (ja) | 情報端末装置、サーバ及びプログラム | |
JP4309881B2 (ja) | 身分証認識装置及び身分証認識方法 | |
JP6743401B2 (ja) | 帳票設計・読取設定支援装置、帳票設計・読取設定支援方法、及び、光学文字認識システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20060509 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20060821 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070319 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070319 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070319 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090929 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091126 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100302 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100308 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130312 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |