JP2013037419A - Handwritten information reflection system, handwritten information reflection method, and program - Google Patents
Handwritten information reflection system, handwritten information reflection method, and program Download PDFInfo
- Publication number
- JP2013037419A JP2013037419A JP2011170764A JP2011170764A JP2013037419A JP 2013037419 A JP2013037419 A JP 2013037419A JP 2011170764 A JP2011170764 A JP 2011170764A JP 2011170764 A JP2011170764 A JP 2011170764A JP 2013037419 A JP2013037419 A JP 2013037419A
- Authority
- JP
- Japan
- Prior art keywords
- handwritten information
- data
- extracted
- reflecting
- electronic book
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- User Interface Of Digital Computer (AREA)
- Document Processing Apparatus (AREA)
Abstract
Description
本発明は、手書き情報反映システム、手書き情報反映方法、およびプログラムに関し、特に、紙媒体から抽出した手書き情報を電子書籍データに反映する手書き情報反映システム等に関する。 The present invention relates to a handwritten information reflecting system, a handwritten information reflecting method, and a program, and more particularly to a handwritten information reflecting system that reflects handwritten information extracted from a paper medium in electronic book data.
近年、紙の節約、嵩張る紙の輸送や保管費の削減のため、ディスプレイに表示して閲覧するデジタルデータによる電子書籍が提供されるようになってきている。 2. Description of the Related Art In recent years, electronic books using digital data displayed on a display for browsing have been provided in order to save paper and reduce bulky paper transportation and storage costs.
書籍が電子化されることにより、様々な利用方法が可能となる。特許文献1には、読書進行状況情報に応じた実際の書籍と同様の厚みを有する縦縞模様を表示することにより、現在表示しているページが書籍全体としてどの当りの位置に相当するのかをユーザに対して直感的かつ大まかに認識させる技術が提案されている。
Various utilization methods are possible by digitizing a book. In
また特許文献2には、ページ毎に索引としてのキーワードを抽出し、そのキーワードから目次を作成することにより、検索に必要とされる文字列の入力を不要として、それら電子化ドキュメントを容易に検索・表示する技術が提案されている。
In
しかしながら、特許文献1および特許文献2の技術では、紙媒体に付与されたマーカやメモ書きを抽出し、抽出したマーカやメモ書きを手書き情報としてリフロー型電子書籍データに反映することができない課題があった。
However, with the techniques of
本発明は、前述した問題点に鑑みてなされたもので、その目的とすることは、紙媒体から抽出した手書き情報をリフロー型電子書籍データに反映する手書き情報反映システム等を提供することである。 The present invention has been made in view of the above-described problems, and an object of the present invention is to provide a handwritten information reflecting system that reflects handwritten information extracted from a paper medium in reflow electronic book data. .
前述した目的を達成するために、第1の本発明は、リフロー型電子書籍データおよび紙書籍から読み取られた読取画像を記憶する記憶手段と、前記読取画像から、所定の抽出条件に基づいて、手書き情報および反映位置を抽出する抽出手段と、前記リフロー型電子書籍データのうち、前記抽出手段により抽出された前記反映位置に前記手書き情報を反映する反映手段と、を具備することを特徴とする手書き情報反映システムである。
第1の発明によって、紙媒体から抽出した手書き情報を電子書籍データに簡単に反映することが可能となる。
In order to achieve the above-described object, the first aspect of the present invention is a storage means for storing reflow type electronic book data and a read image read from a paper book, and based on a predetermined extraction condition from the read image. Extraction means for extracting handwritten information and a reflection position, and reflection means for reflecting the handwritten information in the reflection position extracted by the extraction means in the reflow type electronic book data. This is a handwritten information reflection system.
According to the first invention, handwritten information extracted from a paper medium can be easily reflected in electronic book data.
前記抽出手段は、前記手書き情報としてメモ書きを含むメモ画像を抽出し、前記反映位置として前記メモ画像と近い位置の文字列を抽出する。
これにより、メモ書きとして抽出されたメモ画像と、そのメモ画像と近い位置の文字列とを対応付けて手書き情報データとして保存することができる。
The extraction unit extracts a memo image including a memo as the handwritten information, and extracts a character string at a position close to the memo image as the reflection position.
Thereby, the memo image extracted as a memo and the character string at a position close to the memo image can be associated with each other and stored as handwritten information data.
前記抽出手段は、前記メモ画像のヒストグラムを算出し、前記ヒストグラムの分布に応じてメモ画像と書籍画像を区別する。
これにより、誤ってメモ画像として抽出された書籍画像をメモ画像の対象から除外することができる。
The extraction means calculates a histogram of the memo image and distinguishes the memo image from the book image according to the distribution of the histogram.
Thereby, the book image extracted as a memo image by mistake can be excluded from the target of the memo image.
前記反映手段は、反映させる前記メモ画像の選択画面を表示し、前記選択画面で選択された前記メモ画像を前記リフロー型電子書籍データに反映する。
これにより、反映させるメモ画像を確認することができるため、ユーザは、メモ画像のみを確実に電子書籍データに反映することができる。
The reflection means displays a selection screen for the memo image to be reflected, and reflects the memo image selected on the selection screen in the reflow electronic book data.
Thereby, since the memo image to be reflected can be confirmed, the user can reliably reflect only the memo image in the electronic book data.
前記抽出手段は、前記手書き情報としてマーカ領域を抽出し、前記反映位置として前記マーカ領域内の文字列を抽出する。
これにより、マーカ領域ごとにマーカ領域内の文字列を手書き情報データとして保存することができる。
The extraction unit extracts a marker area as the handwritten information, and extracts a character string in the marker area as the reflection position.
Thereby, the character string in a marker area | region can be preserve | saved as handwritten information data for every marker area | region.
第2の発明は、リフロー型電子書籍データおよび紙書籍から読み取られた読取画像を記憶する記憶ステップと、前記読取画像から、所定の抽出条件に基づいて、手書き情報および反映位置を抽出する抽出ステップと、前記リフロー型電子書籍データのうち、前記抽出手段により抽出された前記反映位置に前記手書き情報を反映する反映ステップと、を含むことを特徴とする。
第2の発明によって、紙媒体から抽出した手書き情報を電子書籍データに簡単に反映することが可能となる。
2nd invention memorize | stores the read image read from reflow type | mold electronic book data and a paper book, The extraction step which extracts handwritten information and a reflection position from the said read image based on predetermined | prescribed extraction conditions And a reflecting step of reflecting the handwritten information in the reflecting position extracted by the extracting means in the reflow type electronic book data.
According to the second invention, handwritten information extracted from a paper medium can be easily reflected in electronic book data.
第3の発明は、リフロー型電子書籍データおよび紙書籍から読み取られた読取画像を記憶する記憶ステップと、前記読取画像から、所定の抽出条件に基づいて、手書き情報および反映位置を抽出する抽出ステップと、前記リフロー型電子書籍データのうち、前記抽出手段により抽出された前記反映位置に前記手書き情報を反映する反映ステップと、を実行させるためのプログラムである。 3rd invention memorize | stores the reflow type | mold electronic book data and the reading image read from the paper book, The extraction step which extracts handwritten information and a reflection position from the said reading image based on predetermined | prescribed extraction conditions And a reflecting step of reflecting the handwritten information in the reflecting position extracted by the extracting means in the reflow type electronic book data.
第3の発明に係るプログラムをコンピュータにインストールすることで、第1の発明に係る手書き情報反映システムを得ることができる。 By installing the program according to the third invention in the computer, the handwritten information reflecting system according to the first invention can be obtained.
本発明により、紙媒体から抽出した手書き情報をリフロー型電子書籍データに反映する手書き情報反映システム等を提供することができる。 According to the present invention, it is possible to provide a handwritten information reflection system that reflects handwritten information extracted from a paper medium in reflow electronic book data.
以下、図面に基づいて、本発明の実施形態を詳細に説明する。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
[本発明の第1の実施の形態]
図1は、本発明の実施の形態に係る手書き情報反映システム1の構成例を示す図である。
[First embodiment of the present invention]
FIG. 1 is a diagram illustrating a configuration example of a handwritten
図1に示す手書き情報反映システム1は、端末2と読取装置3とが相互に接続されることで構成される。端末2は、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)、HDD(Hard Disc Drive)等からなるコンピュータシステムであり、例えば、パーソナルコンピュータ、タブレット端末、携帯電話機、スマートフォンである。
The handwritten
端末2は、リフロー型の電子書籍データを記憶する。電子書籍データには、書誌データ(書籍の題号、著者、出版社、出版年月等)、目次データ(書籍の本文の内容を示す見出し等)、本文データ(書籍の本文に関する電子データ)、文献リストデータ(書籍の著者、題号、出版社、出版年月等)などが含まれる。
The
リフロー型の電子書籍データとは、文字を大きくすればページ数が増え、文字を小さくすればページ数が減るといったように、文字の大きさを変更しても画面に合わせて文字がリフローするため、ページ送りだけで読み進めることができる電子書籍データのことである。 Reflow-type e-book data means that the text will reflow to fit the screen even if the size of the text is changed, such as increasing the text to increase the number of pages and reducing the text to decrease the number of pages. This is electronic book data that can be read only by page feed.
端末2は、読み取り装置3が紙書籍4から読み取った読取画像のデータを受信し、記憶する。また端末2は、読取画像データから所定の抽出条件に基づいて手書き情報を抽出するとともに、電子書籍データから手書き情報にマッチングする位置を反映位置として抽出し、その反映位置に手書き情報を反映する。第1の実施の形態でいう手書き情報とは、例えば、蛍光ペンによるマーカラインが付与された部分のことである。
The
読取装置3は、例えば、スキャナやカメラなどであり、紙書籍4の紙面を読み取り、読取画像データを生成する。第1の実施の形態において、読取装置3は、紙書籍4の1頁分を画像化することができる装置であれば、何でもよい。なお、端末2にカメラが実装されている場合、端末2と読取装置3は一体とされる。
The
図2は、端末2のハードウエア構成例を示す図である。尚、図2のハードウエア構成は一例であり、用途、目的に応じて様々な構成を採ることが可能である。
FIG. 2 is a diagram illustrating a hardware configuration example of the
端末2は、制御部11、記憶部12、メディア入出力部13、通信制御部14、入力部15、表示部16、周辺機器I/F部17等が、バス18を介して接続される。
The
制御部11は、CPU、ROM、RAM等で構成される。CPUは、記憶部12、ROM、記録媒体等に格納されるプログラムをRAM上のワークメモリ領域に呼び出して実行し、バス18を介して接続された各装置を駆動制御し、端末2が行う後述する処理を実現する。ROMは、不揮発性メモリであり、端末2のブートプログラムやBIOS(Basic Input/Output System)等のプログラム、データ等を恒久的に保持している。RAMは、揮発性メモリであり、記憶部12、ROM、記録媒体等からロードしたプログラム、データ等を一時的に保持するとともに、制御部11が各種処理を行う為に使用するワークエリアを備える。
The
記憶部12は、HDD等であり、制御部11が実行するプログラム、プログラム実行に必要なデータ、OS(オペレーティングシステム)等が格納される。プログラムに関しては、OSに相当する制御プログラムや、後述する処理を端末2に実行させるためのアプリケーションプログラムが格納されている。これらの各プログラムコードは、制御部11により必要に応じて読み出されてRAMに移され、CPUに読み出されて各種の手段として実行される。
The
メディア入出力部13(ドライブ装置)は、データの入出力を行い、例えば、CDドライブ(−ROM、−R、−RW等)、DVDドライブ(−ROM、−R、−RW等)等のメディア入出力装置を有する。 The media input / output unit 13 (drive device) inputs / outputs data, for example, media such as a CD drive (-ROM, -R, -RW, etc.), DVD drive (-ROM, -R, -RW, etc.) Has input / output devices.
通信制御部14は、通信制御装置、通信ポート等を有し、端末2とネットワーク間の通信を媒介する通信インタフェースであり、ネットワークを介して、他の装置間との通信制御を行う。ネットワークは、有線、無線を問わない。
The
入力部15は、データの入力を行い、例えば、キーボード、マウス等のポインティングデバイス、テンキー等の入力装置を有する。入力部15を介して、端末2に対して、操作指示、動作指示、データ入力等を行うことができる。
The
表示部16は、液晶パネル等のディスプレイ装置、ディスプレイ装置と連携して端末2のビデオ機能を実現するための論理回路等(ビデオアダプタ等)を有する。
The
周辺機器I/F(インタフェース)部17は、端末2に周辺機器を接続させるためのポートであり、周辺機器I/F部17を介して端末2は周辺機器とのデータの送受信を行う。周辺機器I/F部17は、USB(Universal Serial Bus)やIEEE(The Institute of Electrical and
Electronics Engineers)1394やRS(Recommended Standard)−232C等で構成されており、通常複数の周辺機器I/Fを有する。周辺機器との接続形態は有線、無線を問わない。バス18は、各装置間の制御信号、データ信号等の授受を媒介する経路である。
The peripheral device I / F (interface)
Electronics Engineers) 1394, RS (Recommended Standard) -232C, etc., and usually has a plurality of peripheral devices I / F. The connection form with the peripheral device may be wired or wireless. The bus 18 is a path that mediates transmission / reception of control signals, data signals, and the like between the devices.
図3は、端末2の記憶部12に記憶される情報の例である。
FIG. 3 is an example of information stored in the
図3に示すように、端末2の記憶部12は、読取画像データ21、電子書籍データ22、手書き情報データ23、手書き情報反映AP(アプリケーション)24、および電子書籍ビューア25を記憶している。
As illustrated in FIG. 3, the
読取画像データ21は、読取装置3で読み取られた紙書籍4が画像化されたデータである。電子書籍データ22は、書籍1冊分のデータであって、書誌データ、目次データ、本文データ、文献リストデータなどを含み、リフロー型に制作されたデータである。
The read
手書き情報データ23は、手書き情報反映アプリケーション24により、所定の抽出条件に基づいて読取画像データ21から抽出された手書き情報のデータである。
The handwritten information data 23 is handwritten information data extracted from the read
手書き情報反映アプリケーション24は、所定の抽出条件に基づいて、読取画像データ21から手書き情報を抽出し、手書き情報データ23を生成する。また手書き情報反映アプリケーション24は、電子書籍データ22から手書き情報にマッチングする位置を反映位置として抽出し、その反映位置に、抽出された手書き情報を反映する。
The handwritten
電子書籍ビューア25は、手書き情報が反映された電子書籍データ22を取得し、その内容を表示する。
The
図4は、手書き情報反映システム1が実行する、第1の実施の形態における手書き情報抽出処理を説明するフローチャートである。図4の説明に当たり、図5〜図9を参照し、具体的な処理内容も説明する。
FIG. 4 is a flowchart for explaining the handwritten information extraction process in the first embodiment, which is executed by the handwritten
ステップS1において、読取装置3は、蛍光ペンなどによるマーカラインが付与された紙書籍4の紙面を読み取り、読取画像データを生成する。
In step S <b> 1, the
図5は、読取装置3により読み取られ、生成された読取画像データ21a、21bの例を示す図である。
FIG. 5 is a diagram illustrating an example of the read image data 21a and 21b read and generated by the
図5に示すように、読取画像データ21aには、「吾輩(わがはい)は猫」の文字にマーカ30aが付与されているとともに、「である。名前はまだ無い。」の文字にマーカ30bが付与されている。また、読取画像データ21bには、「しかしその当時は何という考もなかったから別段恐ろしいとも思わなかった。」の文字にマーカ30cが付与されている。図5の例では、読取画像データ21aに含まれるマーカ30aとマーカ30bは、互いのマーカラインが接していないが、読取画像データ21bに含まれるマーカ30cは、複数行のマーカラインが接している。
As shown in FIG. 5, in the read image data 21 a, a marker 30 a is added to the characters “My cat is a cat” and a
図4の説明に戻る。ステップS2において、端末2の手書き情報反映アプリケーション24は、ステップS1の処理で読取装置3により生成された読取画像データを走査し、背景色が異なる領域(例えば、蛍光色)を抽出する。例えば、図5において、マーカ30a、30b、30c(斜線で囲まれた領域)が異なる領域と判断され、矢印S2の先に示すように、抽出領域31a、31b、31cとしてそれぞれ抽出される。
Returning to the description of FIG. In step S2, the handwritten
図4の説明に戻る。ステップS3において、端末2の手書き情報反映アプリケーション24は、ステップS2の処理で抽出した抽出領域ごとに、抽出領域内のエッジを算出し、2値化する。例えば、図5において、抽出領域31a、31b、31c内のエッジが算出されて2値化され、矢印S3の先に示すように、2値化領域32a、32b、32cがそれぞれ得られる。
Returning to the description of FIG. In step S3, the handwritten
図4の説明に戻る。ステップS4において、端末2の手書き情報反映アプリケーション24は、ステップS3の処理で2値化した2値化領域ごとに、行間を除いた行ごとの行領域を抽出する。
Returning to the description of FIG. In step S4, the handwritten
図6は、2値化領域32cの行間を除いた行ごとの行領域を抽出する例を示す図である。 FIG. 6 is a diagram illustrating an example of extracting the row area for each row excluding the line spacing of the binarized region 32c.
図6に示すように、2値化領域32cには、「しかしその」の文字列が含まれる行、「当時は何という考もな」の文字列が含まれる行、「かったから別段恐ろしいと」の文字列が含まれる行、「も思わなかった。」の文字列が含まれる行、および行間(空白)が含まれている。この2値化領域32cにおいて、矢印S4の先に示すように、行間を除く行ごとの行領域33a、33b、33c、33dがそれぞれ抽出される。なお、図5における2値化領域32a、32bは、行間を含まない1行からなる文字列であるため、2値化領域32a、32bがそのまま行領域となる(図示せず)。 As shown in FIG. 6, the binarized area 32 c includes a line that includes the character string “But”, a line that includes the character string “Nothing to think at that time”, and “ ", A line including the character string" I didn't expect it ", and a line space (blank). In the binarized area 32c, as indicated by the tip of the arrow S4, line areas 33a, 33b, 33c, and 33d for each line excluding the line spacing are extracted. Since the binarized areas 32a and 32b in FIG. 5 are character strings consisting of one line that does not include a line space, the binarized areas 32a and 32b are directly used as line areas (not shown).
図4の説明に戻る。ステップS5において、端末2の手書き情報反映アプリケーション24は、ステップS4の処理で抽出した行領域ごとに、1文字ごとの文字領域を抽出する。
Returning to the description of FIG. In step S5, the handwritten
図7は、行領域33aごとに1文字ごとの文字領域を抽出する例を示す図である。 FIG. 7 is a diagram illustrating an example of extracting a character area for each character for each row area 33a.
図7に示すように、行領域33aには、「しかしその」の文字列が含まれており、矢印S5の先に示すように、「し」の文字領域34a、「か」の文字領域34b、「し」の文字領域34c、「そ」の文字領域34d、「の」の文字領域34eがそれぞれ抽出される。 As shown in FIG. 7, the line area 33a includes the character string “But”, however, as indicated by the tip of the arrow S5, the character area 34a of “shi” and the character area 34b of “ka”. , “Shi” character area 34c, “so” character area 34d, and “no” character area 34e, respectively.
図4の説明に戻る。ステップS6において、端末2の手書き情報反映アプリケーション24は、ステップS5の処理で抽出した文字領域ごとに、文字認識を行い、文字コードを特定する。ステップS7において、端末2の手書き情報反映アプリケーション24は、ステップS2の処理で抽出した抽出領域ごとに、抽出領域内の文字コード群を手書き情報データ(マーカ)として記憶部12に保存する。
Returning to the description of FIG. In step S6, the handwritten
図8は、手書き情報データ23aの例を示す図である。 FIG. 8 is a diagram illustrating an example of the handwritten information data 23a.
図8に示すように、No.1のデータ格納領域には、種別が「マーカ」、抽出文字列が「吾輩(わがはい)は猫」の手書き情報データ(抽出領域31a内の文字コード群)が保存され、No.2のデータ格納領域には、種別が「マーカ」、抽出文字列が「である。名前はまだ無い。」の手書き情報データ(抽出領域31b内の文字コード群)が保存され、No.3のデータ格納領域には、種別が「マーカ」、抽出文字列が「しかしその当時は何という考もなかったから別段恐ろしいとも思わなかった。」の手書き情報データ(抽出領域31c内の文字コード群)が保存される。
As shown in FIG. In the
以上のようにして、手書き情報反映システム1は、蛍光ペンによるマーカラインが付与された紙書籍4の紙面を読み取り、そのマーカ領域を手書き情報として抽出し、保存することができる。
As described above, the handwritten
図9は、手書き情報反映システム1が実行する、第1の実施の形態における手書き情報反映処理を説明するフローチャートである。図9の説明に当たり、図10を参照し、具体的な処理内容も説明する。
FIG. 9 is a flowchart for explaining handwritten information reflecting processing in the first embodiment executed by the handwritten
ステップS11において、端末2の手書き情報反映アプリケーション24は、記憶部12に保存されている手書き情報データ23a(図8)の抽出文字列と、閾値以上の割合で一致する電子書籍データ22の文字列を検索する。
In step S11, the handwritten
具体的には、端末2の手書き情報反映アプリケーション24は、手書き情報データ23aの抽出文字列の先頭から、文字列の最後まで1文字ずつ電子書籍データ22とマッチングを行い、マッチしたら1、マッチしなかったら0というようにスコアリングし、予め設定した閾値を元にマッチするかしないかを判断する。例えば、19文字の抽出文字列に完全一致させる場合にはスコアが19でなければならないが、閾値(一致する割合)を設定することで、あいまい検索が可能となる。
Specifically, the handwritten
ステップS12において、端末2の手書き情報反映アプリケーション24は、ステップS11の処理で検索した電子書籍データ22の文字列を囲むマーカタグを追加する。
In step S12, the handwritten
具体的には、図5に示した読取画像データ21aにおいて、「吾輩(わがはい)は猫である。名前はまだ無い。」の一文がひとつの段落を構成している。すなわち、XML(Extensible Markup Language)の形式で記述された電子書籍データ22では、「吾輩(わがはい)は猫である。名前はまだ無い。」の前段に「<P>」が記述され、後段に「</P>」が記述されることで、<P>〜</P>で囲まれた部分がひとつの段落であることが表されている。 Specifically, in the read image data 21 a shown in FIG. 5, one sentence of “My friend is a cat. No name yet” forms one paragraph. That is, in the electronic book data 22 described in the XML (Extensible Markup Language) format, “<P>” is described in the former stage of “My friend is a cat. There is no name yet.” By describing “</ P>”, it is indicated that the portion surrounded by <P> to </ P> is one paragraph.
図8に示すように、手書き情報データ23aにおける「吾輩(わがはい)は猫」と「である。名前はまだ無い。」の抽出文字列は別々に抽出されているため、電子書籍データ22のXMLファイルにおける「吾輩(わがはい)は猫」の前段に「<span class=“mark”>」が記述され、後段に「</span>」が記述される。また、「である。名前はまだ無い。」の前段に「<span class=“mark”>」が記述され、後段に「</span>」が記述される。これにより、<span class=“mark”>〜</span>で囲まれた部分にマーカタグ(マーカ機能)が追加される。 As shown in FIG. 8, the extracted character strings “My cat is a cat” and “No name yet.” In the handwritten information data 23 a are extracted separately. In the file, “<span class =“ mark ”>” is described at the front of “My cat is my cat”, and “</ span>” is described at the back. In addition, “<span class =“ mark ”>” is described in the previous stage of “Yes. No name yet”, and “</ span>” is described in the subsequent stage. Thereby, a marker tag (marker function) is added to a portion surrounded by <span class = “mark”> to </ span>.
図9の説明に戻る。ステップS13において、端末2の手書き情報反映アプリケーション24は、ステップS12の処理で追加したマーカタグのうち、連続するマーカタグを統合する。これにより、電子書籍データ22のXMLファイルにおける「吾輩(わがはい)は猫」と「である。名前はまだ無い。」にそれぞれマーカタグが追加されていたが、それらが1つに統合される。
Returning to the description of FIG. In step S13, the handwritten
なお、図8に示すように、手書き情報データ23aにおける「しかしその当時は何という考もなかったから別段恐ろしいとも思わなかった。」の抽出文字列は一続きで抽出されているため、1つのマーカタグが追加され、マーカタグの統合の必要はない。 As shown in FIG. 8, the extracted character string “But I didn't think it was scary because I had no idea at that time” in the handwritten information data 23a was extracted in a row, so one marker tag Is added and there is no need for marker tag integration.
図10は、マーカタグが追加された電子書籍データ22のXMLファイル41aと、そのファイルに基づく表示画面42aの例を示す図である。 FIG. 10 is a diagram illustrating an example of an XML file 41a of electronic book data 22 to which a marker tag is added and a display screen 42a based on the file.
図10に示すように、電子書籍データ22のXMLファイル41aには、「吾輩(わがはい)は猫である。名前はまだ無い。」の前後にマーカタグが記述されているとともに、「しかしその当時は何という考もなかったから別段恐ろしいとも思わなかった。」の前後にマーカタグが記述されている。電子書籍ビューア25は、このXMLファイル41aに基づいて表示画面42aを表示部16に表示させることができる。図10の例では、紙書籍4の紙面で付与された手書きマーカが電子書籍データ22に反映され、表示されている(図中、斜線で囲まれた領域)。
As shown in FIG. 10, in the XML file 41a of the electronic book data 22, marker tags are described before and after “My friend is a cat. There is no name yet.” I didn't think anything, so I didn't think it was awful. "Marker tags are written before and after. The
[本発明の第1の実施の形態における効果]
1.以上のように、紙書籍に付与したマーカを簡単にリフロー型の電子書籍に反映することができる。例えば、学校の教科書や参考書などの場合、授業中に複数の書籍にマーカした内容を電子書籍に反映することによって、電車などでまとめて確認することができる。
[Effect in the first embodiment of the present invention]
1. As described above, a marker attached to a paper book can be easily reflected in a reflow electronic book. For example, in the case of school textbooks and reference books, the contents marked on a plurality of books during the class can be reflected on the electronic book, so that they can be confirmed together on a train.
2.著名人が付与したマーカをリフロー型の電子書籍に反映することによって、新たな付加価値を持つ電子書籍を提供することができる。例えば、著名人のファンなどは、オリジナルの電子書籍にあまり関心がなくても、著名人が特にお勧めする文章がマーカされた電子書籍であれば購入することが考えられ、販促効果が期待できる。 2. By reflecting a marker provided by a celebrity in a reflow-type electronic book, an electronic book having a new added value can be provided. For example, a celebrity fan may be interested in purchasing an e-book that is marked with a sentence recommended by a celebrity, even if he is not interested in the original e-book. .
[本発明の第2の実施の形態]
次に、本発明の第2の実施の形態について説明する。
[Second embodiment of the present invention]
Next, a second embodiment of the present invention will be described.
第2の実施の形態において、基本的なシステム構成(図1)、端末2のハードウエア構成(図2)および記憶部12に記憶される情報(図3)は、第1の実施の形態と同様である。第2の実施の形態では、手書き情報として、メモ書きを抽出して電子書籍データ22に反映させることを特徴とするものである。 In the second embodiment, the basic system configuration (FIG. 1), the hardware configuration of the terminal 2 (FIG. 2), and the information stored in the storage unit 12 (FIG. 3) are the same as those in the first embodiment. It is the same. In the second embodiment, note writing is extracted as handwritten information and reflected in the electronic book data 22.
図11は、手書き情報反映システム1が実行する、第2の実施の形態における手書き情報抽出処理を説明するフローチャートである。図11の説明に当たり、図12〜図15を参照し、具体的な処理内容も説明する。
FIG. 11 is a flowchart for describing handwritten information extraction processing in the second embodiment, which is executed by the handwritten
ステップS21において、読取装置3は、手書き文字が書き込まれた紙書籍4の紙面を読み取り、読取画像データを生成する。
In step S <b> 21, the
図12は、読取装置3により読み取られ、生成された読取画像データ21c、21dの例を示す図である。
FIG. 12 is a diagram illustrating an example of the read image data 21c and 21d read and generated by the
図12に示すように、読取画像データ21cには、基本版面52内の上方(「吾輩」と「である。」の行間付近)に、「メモAです。」の手書き文字51aが書き込まれている。また、読取画像データ21dには、基本版面52外の下方に、「メモBです。」の手書き文字51bが書き込まれている。なお、読取画像データ21dには、書籍画像53も含まれる。 As shown in FIG. 12, in the read image data 21c, a handwritten character 51a of "Memo A." is written above the basic printing plate 52 (near the line spacing of "Sai" and "I"). Yes. In the read image data 21 d, a handwritten character 51 b of “Memo B.” is written below the basic plate surface 52. The read image data 21d includes a book image 53.
図11の説明に戻る。ステップS22において、端末2の手書き情報反映アプリケーション24は、紙書籍4の紙面の基本版面を取得する。例えば、手書き情報反映アプリケーション24は、紙面における本文のうち、最左端の文字列のエッジと最右端の文字列のエッジから横サイズを算出し、最上端の文字列のエッジと最下端の文字列のエッジから縦サイズを算出することで、基本版面を取得することができる。
Returning to the description of FIG. In step S <b> 22, the handwritten
ステップS23において、端末2の手書き情報反映アプリケーション24は、ステップS22の処理で取得した基本版面外におけるエッジを算出し、エッジが多い領域を抽出する。つまり、基本版面外には本文が存在しないため、エッジが多い領域がメモ書き候補として抽出される。例えば、図12において、読取画像データ21d内に含まれる手書き文字51bが抽出領域画像として抽出される。
In step S23, the handwritten
ステップS24において、端末2の手書き情報反映アプリケーション24は、ステップS22の処理で取得した基本版面内におけるエッジを算出し、エッジの出現位置が不規則な領域を抽出する。
In step S24, the handwritten
具体的には、予め、メモ書きがない紙面に基づいて行領域と行間領域の幅を算出しておき、メモ書きがある紙面に対して行間領域を走査することで、エッジを探索していく。本文はエッジの出方が規則的であるが、メモ書きや画像等は不規則になるため、エッジの出方が不規則になる領域がメモ書き候補として抽出される。この方法によると、画像なども抽出される。例えば、図12において、読取画像データ21cに含まれる手書き文字51aと、読取画像データ21dに含まれる手書き文字51bが抽出領域画像として抽出される。 Specifically, the widths of the line area and the inter-line area are calculated in advance based on a sheet without a note, and the edge is searched by scanning the line area with respect to the sheet with a note. . Although the text has regular edges, the memos and images are irregular, so the areas where the edges appear irregular are extracted as memo candidates. According to this method, an image or the like is also extracted. For example, in FIG. 12, a handwritten character 51a included in the read image data 21c and a handwritten character 51b included in the read image data 21d are extracted as extraction region images.
ステップS25において、端末2の手書き情報反映アプリケーション24は、ステップS23、S24の処理で抽出した抽出領域画像ごとにヒストグラムを算出し、ヒストグラムが幅広く分布している抽出領域画像を書籍画像と判定する。
In step S25, the handwritten
図13は、抽出領域画像から算出されたヒストグラムの例を示す図である。 FIG. 13 is a diagram illustrating an example of a histogram calculated from the extracted region image.
図13(a)は、図12に示した手書き文字51aに対応する抽出領域画像61aから算出されたヒストグラム62aを示している。図13(b)は、図12に示した書籍画像53に対応する抽出領域画像61bから算出されたヒストグラム62bを示している。図13(c)は、図12に示した手書き文字51bに対応する抽出領域画像61cから算出されたヒストグラム62cを示している。
FIG. 13A shows a histogram 62a calculated from the
これらの図からもわかる通り、ヒストグラム62bだけが幅広く分布しており、ヒストグラム62a、62cは分布が両端に偏っている。従って、ヒストグラム62bを算出する上で元画像となった抽出領域画像61bは、メモ書きではなく、書籍画像と判断することができる。
As can be seen from these figures, only the histogram 62b is widely distributed, and the distributions of the histograms 62a and 62c are biased at both ends. Therefore, the
図11の説明に戻る。ステップS26において、端末2の手書き情報反映アプリケーション24は、ステップS23、S24で抽出された抽出領域画像に基づく反映メモ選択画面を生成し、表示部16に表示させる。
Returning to the description of FIG. In step S <b> 26, the handwritten
図14は、反映メモ選択画面71の表示例を示す図である。 FIG. 14 is a diagram illustrating a display example of the reflected memo selection screen 71.
図14に示すように、反映メモ選択画面71には、抽出領域画像61a、61b、61cがそれぞれファイル名とともに表示されており、各画像の左側にチェックボックスが配置され、手書きメモと判断された抽出領域画像にはチェックが入れられている。図14の例の場合、ステップS25の処理で抽出領域画像61bは書籍画像であると判定されたため、チェックが外されている。
As shown in FIG. 14, on the reflected memo selection screen 71, the
また反映メモ選択画面71には、チェックボックスにチェックが入れられた手書きメモ(抽出領域画像)を電子書籍データ22に反映する場合に選択される決定ボタン71a、電子書籍データ22への反映をキャンセルする場合に選択されるキャンセルボタン71bも表示されている。
In addition, the reflected memo selection screen 71 cancels the reflection to the electronic book data 22, the
図11の説明に戻る。ステップS27において、端末2の手書き情報反映アプリケーション24は、ステップS26の処理で反映メモ選択画面71に表示された抽出領域画像61a〜61cごとに、読取画像データ21における抽出領域と近い位置の文字列をそれぞれ特定する。ステップS28において、端末2の手書き情報反映アプリケーション24は、抽出領域画像61a〜61cと、ステップS27の処理で特定された抽出文字列とを対応付けて手書き情報データ(メモ)として記憶部12に保存する。
Returning to the description of FIG. In step S27, the handwritten
図15は、手書き情報データ23bの例を示す図である。 FIG. 15 is a diagram illustrating an example of the handwritten information data 23b.
図15に示すように、No.1のデータ格納領域には、種別が「メモ」、抽出領域画像が「Memo001.png」、抽出領域と近い位置の文字列が「xx(わがはい)は」の手書き情報データが保存され、No.2のデータ格納領域には、種別が「メモ」、抽出領域画像が「Memo003.png」、抽出領域と近い位置の文字列が「見始(みはじめ)であろう。」の手書き情報データが保存される。なお、No.1のデータ格納領域に記憶される文字列のうち「xx」は、文字認識できなかった文字を示している。
As shown in FIG. In the
以上のようにして、手書き情報反映システム1は、メモが書き込まれた紙書籍4の紙面を読み取り、エッジが多い、またはエッジ出現位置が不規則な領域を手書き情報として抽出し、保存することができる。
As described above, the handwritten
図16は、手書き情報反映システム1が実行する、第2の実施の形態における手書き情報反映処理を説明するフローチャートである。図16の説明に当たり、図17を参照し、具体的な処理内容も説明する。
FIG. 16 is a flowchart for explaining handwritten information reflecting processing in the second embodiment, which is executed by the handwritten
ステップS31において、端末2の手書き情報反映アプリケーション24は、記憶部12に保存されている手書き情報データ23b(図15)の抽出領域と近い位置の文字列と、閾値以上の割合で一致する電子書籍データ22の文字列を検索する。
In step S31, the handwritten
具体的には、端末2の手書き情報反映アプリケーション24は、第1の実施の形態と同様に、手書き情報データ23bの文字列の先頭から、文字列の最後まで1文字ずつ電子書籍データ22とマッチングを行い、マッチしたら1、マッチしなかったら0というようにスコアリングし、予め設定した閾値を元にマッチするかしないかを判断する。
Specifically, the handwritten
ステップS32において、端末2の手書き情報反映アプリケーション24は、ステップS31の処理で検索した電子書籍データ22の文字列を囲むメモタグを追加する。
In step S32, the handwritten
具体的には、上述した処理によって、図15に示すように、手書き情報データ23bにおける「xx(わがはい)は」と「見始(みはじめ)であろう。」が手書きメモの抽出領域と近い位置の文字列として抽出されているため、電子書籍データ22のXMLファイルにおける「吾輩(わがはい)は」の前段に「<memo
src=“Memo001.png”>」が記述され、後段に「</memo>」が記述される。また、「見始(みはじめ)であろう。」の前段に「<memo src=“Memo001.png”>」が記述され、後段に「</memo>」が記述される。これにより、<memo src=“Memo001.png”>〜</memo>で囲まれた領域にメモタグ(メモ機能)が追加される。
Specifically, as shown in FIG. 15, by the above-described processing, “xx (my own)” and “beginning” are close to the handwritten memo extraction area in the handwritten information data 23 b. Since it is extracted as a character string of the position, the “<memo”
src = “Memo001.png”> ”is described, and“ </ memo> ”is described in the subsequent stage. In addition, “<memo src =“ Memo001.png ”>” is described in the front stage of “It will be the beginning”, and “</ memo>” is described in the subsequent stage. As a result, a memo tag (memo function) is added to the area surrounded by <memo src = “Memo001.png”> to </ memo>.
図17は、メモタグが追加された電子書籍データ22のXMLファイル41bと、そのファイルに基づく表示画面42bの例を示す図である。 FIG. 17 is a diagram illustrating an example of an XML file 41b of electronic book data 22 to which a memo tag is added and a display screen 42b based on the file.
図17に示すように、電子書籍データ22のXMLファイル41bには、「吾輩(わがはい)は」の前後にメモタグが記述されているとともに、「見始(みはじめ)であろう。」の前後にメモタグが記述されている。電子書籍ビューア25は、このXMLファイル41bに基づいて表示画面42bを表示部16に表示させることができる。図17の例では、紙書籍4の紙面でのメモ書きが電子書籍データ22に反映され、「メモAです。」と「メモBです。」の吹き出しとして表示されている。なお、図17の例では、吹き出しが表示されている状態とされているが、実際には、メモタグで囲まれた文字列がタップされる(またはマウスが通過される)ときのみ表示される。
As shown in FIG. 17, in the XML file 41b of the electronic book data 22, memo tags are described before and after “myself”, and before and after “beginning”. Has a memo tag. The
[本発明の第2の実施の形態における効果]
1.以上のように、紙書籍に書き込んだメモを簡単にリフロー型の電子書籍に反映することができる。例えば、学校の教科書や参考書などの場合、授業中に複数の書籍にメモした内容を電子書籍に反映することによって、電車などでまとめて確認することができる。
[Effect in the second embodiment of the present invention]
1. As described above, a memo written on a paper book can be easily reflected in a reflow electronic book. For example, in the case of school textbooks and reference books, the contents recorded in a plurality of books during a class can be confirmed together on a train by reflecting them in an electronic book.
2.著名人が書き込んだメモをリフロー型の電子書籍に反映することによって、新たな付加価値を持つ電子書籍を提供することができる。例えば、著名人のファンなどは、オリジナルの電子書籍にあまり関心がなくても、著名人が直接書き込んだメモ入り電子書籍であれば購入することが考えられ、販促効果が期待できる。 2. By reflecting a memo written by a celebrity in a reflow-type electronic book, an electronic book having a new added value can be provided. For example, a celebrity fan may be interested in purchasing an electronic book with a note directly written by a celebrity, even if he / she is not interested in the original electronic book.
[変形例]
以上においては、紙書籍に付与したマーカやメモ書きをリフロー型の電子書籍データに反映するようにしたが、これに限らず、例えば、ページの隅を折り曲げてある箇所(しおり)を検出し、そのページの先頭の文字列を抽出し、電子書籍データの文字列とマッチングする文字列にしおり機能を追加するようにしてもよい。
[Modification]
In the above, the marker or memo written on the paper book is reflected in the reflow-type electronic book data. However, the present invention is not limited to this. For example, a place where a corner of the page is folded (bookmark) is detected. The top character string of the page may be extracted and a bookmark function may be added to the character string matching the character string of the electronic book data.
例えば、図18に示すように、読取装置3により、読取画像データ21e、21fが生成されたとする。読取画像データ21fには、右上方隅にしおりが折り曲げられている。
For example, as shown in FIG. 18, it is assumed that the read image data 21e and 21f are generated by the
端末2の手書き情報反映アプリケーション24は、紙書籍4の紙面の基本版面外の四隅を探索し、折り曲げ(図18の例の場合、三角形のエッジ)を検出すると、それを、しおりとして抽出するとともに、その折り曲げを抽出したページの先頭の文字列を抽出する。そして、手書き情報反映アプリケーション24は、図19に示すように、種別が「しおり」、抽出文字列が「えて煮(に)て食うという話である。」の手書き情報データ23cを記憶部12に保存することができる。
When the handwritten
以上のようにして、手書き情報反映システム1は、しおりが折り曲げられた紙書籍4の紙面を読み取り、折り曲げを手書き情報として抽出し、保存することができる。
As described above, the handwritten
以上、添付図面を参照しながら、本発明に係る手書き情報反映システム等の好適な実施形態について説明したが、本発明はかかる例に限定されない。当業者であれば、本願で開示した技術的思想の範疇内において、各種の変更例又は修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。 The preferred embodiments of the handwritten information reflecting system and the like according to the present invention have been described above with reference to the accompanying drawings, but the present invention is not limited to such examples. It will be apparent to those skilled in the art that various changes or modifications can be conceived within the scope of the technical idea disclosed in the present application, and these naturally belong to the technical scope of the present invention. Understood.
1………手書き情報反映システム
2………端末
3………読取装置
4………紙書籍
11………制御部
12………記憶部
16………表示部
DESCRIPTION OF
Claims (7)
前記読取画像から、所定の抽出条件に基づいて、手書き情報および反映位置を抽出する抽出手段と、
前記リフロー型電子書籍データのうち、前記抽出手段により抽出された前記反映位置に前記手書き情報を反映する反映手段と、
を備えることを特徴とする手書き情報反映システム。 Storage means for storing reflow type electronic book data and a read image read from a paper book;
Extraction means for extracting handwritten information and a reflection position from the read image based on a predetermined extraction condition;
Reflecting means for reflecting the handwritten information in the reflecting position extracted by the extracting means among the reflow type electronic book data;
A handwritten information reflection system comprising:
ことを特徴とする請求項1に記載の手書き情報反映システム。 2. The handwritten information reflecting system according to claim 1, wherein the extracting unit extracts a memo image including a memo as the handwritten information, and extracts a character string at a position close to the memo image as the reflecting position. .
ことを特徴とする請求項2に記載の手書き情報反映システム。 The handwriting information reflecting system according to claim 2, wherein the extraction unit calculates a histogram of the memo image and distinguishes the memo image from the book image according to the distribution of the histogram.
ことを特徴とする請求項2または請求項3に記載の手書き情報反映システム。 The reflection unit displays a selection screen of the memo image to be reflected, and reflects the memo image selected on the selection screen in the reflow type electronic book data. The handwritten information reflection system described.
ことを特徴とする請求項1乃至請求項4のいずれかに記載の手書き情報反映システム。 5. The handwritten information reflection according to claim 1, wherein the extraction unit extracts a marker region as the handwritten information, and extracts a character string in the marker region as the reflection position. system.
前記読取画像から、所定の抽出条件に基づいて、手書き情報および反映位置を抽出する抽出ステップと、
前記リフロー型電子書籍データのうち、前記抽出手段により抽出された前記反映位置に前記手書き情報を反映する反映ステップと、
を含むことを特徴とする手書き情報反映方法。 A storage step of storing reflow type electronic book data and a read image read from a paper book;
An extraction step for extracting handwritten information and a reflection position from the read image based on a predetermined extraction condition;
A reflecting step of reflecting the handwritten information in the reflecting position extracted by the extracting means in the reflow type electronic book data;
A method for reflecting handwritten information, comprising:
リフロー型電子書籍データおよび紙書籍から読み取られた読取画像を記憶する記憶ステップと、
前記読取画像から、所定の抽出条件に基づいて、手書き情報および反映位置を抽出する抽出ステップと、
前記リフロー型電子書籍データのうち、前記抽出手段により抽出された前記反映位置に前記手書き情報を反映する反映ステップと、
を実行させるためのプログラム。 On the computer,
A storage step of storing reflow type electronic book data and a read image read from a paper book;
An extraction step for extracting handwritten information and a reflection position from the read image based on a predetermined extraction condition;
A reflecting step of reflecting the handwritten information in the reflecting position extracted by the extracting means in the reflow type electronic book data;
A program for running
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011170764A JP2013037419A (en) | 2011-08-04 | 2011-08-04 | Handwritten information reflection system, handwritten information reflection method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011170764A JP2013037419A (en) | 2011-08-04 | 2011-08-04 | Handwritten information reflection system, handwritten information reflection method, and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2013037419A true JP2013037419A (en) | 2013-02-21 |
Family
ID=47887006
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011170764A Withdrawn JP2013037419A (en) | 2011-08-04 | 2011-08-04 | Handwritten information reflection system, handwritten information reflection method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2013037419A (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013222458A (en) * | 2012-04-13 | 2013-10-28 | Samsung Electronics Co Ltd | Electronic device and method for inputting and managing user data |
JP2014186546A (en) * | 2013-03-22 | 2014-10-02 | Yahoo Japan Corp | Information processing device, information processing program, and information processing method |
JP7229318B1 (en) | 2021-10-31 | 2023-02-27 | 株式会社日本経済新聞社 | Newspaper electronic version system |
-
2011
- 2011-08-04 JP JP2011170764A patent/JP2013037419A/en not_active Withdrawn
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013222458A (en) * | 2012-04-13 | 2013-10-28 | Samsung Electronics Co Ltd | Electronic device and method for inputting and managing user data |
JP2014186546A (en) * | 2013-03-22 | 2014-10-02 | Yahoo Japan Corp | Information processing device, information processing program, and information processing method |
JP7229318B1 (en) | 2021-10-31 | 2023-02-27 | 株式会社日本経済新聞社 | Newspaper electronic version system |
JP2023067314A (en) * | 2021-10-31 | 2023-05-16 | 株式会社日本経済新聞社 | Newspaper electronic version system |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8107727B2 (en) | Document processing apparatus, document processing method, and computer program product | |
US10614300B2 (en) | Formatting handwritten content | |
JP4785655B2 (en) | Document processing apparatus and document processing method | |
US11475688B2 (en) | Information processing apparatus and information processing method for extracting information from document image | |
US11763588B2 (en) | Computing system for extraction of textual elements from a document | |
US9032284B2 (en) | Green printing: re-purposing a document to save ink and paper | |
US8799761B2 (en) | Method and system for repurposing a spreadsheet to save paper and ink | |
US10803233B2 (en) | Method and system of extracting structured data from a document | |
US20150261735A1 (en) | Document processing system, document processing apparatus, and document processing method | |
JP2014215911A (en) | Interest area estimation device, method, and program | |
JP2013037419A (en) | Handwritten information reflection system, handwritten information reflection method, and program | |
US20140281948A1 (en) | Information displaying apparatus, information editing method and non-transitory computer-readable storage medium | |
JP2008129793A (en) | Document processing system, apparatus and method, and recording medium with program recorded thereon | |
JP2013254321A (en) | Image processing apparatus, image processing method, and program | |
CN113111881A (en) | Information processing apparatus and recording medium | |
JP2011237993A (en) | Information input device and information input program | |
JP5550959B2 (en) | Document processing system and program | |
JP2007310503A (en) | Information processor, its control method and program | |
US20180032244A1 (en) | Input control device, input control method, character correction device, and character correction method | |
KR101368610B1 (en) | Method and system for selecting paragraph on electronic book environments | |
JP5596068B2 (en) | Electronic terminal and book browsing program | |
CN113378526A (en) | PDF paragraph processing method, device, storage medium and equipment | |
JP2010102734A (en) | Image processor and program | |
JP2016103150A (en) | Document processing device and document processing program | |
KR101098500B1 (en) | Data record operating method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20141007 |