[go: up one dir, main page]

JP2013037419A - Handwritten information reflection system, handwritten information reflection method, and program - Google Patents

Handwritten information reflection system, handwritten information reflection method, and program Download PDF

Info

Publication number
JP2013037419A
JP2013037419A JP2011170764A JP2011170764A JP2013037419A JP 2013037419 A JP2013037419 A JP 2013037419A JP 2011170764 A JP2011170764 A JP 2011170764A JP 2011170764 A JP2011170764 A JP 2011170764A JP 2013037419 A JP2013037419 A JP 2013037419A
Authority
JP
Japan
Prior art keywords
handwritten information
data
extracted
reflecting
electronic book
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2011170764A
Other languages
Japanese (ja)
Inventor
Kenko Mihashi
憲晃 三橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dai Nippon Printing Co Ltd
Original Assignee
Dai Nippon Printing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dai Nippon Printing Co Ltd filed Critical Dai Nippon Printing Co Ltd
Priority to JP2011170764A priority Critical patent/JP2013037419A/en
Publication of JP2013037419A publication Critical patent/JP2013037419A/en
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)
  • Document Processing Apparatus (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a handwritten information reflection system and the like to reflect handwritten information extracted from a paper medium in reflow type electronic book data.SOLUTION: In S1, a page space of a paper document 4 having marking lines is read and read image data is generated. In S2, the read image data is scanned and areas having different background colors are extracted. In S3, edges in each extracted area are calculated and binarized. In S4 to S6, row areas each representing a row except for spacing between rows are extracted from each binarized area, character areas each representing a character are extracted from each row area, and character recognition is performed on each character area to identify its character code. In S7, a group of the character codes in each extracted area is stored as handwritten information data. Then extracted character strings of the handwritten information data are checked against electronic book data, and the handwritten information data is reflected in matching positions.

Description

本発明は、手書き情報反映システム、手書き情報反映方法、およびプログラムに関し、特に、紙媒体から抽出した手書き情報を電子書籍データに反映する手書き情報反映システム等に関する。   The present invention relates to a handwritten information reflecting system, a handwritten information reflecting method, and a program, and more particularly to a handwritten information reflecting system that reflects handwritten information extracted from a paper medium in electronic book data.

近年、紙の節約、嵩張る紙の輸送や保管費の削減のため、ディスプレイに表示して閲覧するデジタルデータによる電子書籍が提供されるようになってきている。   2. Description of the Related Art In recent years, electronic books using digital data displayed on a display for browsing have been provided in order to save paper and reduce bulky paper transportation and storage costs.

書籍が電子化されることにより、様々な利用方法が可能となる。特許文献1には、読書進行状況情報に応じた実際の書籍と同様の厚みを有する縦縞模様を表示することにより、現在表示しているページが書籍全体としてどの当りの位置に相当するのかをユーザに対して直感的かつ大まかに認識させる技術が提案されている。   Various utilization methods are possible by digitizing a book. In Patent Document 1, a vertical stripe pattern having the same thickness as that of an actual book corresponding to the reading progress information is displayed, so that the user can determine which position the currently displayed page corresponds to as a whole book. A technique for intuitively and roughly recognizing is proposed.

また特許文献2には、ページ毎に索引としてのキーワードを抽出し、そのキーワードから目次を作成することにより、検索に必要とされる文字列の入力を不要として、それら電子化ドキュメントを容易に検索・表示する技術が提案されている。   In Patent Document 2, keywords as indexes are extracted for each page, and by creating a table of contents from the keywords, it is not necessary to input a character string required for the search, and these digitized documents can be easily searched.・ Display technology has been proposed.

特開2003−150618号公報JP 2003-150618 A 特開2005−275756号公報JP 2005-275756 A

しかしながら、特許文献1および特許文献2の技術では、紙媒体に付与されたマーカやメモ書きを抽出し、抽出したマーカやメモ書きを手書き情報としてリフロー型電子書籍データに反映することができない課題があった。   However, with the techniques of Patent Literature 1 and Patent Literature 2, there is a problem that a marker or memo written on a paper medium is extracted, and the extracted marker or memo cannot be reflected as rewritten electronic book data as handwritten information. there were.

本発明は、前述した問題点に鑑みてなされたもので、その目的とすることは、紙媒体から抽出した手書き情報をリフロー型電子書籍データに反映する手書き情報反映システム等を提供することである。   The present invention has been made in view of the above-described problems, and an object of the present invention is to provide a handwritten information reflecting system that reflects handwritten information extracted from a paper medium in reflow electronic book data. .

前述した目的を達成するために、第1の本発明は、リフロー型電子書籍データおよび紙書籍から読み取られた読取画像を記憶する記憶手段と、前記読取画像から、所定の抽出条件に基づいて、手書き情報および反映位置を抽出する抽出手段と、前記リフロー型電子書籍データのうち、前記抽出手段により抽出された前記反映位置に前記手書き情報を反映する反映手段と、を具備することを特徴とする手書き情報反映システムである。
第1の発明によって、紙媒体から抽出した手書き情報を電子書籍データに簡単に反映することが可能となる。
In order to achieve the above-described object, the first aspect of the present invention is a storage means for storing reflow type electronic book data and a read image read from a paper book, and based on a predetermined extraction condition from the read image. Extraction means for extracting handwritten information and a reflection position, and reflection means for reflecting the handwritten information in the reflection position extracted by the extraction means in the reflow type electronic book data. This is a handwritten information reflection system.
According to the first invention, handwritten information extracted from a paper medium can be easily reflected in electronic book data.

前記抽出手段は、前記手書き情報としてメモ書きを含むメモ画像を抽出し、前記反映位置として前記メモ画像と近い位置の文字列を抽出する。
これにより、メモ書きとして抽出されたメモ画像と、そのメモ画像と近い位置の文字列とを対応付けて手書き情報データとして保存することができる。
The extraction unit extracts a memo image including a memo as the handwritten information, and extracts a character string at a position close to the memo image as the reflection position.
Thereby, the memo image extracted as a memo and the character string at a position close to the memo image can be associated with each other and stored as handwritten information data.

前記抽出手段は、前記メモ画像のヒストグラムを算出し、前記ヒストグラムの分布に応じてメモ画像と書籍画像を区別する。
これにより、誤ってメモ画像として抽出された書籍画像をメモ画像の対象から除外することができる。
The extraction means calculates a histogram of the memo image and distinguishes the memo image from the book image according to the distribution of the histogram.
Thereby, the book image extracted as a memo image by mistake can be excluded from the target of the memo image.

前記反映手段は、反映させる前記メモ画像の選択画面を表示し、前記選択画面で選択された前記メモ画像を前記リフロー型電子書籍データに反映する。
これにより、反映させるメモ画像を確認することができるため、ユーザは、メモ画像のみを確実に電子書籍データに反映することができる。
The reflection means displays a selection screen for the memo image to be reflected, and reflects the memo image selected on the selection screen in the reflow electronic book data.
Thereby, since the memo image to be reflected can be confirmed, the user can reliably reflect only the memo image in the electronic book data.

前記抽出手段は、前記手書き情報としてマーカ領域を抽出し、前記反映位置として前記マーカ領域内の文字列を抽出する。
これにより、マーカ領域ごとにマーカ領域内の文字列を手書き情報データとして保存することができる。
The extraction unit extracts a marker area as the handwritten information, and extracts a character string in the marker area as the reflection position.
Thereby, the character string in a marker area | region can be preserve | saved as handwritten information data for every marker area | region.

第2の発明は、リフロー型電子書籍データおよび紙書籍から読み取られた読取画像を記憶する記憶ステップと、前記読取画像から、所定の抽出条件に基づいて、手書き情報および反映位置を抽出する抽出ステップと、前記リフロー型電子書籍データのうち、前記抽出手段により抽出された前記反映位置に前記手書き情報を反映する反映ステップと、を含むことを特徴とする。
第2の発明によって、紙媒体から抽出した手書き情報を電子書籍データに簡単に反映することが可能となる。
2nd invention memorize | stores the read image read from reflow type | mold electronic book data and a paper book, The extraction step which extracts handwritten information and a reflection position from the said read image based on predetermined | prescribed extraction conditions And a reflecting step of reflecting the handwritten information in the reflecting position extracted by the extracting means in the reflow type electronic book data.
According to the second invention, handwritten information extracted from a paper medium can be easily reflected in electronic book data.

第3の発明は、リフロー型電子書籍データおよび紙書籍から読み取られた読取画像を記憶する記憶ステップと、前記読取画像から、所定の抽出条件に基づいて、手書き情報および反映位置を抽出する抽出ステップと、前記リフロー型電子書籍データのうち、前記抽出手段により抽出された前記反映位置に前記手書き情報を反映する反映ステップと、を実行させるためのプログラムである。   3rd invention memorize | stores the reflow type | mold electronic book data and the reading image read from the paper book, The extraction step which extracts handwritten information and a reflection position from the said reading image based on predetermined | prescribed extraction conditions And a reflecting step of reflecting the handwritten information in the reflecting position extracted by the extracting means in the reflow type electronic book data.

第3の発明に係るプログラムをコンピュータにインストールすることで、第1の発明に係る手書き情報反映システムを得ることができる。   By installing the program according to the third invention in the computer, the handwritten information reflecting system according to the first invention can be obtained.

本発明により、紙媒体から抽出した手書き情報をリフロー型電子書籍データに反映する手書き情報反映システム等を提供することができる。   According to the present invention, it is possible to provide a handwritten information reflection system that reflects handwritten information extracted from a paper medium in reflow electronic book data.

本発明の第1の実施の形態に係る手書き情報反映システムの構成例を示す図である。It is a figure which shows the structural example of the handwritten information reflection system which concerns on the 1st Embodiment of this invention. 第1の実施の形態における端末のハードウエア構成例を示す図である。It is a figure which shows the hardware structural example of the terminal in 1st Embodiment. 第1の実施の形態における端末の記憶部に記憶される情報の例である。It is an example of the information memorize | stored in the memory | storage part of the terminal in 1st Embodiment. 第1の実施の形態における手書き情報抽出処理を説明するフローチャートである。It is a flowchart explaining the handwritten information extraction process in 1st Embodiment. 第1の実施の形態における読取画像データの例を示す図である。It is a figure which shows the example of the read image data in 1st Embodiment. 2値化領域の行間を除いた行ごとの行領域を抽出する例を示す図である。It is a figure which shows the example which extracts the line area | region for every line except the line space of the binarization area | region. 行領域ごとに1文字ごとの文字領域を抽出する例を示す図である。It is a figure which shows the example which extracts the character area for every character for every line area. 第1の実施の形態における手書き情報データの例を示す図である。It is a figure which shows the example of the handwritten information data in 1st Embodiment. 第1の実施の形態における手書き情報反映処理を説明するフローチャートである。It is a flowchart explaining the handwritten information reflection process in 1st Embodiment. マーカタグが追加された電子書籍データのXMLファイルと、そのファイルに基づく表示画面の一例を示す図である。It is a figure which shows an example of the display file based on the XML file of the electronic book data to which the marker tag was added, and the file. 第2の実施の形態における手書き情報抽出処理を説明するフローチャートである。It is a flowchart explaining the handwritten information extraction process in 2nd Embodiment. 第2の実施の形態における読取画像データの例を示す図である。It is a figure which shows the example of the read image data in 2nd Embodiment. 抽出領域画像から算出されたヒストグラムの例を示す図である。It is a figure which shows the example of the histogram calculated from the extraction area | region image. 反映メモ選択画面の表示例を示す図である。It is a figure which shows the example of a display of a reflection memo selection screen. 第2の実施の形態における手書き情報データの例を示す図である。It is a figure which shows the example of the handwritten information data in 2nd Embodiment. 第2の実施の形態における手書き情報反映処理を説明するフローチャートである。It is a flowchart explaining the handwritten information reflection process in 2nd Embodiment. メモタグが追加された電子書籍データのXMLファイルと、そのファイルに基づく表示画面の例を示す図である。It is a figure which shows the example of the display screen based on the XML file of the electronic book data to which the memo tag was added, and the file. 変形例における読取画像データの例を示す図である。It is a figure which shows the example of the read image data in a modification. 変形例における手書き情報データの例を示す図である。It is a figure which shows the example of the handwritten information data in a modification.

以下、図面に基づいて、本発明の実施形態を詳細に説明する。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.

[本発明の第1の実施の形態]
図1は、本発明の実施の形態に係る手書き情報反映システム1の構成例を示す図である。
[First embodiment of the present invention]
FIG. 1 is a diagram illustrating a configuration example of a handwritten information reflecting system 1 according to an embodiment of the present invention.

図1に示す手書き情報反映システム1は、端末2と読取装置3とが相互に接続されることで構成される。端末2は、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)、HDD(Hard Disc Drive)等からなるコンピュータシステムであり、例えば、パーソナルコンピュータ、タブレット端末、携帯電話機、スマートフォンである。   The handwritten information reflecting system 1 shown in FIG. 1 is configured by connecting a terminal 2 and a reading device 3 to each other. The terminal 2 is a computer system including a CPU (Central Processing Unit), a ROM (Read Only Memory), a RAM (Random Access Memory), an HDD (Hard Disc Drive), etc. For example, a personal computer, a tablet terminal, a mobile phone, It is a smartphone.

端末2は、リフロー型の電子書籍データを記憶する。電子書籍データには、書誌データ(書籍の題号、著者、出版社、出版年月等)、目次データ(書籍の本文の内容を示す見出し等)、本文データ(書籍の本文に関する電子データ)、文献リストデータ(書籍の著者、題号、出版社、出版年月等)などが含まれる。   The terminal 2 stores reflow electronic book data. Electronic book data includes bibliographic data (book titles, authors, publishers, publication dates, etc.), table of contents data (headings indicating the content of the book text, etc.), text data (electronic data related to the text of the book), Document list data (book author, title, publisher, date of publication, etc.) are included.

リフロー型の電子書籍データとは、文字を大きくすればページ数が増え、文字を小さくすればページ数が減るといったように、文字の大きさを変更しても画面に合わせて文字がリフローするため、ページ送りだけで読み進めることができる電子書籍データのことである。   Reflow-type e-book data means that the text will reflow to fit the screen even if the size of the text is changed, such as increasing the text to increase the number of pages and reducing the text to decrease the number of pages. This is electronic book data that can be read only by page feed.

端末2は、読み取り装置3が紙書籍4から読み取った読取画像のデータを受信し、記憶する。また端末2は、読取画像データから所定の抽出条件に基づいて手書き情報を抽出するとともに、電子書籍データから手書き情報にマッチングする位置を反映位置として抽出し、その反映位置に手書き情報を反映する。第1の実施の形態でいう手書き情報とは、例えば、蛍光ペンによるマーカラインが付与された部分のことである。   The terminal 2 receives and stores read image data read from the paper book 4 by the reading device 3. The terminal 2 extracts handwritten information from the read image data based on a predetermined extraction condition, extracts a position matching the handwritten information from the electronic book data as a reflection position, and reflects the handwritten information at the reflection position. The handwritten information referred to in the first embodiment is, for example, a portion provided with a marker line by a highlighter pen.

読取装置3は、例えば、スキャナやカメラなどであり、紙書籍4の紙面を読み取り、読取画像データを生成する。第1の実施の形態において、読取装置3は、紙書籍4の1頁分を画像化することができる装置であれば、何でもよい。なお、端末2にカメラが実装されている場合、端末2と読取装置3は一体とされる。   The reading device 3 is a scanner or a camera, for example, and reads the paper surface of the paper book 4 to generate read image data. In the first embodiment, the reading device 3 may be anything as long as it can image one page of the paper book 4. When a camera is mounted on the terminal 2, the terminal 2 and the reading device 3 are integrated.

図2は、端末2のハードウエア構成例を示す図である。尚、図2のハードウエア構成は一例であり、用途、目的に応じて様々な構成を採ることが可能である。   FIG. 2 is a diagram illustrating a hardware configuration example of the terminal 2. Note that the hardware configuration in FIG. 2 is an example, and various configurations can be adopted depending on the application and purpose.

端末2は、制御部11、記憶部12、メディア入出力部13、通信制御部14、入力部15、表示部16、周辺機器I/F部17等が、バス18を介して接続される。   The terminal 2 is connected to a control unit 11, a storage unit 12, a media input / output unit 13, a communication control unit 14, an input unit 15, a display unit 16, a peripheral device I / F unit 17, and the like via a bus 18.

制御部11は、CPU、ROM、RAM等で構成される。CPUは、記憶部12、ROM、記録媒体等に格納されるプログラムをRAM上のワークメモリ領域に呼び出して実行し、バス18を介して接続された各装置を駆動制御し、端末2が行う後述する処理を実現する。ROMは、不揮発性メモリであり、端末2のブートプログラムやBIOS(Basic Input/Output System)等のプログラム、データ等を恒久的に保持している。RAMは、揮発性メモリであり、記憶部12、ROM、記録媒体等からロードしたプログラム、データ等を一時的に保持するとともに、制御部11が各種処理を行う為に使用するワークエリアを備える。   The control unit 11 includes a CPU, a ROM, a RAM, and the like. The CPU calls a program stored in the storage unit 12, ROM, recording medium, etc. to a work memory area on the RAM, executes it, drives and controls each device connected via the bus 18, and is described later by the terminal 2. To achieve the process. The ROM is a non-volatile memory and permanently stores a boot program for the terminal 2, programs such as BIOS (Basic Input / Output System), data, and the like. The RAM is a volatile memory, and temporarily stores a program, data, and the like loaded from the storage unit 12, ROM, recording medium, and the like, and includes a work area used by the control unit 11 to perform various processes.

記憶部12は、HDD等であり、制御部11が実行するプログラム、プログラム実行に必要なデータ、OS(オペレーティングシステム)等が格納される。プログラムに関しては、OSに相当する制御プログラムや、後述する処理を端末2に実行させるためのアプリケーションプログラムが格納されている。これらの各プログラムコードは、制御部11により必要に応じて読み出されてRAMに移され、CPUに読み出されて各種の手段として実行される。   The storage unit 12 is an HDD or the like, and stores a program executed by the control unit 11, data necessary for program execution, an OS (operating system), and the like. As for the program, a control program corresponding to the OS and an application program for causing the terminal 2 to execute processing to be described later are stored. Each of these program codes is read by the control unit 11 as necessary, transferred to the RAM, read by the CPU, and executed as various means.

メディア入出力部13(ドライブ装置)は、データの入出力を行い、例えば、CDドライブ(−ROM、−R、−RW等)、DVDドライブ(−ROM、−R、−RW等)等のメディア入出力装置を有する。   The media input / output unit 13 (drive device) inputs / outputs data, for example, media such as a CD drive (-ROM, -R, -RW, etc.), DVD drive (-ROM, -R, -RW, etc.) Has input / output devices.

通信制御部14は、通信制御装置、通信ポート等を有し、端末2とネットワーク間の通信を媒介する通信インタフェースであり、ネットワークを介して、他の装置間との通信制御を行う。ネットワークは、有線、無線を問わない。   The communication control unit 14 includes a communication control device, a communication port, and the like, is a communication interface that mediates communication between the terminal 2 and the network, and performs communication control between other devices via the network. The network may be wired or wireless.

入力部15は、データの入力を行い、例えば、キーボード、マウス等のポインティングデバイス、テンキー等の入力装置を有する。入力部15を介して、端末2に対して、操作指示、動作指示、データ入力等を行うことができる。   The input unit 15 inputs data and includes, for example, a keyboard, a pointing device such as a mouse, and an input device such as a numeric keypad. An operation instruction, an operation instruction, data input, and the like can be performed on the terminal 2 via the input unit 15.

表示部16は、液晶パネル等のディスプレイ装置、ディスプレイ装置と連携して端末2のビデオ機能を実現するための論理回路等(ビデオアダプタ等)を有する。   The display unit 16 includes a display device such as a liquid crystal panel, and a logic circuit or the like (video adapter or the like) for realizing the video function of the terminal 2 in cooperation with the display device.

周辺機器I/F(インタフェース)部17は、端末2に周辺機器を接続させるためのポートであり、周辺機器I/F部17を介して端末2は周辺機器とのデータの送受信を行う。周辺機器I/F部17は、USB(Universal Serial Bus)やIEEE(The Institute of Electrical and
Electronics Engineers)1394やRS(Recommended Standard)−232C等で構成されており、通常複数の周辺機器I/Fを有する。周辺機器との接続形態は有線、無線を問わない。バス18は、各装置間の制御信号、データ信号等の授受を媒介する経路である。
The peripheral device I / F (interface) unit 17 is a port for connecting a peripheral device to the terminal 2, and the terminal 2 transmits and receives data to and from the peripheral device via the peripheral device I / F unit 17. The peripheral device I / F unit 17 is a USB (Universal Serial Bus) or IEEE (The Institute of Electrical and
Electronics Engineers) 1394, RS (Recommended Standard) -232C, etc., and usually has a plurality of peripheral devices I / F. The connection form with the peripheral device may be wired or wireless. The bus 18 is a path that mediates transmission / reception of control signals, data signals, and the like between the devices.

図3は、端末2の記憶部12に記憶される情報の例である。   FIG. 3 is an example of information stored in the storage unit 12 of the terminal 2.

図3に示すように、端末2の記憶部12は、読取画像データ21、電子書籍データ22、手書き情報データ23、手書き情報反映AP(アプリケーション)24、および電子書籍ビューア25を記憶している。   As illustrated in FIG. 3, the storage unit 12 of the terminal 2 stores read image data 21, electronic book data 22, handwritten information data 23, handwritten information reflecting AP (application) 24, and an electronic book viewer 25.

読取画像データ21は、読取装置3で読み取られた紙書籍4が画像化されたデータである。電子書籍データ22は、書籍1冊分のデータであって、書誌データ、目次データ、本文データ、文献リストデータなどを含み、リフロー型に制作されたデータである。   The read image data 21 is data obtained by imaging the paper book 4 read by the reading device 3. The electronic book data 22 is data for one book, including bibliographic data, table of contents data, text data, document list data, and the like, and is data produced in a reflow type.

手書き情報データ23は、手書き情報反映アプリケーション24により、所定の抽出条件に基づいて読取画像データ21から抽出された手書き情報のデータである。   The handwritten information data 23 is handwritten information data extracted from the read image data 21 by the handwritten information reflecting application 24 based on a predetermined extraction condition.

手書き情報反映アプリケーション24は、所定の抽出条件に基づいて、読取画像データ21から手書き情報を抽出し、手書き情報データ23を生成する。また手書き情報反映アプリケーション24は、電子書籍データ22から手書き情報にマッチングする位置を反映位置として抽出し、その反映位置に、抽出された手書き情報を反映する。   The handwritten information reflecting application 24 extracts handwritten information from the read image data 21 based on a predetermined extraction condition, and generates handwritten information data 23. The handwritten information reflecting application 24 extracts a position matching the handwritten information from the electronic book data 22 as a reflected position, and reflects the extracted handwritten information at the reflected position.

電子書籍ビューア25は、手書き情報が反映された電子書籍データ22を取得し、その内容を表示する。   The electronic book viewer 25 acquires the electronic book data 22 in which the handwritten information is reflected, and displays the contents.

図4は、手書き情報反映システム1が実行する、第1の実施の形態における手書き情報抽出処理を説明するフローチャートである。図4の説明に当たり、図5〜図9を参照し、具体的な処理内容も説明する。   FIG. 4 is a flowchart for explaining the handwritten information extraction process in the first embodiment, which is executed by the handwritten information reflection system 1. 4 will be described with reference to FIGS. 5 to 9.

ステップS1において、読取装置3は、蛍光ペンなどによるマーカラインが付与された紙書籍4の紙面を読み取り、読取画像データを生成する。   In step S <b> 1, the reading device 3 reads the paper surface of the paper book 4 provided with a marker line by a highlighter pen or the like, and generates read image data.

図5は、読取装置3により読み取られ、生成された読取画像データ21a、21bの例を示す図である。   FIG. 5 is a diagram illustrating an example of the read image data 21a and 21b read and generated by the reading device 3.

図5に示すように、読取画像データ21aには、「吾輩(わがはい)は猫」の文字にマーカ30aが付与されているとともに、「である。名前はまだ無い。」の文字にマーカ30bが付与されている。また、読取画像データ21bには、「しかしその当時は何という考もなかったから別段恐ろしいとも思わなかった。」の文字にマーカ30cが付与されている。図5の例では、読取画像データ21aに含まれるマーカ30aとマーカ30bは、互いのマーカラインが接していないが、読取画像データ21bに含まれるマーカ30cは、複数行のマーカラインが接している。   As shown in FIG. 5, in the read image data 21 a, a marker 30 a is added to the characters “My cat is a cat” and a marker 30 b is added to the characters “Yes. No name yet”. Has been granted. In addition, the read image data 21b is provided with a marker 30c on the characters "But at that time, I didn't think anything, so I didn't think it was awful." In the example of FIG. 5, the marker 30a and the marker 30b included in the read image data 21a are not in contact with each other marker line, but the marker 30c included in the read image data 21b is in contact with a plurality of marker lines. .

図4の説明に戻る。ステップS2において、端末2の手書き情報反映アプリケーション24は、ステップS1の処理で読取装置3により生成された読取画像データを走査し、背景色が異なる領域(例えば、蛍光色)を抽出する。例えば、図5において、マーカ30a、30b、30c(斜線で囲まれた領域)が異なる領域と判断され、矢印S2の先に示すように、抽出領域31a、31b、31cとしてそれぞれ抽出される。   Returning to the description of FIG. In step S2, the handwritten information reflecting application 24 of the terminal 2 scans the read image data generated by the reading device 3 in the process of step S1, and extracts regions (for example, fluorescent colors) having different background colors. For example, in FIG. 5, markers 30a, 30b, and 30c (regions surrounded by diagonal lines) are determined to be different regions, and are extracted as extraction regions 31a, 31b, and 31c, respectively, as indicated by the tip of arrow S2.

図4の説明に戻る。ステップS3において、端末2の手書き情報反映アプリケーション24は、ステップS2の処理で抽出した抽出領域ごとに、抽出領域内のエッジを算出し、2値化する。例えば、図5において、抽出領域31a、31b、31c内のエッジが算出されて2値化され、矢印S3の先に示すように、2値化領域32a、32b、32cがそれぞれ得られる。   Returning to the description of FIG. In step S3, the handwritten information reflecting application 24 of the terminal 2 calculates and binarizes the edge in the extraction area for each extraction area extracted in the process of step S2. For example, in FIG. 5, the edges in the extraction areas 31a, 31b, and 31c are calculated and binarized, and binarized areas 32a, 32b, and 32c are obtained as indicated by the tip of the arrow S3.

図4の説明に戻る。ステップS4において、端末2の手書き情報反映アプリケーション24は、ステップS3の処理で2値化した2値化領域ごとに、行間を除いた行ごとの行領域を抽出する。   Returning to the description of FIG. In step S4, the handwritten information reflecting application 24 of the terminal 2 extracts a line area for each line excluding the line spacing for each binarized area binarized in the process of step S3.

図6は、2値化領域32cの行間を除いた行ごとの行領域を抽出する例を示す図である。   FIG. 6 is a diagram illustrating an example of extracting the row area for each row excluding the line spacing of the binarized region 32c.

図6に示すように、2値化領域32cには、「しかしその」の文字列が含まれる行、「当時は何という考もな」の文字列が含まれる行、「かったから別段恐ろしいと」の文字列が含まれる行、「も思わなかった。」の文字列が含まれる行、および行間(空白)が含まれている。この2値化領域32cにおいて、矢印S4の先に示すように、行間を除く行ごとの行領域33a、33b、33c、33dがそれぞれ抽出される。なお、図5における2値化領域32a、32bは、行間を含まない1行からなる文字列であるため、2値化領域32a、32bがそのまま行領域となる(図示せず)。   As shown in FIG. 6, the binarized area 32 c includes a line that includes the character string “But”, a line that includes the character string “Nothing to think at that time”, and “ ", A line including the character string" I didn't expect it ", and a line space (blank). In the binarized area 32c, as indicated by the tip of the arrow S4, line areas 33a, 33b, 33c, and 33d for each line excluding the line spacing are extracted. Since the binarized areas 32a and 32b in FIG. 5 are character strings consisting of one line that does not include a line space, the binarized areas 32a and 32b are directly used as line areas (not shown).

図4の説明に戻る。ステップS5において、端末2の手書き情報反映アプリケーション24は、ステップS4の処理で抽出した行領域ごとに、1文字ごとの文字領域を抽出する。   Returning to the description of FIG. In step S5, the handwritten information reflecting application 24 of the terminal 2 extracts a character area for each character for each line area extracted in the process of step S4.

図7は、行領域33aごとに1文字ごとの文字領域を抽出する例を示す図である。   FIG. 7 is a diagram illustrating an example of extracting a character area for each character for each row area 33a.

図7に示すように、行領域33aには、「しかしその」の文字列が含まれており、矢印S5の先に示すように、「し」の文字領域34a、「か」の文字領域34b、「し」の文字領域34c、「そ」の文字領域34d、「の」の文字領域34eがそれぞれ抽出される。   As shown in FIG. 7, the line area 33a includes the character string “But”, however, as indicated by the tip of the arrow S5, the character area 34a of “shi” and the character area 34b of “ka”. , “Shi” character area 34c, “so” character area 34d, and “no” character area 34e, respectively.

図4の説明に戻る。ステップS6において、端末2の手書き情報反映アプリケーション24は、ステップS5の処理で抽出した文字領域ごとに、文字認識を行い、文字コードを特定する。ステップS7において、端末2の手書き情報反映アプリケーション24は、ステップS2の処理で抽出した抽出領域ごとに、抽出領域内の文字コード群を手書き情報データ(マーカ)として記憶部12に保存する。   Returning to the description of FIG. In step S6, the handwritten information reflecting application 24 of the terminal 2 performs character recognition for each character area extracted in the process of step S5, and specifies a character code. In step S7, the handwritten information reflecting application 24 of the terminal 2 stores the character code group in the extracted area in the storage unit 12 as handwritten information data (marker) for each extracted area extracted in the process of step S2.

図8は、手書き情報データ23aの例を示す図である。   FIG. 8 is a diagram illustrating an example of the handwritten information data 23a.

図8に示すように、No.1のデータ格納領域には、種別が「マーカ」、抽出文字列が「吾輩(わがはい)は猫」の手書き情報データ(抽出領域31a内の文字コード群)が保存され、No.2のデータ格納領域には、種別が「マーカ」、抽出文字列が「である。名前はまだ無い。」の手書き情報データ(抽出領域31b内の文字コード群)が保存され、No.3のデータ格納領域には、種別が「マーカ」、抽出文字列が「しかしその当時は何という考もなかったから別段恐ろしいとも思わなかった。」の手書き情報データ(抽出領域31c内の文字コード群)が保存される。   As shown in FIG. In the data storage area 1, handwritten information data (character code group in the extraction area 31 a) with the type “marker” and the extracted character string “my gaai is a cat” is stored. In the data storage area 2, handwritten information data (character code group in the extraction area 31 b) with the type “marker” and the extracted character string “. No name yet” is stored. In the data storage area 3, handwritten information data (character code group in the extraction area 31c) whose type is “marker” and whose extracted character string is “but at that time, I did not think it was afraid of anything.” ) Is saved.

以上のようにして、手書き情報反映システム1は、蛍光ペンによるマーカラインが付与された紙書籍4の紙面を読み取り、そのマーカ領域を手書き情報として抽出し、保存することができる。   As described above, the handwritten information reflecting system 1 can read the paper surface of the paper book 4 provided with the marker line by the highlighter pen, extract the marker area as handwritten information, and save it.

図9は、手書き情報反映システム1が実行する、第1の実施の形態における手書き情報反映処理を説明するフローチャートである。図9の説明に当たり、図10を参照し、具体的な処理内容も説明する。   FIG. 9 is a flowchart for explaining handwritten information reflecting processing in the first embodiment executed by the handwritten information reflecting system 1. In the description of FIG. 9, the specific processing contents will also be described with reference to FIG.

ステップS11において、端末2の手書き情報反映アプリケーション24は、記憶部12に保存されている手書き情報データ23a(図8)の抽出文字列と、閾値以上の割合で一致する電子書籍データ22の文字列を検索する。   In step S11, the handwritten information reflecting application 24 of the terminal 2 matches the character string of the electronic book data 22 that matches the extracted character string of the handwritten information data 23a (FIG. 8) stored in the storage unit 12 at a rate equal to or higher than the threshold. Search for.

具体的には、端末2の手書き情報反映アプリケーション24は、手書き情報データ23aの抽出文字列の先頭から、文字列の最後まで1文字ずつ電子書籍データ22とマッチングを行い、マッチしたら1、マッチしなかったら0というようにスコアリングし、予め設定した閾値を元にマッチするかしないかを判断する。例えば、19文字の抽出文字列に完全一致させる場合にはスコアが19でなければならないが、閾値(一致する割合)を設定することで、あいまい検索が可能となる。   Specifically, the handwritten information reflection application 24 of the terminal 2 performs matching with the electronic book data 22 character by character from the beginning of the extracted character string of the handwritten information data 23a to the end of the character string. If not, scoring is performed as 0, and it is determined whether or not to match based on a preset threshold value. For example, the score must be 19 in order to completely match the extracted character string of 19 characters, but a fuzzy search is possible by setting a threshold value (ratio of matching).

ステップS12において、端末2の手書き情報反映アプリケーション24は、ステップS11の処理で検索した電子書籍データ22の文字列を囲むマーカタグを追加する。   In step S12, the handwritten information reflecting application 24 of the terminal 2 adds a marker tag surrounding the character string of the electronic book data 22 searched in the process of step S11.

具体的には、図5に示した読取画像データ21aにおいて、「吾輩(わがはい)は猫である。名前はまだ無い。」の一文がひとつの段落を構成している。すなわち、XML(Extensible Markup Language)の形式で記述された電子書籍データ22では、「吾輩(わがはい)は猫である。名前はまだ無い。」の前段に「<P>」が記述され、後段に「</P>」が記述されることで、<P>〜</P>で囲まれた部分がひとつの段落であることが表されている。   Specifically, in the read image data 21 a shown in FIG. 5, one sentence of “My friend is a cat. No name yet” forms one paragraph. That is, in the electronic book data 22 described in the XML (Extensible Markup Language) format, “<P>” is described in the former stage of “My friend is a cat. There is no name yet.” By describing “</ P>”, it is indicated that the portion surrounded by <P> to </ P> is one paragraph.

図8に示すように、手書き情報データ23aにおける「吾輩(わがはい)は猫」と「である。名前はまだ無い。」の抽出文字列は別々に抽出されているため、電子書籍データ22のXMLファイルにおける「吾輩(わがはい)は猫」の前段に「<span class=“mark”>」が記述され、後段に「</span>」が記述される。また、「である。名前はまだ無い。」の前段に「<span class=“mark”>」が記述され、後段に「</span>」が記述される。これにより、<span class=“mark”>〜</span>で囲まれた部分にマーカタグ(マーカ機能)が追加される。   As shown in FIG. 8, the extracted character strings “My cat is a cat” and “No name yet.” In the handwritten information data 23 a are extracted separately. In the file, “<span class =“ mark ”>” is described at the front of “My cat is my cat”, and “</ span>” is described at the back. In addition, “<span class =“ mark ”>” is described in the previous stage of “Yes. No name yet”, and “</ span>” is described in the subsequent stage. Thereby, a marker tag (marker function) is added to a portion surrounded by <span class = “mark”> to </ span>.

図9の説明に戻る。ステップS13において、端末2の手書き情報反映アプリケーション24は、ステップS12の処理で追加したマーカタグのうち、連続するマーカタグを統合する。これにより、電子書籍データ22のXMLファイルにおける「吾輩(わがはい)は猫」と「である。名前はまだ無い。」にそれぞれマーカタグが追加されていたが、それらが1つに統合される。   Returning to the description of FIG. In step S13, the handwritten information reflection application 24 of the terminal 2 integrates continuous marker tags among the marker tags added in the process of step S12. As a result, marker tags have been added to “My friend is a cat” and “No name yet” in the XML file of the electronic book data 22, but they are integrated into one.

なお、図8に示すように、手書き情報データ23aにおける「しかしその当時は何という考もなかったから別段恐ろしいとも思わなかった。」の抽出文字列は一続きで抽出されているため、1つのマーカタグが追加され、マーカタグの統合の必要はない。   As shown in FIG. 8, the extracted character string “But I didn't think it was scary because I had no idea at that time” in the handwritten information data 23a was extracted in a row, so one marker tag Is added and there is no need for marker tag integration.

図10は、マーカタグが追加された電子書籍データ22のXMLファイル41aと、そのファイルに基づく表示画面42aの例を示す図である。   FIG. 10 is a diagram illustrating an example of an XML file 41a of electronic book data 22 to which a marker tag is added and a display screen 42a based on the file.

図10に示すように、電子書籍データ22のXMLファイル41aには、「吾輩(わがはい)は猫である。名前はまだ無い。」の前後にマーカタグが記述されているとともに、「しかしその当時は何という考もなかったから別段恐ろしいとも思わなかった。」の前後にマーカタグが記述されている。電子書籍ビューア25は、このXMLファイル41aに基づいて表示画面42aを表示部16に表示させることができる。図10の例では、紙書籍4の紙面で付与された手書きマーカが電子書籍データ22に反映され、表示されている(図中、斜線で囲まれた領域)。   As shown in FIG. 10, in the XML file 41a of the electronic book data 22, marker tags are described before and after “My friend is a cat. There is no name yet.” I didn't think anything, so I didn't think it was awful. "Marker tags are written before and after. The electronic book viewer 25 can display the display screen 42a on the display unit 16 based on the XML file 41a. In the example of FIG. 10, the handwritten marker given on the paper surface of the paper book 4 is reflected and displayed in the electronic book data 22 (in the figure, the area surrounded by the diagonal lines).

[本発明の第1の実施の形態における効果]
1.以上のように、紙書籍に付与したマーカを簡単にリフロー型の電子書籍に反映することができる。例えば、学校の教科書や参考書などの場合、授業中に複数の書籍にマーカした内容を電子書籍に反映することによって、電車などでまとめて確認することができる。
[Effect in the first embodiment of the present invention]
1. As described above, a marker attached to a paper book can be easily reflected in a reflow electronic book. For example, in the case of school textbooks and reference books, the contents marked on a plurality of books during the class can be reflected on the electronic book, so that they can be confirmed together on a train.

2.著名人が付与したマーカをリフロー型の電子書籍に反映することによって、新たな付加価値を持つ電子書籍を提供することができる。例えば、著名人のファンなどは、オリジナルの電子書籍にあまり関心がなくても、著名人が特にお勧めする文章がマーカされた電子書籍であれば購入することが考えられ、販促効果が期待できる。   2. By reflecting a marker provided by a celebrity in a reflow-type electronic book, an electronic book having a new added value can be provided. For example, a celebrity fan may be interested in purchasing an e-book that is marked with a sentence recommended by a celebrity, even if he is not interested in the original e-book. .

[本発明の第2の実施の形態]
次に、本発明の第2の実施の形態について説明する。
[Second embodiment of the present invention]
Next, a second embodiment of the present invention will be described.

第2の実施の形態において、基本的なシステム構成(図1)、端末2のハードウエア構成(図2)および記憶部12に記憶される情報(図3)は、第1の実施の形態と同様である。第2の実施の形態では、手書き情報として、メモ書きを抽出して電子書籍データ22に反映させることを特徴とするものである。   In the second embodiment, the basic system configuration (FIG. 1), the hardware configuration of the terminal 2 (FIG. 2), and the information stored in the storage unit 12 (FIG. 3) are the same as those in the first embodiment. It is the same. In the second embodiment, note writing is extracted as handwritten information and reflected in the electronic book data 22.

図11は、手書き情報反映システム1が実行する、第2の実施の形態における手書き情報抽出処理を説明するフローチャートである。図11の説明に当たり、図12〜図15を参照し、具体的な処理内容も説明する。   FIG. 11 is a flowchart for describing handwritten information extraction processing in the second embodiment, which is executed by the handwritten information reflecting system 1. In the description of FIG. 11, specific processing contents will also be described with reference to FIGS. 12 to 15.

ステップS21において、読取装置3は、手書き文字が書き込まれた紙書籍4の紙面を読み取り、読取画像データを生成する。   In step S <b> 21, the reading device 3 reads the paper surface of the paper book 4 in which handwritten characters are written, and generates read image data.

図12は、読取装置3により読み取られ、生成された読取画像データ21c、21dの例を示す図である。   FIG. 12 is a diagram illustrating an example of the read image data 21c and 21d read and generated by the reading device 3.

図12に示すように、読取画像データ21cには、基本版面52内の上方(「吾輩」と「である。」の行間付近)に、「メモAです。」の手書き文字51aが書き込まれている。また、読取画像データ21dには、基本版面52外の下方に、「メモBです。」の手書き文字51bが書き込まれている。なお、読取画像データ21dには、書籍画像53も含まれる。   As shown in FIG. 12, in the read image data 21c, a handwritten character 51a of "Memo A." is written above the basic printing plate 52 (near the line spacing of "Sai" and "I"). Yes. In the read image data 21 d, a handwritten character 51 b of “Memo B.” is written below the basic plate surface 52. The read image data 21d includes a book image 53.

図11の説明に戻る。ステップS22において、端末2の手書き情報反映アプリケーション24は、紙書籍4の紙面の基本版面を取得する。例えば、手書き情報反映アプリケーション24は、紙面における本文のうち、最左端の文字列のエッジと最右端の文字列のエッジから横サイズを算出し、最上端の文字列のエッジと最下端の文字列のエッジから縦サイズを算出することで、基本版面を取得することができる。   Returning to the description of FIG. In step S <b> 22, the handwritten information reflecting application 24 of the terminal 2 acquires the basic version of the paper surface of the paper book 4. For example, the handwritten information reflection application 24 calculates the horizontal size from the edge of the leftmost character string and the edge of the rightmost character string in the text on the page, and the edge of the uppermost character string and the character string of the lowermost character string. By calculating the vertical size from the edges, the basic plate surface can be obtained.

ステップS23において、端末2の手書き情報反映アプリケーション24は、ステップS22の処理で取得した基本版面外におけるエッジを算出し、エッジが多い領域を抽出する。つまり、基本版面外には本文が存在しないため、エッジが多い領域がメモ書き候補として抽出される。例えば、図12において、読取画像データ21d内に含まれる手書き文字51bが抽出領域画像として抽出される。   In step S23, the handwritten information reflecting application 24 of the terminal 2 calculates an edge outside the basic printing surface acquired in the process of step S22, and extracts a region with many edges. That is, since there is no text outside the basic version, an area with many edges is extracted as a memo writing candidate. For example, in FIG. 12, the handwritten character 51b included in the read image data 21d is extracted as the extraction region image.

ステップS24において、端末2の手書き情報反映アプリケーション24は、ステップS22の処理で取得した基本版面内におけるエッジを算出し、エッジの出現位置が不規則な領域を抽出する。   In step S24, the handwritten information reflecting application 24 of the terminal 2 calculates an edge in the basic printing plate acquired in the process of step S22, and extracts an area where the appearance position of the edge is irregular.

具体的には、予め、メモ書きがない紙面に基づいて行領域と行間領域の幅を算出しておき、メモ書きがある紙面に対して行間領域を走査することで、エッジを探索していく。本文はエッジの出方が規則的であるが、メモ書きや画像等は不規則になるため、エッジの出方が不規則になる領域がメモ書き候補として抽出される。この方法によると、画像なども抽出される。例えば、図12において、読取画像データ21cに含まれる手書き文字51aと、読取画像データ21dに含まれる手書き文字51bが抽出領域画像として抽出される。   Specifically, the widths of the line area and the inter-line area are calculated in advance based on a sheet without a note, and the edge is searched by scanning the line area with respect to the sheet with a note. . Although the text has regular edges, the memos and images are irregular, so the areas where the edges appear irregular are extracted as memo candidates. According to this method, an image or the like is also extracted. For example, in FIG. 12, a handwritten character 51a included in the read image data 21c and a handwritten character 51b included in the read image data 21d are extracted as extraction region images.

ステップS25において、端末2の手書き情報反映アプリケーション24は、ステップS23、S24の処理で抽出した抽出領域画像ごとにヒストグラムを算出し、ヒストグラムが幅広く分布している抽出領域画像を書籍画像と判定する。   In step S25, the handwritten information reflecting application 24 of the terminal 2 calculates a histogram for each extracted region image extracted in the processes in steps S23 and S24, and determines that the extracted region image in which the histogram is widely distributed is a book image.

図13は、抽出領域画像から算出されたヒストグラムの例を示す図である。   FIG. 13 is a diagram illustrating an example of a histogram calculated from the extracted region image.

図13(a)は、図12に示した手書き文字51aに対応する抽出領域画像61aから算出されたヒストグラム62aを示している。図13(b)は、図12に示した書籍画像53に対応する抽出領域画像61bから算出されたヒストグラム62bを示している。図13(c)は、図12に示した手書き文字51bに対応する抽出領域画像61cから算出されたヒストグラム62cを示している。   FIG. 13A shows a histogram 62a calculated from the extraction region image 61a corresponding to the handwritten character 51a shown in FIG. FIG. 13B shows a histogram 62b calculated from the extraction area image 61b corresponding to the book image 53 shown in FIG. FIG. 13C shows a histogram 62c calculated from the extraction region image 61c corresponding to the handwritten character 51b shown in FIG.

これらの図からもわかる通り、ヒストグラム62bだけが幅広く分布しており、ヒストグラム62a、62cは分布が両端に偏っている。従って、ヒストグラム62bを算出する上で元画像となった抽出領域画像61bは、メモ書きではなく、書籍画像と判断することができる。   As can be seen from these figures, only the histogram 62b is widely distributed, and the distributions of the histograms 62a and 62c are biased at both ends. Therefore, the extraction area image 61b that is the original image in calculating the histogram 62b can be determined as a book image, not a memo.

図11の説明に戻る。ステップS26において、端末2の手書き情報反映アプリケーション24は、ステップS23、S24で抽出された抽出領域画像に基づく反映メモ選択画面を生成し、表示部16に表示させる。   Returning to the description of FIG. In step S <b> 26, the handwritten information reflection application 24 of the terminal 2 generates a reflection memo selection screen based on the extracted area image extracted in steps S <b> 23 and S <b> 24 and displays it on the display unit 16.

図14は、反映メモ選択画面71の表示例を示す図である。   FIG. 14 is a diagram illustrating a display example of the reflected memo selection screen 71.

図14に示すように、反映メモ選択画面71には、抽出領域画像61a、61b、61cがそれぞれファイル名とともに表示されており、各画像の左側にチェックボックスが配置され、手書きメモと判断された抽出領域画像にはチェックが入れられている。図14の例の場合、ステップS25の処理で抽出領域画像61bは書籍画像であると判定されたため、チェックが外されている。   As shown in FIG. 14, on the reflected memo selection screen 71, the extraction area images 61a, 61b, and 61c are displayed together with the file names, and a check box is arranged on the left side of each image, so that the handwritten memo is determined. The extraction area image is checked. In the case of the example in FIG. 14, the extraction area image 61 b is determined to be a book image in the process of step S <b> 25, so the check is removed.

また反映メモ選択画面71には、チェックボックスにチェックが入れられた手書きメモ(抽出領域画像)を電子書籍データ22に反映する場合に選択される決定ボタン71a、電子書籍データ22への反映をキャンセルする場合に選択されるキャンセルボタン71bも表示されている。   In addition, the reflected memo selection screen 71 cancels the reflection to the electronic book data 22, the decision button 71 a selected when the handwritten memo (extracted area image) whose check box is checked is reflected in the electronic book data 22. A cancel button 71b that is selected when the operation is performed is also displayed.

図11の説明に戻る。ステップS27において、端末2の手書き情報反映アプリケーション24は、ステップS26の処理で反映メモ選択画面71に表示された抽出領域画像61a〜61cごとに、読取画像データ21における抽出領域と近い位置の文字列をそれぞれ特定する。ステップS28において、端末2の手書き情報反映アプリケーション24は、抽出領域画像61a〜61cと、ステップS27の処理で特定された抽出文字列とを対応付けて手書き情報データ(メモ)として記憶部12に保存する。   Returning to the description of FIG. In step S27, the handwritten information reflecting application 24 of the terminal 2 sets the character string at a position close to the extraction area in the read image data 21 for each of the extraction area images 61a to 61c displayed on the reflection memo selection screen 71 in the process of step S26. Identify each. In step S28, the handwritten information reflecting application 24 of the terminal 2 associates the extracted area images 61a to 61c with the extracted character string specified in the process of step S27 and saves it in the storage unit 12 as handwritten information data (memo). To do.

図15は、手書き情報データ23bの例を示す図である。   FIG. 15 is a diagram illustrating an example of the handwritten information data 23b.

図15に示すように、No.1のデータ格納領域には、種別が「メモ」、抽出領域画像が「Memo001.png」、抽出領域と近い位置の文字列が「xx(わがはい)は」の手書き情報データが保存され、No.2のデータ格納領域には、種別が「メモ」、抽出領域画像が「Memo003.png」、抽出領域と近い位置の文字列が「見始(みはじめ)であろう。」の手書き情報データが保存される。なお、No.1のデータ格納領域に記憶される文字列のうち「xx」は、文字認識できなかった文字を示している。   As shown in FIG. In the data storage area 1, handwritten information data having a type “memo”, an extraction area image “Memo001.png”, and a character string “xx (waigai)” near the extraction area is stored. In the data storage area 2, handwritten information data whose type is “memo”, the extracted area image is “Memo003.png”, and the character string at the position close to the extracted area is “beginning”. Saved. In addition, No. Among the character strings stored in one data storage area, “xx” indicates a character that could not be recognized.

以上のようにして、手書き情報反映システム1は、メモが書き込まれた紙書籍4の紙面を読み取り、エッジが多い、またはエッジ出現位置が不規則な領域を手書き情報として抽出し、保存することができる。   As described above, the handwritten information reflecting system 1 can read the paper surface of the paper book 4 on which the memo is written, extract an area with many edges or irregular edge appearance positions as handwritten information, and save it. it can.

図16は、手書き情報反映システム1が実行する、第2の実施の形態における手書き情報反映処理を説明するフローチャートである。図16の説明に当たり、図17を参照し、具体的な処理内容も説明する。   FIG. 16 is a flowchart for explaining handwritten information reflecting processing in the second embodiment, which is executed by the handwritten information reflecting system 1. In the description of FIG. 16, the specific processing contents will also be described with reference to FIG.

ステップS31において、端末2の手書き情報反映アプリケーション24は、記憶部12に保存されている手書き情報データ23b(図15)の抽出領域と近い位置の文字列と、閾値以上の割合で一致する電子書籍データ22の文字列を検索する。   In step S31, the handwritten information reflecting application 24 of the terminal 2 matches the character string at a position close to the extraction region of the handwritten information data 23b (FIG. 15) stored in the storage unit 12 with a ratio equal to or higher than the threshold. The character string of the data 22 is searched.

具体的には、端末2の手書き情報反映アプリケーション24は、第1の実施の形態と同様に、手書き情報データ23bの文字列の先頭から、文字列の最後まで1文字ずつ電子書籍データ22とマッチングを行い、マッチしたら1、マッチしなかったら0というようにスコアリングし、予め設定した閾値を元にマッチするかしないかを判断する。   Specifically, the handwritten information reflecting application 24 of the terminal 2 matches the electronic book data 22 character by character from the beginning of the character string of the handwritten information data 23b to the end of the character string, as in the first embodiment. Then, 1 is scored if there is a match, 0 is scored if there is no match, and it is determined whether or not to match based on a preset threshold value.

ステップS32において、端末2の手書き情報反映アプリケーション24は、ステップS31の処理で検索した電子書籍データ22の文字列を囲むメモタグを追加する。   In step S32, the handwritten information reflecting application 24 of the terminal 2 adds a memo tag surrounding the character string of the electronic book data 22 searched in the process of step S31.

具体的には、上述した処理によって、図15に示すように、手書き情報データ23bにおける「xx(わがはい)は」と「見始(みはじめ)であろう。」が手書きメモの抽出領域と近い位置の文字列として抽出されているため、電子書籍データ22のXMLファイルにおける「吾輩(わがはい)は」の前段に「<memo
src=“Memo001.png”>」が記述され、後段に「</memo>」が記述される。また、「見始(みはじめ)であろう。」の前段に「<memo src=“Memo001.png”>」が記述され、後段に「</memo>」が記述される。これにより、<memo src=“Memo001.png”>〜</memo>で囲まれた領域にメモタグ(メモ機能)が追加される。
Specifically, as shown in FIG. 15, by the above-described processing, “xx (my own)” and “beginning” are close to the handwritten memo extraction area in the handwritten information data 23 b. Since it is extracted as a character string of the position, the “<memo”
src = “Memo001.png”> ”is described, and“ </ memo> ”is described in the subsequent stage. In addition, “<memo src =“ Memo001.png ”>” is described in the front stage of “It will be the beginning”, and “</ memo>” is described in the subsequent stage. As a result, a memo tag (memo function) is added to the area surrounded by <memo src = “Memo001.png”> to </ memo>.

図17は、メモタグが追加された電子書籍データ22のXMLファイル41bと、そのファイルに基づく表示画面42bの例を示す図である。   FIG. 17 is a diagram illustrating an example of an XML file 41b of electronic book data 22 to which a memo tag is added and a display screen 42b based on the file.

図17に示すように、電子書籍データ22のXMLファイル41bには、「吾輩(わがはい)は」の前後にメモタグが記述されているとともに、「見始(みはじめ)であろう。」の前後にメモタグが記述されている。電子書籍ビューア25は、このXMLファイル41bに基づいて表示画面42bを表示部16に表示させることができる。図17の例では、紙書籍4の紙面でのメモ書きが電子書籍データ22に反映され、「メモAです。」と「メモBです。」の吹き出しとして表示されている。なお、図17の例では、吹き出しが表示されている状態とされているが、実際には、メモタグで囲まれた文字列がタップされる(またはマウスが通過される)ときのみ表示される。   As shown in FIG. 17, in the XML file 41b of the electronic book data 22, memo tags are described before and after “myself”, and before and after “beginning”. Has a memo tag. The electronic book viewer 25 can display the display screen 42b on the display unit 16 based on the XML file 41b. In the example of FIG. 17, the memo writing on the paper book 4 is reflected in the electronic book data 22 and displayed as balloons of “Memo A.” and “Memo B.”. In the example of FIG. 17, a balloon is displayed, but actually, it is displayed only when the character string surrounded by the memo tag is tapped (or the mouse is passed).

[本発明の第2の実施の形態における効果]
1.以上のように、紙書籍に書き込んだメモを簡単にリフロー型の電子書籍に反映することができる。例えば、学校の教科書や参考書などの場合、授業中に複数の書籍にメモした内容を電子書籍に反映することによって、電車などでまとめて確認することができる。
[Effect in the second embodiment of the present invention]
1. As described above, a memo written on a paper book can be easily reflected in a reflow electronic book. For example, in the case of school textbooks and reference books, the contents recorded in a plurality of books during a class can be confirmed together on a train by reflecting them in an electronic book.

2.著名人が書き込んだメモをリフロー型の電子書籍に反映することによって、新たな付加価値を持つ電子書籍を提供することができる。例えば、著名人のファンなどは、オリジナルの電子書籍にあまり関心がなくても、著名人が直接書き込んだメモ入り電子書籍であれば購入することが考えられ、販促効果が期待できる。   2. By reflecting a memo written by a celebrity in a reflow-type electronic book, an electronic book having a new added value can be provided. For example, a celebrity fan may be interested in purchasing an electronic book with a note directly written by a celebrity, even if he / she is not interested in the original electronic book.

[変形例]
以上においては、紙書籍に付与したマーカやメモ書きをリフロー型の電子書籍データに反映するようにしたが、これに限らず、例えば、ページの隅を折り曲げてある箇所(しおり)を検出し、そのページの先頭の文字列を抽出し、電子書籍データの文字列とマッチングする文字列にしおり機能を追加するようにしてもよい。
[Modification]
In the above, the marker or memo written on the paper book is reflected in the reflow-type electronic book data. However, the present invention is not limited to this. For example, a place where a corner of the page is folded (bookmark) is detected. The top character string of the page may be extracted and a bookmark function may be added to the character string matching the character string of the electronic book data.

例えば、図18に示すように、読取装置3により、読取画像データ21e、21fが生成されたとする。読取画像データ21fには、右上方隅にしおりが折り曲げられている。   For example, as shown in FIG. 18, it is assumed that the read image data 21e and 21f are generated by the reading device 3. In the read image data 21f, a bookmark is bent at the upper right corner.

端末2の手書き情報反映アプリケーション24は、紙書籍4の紙面の基本版面外の四隅を探索し、折り曲げ(図18の例の場合、三角形のエッジ)を検出すると、それを、しおりとして抽出するとともに、その折り曲げを抽出したページの先頭の文字列を抽出する。そして、手書き情報反映アプリケーション24は、図19に示すように、種別が「しおり」、抽出文字列が「えて煮(に)て食うという話である。」の手書き情報データ23cを記憶部12に保存することができる。   When the handwritten information reflecting application 24 of the terminal 2 searches for four corners outside the basic version of the paper surface of the paper book 4 and detects a bend (a triangular edge in the example of FIG. 18), it extracts it as a bookmark. Then, the character string at the top of the page from which the bending is extracted is extracted. Then, as shown in FIG. 19, the handwritten information reflecting application 24 stores, in the storage unit 12, handwritten information data 23 c of the type “bookmark” and the extracted character string “is a story about eating and eating”. Can be saved.

以上のようにして、手書き情報反映システム1は、しおりが折り曲げられた紙書籍4の紙面を読み取り、折り曲げを手書き情報として抽出し、保存することができる。   As described above, the handwritten information reflecting system 1 can read the paper surface of the paper book 4 in which the bookmark is folded, extract the folding as the handwritten information, and save it.

以上、添付図面を参照しながら、本発明に係る手書き情報反映システム等の好適な実施形態について説明したが、本発明はかかる例に限定されない。当業者であれば、本願で開示した技術的思想の範疇内において、各種の変更例又は修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。   The preferred embodiments of the handwritten information reflecting system and the like according to the present invention have been described above with reference to the accompanying drawings, but the present invention is not limited to such examples. It will be apparent to those skilled in the art that various changes or modifications can be conceived within the scope of the technical idea disclosed in the present application, and these naturally belong to the technical scope of the present invention. Understood.

1………手書き情報反映システム
2………端末
3………読取装置
4………紙書籍
11………制御部
12………記憶部
16………表示部
DESCRIPTION OF SYMBOLS 1 ......... Handwritten information reflecting system 2 ......... Terminal 3 ......... Reading device 4 ......... Paper book 11 ......... Control unit 12 ......... Storage unit 16 ......... Display unit

Claims (7)

リフロー型電子書籍データおよび紙書籍から読み取られた読取画像を記憶する記憶手段と、
前記読取画像から、所定の抽出条件に基づいて、手書き情報および反映位置を抽出する抽出手段と、
前記リフロー型電子書籍データのうち、前記抽出手段により抽出された前記反映位置に前記手書き情報を反映する反映手段と、
を備えることを特徴とする手書き情報反映システム。
Storage means for storing reflow type electronic book data and a read image read from a paper book;
Extraction means for extracting handwritten information and a reflection position from the read image based on a predetermined extraction condition;
Reflecting means for reflecting the handwritten information in the reflecting position extracted by the extracting means among the reflow type electronic book data;
A handwritten information reflection system comprising:
前記抽出手段は、前記手書き情報としてメモ書きを含むメモ画像を抽出し、前記反映位置として前記メモ画像と近い位置の文字列を抽出する
ことを特徴とする請求項1に記載の手書き情報反映システム。
2. The handwritten information reflecting system according to claim 1, wherein the extracting unit extracts a memo image including a memo as the handwritten information, and extracts a character string at a position close to the memo image as the reflecting position. .
前記抽出手段は、前記メモ画像のヒストグラムを算出し、前記ヒストグラムの分布に応じてメモ画像と書籍画像を区別する
ことを特徴とする請求項2に記載の手書き情報反映システム。
The handwriting information reflecting system according to claim 2, wherein the extraction unit calculates a histogram of the memo image and distinguishes the memo image from the book image according to the distribution of the histogram.
前記反映手段は、反映させる前記メモ画像の選択画面を表示し、前記選択画面で選択された前記メモ画像を前記リフロー型電子書籍データに反映する
ことを特徴とする請求項2または請求項3に記載の手書き情報反映システム。
The reflection unit displays a selection screen of the memo image to be reflected, and reflects the memo image selected on the selection screen in the reflow type electronic book data. The handwritten information reflection system described.
前記抽出手段は、前記手書き情報としてマーカ領域を抽出し、前記反映位置として前記マーカ領域内の文字列を抽出する
ことを特徴とする請求項1乃至請求項4のいずれかに記載の手書き情報反映システム。
5. The handwritten information reflection according to claim 1, wherein the extraction unit extracts a marker region as the handwritten information, and extracts a character string in the marker region as the reflection position. system.
リフロー型電子書籍データおよび紙書籍から読み取られた読取画像を記憶する記憶ステップと、
前記読取画像から、所定の抽出条件に基づいて、手書き情報および反映位置を抽出する抽出ステップと、
前記リフロー型電子書籍データのうち、前記抽出手段により抽出された前記反映位置に前記手書き情報を反映する反映ステップと、
を含むことを特徴とする手書き情報反映方法。
A storage step of storing reflow type electronic book data and a read image read from a paper book;
An extraction step for extracting handwritten information and a reflection position from the read image based on a predetermined extraction condition;
A reflecting step of reflecting the handwritten information in the reflecting position extracted by the extracting means in the reflow type electronic book data;
A method for reflecting handwritten information, comprising:
コンピュータに、
リフロー型電子書籍データおよび紙書籍から読み取られた読取画像を記憶する記憶ステップと、
前記読取画像から、所定の抽出条件に基づいて、手書き情報および反映位置を抽出する抽出ステップと、
前記リフロー型電子書籍データのうち、前記抽出手段により抽出された前記反映位置に前記手書き情報を反映する反映ステップと、
を実行させるためのプログラム。
On the computer,
A storage step of storing reflow type electronic book data and a read image read from a paper book;
An extraction step for extracting handwritten information and a reflection position from the read image based on a predetermined extraction condition;
A reflecting step of reflecting the handwritten information in the reflecting position extracted by the extracting means in the reflow type electronic book data;
A program for running
JP2011170764A 2011-08-04 2011-08-04 Handwritten information reflection system, handwritten information reflection method, and program Withdrawn JP2013037419A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011170764A JP2013037419A (en) 2011-08-04 2011-08-04 Handwritten information reflection system, handwritten information reflection method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011170764A JP2013037419A (en) 2011-08-04 2011-08-04 Handwritten information reflection system, handwritten information reflection method, and program

Publications (1)

Publication Number Publication Date
JP2013037419A true JP2013037419A (en) 2013-02-21

Family

ID=47887006

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011170764A Withdrawn JP2013037419A (en) 2011-08-04 2011-08-04 Handwritten information reflection system, handwritten information reflection method, and program

Country Status (1)

Country Link
JP (1) JP2013037419A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013222458A (en) * 2012-04-13 2013-10-28 Samsung Electronics Co Ltd Electronic device and method for inputting and managing user data
JP2014186546A (en) * 2013-03-22 2014-10-02 Yahoo Japan Corp Information processing device, information processing program, and information processing method
JP7229318B1 (en) 2021-10-31 2023-02-27 株式会社日本経済新聞社 Newspaper electronic version system

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013222458A (en) * 2012-04-13 2013-10-28 Samsung Electronics Co Ltd Electronic device and method for inputting and managing user data
JP2014186546A (en) * 2013-03-22 2014-10-02 Yahoo Japan Corp Information processing device, information processing program, and information processing method
JP7229318B1 (en) 2021-10-31 2023-02-27 株式会社日本経済新聞社 Newspaper electronic version system
JP2023067314A (en) * 2021-10-31 2023-05-16 株式会社日本経済新聞社 Newspaper electronic version system

Similar Documents

Publication Publication Date Title
US8107727B2 (en) Document processing apparatus, document processing method, and computer program product
US10614300B2 (en) Formatting handwritten content
JP4785655B2 (en) Document processing apparatus and document processing method
US11475688B2 (en) Information processing apparatus and information processing method for extracting information from document image
US11763588B2 (en) Computing system for extraction of textual elements from a document
US9032284B2 (en) Green printing: re-purposing a document to save ink and paper
US8799761B2 (en) Method and system for repurposing a spreadsheet to save paper and ink
US10803233B2 (en) Method and system of extracting structured data from a document
US20150261735A1 (en) Document processing system, document processing apparatus, and document processing method
JP2014215911A (en) Interest area estimation device, method, and program
JP2013037419A (en) Handwritten information reflection system, handwritten information reflection method, and program
US20140281948A1 (en) Information displaying apparatus, information editing method and non-transitory computer-readable storage medium
JP2008129793A (en) Document processing system, apparatus and method, and recording medium with program recorded thereon
JP2013254321A (en) Image processing apparatus, image processing method, and program
CN113111881A (en) Information processing apparatus and recording medium
JP2011237993A (en) Information input device and information input program
JP5550959B2 (en) Document processing system and program
JP2007310503A (en) Information processor, its control method and program
US20180032244A1 (en) Input control device, input control method, character correction device, and character correction method
KR101368610B1 (en) Method and system for selecting paragraph on electronic book environments
JP5596068B2 (en) Electronic terminal and book browsing program
CN113378526A (en) PDF paragraph processing method, device, storage medium and equipment
JP2010102734A (en) Image processor and program
JP2016103150A (en) Document processing device and document processing program
KR101098500B1 (en) Data record operating method

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20141007