JP6790712B2 - Shape extraction program, shape extraction method and shape extraction device - Google Patents
Shape extraction program, shape extraction method and shape extraction device Download PDFInfo
- Publication number
- JP6790712B2 JP6790712B2 JP2016205442A JP2016205442A JP6790712B2 JP 6790712 B2 JP6790712 B2 JP 6790712B2 JP 2016205442 A JP2016205442 A JP 2016205442A JP 2016205442 A JP2016205442 A JP 2016205442A JP 6790712 B2 JP6790712 B2 JP 6790712B2
- Authority
- JP
- Japan
- Prior art keywords
- characters
- template
- shape
- partial area
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
- Document Processing Apparatus (AREA)
- Character Input (AREA)
Description
本発明は、形状抽出プログラム、形状抽出方法及び形状抽出装置に関する。 The present invention relates to a shape extraction program, a shape extraction method, and a shape extraction device.
新聞等の編集作業においては、予め編集する情報の内容等に応じて各ページの所望の位置に、文字や画像を配置するためのフレームやボックスと呼ばれる所望のサイズの枠を設定した後、枠内に文字や画像を流し込むことにより、作業が行われることが多い。また、最近では、フレームやボックスが予め所望の位置に配置されたひな形を用意しておき、選択して作業に利用することで、省力化を図ることも行われている。 In the editing work of newspapers, etc., after setting a frame of a desired size called a frame or box for arranging characters and images at a desired position on each page according to the content of information to be edited in advance, the frame Work is often done by pouring characters and images inside. Further, recently, labor saving has been achieved by preparing a template in which a frame or a box is arranged at a desired position in advance, selecting the template, and using it for work.
なお、特許文献1等には、文書画像処理を自動的に行う技術について開示されている。
In addition,
しかしながら、実際に製作した新聞等を人手でひな形化する場合、製作した新聞等から記事が配置されている領域を特定し、特定した領域の形状を抽出する必要があり、手間と労力がかかる。 However, when a newspaper or the like actually produced is manually modeled, it is necessary to identify the area where the article is arranged from the produced newspaper or the like and extract the shape of the specified area, which takes time and effort. ..
1つの側面では、本発明は、文書情報から文字が配置された領域の形状を簡易に抽出することが可能な形状抽出プログラム、形状抽出方法及び形状抽出装置を提供することを目的とする。 In one aspect, it is an object of the present invention to provide a shape extraction program, a shape extraction method, and a shape extraction device capable of easily extracting the shape of a region in which characters are arranged from document information.
一つの態様では、形状抽出プログラムは、文字を含む文書情報から、区切り線、前記文字のフォント、フォントサイズ、前記文字の色の1又は複数の組み合わせに基づいて部分領域を特定し、特定した前記部分領域から文字を除いた形状を抽出し、特定した前記部分領域に配置された文字を形態素解析して抽出した名詞を属性情報とし、該属性情報を抽出した前記形状に対応づけて記憶部に記憶させる、処理をコンピュータに実行させるプログラムである。 In one embodiment, the shape extraction program identifies and identifies a partial area from document information including characters based on a separator line, the font of the characters, a font size, and one or more combinations of the colors of the characters. The shape obtained by removing the characters from the partial area is extracted , the characters arranged in the specified partial area are morphologically analyzed, and the extracted nomenclature is used as attribute information, and the attribute information is associated with the extracted shape and stored in the storage unit. It is a program that causes a computer to perform processing that is stored .
文書情報から文字が配置された領域の形状を簡易に抽出することができる。 The shape of the area where characters are arranged can be easily extracted from the document information.
以下、新聞製作システムの一実施形態について、図1〜図18に基づいて詳細に説明する。 Hereinafter, one embodiment of the newspaper production system will be described in detail with reference to FIGS. 1 to 18.
図1には、一実施形態に係る新聞製作システム100の構成が概略的に示されている。図1に示すように、新聞製作システム100は、形状抽出装置及び編集支援装置としての情報処理装置10と、ユーザ端末60と、レイアウトデータ格納装置70と、を備える。新聞製作システム100に含まれる各装置は、インターネットなどのネットワーク80に接続されている。
FIG. 1 schematically shows the configuration of the
情報処理装置10は、サーバ等を含み、ユーザが製作した文書情報(ここでは、新聞紙面のデータ(レイアウトデータ))から新聞製作に利用可能なひな形を自動的に生成するとともに、ユーザ端末60に対して適切なひな形を提供するための装置である。
The
図2(a)には、情報処理装置10のハードウェア構成が示されている。図2(a)に示すように、情報処理装置10は、CPU(Central Processing Unit)90、ROM(Read Only Memory)92、RAM(Random Access Memory)94、記憶部(ここではHDD(Hard Disk Drive))96、ネットワークインタフェース97、及び可搬型記憶媒体用ドライブ99等を備えている。これら情報処理装置10の構成各部は、バス98に接続されている。情報処理装置10では、ROM92あるいはHDD96に格納されているプログラム(形状抽出プログラムや編集支援プログラムを含む)、或いは可搬型記憶媒体用ドライブ99が可搬型記憶媒体91から読み取ったプログラム(形状抽出プログラムや編集支援プログラムを含む)をCPU90が実行することにより、図3に示す、各部の機能が実現される。なお、図3には、情報処理装置10のHDD96等に格納されているデータベースやテーブルについても図示されている。
FIG. 2A shows the hardware configuration of the
図3には、情報処理装置10及びユーザ端末60の機能ブロック図が示されている。図3に示すように、情報処理装置10は、ひな形生成部20と、ひな形提示部22として機能する。
FIG. 3 shows a functional block diagram of the
ひな形生成部20は、蓄積対象テーブル30を参照して、ユーザが製作した新聞紙面が蓄積対象か否かを判定し、蓄積対象である場合には、ユーザが製作した新聞紙面に基づいて、次回以降の新聞紙面製作に利用可能なひな形を自動生成する。ひな形生成部20が自動生成したひな形(レイアウトデータ)は、ひな形DB32に格納される。ここで、ひな形生成部20は、ひな形を自動生成する際に、ユーザが製作した新聞紙面を解析する。具体的には、ひな形生成部20は、ユーザが製作した新聞紙面の記事や見出し、画像が配置された部分領域(配置領域)の属性(配置領域が、記事、見出し、画像のいずれが配置された領域であるか)を判定する。また、各配置領域のカテゴリ(記事や見出し、画像の内容)を判定する。
The
また、ひな形生成部20は、ユーザが製作した新聞紙面の解析結果を用いて、新聞紙面をカテゴリごとに分割してモジュール化し、各モジュールにおいて配置領域を抽出する「モジュール分割」を実行する。なお、モジュールとは、同一のテーマ(カテゴリ)に属する記事(文字)や写真等のまとまりを意味する。更に、ひな形生成部20は、抽出した配置領域から文字や画像を削除して配置領域だけの状態にする「書き割り化」を実行し、書き割り化後の配置領域のレイアウトデータをひな形とする。
In addition, the
ひな形提示部22は、ユーザが新聞紙面の製作を開始する際に、ひな形DB32を参照して、ユーザが製作しようとしている新聞紙面(編集対象の文書ページ)に適したひな形を選定し、選定したひな形の一覧画面をユーザ端末60に送信する。また、ひな形提示部22は、一覧画面でユーザにより選択されたひな形をユーザ端末60に送信する。
When the user starts producing a newspaper page, the
図4には、蓄積対象テーブル30のデータ構造の一例が示されている。図4に示すように、蓄積対象テーブル30は、「面名」と、「蓄積対象/対象外」のフィールドを有する。「面名」のフィールドには、面の名称(一面、二面、社会面、くらし面など)が格納される。「蓄積対象/対象外」のフィールドには、ひな形の情報を生成し、蓄積する対象であるか否か(対象/対象外)が格納される。したがって、ひな形生成部20は、蓄積対象テーブル30を参照することで、新聞紙面のうち、どの面のひな形を生成し、蓄積すればよいのかを判定することができる。
FIG. 4 shows an example of the data structure of the storage target table 30. As shown in FIG. 4, the storage target table 30 has fields of “face name” and “storage target / non-target”. In the "face name" field, the name of the face (one face, two faces, social face, living face, etc.) is stored. In the "accumulation target / non-target" field, template information is generated and whether or not it is a storage target (target / non-target) is stored. Therefore, the
図5には、ひな形DB32の一例が示されている。ひな形DB32は、ひな形のデータをひな形を生成する際に利用した新聞紙面の属性と対応付けて記憶するデータベースである。具体的には、ひな形DB32は、図5に示すように「データ種別」、「作成日時」、「最終使用日時」、「使用回数」、「掲載年月日」、「掲載曜日」、「左右ページ」、「面名」、「版名」、「モジュール名」、「縦大きさ」、「横大きさ」、「記事部段数」、「レイアウト格納パス」、「表示画格納パス(書き割り)」、「表示画格納パス(組み上がり)」、「モジュール構成情報格納パス」、「記事数」、「記事行数」、「画像数」、「画像の縦横」の各フィールドを有する。 FIG. 5 shows an example of the model DB 32. The template DB 32 is a database that stores template data in association with the attributes of newspaper pages used when generating the template. Specifically, as shown in FIG. 5, the template DB 32 has "data type", "creation date", "last use date", "number of uses", "post date", "post date", and "post date". Left and right pages, "face name", "version name", "module name", "vertical size", "horizontal size", "number of article copies", "layout storage path", "display image storage path (writing) It has fields of "split)", "display image storage path (assembled)", "module configuration information storage path", "number of articles", "number of article lines", "number of images", and "vertical and horizontal images".
「データ種別」のフィールドには、「面」又は「モジュール」が格納される。「面」が格納されているデータ(行)は、新聞の面(1ページ)全体のレイアウト(ひな形)に関するデータを意味し、「モジュール」が格納されているデータ(行)は、面に含まれる各記事のレイアウト(ひな形)に関するデータを意味する。 A "face" or "module" is stored in the "data type" field. The data (row) in which the "face" is stored means the data related to the layout (template) of the entire newspaper face (1 page), and the data (row) in which the "module" is stored is in the face. It means data about the layout (template) of each contained article.
「作成日時」のフィールドには、ひな形が作成された日時の情報が格納され、「最終使用日時」のフィールドには、ひな形が最後に使用された日時の情報が格納される。「使用回数」のフィールドには、ひな形が使用された回数の情報が格納され、「掲載年月日」、「掲載曜日」のフィールドには、ひな形の作成に利用した新聞が発行された日付及び曜日が格納される。なお、「作成日時」や「最終使用日時」、「使用回数」のフィールドに格納されている情報は、あまり利用されないひな形のデータを削除するか否かを判断する判断基準として利用することができる。 The "Created date and time" field stores information on the date and time when the stationery was created, and the "Last used date and time" field stores information on the date and time when the stationery was last used. Information on the number of times the stationery was used was stored in the "Number of uses" field, and the newspaper used to create the stationery was published in the "Date of publication" and "Day of the week" fields. The date and day of the week are stored. The information stored in the "Created date", "Last used date", and "Number of uses" fields can be used as a criterion for determining whether to delete the template data that is rarely used. it can.
「左右ページ」のフィールドには、面及びフィールドが紙面の左側のページ及び右側のページのいずれに配置されたかの情報が格納され、「面名」のフィールドには、面の名称又はモジュールが配置された面の名称が格納される。「版名」のフィールドには、面及びモジュールが掲載された版の名称が格納され、「モジュール名」のフィールドには、モジュールの名称が格納される。なお、データ種別が「面」のデータ(行)においては、モジュール名は、面名と同一となる。 The "left and right page" field stores information on whether the face and the field are placed on the left page or the right page of the page, and the "face name" field contains the face name or module. The name of the face is stored. The name of the plate on which the face and the module are posted is stored in the "version name" field, and the name of the module is stored in the "module name" field. In the data (row) whose data type is "face", the module name is the same as the face name.
「縦大きさ」、「横大きさ」のフィールドには、面やモジュールの縦横の大きさが格納され、「記事部段数」のフィールドには、面において記事(広告を除く部分)が何段配置されているかの情報が格納される。記事部段数は、面が有する段数から広告の段数を差し引いた段数であるといえる。 The vertical and horizontal sizes of faces and modules are stored in the "vertical size" and "horizontal size" fields, and the number of articles (parts excluding advertisements) on the face is stored in the "article number of columns" field. Information on whether it is placed is stored. It can be said that the number of article copies is the number of stages obtained by subtracting the number of advertisement stages from the number of stages of the surface.
「レイアウト格納パス」のフィールドには、レイアウトデータ(ひな形情報)が保存されている保存先のパスが格納される。なお、レイアウトデータのファイルは、情報処理装置10のストレージに格納される。なお、ストレージは、図2(a)のHDD96等であるため、以下においては、「ストレージ96」とも表記するものとする。例えば、レイアウトデータのファイルは、見出しや記事、画像、区切り線などが配置される配置領域のレイアウト(位置、大きさ、形状等)を管理するとともに、配置領域の属性(見出し、記事、画像、区切り線のいずれが配置されるか)を管理している。なお、本実施形態では、ストレージ96にレイアウトデータを保存し、ひな形DB32において保存先のパスを管理するため、ひな形DB32及びストレージ96においてレイアウトデータを読出し可能に記憶しているといえる。
In the "Layout storage path" field, the save destination path in which the layout data (template information) is saved is stored. The layout data file is stored in the storage of the
「表示画格納パス(書き割り)」、「表示画格納パス(組み上がり)」のフィールドには、書き割り後の表示画(例えば、図13(b)参照)と、書き割り前の表示画(例えば、図13(a)参照)を保存する保存先のパスが格納される。なお、表示画のファイルは、例えばjpeg形式のファイルであり、情報処理装置10のストレージ96に格納される。「モジュール構成情報格納パス」のフィールドには、モジュールの構成情報が保存されている保存先のパスが格納される。モジュールの構成情報は、モジュールに含まれるオブジェクト(見出し、記事、画像など)の識別番号のリストである。オブジェクトの識別番号を用いて、レイアウトデータのファイルを検索することで、オブジェクトの位置や大きさ、形状を取り出すことができる。なお、モジュールの構成情報のファイルについても、情報処理装置10のストレージ96に格納される。なお、本実施形態では、表示画やモジュール構成情報をストレージ96に保存し、ひな形DB32において保存先のパスを管理するため、ひな形DB32及びストレージ96において表示画やモジュール構成情報を読出し可能に記憶しているといえる。
In the fields of "Display image storage path (writing division)" and "Display image storage path (assembled)", the display image after writing division (see, for example, FIG. 13B) and the display image before writing division are displayed. (For example, see FIG. 13 (a)) is stored in the save destination path. The display image file is, for example, a jpeg format file and is stored in the
「記事数」のフィールドには、モジュールに含まれる記事の数が格納され、「記事行数」のフィールドには、モジュールに含まれる記事の行数が格納される。また、「画像数」のフィールドには、モジュールに含まれる画像の数が格納され、「画像の縦横」のフィールドには、モジュールに含まれる画像が縦長であるか横長であるかが格納される。 The number of articles contained in the module is stored in the "number of articles" field, and the number of lines of articles contained in the module is stored in the "number of article lines" field. In addition, the number of images included in the module is stored in the "number of images" field, and whether the images included in the module are vertically long or horizontally long is stored in the "vertical and horizontal images" field. ..
図1に戻り、ユーザ端末60は、新聞紙面を製作するユーザ(新聞社の社員等)が利用する端末である。ユーザ端末60では、情報処理装置10に対して、ユーザが製作しようとしている新聞紙面に関する情報を提供し、情報処理装置10から提示されたひな形の一覧画面を表示する。また、ユーザ端末60は、一覧画面においてユーザにより選択されたひな形の情報を情報処理装置10に送信し、情報処理装置10から送信されてくるひな形及び/又は情報処理装置10にあるひな形を表示部193上に展開する。また、ユーザ端末60は、ユーザが製作した新聞紙面のレイアウトデータをレイアウトデータ格納装置70に記憶する。この場合、ユーザ端末60は、レイアウトデータに関連付けて、ユーザが製作した新聞紙面やモジュールに関する情報(掲載年月日、掲載曜日、左右ページ、面名、版名、縦大きさ、横大きさ、記事部段数、記事数、記事行数、画像数、画像の縦横など)をレイアウトデータ格納装置70に記憶する。
Returning to FIG. 1, the
図2(b)には、ユーザ端末60のハードウェア構成が示されている。図2(b)に示すように、ユーザ端末60は、CPU190、ROM192、RAM194、記憶部(HDD)196、ネットワークインタフェース197、表示部193、入力部195、及び可搬型記憶媒体用ドライブ199等を備えている。これらユーザ端末60の構成各部は、バス198に接続されている。表示部193は液晶ディスプレイ等を含み、入力部195は、キーボードやマウスタッチパネル等を含む。ユーザ端末60では、ROM192あるいはHDD196に格納されているプログラム、或いは可搬型記憶媒体用ドライブ199が可搬型記憶媒体191から読み取ったプログラムをCPU190が実行することにより、図3に示す、紙面製作部62、紙面送信部64の機能が実現される。紙面製作部62は、ユーザの操作に従って、新聞紙面を製作する処理を実行する。例えば、紙面製作部62は、ユーザが配置した記事や見出し、区切り線に基づいて、新聞紙面を製作する。また、紙面製作部62は、例えば、ユーザにより選択されたひな形に対するユーザの操作に応じて紙面を製作する。紙面送信部64は、紙面製作部62が製作した紙面をレイアウトデータ格納装置70に格納する。
FIG. 2B shows the hardware configuration of the
レイアウトデータ格納装置70は、データサーバ等であり、ユーザ端末60において製作された新聞紙面のレイアウトデータや、紙面及びモジュールの情報を管理する。
The layout
(情報処理装置10のひな形生成処理)
次に、情報処理装置10によるひな形生成処理について、図6のフローチャートに沿って詳細に説明する。なお、本処理が行われるタイミングは、ユーザ端末60において新規の新聞紙面が製作され、新規新聞紙面のデータ(レイアウトデータ)がレイアウトデータ格納装置70に格納されたタイミングであるものとする。ただし、これに限らず、例えば、新規の新聞紙面が所定数だけ製作された場合や、所定期間経過した場合(例えば1日1回)など、所定の条件を満たしたタイミングで図6の処理を実行することとしてもよい。また、ユーザや情報処理装置10の管理者等が手動で図6の処理の実行開始を指示してもよい。
(Model generation process of information processing device 10)
Next, the model generation process by the
図6の処理では、まず、ステップS10において、情報処理装置10のひな形生成部20は、新たにレイアウトデータ格納装置70に格納された新聞紙面のレイアウトデータを取得する。
In the process of FIG. 6, first, in step S10, the
次いで、ステップS11では、ひな形生成部20が、ユーザが製作した新聞紙面の中から蓄積対象面を決定する。ひな形生成部20は、蓄積対象テーブル30を参照して、1日分の新聞紙面から、ひな形を生成する面を決定する。図4の蓄積対象テーブル30からは、「生活」、「くらし」、「文化」の面がひな形を生成する面として決定される。なお、以下においては、「文化」の面のひな形生成を例にとり説明する。
Next, in step S11, the
次いで、ステップS12では、ひな形生成部20が、ユーザが製作した新聞紙面の解析処理を実行する。ステップS12の解析処理においては、具体的には、ひな形生成部20は、図7のフローチャートに沿った処理を実行する。
Next, in step S12, the
ひな形生成部20は、図7の処理において、配置領域の特定処理(S120)と、配置領域の種別判定処理(S122)と、配置領域のカテゴリ判定処理(S124)とを実行する。
In the process of FIG. 7, the
配置領域の特定(S120)においては、ひな形生成部20は、区切り線、文字のフォント、フォントサイズ、文字の色の少なくとも1つに基づいて、配置領域を抽出する。例えば、ひな形生成部20は、区切り線を用いて、新聞紙面の領域を区画するとともに、区画した範囲内で、文字のフォント、フォントサイズや色に基づいて、更に領域を区画することで、配置領域を抽出する。また、画像が配置されている領域についても、配置領域として抽出する。
In specifying the arrangement area (S120), the
次いで、配置領域の種別判定処理(S122)においては、まず、ステップS1221において、ひな形生成部20が、記事領域判定を実行する。具体的には、ひな形生成部20は、割り付いた文字のフォントが記事本文用のフォントである配置領域を記事領域として認識する。
Next, in the arrangement area type determination process (S122), first, in step S1221, the
次いで、ステップS1222では、ひな形生成部20は、見出し領域判定処理を実行する。具体的には、ひな形生成部20は、割り付いた文字のフォントが見出し用のフォントである配置領域、記事フォントよりもサイズが大きい配置領域、フォントの色が見出し用の色である配置領域、例えば白抜き文字など装飾されている文字が割りついた配置領域、などを見出し領域と認識する。
Next, in step S1222, the
次いで、ステップS1223では、ひな形生成部20は、画像領域判定処理を実行する。具体的には、ひな形生成部20は、文字が割り付いておらず、画像のみが割り付いている配置領域または画像と写真説明文の領域とを合わせた領域を画像領域と認識する。
Next, in step S1223, the
以上のようにして配置領域の種別判定処理(S122)が行われた後は、ひな形生成部20は、ステップS124において、配置領域のカテゴリ判定を実行する。具体的には、ひな形生成部20は、次のようにして、配置領域のカテゴリ判定を行う。
After the type determination process (S122) of the arrangement area is performed as described above, the
(1)まず、ひな形生成部20は、見出し領域の文字(見出し文)を形態素解析し、名詞を抽出する。例えば、図8に示すように、見出し文が「日本総人口 初の減少」であったとする。この場合、ひな形生成部20は、形態素解析により、名詞「日本」「人口」「初」「減少」を抽出する。
(2)次いで、ひな形生成部20は、記事領域の文字(記事本文)の中から、(1)で抽出された名詞「日本」「人口」「初」「減少」を検索する。
(3)次いで、ひな形生成部20は、見出し文と記事本文の文字が所定の類似関係を満たす場合に、同一のカテゴリとする。具体的には、ひな形生成部20は、一致する名詞が最も多い記事本文と見出しを関連付け、同一のカテゴリ名「日本/人口/初/減少」を付与する。
(1) First, the
(2) Next, the
(3) Next, the
以上の処理により、図7の処理(ステップS12の処理)が終了する。この図7の処理により、各配置領域の種別が判定できるとともに、配置領域のカテゴリが判定できるので、以降においては、カテゴリ名が共通する配置領域を1つのまとまり(モジュール)として扱うことが可能になる。この場合、共通するカテゴリ名がモジュール名として扱われる。なお、ひな形生成部20は、ステップS12の判定結果を、配置領域のレイアウトデータとして管理する。なお、配置領域のレイアウトデータには、配置領域の位置や大きさも含まれている。
By the above processing, the processing of FIG. 7 (processing of step S12) is completed. By the process of FIG. 7, the type of each arrangement area can be determined and the category of the arrangement area can be determined. Therefore, thereafter, the arrangement areas having the same category name can be treated as one group (module). Become. In this case, the common category name is treated as the module name. The
図6に戻り、ステップS13では、ひな形生成部20が、モジュール分割を実行する。例えば、ユーザ端末60において、新聞紙面の「文化」の面が、図9に示すように製作されたものとする。この場合、ひな形生成部20は、文化の面をカテゴリ(=記事、話題)ごとに分割する。なお、本実施形態においては、新聞紙面のレイアウトデータでは、前述のように配置領域の位置や大きさと種別(見出し、記事、画像、区切り線の別)とが管理されている。すなわち、レイアウトデータからは、図10に示すように、配置領域の位置や大きさと種別とが得られる。また、レイアウトデータにおいては、配置領域内に配置された記事や見出し、画像のカテゴリ名(何に関する記事であるかを示す名称)が管理されている。したがって、ひな形生成部20は、カテゴリ名ごとのまとまりで、配置領域を分割する。図11には、モジュール分割により新聞紙面の配置領域が分割された状態が太線枠にて示されている。
Returning to FIG. 6, in step S13, the
次いで、ステップS14では、ひな形生成部20が、書き割り化を実行する。具体的には、ひな形生成部20は、新聞紙面のレイアウトデータを編集し、文字や画像を削除して配置領域だけの状態にする。図12には、書き割り化後の新聞レイアウトが示されている。なお、書き割り化後の新聞レイアウトは、新聞紙面から抽出された形状データであるといえる。
Next, in step S14, the
次いで、ステップS16では、ひな形生成部20が、レイアウトデータの書き出しを行う。すなわち、ひな形生成部20は、書き割り化した新聞紙面のレイアウトデータを書き出し、ストレージ96に格納するとともに、格納先のパスを取得する。この場合、ひな形生成部20は、面全体のレイアウトデータを書き出すとともに、面の一部であるモジュールごとのレイアウトデータ(図11の太線枠ごとのレイアウトデータ)についても書き出す。
Next, in step S16, the
次いで、ステップS18では、ひな形生成部20が、管理情報の収集を行う。この場合、ひな形生成部20は、レイアウトデータ格納装置70に格納されているユーザが製作した新聞紙面の情報を参照し、蓄積する必要のある管理情報を収集する。具体的には、ひな形生成部20は、レイアウトデータ格納装置70から、新聞紙面の管理情報として、図5のひな形DB32の「掲載年月日」、「掲載曜日」、「左右ページ」、「面名」、「版名」、「モジュール名」、「縦大きさ」、「横大きさ」、「記事部段数」のフィールドに格納する情報などを収集する。
Next, in step S18, the
次いで、ステップS20では、ひな形生成部20が、表示画を作成する。この場合、図13(a)、図13(b)に示すような、モジュールごとの表示画を書き出す。より具体的には、ひな形生成部20は、図13(a)に示すような組み上がり状態(新聞発行時の状態)を示す表示画と、図13(b)に示すような書き割り状態(配置領域のみの状態)を示す表示画の2種類の表示画を作成する。また、ひな形生成部20は、図9の新聞紙面そのものの表示画についても作成する。なお、ひな形生成部20は、作成した表示画をストレージ96に格納し、格納先のパスを取得する。
Next, in step S20, the
次いで、ステップS22では、ひな形生成部20が、ひな形DB32へデータを格納する。すなわち、ひな形生成部20は、これまでの処理において作成、収集したデータをひな形DB32へ格納する。なお、図9の新聞紙面そのものの表示画の格納パスについては、図5のひな形DB32のデータ種別が「面」のデータ(行)の「表示画格納パス(組み上がり)」のフィールドに格納される。
Next, in step S22, the
(情報処理装置10によるひな形提示処理)
次に、図14のフローチャートに沿って、情報処理装置10により実行されるひな形提示処理について説明する。図14の処理は、例えば、ユーザがユーザ端末60において新規の新聞紙面の製作を開始するタイミングで実行される処理である。
(Model presentation processing by information processing device 10)
Next, the template presentation process executed by the
図14の処理では、まず、ステップS50において、ひな形提示部22は、ユーザが製作しようとしている紙面の情報を取得する。この場合、紙面編集開始時に自動で紙面の情報を取得する場合と、ユーザが手入力した紙面の情報を取得する場合とがある。
In the process of FIG. 14, first, in step S50, the
紙面編集開始時に自動で紙面の情報を取得する場合、ひな形提示部22は、ユーザ端末60から、製作しようとしている紙面の情報と作成済みで新聞紙面に配置しようとしているコンテンツ(記事)の属性を自動的に取得する。なお、ユーザ端末60において紙面編集を開始する際に表示される画面は、図15(a)に示すような画面である。ユーザは、紙面を製作するときに、図15(a)の画面の入力欄72において日付や、製作する面の情報などを入力、選択等するため、ひな形提示部22は、図15(a)の画面に入力された情報を取得する。また、ひな形提示部22は、ユーザ端末60において作成されたコンテンツ(記事)の情報(モジュール名や、モジュールの大きさ、画像数、画像の縦横の情報など)を取得する。なお、コンテンツ(記事)の情報は、文字、文字の構成情報、写真の構成情報を含んでいる。
When the information on the paper is automatically acquired at the start of editing the paper, the
一方、ユーザが手動で紙面の情報を入力する画面は、図15(b)に示すような画面である。ユーザは、ひな形を呼び出す際に、図15(b)の画面において、掲載年月日や掲載曜日、記事数、画像数、モジュール名、面名、版名、左右ページ、記事部段数、記事行数、画像縦横などの情報を入力し、確定ボタンを押す。ユーザによって確定ボタンが押されると、ユーザ端末60からひな形提示部22に図15(b)の画面において入力された情報が送信される。
On the other hand, the screen on which the user manually inputs the information on the paper is the screen as shown in FIG. 15B. When the user calls the template, on the screen shown in FIG. 15B, the publication date, the publication day of the week, the number of articles, the number of images, the module name, the face name, the version name, the left and right pages, the number of article sections, and the article Enter information such as the number of lines and image height and width, and press the confirm button. When the confirmation button is pressed by the user, the information input on the screen of FIG. 15B is transmitted from the
図14に戻り、次のステップS52では、ひな形提示部22が、紙面の属性(掲載曜日、左右ページ、面名、版名など)でひな形を絞り込む。この場合、ひな形提示部22は、ひな形DB32を参照して、ユーザが製作しようとしている紙面の属性と一致するひな形を抽出する。なお、ステップS52では、ユーザが製作しようとしている紙面の属性と完全一致するひな形を抽出する場合に限らず、属性がある程度類似するひな形を抽出することとしてもよい。
Returning to FIG. 14, in the next step S52, the
次いで、ステップS54では、ひな形提示部22が、記事(コンテンツ)の属性でひな形を絞り込む。この場合、ひな形提示部22は、ステップS52で抽出したひな形のうち、ステップS50で取得した記事の属性(例えば、モジュール名、記事数、行数、画像数、画像の縦横など)と一致するひな形を抽出する。なお、ステップS52では、記事の属性と完全一致するひな形を抽出する場合に限らず、属性がある程度類似するひな形を抽出することとしてもよい。
Next, in step S54, the
次いで、ステップS56では、ひな形提示部22が、ひな形の候補を一覧表示する。具体的には、ひな形提示部22は、図16や図17に示すような一覧画面を情報処理装置10の紙面製作部62に送信する。これにより、紙面製作部62が、表示部193上に一覧表示を行う。図16の一覧画面では、表示画として「組み上がり」、「書き割り」が表示される。一方、図17の一覧画面では、表示画として「組み上がり」、「書き割り」に加え、「出来上がり」が表示される。表示画(出来上がり)は、ひな形を生成した際に用いた新聞紙面そのものの画像(図9の新聞紙面から生成した表示画)である。表示画(出来上がり)は、ひな形DB32のうちデータ種別が「面」のデータの「表示画格納パス(組み上がり)」のフィールドに格納されているパスで管理されている表示画である。なお、図16と図17のいずれの一覧画面を表示するかは、ユーザにより予め設定されているものとする。なお、ユーザからの入力により、一覧画面を図16から図17へ、又は図17から図16へ切り替えられるようにしてもよい。ユーザは、図16や図17の一覧画面を参照することで、製作しようとしている新聞紙面において記事や画像がどのように配置されるかを確認することができるので、一覧画面からのひな形選択がしやすくなっている。
Next, in step S56, the
次いで、ステップS58では、ひな形提示部22が、一覧画面の中からユーザがいずれかのひな形を選択するまで待機する。ユーザが入力部195を介していずれかのひな形を選択し、選択したひな形の情報が紙面製作部62からひな形提示部22に送信されると、ステップS60に移行する。
Next, in step S58, the
ステップS60に移行すると、ひな形提示部22は、ひな形をユーザ端末60の表示部193上に展開する。図18には、選択されたひな形を表示部193上に展開した状態が示されている。ユーザは、展開されたひな形の各配置領域に対して、見出しや記事を配置したり、画像を配置することが可能となっている。なお、展開されたひな形の配置領域の大きさは、配置時に更新またはユーザが適宜変更できるようになっている。すなわち、ステップS60では、ひな形提示部22は、ユーザによって選択されたひな形を、ユーザが製作しようとしている新聞紙面の構成要素として提示しているといえる。
When the process proceeds to step S60, the
以上のように、図14の処理が実行されることで、本実施形態では、ユーザが、適切なひな形を利用することができるので、簡易に新聞紙面を製作することが可能となっている。 As described above, by executing the process of FIG. 14, in the present embodiment, the user can use an appropriate template, so that it is possible to easily produce a newspaper page. ..
これまでの説明からわかるように、本実施形態では、ひな形生成部20は、製作した新聞紙面から、区切り線、文字のフォント、フォントサイズ、文字の色の少なくとも1つに基づいて配置領域を特定する特定部、及び特定した配置領域から文字を除いた形状を抽出する抽出部として機能する。また、ひな形生成部20は、特定した配置領域に配置された文字に基づいて配置領域の属性を生成し、生成した属性を抽出した形状に対応づけてひな形DB32に記憶させる生成部として機能する。また、ひな形生成部20は、新聞紙面から、区切り線で区切られた領域(図11の太枠参照)を特定する特定部、及び特定した領域のデータと、該領域から文字を除いた形状とをひな形DB32やストレージ96に記憶させる記憶制御部として機能する。
As can be seen from the above description, in the present embodiment, the
以上、詳細に説明したように、本実施形態によると、ひな形生成部20は、ユーザがユーザ端末60において製作した新聞紙面から、区切り線、文字のフォント、フォントサイズ、色等に基づいて配置領域を特定し(S120)、特定した配置領域から文字を除いた形状を抽出する(S13)。これにより、ユーザが製作した新聞紙面において配置領域が指定されていなくても、自動的に配置領域を特定し、ひな形に利用可能な配置領域の形状を簡易に抽出することができる。
As described in detail above, according to the present embodiment, the
また、本実施形態によると、ひな形生成部20は、特定した配置領域に配置された文字に基づいて属性情報(見出し、記事、画像の別や、カテゴリ(モジュール名))を生成し(S122)、配置領域の形状等に対応付けてレイアウトデータとしてストレージ93に記憶する。これにより、ユーザが製作した新聞紙面において配置領域の属性が定められていない場合であっても、新聞紙面から配置領域の属性情報と配置領域の形状等を対応付けたレイアウトデータを自動的に生成することが可能である。
Further, according to the present embodiment, the
また、本実施形態によると、2つの配置領域のそれぞれに含まれる文字が所定の類似関係を満たす場合(記事本文が、見出し文に含まれる名詞を多く含む場合)に、2つの配置領域を同じグループ(モジュール)としてストレージ96及びひな形DB32に記憶する。これにより、ユーザが製作した新聞紙面において配置領域間の関係が定められていない場合であっても、新聞紙面から配置領域のグループ(モジュール)を自動的に生成することが可能である。
Further, according to the present embodiment, when the characters included in each of the two arrangement areas satisfy a predetermined similarity relationship (when the article body contains many nouns included in the headline sentence), the two arrangement areas are the same. It is stored in the
また、本実施形態では、新聞紙面から、区切り線で区切られた領域を特定し(図11)、特定した領域のデータ(例えばモジュール名や記事数、画像数など)と、特定した領域から文字を除いた形状データ(ひな形)とをストレージ96及びひな形DB32に記憶している。これにより、モジュール名や記事数、画像数などに基づいて、ストレージ96からユーザが製作しようとしている新聞紙面に適したひな形をモジュール単位で読み出すことが可能である。また、本実施形態では、ひな形提示部22がひな形をユーザに提示する際に、ひな形に対応する特定した領域のデータ(モジュール名や記事数、画像数など)を併せて表示する(図16、図17)ので、ユーザは、ひな形が複数提示された場合でも、適切なひな形を選択することが可能である。
Further, in the present embodiment, an area separated by a dividing line is specified from the newspaper surface (FIG. 11), data of the specified area (for example, module name, number of articles, number of images, etc.) and characters from the specified area are specified. The shape data (template) excluding the above is stored in the
また、本実施形態では、ひな形DB32において、モジュールが配置された面の面名、面の記事部段数、モジュールの行数情報をモジュールのひな形に対応づけて記憶している。これにより、ひな形に対応付けて記憶されている情報に基づいて、ひな形DB32からユーザが製作しようとしている新聞紙面に適したひな形を抽出し、ユーザに提供することが可能である。 Further, in the present embodiment, in the template DB 32, the surface name of the surface on which the module is arranged, the number of article sections of the surface, and the line number information of the module are stored in association with the module template. Thereby, based on the information stored in association with the template, it is possible to extract a template suitable for the newspaper surface to be produced by the user from the template DB 32 and provide the template to the user.
また、本実施形態では、ひな形DB32において、モジュールが配置された面が新聞の左右いずれの面であるかの情報を、モジュールのひな形に対応づけて記憶している。新聞の場合、左右いずれの面であるかによってレイアウトが異なるため、上記のように左右いずれの面であるかの情報をひな形に対応付けて記憶しておくことで、ユーザが製作しようとしている新聞紙面に適したひな形を抽出し、ユーザに提供することが可能である。 Further, in the present embodiment, in the model DB 32, information on whether the side on which the module is arranged is the left or right side of the newspaper is stored in association with the model of the module. In the case of newspapers, the layout differs depending on which side is left or right, so the user is trying to produce by storing the information on which side is left or right in association with the template as described above. It is possible to extract a template suitable for the newspaper surface and provide it to the user.
また、本実施形態では、ひな形DB32において、モジュールが掲載された新聞紙面が発行された曜日や日付を、モジュールのひな形に対応づけて記憶している。新聞の場合、曜日や日付によってレイアウトが異なることが多いため、上記のように曜日や日付の情報をひな形に対応付けて記憶しておくことで、ユーザが製作しようとしている新聞紙面に適したひな形を抽出し、ユーザに提供することが可能である。 Further, in the present embodiment, in the template DB 32, the day of the week and the date on which the newspaper on which the module is published are published are stored in association with the template of the module. In the case of newspapers, the layout often differs depending on the day of the week and date, so by storing the information on the day of the week and date in association with the template as described above, it is suitable for the newspaper page that the user is trying to produce. It is possible to extract a template and provide it to the user.
また、本実施形態によれば、ユーザ端末60で生成された新聞紙面のレイアウトデータを取得し(S10)、取得したデータのうち、区切り線と、各記事の配置領域を抽出し(S13〜S16)、抽出した区切り線と、各記事の配置領域の形状とをひな形(レイアウトデータ)として、読み出し可能にひな形DB32及びストレージ96に記憶させる(S22)。これにより、ユーザが新聞紙面を製作する際に利用可能なひな形を自動的に生成して、ひな形DB32及びストレージ96に記憶させることができる。この場合、ひな形を一から手作業で生成したり、製作済みの新聞紙面から文字や画像を除外してひな形を生成したりする場合に比べて、手間や時間をかけずにひな形を生成することができ、新聞紙面の製作作業を適切に支援することが可能である。
Further, according to the present embodiment, the layout data of the newspaper page generated by the
また、本実施形態では、ひな形DB32において、記事のカテゴリ(モジュール名)をひな形に対応付けて記憶している。これにより、ユーザが製作しようとしている記事のカテゴリに応じて、適切なひな形をひな形DB32から読み出して、ユーザに対して提供することができる。 Further, in the present embodiment, in the template DB 32, the article category (module name) is stored in association with the template. As a result, an appropriate template can be read from the template DB 32 and provided to the user according to the category of the article to be produced by the user.
また、本実施形態では、ひな形DB32において、ひな形を生成するときに用いた新聞紙面から生成した画像(表示画)をひな形に対応付けて記憶している。これにより、ユーザに対してひな形を提示するときに、表示画を表示することができるため、ユーザは、表示画を参照して、提示されたひな形の中から利用するひな形を選択することが可能である。 Further, in the present embodiment, in the model DB 32, an image (display image) generated from the newspaper surface used when generating the model is stored in association with the model. As a result, when the template is presented to the user, the display image can be displayed. Therefore, the user refers to the display image and selects the template to be used from the presented templates. It is possible.
また、本実施形態では、新たに製作された新聞紙面のうち、蓄積対象テーブル30において対象とされている面を用いて、ひな形(レイアウトデータ)を生成し、ひな形DB32及びストレージ96に読み出し可能に記憶することとしている。これにより、ユーザが利用する可能性の高い、利便性の高いひな形を生成し、ひな形DB32及びストレージ96に記憶しておくことができる。
Further, in the present embodiment, a template (layout data) is generated by using the surface of the newly produced newspaper surface targeted in the storage target table 30, and read out to the template DB 32 and the
また、本実施形態によると、ひな形提示部22は、ユーザが製作しようとしている(編集対象の)紙面や記事の属性(掲載曜日、左右ページ、面名、版名、記事数、記事行数、画像数、画像の縦横など)を取得し、ひな形DB32を参照して、取得した紙面の属性に対応するひな形を絞り込み(S52、S54)、絞り込んだひな形をユーザが製作しようとしている紙面のひな形として提示する(S56)。これにより、ユーザが製作しようとしている紙面の製作に適したひな形を自動的に特定し、提示することができる。したがって、多数のひな形がひな形DB32及びストレージ96に格納されている場合であっても、新聞の製作に適したひな形を容易に絞り込み、ユーザに提示することができる。
Further, according to the present embodiment, the
また、本実施形態では、ひな形提示部22は、絞り込んだひな形を提示する際に、ひな形のデータとともに、文字や写真の配置候補(表示画(組み上がり)や表示画(出来上がり))を提示する。これにより、ユーザは、提示されたひな形から利用するひな形を選択する際に、組み上がりや出来上がり後の紙面を参考にすることができる。
Further, in the present embodiment, when the
また、本実施形態では、ひな形提示部22は、ひな形を提示する際に、製作しようとしている面全体または面の一部を提示する。これにより、ユーザは、紙面作成の際に利用しやすい大きさのひな形を選択することが可能である。
Further, in the present embodiment, when presenting the template, the
なお、上記実施形態では、ひな形提示部22は、ステップS52及びS54において、面及びコンテンツの属性でひな形を絞り込む場合について説明したが、これに限られるものではない。すなわち、ステップS52とステップS54のいずれか一方を実行することとしてもよい。
In the above embodiment, the
なお、上記実施形態では、情報処理装置10において生成されたひな形を情報処理装置10内のひな形DB32で管理する場合について説明したが、これに限らず、外部のデータサーバ等で管理してもよい。この場合、ひな形を生成する装置と、ひな形を提示する装置とが異なっていてもよい。
In the above embodiment, the case where the model generated in the
なお、上記実施形態では、新聞製作時に利用するひな形の生成、提示において、情報処理装置10が上記処理を実行する場合について説明したが、これに限られるものではない。例えば、雑誌などの書籍の製作時に利用するひな形の生成、提示において、情報処理装置10が上記処理を実行することとしてもよい。
In the above embodiment, the case where the
なお、上記の処理機能は、コンピュータによって実現することができる。その場合、処理装置が有すべき機能の処理内容を記述したプログラムが提供される。そのプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体(ただし、搬送波は除く)に記録しておくことができる。 The above processing function can be realized by a computer. In that case, a program that describes the processing content of the function that the processing device should have is provided. By executing the program on a computer, the above processing function is realized on the computer. The program describing the processing content can be recorded on a computer-readable recording medium (however, the carrier wave is excluded).
プログラムを流通させる場合には、例えば、そのプログラムが記録されたDVD(Digital Versatile Disc)、CD−ROM(Compact Disc Read Only Memory)などの可搬型記録媒体の形態で販売される。また、プログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することもできる。 When a program is distributed, it is sold in the form of a portable recording medium such as a DVD (Digital Versatile Disc) or a CD-ROM (Compact Disc Read Only Memory) on which the program is recorded. It is also possible to store the program in the storage device of the server computer and transfer the program from the server computer to another computer via the network.
プログラムを実行するコンピュータは、例えば、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、自己の記憶装置に格納する。そして、コンピュータは、自己の記憶装置からプログラムを読み取り、プログラムに従った処理を実行する。なお、コンピュータは、可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することもできる。また、コンピュータは、サーバコンピュータからプログラムが転送されるごとに、逐次、受け取ったプログラムに従った処理を実行することもできる。 The computer that executes the program stores, for example, the program recorded on the portable recording medium or the program transferred from the server computer in its own storage device. Then, the computer reads the program from its own storage device and executes the processing according to the program. The computer can also read the program directly from the portable recording medium and execute the processing according to the program. In addition, the computer can sequentially execute processing according to the received program each time the program is transferred from the server computer.
上述した実施形態は本発明の好適な実施の例である。但し、これに限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々変形実施可能である。 The embodiments described above are examples of preferred embodiments of the present invention. However, the present invention is not limited to this, and various modifications can be made without departing from the gist of the present invention.
なお、以上の実施形態の説明に関して、更に以下の付記を開示する。
(付記1) 文字を含む文書情報から、区切り線、前記文字のフォント、フォントサイズ、前記文字の色の1又は複数の組み合わせに基づいて部分領域を特定し、
特定した前記部分領域から文字を除いた形状を抽出する、
処理をコンピュータに実行させることを特徴とする形状抽出プログラム。
(付記2) 特定した前記部分領域に配置された文字に基づいて属性情報を生成し、生成した前記属性情報を抽出した前記形状に対応づけて記憶部に記憶させる、
ことを特徴とする付記1に記載の形状抽出プログラム。
(付記3) 前記部分領域が複数特定され、2つの部分領域のそれぞれに含まれる文字が所定の類似関係を満たす場合に、前記2つの部分領域を同じグループとして記憶部に記憶させる、
ことを特徴とする付記1に記載の形状抽出プログラム。
(付記4) 前記属性情報の生成に用いられる文字は、フォントサイズが所定のサイズより大きい文字、又は、見出し文字、又は、特定の色に対応する文字である、
ことを特徴とする付記2に記載の形状抽出プログラム。
(付記5) 前記文書情報は複数ページの文書情報を含み、特定した前記部分領域が配置されたページに対応するカテゴリ情報、前記部分領域が配置されたページに配置された広告の段数情報、特定した前記部分領域の文字の行数情報の少なくともいずれかが、特定した前記部分領域に対応づけて前記記憶部に記憶される、
ことを特徴とする付記2〜4のいずれかに記載の形状抽出プログラム。
(付記6) 前記文書情報は見開きのページ構成を有し、特定した前記部分領域が配置されたページが見開きの右側か、左側かの別を示す情報を前記部分領域に対応づけて前記記憶部に記憶させる、ことを特徴とする付記2〜5のいずれかに記載の形状抽出プログラム。
(付記7) 前記文書情報の曜日又は日付情報が、前記部分領域に対応づけて前記記憶部に記憶される、ことを特徴とする付記2〜6のいずれかに記載の形状抽出プログラム。
(付記8) 編集対象の文書ページの構成要素として前記記憶部に記憶された情報を選択し、表示することを特徴とする付記2〜7のいずれかに記載の形状抽出プログラム。
(付記9) 区切り線で区切られて配置された文字を含む文書情報から、区切り線で区切られた部分領域を特定し、
特定した前記部分領域のデータと、該部分領域から文字を除いた形状とを記憶部に記憶させる、
処理をコンピュータに実行させることを特徴とする形状抽出プログラム。
(付記10) 編集対象の文書ページの構成要素として前記記憶部に記憶された前記部分領域から文字を除いた形状を表示する際に、前記部分領域のデータも併せて表示させる、
処理をコンピュータに実行させることを特徴とする付記9に記載の形状抽出プログラム。
(付記11) 文字を含む文書情報から、区切り線、前記文字のフォント、フォントサイズ、前記文字の色の1又は複数の組み合わせに基づいて部分領域を特定し、
特定した前記部分領域から文字を除いた形状を抽出する、
処理をコンピュータが実行することを特徴とする形状抽出方法。
(付記12) 区切り線で区切られて配置された文字を含む文書情報から、区切り線で区切られた部分領域を特定し、
特定した前記部分領域のデータと、該部分領域から文字を除いた形状とを記憶部に記憶させる、
処理をコンピュータが実行することを特徴とする形状抽出方法。
(付記13) 文字を含む文書情報から、区切り線、前記文字のフォント、フォントサイズ、前記文字の色の1又は複数の組み合わせに基づいて部分領域を特定する特定部と、
特定した前記部分領域から文字を除いた形状を抽出する抽出部と、
を備える形状抽出装置。
(付記14) 特定した前記部分領域に配置された文字に基づいて属性情報を生成し、生成した前記属性情報を抽出した前記形状に対応づけて記憶部に記憶させる生成部、を備える付記13に記載の形状抽出装置。
(付記15) 前記部分領域が複数特定され、2つの部分領域のそれぞれに含まれる文字が所定の類似関係を満たす場合に、前記2つの部分領域を同じグループとして記憶部に記憶させる生成部、を備える付記13に記載の形状抽出装置。
(付記16) 前記属性情報の生成に用いられる文字は、フォントサイズが所定のサイズより大きい文字、又は、見出し文字、又は、特定の色に対応する文字である、ことを特徴とする付記14に記載の形状抽出装置。
(付記17) 区切り線で区切られて配置された文字を含む文書情報から、区切り線で区切られた部分領域を特定する特定部と、
特定した前記部分領域のデータと、該部分領域から文字を除いた形状とを記憶部に記憶させる記憶制御部と、を備える形状抽出装置。
Regarding the description of the above embodiments, the following additional notes will be further disclosed.
(Appendix 1) From the document information including characters, a partial area is specified based on a dividing line, the font of the characters, the font size, and one or a plurality of combinations of the colors of the characters.
Extract the shape excluding characters from the specified partial area,
A shape extraction program characterized by having a computer execute processing.
(Appendix 2) Attribute information is generated based on the characters arranged in the specified partial area, and the generated attribute information is stored in the storage unit in association with the extracted shape.
The shape extraction program according to
(Appendix 3) When a plurality of the subregions are specified and the characters included in each of the two subregions satisfy a predetermined similarity relationship, the two subregions are stored in the storage unit as the same group.
The shape extraction program according to
(Appendix 4) The characters used to generate the attribute information are characters whose font size is larger than a predetermined size, heading characters, or characters corresponding to a specific color.
The shape extraction program according to
(Appendix 5) The document information includes a plurality of pages of document information, category information corresponding to the page on which the specified partial area is arranged, information on the number of stages of advertisement arranged on the page on which the partial area is arranged, and identification. At least one of the line number information of the characters in the partial area is stored in the storage unit in association with the specified partial area.
The shape extraction program according to any one of
(Appendix 6) The document information has a spread page structure, and the storage unit associates information indicating whether the page on which the specified partial area is arranged is on the right side or the left side of the spread with the partial area. The shape extraction program according to any one of
(Supplementary Note 7) The shape extraction program according to any one of
(Supplementary Note 8) The shape extraction program according to any one of
(Appendix 9) From the document information including the characters separated by the dividing line, the partial area separated by the dividing line is specified.
The data of the specified partial area and the shape obtained by removing the characters from the partial area are stored in the storage unit.
A shape extraction program characterized by having a computer execute processing.
(Appendix 10) When displaying the shape obtained by removing characters from the partial area stored in the storage unit as a component of the document page to be edited, the data of the partial area is also displayed.
The shape extraction program according to
(Appendix 11) From the document information including characters, a partial area is specified based on a dividing line, a font of the characters, a font size, and one or a plurality of combinations of the colors of the characters.
Extract the shape excluding characters from the specified partial area,
A shape extraction method characterized in that processing is performed by a computer.
(Appendix 12) From the document information including the characters separated by the dividing line, the partial area separated by the dividing line is specified.
The data of the specified partial area and the shape obtained by removing the characters from the partial area are stored in the storage unit.
A shape extraction method characterized in that processing is performed by a computer.
(Appendix 13) A specific portion that specifies a partial area based on a dividing line, a font of the character, a font size, and one or a plurality of combinations of the color of the character from document information including characters.
An extraction unit that extracts the shape excluding characters from the specified partial area,
A shape extractor equipped with.
(Appendix 14)
(Appendix 15) When a plurality of the subregions are specified and the characters included in each of the two subregions satisfy a predetermined similarity relationship, the generation unit that stores the two subregions as the same group in the storage unit. The shape extraction device according to
(Supplementary note 16) The character used for generating the attribute information is a character whose font size is larger than a predetermined size, a heading character, or a character corresponding to a specific color. The shape extractor described.
(Appendix 17) From the document information including the characters separated by the dividing line, the specific part that identifies the partial area separated by the dividing line and the specific part.
A shape extraction device including a storage control unit that stores data in the specified partial area and a shape obtained by removing characters from the partial area in a storage unit.
10 情報処理装置(形状抽出装置)
20 ひな形生成部(特定部、抽出部、生成部、記憶制御部)
32 ひな形DB(記憶部)
96 ストレージ(記憶部)
10 Information processing device (shape extraction device)
20 Model generation unit (specific unit, extraction unit, generation unit, memory control unit)
32 Stationery DB (storage unit)
96 storage (storage unit)
Claims (9)
特定した前記部分領域から文字を除いた形状を抽出し、
特定した前記部分領域に配置された文字を形態素解析して抽出した名詞を属性情報とし、該属性情報を抽出した前記形状に対応づけて記憶部に記憶させる、
処理をコンピュータに実行させることを特徴とする形状抽出プログラム。 From the document information including characters, a partial area is specified based on the dividing line, the font of the characters, the font size, and one or more combinations of the colors of the characters.
The shape excluding the characters is extracted from the specified partial area, and the shape is extracted .
The noun extracted by morphological analysis of the characters arranged in the specified partial area is used as attribute information, and the attribute information is stored in the storage unit in association with the extracted shape.
A shape extraction program characterized by having a computer execute processing.
ことを特徴とする請求項1に記載の形状抽出プログラム。 When a plurality of the subregions are specified and the characters included in each of the two subregions satisfy a predetermined similarity relationship, the two subregions are stored in the storage unit as the same group.
The shape extraction program according to claim 1.
ことを特徴とする請求項1に記載の形状抽出プログラム。 The character to be morphologically analyzed is a character whose font size is larger than a predetermined size, a heading character, or a character corresponding to a specific color.
The shape extraction program according to claim 1 .
ことを特徴とする請求項1〜3のいずれか一項に記載の形状抽出プログラム。 The document information includes document information of a plurality of pages, category information corresponding to the page on which the specified partial area is arranged, information on the number of stages of advertisement arranged on the page on which the partial area is arranged, and the specified partial area. At least one of the line number information of the character is stored in the storage unit in association with the specified partial area.
The shape extraction program according to any one of claims 1 to 3 , wherein the shape extraction program is characterized in that.
特定した前記部分領域から文字を除いた形状を抽出し、
特定した前記部分領域に配置された文字を形態素解析して抽出した名詞を属性情報とし、該属性情報を抽出した前記形状に対応づけて記憶部に記憶させる、
処理をコンピュータが実行することを特徴とする形状抽出方法。 From the document information including characters, a partial area is specified based on the dividing line, the font of the characters, the font size, and one or more combinations of the colors of the characters.
The shape excluding the characters is extracted from the specified partial area, and the shape is extracted .
The noun extracted by morphological analysis of the characters arranged in the specified partial area is used as attribute information, and the attribute information is stored in the storage unit in association with the extracted shape.
A shape extraction method characterized in that processing is performed by a computer.
特定した前記部分領域から文字を除いた形状を抽出する抽出部と、
特定した前記部分領域に配置された文字を形態素解析して抽出した名詞を属性情報とし、該属性情報を抽出した前記形状に対応づけて記憶部に記憶させる記憶制御部と、
を備える形状抽出装置。 A specific part that specifies a partial area based on a dividing line, a font of the character, a font size, and one or a plurality of combinations of the color of the character from the document information including the character.
An extraction unit that extracts the shape excluding characters from the specified partial area,
A storage control unit that uses a noun extracted by morphological analysis of characters arranged in the specified partial area as attribute information and stores the attribute information in the storage unit in association with the extracted shape.
A shape extractor equipped with.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016205442A JP6790712B2 (en) | 2016-10-19 | 2016-10-19 | Shape extraction program, shape extraction method and shape extraction device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016205442A JP6790712B2 (en) | 2016-10-19 | 2016-10-19 | Shape extraction program, shape extraction method and shape extraction device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018067153A JP2018067153A (en) | 2018-04-26 |
JP6790712B2 true JP6790712B2 (en) | 2020-11-25 |
Family
ID=62086090
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016205442A Active JP6790712B2 (en) | 2016-10-19 | 2016-10-19 | Shape extraction program, shape extraction method and shape extraction device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6790712B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10771655B2 (en) * | 2018-12-20 | 2020-09-08 | HCL Technologies Italy S.p.A. | System and method for transferring a document |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57199066A (en) * | 1981-06-02 | 1982-12-06 | Toshiyuki Sakai | File forming system for cutting of newspaper and magazine |
JPH08194829A (en) * | 1995-01-20 | 1996-07-30 | Toshiba Corp | Typesetting device |
JP2000251067A (en) * | 1999-02-25 | 2000-09-14 | Sumitomo Metal Ind Ltd | Document analysis method and apparatus, and recording medium |
JP3867482B2 (en) * | 2000-07-25 | 2007-01-10 | 富士通株式会社 | Paper management system |
JP4785655B2 (en) * | 2006-07-11 | 2011-10-05 | キヤノン株式会社 | Document processing apparatus and document processing method |
US8290268B2 (en) * | 2008-08-13 | 2012-10-16 | Google Inc. | Segmenting printed media pages into articles |
-
2016
- 2016-10-19 JP JP2016205442A patent/JP6790712B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018067153A (en) | 2018-04-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107506343B (en) | A kind of processing method and processing device of information editing | |
JP6165913B1 (en) | Information processing apparatus, information processing method, and program | |
CN108959586A (en) | Text vocabulary is identified in response to visual query | |
CN104123269A (en) | Semi-automatic publication generation method and system based on template | |
KR20070090321A (en) | Document information extraction system, its extraction method and recording medium recording the same | |
JP2018120286A (en) | Advertisement creation support program, apparatus, and method | |
KR102206838B1 (en) | System for publishing book by matching images and texts | |
JP6790712B2 (en) | Shape extraction program, shape extraction method and shape extraction device | |
CN104063367A (en) | Annotation search apparatus, method and program | |
JP6072560B2 (en) | Electronic magazine generation system, electronic magazine generation method, and electronic magazine generation program | |
JP7000536B1 (en) | Layout method, program, or information processing system | |
JP7040255B2 (en) | Editing support program, editing support method and editing support device | |
JP6474373B2 (en) | Shape extraction program, shape extraction method, and shape extraction apparatus | |
JP6537484B2 (en) | Editing support program, editing support method and editing support apparatus | |
JP6028905B2 (en) | Form management device, form management method, and form management program | |
JP3115059B2 (en) | Structured document editing method | |
JP6398346B2 (en) | Table generation method, program and apparatus, and form generation method, program and apparatus | |
JP2009098829A (en) | Frame retrieval device for cartoon | |
Fons | The tradition of library catalogs | |
Arnold et al. | Transforming Data Silos into Knowledge: Early Chinese Periodicals Online (ECPO) | |
JP2016103150A (en) | Document processing device and document processing program | |
Hardy | Archives-Based Digital Projects in Early America | |
JP2009157470A (en) | Electronic document processor and program | |
JP2008269085A (en) | Information recommendation device and information recommendation system | |
JP2008269086A (en) | Information recommendation device and information recommendation system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190709 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200710 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200804 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200923 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201006 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201019 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6790712 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |