JP2003132078A - Database construction apparatus, database construction method, database construction program, recording medium - Google Patents
Database construction apparatus, database construction method, database construction program, recording mediumInfo
- Publication number
- JP2003132078A JP2003132078A JP2001328333A JP2001328333A JP2003132078A JP 2003132078 A JP2003132078 A JP 2003132078A JP 2001328333 A JP2001328333 A JP 2001328333A JP 2001328333 A JP2001328333 A JP 2001328333A JP 2003132078 A JP2003132078 A JP 2003132078A
- Authority
- JP
- Japan
- Prior art keywords
- information
- database
- electronic document
- extracted
- regularity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】
【課題】 レイアウト構造ファイルに含まれる各要素を
抽出して、データ構造ファイルを生成してデータベース
を構築することができるデータベース構築装置を提供す
る。
【解決手段】 電子文書を構成する要素が予めレイアウ
トされた電子文書からデータベースを構築するデータベ
ース構築システムであって、電子文書から抽出する要素
を指定するためのルール情報を設定し、電子文書から抽
出される要素にデータベースの項目となる項目情報を設
定し、指定されるルール情報に基づいて、電子文書から
要素を抽出し、抽出した要素を項目情報を対応付けてデ
ータベース情報として出力し、要素名規則性定義手段
は、文字と画像とのうちすくなくともいずれか一方の要
素に対するルール情報を生成する。
(57) [Summary] [PROBLEMS] To provide a database construction device capable of extracting each element included in a layout structure file, generating a data structure file and constructing a database. A database construction system for constructing a database from electronic documents in which elements constituting an electronic document are laid out in advance, wherein rule information for designating elements to be extracted from the electronic document is set and extracted from the electronic document. Element information to be a database item is set for the element to be extracted, the element is extracted from the electronic document based on the specified rule information, the extracted element is output as database information in association with the item information, and the element name The regularity defining means generates rule information for at least one of the character and the image.
Description
【0001】[0001]
【発明の属する技術分野】この発明は、要素間を簡単に
関連づけしてデータベースの構築および更新を行うデー
タベース構築装置、データベース構築方法、データベー
ス構築プログラム、記録媒体に関するものである。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a database construction apparatus, a database construction method, a database construction program, and a recording medium for constructing and updating a database by simply associating elements with each other.
【0002】[0002]
【従来の技術】従来から、カタログ作成依頼者(以下、
依頼者と称する)からカタログを作成依頼された場合
に、印刷業者は、DTP(Desktop Publi
shing)が適用されたシステムを利用して、カタロ
グを作成することが行われている。例えば、カタログに
掲載するための商品の画像や、商品の名称、型式、寸
法、製品紹介文などの文書等の商品情報が商品データベ
ースに予め記憶されている。この商品データベースから
DTP用コンピュータを利用して、商品情報を読み出
し、画像や文書のレイアウトを決め、編集を行い、見本
を印刷する。そして、印刷された見本を依頼者に確認
(レイアウト、誤植の有無等)してもらい、訂正内容が
あれば、見本に訂正内容を記入してもらう。印刷業者
は、見本に記入された訂正内容に応じて、DTP用コン
ピュータによってDTP上のデータを修正する。そし
て、修正後の見本の印刷物を依頼者に再度確認してもら
い、変更がなければ、印刷し、カタログを作成する。2. Description of the Related Art Conventionally, a catalog creation requester (hereinafter,
When a catalog creation request is made by the requester), the printer trades the DTP (Desktop Public).
A catalog is created using a system to which “shing” is applied. For example, product information such as images of products to be published in a catalog and documents such as product names, models, dimensions, product introductions, etc. are stored in advance in the product database. Using the DTP computer, the product information is read out from this product database, the layout of images and documents is determined, edited, and the sample is printed. Then, the client confirms the printed sample (layout, presence of typographical errors, etc.), and if there is correction content, has the correction content written on the sample. The printer trades the data on the DTP with the DTP computer according to the correction content entered in the sample. Then, the client confirms the corrected printed matter again, and if there is no change, prints it and creates a catalog.
【0003】一方、上述した商品データベースは、次回
のカタログ制作時においては、新製品などの情報が追加
され、引き続き利用される。従って、依頼者によって見
本に記入された訂正内容に応じて、印刷業者は、DTP
用コンピュータによってDTP上のデータが修正された
場合、この修正内容を商品データベースに反映させ、商
品データベースを更新する必要があるが、この商品デー
タベースの更新作業は、印刷業者が見本に記入された訂
正内容に基づいて、商品データベース用のコンピュータ
から商品データベースの更新作業を行っていた。On the other hand, the product database described above is added with information such as new products at the time of the next catalog production, and is continuously used. Therefore, depending on the correction content entered in the sample by the client, the printer trades the DTP.
If the data on the DTP is modified by the computer, the modification contents need to be reflected in the product database and the product database needs to be updated. The product database was updated from the product database computer based on the contents.
【0004】[0004]
【発明が解決しようとする課題】上述したように、見本
に記入された訂正内容を反映させる場合、DTP上のデ
ータの修正作業を行った後に、商品データベースに対し
ても修正作業を行う場合、データの修正作業を2重に行
う必要があり、印刷業者にとって大きな負担であるとと
もに、更新作業に多大な時間がかかってしまっていた。
そこで、更新されたDTP上のデータから商品データベ
ースを構築する場合、商品カタログには、多種の商品が
存在するため、商品毎に、商品の画像、名称、型式、寸
法などの要素を1つの商品情報としてリンクさせて、デ
ータベースを構築し、管理することが望ましいが、DT
P上のデータにおいては、これらの情報間においては、
リンク付けがされていないため、画像、名称、形式、寸
法などの要素を関連づけする必要がある。As described above, when the correction contents entered in the sample are reflected, when the correction work is also performed on the product database after the correction work of the data on the DTP, Since it is necessary to do the data correction work in duplicate, it is a great burden for the printing company, and the updating work also takes a lot of time.
Therefore, when a product database is constructed from updated DTP data, since there are various products in the product catalog, each product has one element such as a product image, name, model, and size. It is desirable to build a database and manage it by linking it as information, but DT
In the data on P, between these information,
Since there is no link, it is necessary to associate elements such as images, names, formats, and dimensions.
【0005】しかしながら、従来技術によれば、印刷業
者は、依頼者によって記入された見本の訂正内容に基づ
いて、DTP上のデータの更新作業を行うとともに、商
品データベースの更新作業を行うすなわち、二重に入力
作業を行う必要があり、これらの更新作業は、印刷業者
にとって大きな負担であるとともに、更新作業に多大な
時間がかかってしまっていた。また、商品データベース
に対しても、DTP上のデータの更新と同じ更新内容を
反映させる必要があるが、作業者のミスなどにより、商
品データベースに確実な更新作業を行うことができない
場合もあった。However, according to the conventional technique, the printer trades the data on the DTP and the product database based on the correction contents of the sample entered by the client. Since it is necessary to do input work twice, the update work is a heavy burden on the printing company, and the update work takes a lot of time. Also, it is necessary to reflect the same update content as the update of the data on the DTP to the product database, but there are cases where the product database cannot be reliably updated due to a mistake made by an operator. .
【0006】本発明は、このような事情に鑑みてなされ
たもので、その目的は、レイアウト構造ファイルに含ま
れる各要素を抽出して、データ構造ファイルを生成して
データベースを構築することができるデータベース構築
装置、データベース構築方法、データベース構築プログ
ラム、記録媒体を提供することにある。The present invention has been made in view of such circumstances, and an object thereof is to extract each element included in a layout structure file and generate a data structure file to construct a database. A database construction apparatus, a database construction method, a database construction program, and a recording medium are provided.
【0007】[0007]
【課題を解決するための手段】上記目的を達成するため
に、本発明は、電子文書を構成する要素が予めレイアウ
トされた電子文書からデータベースを構築するデータベ
ース構築システムであって、前記電子文書から抽出する
要素を指定するためのルール情報を設定する要素名規則
性定義手段と、前記電子文書から抽出される要素にデー
タベースの項目となる項目情報を設定する要素名規則性
特定手段と、前記要素名規則性定義手段によって指定さ
れるルール情報に基づいて、前記電子文書から要素を抽
出し、抽出した要素を前記要素名規則性特定手段によっ
て設定される項目情報を対応付けてデータベース情報と
して出力する構成要素抽出手段とを有し、前記要素名規
則性定義手段は、文字と画像とのうちすくなくともいず
れか一方の要素に対するルール情報を生成することを特
徴とする。In order to achieve the above object, the present invention is a database construction system for constructing a database from an electronic document in which elements constituting the electronic document are laid out in advance, and An element name regularity defining means for setting rule information for designating an element to be extracted, an element name regularity specifying means for setting item information to be an item of a database in the element extracted from the electronic document, and the element An element is extracted from the electronic document based on the rule information specified by the name regularity defining means, and the extracted element is associated with the item information set by the element name regularity specifying means and output as database information. The element name regularity defining means has a constituent element extracting means, and the element name regularity defining means is provided for at least one of the character and the image. And generating a rule information.
【0008】また、本発明は、上述のデータベース構築
装置において、前記要素名規則性定義手段によって設定
される文字に対するルール情報は、文字の書体名、サイ
ズ、色、変形、字送りのうち少なくとも1つの条件を含
む文字体裁に関する条件と、行頭と行末とのうち一方又
は両方を含む文字が配置された文字位置に関する条件
と、前後の文字または他の要素との関係を指定する関係
前後関係に関する条件と、内部に含まれる文字列を指定
する条件である包含文字に関する条件と、のうち、少な
くともいずれか1つの条件を含むことを特徴とする。According to the present invention, in the above-mentioned database construction apparatus, the rule information for the character set by the element name regularity defining means is at least one of a font face name, size, color, transformation, and character feed. Conditions related to typography including one condition, conditions related to the character position where the character including one or both of the beginning and end of the line is placed, and a relationship specifying the relationship between the preceding and succeeding characters or other elements. And a condition regarding an included character that is a condition for designating a character string contained therein, at least one condition is included.
【0009】また、本発明は、上述のデータベース構築
装置において、前記要素名規則性定義手段によって設定
される画像に対するルール情報は、ファイル名とファイ
ル種別との一方または両方の条件を含むファイル情報に
関する条件と、画像の大きさと解像度との一方または両
方の条件を含む画像属性に関する条件と、画像の回転と
倍率との一方または両方の条件を含むレイアウト属性に
関する条件と、のうち少なくとも1つの条件を含むこと
を特徴とする。Further, according to the present invention, in the above-mentioned database construction apparatus, the rule information for the image set by the element name regularity defining means relates to file information including one or both conditions of a file name and a file type. At least one of a condition, a condition regarding an image attribute including one or both of a size and a resolution of an image, and a condition regarding a layout attribute including one or both of a rotation and a magnification of an image is set. It is characterized by including.
【0010】また、本発明は、上述のデータベース構築
装置において、前記要素名規則性定義手段によって設定
される文字と画像とに対する共通の条件として、レイア
ウト領域の大きさと枠線との一方または両方を含むレイ
アウト領域に関する条件を含むことを特徴とする。Further, according to the present invention, in the above-mentioned database construction apparatus, one or both of the size of the layout area and the frame line is set as a common condition for the character and the image set by the element name regularity defining means. It is characterized in that it includes a condition regarding a layout area that includes it.
【0011】また、本発明は、上述のデータベース構築
装置において、前記各要素間を1つのグループとして関
連付けするリンク情報を生成する要素関係特定手段を有
し、前記構成要素抽出手段は、前記要素関係特定手段に
よって生成されたリンク情報に基づいて前記電子文書か
ら抽出される要素を関連付けるとともに、前記項目情報
を対応付けてデータベース情報として出力することを特
徴とする。Further, the present invention is, in the above-mentioned database construction apparatus, provided with an element relationship specifying means for generating link information for associating the respective elements as one group, and the constituent element extracting means is provided for the element relationship. It is characterized in that elements extracted from the electronic document are associated with each other on the basis of the link information generated by the specifying means, and the item information is associated and output as database information.
【0012】また、本発明は、前記電子文書は、商品の
カタログに関する情報を含むことを特徴とする。Further, the present invention is characterized in that the electronic document includes information about a catalog of products.
【0013】また、本発明は、電子文書を構成する要素
が予めレイアウトされた電子文書からデータベースを構
築するデータベース構築方法であって、前記電子文書か
ら抽出する要素を指定するためのルール情報として、文
字と画像とのうちすくなくともいずれか一方の要素に対
するルール情報を設定し、前記電子文書から抽出される
要素にデータベースの項目となる項目情報を設定し、前
記要素名規則性定義手段によって指定されるルール情報
に基づいて、前記電子文書から要素を抽出し、抽出した
要素を前記要素名規則性特定手段によって設定される項
目情報を対応付けてデータベース情報として出力するこ
とを特徴とする。Further, the present invention is a database construction method for constructing a database from an electronic document in which elements constituting an electronic document are laid out in advance, and as rule information for designating an element to be extracted from the electronic document, Rule information for at least one of characters and images is set, item information to be an item of a database is set for an element extracted from the electronic document, and the element name regularity definition means specifies the element information. Elements are extracted from the electronic document based on the rule information, and the extracted elements are associated with item information set by the element name regularity specifying means and output as database information.
【0014】また、本発明は、電子文書を構成する要素
が予めレイアウトされた電子文書からデータベースを構
築するデータベース構築プログラムであって、前記電子
文書から抽出する要素を指定するためのルール情報とし
て、文字と画像とのうちすくなくともいずれか一方の要
素に対するルール情報を設定するステップと、前記電子
文書から抽出される要素にデータベースの項目となる項
目情報を設定するステップと、前記要素名規則性定義手
段によって指定されるルール情報に基づいて、前記電子
文書から要素を抽出し、抽出した要素を前記要素名規則
性特定手段によって設定される項目情報を対応付けてデ
ータベース情報として出力するステップとをコンピュー
タに実行させることを特徴とする。Further, the present invention is a database construction program for constructing a database from an electronic document in which elements constituting an electronic document are laid out in advance, and as rule information for designating an element to be extracted from the electronic document, A step of setting rule information for at least one of a character and an image, a step of setting item information to be an item of a database in an element extracted from the electronic document, the element name regularity defining means A step of extracting an element from the electronic document based on the rule information specified by, and outputting the extracted element as database information in association with item information set by the element name regularity specifying means. It is characterized by being executed.
【0015】また、本発明は、電子文書を構成する要素
が予めレイアウトされた電子文書からデータベースを構
築するデータベース構築プログラムを記録したコンピュ
ータ読み取り可能な記録媒体であって、前記電子文書か
ら抽出する要素を指定するためのルール情報として、文
字と画像とのうちすくなくともいずれか一方の要素に対
するルール情報を設定するステップと、前記電子文書か
ら抽出される要素にデータベースの項目となる項目情報
を設定するステップと、前記要素名規則性定義手段によ
って指定されるルール情報に基づいて、前記電子文書か
ら要素を抽出し、抽出した要素を前記要素名規則性特定
手段によって設定される項目情報を対応付けてデータベ
ース情報として出力するステップとをコンピュータに実
行させるデータベース構築プログラムを記録したことを
特徴とする。Further, the present invention is a computer-readable recording medium recording a database construction program for constructing a database from an electronic document in which the elements constituting the electronic document are laid out in advance, and the element extracted from the electronic document. As rule information for specifying, a step of setting rule information for at least one of a character and an image, and a step of setting item information to be an item of a database in an element extracted from the electronic document And an element based on the rule information designated by the element name regularity defining means, the element is extracted from the electronic document, and the extracted element is associated with item information set by the element name regularity specifying means The step of outputting as information and the database that causes the computer to execute Characterized in that it was recorded to build the program.
【0016】[0016]
【発明の実施の形態】以下、本発明の一実施形態による
データベース構築装置を図面を参照して説明する。この
実施形態においては、図2に示すような商品カタログの
レイアウト構造ファイルである電子文書からデータ構造
ファイルを生成し、データベースを構築する場合につい
て説明する。ここでいうデータ構造ファイルとは、要素
に意味を持たせ、その意味を指定し、表現することが可
能なデータを記憶するファイルであり、例えば、DB、
XML(eXtensible Markup Lan
guage)等がある。レイアウト構造ファイルとは、
要素を表現する位置(レイアウト)を指定し表現するこ
とができるデータを記憶するためのファイルであり、例
えば、DTPデータ、HTML(HyperText
Markup Language)等がある。図1は、
この発明の一実施形態によるデータベース構築装置の構
成を示す概略ブロック図である。この図において、電子
文書変換部1は、外部の装置から出力される電子ファイ
ルをデータベース構築装置において処理可能なファイル
形式のデータに変換し、変換されたデータを変換データ
分析部2に出力する。例えば、電子文書変換部1は、外
部から送信されるDTPドキュメントデータを中間ファ
イルに変換する。BEST MODE FOR CARRYING OUT THE INVENTION A database construction apparatus according to an embodiment of the present invention will be described below with reference to the drawings. In this embodiment, a case where a data structure file is generated from an electronic document which is a layout structure file of a product catalog as shown in FIG. 2 and a database is constructed will be described. The data structure file here is a file that stores data that can be expressed by designating the meaning of an element, for example, DB,
XML (eXtensible Markup Lan)
guage) and the like. What is a layout structure file?
This is a file for storing data that can specify and express the position (layout) for expressing the element, and is, for example, DTP data, HTML (HyperText).
Markup Language) and the like. Figure 1
It is a schematic block diagram which shows the structure of the database construction | assembly apparatus by one Embodiment of this invention. In this figure, an electronic document conversion unit 1 converts an electronic file output from an external device into data in a file format that can be processed by a database construction device, and outputs the converted data to a converted data analysis unit 2. For example, the electronic document conversion unit 1 converts DTP document data transmitted from the outside into an intermediate file.
【0017】ここで、中間ファイルとは、レイアウト構
造ファイルであり、文字や画像、図形などが紙や画面に
出力される際の体裁情報をもつ、印刷用データ、ワープ
ロデータ、マークアップ言語データ(HTML(Hyp
ertext MarkupLanguage)、XM
L(Extensible Markup Langu
age)、SGML(Standard Genera
lized Markup Language))等の
形式のデータである。Here, the intermediate file is a layout structure file, and has print data, word processing data, markup language data (format data having format information when characters, images, figures, etc. are output on paper or a screen. HTML (Hyp
ertext MarkupLanguage), XM
L (Extensible Markup Langu
age), SGML (Standard Genera)
It is data in a format such as a rised markup language)).
【0018】変換データ分析部2は、電子文書変換部1
から出力される中間ファイルに基づく画像を変換データ
表示部4の画面上に出力する。この変換データ表示部4
の画面上には、例えば、図2に示すような書類をまとめ
る事務用ファイルのカタログに関する情報が表示され
る。また、変換データ分析部2は、電子文書変換部1か
ら出力される中間ファイルと要素名規則性定義部3から
出力されるルール情報とを構成要素抽出部7に出力す
る。The conversion data analysis unit 2 is an electronic document conversion unit 1.
The image based on the intermediate file output from is output on the screen of the conversion data display unit 4. This converted data display section 4
On the screen of, for example, information on a catalog of office files for organizing documents as shown in FIG. 2 is displayed. The conversion data analysis unit 2 also outputs the intermediate file output from the electronic document conversion unit 1 and the rule information output from the element name regularity definition unit 3 to the component extraction unit 7.
【0019】要素名規則性定義部3は、電子文書から抽
出する要素を指定するためのルール情報を設定する。こ
のルール情報の一例を図3に示す。この図に示すよう
に、ルール情報のうち、文字に対するルール情報は、例
えば、文字の書体名、サイズ、色、変形、字送りのうち
少なくとも1つの条件を含む文字体裁に関する条件と、
行頭と行末とのうち一方又は両方を含む文字が配置され
た文字位置に関する条件と、前後の文字または他の要素
との関係を指定する関係前後関係に関する条件と、内部
に含まれる文字列を指定する条件である包含文字に関す
る条件と、のうち、少なくともいずれか1つの条件を含
む。また、抽出する対象が文字である場合、画像に対す
るルール情報は、ファイル名とファイル種別との一方ま
たは両方の条件を含むファイル情報に関する条件と、画
像の大きさと解像度との一方または両方の条件を含む画
像属性に関する条件と、画像の回転と倍率との一方また
は両方の条件を含むレイアウト属性に関する条件と、の
うち少なくとも1つの条件を含む。また、文字と画像と
に対する共通の条件となるルール情報は、レイアウト領
域の大きさと枠線との一方または両方を含むレイアウト
領域に関する条件を含む。また、要素名規則性定義部3
は、ルール情報を予め記憶するルールデータベースを有
し、必要に応じて、ルールデータベースからルール情報
を読み出す。The element name regularity definition unit 3 sets rule information for designating elements to be extracted from the electronic document. An example of this rule information is shown in FIG. As shown in this figure, of the rule information, the rule information for a character is, for example, a typographic condition including at least one condition of a typeface name, size, color, transformation, and character sending of the character,
Specify the condition regarding the character position where the character including one or both of the beginning of the line and the end of the line is specified, the condition regarding the relationship before and after the character or other element, and the condition related to the context, and the character string contained inside At least one of the conditions regarding the included character that is the condition to be performed is included. In addition, when the target to be extracted is a character, the rule information for the image includes a condition regarding the file information including one or both of the file name and the file type, and one or both of the image size and the resolution. At least one of the condition regarding the included image attribute and the condition regarding the layout attribute including one or both of the rotation and the magnification of the image is included. The rule information, which is a common condition for characters and images, includes a condition for the layout area including one or both of the size of the layout area and the frame line. Also, the element name regularity definition unit 3
Has a rule database that stores rule information in advance, and reads the rule information from the rule database as necessary.
【0020】また、ここでいう要素とは、ヘッダーやフ
ッター、見出しや本文、挿絵など文書を構成している内
容となる情報であり、商品カタログの場合は、商品の品
番や価格などの商品スペックの他、写真や図形、ロゴマ
ークなどが該当する。なお、このルール情報は、データ
ベース構築装置の外部に接続されるキーボードやマウス
等の入力デバイスから、作業者によって入力される。The elements referred to here are information that constitutes the contents of the document such as headers and footers, headings and texts, and illustrations. In the case of a product catalog, product specifications such as product number and price. Besides, photos, figures, logo marks, etc. are applicable. The rule information is input by an operator from an input device such as a keyboard or a mouse connected to the outside of the database construction device.
【0021】変換データ表示部4は、表示装置であり、
例えば、CRT(CathodeRay Tube)や
液晶表示装置等が用いられる。The converted data display unit 4 is a display device,
For example, a CRT (CathodeRay Tube), a liquid crystal display device, or the like is used.
【0022】要素関係特定部5は、入力デバイスを介し
て入力される作業者からの指示に基づいて、各要素間を
1つのグループとして関連付けするリンク情報を生成す
る。このリンク情報とは、例えば、図4の符号(a)、
符号(b)、符号(c)、符号(d)に示す各レイアウ
ト領域内の文字や画像の情報が1つの商品について説明
するためのデータであることの関連づけを行う情報であ
る。これにより、画像や文字がどの商品であるかが商品
毎に関連づけされる。なお、ここでいうレイアウト領域
とは、1つの画像または1つの文字列などが設定される
領域である。The element relation specifying unit 5 generates link information for associating each element as one group based on the instruction from the operator input through the input device. The link information is, for example, the code (a) in FIG.
This is information for associating that the information of the characters and images in each layout area shown by the reference numerals (b), (c), and (d) is data for explaining one product. As a result, which product the image or the character belongs to is associated with each product. The layout area here is an area in which one image or one character string is set.
【0023】要素名規則性特定部6は、電子文書から抽
出される文字や画像などの要素にデータベースの項目と
なる項目情報を設定する。この項目には、例えば、「品
番」、「型式」、「寸法」、「価格」等がある。The element name regularity specifying unit 6 sets item information, which is an item of a database, in elements such as characters and images extracted from an electronic document. This item includes, for example, "product number", "model", "dimension", "price", and the like.
【0024】構成要素抽出部7は、要素名規則性定義部
3によって指定されるルール情報に基づいて、電子文書
から要素を抽出し、抽出した要素を要素名規則性特定部
6によって設定される項目情報を対応付けてデータベー
ス情報として構成要素出力部8に出力する。また、構成
要素抽出部7は、要素関係特定部5によって生成された
リンク情報に基づいて、電子文書から抽出される要素を
関連付けるとともに、項目情報を対応付けてデータベー
ス情報として出力する。The constituent element extracting section 7 extracts elements from the electronic document based on the rule information designated by the element name regularity defining section 3, and sets the extracted elements by the element name regularity specifying section 6. Corresponding item information is output to the component output unit 8 as database information. Further, the constituent element extracting unit 7 associates the elements extracted from the electronic document based on the link information generated by the element relationship identifying unit 5, and associates the item information with each other and outputs it as database information.
【0025】構成要素出力部8は、表示装置であり、構
成要素抽出部7から出力されるデータベース情報を画面
上に出力する。構成要素出力部8は、変換データ表示部
4と共通の表示装置を利用するようにしてもよい。ま
た、構成要素出力部8は、データ出力装置であってもよ
い。The component output unit 8 is a display device and outputs the database information output from the component extraction unit 7 on the screen. The component output unit 8 may use the same display device as the conversion data display unit 4. Further, the component output unit 8 may be a data output device.
【0026】次に、図1に示すデータベース構築装置の
動作について図5から図8のフローチャートを用いて説
明する。まず、図5において、外部からDTPデータの
電子文書が入力されると(ステップA1)、電子文書変
換部1は、入力された電子文書を中間ファイルに変換し
(ステップA2)、変換後の中間ファイルを変換データ
分析部2に出力する(ステップA3)。Next, the operation of the database construction apparatus shown in FIG. 1 will be described with reference to the flowcharts of FIGS. First, in FIG. 5, when an electronic document of DTP data is input from the outside (step A1), the electronic document conversion unit 1 converts the input electronic document into an intermediate file (step A2), and the intermediate after conversion is converted. The file is output to the converted data analysis unit 2 (step A3).
【0027】次に、図6において、変換されたデータで
ある中間ファイルが入力されると(ステップB1)、デ
ータベース構築装置は、構成要素の特定を行い(ステッ
プB2)、特定された構成要素の抽出を行い(ステップ
B3)、抽出された構成要素をデータベース情報として
構成要素出力部8から出力する(ステップB4)。Next, in FIG. 6, when the intermediate file which is the converted data is input (step B1), the database construction device identifies the component (step B2), and the identified component is identified. Extraction is performed (step B3), and the extracted component is output as database information from the component output unit 8 (step B4).
【0028】次に、図7を用いて、図6におけるステッ
プB2の構成要素の特定処理について説明する。変換デ
ータ分析部2は、電子文書変換部1から出力された中間
ファイルを変換データ表示部4に出力し、画面上に表示
させる(ステップB21)。このとき、変換データ表示
部4の画面上には、例えば、図2のような表示がなされ
る。Next, with reference to FIG. 7, the process of identifying the constituent elements in step B2 in FIG. 6 will be described. The conversion data analysis unit 2 outputs the intermediate file output from the electronic document conversion unit 1 to the conversion data display unit 4 and displays it on the screen (step B21). At this time, for example, a display as shown in FIG. 2 is displayed on the screen of the conversion data display unit 4.
【0029】次に、要素名規則性定義部3は、作業者か
ら入力デバイスを介して、ルール情報が入力されると、
入力されたルール情報を設定する。次に、要素関係特定
部5は、作業者から入力デバイスを介して各レイアウト
領域間の構成要素が選択され、要素関係の関連付けが指
示されると、選択された構成要素間の関連付けを行う
(ステップB23)。そして、要素名規則性特定部6
は、作業者から入力デバイスを介して各レイアウト領域
対して要素名が指定されると、指定された要素名が、各
レイアウト領域にデータベース情報の項目として設定す
るとともに、作業者から入力デバイスを介して入力され
る指示に基づいて、要素名規則性定義部3から入力され
たルール情報と項目の対応付けを行う(ステップB2
4)。この設定は、すべてのレイアウト領域に対して行
われると、終了する(ステップB25)。Next, the element name regularity definition unit 3 receives the rule information from the operator via the input device,
Set the entered rule information. Next, when the operator selects a constituent element between the layout areas via the input device and is instructed to associate the element relationship, the element relationship identifying unit 5 associates the selected constituent elements ( Step B23). Then, the element name regularity specifying unit 6
When the operator specifies an element name for each layout area via the input device, the specified element name is set as a database information item in each layout area, and the operator also inputs it through the input device. The rule information input from the element name regularity definition unit 3 and the item are associated with each other based on the instruction input in step B2.
4). When this setting is performed for all the layout areas, it ends (step B25).
【0030】次に、図8を用いて図7のステップB24
について説明する。要素関係特定部5は、作業者から入
力デバイスを介して、各レイアウト領域に対して要素名
が定義されると(ステップB241)、要素名規則性定
義情報3から入力されたルール情報と項目の対応付けを
行う。ここでは、構成要素名の定義対象が画像である場
合(ステップB242)、画像情報を特定するルール情
報が定義され(ステップB243)、定義対象が文字で
ある場合、(ステップB242)、文字情報を特定する
ルール情報が定義される(ステップB244)。そし
て、抽出する対象のデータのルール情報が商品の画像、
型式、寸法などの項目に対してすべて設定されると、構
成要素名の定義が終了する(ステップB245)。Next, referring to FIG. 8, step B24 in FIG.
Will be described. When the operator defines an element name for each layout area via the input device (step B241), the element relationship specifying unit 5 determines whether the rule information and the items input from the element name regularity definition information 3 are input. Correspond. Here, when the definition target of the component name is an image (step B242), rule information for specifying the image information is defined (step B243), and when the definition target is a character (step B242), the character information is changed. Rule information to be specified is defined (step B244). Then, the rule information of the data to be extracted is the image of the product,
When all the items such as the model and dimensions have been set, the definition of the component name ends (step B245).
【0031】そして、構成要素抽出部7は、変換データ
分析部2から出力される中間ファイル内のデータから、
要素関係特定部5からの指示に基づいて各レイアウト領
域間の関連づけを行い、関連づけされた各レイアウト領
域内のデータに対し、要素名規則性特定部6によって指
定される要素名(項目)を設定し、要素名規則性定義部
3によって設定されたルール情報に対応するデータをレ
イアウト領域内から抽出し、抽出されたデータを要素関
係と要素名規則性に対応づけて、データベース情報とし
て構成要素出力部8に出力する。Then, the component extraction unit 7 extracts the data in the intermediate file output from the conversion data analysis unit 2 from
The layout areas are associated with each other based on the instruction from the element relationship identification unit 5, and the element name (item) specified by the element name regularity identification unit 6 is set for the data in each associated layout area. Then, the data corresponding to the rule information set by the element name regularity definition unit 3 is extracted from the layout area, the extracted data is associated with the element relationship and the element name regularity, and the component information is output as database information. Output to the unit 8.
【0032】以上説明した実施形態において、図5のス
テップA3において変換データ出力装置4の画面上に
は、例えば、図2に示すような商品カタログに関する情
報が出力される。また、この商品カタログを構成する各
要素をレイアウト領域として表示させる場合は、図9に
示すように、各レイアウト領域が、矩形によって表示さ
れる。In the embodiment described above, in step A3 of FIG. 5, the information about the product catalog as shown in FIG. 2 is output on the screen of the conversion data output device 4, for example. Further, when each element constituting the product catalog is displayed as a layout area, each layout area is displayed by a rectangle as shown in FIG.
【0033】次に、要素関係特定部5において、図7ス
テップB23の構成要素関係特定処理により、各要素間
の関連付けが行われると、例えば、図10符号(e)に
示すように、関連付けされた各レイアウト領域が強調さ
れて表示される。ここでは、1つのグループを説明する
ための画像と文字の情報が関連付けされている場合につ
いて図示されている。Next, in the element relationship specifying unit 5, when the elements are related by the constituent relationship specifying process of step B23 in FIG. 7, the elements are related as shown by reference numeral (e) in FIG. Each layout area is highlighted and displayed. Here, the case where an image for explaining one group and character information are associated with each other is illustrated.
【0034】次に、要素名規則性特定部6において、図
7ステップB24の要素名規則性特定処理により、要素
名に対して項目が設定されると、例えば、図10符号
(f)に示すように、項目名として設定され、表示され
る。また、要素名規則性定義部3において、定義された
ルール情報は、例えば、図10符号(g)に示すよう
に、抽出する対象の文字のフォント、カラー、文字飾り
などについて表示される。さらに、図8のステップB2
41からステップB245によって構成要素名とルール
情報の対応付けが行われると、例えば、図10符号
(f)に示す項目に対して図10符号(h)に示すよう
な設定がなされる。Next, in the element name regularity specifying unit 6, when an item is set for the element name by the element name regularity specifying process of step B24 in FIG. 7, it is shown in FIG. Is set and displayed as the item name. The rule information defined by the element name regularity definition unit 3 is displayed for the font, color, character decoration, etc. of the character to be extracted, as shown in FIG. 10 (g). Further, step B2 in FIG.
When the component element name and the rule information are associated with each other in Steps B41 to B245, for example, the items shown in the symbol (f) of FIG. 10 are set as shown in the symbol (h) of FIG.
【0035】図11は、構成要素抽出部7によって抽出
されたデータがデータベース化された一例を示す図面で
ある。構成要素抽出部7によって抽出されたデータは、
関連づけされた各要素から抽出されたデータが1つの商
品データとして符号(i)に示すように記憶される。ま
た、符号(i)に示す商品データの各要素は、要素名規
則性特定部6によって定義された項目名が設定され、デ
ータベースの対応する項目の欄に記憶される。以上のよ
うにして、商品カタログなどのレイアウト構造ファイル
からデータ構造ファイルを生成し、データベースを構築
することができる。なお、レイアウト領域内の要素が画
像である場合、データベースには、画像のファイル名が
記憶される。FIG. 11 is a diagram showing an example in which the data extracted by the component extraction unit 7 is made into a database. The data extracted by the component extraction unit 7 is
The data extracted from each associated element is stored as one item of data as indicated by reference numeral (i). Further, the item name defined by the element name regularity specifying unit 6 is set for each element of the product data indicated by the reference numeral (i), and the item name is stored in the corresponding item column of the database. As described above, the data structure file can be generated from the layout structure file such as the product catalog and the database can be constructed. When the element in the layout area is an image, the file name of the image is stored in the database.
【0036】次に、第2の実施形態について説明する。
ここでは、要素関係特定部5が行う各要素間の関連づけ
についての他の実施形態について説明する。この実施形
態において、要素関係特定部5は、基準となるレイアウ
ト領域である基準レイアウト領域と、基準レイアウト領
域に対して相対位置条件に該当するレイアウト領域とを
関連づけを行う相対位置関連づけ機能を有する。相対位
置条件は、上述した入力デバイスから、作業者によって
入力される。また、この相対位置条件とは、基準レイア
ウト領域と関連づけする対象となるレイアウト領域との
位置関係を指定するための条件であり、例えば、基準と
なるレイアウト領域の矩形の四隅の座標からリンクさせ
る対象となるレイアウト領域の四隅の座標までの距離及
び方向を指定する情報である。Next, a second embodiment will be described.
Here, another embodiment of the association between the elements performed by the element relationship identifying unit 5 will be described. In this embodiment, the element relationship specifying unit 5 has a relative position associating function for associating a reference layout region, which is a reference layout region, and a layout region corresponding to a relative position condition with respect to the reference layout region. The relative position condition is input by the operator from the input device described above. Further, the relative position condition is a condition for specifying the positional relationship with the layout area that is the target to be associated with the reference layout area, and for example, the target to be linked from the coordinates of the four corners of the rectangle of the reference layout area. It is information that specifies the distances and directions to the coordinates of the four corners of the layout area.
【0037】次に、この実施形態において、要素関係特
定部5が相対位置に基づいて各要素間の関連づけを行う
動作について説明する。まず、作業者は、関連づけを行
う基準となるレイアウト領域である基準レイアウト領域
を指定し、さらに、この基準レイアウト領域に対する相
対位置条件を入力デバイスを介して要素関係特定部5に
設定する。要素関係特定部5は、設定された基準レイア
ウト領域に対して相対位置条件に該当するレイアウト領
域を検索し、該当するレイアウト領域が検出された場合
に、検出されたレイアウト領域と基準レイアウト領域と
を関連づけする。Next, in this embodiment, the operation of the element relation specifying unit 5 for associating each element based on the relative position will be described. First, the operator designates a reference layout area, which is a layout area that serves as a reference for associating, and further sets a relative position condition with respect to the reference layout area in the element relationship specifying unit 5 via an input device. The element relationship specifying unit 5 searches for a layout area corresponding to the relative position condition with respect to the set reference layout area, and when the corresponding layout area is detected, determines the detected layout area and the reference layout area. Relate.
【0038】次に、第3の実施形態について説明する。
図12は、第3の実施形態における要素関係特定部5の
構成を示す概略ブロック図である。この図において、相
対位置情報生成部51は、基準レイアウト領域を決定
し、この基準レイアウト領域に対して他のレイアウト領
域までの相対位置に関する情報である相対位置情報を基
準レイアウト領域以外の各レイアウト領域に対して生成
する。Next, a third embodiment will be described.
FIG. 12 is a schematic block diagram showing the configuration of the element relationship identifying unit 5 in the third embodiment. In this figure, the relative position information generation unit 51 determines a reference layout area, and outputs relative position information, which is information regarding the relative position of this reference layout area to another layout area, to each layout area other than the reference layout area. Generate against.
【0039】検出部52は、生成された相対位置情報に
該当するレイアウト領域が他のレイアウト領域を基準に
した場合においても存在するか否かを検出する。リンク
設定部53は、検出部52によって他のレイアウト領域
を基準にした場合においても相対位置情報に該当するレ
イアウト領域があることが検出された場合に、基準とさ
れたレイアウト領域と相対位置情報に該当するレイアウ
ト領域との関連づけを行う。The detecting section 52 detects whether or not the layout area corresponding to the generated relative position information exists even when another layout area is used as a reference. When the detection unit 52 detects that there is a layout area corresponding to the relative position information even when the other layout areas are used as the reference, the link setting unit 53 determines the reference layout area and the relative position information. Associate with the corresponding layout area.
【0040】次に、この実施形態における要素関係特定
部5の動作について説明する。ここでは、図13に示す
ような9種類の照明器具が掲載された商品カタログにお
いて、商品毎に要素を関連付けする場合について説明す
る。関連付け処理の開始が上述の入力デバイスから指示
されると、要素関係特定部5の相対位置情報生成部51
は、符号(j)に示すレイアウト領域を基準レイアウト
領域として決定し、この符号(j)の基準レイアウト領
域から他のレイアウト領域までの相対位置情報を、基準
レイアウト領域以外の各レイアウト領域に対して生成す
る。この相対位置情報の生成は、例えば、符号(k)、
符号(l)、符号(m)、符号(p)、符号(r)、…
等の基準レイアウト以外のレイアウト領域すべてを対象
に総当りで行われる。そして、相対位置情報生成部51
は、生成した相対位置情報を一時保持する。Next, the operation of the element relationship specifying unit 5 in this embodiment will be described. Here, a case will be described in which an element is associated with each product in a product catalog in which nine types of lighting fixtures as shown in FIG. 13 are posted. When the start of the association process is instructed from the above-mentioned input device, the relative position information generation unit 51 of the element relationship identification unit 5
Determines the layout area indicated by the reference numeral (j) as the reference layout area, and outputs relative position information from the reference layout area indicated by the reference numeral (j) to other layout areas to each layout area other than the reference layout area. To generate. This relative position information is generated by, for example, the code (k),
Code (l), code (m), code (p), code (r), ...
All layout areas other than the standard layout are subject to brute force. Then, the relative position information generation unit 51
Holds the generated relative position information temporarily.
【0041】相対位置情報が生成されると、検出部52
は、生成された相対位置情報に該当するレイアウト領域
が他のレイアウト領域を基準にした場合においても存在
するか否かを検出する。この検出は、例えば、符号
(j)の基準レイアウト領域に対して符号(k)、符号
(l)の相対位置にあるレイアウト領域は、符号(m)
に示す画像が設定されたレイアウト領域を基準レイアウ
ト領域とした場合、符号(n)、符号(s)に示すレイ
アウト領域が相当するので、符号(j)の基準レイアウ
ト領域に対して符号(k)、符号(l)の相対位置にあ
るレイアウト領域の相対位置情報が、引き続き保持され
る。When the relative position information is generated, the detecting unit 52
Detects whether or not the layout area corresponding to the generated relative position information exists even when another layout area is used as a reference. This detection is performed, for example, by using the code (m) for the layout area at the relative position of the code (k) and the code (l) with respect to the reference layout area for the code (j).
When the layout area in which the image shown in (1) is set is the reference layout area, the layout areas indicated by reference numerals (n) and (s) correspond, and therefore the reference layout area indicated by reference numeral (j) corresponds to reference numeral (k). , Relative position information of the layout area at the relative position of the code (l) is continuously held.
【0042】一方、符号(j)の基準レイアウト領域に
対して符号(r)の相対位置にあるレイアウト領域は、
符号(m)に示す画像が設定されたレイアウト領域を基
準レイアウト領域とした場合、相対位置が同じ場所にレ
イアウト領域が存在しないので、符号(j)の基準レイ
アウト領域に対して符号(r)の相対位置にあるレイア
ウト領域の相対位置情報が削除される。On the other hand, the layout area at the relative position of the code (r) with respect to the reference layout area of the code (j) is
When the layout area in which the image indicated by the reference sign (m) is set is the reference layout area, the layout area does not exist at the same relative position, and therefore the reference layout area of the reference sign (r) is set to the reference layout area of the reference sign (j). The relative position information of the layout area at the relative position is deleted.
【0043】このようにして、他のレイアウト領域を基
準レイアウト領域とした場合に、当初の基準レイアウト
領域からの相対位置が同じ位置にレイアウト領域が存在
しなければ相対位置情報が削除され、当初の基準レイア
ウト領域からの相対位置が同じ位置にレイアウト領域が
存在する場合に、相対位置情報が保持される。In this way, when another layout area is used as the reference layout area, if the layout area does not exist at the same relative position from the original reference layout area, the relative position information is deleted and the original position information is deleted. When the layout area exists at the same relative position from the reference layout area, the relative position information is held.
【0044】そして、すべてのレイアウト領域に対して
検出部52による検出処理が完了すると、リンク設定部
53は、検出部52による検出処理が完了した時点にお
いて保持されている相対位置情報に基づいて、基準とさ
れたレイアウト領域と相対位置情報に該当するレイアウ
ト領域との関連づけを、すべてのレイアウト領域につい
て行う。これにより、例えば、符号(j)、符号
(k)、符号(l)のレイアウト領域が1つのグループ
として関連付けされるとともに、符号(m)、符号
(n)、符号(s)のレイアウト領域が1つのグループ
として関連付けされる。さらに、他のレイアウト領域に
ついても、符号(j)、符号(k)、符号(l)と相対
位置が同じである各レイアウト領域を1つのグループと
して関連付けが行われる。When the detection processing by the detection unit 52 is completed for all the layout areas, the link setting unit 53, based on the relative position information held at the time when the detection processing by the detection unit 52 is completed, The reference layout area and the layout area corresponding to the relative position information are associated with each other for all the layout areas. Thereby, for example, the layout areas of the code (j), the code (k), and the code (l) are associated as one group, and the layout areas of the code (m), the code (n), and the code (s) are associated with each other. They are associated as one group. Further, with respect to the other layout areas, the layout areas having the same relative positions as the code (j), the code (k), and the code (l) are associated as one group.
【0045】上述の処理により、図13に示す照明器具
の画像と型式と価格などについて、9種類の商品毎に、
グループとして関連付けがなされる。なお、図14に示
すように、符号(t)に示すレイアウト領域のみ他のレ
イアウト領域における関連付けが異なる場合、符号
(t)に示す部分以外については、上述のグループとし
ての相対位置情報に基づく関連付け処理を行い、符号
(t)に示す部分については、第1の実施形態において
説明した、入力デバイスからの指示による関連付けを行
うようにしても良い。By the above-mentioned processing, with respect to the image, model, price, etc. of the lighting equipment shown in FIG.
Associations are made as a group. As shown in FIG. 14, when only the layout area indicated by reference numeral (t) has a different association in the other layout areas, the portions other than the portion indicated by reference numeral (t) are associated based on the relative position information as the group described above. The processing may be performed, and the portion indicated by the reference numeral (t) may be associated with the instruction from the input device described in the first embodiment.
【0046】次に、第4の実施形態について説明する。
この実施形態において、要素関係特定部5は、各レイア
ウト領域間において既に関連付けされた情報をテンプレ
ートリンク情報として生成し、生成されたテンプレート
リンク情報を他のレイアウト領域間(あるいは他のペー
ジ)においても利用し、各レイアウト領域間において同
様の関連付けを行う。例えば、図13に示すようにレイ
アウト領域が配置されたページが複数ページにわたって
存在する場合に、例えば、最初のページにおいて各商品
について第3の実施形態の関連付け処理を利用して各レ
イアウト領域間の関連づけを行い、この関連付けされた
各レイアウト領域間の相対位置に基づいて、テンプレー
トリンク情報として生成する。そして、次のページにお
いても同じレイアウト領域が配置されていれば、生成さ
れたテンプレートリンク情報を利用して、このページ内
における各商品の画像や型式、価格などの文字を1つの
商品として関連付けを行う。Next, a fourth embodiment will be described.
In this embodiment, the element relationship specifying unit 5 generates information already associated with each layout area as template link information, and also generates the generated template link information between other layout areas (or other pages). Utilizing this, the same association is made between the layout areas. For example, when there are a plurality of pages in which layout areas are arranged as shown in FIG. 13, for example, using the association process of the third embodiment for each product on the first page, the layout areas are arranged between the layout areas. Correlation is performed, and template link information is generated based on the relative position between the associated layout areas. Then, if the same layout area is arranged on the next page as well, the generated template link information is used to associate characters such as images, models, and prices of each product in this page as one product. To do.
【0047】次に、第5の実施形態について説明する。
図15は、第5の実施形態における要素関係特定部5の
構成を示す概略ブロック図である。この図において、リ
ンク情報記憶部55は、既に関連付けされた各レイアウ
ト領域間のリンク情報を記憶する。比較部56は、対応
するデータベース情報のリンク情報を読み出して、読み
出されたデータの各要素と更新されたデータベース情報
の各要素とを比較する。Next, a fifth embodiment will be described.
FIG. 15 is a schematic block diagram showing the configuration of the element relationship specifying unit 5 in the fifth embodiment. In this figure, the link information storage unit 55 stores the link information between the layout areas already associated with each other. The comparing unit 56 reads out the link information of the corresponding database information and compares each element of the read data with each element of the updated database information.
【0048】配色部57は、比較部56の比較結果に基
づいて、読み出されたデータの要素と更新されたデータ
ベース情報の要素とが一致する要素と、一致しない要素
とを異なる表現方法によって出力する。この異なる表現
方法とは、例えば、異なる色をレイアウト領域に設定し
て出力する。また、この異なる表現方法には、レイアウ
ト領域を示す矩形の線の種類によって区別してもよく、
また、レイアウト領域にハッチングを行うなどによって
区別するようにしてもよい。Based on the comparison result of the comparison unit 56, the color arrangement unit 57 outputs the element in which the element of the read data and the element of the updated database information match and the element in which they do not match, by different expression methods. To do. The different expression method is, for example, setting different colors in the layout area and outputting. In addition, the different representation methods may be distinguished by the type of rectangular line indicating the layout area,
Alternatively, the layout areas may be distinguished by hatching.
【0049】リンク設定部58は、比較部56の比較結
果に基づいて、読み出されたデータの要素と更新された
データベース情報の要素とが一致する要素とを関連付け
する。The link setting unit 58 associates the element of the read data with the element of which the element of the updated database information matches based on the comparison result of the comparing unit 56.
【0050】次に、この実施の形態における要素関連特
定装置5の動作について説明する。リンク情報記憶部5
5は、データベースが構築時において、関連付けされた
各レイアウト領域間のリンク情報を順次記憶する。そし
て、データベースが構築された後あるいは構築途中にお
いて、DTPドキュメントデータの修正が行われた後
に、再度関連付けを行う指示が入力されると、要素関連
特定装置5の比較部56は、再度関連付けを行う指示に
おうじて、修正が行われたデータベース情報のリンク情
報を読み出して、読み出されたデータの各要素と更新さ
れたデータベース情報の各要素とを比較し、比較結果を
配色部57に出力する。Next, the operation of the element relation specifying device 5 in this embodiment will be described. Link information storage unit 5
Reference numeral 5 sequentially stores link information between associated layout areas when the database is constructed. Then, after the DTP document data is corrected after the database is constructed or in the process of being constructed, when an instruction to reassociate is input, the comparison unit 56 of the element association identifying apparatus 5 reassociates. According to the instruction, the link information of the corrected database information is read, each element of the read data is compared with each element of the updated database information, and the comparison result is output to the color arrangement unit 57. .
【0051】配色部57は、比較部56の比較結果に基
づいて、読み出されたデータの要素と更新されたデータ
ベース情報の要素とが一致する要素と、一致しない要素
とを異なる色をレイアウト領域に設定してリンク設定部
58に出力する。リンク設定部58は、比較部56の比
較結果を配色部57を介して受け取り、読み出されたデ
ータの要素と更新されたデータベース情報の要素とが一
致する要素とを関連付けする。On the basis of the comparison result of the comparison unit 56, the color arrangement unit 57 sets different colors for the elements in which the elements of the read data and the elements of the updated database information are different from each other in different layout areas. And output to the link setting unit 58. The link setting unit 58 receives the comparison result of the comparison unit 56 via the color arrangement unit 57, and associates the element of the read data with the element of which the element of the updated database information matches.
【0052】例えば、図16符号(u)内のレイアウト
領域のうち、符号(w)に示すレイアウト領域に対して
DTP上でデータの修正が行われ、上述の配色処理が行
われると、図16に示すように、符号(u)内のレイア
ウト領域のうち、符号(w)に示すレイアウト領域が異
なる色によって画面上に出力される。これにより、作業
者にとって、DTP上でデータの修正が行われたレイア
ウト領域のデータが視覚的に確認しやすくなる。For example, when the data is corrected on the DTP for the layout area shown by the code (w) in the layout area shown by the code (u) in FIG. 16 and the above-mentioned color arrangement processing is carried out, FIG. As shown in FIG. 5, among the layout areas in the code (u), the layout area in the code (w) is output on the screen in different colors. This makes it easier for the operator to visually confirm the data in the layout area in which the data has been corrected on the DTP.
【0053】次に、第6の実施形態について説明する。
図17は、第6の実施形態における要素関係特定部5の
構成を示す概略ブロック図である。この図において、矩
形内レイアウト領域検出部510は、既に関連付けされ
ている複数のレイアウト領域を包含する最小外接矩形内
のレイアウト領域を検出する。ここでいう最小外接矩形
とは、例えば、図18に示すように、符号(イ)に示す
画像領域と文字領域とが既に関連付けされている場合に
おいて、既に関連付けされている符号(イ)に示す画像
領域と文字領域とを包含して概説する最小の矩形(符号
(ホ))である。Next, a sixth embodiment will be described.
FIG. 17 is a schematic block diagram showing the configuration of the element relationship specifying unit 5 in the sixth embodiment. In this figure, an in-rectangle layout area detection unit 510 detects a layout area within a minimum circumscribed rectangle that includes a plurality of already associated layout areas. The minimum circumscribed rectangle mentioned here is, for example, as shown in FIG. 18, when the image area and the character area indicated by the reference numeral (a) are already associated with each other, the minimum circumscribed rectangle is indicated by the already associated reference numeral (a). It is the smallest rectangle (reference numeral (e)) that outlines the image area and the character area.
【0054】リンク設定部520は、矩形内レイアウト
領域検出部510が検出した最小外接矩形内のレイアウ
ト領域をそれぞれ関連付けする。The link setting section 520 associates the layout areas in the minimum circumscribed rectangle detected by the in-rectangle layout area detection section 510 with each other.
【0055】次に、この実施形態における要素関係特定
部5の動作について説明する。符号(イ)に示す画像領
域と文字領域とが既に関連付けされており、さらに、符
号(ハ)に示す図形領域についても関連付けする場合、
矩形内レイアウト領域検出部510は、作業者から入力
デバイスを介して、最小外接矩形による関連付け処理の
指示が入力されると、既に関連付けされている複数のレ
イアウト領域を包含する最小外接矩形内のレイアウト領
域を検出する。ここでは、符号(ホ)に示す最小外接矩
形内のレイアウト領域が検出される。Next, the operation of the element relationship specifying unit 5 in this embodiment will be described. When the image area and the character area indicated by reference numeral (a) are already associated with each other, and further the graphic area indicated by reference numeral (c) is also associated,
The in-rectangular layout area detection unit 510 receives a layout instruction in the minimum circumscribing rectangle including a plurality of layout areas already associated with each other, when an instruction of the association processing by the minimum circumscribing rectangle is input from the operator via the input device. Detect the area. Here, the layout area within the minimum circumscribed rectangle indicated by reference numeral (e) is detected.
【0056】最小外接矩形内のレイアウト領域が検出さ
れると、リンク設定部520は、検出された最小外接矩
形内のレイアウト領域をそれぞれ関連付けする。これに
より、符号(イ)に示す画像領域と文字領域と符号
(ハ)に示す図形領域が関連付けされる。When the layout area within the minimum circumscribed rectangle is detected, the link setting section 520 associates the detected layout area within the minimum circumscribed rectangle with each other. As a result, the image area and the character area indicated by reference numeral (a) are associated with the graphic area indicated by reference numeral (c).
【0057】符号(ホ)内の関連付けが終了すると、他
のレイアウト領域においても最小外接矩形による関連付
け処理が行われる。これにより、符号(ロ)に示す画像
領域と文字領域とが既に関連付けされている場合、既に
関連付けされている符号(ロ)の2つのレイアウト領域
を包含する最小外接矩形内のレイアウト領域(符号
(ヘ))が検出され、符号(ヘ)内に存在する図形領域
(符号(ニ))についても、既に関連付けされている符
号(ロ)の2つのレイアウト領域に対して関連付けされ
る。When the association within the code (e) is completed, the association processing by the minimum circumscribed rectangle is performed also in other layout areas. As a result, when the image area and the character area indicated by the code (b) are already associated with each other, the layout area within the minimum circumscribed rectangle including the two layout areas with the already associated code (b) (the code ( F)) is detected, and the graphic area (code (d)) existing in the code (f) is also associated with the two layout areas of the code (b) that are already associated.
【0058】以上説明した実施形態によれば、印刷業者
は、依頼者によって記入された見本の訂正内容に基づい
て、二重に入力作業を行う必要がなくなり、作業の負担
が軽減されるとともに、データベースの更新作業の時間
を短縮することができる。また、作業者のミスを無く
し、商品データベースに確実な更新作業を行うことがで
きる。According to the embodiment described above, the printer does not need to do double input work based on the correction contents of the sample entered by the client, which reduces the work load and The time required for updating the database can be shortened. In addition, it is possible to eliminate mistakes made by the operator and perform a reliable update operation on the product database.
【0059】また、図1における電子文書変換部1、変
換データ分析部2、要素名規則性定義部3、要素関係特
定部5、要素名規則性特定部6、構成要素抽出部7の機
能を実現するためのプログラムをコンピュータ読み取り
可能な記録媒体に記録して、この記録媒体に記録された
プログラムをコンピュータシステムに読み込ませ、実行
することによりデータベース構築処理を行ってもよい。
なお、ここでいう「コンピュータシステム」とは、OS
や周辺機器等のハードウェアを含むものとする。Further, the functions of the electronic document converting section 1, the conversion data analyzing section 2, the element name regularity defining section 3, the element relation specifying section 5, the element name regularity specifying section 6, and the component extracting section 7 in FIG. A database construction process may be performed by recording a program to be realized in a computer-readable recording medium, reading the program recorded in the recording medium into a computer system, and executing the program.
The “computer system” here means an OS.
And peripheral equipment and other hardware.
【0060】また、「コンピュータシステム」は、WW
Wシステムを利用している場合であれば、ホームページ
提供環境(あるいは表示環境)も含むものとする。ま
た、「コンピュータ読み取り可能な記録媒体」とは、フ
レキシブルディスク、光磁気ディスク、ROM、CD−
ROM等の可搬媒体、コンピュータシステムに内蔵され
るハードディスク等の記憶装置のことをいう。さらに
「コンピュータ読み取り可能な記録媒体」とは、インタ
ーネット等のネットワークや電話回線等の通信回線を介
してプログラムを送信する場合の通信線のように、短時
間の間、動的にプログラムを保持するもの、その場合の
サーバやクライアントとなるコンピュータシステム内部
の揮発性メモリのように、一定時間プログラムを保持し
ているものも含むものとする。また上記プログラムは、
前述した機能の一部を実現するためのものであっても良
く、さらに前述した機能をコンピュータシステムにすで
に記録されているプログラムとの組み合わせで実現でき
るものであっても良い。The "computer system" is WW.
If the W system is used, the homepage providing environment (or display environment) is also included. The "computer-readable recording medium" means a flexible disk, a magneto-optical disk, a ROM, a CD-
A portable medium such as a ROM or a storage device such as a hard disk built in a computer system. Further, the "computer-readable recording medium" means to hold a program dynamically for a short time like a communication line when transmitting the program through a network such as the Internet or a communication line such as a telephone line. In this case, a volatile memory inside a computer system that serves as a server or a client in that case holds a program for a certain period of time. Also, the program above
It may be for realizing some of the above-mentioned functions, or may be for realizing the above-mentioned functions in combination with a program already recorded in the computer system.
【0061】以上、この発明の実施形態を図面を参照し
て詳述してきたが、具体的な構成はこの実施形態に限ら
れるものではなく、この発明の要旨を逸脱しない範囲の
設計等も含まれる。Although the embodiment of the present invention has been described in detail above with reference to the drawings, the specific configuration is not limited to this embodiment, and includes a design etc. within the scope not departing from the gist of the present invention. Be done.
【0062】[0062]
【発明の効果】以上説明したように、この発明によれ
ば、電子文書から抽出する要素を指定するためのルール
情報として、文字と画像とのうちすくなくともいずれか
一方の要素に対するルール情報を設定し、電子文書から
抽出される要素にデータベースの項目となる項目情報を
設定し、要素名規則性定義手段によって指定されるルー
ル情報に基づいて、電子文書から要素を抽出し、抽出し
た要素を項目情報を対応付けてデータベース情報として
出力するようにしたので、電子文書から文字と画像との
うち一方又は両方を抽出してデータベースを簡単に構築
することができ、作業者の負担を軽減させることが可能
である。As described above, according to the present invention, as rule information for designating an element to be extracted from an electronic document, rule information for at least one of a character and an image is set. Item information that is an item of the database is set to the element extracted from the electronic document, the element is extracted from the electronic document based on the rule information specified by the element name regularity defining means, and the extracted element is set as the item information. Since it is output as database information in association with each other, it is possible to easily construct a database by extracting one or both of characters and images from an electronic document, and it is possible to reduce the burden on the operator. Is.
【0063】また、本発明によれば、ルール情報は、文
字体裁に関する条件、文字位置に関する条件、関係前後
関係に関する条件、包含文字に関する条件、のうち、少
なくともいずれか1つの条件を設定するようにしたの
で、抽出する対象の文字を精度良く特定して抽出するこ
とができる効果が得られる。Further, according to the present invention, the rule information sets at least one of a condition regarding typography, a condition regarding character position, a condition regarding relation context, and a condition regarding included characters. Therefore, it is possible to obtain an effect that the character to be extracted can be accurately specified and extracted.
【0064】また、本発明によれば、ルール情報は、フ
ァイル情報に関する条件、画像属性に関する条件、レイ
アウト属性に関する条件、のうち少なくとも1つの条件
を含むようにしたので、抽出する対象の画像を精度良く
特定して抽出することができる効果が得られる。Further, according to the present invention, since the rule information includes at least one of the condition regarding the file information, the condition regarding the image attribute, and the condition regarding the layout attribute, the accuracy of the image to be extracted can be improved. The effect of being able to identify and extract well is obtained.
【0065】また、本発明によれば、各要素間を1つの
グループとして関連付けするリンク情報を生成し、リン
ク情報に基づいて電子文書から抽出される要素を関連付
けるとともに、項目情報を対応付けてデータベース情報
として出力するようにしたので、各要素をグループ毎に
分類してデータベースを構築することができる効果が得
られる。Further, according to the present invention, link information for associating each element as one group is generated, the elements extracted from the electronic document are associated with each other based on the link information, and the item information is associated with the database. Since the information is output, it is possible to classify each element into groups and construct a database.
【0066】また、この発明によれば、電子文書は、商
品のカタログに関する情報を含むようにしたので、カタ
ログを印刷するための要素がレイアウトされた印刷デー
タからデータベース情報を生成することができ、これに
より、カタログの情報を簡単にデータベース化すること
ができる。Further, according to the present invention, since the electronic document includes the information on the catalog of the product, the database information can be generated from the print data in which the elements for printing the catalog are laid out. Thereby, the information of the catalog can be easily made into a database.
【図1】 この発明の一実施形態によるデータベース構
築装置の構成を示す概略ブロック図である。FIG. 1 is a schematic block diagram showing the configuration of a database construction device according to an embodiment of the present invention.
【図2】 変換データ表示部4に表示される画面の一例
を示す図面である。FIG. 2 is a diagram showing an example of a screen displayed on a conversion data display unit 4.
【図3】 ルール情報の一例を示す図面である。FIG. 3 is a diagram showing an example of rule information.
【図4】 各要素間の関連づけについて説明するための
図面である。FIG. 4 is a diagram for explaining association between elements.
【図5】 図1に示すデータベース構築装置の動作につ
いて説明するためのフローチャートである。5 is a flowchart for explaining the operation of the database construction device shown in FIG. 1. FIG.
【図6】 図1に示すデータベース構築装置の動作につ
いて説明するためのフローチャートである。FIG. 6 is a flowchart for explaining the operation of the database construction device shown in FIG.
【図7】 図1に示すデータベース構築装置の動作につ
いて説明するためのフローチャートである。FIG. 7 is a flowchart for explaining the operation of the database construction device shown in FIG.
【図8】 図1に示すデータベース構築装置の動作につ
いて説明するためのフローチャートである。FIG. 8 is a flowchart for explaining the operation of the database construction device shown in FIG.
【図9】 商品カタログを構成する各要素をレイアウト
領域として表示された場合の一例を示す図面であるFIG. 9 is a diagram showing an example of a case where each element constituting the product catalog is displayed as a layout area.
【図10】 関連付けとルール情報の設定について説明
するための図面である。FIG. 10 is a diagram for explaining association and setting of rule information.
【図11】 構成要素抽出部7によって抽出されたデー
タがデータベース化された一例を示す図面である。FIG. 11 is a diagram showing an example in which the data extracted by the component extraction unit 7 is made into a database.
【図12】 第3の実施形態における要素関係特定部5
の構成を示す概略ブロック図である。FIG. 12 is an element relation specifying unit 5 according to the third embodiment.
3 is a schematic block diagram showing the configuration of FIG.
【図13】 他の実施形態における関連付けについて説
明するための図面である。FIG. 13 is a diagram for explaining association in another embodiment.
【図14】 他の実施形態における関連付けについて説
明するための図面である。FIG. 14 is a diagram for explaining association in another embodiment.
【図15】 第5の実施形態における要素関係特定部5
の構成を示す概略ブロック図である。FIG. 15 is an element relationship specifying unit 5 according to the fifth embodiment.
3 is a schematic block diagram showing the configuration of FIG.
【図16】 第5の実施形態について説明するための図
面である。FIG. 16 is a drawing for explaining the fifth embodiment.
【図17】 第6の実施形態における要素関係特定部5
の構成を示す概略ブロック図である。FIG. 17 is an element relation specifying unit 5 according to the sixth embodiment.
3 is a schematic block diagram showing the configuration of FIG.
【図18】 最小外接矩形による関連付け処理を説明す
るための図面である。FIG. 18 is a diagram for explaining an association process using a minimum circumscribed rectangle.
1 電子文書変換部 2 変換データ
分析部
3 要素名規則性定義部 4 変換データ
表示部
5 要素関係特定部 6 要素名規則
性特定部
7 構成要素抽出部 8 構成要素出
力部
51 相対位置情報生成部 52 検出部
53、58、520 リンク設定部 55 リンク情
報記憶部
56 比較部 57 配色部
510 矩形内レイアウト領域検出部1 electronic document conversion unit 2 conversion data analysis unit 3 element name regularity definition unit 4 conversion data display unit 5 element relationship specification unit 6 element name regularity specification unit 7 component extraction unit 8 component output unit 51 relative position information generation unit 52 detection units 53, 58, 520 link setting unit 55 link information storage unit 56 comparison unit 57 color arrangement unit 510 in-rectangular layout area detection unit
Claims (9)
トされた電子文書からデータベースを構築するデータベ
ース構築システムであって、 前記電子文書から抽出する要素を指定するためのルール
情報を設定する要素名規則性定義手段と、 前記電子文書から抽出される要素にデータベースの項目
となる項目情報を設定する要素名規則性特定手段と、 前記要素名規則性定義手段によって指定されるルール情
報に基づいて、前記電子文書から要素を抽出し、抽出し
た要素を前記要素名規則性特定手段によって設定される
項目情報を対応付けてデータベース情報として出力する
構成要素抽出手段とを有し、 前記要素名規則性定義手段は、文字と画像とのうちすく
なくともいずれか一方の要素に対するルール情報を生成
することを特徴とするデータベース構築装置。1. A database construction system for constructing a database from an electronic document in which elements constituting an electronic document are laid out in advance, and an element name rule for setting rule information for designating an element to be extracted from the electronic document. Based on the rule information specified by the element name regularity defining means, the element name regularity specifying means for setting item information to be an item of a database in the element extracted from the electronic document, The element name regularity defining means for extracting an element from the electronic document, and outputting the extracted element as database information in association with the item information set by the element name regularity specifying means. Is data that is characterized by generating rule information for at least one of a character and an image. Over to build devices.
される文字に対するルール情報は、文字の書体名、サイ
ズ、色、変形、字送りのうち少なくとも1つの条件を含
む文字体裁に関する条件と、行頭と行末とのうち一方又
は両方を含む文字が配置された文字位置に関する条件
と、前後の文字または他の要素との関係を指定する関係
前後関係に関する条件と、内部に含まれる文字列を指定
する条件である包含文字に関する条件と、のうち、少な
くともいずれか1つの条件を含むことを特徴とする請求
項1に記載のデータベース構築装置。2. The rule information for a character set by the element name regularity defining means includes a typographic condition including at least one condition of a font face name, size, color, transformation, and character feed, and a line head. Specify the condition regarding the character position where the character including one or both of the line ending and the end of the line is specified, the condition regarding the relationship before and after the character or other element, and the character string contained inside. The database construction device according to claim 1, wherein at least one condition is included among the condition regarding the included character that is the condition.
される画像に対するルール情報は、ファイル名とファイ
ル種別との一方または両方の条件を含むファイル情報に
関する条件と、画像の大きさと解像度との一方または両
方の条件を含む画像属性に関する条件と、画像の回転と
倍率との一方または両方の条件を含むレイアウト属性に
関する条件と、のうち少なくとも1つの条件を含むこと
を特徴とする請求項1または請求項2に記載のデータベ
ース構築装置。3. The rule information for the image set by the element name regularity defining means is one of a condition regarding file information including a condition of one or both of a file name and a file type, and an image size and resolution. Or at least one of a condition relating to an image attribute including both conditions and a condition relating to a layout attribute including one or both conditions of image rotation and magnification. The database construction device according to item 2.
される文字と画像とに対する共通の条件として、レイア
ウト領域の大きさと枠線との一方または両方を含むレイ
アウト領域に関する条件を含むことを特徴とする請求項
1から請求項3のうちいずれかに記載のデータベース構
築装置。4. The condition common to characters and images set by the element name regularity defining means includes a condition relating to a layout region including one or both of a size of a layout region and a frame line. The database construction device according to any one of claims 1 to 3.
連付けするリンク情報を生成する要素関係特定手段を有
し、 前記構成要素抽出手段は、前記要素関係特定手段によっ
て生成されたリンク情報に基づいて前記電子文書から抽
出される要素を関連付けるとともに、前記項目情報を対
応付けてデータベース情報として出力することを特徴と
する請求項1から請求項4のうちいずれかに記載のデー
タベース構築装置。5. An element relationship specifying means for generating link information for associating the respective elements as one group, wherein the constituent element extracting means is based on the link information generated by the element relationship specifying means. The database construction apparatus according to claim 1, wherein the element extracted from the electronic document is associated, and the item information is associated and output as database information.
る情報を含むことを特徴とする請求項1から請求項5の
うちいずれかに記載のデータベース構築装置。6. The database construction apparatus according to claim 1, wherein the electronic document includes information about a product catalog.
トされた電子文書からデータベースを構築するデータベ
ース構築方法であって、 前記電子文書から抽出する要素を指定するためのルール
情報として、文字と画像とのうちすくなくともいずれか
一方の要素に対するルール情報を設定し、 前記電子文書から抽出される要素にデータベースの項目
となる項目情報を設定し、 前記要素名規則性定義手段によって指定されるルール情
報に基づいて、前記電子文書から要素を抽出し、抽出し
た要素を前記要素名規則性特定手段によって設定される
項目情報を対応付けてデータベース情報として出力する
ことを特徴とするデータベース構築方法。7. A database construction method for constructing a database from an electronic document in which elements constituting an electronic document are laid out in advance, wherein characters and images are used as rule information for designating elements to be extracted from the electronic document. Set rule information for at least one of the elements, set item information that is an item of the database in the element extracted from the electronic document, based on the rule information specified by the element name regularity defining means Then, an element is extracted from the electronic document, and the extracted element is associated with item information set by the element name regularity specifying means and output as database information.
トされた電子文書からデータベースを構築するデータベ
ース構築プログラムであって、 前記電子文書から抽出する要素を指定するためのルール
情報として、文字と画像とのうちすくなくともいずれか
一方の要素に対するルール情報を設定するステップと、 前記電子文書から抽出される要素にデータベースの項目
となる項目情報を設定するステップと、 前記要素名規則性定義手段によって指定されるルール情
報に基づいて、前記電子文書から要素を抽出し、抽出し
た要素を前記要素名規則性特定手段によって設定される
項目情報を対応付けてデータベース情報として出力する
ステップとをコンピュータに実行させることを特徴とす
るデータベース構築プログラム。8. A database construction program for constructing a database from an electronic document in which elements composing an electronic document are laid out in advance, and characters and images are used as rule information for designating elements to be extracted from the electronic document. A step of setting rule information for at least one of the elements, a step of setting item information which is an item of a database in an element extracted from the electronic document, and designated by the element name regularity defining means Extracting the element from the electronic document based on the rule information and outputting the extracted element as database information in association with item information set by the element name regularity specifying means. Characteristic database construction program.
トされた電子文書からデータベースを構築するデータベ
ース構築プログラムを記録したコンピュータ読み取り可
能な記録媒体であって、 前記電子文書から抽出する要素を指定するためのルール
情報として、文字と画像とのうちすくなくともいずれか
一方の要素に対するルール情報を設定するステップと、 前記電子文書から抽出される要素にデータベースの項目
となる項目情報を設定するステップと、 前記要素名規則性定義手段によって指定されるルール情
報に基づいて、前記電子文書から要素を抽出し、抽出し
た要素を前記要素名規則性特定手段によって設定される
項目情報を対応付けてデータベース情報として出力する
ステップとをコンピュータに実行させるデータベース構
築プログラムを記録した記録媒体。9. A computer-readable recording medium recording a database construction program for constructing a database from an electronic document in which the electronic document is laid out in advance, for designating an element to be extracted from the electronic document. As rule information of, a step of setting rule information for at least one element of characters and images; a step of setting item information to be an item of a database in an element extracted from the electronic document; An element is extracted from the electronic document based on the rule information specified by the name regularity defining means, and the extracted element is associated with the item information set by the element name regularity specifying means and output as database information. A database construction program that causes a computer to execute steps and A recording medium that records ram.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001328333A JP2003132078A (en) | 2001-10-25 | 2001-10-25 | Database construction apparatus, database construction method, database construction program, recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001328333A JP2003132078A (en) | 2001-10-25 | 2001-10-25 | Database construction apparatus, database construction method, database construction program, recording medium |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2003132078A true JP2003132078A (en) | 2003-05-09 |
Family
ID=19144413
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001328333A Pending JP2003132078A (en) | 2001-10-25 | 2001-10-25 | Database construction apparatus, database construction method, database construction program, recording medium |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2003132078A (en) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007174079A (en) * | 2005-12-20 | 2007-07-05 | Fuji Xerox Co Ltd | History output device, history output method, and program |
JP2009026122A (en) * | 2007-07-20 | 2009-02-05 | Konica Minolta Business Technologies Inc | Document-processing device, document-processing method, and document-processing program |
JP2012003355A (en) * | 2010-06-14 | 2012-01-05 | Nippon Telegr & Teleph Corp <Ntt> | Retrieval device, method, and program |
US8279319B2 (en) | 2005-02-15 | 2012-10-02 | Sony Corporation | Information processing apparatus, information processing method, and information processing system |
GB2528697A (en) * | 2014-07-29 | 2016-02-03 | Ibm | Generating a database structure from a scanned drawing |
CN114064602A (en) * | 2020-07-30 | 2022-02-18 | 阿里巴巴集团控股有限公司 | Database construction method, database query method, device and equipment |
-
2001
- 2001-10-25 JP JP2001328333A patent/JP2003132078A/en active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8279319B2 (en) | 2005-02-15 | 2012-10-02 | Sony Corporation | Information processing apparatus, information processing method, and information processing system |
JP2007174079A (en) * | 2005-12-20 | 2007-07-05 | Fuji Xerox Co Ltd | History output device, history output method, and program |
JP2009026122A (en) * | 2007-07-20 | 2009-02-05 | Konica Minolta Business Technologies Inc | Document-processing device, document-processing method, and document-processing program |
JP2012003355A (en) * | 2010-06-14 | 2012-01-05 | Nippon Telegr & Teleph Corp <Ntt> | Retrieval device, method, and program |
GB2528697A (en) * | 2014-07-29 | 2016-02-03 | Ibm | Generating a database structure from a scanned drawing |
US10430393B2 (en) | 2014-07-29 | 2019-10-01 | International Business Machines Corporation | Generating a database structure from a scanned drawing |
CN114064602A (en) * | 2020-07-30 | 2022-02-18 | 阿里巴巴集团控股有限公司 | Database construction method, database query method, device and equipment |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7949942B2 (en) | System and method for identifying line breaks | |
JP5623079B2 (en) | Automatic generation of form definitions from hardcopy forms | |
US5708766A (en) | Filing device | |
JP2003132078A (en) | Database construction apparatus, database construction method, database construction program, recording medium | |
JPH08161309A (en) | Document creation device | |
US9195655B2 (en) | Method and system for transforming documents | |
JP4508264B2 (en) | Database construction apparatus, database construction method, database construction program, recording medium | |
JP4147763B2 (en) | Database construction apparatus, database construction method, database construction program, recording medium | |
JP4192457B2 (en) | Database construction apparatus, database construction method, database construction program, recording medium | |
JP2003132077A (en) | Database construction apparatus, database construction method, database construction program, recording medium | |
JPH1091701A (en) | Form document system | |
JPH08161350A (en) | Method and device for electronic filing | |
JP2008257739A (en) | Database construction apparatus, database construction method, database construction program, recording medium | |
JPH1063813A (en) | Method for managing image document and device therefor | |
JP4276402B2 (en) | Form processing device | |
JP2011248421A (en) | Data creation method and data creation system | |
JP2000280435A (en) | Delivered data checking system | |
JPH07152548A (en) | Document creation device | |
JP2005004785A (en) | Form information processing apparatus, form information processing system, and program | |
JP2001307003A (en) | Data creation processing device and its program recording medium | |
JPH03269665A (en) | Original character drawing/character font control system | |
JPH0737005A (en) | Format information generating device | |
JPS61117656A (en) | Japanese language processing system of data processing system | |
JP2005271482A (en) | Image formation system, information processing device, image formation device, image formation method and image forming program | |
JPH08167003A (en) | Document processor |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040916 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070410 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070611 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20070717 |