JP2006127235A - 構造化文書管理システム、構造化文書管理方法及びプログラム - Google Patents
構造化文書管理システム、構造化文書管理方法及びプログラム Download PDFInfo
- Publication number
- JP2006127235A JP2006127235A JP2004316109A JP2004316109A JP2006127235A JP 2006127235 A JP2006127235 A JP 2006127235A JP 2004316109 A JP2004316109 A JP 2004316109A JP 2004316109 A JP2004316109 A JP 2004316109A JP 2006127235 A JP2006127235 A JP 2006127235A
- Authority
- JP
- Japan
- Prior art keywords
- structured document
- post
- data
- xml
- original
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/123—Storage facilities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/80—Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
- G06F16/83—Querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/80—Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
- G06F16/84—Mapping; Conversion
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99941—Database schema or data structure
- Y10S707/99942—Manipulating data structure, e.g. compression, compaction, compilation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Document Processing Apparatus (AREA)
Abstract
【解決手段】パース処理部14は、クライアント端末20から与えられる構造化文書格納要求に応じて、要求された構造化文書をパースすることによってパース後データを取得する。構造化文書更新部13は、パース処理部14によって取得されたパース後データをXMLDB11に格納する。構造化文書参照部15は、クライアント端末20から与えられる構造化文書取得(検索)要求に応じて、当該要求に合致する構造化文書のデータとしてのパース後データを取得する。要求処理部12は、構造化文書参照部15によって取得されたパース後データをクライアント端末20に返す。
【選択図】 図1
Description
[第1の実施形態]
図1は本発明の第1の実施形態に係る構造化文書管理システム10の構成を示すブロック図である。この構造化文書管理システム10は、クライアント端末20と、ローカルエリアネットワーク(LAN)等のネットワークNを介して接続されている。クライアント端末20上では、構造化文書管理システム10を利用するアプリケーション(アプリケーションプログラム)21が動作する。構造化文書管理システム10は、XMLデータベース(XMLDB)11と、要求処理部12と、構造化文書更新部13と、パース処理部14と、構造化文書参照部15と、クエリ処理部16と、格納位置管理部17とから構成される。
まず、構造化文書管理システム10における格納処理の手順について、図7のフローチャートを参照して説明する。
次に、構造化文書管理システム10における検索処理の手順について、図8のフローチャートを参照して説明する。
次に、構造化文書管理システム10におけるパース後データ取得処理の手順について、図9のフローチャートを参照して説明する。
次に、構造化文書管理システム10におけるパース後データ変更処理の手順について、図10のフローチャートを参照して説明する。
図11は、本発明の第2の実施形態に係る構造化文書管理システム100の構成を示すブロック図である。図11において、図1と等価な要素には同一参照番号を付してある。
まず、構造化文書管理システム100における格納処理の手順について、図12のフローチャートを参照して説明する。
次に、構造化文書管理システム100における元XML文書取得処理の手順について、図13のフローチャートを参照して説明する。
Claims (12)
- 構造化文書データベースを管理する構造化文書管理システムにおいて、
クライアントから与えられる構造化文書格納要求に応じて、要求された構造化文書をパースすることによってパース後データを取得するパース処理手段と、
前記パース処理手段によって取得された前記構造化文書のパース後データを前記構造化文書データベースに格納する構造化文書格納手段と、
前記クライアントから与えられる構造化文書取得要求に応じて、当該要求に合致する構造化文書のデータとしてのパース後データを前記構造化文書データベースから取得する構造化文書取得手段と、
前記構造化文書取得手段によって取得されたパース後データを前記クライアントに返す要求処理手段とを具備することを特徴とする構造化文書管理システム。 - 前記構造化文書格納手段は、前記構造化文書のパース後データを、1つの仮想的な構造化文書の木構造の部分木として前記構造化文書データベースに格納することを特徴とする請求項1記載の構造化文書管理システム。
- 前記構造化文書格納手段は、
前記構造化文書のパース後データから前記仮想的な構造化文書の木構造の要素となる各ノードのノード情報を取得して前記構造化文書データベースに格納する第1の格納手段と、
前記構造化文書のパース後データから前記仮想的な構造化文書の木構造の要素となる各ノードの親子兄弟関係を抽出して、当該抽出された親子兄弟関係を管理するための構造情報を前記構造化文書データベースに格納する第2の格納手段と
を含むことを特徴とする請求項2記載の構造化文書管理システム。 - 前記構造化文書格納手段は、当該構造化文書格納手段によって前記構造化文書データベースに格納されるパース後データの元の構造化文書を元構造化文書データベースに格納することを特徴とする請求項1記載の構造化文書管理システム。
- 前記構造化文書取得手段は、前記クライアントから与えられる元構造化文書取得要求に応じて、要求された元の構造化文書のデータを前記元構造化文書データベースから取得することを特徴とする請求項4記載の構造化文書管理システム。
- 前記構造化文書データベースに格納されるパース後データの当該構造化文書データベースにおける格納位置を示す第1の格納位置情報と、前記元構造化文書データベースに格納される当該パース後データの元の構造化文書の当該元構造化文書データベースにおける格納位置を示す第2の格納位置情報とを対応付けて前記元構造化文書データベースに格納する元構造化文書格納位置管理手段を更に具備し、
前記元構造化文書格納位置管理手段は、前記クライアントから第2の格納位置情報による元構造化文書取得要求が与えられた場合、当該第2の格納位置情報と対応付けられている第1の格納位置情報を前記元構造化文書データベースから取得し、
前記構造化文書取得手段は、前記元構造化文書格納位置管理手段によって取得される前記第1の格納位置情報に従って、要求された元の構造化文書のデータを前記元構造化文書データベースから取得する
ことを特徴とする請求項5記載の構造化文書管理システム。 - 前記クライアントから与えられる構造化文書検索要求に応じて前記構造化文書データベースを検索し、当該要求に合致する構造化文書のデータとしてのパース後データが格納されている前記構造化文書データベースにおける格納位置を示す第1の格納位置情報を取得する格納位置管理手段を更に具備し、
前記要求処理手段は、前記格納位置管理手段によって取得された前記第1の格納位置情報を、前記構造化文書検索要求に対する検索結果として前記クライアントに返すことを特徴とする請求項6記載の構造化文書管理システム。 - パース後のデータを操作するための汎用の問い合わせ言語を解析する問い合わせ言語処理手段を更に具備し、
前記構造化文書取得要求はパース後のデータを操作するための汎用の問い合わせ言語を含み、
前記構造化文書取得手段は、前記構造化文書取得要求に含まれている前記問い合わせ言語を前記問い合わせ言語処理手段により解析させ、その解析結果に従って、当該解析結果の示す要求に合致する構造化文書のデータとしてのパース後データを前記構造化文書データベースから取得する
ことを特徴とする請求項1記載の構造化文書管理システム。 - 構造化文書管理システムにおいて構造化文書データベースを管理するための構造化文書管理方法であって、
クライアントから前記構造化文書管理システムに与えられる構造化文書格納要求に応じて、要求された構造化文書をパースするステップと、
構造化文書をパースすることによって取得されるパース後データを前記構造化文書に格納するステップと、
前記クライアントから与えられる構造化文書取得要求に応じて、当該要求に合致する構造化文書のデータとしてのパース後データを前記構造化文書データベースから取得するステップと、
前記取得されたパース後データを前記クライアントに返すステップと
を具備することを特徴とする構造化文書管理方法。 - 前記構造化文書データベースに格納される前記パース後データの元の構造化文書を元構造化文書データベースに格納するステップを更に具備することを特徴とする請求項9記載の構造化文書管理方法。
- 前記クライアントから与えられる元構造化文書取得要求に応じて、要求された元の構造化文書のデータを前記元構造化文書データベースから取得するステップと、
前記取得されたパース後データを前記クライアントに返すステップと
を更に具備することを特徴とする請求項10記載の構造化文書管理方法。 - 構造化文書データベースを管理するためのプログラムであって、
コンピュータに、
クライアントから前記構造化文書管理システムに与えられる構造化文書格納要求に応じて、要求された構造化文書をパースするステップと、
構造化文書をパースすることによって取得されるパース後データを前記構造化文書に格納するステップと、
前記クライアントから与えられる構造化文書取得要求に応じて、当該要求に合致する構造化文書のデータとしてのパース後データを前記構造化文書データベースから取得するステップと、
前記取得されたパース後データを前記クライアントに返すステップと
を実行させるためのプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004316109A JP2006127235A (ja) | 2004-10-29 | 2004-10-29 | 構造化文書管理システム、構造化文書管理方法及びプログラム |
US11/080,822 US7457812B2 (en) | 2004-10-29 | 2005-03-16 | System and method for managing structured document |
CNB2005100646039A CN100498771C (zh) | 2004-10-29 | 2005-04-15 | 用于管理结构化文件的系统和方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004316109A JP2006127235A (ja) | 2004-10-29 | 2004-10-29 | 構造化文書管理システム、構造化文書管理方法及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006127235A true JP2006127235A (ja) | 2006-05-18 |
Family
ID=36387676
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004316109A Pending JP2006127235A (ja) | 2004-10-29 | 2004-10-29 | 構造化文書管理システム、構造化文書管理方法及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US7457812B2 (ja) |
JP (1) | JP2006127235A (ja) |
CN (1) | CN100498771C (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007096844A (ja) * | 2005-09-29 | 2007-04-12 | Nec Personal Products Co Ltd | 文書表示方法及び文書表示装置 |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006185408A (ja) * | 2004-11-30 | 2006-07-13 | Matsushita Electric Ind Co Ltd | データベース構築装置及びデータベース検索装置及びデータベース装置 |
JP5320697B2 (ja) * | 2007-07-26 | 2013-10-23 | 富士通株式会社 | 照合処理プログラムおよび照合処理装置 |
US8352509B2 (en) * | 2007-12-19 | 2013-01-08 | International Business Machines Corporation | Methods, systems, and computer program products for accessing a multi-format data object |
US8589788B2 (en) * | 2007-12-19 | 2013-11-19 | International Business Machines Corporation | Methods, systems, and computer program products for automatic parsing of markup language documents |
US8145794B2 (en) * | 2008-03-14 | 2012-03-27 | Microsoft Corporation | Encoding/decoding while allowing varying message formats per message |
US8397158B1 (en) | 2008-03-31 | 2013-03-12 | Sonoa Networks India (PVT) Ltd | System and method for partial parsing of XML documents and modification thereof |
JP2013246522A (ja) * | 2012-05-23 | 2013-12-09 | Hitachi Ltd | 構造化文書検索装置及びプログラム |
US10810368B2 (en) * | 2012-07-10 | 2020-10-20 | Robert D. New | Method for parsing natural language text with constituent construction links |
CN109657042A (zh) * | 2018-12-11 | 2019-04-19 | 浙江格林蓝德信息技术有限公司 | 结构化报告处理方法、装置、计算机设备和存储介质 |
CN114647649A (zh) * | 2022-05-13 | 2022-06-21 | 中电云数智科技有限公司 | 基于层序遍历的半结构化数据同步方法及装置 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3083024B2 (ja) * | 1993-06-21 | 2000-09-04 | キヤノン株式会社 | 文字処理装置及び方法 |
JPH07271813A (ja) | 1994-03-31 | 1995-10-20 | Toshiba Corp | 情報分類整理システム |
JPH0844766A (ja) | 1994-07-29 | 1996-02-16 | Fuji Xerox Co Ltd | 文書検索装置 |
CA2242158C (en) | 1997-07-01 | 2004-06-01 | Hitachi, Ltd. | Method and apparatus for searching and displaying structured document |
JP2001167087A (ja) * | 1999-12-14 | 2001-06-22 | Fujitsu Ltd | 構造化文書検索装置,構造化文書検索方法,構造化文書検索用プログラム記録媒体および構造化文書検索用インデックス作成方法 |
US6654737B1 (en) * | 2000-05-23 | 2003-11-25 | Centor Software Corp. | Hypertext-based database architecture |
JP2003157249A (ja) | 2001-11-21 | 2003-05-30 | Degital Works Kk | 文書の圧縮格納方法 |
JP2003288365A (ja) | 2002-03-28 | 2003-10-10 | Toshiba Corp | 付加情報管理方法及び付加情報管理システム |
AUPS194702A0 (en) * | 2002-04-24 | 2002-05-30 | Canon Kabushiki Kaisha | Markup-language document formatting in memory-constrained enviroment |
US8150818B2 (en) * | 2003-08-25 | 2012-04-03 | International Business Machines Corporation | Method and system for storing structured documents in their native format in a database |
-
2004
- 2004-10-29 JP JP2004316109A patent/JP2006127235A/ja active Pending
-
2005
- 2005-03-16 US US11/080,822 patent/US7457812B2/en active Active
- 2005-04-15 CN CNB2005100646039A patent/CN100498771C/zh not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007096844A (ja) * | 2005-09-29 | 2007-04-12 | Nec Personal Products Co Ltd | 文書表示方法及び文書表示装置 |
JP4746952B2 (ja) * | 2005-09-29 | 2011-08-10 | Necパーソナルプロダクツ株式会社 | 文書表示方法及び文書表示装置 |
Also Published As
Publication number | Publication date |
---|---|
US20060106831A1 (en) | 2006-05-18 |
US7457812B2 (en) | 2008-11-25 |
CN1766876A (zh) | 2006-05-03 |
CN100498771C (zh) | 2009-06-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7080067B2 (en) | Apparatus, method, and program for retrieving structured documents | |
US7386567B2 (en) | Techniques for changing XML content in a relational database | |
US6889223B2 (en) | Apparatus, method, and program for retrieving structured documents | |
US7975220B2 (en) | Apparatus, program product and method for structured document management | |
US20080010256A1 (en) | Element query method and system | |
US9361398B1 (en) | Maintaining a relational database and its schema in response to a stream of XML messages based on one or more arbitrary and evolving XML schemas | |
JP2008052662A (ja) | 構造化文書管理システム及びプログラム | |
US8762410B2 (en) | Document level indexes for efficient processing in multiple tiers of a computer system | |
WO2007018827A2 (en) | Lightweight application program interface (api) for extensible markup language (xml) | |
US8214403B2 (en) | Structured document management device and method | |
JP4247135B2 (ja) | 構造化文書記憶方法、構造化文書記憶装置、構造化文書検索方法 | |
US20050144153A1 (en) | Structured data retrieval apparatus, method, and computer readable medium | |
JP2006127235A (ja) | 構造化文書管理システム、構造化文書管理方法及びプログラム | |
JP2009544102A (ja) | Xml文書の、意味論を意識した処理 | |
JP4309818B2 (ja) | 構造化文書管理装置、検索装置、記憶方法、検索方法及びプログラム | |
JP2006127229A (ja) | 構造化文書検索システム、構造化文書検索方法及びプログラム | |
US20090307187A1 (en) | Tree automata based methods for obtaining answers to queries of semi-structured data stored in a database environment | |
JP3842572B2 (ja) | 構造化文書管理方法および構造化文書管理装置およびプログラム | |
JP3842576B2 (ja) | 構造化文書編集方法及び構造化文書編集システム | |
JP4289022B2 (ja) | 構造化文書処理方法及び装置及び構造化文書処理プログラム及び構造化文書処理プログラムを格納した記憶媒体 | |
JP3842574B2 (ja) | 情報抽出方法および構造化文書管理装置およびプログラム | |
JP4568267B2 (ja) | 構造化文書検索システム及びデータベース管理プログラム | |
JP5439606B1 (ja) | 構造化文書管理装置、方法およびプログラム | |
JP3842575B2 (ja) | 構造化文書検索方法、構造化文書管理装置及びプログラム | |
JP4406397B2 (ja) | 構造化文書検索システム及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071218 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080215 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080401 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080602 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20080620 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20080815 |