JP2007226813A - 構造化された文書を圧縮/伸長する方法 - Google Patents
構造化された文書を圧縮/伸長する方法 Download PDFInfo
- Publication number
- JP2007226813A JP2007226813A JP2007054875A JP2007054875A JP2007226813A JP 2007226813 A JP2007226813 A JP 2007226813A JP 2007054875 A JP2007054875 A JP 2007054875A JP 2007054875 A JP2007054875 A JP 2007054875A JP 2007226813 A JP2007226813 A JP 2007226813A
- Authority
- JP
- Japan
- Prior art keywords
- document
- component
- instruction
- group
- code
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/235—Processing of additional data, e.g. scrambling of additional data or processing content descriptors
- H04N21/2353—Processing of additional data, e.g. scrambling of additional data or processing content descriptors specifically adapted to content descriptors, e.g. coding, compressing or processing of metadata
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Library & Information Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Document Processing Apparatus (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Jellies, Jams, And Syrups (AREA)
- Press Drives And Press Lines (AREA)
- Input From Keyboards Or The Like (AREA)
- Auxiliary Devices For And Details Of Packaging Control (AREA)
Abstract
【解決手段】文書は、文書の構造を定義し、情報要素を表す、互いの中にネストされた複数の構造成分からなる少なくとも一つの構造スキーマ(1)と関連付けられている。さらに、本発明は、上記文書の構造スキーマ(1)を解析(11)してコンパイル(13)し、上記スキーマの各成分について実行可能な命令(5)のシーケンスを得ること、および、ビット・ストリーム形式の伸長する文書(10)を伸長(14’)することからなる。命令(5)のシーケンスは、制御コードおよび要素のコードまたは成分命令の呼び出しを挿入する命令と、制御コード値に基づいて上記シーケンスの実行の進捗を制御する命令とからなる。なお、上記ステップは命令(5)のシーケンスを上記ビット・ストリームに対して実行して、元の文書を復元することを含む。
【選択図】図1
Description
XML形式の文書の圧縮に適応化した圧縮アルゴリズムの開発については、「XMILL、XMLデータの高効率圧縮(XMILL: An Efficient Compressor for XML Data)」、エイチ・ライフク他(H. Liefke et al.)著、Sigmond Record、コンピュータ機器協会、アメリカ・ニューヨーク、No. 2、2000年6月、153〜164頁、および「ミリアウ:ウエッブにおける、XMLの高効率表示と送信を実現する符号化方式(Millau: An Encoding Format for Efficient Representation and Exchange of XML over the Web)」、エム・ジラルドット他(M. Girardot et al.)著、Computer Networks and ISDN Systems、North Holland Publising, アムステルダム、NL、Vol. 33、No. 1-6、2000年6月に記載がある。
該命令のシーケンスは、制御コードおよび情報要素の圧縮値または成分の命令シーケンスの呼び出しコードを挿入する命令と、制御コードの値の関数として、上記シーケンスの実行を制御する命令とからなり、
上記構造化された文書に対する上記命令シーケンスの実行は、上記構造化された文書を文書中の情報要素の圧縮値を含んだビット・ストリーム(流れ;英;stream 仏:flux binaire)に圧縮する。
n個のサブタイプを有する型の成分のために生成した上記命令シーケンスが、
上記文書の成分に対応する要素に適用するサブタイプを表すサブタイプコードを挿入し、ビット数で表した、このコードのサイズに関連した命令と、
上記サブタイプコードの値をテストする命令とを順に含み、
各テスト命令が、サブタイプコードのテスト済みの値と対応する要素のサブタイプへの参照と、上記サブタイプと関連付けられた要素の圧縮のために生成された命令シーケンスとに関連付けられている。
上記成分に対応する要素群が上記文書中に存在するかしないかを示す1ビットによる存在コードを挿入する命令と、
上記存在コードの値をテストする命令と、
上記テスト命令に関連して、上記文書中に該要素群が存在することを存在コードの値が示している場合、関連する出現回数とは無関係に、上記成分のために生成された命令シーケンスと、を順に含んでいる。
上記圧縮文書中で上記成分に対応する要素群が連続して出現する回数から最低出現回数を引いたものを示す出現回数コードを挿入し、ビット数で表した、このコードのサイズに関連した命令と、
上記出現回数コードの値に対応した反復回数を定義するループ命令と、
上記ループ命令に関連して、関連する出現回数とは無関係に、上記成分のために生成された命令シーケンスとを順に含んでいる。
上記文書中で上記成分に対応する要素群が少なくとも一回出現するかしないかを示す存在コードを挿入する命令と、
少なくとも一つの要素群が存在することを存在コードの値が示している場合、出現回数が1とmとの間の成分のために生成した命令シーケンスに関連する存在コードの値をテストする命令とを含んでいる。
上記文書中の上記成分に対応する要素群の出現を報知する1ビットの存在コードを挿入し、ビット数で表した、このコードのサイズに関連した命令と、
挿入する上記存在コードが上記要素群の新たな出現を示している限り実行するループ命令と、
上記ループ命令と関連して、上記成分のために生成した命令シーケンスと、上記文書中で上記要素群が新たに出現することを報知する1ビットの存在コードを新たに挿入する命令とを順に含んでいる。
上記構造化された文書(2)の構造スキーマ(1)は、順序付けした成分からなる、少なくとも一つのシーケンス型(順序型;英:sequence type;仏:de type se'quence)成分を含んでおり、当該シーケンス中で現われる順序は、上記シーケンス型グループの成分に対応する要素群が文書中で現われる順序を定義し、また、
n個の成分からなるシーケンスのために生成した上記命令シーケンスが、該シーケンス中の各成分のために生成した命令シーケンスを連続して含んでいる。
対応するn個の要素群を定義するn個の成分からなる選択成分のグループのために生成した上記命令シーケンスが、
n個の要素群のうちでどの要素群が文書中で現われるかを示す要素群番号コードを挿入し、ビット数で表した、このコードのサイズに関連した命令と、
上記要素群番号コードの値をテストする、複数の命令とを順に含み、各テスト命令は、それぞれ要素群番号コードのテスト済みの値に対応する要素群(Xi)に対応する成分のために生成された命令シーケンスに関連付けられている。
圧縮する上記文書の構造スキーマが、少なくとも一つの順序付けしていない成分の型のグループを含み、順序付けしていないグループ中の各成分が要素群に対応し、順序付けしていないグループ型のグループが、上記文書において、上記順序付けしていない型のグループの成分に対応する全ての要素群を任意の順序で含んだグループに対応し、
文書中のn個の要素群に対応するn個の成分からなる順序付けしていない型のグループのために生成した上記命令シーケンスが、
上記文書中で次に現われる要素群を示す要素群の番号コードを挿入し、ビット数で表した、このコードのサイズに関連した命令と、
上記要素群番号コードの値をテストする命令とを順に含み、各テスト命令は、それぞれ、要素群番号コードのテスト済みの値に対応する要素群に対応する成分のために生成された命令シーケンスと、当該要素群に対応する成分を除いた、順序付けしていないグループの全ての成分からなる順序付けしていない型のグループのために生成された命令シーケンスと関連付けられている。
このシーケンスは、
制御コードと、情報要素の圧縮値、または成分命令シーケンスを呼び出す呼び出しコードとを読み取る命令と、
上記圧縮文書を形成するビット・ストリームにおいて、上記制御コード値の関数として上記シーケンスの実行を制御する命令とを含み、
命令シーケンスを上記圧縮文書に対して実行すれば、元の文書と同じ形式かつ少なくとも同等の構造に文書が復元できる。
n個のサブタイプを有する型の成分のために生成した命令シーケンスが、
文書中の成分に対応した要素に適用するサブタイプの番号を表すサブタイプコードを読み取り、ビット数で表した、このコードのサイズに関連した命令と、
当該サブタイプコードの値をテストする命令とを順に含み、上記各テスト命令は、それぞれ、サブタイプコードのテスト済みの値と対応する要素のサブタイプへの参照と、サブタイプと関連付けられた要素の伸長のために生成された命令シーケンスとに関連付けられている。
上記成分に対応する要素群が上記圧縮文書中に存在するかしないかを示す1ビットの存在コードを読み取る命令と、
上記存在コードの値をテストする命令と、
上記テスト命令に関連して、上記圧縮文書中に該要素群が存在することを存在コード値が示している場合、関連する出現回数とは無関係に、上記成分のために生成された命令シーケンスと、を順に含んでいる。
上記圧縮文書中で上記成分に対応する要素群が連続して出現する回数から最低出現回数を引いたものを示す出現回数コードを読み取り、ビット数で表したこのコードのサイズに関連した命令と、
出現回数コードの値に対応する反復回数を定義するループ命令と、
上記ループ命令に関連して、関連する出現回数とは無関係に、上記成分のために生成された命令シーケンスと、を順に含んでいる。
上記圧縮文書中で上記成分に対応する要素群が少なくとも一回出現するかしないかを示す1ビットの存在コードを読み取る命令と、
少なくとも一つの要素群が存在することを存在コードの値が示している場合、出現回数が1とnとの間の成分のために生成した命令シーケンスに関連する存在コードの値をテストする命令とを含んでいる。
上記圧縮文書中の上記成分に対応する要素群の出現が出現するかしないかを示す1ビットの存在コードを読み取り、ビット数で表した、このコードのサイズに関連した命令と、
上記圧縮文書のビット・ストリームから読み取った上記存在コードが上記要素群の新たな出現を示している限り実行するループ命令と、
上記ループ命令と関連して、上記成分について生成した命令シーケンスと、上記圧縮文書中で上記要素群が新たに出現するかしないかを示す1ビットの存在コードを新たに挿入する命令とを連続して含んでいる。
上記圧縮文書の構造スキーマが、順序付けした成分からなる、少なくとも一つのシーケンス型成分を含んでおり、上記シーケンス中で現われる順序が上記シーケンス型グループの成分に対応する要素群が文書中で現われる順序を定義し、また、
n個の成分からなるシーケンスのために生成した上記命令シーケンスが、該シーケンス中の各成分のために生成した命令シーケンスを連続して含んでいる。
伸長する上記文書の構造スキーマが選択成分グループ型の成分を少なくとも一つ含んでいて、各選択成分が情報要素群に対応し、上記選択成分グループ型の成分が、上記文書中で選択成分に対応する情報群の一つに対応し、
選択成分のグループのために生成した上記命令シーケンスが、n個の要素(X1, X2, ..., Xn)群をそれぞれ定義するn個の成分からなり、
n個の要素群のうちで上記文書中に現われる要素群を示す要素群番号コードを読み取り、ビット数で表した、このコードのサイズに関連した命令と、
上記要素群番号コードの値をテストする複数の命令とを順に含み、各テスト命令は、それぞれ要素群番号コードのテスト済みの値に対応する要素群に対応する成分のために生成された命令シーケンスに関連付けられている。
圧縮する上記文書の構造スキーマが、少なくとも一つの、順序付けしていない成分の型のグループからなり、順序付けしていないグループ中の各成分が要素群に対応し、順序付けしていないグループ型のグループが、上記文書において、上記順序付けしていない型のグループの成分に対応する全ての要素群を任意の順序で含んだグループに対応し、
文書中のn個の要素群に対応するn個の成分からなる順序付けしていない型のグループについて生成した上記命令シーケンスが、
上記文書中で次に現われる要素群を示す要素群の番号コードを読み取り、ビット数で表した、このコードのサイズに関連した命令と、
上記要素群番号コードの値をテストする命令とを順に含み、各テスト命令は、それぞれ、要素群番号コードのテスト済みの値に対応する要素群に対応する成分のために生成された命令シーケンスと、当該要素群に対応する成分を除いた、順序付けしていないグループの全ての成分からなる順序付けしていない型のグループのために生成した命令シーケンスとに関連付けられている。
<complexType>
<Choice>
<element name="A" type="TA" minOccurs=1 maxOccurs=1/>
<element name="B" type="TB" minOccurs=1 maxOccurs=1/>
</Choice>
<attribute name="a2" required=false type="boolean"/>
<attribute name="a1" required=true type="integer"/>
</complexType>
</element>
このスキーマは、「c」という構造成分(コンポーネント;英:component;仏:composant )が、第一の省略可能なブーリアン(論理;英:boolean;仏:boole'en)型の属性a2と、構造中に常に存在する第二の整数型の属性a1と、型がそれぞれ「TA」、「TB」と表される選択成分A、Bのグループとからなる複雑構造を有していることを示している。なお、選択成分A、Bは、いずれか一つが一回だけ構造中に現われる。
・順序付けされた成分のリストを定義するSEQ。文書中の対応する要素全ては、該リストにおいて指定された順序で掲載されていなければならない。
・選択成分のグループを定義するCHO。グループの成分に対応する一つの要素が、文書中に含まれていなければならない。
・複数成分からなるグループを定義するAND。この成分に対応する要素は、全て任意の順序で文書中に含まれていなければならず、この順序は、変更してはならない。XMLスキーマの規格(基準;標準;英:standard ;仏:norme)では、このグループは、「all(全て)」のグループに相当する。
・複数成分からなるグループを定義するANDNO。この成分に対応する要素は、全て任意の順序で文書中に含まれていなければならず、この順序は、重要ではない。このグループを使って、XMLの規格では順序が重要でない属性を符号化してもよい。
・文書中で見つかる可能性のある要素を全て含んだANY。
ここで、A[x,y]は、成分Aが文書中でX回からY回までの間で繰り返し現われる要素に相当することを示し、この繰り返し回数を不定値を表す記号「*」で表すこともできる。
TA→SEQ[1,1](AND[1,1](a3int[1,1],a4int[0,1]),SEQ[1,1](XTC[1,1],YTC[1,1]))
TB→SEQ[1,1](a1bool[1,1],a5bool[1,1])
によって求めてもよく、このとき、それぞれ図2aと図2bに示すツリーで表される。
<restriction base="TA">
</restriction>
</complexType>
<complexType type="TA2">
<extension base="TA">
</extension>
</complexType>
<element name="X" type="TA" />
この構文は、制限または拡張によって、型TA1とTA2が型TAのサブタイプであると定義する。また、型TAの情報成分Xを定義する。
<X xsi:type="TA1">
を使って追加すればよい。
</complexType>
また、構造成分は、決定論的(決定性;英:deterministic;仏:de'terministes)でないといけない。つまり、文書の要素は、一通りにしか解釈できないものでないといけない。例えば、CHO(a,SEQ(a,b))スキーマでは、aが文書中に現われた場合には、その後、bが現われるはずなのかどうかが分からない。こういった目的を持ったアルゴリズムがあり、本発明の方法に対して該アルゴリズムを適用すれば、非決定論的スキーマを決定論的スキーマに変えられる。参考文献としては、例えば、「正規表現から有限オートマタへ(Regular expressions into finite automata)」、ブルッグマン−クレイン、アン(Bruggemann-Klein, Anne)著、Extended Abstract in I. Simon. Hrsg., LATIN 1992, S. 97-98. Springer-Verlag, Berlin 1992(全稿は、Theoretical Computer Science 120; 197-213, 1993に掲載)が挙げられる。このように、上記スキーマをSEQ(a,b[0,1])で置き換えることができる。
GROUP[nG, mG](X[nx, mx])
ここで、グループは、SEQ、CHO、またはAND型のグループである。任意のグループを次の成分で置き換えてもよい。
X[nG.nx,mG.mx]
ツリーを壊さずに簡素化ができる他の場合として、選択成分CHOのグループが、最低出現回数が0に等しい、少なくとも一つの成分からなる場合が挙げられる。このように、グループ CHO[nc,mc](X1[ nx1,mx1],X2[0,mx2],X3[ nx3,mx3])を、CHO[0,mc](X1[nx1,mx1],X2[1,mx2],X3[nx3,mx3])に置き換えることができる。
・グループGが正規化される前にグループG内にサブグループgiがあれば、これを正規化するステップ。この正規化アルゴリズムは、再帰的である。
・さらに、サブグループgiの前にグループG中に成分eiがあれば、これを記録するステップ、
・予め定義した順に成分eiを記録するステップ、
・予め定義した順にサブグループgiを記録するステップ、および、
・上記ステップで生成した順にグループGの成分(およびサブグループ)の全ての署名を連結することによって、グループGの署名を決定するステップ。
・要素Xに適用するサブタイプの番号(英:number;仏:nume'ro)を表すサブタイプのコードflagPolyを挿入または読み取り、ビット数として、このコードのサイズと関連付けられた一つの命令。および、
・サブタイプコードの値をテストする複数の命令。当該各テスト命令は、
それぞれ、要素Xの値を挿入するまたは読み取る命令、あるいは、要素Xに対応した命令シーケンスを呼び出す命令と関連付けられており、当該テスト命令は、サブタイプコードのテスト値に対応する要素Xのサブタイプへの参照と関連付けられている。
・要素型が上記デフォルト型であるのか、あるいは、このデフォルト型のサブタイプであるのかを示す1ビットのサブタイピング存在コードtypInfoFlagを挿入するまたは読み取る命令。
・サブタイピング存在コードの値をテストする命令、および、
・このテスト命令と関連して、要素型がサブタイプであることをサブタイピング存在コードの値が示している場合、表1に示すようなポリモフィズムを定義する命令シーケンス、他の場合には、要素Xのデフォルト型への参照と関連付けて要素Xの値を挿入するまたは読み取る命令。
・要素Xが圧縮された文書(圧縮文書)中に存在するかしないかを示す、1ビットの存在コード"flagX"を挿入あるいは読み取り、ビット数として、このコードのサイズと関連付けられた命令。
・存在コードの値をテストする命令。および、
・このテスト命令と関連して、要素Xが文書中に存在することを上記存在コードの値が示しているときに、該要素Xの値を挿入するまたは読み取る命令、あるいは、要素Xに対応する命令シーケンスを呼び出す命令。
・要素Xが現われる最低回数nを圧縮文書で要素Xが連続して現われる回数から引いた数を表す出現回数コードloopflagXを、挿入または読み取り、ビット数で表した、このコードのサイズに関連付けられた命令。
・出現回数コードの値に対応する繰り返し回数を定義するループ命令。および、
・上記ループ命令に関連して、要素Xの値を挿入するまたは読み取る、あるいは、要素Xに対応する命令シーケンスを呼び出す命令。
・1ビットの存在コードshuntflagXを挿入するまたは読み取る命令。当該存在コードshuntflagXは、圧縮文書中に要素Xが一つ以上存在するかしないかを示している。および、
・要素Xが少なくとも一つ存在することをこの存在コード値が示しているとき、1とmの間の要素Xの出現回数と同じ回数生成した命令シーケンスに関連して、該存在コード値をテストする命令。
・文書中に要素Xが現われるかどうかを示す、1ビットのflagX存在コードを挿入または読み取り、ビット数で表した、このコードのサイズに関連付けられた命令。
・挿入した読み取った上記存在コードが要素Xの新たな出現の存在を示している限り実行されるループ命令。
・上記ループ命令に関連して、要素Xの値を挿入するまたは読み取る、あるいは要素Xに対応する命令シーケンスを呼び出す命令。および、
・文書中で要素Xが新たに現われるかどうかを示す、新たな1ビットflagX存在コードを挿入するまたは読み取る命令。
・圧縮文書中において、成分番号Xi(i=1 ... n)を示し、このグループ中で次に挿入するまたは読み取る要素を表す成分番号コードflagChoXを、挿入または読み取り、ビット数で表した、このコードのサイズに関連付けられた命令。および、
・該要素番号コードの値をテストする命令。このテスト命令は、それぞれ、要素Xiの値を挿入するまたは読み取る命令、もしくは成分コードのテスト済みの値に対応する要素Xiに対応する命令シーケンスを呼び出す命令と関連付けられている。
・圧縮文書中において、該グループの成分番号Xiを示し、このグループ中で次に挿入するまたは読み取る要素Xiを表す成分番号コードflagChoXを、挿入または読み取り、ビット数で表した、このコードのサイズに関連付けられた命令。および、
・該成分番号コードの値をテストする命令。各テスト命令は、それぞれ、要素Xiの値を挿入するまたは読み取る命令、もしくは、成分コードのテスト済みの値に対応する要素Xiに対応する命令シーケンスを呼び出す命令と、成分Xiを除いた、該グループ中の全ての成分X1, ..., Xnからなる「順序付けしていないグループ」の型のグループについて生成される命令シーケンスとに関連付けられている。
「sPnYnMnDTnHnMnS」
を考えてみる。ここで、sは、+または−符号である。また、nYは、年の数字(整数値であり、限定はない)を、nMは、月の数字(整数値であり、限定はない)を、nDは、日の数字(整数値であり、限定はない)をそれぞれ表す。Tは、日付と時間との間を区切る文字である。nHは、時間の数字(整数値であり、限定はない)を、nMは、分の数字(整数値であり、限定はない)を、nSは、秒の数字(十進;小数;英:decimal;仏:de'cimal)をそれぞれ表している。この要素はどれも省略が可能である。
ここで、"\+"はプラス(+)の文字を挿入することを示し、(x|y)は、要素xまたはyを挿入することを示す。また、?は、先の要素の挿入が省略可能なであることを、"\d+"は任意のビット数の二進数を示す。
各要素の長さの符号化が必須か、省略可能か、あるいは、該文書中には存在しないのかを示すパラメータと、
要素がサブタイプに対応付けられているか、つまり、その要素の基底型より明確な(細かい;英:precise;仏:pre'cis)型に関連付けられているかどうかを示すパラメータと、
出現回数について使用した符号化の種類を示すパラメータとである。
ここで、00101は、出現回数を二進数で表した値を示し、UlNT_VLC形式では、5に等しい。また、Va1、Va2、Va3は、それぞれ、a1、a2、a3の出現回数の値である。
11が出現回数のエンド・コードであり、この場合、CHOグループの選択コードに組み込まれている。
SEQ[0,*](a1[0,*],CHO[0,*](b1,b2))
次のバイナリ構文が得られる。
00010 上記シーケンスの出現回数(この場合二回)
0 a = 0の出現回数
l 0に等しくないCHOの出現回数
00010 CHOの出現回数(二回)
1 b2の選択コード
Vb2 b2の符号化値
0 b1の選択コード
Vb1 b1の符号化値
1 a = 0 の出現回数
00001 a1の出現回数(一回)
Va1 a1の符号化値
0 CHO = 0 の出現回数。
ここで、pは、要素長さを符号化するのに用いるバイト数(ANSIエンコーディング、または、各バイトの高位ビットを使って、この数値を符号化するのに用いるバイト数)を表す。hは、この長さで残ったビット数である(h<8)。
Claims (32)
- ネストされて、それぞれが情報の型と関連付けられている複数の情報要素からなる構造化された文書を、デジタルデータ通信網を通じて転送するかまたは記録するために圧縮する方法であり、上記構造化された文書(2)は、文書のツリー状構造を定義し、ネストされた複数の構造成分(a3, a4, X, Y, a1, a5, a1, a2, A, B, 32, 33, 34, 40, 44, 45, 46)からなる少なくとも一つの構造スキーマ(1;31、39、43)と関連付けられていて、文書情報の型は、それぞれ上記スキーマの中の成分によって定義されている方法において、
上記方法は、
制御コードと、情報要素を圧縮した値または成分の命令シーケンスの呼び出しコードとを、コンピュータの文書符号化手段がビット・ストリームに挿入する命令と、
制御コードの値の関数として、上記命令シーケンスの実行を上記文書符号化手段が制御する命令と
からなるシーケンスであり、上記構造スキーマの各成分に対して、実行可能な命令シーケンス(5)を得るために上記文書構造スキーマ(1)を解析する(11、13)、コンピュータの構文分析手段による処理ステップと、
上記構造スキーマ各成分に対する命令シーケンスを生成する、コンピュータの命令シーケンス生成手段による処理ステップと、
上記構造化された文書(2)を、当該文書中の情報要素を圧縮した値を含んだビット・ストリーム(10)へ圧縮する(14)ために、上記構造化された文書(2)に対して上記命令シーケンスを実行する、上記文書符号化手段による処理ステップと
を含んだことを特徴とする方法。 - 上記文書がサブ要素に分解できない基底要素からなり、
少なくとも一つの型の基底要素情報が、前もって、その情報の型にあわせた圧縮アルゴリズム(16)と関連付けられ、
上記方法では、上記文書符号化手段が、上記命令シーケンス(5)の実行中に、そのアルゴリズムと関連付けられた型の各情報要素の値に対して、上記圧縮アルゴリズム(16)を適用することを含んでいることを特徴とする請求項1に記載の圧縮方法。 - 上記方法では、コンピュータの専用符号化プログラム生成手段が、上記構造スキーマの各成分について得られた命令シーケンス(5)をコンパイルして、上記構造スキーマ専用、かつ、コンピュータによって直接実行可能もしくは解釈可能で、上記構造スキーマ(1)を有する文書(2)を圧縮するためのバイナリ符号化プログラム(6)を得るステップ(17)を含んでいることを特徴とする請求項1または2に記載の圧縮方法。
- 上記方法では、コンピュータの変換正規化手段が、文書構造スキーマ(5)を前もって正規化して、上記スキーマの成分の、予め定義された一つの順序を得るステップ(12)を含んでいることを特徴とする請求項1ないし3のいずれか一つに記載の圧縮方法。
- 上記方法では、コンピュータの変換正規化手段が、構造成分におけるネストのレベルの個数を減らすことからなり、上記文書構造スキーマを前もって最適化し簡素化するステップ(12)を含んでいることを特徴とする請求項1ないし4のいずれか一つに記載の圧縮方法。
- 上記文書(2)中の少なくとも一つの情報要素は、上記文書符号化手段により生成されたビット・ストリーム中の情報要素コードと対応付けられており、
当該情報要素コードは、上記ビット・ストリーム中で、その要素に先行する情報要素をコンピュータの文書復号化手段が伸長しなくても、当該ビット・ストリーム(10)中のある特定の圧縮された情報要素に上記文書復号化手段が直接アクセスできるように上記文書符号化手段によりマークされていることを特徴とする請求項1ないし5のいずれか一つに記載の圧縮方法。 - 上記文書符号化手段により生成された圧縮文書(10)は、上記構造化された文書(2)の各情報要素について、情報要素に関連付けられている情報の型と該情報要素のバイナリ値とを上記文書符号化手段が決定するために用いるコードを含んでいることを特徴とする請求項1ないし6のいずれか一つに記載の圧縮方法。
- 上記文書(2)中の少なくとも一つの情報要素からなる要素群が複数回出現することに対応した成分について上記文書符号化手段が生成した上記ビット・ストリームは、予め定義したエンド・コードを含んでいることを特徴とする請求項1ないし7のいずれか一つに記載の圧縮方法。
- 上記構造スキーマ(1)の各成分は、少なくとも一つの情報要素からなる上記文書(2)中の要素群に対応し、また、出現する可能性のある回数の組と関連付けられていて、この組は、この成分に対応する要素群が、それの属するレベルのすぐ上のレベルの情報要素中に現われえる回数を示していることを特徴とする請求項1ないし8のいずれか一つに記載の圧縮方法。
- 出現回数が0か1に等しい成分のために上記命令シーケンス生成手段が生成した上記命令シーケンスは、
上記成分に対応する要素(X)群が上記文書(2)中に存在するかしないかを示す、1ビットによる存在コード(flagX)を上記文書符号化手段が挿入する命令と、
上記存在コードの値を上記文書符号化手段がテストする命令と、
上記テスト命令に関連して、上記文書中に該要素群(X)が存在することを存在コードの値が示している場合、関連する出現回数とは無関係に、上記成分のために上記命令シーケンス生成手段により生成された命令シーケンスと、を順に含んでいることを特徴とする請求項9に記載の圧縮方法。 - 出現回数がnとmとの間の成分のために上記命令シーケンス生成手段が生成した上記命令シーケンスは、
上記圧縮文書中で上記成分に対応する要素群(X)が連続して出現する回数から最低出現回数を引いたものを示す出現回数コード(loopflagX)を、ビット数で表したこのコードのサイズと共に上記文書符号化手段が挿入する命令と、
上記出現回数コードの値に対応した反復回数を定義するループ命令と、
上記ループ命令に関連して、関連する出現回数とは無関係に、上記成分のために上記命令シーケンス生成手段により生成された命令シーケンスとを順に含んでいることを特徴とする請求項9または10のいずれかに記載の圧縮方法。 - 出現回数が0とmとの間の成分のために上記命令シーケンス生成手段が生成した上記命令シーケンスは、さらに、
上記文書中で上記成分に対応する要素群(X)が少なくとも一回出現するかしないかを示す存在コード(shuntflagX)を上記文書符号化手段が挿入する命令と、
少なくとも一つの要素群が存在することを存在コードの値が示している場合、出現回数が1とmとの間の成分のために上記命令シーケンス生成手段が生成した命令シーケンスに関連する存在コードの値を上記文書符号化手段がテストする命令とを含んでいることを特徴とする請求項11に記載の圧縮方法。 - 出現回数がnとmとの間の成分のために上記命令シーケンス生成手段が生成した上記命令シーケンスは、
上記文書(2)中の上記成分に対応する要素群(X)の出現を報知する1ビットの存在コード(flagX)を、ビット数で表したこのコードのサイズと共に上記文書符号化手段が挿入する命令と、
上記文書符号化手段が挿入する上記存在コードが上記要素(X)群の新たな出現を示している限り上記文書符号化手段により実行されるループ命令と、
上記ループ命令と関連して、上記成分のために上記命令シーケンス生成手段が生成した命令シーケンスと、上記文書中で上記要素群(X)が新たに出現することを報知する1ビットの存在コード(flagX)を、上記文書符号化手段が新たに挿入する命令とを順に含んでいることを特徴とする請求項9に記載の圧縮方法。 - 上記構造スキーマ(1)中の各成分が、少なくとも一つの情報要素からなる要素群に対応すること、
上記構造化された文書(2)の構造スキーマ(1)は、順序付けした成分からなる、少なくとも一つのシーケンス型成分を含んでおり、当該シーケンス中で現われる順序は、上記シーケンス型グループの成分に対応する要素群が文書中で現われる順序を定義すること、および、
n個の成分(X1, X2, ..., Xn)からなるシーケンスのために上記命令シーケンス生成手段が生成した上記命令シーケンスは、該シーケンス中の各成分のために上記命令シーケンス生成手段が生成した命令シーケンスを連続して含んでいることを特徴とする請求項1ないし13のいずれか一つに記載の圧縮方法。 - 上記構造スキーマ(1)の各成分が、少なくとも一つの情報要素からなる要素群に対応し、上記文書符号化手段が圧縮する上記文書の構造スキーマ(1)が選択成分グループ型の成分を少なくとも一つ含み、各選択成分が情報要素群に対応し、上記選択成分グループ型の成分が、上記文書中の選択成分に対応する情報群の一つに対応することと、
対応するn個の要素群(X1, X2, ..., Xn)を定義するn個の成分からなる選択成分のグループのために上記命令シーケンス生成手段が生成した上記命令シーケンスが、
n個の要素群(X1, X2, ..., Xn)のうちでどの要素群が文書(2)中で現われるかを示す要素群番号コード(flagChoX)を、ビット数で表したこのコードのサイズと共に上記文書符号化手段が挿入する命令と、
上記要素群番号コードの値を上記文書符号化手段がテストする複数の命令とを順に含み、
各テスト命令は、それぞれ要素群番号コードのテスト済みの値に対応する要素群(Xi)に対応する成分のために上記命令シーケンス生成手段により生成された命令シーケンスに関連付けられていることとを特徴とする請求項1ないし14のいずれか一つに記載の圧縮方法。 - 上記構造スキーマ(1)の各成分が、少なくとも一つの情報要素からなる要素群に対応していること、
上記文書符号化手段が圧縮する上記文書の構造スキーマ(1)が、少なくとも一つの、順序付けしていない成分グループ型を含み、当該順序付けしていないグループ中の各成分が要素群に対応し、当該順序付けしていないグループ型のグループが、上記文書において、上記順序付けしていない型のグループの成分に対応する全ての要素群を任意の順序で含んだグループに対応すること、および、
上記文書中のn個の要素群(X1, X2, ..., Xn)に対応するn個の成分からなる順序付けしていない型のグループのために上記命令シーケンス生成手段が生成した上記命令シーケンスが、
文書(2)中で次に現われる要素群を示す要素群(Xi)の番号コード(flagChoX)を、ビット数で表したこのコードのサイズと共に挿入する命令と、
上記要素群番号コードの値を上記文書符号化手段がテストする命令とを順に含み、
各テスト命令は、それぞれ、要素群番号コードのテスト済みの値に対応する要素群(Xi)に対応する成分のために上記命令シーケンス生成手段により生成された命令シーケンスと、当該要素群(Xi)に対応する成分を除いた、順序付けしていないグループの全ての成分(X1, ..., Xn)からなる順序付けしていない型のグループのために上記命令シーケンス生成手段により生成された命令シーケンスとに関連付けられていることを特徴とする請求項1ないし15のいずれか一つに記載の圧縮方法。 - ネストされて、それぞれが情報の型と関連付けられている複数の情報要素からなる、デジタルデータ通信網を通じて転送されたかまたは記録された、構造化された文書を伸長する方法であり、上記構造化された文書(2)は、文書のツリー状構造を定義し、ネストされた複数の構造成分(a3, a4, X, Y, a1, a5, a1, a2, A, B, 32, 33, 34, 40, 44, 45, 46)からなる少なくとも一つの構造スキーマ(1; 31、39、43)と関連付けられていて、文書情報の型はそれぞれ上記スキーマの成分によって定義されている方法において、
上記方法は、
コンピュータの文書符号化手段により圧縮された上記文書(10)を形成するビット・ストリーム中の制御コードを、情報要素の圧縮された値または成分の命令シーケンスの呼び出しコードと共にコンピュータの文書復号化手段が読み取る命令と、
上記制御コードの値の関数として、上記シーケンスの実行を上記文書復号化手段が制御する命令と
からなるシーケンスであり、上記構造スキーマの各成分に対して、実行可能な命令シーケンス(5)を得るために上記文書構造スキーマ(1)を解析する(11、13)、コンピュータの構文分析手段よる処理ステップと、
上記構造スキーマ各成分に対する命令シーケンスを生成する、コンピュータの命令シーケンス生成手段による処理ステップと、
元の文書(2)と同じ形式でありかつ少なくとも同等の構造を持つ文書(2’)を復元するために、圧縮された上記文書(10)に対して命令シーケンスを実行する、上記文書復号化手段による処理ステップと
を含んだことを特徴とする方法。 - 上記構造化された文書(2)がサブ要素に分解できない基底要素からなり、
少なくとも一つの型の基底要素情報が、その情報の型にあわせた伸長アルゴリズム(16’)と関連付けられ、
該方法では、上記文書復号化手段が、上記圧縮文書(10)を形成するビット・ストリーム中の命令シーケンス(5)の実行中にビット・ストリーム中の上記情報型に対応する情報要素バイナリコードを検出するステップと、
上記文書復号化手段がこのバイナリコードに対して上記伸長アルゴリズムを適用するステップとを含んでいることを特徴とする請求項17に記載の伸長方法。 - 上記方法では、コンピュータの専用復号化プログラム生成手段が、上記構造スキーマ(1)の各成分について得られた命令シーケンス(5)をコンパイルして、上記構造スキーマ専用、かつ、コンピュータによって直接実行可能もしくは解釈可能で、この構造スキーマを有する文書(10)を伸長するためのバイナリ復号化プログラム(6)を得るステップ(17)を含んでいること特徴とする請求項17または18に記載の伸長方法。
- 上記方法では、コンピュータの変換正規化手段が、文書構造スキーマ(5)を前もって正規化して、上記スキーマの成分の、予め定義された一つの順序を得るステップ(12)を含んでいることを特徴とする請求項17ないし19のいずれか一つに記載の伸長方法。
- 上記方法では、コンピュータの変換正規化手段が、構造成分グループの階層の個数を減らすことからなり、上記文書構造スキーマを前もって最適化し簡素化するステップ(12)を含んでいることを特徴とする請求項17ないし20のいずれか一つに記載の伸長方法。
- ビット・ストリーム中で、その要素に先行する情報要素を上記文書復号化手段が伸長しなくても、この情報要素に上記文書復号化手段が直接アクセスできるように、少なくとも一つの情報要素コードを上記圧縮文書(10)のビット・ストリーム中で上記文書復号化手段が識別することを特徴とする請求項17ないし21のいずれか一つに記載の伸長方法。
- 上記圧縮文書(10)は、上記情報要素と上記文書符号化手段により圧縮された情報要素のバイナリの値とに関連付けられた情報型を決定するために、元の文書における各情報要素のコードを含んでいることを特徴とする請求項17ないし22のいずれか一つに記載の伸長方法。
- 上記スキーマ(1)の成分に対応する少なくとも一つの情報要素からなる要素群が複数回出現するグループの末尾は、上記圧縮文書(10)のビット・ストリームでは、上記文書符号化手段により決定されたバイナリコードによりマークされていることを特徴とする請求項17ないし23のいずれか一つに記載の伸長方法。
- 上記構造スキーマ(1)の各成分は、少なくとも一つの情報要素からなる文書(10)のビット・ストリームの要素群に対応し、また、出現する可能性のある回数の組と関連付けられていて、この組は、この構造成分に対応する要素群が、それの属するレベルのすぐ上のレベルの情報要素中に現われえる回数を示していることを特徴とする請求項17ないし24のいずれか一つに記載の伸長方法。
- 出現回数が0か1に等しい成分のために上記命令シーケンス生成手段が生成した上記命令シーケンスは、
上記成分に対応する要素群(X)が上記圧縮文書中に存在するかしないかを示す1ビットの存在コード(flagX)を上記文書復号化手段が読み取る命令と、
上記存在コードの値を上記文書復号化手段がテストする命令と、
上記テスト命令に関連して、上記圧縮文書中に該要素群(X)が存在することを存在コードの値が示している場合、関連する出現回数とは無関係に、上記成分のために上記命令シーケンス生成手段により生成された命令シーケンスと、を順に含んでいることを特徴とする請求項25に記載の伸長方法。 - 出現回数がnとmとの間の成分のために上記命令シーケンス生成手段が生成した上記命令シーケンスは、
上記圧縮文書中で上記成分に対応する要素群(X)が連続して出現する回数から最低出現回数を引いたものを示す出現回数コード(loopflagX)を、ビット数で表したこのコードのサイズと共に上記文書復号化手段が読み取る命令と、
上記出現回数コードの値に対応する反復回数を定義するループ命令と、
上記ループ命令に関連して、関連する出現回数とは無関係に、上記成分のために上記命令シーケンス生成手段により生成された命令シーケンスと、を順に含んでいることを特徴とする請求項25または26のいずれかに記載の伸長方法。 - 出現回数が0とmとの間の成分のために上記命令シーケンス生成手段が生成した上記命令シーケンスは、さらに、
上記圧縮文書中で上記成分に対応する要素群(X)が少なくとも一回出現するかしないかを示す1ビットの存在コード(shuntflagX)を上記文書復号化手段が読み取る命令と、
少なくとも一つの要素群が存在することを存在コードの値が示している場合、出現回数が1とnとの間の成分のために上記命令シーケンス生成手段が生成した命令シーケンスに関連する存在コードの値を上記文書復号化手段がテストする命令とを含んでいることを特徴とする請求項27に記載の伸長方法。 - 出現回数がnとmとの間の成分について上記命令シーケンス生成手段が生成した上記命令シーケンスは、
上記圧縮文書(10)中の上記成分に対応する要素群(X)が出現するかしないかを示す1ビットの存在コード(flagX)を、ビット数で表したこのコードのサイズと共に上記文書復号化手段が読み取る命令と、
上記圧縮文書のビット・ストリームから上記文書復号化手段が読み取った上記存在コードが上記要素群(X)の新たな出現を示している限り上記文書復号化手段により実行されるループ命令と、
上記ループ命令と関連して、上記成分について上記命令シーケンス生成手段が生成した命令シーケンスと、上記圧縮文書(10)中で上記要素群(X)が新たに出現するかしないかを示す1ビットの存在コード(flagX)を上記文書符号化手段が新たに挿入する命令とを連続して含んでいることを特徴とする請求項25に記載の伸長方法。 - 上記構造スキーマの各成分(1)が少なくとも一つの情報要素からなる要素群に対応すること、
上記圧縮文書(10)の構造スキーマ(1)が、順序付けした成分からなる、少なくとも一つのシーケンス型成分を含んでおり、当該シーケンス中で現われる順序は、上記シーケンス型グループの成分に対応する要素群が文書中で現われる順序を定義すること、および、
n個の成分(X1, X2, ..., Xn)からなるシーケンスのために上記命令シーケンス生成手段が生成した上記命令シーケンスは、該シーケンス中の各成分のために上記命令シーケンス生成手段が生成した命令シーケンスを連続して含んでいることを特徴とする請求項17ないし29のいずれか一つに記載の伸長方法。 - 上記構造スキーマ(1)の各成分が、少なくとも一つの情報要素からなる要素群に対応すること、
上記文書復号化手段が伸長する上記文書の構造スキーマ(1)が選択成分グループ型の成分を少なくとも一つ含んでいて、各選択成分が情報要素群に対応し、上記選択成分グループ型の成分が、上記文書中で選択成分に対応する情報群の一つに対応すること、および、
選択成分のグループのために上記命令シーケンス生成手段が生成した上記命令シーケンスが、n個の要素群をそれぞれ定義するn個の成分(X1, X2, ..., Xn)からなり、
n個の要素群(X1, X2, ... Xn)のうちで上記文書中に現われる要素群を示す要素群番号コード(flagChoX)を、ビット数で表したこのコードのサイズと共に上記文書復号化手段が読み取る命令と、
上記要素群番号コードの値を上記文書復号化手段がテストする、複数の命令とを順に含み、
各テスト命令は、それぞれ要素群番号コードのテスト済みの値に対応する要素群(Xi)に対応する成分のために上記命令シーケンス生成手段により生成された命令シーケンスに関連付けられていることとを特徴とする請求項17ないし30のいずれか一つに記載の伸長方法。 - 上記構造スキーマ(1)の各成分が、少なくとも一つの情報要素からなる要素群に対応していること、
上記文書復号化手段が伸長する上記文書の構造スキーマ(1)が、少なくとも一つの、順序付けしていない成分の型のグループからなり、順序付けしていないグループ中の各成分が要素群に対応し、順序付けしていないグループ型のグループが、上記文書において、上記順序付けしていない型のグループの成分に対応する全ての要素群を任意の順序で含んだグループに対応すること、および、
文書中のn個の要素群(X1, X2, .... Xn)に対応するn個の成分からなる順序付けしていない型のグループについて上記命令シーケンス生成手段が生成した上記命令シーケンスが、
上記文書(10)中で次に現われる要素群を示す要素群(Xi)の番号コードを、ビット数で表したこのコードのサイズと共に上記文書復号化手段が読み取る命令と、
上記要素群番号コードの値を上記文書復号化手段がテストする命令とを順に含み、
各テスト命令は、それぞれ、要素群番号コードのテスト済みの値に対応する要素群(Xi)に対応する成分のために上記命令シーケンス生成手段が生成した命令シーケンスと、当該要素群(Xi)に対応する成分を除いた、順序付けしていないグループの全ての成分(X1, ..., Xn)からなる順序付けしていない型のグループのために上記命令シーケンス生成手段が生成した命令シーケンスとに関連付けられていることを特徴とする請求項17ないし31のいずれか一つに記載の伸長方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR0101447A FR2820563B1 (fr) | 2001-02-02 | 2001-02-02 | Procede de compression/decompression d'un document structure |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002563607A Division JP3973557B2 (ja) | 2001-02-02 | 2002-02-01 | 構造化された文書を圧縮/伸長する方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007226813A true JP2007226813A (ja) | 2007-09-06 |
Family
ID=8859571
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002563607A Expired - Fee Related JP3973557B2 (ja) | 2001-02-02 | 2002-02-01 | 構造化された文書を圧縮/伸長する方法 |
JP2007054875A Pending JP2007226813A (ja) | 2001-02-02 | 2007-03-05 | 構造化された文書を圧縮/伸長する方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002563607A Expired - Fee Related JP3973557B2 (ja) | 2001-02-02 | 2002-02-01 | 構造化された文書を圧縮/伸長する方法 |
Country Status (12)
Country | Link |
---|---|
US (1) | US20040054692A1 (ja) |
EP (1) | EP1356595B1 (ja) |
JP (2) | JP3973557B2 (ja) |
KR (1) | KR100614677B1 (ja) |
CN (1) | CN1309173C (ja) |
AT (1) | ATE336108T1 (ja) |
AU (1) | AU2002234715B2 (ja) |
CA (1) | CA2445300C (ja) |
DE (1) | DE60213760T2 (ja) |
ES (1) | ES2272666T3 (ja) |
FR (1) | FR2820563B1 (ja) |
WO (1) | WO2002063776A2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9075737B2 (en) | 2012-10-26 | 2015-07-07 | Kabushiki Kaisha Toshiba | Verification device, verification method and computer program product |
Families Citing this family (47)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2813743B1 (fr) * | 2000-09-06 | 2003-01-03 | Claude Seyrat | Procede de compression/decompression de documents structures |
EP1388211A2 (en) * | 2001-02-05 | 2004-02-11 | Expway | Method and system for compressing structured documents |
US7080318B2 (en) * | 2001-02-28 | 2006-07-18 | Koninklijke Philips Electronics N.V. | Schema, syntactic analysis method and method of generating a bit stream based on a schema |
US7028286B2 (en) * | 2001-04-13 | 2006-04-11 | Pts Corporation | Methods and apparatus for automated generation of abbreviated instruction set and configurable processor architecture |
ES2272429T3 (es) * | 2001-07-13 | 2007-05-01 | France Telecom | Metodo para comprimir un arbol jerarquico, señal correspondiente y metodo para descodificar una señal. |
US20030188265A1 (en) * | 2002-04-02 | 2003-10-02 | Murata Kikai Kabushiki Kaisha | Structured document processing device and recording medium recording structured document processing program |
US20050021502A1 (en) * | 2003-05-23 | 2005-01-27 | Benjamin Chen | Data federation methods and system |
KR20060123197A (ko) | 2003-11-07 | 2006-12-01 | 이엑스피웨이 | 구조적 문서의 압축 및 압축 해제 방법 |
US8037102B2 (en) | 2004-02-09 | 2011-10-11 | Robert T. and Virginia T. Jenkins | Manipulating sets of hierarchical data |
US7603654B2 (en) * | 2004-03-01 | 2009-10-13 | Microsoft Corporation | Determining XML schema type equivalence |
CN1697327A (zh) * | 2004-05-13 | 2005-11-16 | 皇家飞利浦电子股份有限公司 | 一种顺序压缩/解压缩数据的方法及装置 |
US9646107B2 (en) | 2004-05-28 | 2017-05-09 | Robert T. and Virginia T. Jenkins as Trustee of the Jenkins Family Trust | Method and/or system for simplifying tree expressions such as for query reduction |
US7620632B2 (en) | 2004-06-30 | 2009-11-17 | Skyler Technology, Inc. | Method and/or system for performing tree matching |
US7801923B2 (en) | 2004-10-29 | 2010-09-21 | Robert T. and Virginia T. Jenkins as Trustees of the Jenkins Family Trust | Method and/or system for tagging trees |
US7627591B2 (en) | 2004-10-29 | 2009-12-01 | Skyler Technology, Inc. | Method and/or system for manipulating tree expressions |
US7636727B2 (en) | 2004-12-06 | 2009-12-22 | Skyler Technology, Inc. | Enumeration of trees from finite number of nodes |
US7630995B2 (en) | 2004-11-30 | 2009-12-08 | Skyler Technology, Inc. | Method and/or system for transmitting and/or receiving data |
US8316059B1 (en) | 2004-12-30 | 2012-11-20 | Robert T. and Virginia T. Jenkins | Enumeration of rooted partial subtrees |
US7634502B2 (en) * | 2005-01-24 | 2009-12-15 | Paul Colton | System and method for improved content delivery |
US8615530B1 (en) | 2005-01-31 | 2013-12-24 | Robert T. and Virginia T. Jenkins as Trustees for the Jenkins Family Trust | Method and/or system for tree transformation |
US7681177B2 (en) | 2005-02-28 | 2010-03-16 | Skyler Technology, Inc. | Method and/or system for transforming between trees and strings |
KR100714539B1 (ko) * | 2005-03-09 | 2007-05-07 | 엘지전자 주식회사 | 냉장고용 정수장치 |
US8111694B2 (en) | 2005-03-23 | 2012-02-07 | Nokia Corporation | Implicit signaling for split-toi for service guide |
US8356040B2 (en) | 2005-03-31 | 2013-01-15 | Robert T. and Virginia T. Jenkins | Method and/or system for transforming between trees and arrays |
US20060234681A1 (en) * | 2005-04-18 | 2006-10-19 | Research In Motion Limited | System and method for data and message optimization in wireless communications |
US7899821B1 (en) | 2005-04-29 | 2011-03-01 | Karl Schiffmann | Manipulation and/or analysis of hierarchical data |
US20060288028A1 (en) * | 2005-05-26 | 2006-12-21 | International Business Machines Corporation | Decompressing electronic documents |
US20070143664A1 (en) * | 2005-12-21 | 2007-06-21 | Motorola, Inc. | A compressed schema representation object and method for metadata processing |
JP4429329B2 (ja) * | 2007-02-16 | 2010-03-10 | キヤノン株式会社 | 符号化装置及びその制御方法、復号装置及びその制御方法、プログラム、記憶媒体 |
US7747558B2 (en) | 2007-06-07 | 2010-06-29 | Motorola, Inc. | Method and apparatus to bind media with metadata using standard metadata headers |
US8694893B2 (en) * | 2008-08-08 | 2014-04-08 | Oracle International Corporation | Interactive product configurator with persistent component association |
US20100049727A1 (en) * | 2008-08-20 | 2010-02-25 | International Business Machines Corporation | Compressing xml documents using statistical trees generated from those documents |
FR2936623B1 (fr) * | 2008-09-30 | 2011-03-04 | Canon Kk | Procede de codage d'un document structure et de decodage, dispositifs correspondants |
JP5570202B2 (ja) * | 2009-12-16 | 2014-08-13 | キヤノン株式会社 | 構造化文書解析装置、構造化文書解析方法、及びコンピュータプログラム |
WO2011079796A1 (zh) * | 2009-12-30 | 2011-07-07 | 北京飞天诚信科技有限公司 | .net文件压缩方法 |
US8963959B2 (en) | 2011-01-18 | 2015-02-24 | Apple Inc. | Adaptive graphic objects |
US8442998B2 (en) | 2011-01-18 | 2013-05-14 | Apple Inc. | Storage of a document using multiple representations |
CN103019895B (zh) * | 2012-12-28 | 2015-01-28 | 华为技术有限公司 | 文件存储方法及装置 |
US9498819B2 (en) | 2013-03-14 | 2016-11-22 | Hitchiner Manufacturing Co., Inc. | Refractory mold and method of making |
US9481029B2 (en) | 2013-03-14 | 2016-11-01 | Hitchiner Manufacturing Co., Inc. | Method of making a radial pattern assembly |
US9486852B2 (en) | 2013-03-14 | 2016-11-08 | Hitchiner Manufacturing Co., Inc. | Radial pattern assembly |
CN104868922B (zh) * | 2014-02-24 | 2018-05-29 | 华为技术有限公司 | 数据压缩方法及装置 |
US10333696B2 (en) | 2015-01-12 | 2019-06-25 | X-Prime, Inc. | Systems and methods for implementing an efficient, scalable homomorphic transformation of encrypted data with minimal data expansion and improved processing efficiency |
KR101702767B1 (ko) * | 2015-08-18 | 2017-02-03 | 라인 가부시키가이샤 | 비트를 이용하여 문서에 대한 접근 권한과 타입에 따라 문서를 검색하는 시스템 및 방법 |
US20200042735A1 (en) * | 2016-10-11 | 2020-02-06 | Genomsys Sa | Method and system for selective access of stored or transmitted bioinformatics data |
US11553210B2 (en) * | 2018-12-07 | 2023-01-10 | Interdigital Vc Holdings, Inc. | Managing coding tools combinations and restrictions |
CN114266018B (zh) * | 2021-11-17 | 2025-01-21 | 成都安恒信息技术有限公司 | 一种将任意字节转化为执行逻辑的方法及系统 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5778375A (en) * | 1996-06-27 | 1998-07-07 | Microsoft Corporation | Database normalizing system |
US6580834B2 (en) * | 1997-05-30 | 2003-06-17 | Competitive Technologies Of Pa, Inc. | Method and apparatus for encoding and decoding signals |
EP0928070A3 (en) * | 1997-12-29 | 2000-11-08 | Phone.Com Inc. | Compression of documents with markup language that preserves syntactical structure |
US6272252B1 (en) * | 1998-12-18 | 2001-08-07 | Xerox Corporation | Segmenting image data into blocks and deleting some prior to compression |
GB9911099D0 (en) * | 1999-05-13 | 1999-07-14 | Euronet Uk Ltd | Compression/decompression method |
US6883137B1 (en) * | 2000-04-17 | 2005-04-19 | International Business Machines Corporation | System and method for schema-driven compression of extensible mark-up language (XML) documents |
US6865664B2 (en) * | 2000-12-13 | 2005-03-08 | Conexant Systems, Inc. | Methods, systems, and computer program products for compressing a computer program based on a compression criterion and executing the compressed program |
-
2001
- 2001-02-02 FR FR0101447A patent/FR2820563B1/fr not_active Expired - Fee Related
-
2002
- 2002-02-01 JP JP2002563607A patent/JP3973557B2/ja not_active Expired - Fee Related
- 2002-02-01 CA CA002445300A patent/CA2445300C/en not_active Expired - Fee Related
- 2002-02-01 CN CNB028057090A patent/CN1309173C/zh not_active Expired - Fee Related
- 2002-02-01 US US10/470,373 patent/US20040054692A1/en not_active Abandoned
- 2002-02-01 AU AU2002234715A patent/AU2002234715B2/en not_active Ceased
- 2002-02-01 ES ES02701380T patent/ES2272666T3/es not_active Expired - Lifetime
- 2002-02-01 WO PCT/FR2002/000394 patent/WO2002063776A2/fr active IP Right Grant
- 2002-02-01 AT AT02701380T patent/ATE336108T1/de not_active IP Right Cessation
- 2002-02-01 EP EP02701380A patent/EP1356595B1/fr not_active Expired - Lifetime
- 2002-02-01 KR KR1020037010251A patent/KR100614677B1/ko not_active IP Right Cessation
- 2002-02-01 DE DE60213760T patent/DE60213760T2/de not_active Expired - Lifetime
-
2007
- 2007-03-05 JP JP2007054875A patent/JP2007226813A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9075737B2 (en) | 2012-10-26 | 2015-07-07 | Kabushiki Kaisha Toshiba | Verification device, verification method and computer program product |
Also Published As
Publication number | Publication date |
---|---|
CA2445300A1 (en) | 2002-08-15 |
JP3973557B2 (ja) | 2007-09-12 |
DE60213760D1 (de) | 2006-09-21 |
JP2004530188A (ja) | 2004-09-30 |
KR100614677B1 (ko) | 2006-08-21 |
ATE336108T1 (de) | 2006-09-15 |
FR2820563A1 (fr) | 2002-08-09 |
WO2002063776A3 (fr) | 2002-11-28 |
WO2002063776A2 (fr) | 2002-08-15 |
US20040054692A1 (en) | 2004-03-18 |
EP1356595A2 (fr) | 2003-10-29 |
CN1309173C (zh) | 2007-04-04 |
CN1494767A (zh) | 2004-05-05 |
KR20040007442A (ko) | 2004-01-24 |
EP1356595B1 (fr) | 2006-08-09 |
CA2445300C (en) | 2007-04-24 |
FR2820563B1 (fr) | 2003-05-16 |
ES2272666T3 (es) | 2007-05-01 |
DE60213760T2 (de) | 2007-08-09 |
AU2002234715B2 (en) | 2005-10-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3973557B2 (ja) | 構造化された文書を圧縮/伸長する方法 | |
CA2437123C (en) | Method and system for compressing structured descriptions of documents | |
JP4997777B2 (ja) | デリミタを減少させる方法及びシステム | |
JP2004508647A (ja) | 構造化文書の圧縮/解凍方法 | |
JP5044942B2 (ja) | 文書分析において受付状態を決定するシステム及び方法 | |
AU2002253002A1 (en) | Method and system for compressing structured descriptions of documents | |
JP5377818B2 (ja) | コンパイル済みスキーマに順次アクセスする方法とシステム | |
WO2007024378A2 (en) | Encoding of markup-language data | |
JP5044943B2 (ja) | データ文書の高速符号化方法及びシステム | |
EP1990737A1 (en) | Document transformation system | |
US6883087B1 (en) | Processing of binary data for compression | |
JP5789236B2 (ja) | 構造化文書分析方法、構造化文書分析プログラム、および構造化文書分析システム | |
US7571152B2 (en) | Method for compressing and decompressing structured documents | |
JP4776389B2 (ja) | 符号化文書復号方法及びシステム | |
JP2006221655A (ja) | スキーマをコンパイルする方法とシステム | |
CN102119384B (zh) | 用于编码元素的方法和设备 | |
JP2004342029A (ja) | 構造化文書圧縮方法及び装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20070510 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090113 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20090401 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20090406 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20091006 |