JP5808361B2 - 文字列圧縮及び復元システム並びに方法 - Google Patents
文字列圧縮及び復元システム並びに方法 Download PDFInfo
- Publication number
- JP5808361B2 JP5808361B2 JP2013080293A JP2013080293A JP5808361B2 JP 5808361 B2 JP5808361 B2 JP 5808361B2 JP 2013080293 A JP2013080293 A JP 2013080293A JP 2013080293 A JP2013080293 A JP 2013080293A JP 5808361 B2 JP5808361 B2 JP 5808361B2
- Authority
- JP
- Japan
- Prior art keywords
- character string
- sample
- replacement
- partial
- replacement pointer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
入力文字列Nから部分文字列を抽出し、該入力文字列Nにおける該部分文字列の出現回数をカウントし、該部分文字列と出現回数を頻出パターン記憶手段に格納する頻出パターン分析手段と、
前記頻出パターン記憶手段に格納されている前記部分文字列の出現回数について降順に並べ替え、該頻出パターン記憶手段に格納し、該頻出パターン記憶手段の上位N件を、サンプル文字列としてサンプル文字列記憶手段に格納するサンプル文字列生成手段と、
前記入力文字列Nの開始位置iから始まる部分文字列と、前記サンプル文字列記憶手段から読み出した前記サンプル文字列Mの最大一致長LMと該部分文字列の出現位置PMを求め、前記入力文字列Nの開始位置i番目から始まる部分文字列と、該入力文字列Nの0番目からi−1番目までに出現した部分文字列との最大一致長LNと、該出現した部分文字列の出現位置P N を求め、該最大一致長LNが該最大一致長LMより大きい場合は、置換ポインタを該入力文字列Nの過去の位置を示すものとし、該最大一致長LMが該最大一致長LN以上である場合は、該置換ポインタをサンプル文字列M上の位置を示すものとし、該入力文字列Nの[i…i+L+1]の部分文字列を出現済みの部分文字列として動的辞書記憶手段に格納し、置換ポインタ列と該サンプル文字列を出力する置換ポインタ生成手段と、
を有する符号化手段と、
前記置換ポインタ生成手段から前記置換ポインタ列と前記サンプル文字列を取得し、置換ポインタがサンプル文字列M上の位置を示している場合には、該置換ポインタが参照するサンプル文字列M上の部分文字列を出力し、該置換ポインタが前記入力文字列Nの過去の位置を示す場合には、該置換ポインタが参照する既に復元済みの部分文字列を出力する置換ポインタ分析手段を有する復号手段と、を有する。
ステップ307) 最大一致長LをLNとし、ポインタをP N とし、ステップ310に移行する。
110 サンプル文字列生成部
120 サンプル文字列取得部
130 置換ポインタ生成部
140 サンプル文字列探索部
150 サンプル文字列M記憶部
160 動的辞書探索・更新部
170 動的辞書記憶部
180 置換ポインタ記憶部
200 復号部
210 置換ポインタ分析部
220 入力サンプル文字列記憶部
230 出力文字列記憶部
310 頻出パターン分析部
320 頻出パターン記憶部
Claims (4)
- 置換方式による文字列圧縮及び復元システムであって、
入力文字列Nから部分文字列を抽出し、該入力文字列Nにおける該部分文字列の出現回数をカウントし、該部分文字列と出現回数を頻出パターン記憶手段に格納する頻出パターン分析手段と、
前記頻出パターン記憶手段に格納されている前記部分文字列の出現回数について降順に並べ替え、該頻出パターン記憶手段に格納し、該頻出パターン記憶手段の上位N件を、サンプル文字列としてサンプル文字列記憶手段に格納するサンプル文字列生成手段と、
前記入力文字列Nの開始位置iから始まる部分文字列と、前記サンプル文字列記憶手段から読み出した前記サンプル文字列Mの最大一致長LMと該部分文字列の出現位置PMを求め、前記入力文字列Nの開始位置i番目から始まる部分文字列と、該入力文字列Nの0番目からi−1番目までに出現した部分文字列との最大一致長LNと、該出現した部分文字列の出現位置P N を求め、該最大一致長LNが該最大一致長LMより大きい場合は、置換ポインタを該入力文字列Nの過去の位置を示すものとし、該最大一致長LMが該最大一致長LN以上である場合は、該置換ポインタをサンプル文字列M上の位置を示すものとし、該入力文字列Nの[i…i+L+1]の部分文字列を出現済みの部分文字列として動的辞書記憶手段に格納し、置換ポインタ列と該サンプル文字列を出力する置換ポインタ生成手段と、
を有する符号化手段と、
前記置換ポインタ生成手段から前記置換ポインタ列と前記サンプル文字列を取得し、置換ポインタがサンプル文字列M上の位置を示している場合には、該置換ポインタが参照するサンプル文字列M上の部分文字列を出力し、該置換ポインタが前記入力文字列Nの過去の位置を示す場合には、該置換ポインタが参照する既に復元済みの部分文字列を出力する置換ポインタ分析手段を有する復号手段と、
を有することを特徴とするサンプル文字列(辞書)を用いた二段階置き換えによる圧縮及び復元システム。 - 前記サンプル文字列記憶手段は、前記入力文字列Nに対して1%以下程度の領域とする
請求項1記載のサンプル文字列(辞書)を用いた二段階置き換えによる圧縮及び復元システム。 - 置換方式による文字列圧縮及び復元方法であって、
頻出パターン分析手段と、頻出パターン記憶手段と、サンプル文字列生成手段と、サンプル文字列記憶手段と、動的辞書記憶手段と、置換ポインタ生成手段とを有する符号化手段、及び、置換ポインタ分析手段を有する復号手段とを有する装置において、
前記符号化手段の前記頻出パターン分析手段が、入力文字列Nから部分文字列を抽出し、該入力文字列Nにおける該部分文字列の出現回数をカウントし、該部分文字列と該出現回数を前記頻出パターン記憶手段に格納する頻出パターン分析ステップと、
前記符号化手段の前記サンプル文字列生成手段が、前記頻出パターン記憶手段に格納されている前記部分文字列の出現回数を降順に並べ替え、該頻出パターン記憶手段に格納し、該頻出パターン記憶手段の上位N件を、サンプル文字列としてサンプル文字列記憶手段に格納するサンプル文字列生成ステップと、
前記符号化手段の前記置換ポインタ生成手段が、前記入力文字列Nの開始位置iから始まる部分文字列と、前記サンプル文字列記憶手段から読み出した前記サンプル文字列Mの最大一致長LMと該部分文字列の出現位置PMを求め、前記入力文字列Nの開始位置i番目から始まる部分文字列と、該入力文字列Nの0番目からi−1番目までに出現した部分文字列との最大一致長LNと、該出現した部分文字列の出現位置P N を求め、該最大一致長LNが該最大一致長LMより大きい場合は、置換ポインタを該入力文字列Nの過去の位置を示すものとし、該最大一致長LMが該最大一致長LN以上である場合は該置換ポインタをサンプル文字列M上の位置を示すものとし、該入力文字列Nの[i…i+L+1]の部分文字列を出現済みの部分文字列として動的辞書記憶手段に格納し、置換ポインタ列と該サンプル文字列を出力する置換ポインタ生成ステップと、
前記復号手段の前記置換ポインタ分析手段が、前記符号化手段より前記置換ポインタ列と前記サンプル文字列を取得し、置換ポインタがサンプル文字列M上の位置を示している場合には、該置換ポインタが参照するサンプル文字列M上の部分文字列を出力し、該置換ポインタが前記入力文字列Nの過去の位置を示す場合には、該置換ポインタが参照する既に復元済みの部分文字列を出力する置換ポインタ分析ステップと、
を行うことを特徴とするサンプル文字列(辞書)を用いた二段階置き換えによる圧縮及び復元方法。 - 前記サンプル文字列記憶手段を、前記入力文字列Nに対して1%以下程度の領域とする
請求項3記載のサンプル文字列(辞書)を用いた二段階置き換えによる圧縮及び復元方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013080293A JP5808361B2 (ja) | 2013-04-08 | 2013-04-08 | 文字列圧縮及び復元システム並びに方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013080293A JP5808361B2 (ja) | 2013-04-08 | 2013-04-08 | 文字列圧縮及び復元システム並びに方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014204358A JP2014204358A (ja) | 2014-10-27 |
JP5808361B2 true JP5808361B2 (ja) | 2015-11-10 |
Family
ID=52354419
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013080293A Expired - Fee Related JP5808361B2 (ja) | 2013-04-08 | 2013-04-08 | 文字列圧縮及び復元システム並びに方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5808361B2 (ja) |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2954749B2 (ja) * | 1991-07-19 | 1999-09-27 | 富士通株式会社 | データ圧縮方式 |
JP3241788B2 (ja) * | 1992-02-28 | 2001-12-25 | 富士通株式会社 | データ圧縮方式 |
JP3231105B2 (ja) * | 1992-11-30 | 2001-11-19 | 富士通株式会社 | データ符号化方式及びデータ復元方式 |
JPH06202844A (ja) * | 1993-01-05 | 1994-07-22 | Fujitsu Ltd | データ圧縮復元処理装置 |
JP3277792B2 (ja) * | 1996-01-31 | 2002-04-22 | 株式会社日立製作所 | データ圧縮方法および装置 |
JP3695045B2 (ja) * | 1996-10-01 | 2005-09-14 | ソニー株式会社 | 符号化装置 |
JP2000269822A (ja) * | 1999-03-12 | 2000-09-29 | Fujitsu Ltd | データ圧縮装置、及びデータ復元装置 |
JP4479530B2 (ja) * | 2004-12-28 | 2010-06-09 | カシオ電子工業株式会社 | データ圧縮装置、及びデータ復元装置 |
-
2013
- 2013-04-08 JP JP2013080293A patent/JP5808361B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2014204358A (ja) | 2014-10-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103326730B (zh) | 数据并行压缩方法 | |
JP2015186077A (ja) | データ圧縮を高速化する方法、並びに、データ圧縮を高速化するためのコンピュータ、及びそのコンピュータ・プログラム | |
US20160321282A1 (en) | Extracting method, information processing method, computer product, extracting apparatus, and information processing apparatus | |
US8692696B2 (en) | Generating a code alphabet of symbols to generate codewords for words used with a program | |
US20200294629A1 (en) | Gene sequencing data compression method and decompression method, system and computer-readable medium | |
CN107111623A (zh) | 用于基于词典的压缩的并行历史搜索和编码 | |
CN103326732A (zh) | 压缩数据的方法、解压数据的方法、编码器和解码器 | |
TW201643758A (zh) | 依據輸入區塊類型使用動態散列演算法之硬體資料壓縮器 | |
TW201706998A (zh) | 直接對lz77引擎輸出之標記進行霍夫曼編碼程序之硬體資料壓縮器 | |
US20200185058A1 (en) | Gene sequencing data compression preprocessing, compression and decompression method, system, and computer-readable medium | |
TW201640831A (zh) | 建構並使用動態初期霍夫曼編碼表之硬體資料壓縮器 | |
CN103049709A (zh) | 基于生成元扩展彩虹表的密码恢复系统及其恢复方法 | |
US20160028415A1 (en) | Compression method, compression device, and computer-readable recording medium | |
US9137336B1 (en) | Data compression techniques | |
TW201707387A (zh) | 基於節點字串匹配機率對散列鏈進行分類之硬體資料壓縮器 | |
Kumar et al. | Bitstream compression for high speed embedded systems using separated split look up tables (LUTs) | |
JP2019036810A (ja) | データ圧縮装置、データ復元装置、データ圧縮プログラム、データ復元プログラム、データ圧縮方法、およびデータ復元方法 | |
TW201643757A (zh) | 在輸入區塊掃描時維持分類符號列之硬體資料壓縮器 | |
JP5808359B2 (ja) | 文字列圧縮及び復元システム並びに方法 | |
JP5808361B2 (ja) | 文字列圧縮及び復元システム並びに方法 | |
JP5808360B2 (ja) | 文字列圧縮及び復元システム並びに方法 | |
US8270742B1 (en) | Data compression for computer-aided design systems | |
Ozsoy | Culzss-bit: A bit-vector algorithm for lossless data compression on gpgpus | |
Bharathi et al. | A plain-text incremental compression (pic) technique with fast lookup ability | |
JP6555259B2 (ja) | 情報処理装置、データ格納方法、及び、プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150225 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150310 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150422 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20150519 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150817 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20150825 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150904 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150908 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5808361 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |