KR20050098897A - 텍스트 데이터 압축을 위한 방법 및 장치 - Google Patents
텍스트 데이터 압축을 위한 방법 및 장치 Download PDFInfo
- Publication number
- KR20050098897A KR20050098897A KR1020057014498A KR20057014498A KR20050098897A KR 20050098897 A KR20050098897 A KR 20050098897A KR 1020057014498 A KR1020057014498 A KR 1020057014498A KR 20057014498 A KR20057014498 A KR 20057014498A KR 20050098897 A KR20050098897 A KR 20050098897A
- Authority
- KR
- South Korea
- Prior art keywords
- data
- case
- data segment
- match
- character
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
- G06T9/001—Model-based coding, e.g. wire frame
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/3084—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction using adaptive string matching, e.g. the Lempel-Ziv method
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Document Processing Apparatus (AREA)
Abstract
Description
Claims (24)
- 부호화된 데이터를 제공하기 위하여 데이터 세그먼트들의 형태로 통신 데이터를 부호화하는 방법에 있어서,참조 소스에서 데이터 세그먼트에 대한 매치(match)를 탐지하는 단계; 및상기 매치가 탐지된 경우 상기 부호화된 데이터에 압축된 데이터 세그먼트를 제공하기 위하여 상기 데이터 세그먼트를 압축하는 단계를 포함하며,상기 탐지는 상기 데이터 세그먼트의 케이스 센시티비티(case sensitivity)에 기반하는 방식으로 수행되는 것을 특징으로 하는 방법.
- 제1항에 있어서, 데이터 세그먼트는 적어도 하나의 데이터 유닛을 포함하고, 상기 데이터 세그먼트는 케이스 센시티브(case sensitive)하거나 케이스 인센시티브(case insensitive)하며, 상기 적어도 하나의 데이터 유닛이 케이스 인센시티브한 경우 상기 데이터 세그먼트는 케이스 인센시티브한 것을 특징으로 하는 방법.
- 제2항에 있어서, 상기 탐지가 상기 참조 소스에서의 변경된 데이터 세그먼트에 대한 매치에 기반하도록 상기 변경된 데이터 세그먼트를 제공하기 위하여 상기 데이터 세그먼트가 케이스 인센시티브한 경우 상기 데이터 세그먼트를 변경하는 단계를 더 포함하는 것을 특징으로 하는 방법.
- 제2항에 있어서, 상기 데이터 세그먼트는 텍스트 스트링을 포함하고 상기 적어도 하나의 데이터 유닛 각각은 문자를 포함하며, 상기 문자는 제1 케이스 구성 또는 제2 케이스 구성으로 되어 있고, 상기 탐지는 상기 데이터 세그먼트가 케이스 인센시티브한 것처럼 어떤 방식으로 수행되고,상기 적어도 하나의 데이터 유닛 각각에서의 상기 문자의 케이스 구성을 나타내는 정보를 상기 부호화된 데이터에 제공하여 상기 압축된 데이터 세그먼트가 상기 제공된 정보에 기초하여 압축해제되도록 하는 단계를 더 포함하는 것을 특징으로 하는 방법.
- 제4항에 있어서, 상기 텍스트 스트링은 다수의 문자들을 포함하고, 상기 제공된 정보는 다수의 데이터 비트들을 포함하며, 상기 다수의 데이터 비트들 각각은 상기 다수의 문자들 중 하나에 대응하고, 각 데이터 비트에는 상기 대응하는 문자가 상기 제1 케이스 구성인지 또는 상기 제2 케이스 구성인지를 나타내는 값이 할당되는 것을 특징으로 하는 방법.
- 제4항에 있어서, 상기 제공된 정보는 제1 케이스 구성으로 되어 있는 상기 적어도 하나의 데이터 유닛 각각에서의 상기 문자를 나타내는 값을 지닌 코드를 포함하는 것을 특징으로 하는 방법.
- 제6항에 있어서, 상기 제1 케이스 구성은 소문자이고 상기 제2 케이스 구성은 대문자인 것을 특징으로 하는 방법.
- 제6항에 있어서, 상기 제1 케이스 구성은 대문자이고 상기 제2 케이스 구성은 소문자인 것을 특징으로 하는 방법.
- 제4항에 있어서, 상기 텍스트 스트링은 선두 문자 및 적어도 하나의 후속 문자를 포함하는 복수의 문자들을 포함하고, 상기 제공된 정보는 제1 케이스 구성으로 된 상기 텍스트 스트링에서 단지 상기 선두 문자를 나타내는 코드를 포함하는 것을 특징으로 하는 방법.
- 제9항에 있어서, 상기 제1 케이스 구성은 대문자이고 상기 제2 케이스 구성은 소문자인 것을 특징으로 하는 방법.
- 부호화된 데이터를 제공하기 위하여 데이터 세그먼트들의 형태로 통신 데이터를 부호화하기 위한 압축기에 있어서,참조 소스;상기 참조 소스에서 데이터 세그먼트의 매치를 탐지하기 위한 비교 수단; 및상기 부호화된 데이터에 압축된 데이터 세그먼트를 제공하기 위하여 상기 매치가 탐지된 경우 상기 데이터 세그먼트를 압축하기 위한 부호화 모듈을 포함하고,상기 비교 수단은 상기 데이터 세그먼트의 케이스 센시티비티에 기초하여 상기 매치를 탐지하기 위한 매칭 알고리즘을 지니는 것을 특징으로 하는 압축기.
- 제11항에 있어서, 상기 데이터 세그먼트에 응답하는 파서로서, 상기 데이터 세그먼트의 케이스 센시티비티를 결정하고 상기 비교 수단에 상기 데이터 세그먼트의 케이스 센시티비티를 나타내는 정보를 제공하기 위한 파서를 더 포함하는 것을 특징으로 하는 압축기.
- 제12항에 있어서, 상기 제공된 정보는 상기 비교 수단에 전달된 데이터 플래그에 포함되는 것을 특징으로 하는 압축기.
- 제11항에 있어서, 상기 데이터 세그먼트는 적어도 하나의 문자를 포함하고 상기 적어도 하나의 문자 각각은 제1 케이스 구성 또는 제2 케이스 구성으로 되어 있으며, 상기 압축기는,상기 데이터 세그먼트에 응답하는 파서로서 상기 데이터 세그먼트의 케이스 센시티비티를 결정하기 위한 파서; 및상기 데이터 세그먼트에 응답하는 변환기 모듈로서, 상기 비교 수단에 케이스-변환된 데이터 세그먼트를 제공하기 위하여 상기 데이터 세그먼트내의 상기 적어도 하나의 문자 각각을 제1 케이스 구성으로 변환하여 상기 비교 수단이 상기 케이스-변환된 데이터 세그먼트에 기초하여 상기 참조 소스에서 상기 매치를 탐지하도록 허용하는 변환기 모듈을 더 포함하는 것을 특징으로 하는 압축기.
- 제11항에 있어서, 상기 데이터 세그먼트는 적어도 하나의 문자를 포함하고 상기 적어도 하나의 문자 각각은 제1 케이스 구성 또는 제2 케이스 구성으로 되어 있으며,상기 비교 수단은 상기 데이터 세그먼트가 케이스 인센시티브한 것처럼 상기 참조 소스에서 상기 데이터 세그먼트의 매치를 탐지하고,상기 적어도 하나의 문자 각각의 케이스 구성을 나타내는 정보가 상기 부호화된 데이터에 제공되어 상기 부호화된 데이터로부터의 상기 압축된 데이터 세그먼트가 상기 제공된 정보에 기초하여 압축해제되도록 허용하는 것을 특징으로 하는 압축기.
- 데이터 세그먼트의 형태로 통신 데이터를 수신하고 송신하기에 적합한, 통신 네트워크내의 통신 요소에 있어서,송신용의 부호화된 데이터를 제공하기 위하여 상기 수신된 통신 데이터를 부호화하기 위한 압축기를 포함하고, 상기 압축기는,참조 소스;상기 참조 소스에서 데이터 세그먼트의 매치를 탐지하기 위한 알고리즘; 및상기 부호화된 데이터에 압축된 데이터 세그먼트를 제공하기 위하여 상기 매치가 탐지된 경우 상기 데이터 세그먼트를 압축하기 위한 부호화 모듈을 포함하며,상기 알고리즘은 상기 데이터 세그먼트의 케이스 센시티비티에 기초하여 상기 매치를 탐지하는 것을 특징으로 하는 통신 요소.
- 제16항에 있어서, 이동 단말기를 포함하는 것을 특징으로 하는 통신 요소.
- 제16항에 있어서, 상기 통신 네트워크의 기반 구조에 지원 노드를 포함하는 것을 특징으로 하는 통신 요소.
- 데이터 세그먼트들의 형태로 통신 데이터를 부호화하기 위한 데이터 부호화 시스템에 있어서,상기 통신 데이터를 부호화하기 위한 압축기; 및부호화된 데이터를 복호화하기 위한 압축해제기를 포함하고,상기 압축기는,참조 소스;상기 참조 소스에서 데이터 세그먼트의 매치를 탐지하기 위한 알고리즘; 및압축된 데이터 세그먼트를 제공하기 위하여 상기 매치가 탐지된 경우 상기 데이터 세그먼트를 압축하기 위한 부호화 모듈을 포함하며,상기 알고리즘은 상기 데이터 세그먼트의 케이스 센시티비티에 기초하여 상기 매치를 탐지하는 것을 특징으로 하는 데이터 부호화 시스템.
- 제19항에 있어서, 상기 압축해제기는,추가 참조 소스; 및상기 추가 참조 소스로부터 상기 데이터 세그먼트를 탐지하기 위한 추가 알고리즘을 포함하는 것을 특징으로 하는 데이터 부호화 시스템.
- 제19항 또는 제20항에 있어서, 상기 데이터 세그먼트에 응답하는 파서로서, 상기 데이터 세그먼트의 케이스 센시티비티를 결정하고 상기 매칭 알고리즘에 상기 데이터 세그먼트의 케이스 센시티비티를 나타내는 정보를 제공하기 위한 파서를 더 포함하는 것을 특징으로 하는 데이터 부호화 시스템.
- 제21항에 있어서, 상기 제공된 정보는 매칭 알고리즘에 전달된 데이터 플래그에 포함되는 것을 특징으로 하는 데이터 부호화 시스템.
- 제19항 또는 제20항에 있어서, 상기 데이터 세그먼트는 적어도 하나의 문자를 포함하고 상기 적어도 하나의 문자 각각은 제1 케이스 구성 또는 제2 케이스 구성으로 되어 있으며, 상기 압축기는,상기 데이터 세그먼트에 응답하는 파서로서 상기 데이터 세그먼트의 케이스 센시티비티를 결정하기 위한 파서; 및상기 데이터 세그먼트에 응답하는 변환기 모듈로서, 상기 매칭 알고리즘에 케이스-변환된 데이터 세그먼트를 제공하기 위하여 상기 데이터 세그먼트내의 상기 적어도 하나의 문자 각각을 제1 케이스 구성으로 변환하여 상기 매칭 알고리즘이 상기 케이스-변환된 데이터 세그먼트에 기초하여 상기 참조 소스에서 상기 매치를 탐지하도록 허용하는 변환기 모듈을 포함하는 것을 특징으로 하는 데이터 부호화 시스템.
- 제19항에 있어서, 상기 데이터 세그먼트는 적어도 하나의 문자를 포함하고 상기 적어도 하나의 문자 각각은 제1 케이스 구성 또는 제2 케이스 구성으로 되어 있으며,상기 압축기는 상기 데이터 세그먼트가 케이스 인센시티브한 것처럼 상기 참조 소스에서 상기 데이터 세그먼트의 매치를 탐지하고,상기 적어도 하나의 문자 각각의 케이스 구성을 나타내는 정보가 상기 압축된 데이터에 제공되어 상기 압축된 데이터로부터의 상기 압축된 데이터 세그먼트가 상기 제공된 정보에 기초하여 압축해제되도록 허용하는 것을 특징으로 하는 데이터 부호화 시스템.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/361,805 | 2003-02-07 | ||
US10/361,805 US6750791B1 (en) | 2003-02-07 | 2003-02-07 | Method and device for text data compression |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20050098897A true KR20050098897A (ko) | 2005-10-12 |
KR100732664B1 KR100732664B1 (ko) | 2007-06-27 |
Family
ID=32393185
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020057014498A KR100732664B1 (ko) | 2003-02-07 | 2004-02-04 | 텍스트 데이터 압축을 위한 방법 및 장치 |
Country Status (5)
Country | Link |
---|---|
US (1) | US6750791B1 (ko) |
EP (1) | EP1590889A4 (ko) |
KR (1) | KR100732664B1 (ko) |
CN (1) | CN1748369A (ko) |
WO (1) | WO2004070505A2 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100789774B1 (ko) * | 2005-10-21 | 2007-12-28 | 주식회사 비즈위너스 | 압축 코드, 문자 압축 방법 및 장치 |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7079054B2 (en) * | 2004-06-04 | 2006-07-18 | Broadcom Corporation | V.42bis standalone hardware accelerator and architecture of construction |
WO2007084301A2 (en) * | 2006-01-12 | 2007-07-26 | Gary Demos | Efficient bit-exact lossless image coding residual system |
US20070276912A1 (en) * | 2006-05-05 | 2007-11-29 | Mike Rybak | Apparatus and method for forming and communicating a responsive data message |
US7817630B2 (en) * | 2006-12-18 | 2010-10-19 | Telefonaktiebolaget Lm Ericsson (Publ) | Method, communications node, and memory for dynamic dictionary updating and optimization for compression and decompression of messages |
US7836396B2 (en) * | 2007-01-05 | 2010-11-16 | International Business Machines Corporation | Automatically collecting and compressing style attributes within a web document |
US7953881B1 (en) * | 2008-06-12 | 2011-05-31 | Juniper Networks, Inc. | Network characteristic-based compression of network traffic |
US7868789B1 (en) * | 2009-06-28 | 2011-01-11 | Sap Ag | Dictionary-based order-preserving string compression for main memory column stores |
DE102009059939A1 (de) * | 2009-12-22 | 2011-06-30 | Giesecke & Devrient GmbH, 81677 | Verfahren zum Komprimieren von Bezeichnern |
US9432050B2 (en) * | 2012-06-13 | 2016-08-30 | Telefonaktiebolaget Lm Ericsson (Publ) | Software upgrading in a network |
US9912624B2 (en) | 2015-09-25 | 2018-03-06 | International Business Machines Corporation | Lossy text source coding by word length |
CN113114266B (zh) * | 2021-04-30 | 2022-12-13 | 上海智大电子有限公司 | 一种综合监控系统实时数据化简压缩方法 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4494150A (en) * | 1982-07-13 | 1985-01-15 | International Business Machines Corporation | Word autocorrelation redundancy match facsimile compression for text processing systems |
US4906991A (en) * | 1988-04-29 | 1990-03-06 | Xerox Corporation | Textual substitution data compression with finite length search windows |
US5414650A (en) * | 1993-03-24 | 1995-05-09 | Compression Research Group, Inc. | Parsing information onto packets using context-insensitive parsing rules based on packet characteristics |
DE69533500T2 (de) * | 1994-04-01 | 2005-09-08 | Sony Corp. | Verfahren und vorrichtung zum kodieren und dekodieren von nachrichten |
EP0720362A3 (en) * | 1994-12-29 | 2000-12-13 | Thomson Consumer Electronics, Inc. | Television on-screen display system utilizing text data compression |
FI962381L (fi) | 1996-06-07 | 1997-12-08 | Nokia Telecommunications Oy | Datan pakkaaminen tietoliikenneyhteydellä |
US6415061B1 (en) | 1997-06-13 | 2002-07-02 | Cisco Technology, Inc. | Method of updating dictionaries in a data transmission system using data compression |
US6400289B1 (en) | 2000-03-01 | 2002-06-04 | Hughes Electronics Corporation | System and method for performing lossless data compression and decompression |
US6388584B1 (en) | 2000-03-16 | 2002-05-14 | Lucent Technologies Inc. | Method and apparatus for data compression of network packets |
CN1446404A (zh) | 2000-08-15 | 2003-10-01 | 西加特技术有限责任公司 | 操作码的双模数据压缩 |
US6459392B1 (en) * | 2001-01-19 | 2002-10-01 | International Business Machines Corporation | Technique for encoding a sequence of periodic byte values with vertical correlation |
US20020107887A1 (en) * | 2001-02-06 | 2002-08-08 | Cousins Robert E. | Method for compressing character-based markup language files |
US6577254B2 (en) * | 2001-11-14 | 2003-06-10 | Hewlett-Packard Development Company, L.P. | Data compression/decompression system |
-
2003
- 2003-02-07 US US10/361,805 patent/US6750791B1/en not_active Expired - Lifetime
-
2004
- 2004-02-04 CN CNA200480003597XA patent/CN1748369A/zh active Pending
- 2004-02-04 EP EP04707989A patent/EP1590889A4/en not_active Ceased
- 2004-02-04 WO PCT/IB2004/000283 patent/WO2004070505A2/en active Application Filing
- 2004-02-04 KR KR1020057014498A patent/KR100732664B1/ko not_active IP Right Cessation
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100789774B1 (ko) * | 2005-10-21 | 2007-12-28 | 주식회사 비즈위너스 | 압축 코드, 문자 압축 방법 및 장치 |
Also Published As
Publication number | Publication date |
---|---|
WO2004070505A3 (en) | 2005-05-06 |
US6750791B1 (en) | 2004-06-15 |
EP1590889A4 (en) | 2006-03-29 |
EP1590889A2 (en) | 2005-11-02 |
CN1748369A (zh) | 2006-03-15 |
WO2004070505A2 (en) | 2004-08-19 |
KR100732664B1 (ko) | 2007-06-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6606040B2 (en) | Method and apparatus for adaptive data compression | |
US6883035B2 (en) | System and method for communicating with temporary compression tables | |
US6633242B2 (en) | Entropy coding using adaptable prefix codes | |
US6985965B2 (en) | Static information knowledge used with binary compression methods | |
TW586294B (en) | Communication system and method for shared context compression | |
US6100824A (en) | System and method for data compression | |
US7821427B2 (en) | Data processing system and method | |
KR100732664B1 (ko) | 텍스트 데이터 압축을 위한 방법 및 장치 | |
US7640362B2 (en) | Adaptive compression in an edge router | |
US6963587B2 (en) | Communication system and method utilizing request-reply communication patterns for data compression | |
CA2428788C (en) | Static information knowledge used with binary compression methods | |
US6493766B1 (en) | Method, client device, server and article of manufacture for compressing universal resource identifiers using left/right string substitution | |
US6668092B1 (en) | Memory efficient variable-length encoding/decoding system | |
US7023365B1 (en) | System and method for compression of words and phrases in text based on language features | |
WO2002041498A2 (en) | Communication system and method utilizing request-reply communication patterns for data compression | |
Fong et al. | Multimedia applications of self-synchronizing T-codes | |
Das et al. | Design an Algorithm for Data Compression using Pentaoctagesimal SNS | |
GB2360916A (en) | Compression encoder which transmits difference between new data word and recent data word where this falls within a threshold | |
Mittal | A Study of Lossless Data Compression Techniques for Energy Saving |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0105 | International application |
Patent event date: 20050805 Patent event code: PA01051R01D Comment text: International Patent Application |
|
PA0201 | Request for examination | ||
PG1501 | Laying open of application | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20061026 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20070530 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20070620 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20070621 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20100610 Start annual number: 4 End annual number: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20110607 Start annual number: 5 End annual number: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20120611 Start annual number: 6 End annual number: 6 |
|
FPAY | Annual fee payment |
Payment date: 20130603 Year of fee payment: 7 |
|
PR1001 | Payment of annual fee |
Payment date: 20130603 Start annual number: 7 End annual number: 7 |
|
FPAY | Annual fee payment |
Payment date: 20140605 Year of fee payment: 8 |
|
PR1001 | Payment of annual fee |
Payment date: 20140605 Start annual number: 8 End annual number: 8 |
|
FPAY | Annual fee payment |
Payment date: 20150519 Year of fee payment: 9 |
|
PR1001 | Payment of annual fee |
Payment date: 20150519 Start annual number: 9 End annual number: 9 |
|
FPAY | Annual fee payment |
Payment date: 20160517 Year of fee payment: 10 |
|
PR1001 | Payment of annual fee |
Payment date: 20160517 Start annual number: 10 End annual number: 10 |
|
FPAY | Annual fee payment |
Payment date: 20170522 Year of fee payment: 11 |
|
PR1001 | Payment of annual fee |
Payment date: 20170522 Start annual number: 11 End annual number: 11 |
|
LAPS | Lapse due to unpaid annual fee | ||
PC1903 | Unpaid annual fee |
Termination category: Default of registration fee Termination date: 20190401 |