KR100732664B1 - 텍스트 데이터 압축을 위한 방법 및 장치 - Google Patents
텍스트 데이터 압축을 위한 방법 및 장치 Download PDFInfo
- Publication number
- KR100732664B1 KR100732664B1 KR1020057014498A KR20057014498A KR100732664B1 KR 100732664 B1 KR100732664 B1 KR 100732664B1 KR 1020057014498 A KR1020057014498 A KR 1020057014498A KR 20057014498 A KR20057014498 A KR 20057014498A KR 100732664 B1 KR100732664 B1 KR 100732664B1
- Authority
- KR
- South Korea
- Prior art keywords
- data
- case
- data segment
- match
- character
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
- G06T9/001—Model-based coding, e.g. wire frame
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/3084—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction using adaptive string matching, e.g. the Lempel-Ziv method
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Document Processing Apparatus (AREA)
Abstract
Description
Claims (24)
- 부호화된 데이터를 제공하기 위하여 데이터 세그먼트들의 형태로 통신 데이터를 부호화하는 방법에 있어서,참조 소스에서 데이터 세그먼트에 대한 매치(match)를 탐지하는 단계; 및상기 매치가 탐지된 경우 상기 부호화된 데이터에 압축된 데이터 세그먼트를 제공하기 위하여 상기 데이터 세그먼트를 압축하는 단계를 포함하며,상기 탐지는 상기 데이터 세그먼트의 대소문자 구별성(case sensitivity)에 기반하는 방식으로 수행되는 것을 특징으로 하는 방법.
- 제1항에 있어서, 데이터 세그먼트는 적어도 하나의 데이터 유닛을 포함하고, 상기 데이터 세그먼트는 대소문자를 구별하거나(case sensitive) 대소문자를 구별하지 아니하며(case insensitive), 상기 적어도 하나의 데이터 유닛이 대소문자를 구별하지 아니하는 경우 상기 데이터 세그먼트는 대소문자를 구별하지 않는 것을 특징으로 하는 방법.
- 제2항에 있어서, 상기 데이터 세그먼트가 대소문자를 구별하지 아니하는 경우, 상기 데이터 세그먼트를 변경하여 변경된 데이터 세그먼트를 제공함으로써, 상기 참조 소스에서의 매치의 탐지가 상기 변경된 데이터 세그먼트에 기반하도록 하는 단계를 더 포함하는 것을 특징으로 하는 방법.
- 제2항에 있어서, 상기 데이터 세그먼트는 텍스트 스트링을 포함하고 상기 적어도 하나의 데이터 유닛 각각은 문자를 포함하며, 상기 문자는 제1 케이스 구성 또는 제2 케이스 구성으로 되어 있고, 상기 탐지는 상기 데이터 세그먼트가 대소문자를 구별하지 아니하는 경우의 방식으로 수행되고,상기 적어도 하나의 데이터 유닛 각각에서의 상기 문자의 케이스 구성을 나타내는 정보를 상기 부호화된 데이터에 제공하여 상기 압축된 데이터 세그먼트가 상기 제공된 정보에 기초하여 압축해제되도록 하는 단계를 더 포함하는 것을 특징으로 하는 방법.
- 제4항에 있어서, 상기 텍스트 스트링은 다수의 문자들을 포함하고, 상기 제공된 정보는 다수의 데이터 비트들을 포함하며, 상기 다수의 데이터 비트들 각각은 상기 다수의 문자들 중 하나에 대응하고, 각 데이터 비트에는 상기 대응하는 문자가 상기 제1 케이스 구성인지 또는 상기 제2 케이스 구성인지를 나타내는 값이 할당되는 것을 특징으로 하는 방법.
- 제4항에 있어서, 상기 제공된 정보는 제1 케이스 구성으로 되어 있는 상기 적어도 하나의 데이터 유닛 각각에서의 상기 문자를 나타내는 값을 지닌 코드를 포함하는 것을 특징으로 하는 방법.
- 제6항에 있어서, 상기 제1 케이스 구성은 소문자이고 상기 제2 케이스 구성 은 대문자인 것을 특징으로 하는 방법.
- 제6항에 있어서, 상기 제1 케이스 구성은 대문자이고 상기 제2 케이스 구성은 소문자인 것을 특징으로 하는 방법.
- 제4항에 있어서, 상기 텍스트 스트링은 선두 문자 및 적어도 하나의 후속 문자를 포함하는 복수의 문자들을 포함하고, 상기 제공된 정보는 제1 케이스 구성으로 된 상기 텍스트 스트링에서 단지 상기 선두 문자를 나타내는 코드를 포함하는 것을 특징으로 하는 방법.
- 제9항에 있어서, 상기 제1 케이스 구성은 대문자이고 상기 제2 케이스 구성은 소문자인 것을 특징으로 하는 방법.
- 부호화된 데이터를 제공하기 위하여 데이터 세그먼트들의 형태로 통신 데이터를 부호화하기 위한 압축기에 있어서,참조 소스;상기 참조 소스에서 데이터 세그먼트의 매치를 탐지하기 위한 비교 수단; 및상기 부호화된 데이터에 압축된 데이터 세그먼트를 제공하기 위하여 상기 매치가 탐지된 경우 상기 데이터 세그먼트를 압축하기 위한 부호화 모듈을 포함하고,상기 비교 수단은 상기 데이터 세그먼트의 대소문자 구별성에 기초하여 상기 매치를 탐지하기 위한 매칭 알고리즘을 지니는 것을 특징으로 하는 압축기.
- 제11항에 있어서, 상기 데이터 세그먼트에 응답하는 파서로서, 상기 데이터 세그먼트의 대소문자 구별성을 결정하고 상기 비교 수단에 상기 데이터 세그먼트의 대소문자 구별성을 나타내는 정보를 제공하기 위한 파서를 더 포함하는 것을 특징으로 하는 압축기.
- 제12항에 있어서, 상기 제공된 정보는 상기 비교 수단에 전달된 데이터 플래그에 포함되는 것을 특징으로 하는 압축기.
- 제11항에 있어서, 상기 데이터 세그먼트는 적어도 하나의 문자를 포함하고 상기 적어도 하나의 문자 각각은 제1 케이스 구성 또는 제2 케이스 구성으로 되어 있으며, 상기 압축기는,상기 데이터 세그먼트에 응답하는 파서로서 상기 데이터 세그먼트의 대소문자 구별성을 결정하기 위한 파서; 및상기 데이터 세그먼트에 응답하는 변환기 모듈로서, 상기 비교 수단에 케이스-변환된 데이터 세그먼트를 제공하기 위하여 상기 데이터 세그먼트내의 상기 적어도 하나의 문자 각각을 제1 케이스 구성으로 변환하여 상기 비교 수단이 상기 케이스-변환된 데이터 세그먼트에 기초하여 상기 참조 소스에서 상기 매치를 탐지하도록 허용하는 변환기 모듈을 더 포함하는 것을 특징으로 하는 압축기.
- 제11항에 있어서, 상기 데이터 세그먼트는 적어도 하나의 문자를 포함하고 상기 적어도 하나의 문자 각각은 제1 케이스 구성 또는 제2 케이스 구성으로 되어 있으며,상기 비교 수단은 상기 데이터 세그먼트가 대소문자를 구별하지 아니하는 것처럼 상기 참조 소스에서 상기 데이터 세그먼트의 매치를 탐지하고,상기 적어도 하나의 문자 각각의 케이스 구성을 나타내는 정보가 상기 부호화된 데이터에 제공되어 상기 부호화된 데이터로부터의 상기 압축된 데이터 세그먼트가 상기 제공된 정보에 기초하여 압축해제되도록 허용하는 것을 특징으로 하는 압축기.
- 데이터 세그먼트의 형태로 통신 데이터를 수신하고 송신하기에 적합한, 통신 네트워크내의 네트워크 요소에 있어서,송신용의 부호화된 데이터를 제공하기 위하여 상기 수신된 통신 데이터를 부호화하기 위한 압축기를 포함하고, 상기 압축기는,참조 소스;상기 참조 소스에서 데이터 세그먼트의 매치를 탐지하기 위한 알고리즘; 및상기 부호화된 데이터에 압축된 데이터 세그먼트를 제공하기 위하여 상기 매치가 탐지된 경우 상기 데이터 세그먼트를 압축하기 위한 부호화 모듈을 포함하며,상기 알고리즘은 상기 데이터 세그먼트의 대소문자 구별성에 기초하여 상기 매치를 탐지하는 것을 특징으로 하는 네트워크 요소.
- 제16항에 있어서, 이동 단말기를 포함하는 것을 특징으로 하는 네트워크 요소.
- 제16항에 있어서, 상기 통신 네트워크의 기반 구조에 지원 노드를 포함하는 것을 특징으로 하는 네트워크 요소.
- 데이터 세그먼트들의 형태로 통신 데이터를 부호화하기 위한 데이터 부호화 시스템에 있어서,상기 통신 데이터를 부호화하기 위한 압축기; 및부호화된 데이터를 복호화하기 위한 압축해제기를 포함하고,상기 압축기는,참조 소스;상기 참조 소스에서 데이터 세그먼트의 매치를 탐지하기 위한 알고리즘; 및압축된 데이터 세그먼트를 제공하기 위하여 상기 매치가 탐지된 경우 상기 데이터 세그먼트를 압축하기 위한 부호화 모듈을 포함하며,상기 알고리즘은 상기 데이터 세그먼트의 대소문자 구별성에 기초하여 상기 매치를 탐지하는 것을 특징으로 하는 데이터 부호화 시스템.
- 제19항에 있어서, 상기 압축해제기는,추가 참조 소스; 및상기 추가 참조 소스로부터 상기 데이터 세그먼트를 탐지하기 위한 추가 알고리즘을 포함하는 것을 특징으로 하는 데이터 부호화 시스템.
- 제19항 또는 제20항에 있어서, 상기 데이터 세그먼트에 응답하는 파서로서, 상기 데이터 세그먼트의 대소문자 구별성을 결정하고 상기 매칭 알고리즘에 상기 데이터 세그먼트의 대소문자 구별성을 나타내는 정보를 제공하기 위한 파서를 더 포함하는 것을 특징으로 하는 데이터 부호화 시스템.
- 제21항에 있어서, 상기 제공된 정보는 매칭 알고리즘에 전달된 데이터 플래그에 포함되는 것을 특징으로 하는 데이터 부호화 시스템.
- 제19항 또는 제20항에 있어서, 상기 데이터 세그먼트는 적어도 하나의 문자를 포함하고 상기 적어도 하나의 문자 각각은 제1 케이스 구성 또는 제2 케이스 구성으로 되어 있으며, 상기 압축기는,상기 데이터 세그먼트에 응답하는 파서로서 상기 데이터 세그먼트의 대소문자 구별성을 결정하기 위한 파서; 및상기 데이터 세그먼트에 응답하는 변환기 모듈로서, 상기 매칭 알고리즘에 케이스-변환된 데이터 세그먼트를 제공하기 위하여 상기 데이터 세그먼트내의 상기 적어도 하나의 문자 각각을 제1 케이스 구성으로 변환하여 상기 매칭 알고리즘이 상기 케이스-변환된 데이터 세그먼트에 기초하여 상기 참조 소스에서 상기 매치를 탐지하도록 허용하는 변환기 모듈을 포함하는 것을 특징으로 하는 데이터 부호화 시스템.
- 제19항에 있어서, 상기 데이터 세그먼트는 적어도 하나의 문자를 포함하고 상기 적어도 하나의 문자 각각은 제1 케이스 구성 또는 제2 케이스 구성으로 되어 있으며,상기 압축기는 상기 데이터 세그먼트가 대소문자를 구별하지 아니하는 것처럼 상기 참조 소스에서 상기 데이터 세그먼트의 매치를 탐지하고,상기 적어도 하나의 문자 각각의 케이스 구성을 나타내는 정보가 상기 압축된 데이터에 제공되어 상기 압축된 데이터로부터의 상기 압축된 데이터 세그먼트가 상기 제공된 정보에 기초하여 압축해제되도록 허용하는 것을 특징으로 하는 데이터 부호화 시스템.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/361,805 | 2003-02-07 | ||
US10/361,805 US6750791B1 (en) | 2003-02-07 | 2003-02-07 | Method and device for text data compression |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20050098897A KR20050098897A (ko) | 2005-10-12 |
KR100732664B1 true KR100732664B1 (ko) | 2007-06-27 |
Family
ID=32393185
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020057014498A KR100732664B1 (ko) | 2003-02-07 | 2004-02-04 | 텍스트 데이터 압축을 위한 방법 및 장치 |
Country Status (5)
Country | Link |
---|---|
US (1) | US6750791B1 (ko) |
EP (1) | EP1590889A4 (ko) |
KR (1) | KR100732664B1 (ko) |
CN (1) | CN1748369A (ko) |
WO (1) | WO2004070505A2 (ko) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7079054B2 (en) * | 2004-06-04 | 2006-07-18 | Broadcom Corporation | V.42bis standalone hardware accelerator and architecture of construction |
KR100789774B1 (ko) * | 2005-10-21 | 2007-12-28 | 주식회사 비즈위너스 | 압축 코드, 문자 압축 방법 및 장치 |
WO2007084301A2 (en) * | 2006-01-12 | 2007-07-26 | Gary Demos | Efficient bit-exact lossless image coding residual system |
US20070276912A1 (en) * | 2006-05-05 | 2007-11-29 | Mike Rybak | Apparatus and method for forming and communicating a responsive data message |
US7817630B2 (en) * | 2006-12-18 | 2010-10-19 | Telefonaktiebolaget Lm Ericsson (Publ) | Method, communications node, and memory for dynamic dictionary updating and optimization for compression and decompression of messages |
US7836396B2 (en) * | 2007-01-05 | 2010-11-16 | International Business Machines Corporation | Automatically collecting and compressing style attributes within a web document |
US7953881B1 (en) * | 2008-06-12 | 2011-05-31 | Juniper Networks, Inc. | Network characteristic-based compression of network traffic |
US7868789B1 (en) * | 2009-06-28 | 2011-01-11 | Sap Ag | Dictionary-based order-preserving string compression for main memory column stores |
DE102009059939A1 (de) * | 2009-12-22 | 2011-06-30 | Giesecke & Devrient GmbH, 81677 | Verfahren zum Komprimieren von Bezeichnern |
US9432050B2 (en) * | 2012-06-13 | 2016-08-30 | Telefonaktiebolaget Lm Ericsson (Publ) | Software upgrading in a network |
US9912624B2 (en) | 2015-09-25 | 2018-03-06 | International Business Machines Corporation | Lossy text source coding by word length |
CN113114266B (zh) * | 2021-04-30 | 2022-12-13 | 上海智大电子有限公司 | 一种综合监控系统实时数据化简压缩方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4494150A (en) | 1982-07-13 | 1985-01-15 | International Business Machines Corporation | Word autocorrelation redundancy match facsimile compression for text processing systems |
US5414650A (en) | 1993-03-24 | 1995-05-09 | Compression Research Group, Inc. | Parsing information onto packets using context-insensitive parsing rules based on packet characteristics |
US6411227B1 (en) | 2000-08-15 | 2002-06-25 | Seagate Technology Llc | Dual mode data compression for operating code |
US6434168B1 (en) | 1996-06-07 | 2002-08-13 | Nokia Telecommunications Oy | Data compression on a data connection |
US6459392B1 (en) | 2001-01-19 | 2002-10-01 | International Business Machines Corporation | Technique for encoding a sequence of periodic byte values with vertical correlation |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4906991A (en) * | 1988-04-29 | 1990-03-06 | Xerox Corporation | Textual substitution data compression with finite length search windows |
DE69533500T2 (de) * | 1994-04-01 | 2005-09-08 | Sony Corp. | Verfahren und vorrichtung zum kodieren und dekodieren von nachrichten |
EP0720362A3 (en) * | 1994-12-29 | 2000-12-13 | Thomson Consumer Electronics, Inc. | Television on-screen display system utilizing text data compression |
US6415061B1 (en) | 1997-06-13 | 2002-07-02 | Cisco Technology, Inc. | Method of updating dictionaries in a data transmission system using data compression |
US6400289B1 (en) | 2000-03-01 | 2002-06-04 | Hughes Electronics Corporation | System and method for performing lossless data compression and decompression |
US6388584B1 (en) | 2000-03-16 | 2002-05-14 | Lucent Technologies Inc. | Method and apparatus for data compression of network packets |
US20020107887A1 (en) * | 2001-02-06 | 2002-08-08 | Cousins Robert E. | Method for compressing character-based markup language files |
US6577254B2 (en) * | 2001-11-14 | 2003-06-10 | Hewlett-Packard Development Company, L.P. | Data compression/decompression system |
-
2003
- 2003-02-07 US US10/361,805 patent/US6750791B1/en not_active Expired - Lifetime
-
2004
- 2004-02-04 CN CNA200480003597XA patent/CN1748369A/zh active Pending
- 2004-02-04 EP EP04707989A patent/EP1590889A4/en not_active Ceased
- 2004-02-04 WO PCT/IB2004/000283 patent/WO2004070505A2/en active Application Filing
- 2004-02-04 KR KR1020057014498A patent/KR100732664B1/ko not_active IP Right Cessation
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4494150A (en) | 1982-07-13 | 1985-01-15 | International Business Machines Corporation | Word autocorrelation redundancy match facsimile compression for text processing systems |
US5414650A (en) | 1993-03-24 | 1995-05-09 | Compression Research Group, Inc. | Parsing information onto packets using context-insensitive parsing rules based on packet characteristics |
US6434168B1 (en) | 1996-06-07 | 2002-08-13 | Nokia Telecommunications Oy | Data compression on a data connection |
US6411227B1 (en) | 2000-08-15 | 2002-06-25 | Seagate Technology Llc | Dual mode data compression for operating code |
US6459392B1 (en) | 2001-01-19 | 2002-10-01 | International Business Machines Corporation | Technique for encoding a sequence of periodic byte values with vertical correlation |
Also Published As
Publication number | Publication date |
---|---|
WO2004070505A3 (en) | 2005-05-06 |
US6750791B1 (en) | 2004-06-15 |
EP1590889A4 (en) | 2006-03-29 |
EP1590889A2 (en) | 2005-11-02 |
CN1748369A (zh) | 2006-03-15 |
KR20050098897A (ko) | 2005-10-12 |
WO2004070505A2 (en) | 2004-08-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6606040B2 (en) | Method and apparatus for adaptive data compression | |
US6883035B2 (en) | System and method for communicating with temporary compression tables | |
US6633242B2 (en) | Entropy coding using adaptable prefix codes | |
US7051126B1 (en) | Hardware accelerated compression | |
US6985965B2 (en) | Static information knowledge used with binary compression methods | |
US6100824A (en) | System and method for data compression | |
US7821427B2 (en) | Data processing system and method | |
KR100732664B1 (ko) | 텍스트 데이터 압축을 위한 방법 및 장치 | |
US7640362B2 (en) | Adaptive compression in an edge router | |
US6963587B2 (en) | Communication system and method utilizing request-reply communication patterns for data compression | |
CA2428788C (en) | Static information knowledge used with binary compression methods | |
US6493766B1 (en) | Method, client device, server and article of manufacture for compressing universal resource identifiers using left/right string substitution | |
US6668092B1 (en) | Memory efficient variable-length encoding/decoding system | |
US7023365B1 (en) | System and method for compression of words and phrases in text based on language features | |
EP1334559A2 (en) | Communication system and method utilizing request-reply communication patterns for data compression | |
EP2113845A1 (en) | Character conversion method and apparatus | |
Fong et al. | Multimedia applications of self-synchronizing T-codes | |
Das et al. | Design an Algorithm for Data Compression using Pentaoctagesimal SNS | |
GB2360916A (en) | Compression encoder which transmits difference between new data word and recent data word where this falls within a threshold | |
Mittal | A Study of Lossless Data Compression Techniques for Energy Saving |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0105 | International application |
Patent event date: 20050805 Patent event code: PA01051R01D Comment text: International Patent Application |
|
PA0201 | Request for examination | ||
PG1501 | Laying open of application | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20061026 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20070530 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20070620 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20070621 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20100610 Start annual number: 4 End annual number: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20110607 Start annual number: 5 End annual number: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20120611 Start annual number: 6 End annual number: 6 |
|
FPAY | Annual fee payment |
Payment date: 20130603 Year of fee payment: 7 |
|
PR1001 | Payment of annual fee |
Payment date: 20130603 Start annual number: 7 End annual number: 7 |
|
FPAY | Annual fee payment |
Payment date: 20140605 Year of fee payment: 8 |
|
PR1001 | Payment of annual fee |
Payment date: 20140605 Start annual number: 8 End annual number: 8 |
|
FPAY | Annual fee payment |
Payment date: 20150519 Year of fee payment: 9 |
|
PR1001 | Payment of annual fee |
Payment date: 20150519 Start annual number: 9 End annual number: 9 |
|
FPAY | Annual fee payment |
Payment date: 20160517 Year of fee payment: 10 |
|
PR1001 | Payment of annual fee |
Payment date: 20160517 Start annual number: 10 End annual number: 10 |
|
FPAY | Annual fee payment |
Payment date: 20170522 Year of fee payment: 11 |
|
PR1001 | Payment of annual fee |
Payment date: 20170522 Start annual number: 11 End annual number: 11 |
|
LAPS | Lapse due to unpaid annual fee | ||
PC1903 | Unpaid annual fee |
Termination category: Default of registration fee Termination date: 20190401 |