KR101599113B1 - 중복제거 저장 시스템내에서 합성 백업 - Google Patents
중복제거 저장 시스템내에서 합성 백업 Download PDFInfo
- Publication number
- KR101599113B1 KR101599113B1 KR1020137016583A KR20137016583A KR101599113B1 KR 101599113 B1 KR101599113 B1 KR 101599113B1 KR 1020137016583 A KR1020137016583 A KR 1020137016583A KR 20137016583 A KR20137016583 A KR 20137016583A KR 101599113 B1 KR101599113 B1 KR 101599113B1
- Authority
- KR
- South Korea
- Prior art keywords
- input data
- new input
- segments
- data
- deduplication
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003860 storage Methods 0.000 title claims abstract description 107
- 239000002131 composite material Substances 0.000 claims abstract description 35
- 238000000034 method Methods 0.000 claims description 80
- 238000004590 computer program Methods 0.000 claims description 15
- 238000010276 construction Methods 0.000 claims description 13
- 238000004891 communication Methods 0.000 claims description 2
- 230000004931 aggregating effect Effects 0.000 claims 1
- 238000005192 partition Methods 0.000 claims 1
- 238000000638 solvent extraction Methods 0.000 claims 1
- 238000004364 calculation method Methods 0.000 abstract description 11
- 230000008569 process Effects 0.000 description 31
- 230000006870 function Effects 0.000 description 20
- 238000012545 processing Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 10
- 230000008901 benefit Effects 0.000 description 8
- 230000007246 mechanism Effects 0.000 description 8
- 230000000694 effects Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000011084 recovery Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000006855 networking Effects 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 238000005096 rolling process Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000003892 spreading Methods 0.000 description 1
- 238000013403 standard screening design Methods 0.000 description 1
- 229920000638 styrene acrylonitrile Polymers 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/17—Details of further file system functions
- G06F16/174—Redundancy elimination performed by the file system
- G06F16/1748—De-duplication implemented within the file system, e.g. based on file segments
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1446—Point-in-time backing up or restoration of persistent data
- G06F11/1448—Management of the data involved in backup or backup restore
- G06F11/1453—Management of the data involved in backup or backup restore using de-duplication of the data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
- G06F16/2255—Hash tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
- G06F16/24553—Query execution of query operations
- G06F16/24554—Unary operations; Data partitioning operations
- G06F16/24556—Aggregation; Duplicate elimination
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/907—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Library & Information Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
도 1은 하나의 예시적인 합성 백업 아키텍처를 도시한다;
도 2는 하나의 예시적인 합성 백업의 구축 흐름 (construction flow)을 도시한다;
도 3은 데이터 패턴에서 예시적인 레퍼런스 접근 방식 (approaches)을 도시한다;
도 4는 하나의 중복제거 저장 시스템에서 사용될 합성 백업을 구축하기 위한 하나의 예시적인 방법을 도시한다;
도 5는 하나의 예시적인 중복제거 프로세스를 도시한다;
도 6은 하나의 예시적인 최대의 그리고 시프트된 (maximal and shifted) 데이터 블록을 도시한다;
도 7은 입력 데이터 세그먼트를 위한 고유의 특성들 (distinguishing characteristics)인 k 및m 의 예시적인 계산을 도시한다.
도 8은 예시적인 고유의 특성들 (distinguishing characteristics (DC)) 및 저장 식별자 지수들 (storage identifiers (SI) indexes)을 도시한다;
도 9는 저장된 서브-세그먼트들을 가진 입력 서브-세그먼트의 예시적인 맵핑 (mapping)을 도시한다;
도 10a 및 도 10b는 합성 백업에서 데이터 세그먼트의 고유의 특성들을 계산하기 위한 하나의 예시적인 방법을 총괄적으로 (collectively) 도시한다; 그리고
도 11은 본 발명의 예시된 실시예들이 구현되는, 프로세서 디바이스를 포함하는, 중복제거 시스템의 하나의 예시적인 부분을 도시한다.
Claims (11)
- 중복제거 저장 시스템(a deduplication storage system)에서 복수의 새로운 입력 데이터 세그먼트들을 위해, 프로세서 디바이스에 의한 합성 백업(a synthetic backup)의 구축을 용이하게(facilitating) 하는 방법에 있어서, 상기 합성 백업은 기존의 전체 백업(a full, existing backup)인 오리지네이팅 백업(originating backup)과는 독립적이고 상기 오리지네이팅 백업으로부터 구축되며, 상기 방법은:
상기 복수의 새로운 입력 데이터 세그먼트들의 각각의 새로운 입력 데이터 세그먼트를 위해, 상기 새로운 입력 데이터 세그먼트들에 의하여 레퍼런스되는(referenced), 저장된 데이터 세그먼트들의 복수의 저장된 중복제거 다이제스트들을 검색하는 단계 - 상기 저장된 데이터 세그먼트들은 상기 오리지네이팅 백업으로부터 취해진 데이터이고, 상기 복수의 저장된 중복제거 다이제스트들은 상기 저장된 데이터 세그먼트들로부터 계산된 중복제거 다이제스트임 -;
각각의 새로운 입력 데이터 세그먼트를 각각 복수의 고정-크기 데이터 서브-세그먼트들(fixed-sized data sub-segments)로 파티션하는 단계(partitioning);
상기 복수의 고정-크기 데이터 서브-세그먼트들의 각각을 위해, 상기 합성 백업의 구축 동안, 검색된 상기 복수의 저장된 중복제거 다이제스트들에 기초하여 복수의 새로운 입력 데이터 세그먼트들의 중복제거 다이제스트들 각각을 계산하는 단계;
각각의 새로운 입력 데이터 세그먼트의 중복제거 다이제스트를 발생시키기 위하여 상기 복수의 새로운 입력 데이터 세그먼트 중복제거 다이제스트들의 각각을 합하는 단계(aggregating);
각각의 새로운 입력 데이터 세그먼트의 상기 중복제거 다이제스트의 매칭을 위해, 상기 저장된 데이터 세그먼트들의 상기 복수의 저장된 중복제거 다이제스트들을 탐색하는 단계 - 이에 의해 각각의 새로운 입력 데이터 세그먼트의 중복을 제거함(deduplicate) -; 및
각각의 새로운 입력 데이터 세그먼트의 상기 중복제거 다이제스트들로부터 상기 합성 백업의 중복제거 다이제스트를 형성하는 단계;를 포함하는
방법. - 삭제
- 제1항에 있어서,
상기 탐색하는 단계 이후에, 인덱스 내 상기 복수의 새로운 입력 데이터 세그먼트들의 중복제거 다이제스트들을 저장하는 단계를 더 포함하고, 상기 복수의 새로운 입력 데이터 세그먼트들의 중복제거 다이제스트들 중 하나의 입력 데이터 세그먼트 중복제거 다이제스트와 매치되는 상기 복수의 저장된 중복제거 다이제스트들 중 하나의 저장된 중복제거 다이제스트는 상기 새로운 입력 데이터 세그먼트의 중복제거 다이제스트에 의해 치환되는(displaced)
방법. - 제1항에 있어서,
상기 중복제거 저장 시스템 내 메타데이터 파일을 생성하는 단계; 및
연속적인 저장 명령들을 최적화하는 단계;를 더 포함하는
방법. - 제4항에 있어서, 각각의 최적화된 저장 명령을 위해, 상기 방법은:
상기 최적화된 저장 명령에 의하여 표시된 상기 새로운 입력 데이터 세그먼트와 연관된 메타데이터 세그먼트를 검색하는 단계,
상기 메타데이터 세그먼트를 오직 상기 새로운 입력 데이터 세그먼트만 레퍼런스하도록 조정하는 단계,
상기 조정된 메타데이터 세그먼트를 상기 합성 백업의 메타데이터 파일에 복사하는 단계, 및
상기 메타데이터 세그먼트에 의하여 레퍼런스되는 각각의 스토리지 블록을 위해, 레퍼런스 카운트값을 증분시키는 단계(incrementing)를 더 포함하는
방법. - 제1항에 있어서, 복수의 새로운 입력 데이터 세그먼트들의 중복제거 다이제스트들의 각각을 계산하는 단계는:
상기 복수의 새로운 입력 데이터 세그먼트 내 각각의 블록을 위한 해쉬값을 바이트 오프셋으로 (in byte offsets) 계산하는 단계;
중요성 순서에 따라 (according to an order of significance), 선택된 복수의 최대 해쉬값들을 내림차순으로 (in descending order) 정렬하는 단계;
상기 최대 해쉬값들 (hash values)과 연관된 블록들에 관한 결정된 위치들에 있는 블록들을 쉬프트된 블록들 (shifted blocks)로서 식별하는 단계;
상기 복수의 새로운 입력 데이터 데이터 세그먼트들 중 첫 번째 고유의 특성 (distinguishing characteristic)을 위해, 상기 쉬프트된 블록들의 해쉬값들의 서브세트 (subset)를 선택하는 단계; 및
상기 복수의 새로운 입력 데이터 세그먼트들 중 두 번째 고유의 특성을 위해, 상기 쉬프트된 블록들의 해쉬값들의 추가 서브세트를 선택하는 단계를 포함하는
방법. - 제6항에 있어서, 상기 두 번째 고유의 특성을 저장하기 위해 상기 복수의 새로운 입력 데이터 세그먼트들에 대한 고유의 특성(DC) 인덱스(distinguishing characteristics (DC) index)를 구성하는 단계, 및 상기 첫 번째 고유의 특성을 저장하기 위해 상기 복수의 새로운 입력 데이터 세그먼트들에 대한 저장 식별자(SI) 인덱스 (storage identifiers (SI) index)를 구성하는 단계를 더 포함하는
방법. - 제7항에 있어서,
상기 첫 번째 및 두 번째 고유의 특성(DC)을 계산하는 단계를 더 포함하는
방법. - 삭제
- 중복제거 저장 시스템(a deduplication storage system)에서 복수의 새로운 입력 데이터 세그먼트들을 위해, 합성 백업(a synthetic backup)의 구축을 용이하게(facilitating) 하는 시스템에 있어서, 상기 합성 백업은 기존의 전체 백업(a full, existing backup)인 오리지네이팅 백업(originating backup)과는 독립적이고 상기 오리지네이팅 백업으로부터 구축되며, 상기 시스템은:
메모리; 및
중복제거 컴퓨팅 저장 시스템에서 동작가능하고, 상기 메모리와 통신하는 적어도 하나의 프로세서 디바이스;를 포함하고,
상기 적어도 하나의 프로세서 디바이스는:
상기 복수의 새로운 입력 데이터 세그먼트들의 각각의 새로운 입력 데이터 세그먼트를 위해, 상기 새로운 입력 데이터 세그먼트들에 의하여 레퍼런스되는(referenced), 저장된 데이터 세그먼트들의 복수의 저장된 중복제거 다이제스트들을 검색하고 - 상기 저장된 데이터 세그먼트들은 상기 오리지네이팅 백업으로부터 취해진 데이터이고, 상기 복수의 저장된 중복제거 다이제스트들은 상기 저장된 데이터 세그먼트들로부터 계산된 중복제거 다이제스트들임 -,
각각의 새로운 입력 데이터 세그먼트를 각각 복수의 고정-크기 데이터 서브-세그먼트들(fixed-sized data sub-segments)로 파티션하고,
상기 복수의 고정-크기 데이터 서브-세그먼트들의 각각을 위해, 상기 합성 백업의 구축 동안, 검색된 상기 복수의 저장된 중복제거 다이제스트들에 기초하여 복수의 입력 중복제거 다이제스트들 각각을 계산하고,
각각의 새로운 입력 데이터 세그먼트의 중복제거 다이제스트를 발생시키기 위하여 상기 복수의 새로운 입력 데이터 세그먼트들의 중복제거 다이제스트들의 각각을 합하고,
각각의 새로운 입력 데이터 세그먼트의 상기 중복제거 다이제스트의 매칭을 위해, 상기 저장된 데이터 세그먼트들의 상기 복수의 저장된 중복제거 다이제스트들을 탐색하고 - 이에 의해 각각의 새로운 입력 데이터 세그먼트의 중복을 제거함(deduplicate) -, 그리고
각각의 새로운 입력 데이터 세그먼트의 상기 중복제거 다이제스트들로부터 상기 합성 백업의 중복제거 다이제스트를 형성하도록 구성되는
시스템. - 컴퓨터 판독가능 매체에 있어서,
상기 컴퓨터 판독가능 매체는, 중복제거 저장 시스템에서 복수의 새로운 입력 데이터 세그먼트들을 위해, 합성 백업의 구축을 용이하게 하는 컴퓨터 프로그램을 포함하고,
상기 컴퓨터 프로그램은, 컴퓨터에 의하여 실행될 때 상기 청구항 제1항, 제3항 내지 제8항 중 어느 한 항에 기재된 방법의 모든 단계들을 수행하도록 하는 컴퓨터 프로그램 코드를 포함하는,
컴퓨터 판독가능 매체.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/958,205 | 2010-12-01 | ||
US12/958,205 US8682873B2 (en) | 2010-12-01 | 2010-12-01 | Efficient construction of synthetic backups within deduplication storage system |
PCT/EP2011/070290 WO2012072419A1 (en) | 2010-12-01 | 2011-11-16 | Synthetic backups within deduplication storage system |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20130123410A KR20130123410A (ko) | 2013-11-12 |
KR101599113B1 true KR101599113B1 (ko) | 2016-03-14 |
Family
ID=45033951
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020137016583A Active KR101599113B1 (ko) | 2010-12-01 | 2011-11-16 | 중복제거 저장 시스템내에서 합성 백업 |
Country Status (8)
Country | Link |
---|---|
US (9) | US8682873B2 (ko) |
EP (1) | EP2646915B1 (ko) |
JP (1) | JP5878548B2 (ko) |
KR (1) | KR101599113B1 (ko) |
CN (1) | CN103229147B (ko) |
AU (1) | AU2011335219B2 (ko) |
CA (1) | CA2817119C (ko) |
WO (1) | WO2012072419A1 (ko) |
Families Citing this family (65)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8731190B2 (en) * | 2009-06-09 | 2014-05-20 | Emc Corporation | Segment deduplication system with encryption and compression of segments |
US8762348B2 (en) * | 2009-06-09 | 2014-06-24 | Emc Corporation | Segment deduplication system with compression of segments |
US8401181B2 (en) * | 2009-06-09 | 2013-03-19 | Emc Corporation | Segment deduplication system with encryption of segments |
US8495022B1 (en) * | 2010-05-13 | 2013-07-23 | Symantec Corporation | Systems and methods for synthetic backups |
US8682873B2 (en) * | 2010-12-01 | 2014-03-25 | International Business Machines Corporation | Efficient construction of synthetic backups within deduplication storage system |
US8495304B1 (en) * | 2010-12-23 | 2013-07-23 | Emc Corporation | Multi source wire deduplication |
CN102810108A (zh) * | 2011-06-02 | 2012-12-05 | 英业达股份有限公司 | 重复数据的处理方法 |
US9026496B1 (en) * | 2011-09-30 | 2015-05-05 | Emc Corporation | Efficient building of restore list |
US8442945B1 (en) * | 2012-01-03 | 2013-05-14 | Don Doerner | No touch synthetic full backup |
US8719234B2 (en) * | 2012-01-25 | 2014-05-06 | International Business Machines Corporation | Handling rewrites in deduplication systems using data parsers |
US9880771B2 (en) * | 2012-06-19 | 2018-01-30 | International Business Machines Corporation | Packing deduplicated data into finite-sized containers |
US8904147B2 (en) * | 2012-09-11 | 2014-12-02 | Lenovo Enterprise Solutions (Singapore) Pte. Ltd. | Method for generating a delta for compressed data |
US9594643B2 (en) * | 2013-03-06 | 2017-03-14 | Quest Software Inc. | Handling restores in an incremental backup storage system |
KR101505263B1 (ko) | 2013-03-07 | 2015-03-24 | 포항공과대학교 산학협력단 | 데이터 중복 제거 방법 및 장치 |
US9483494B1 (en) * | 2013-03-14 | 2016-11-01 | Emc Corporation | Opportunistic fragmentation repair |
US9547662B2 (en) * | 2013-03-15 | 2017-01-17 | International Business Machines Corporation | Digest retrieval based on similarity search in data deduplication |
US9244937B2 (en) | 2013-03-15 | 2016-01-26 | International Business Machines Corporation | Efficient calculation of similarity search values and digest block boundaries for data deduplication |
US9430332B1 (en) * | 2013-04-29 | 2016-08-30 | Veritas Technologies Llc | Systems and methods for enabling efficient access to incremental backups |
US9286314B2 (en) | 2013-07-15 | 2016-03-15 | International Business Machines Corporation | Applying a maximum size bound on content defined segmentation of data |
US9244830B2 (en) | 2013-07-15 | 2016-01-26 | Globalfoundries Inc. | Hierarchical content defined segmentation of data |
US9891857B2 (en) * | 2013-07-15 | 2018-02-13 | International Business Machines Corporation | Utilizing global digests caching in similarity based data deduplication |
US9594766B2 (en) | 2013-07-15 | 2017-03-14 | International Business Machines Corporation | Reducing activation of similarity search in a data deduplication system |
US9836474B2 (en) | 2013-07-15 | 2017-12-05 | International Business Machines Corporation | Data structures for digests matching in a data deduplication system |
US9892048B2 (en) * | 2013-07-15 | 2018-02-13 | International Business Machines Corporation | Tuning global digests caching in a data deduplication system |
US10296598B2 (en) | 2013-07-15 | 2019-05-21 | International Business Machines Corporation | Digest based data matching in similarity based deduplication |
US10229132B2 (en) * | 2013-07-15 | 2019-03-12 | International Business Machines Corporation | Optimizing digest based data matching in similarity based deduplication |
US9892127B2 (en) * | 2013-07-15 | 2018-02-13 | International Business Machines Corporation | Global digests caching in a data deduplication system |
US10133502B2 (en) | 2013-07-15 | 2018-11-20 | International Business Machines Corporation | Compatibility and inclusion of similarity element resolutions |
US10339109B2 (en) | 2013-07-15 | 2019-07-02 | International Business Machines Corporation | Optimizing hash table structure for digest matching in a data deduplication system |
US9922042B2 (en) | 2013-07-15 | 2018-03-20 | International Business Machines Corporation | Producing alternative segmentations of data into blocks in a data deduplication system |
US10229131B2 (en) * | 2013-07-15 | 2019-03-12 | International Business Machines Corporation | Digest block segmentation based on reference segmentation in a data deduplication system |
US10789213B2 (en) | 2013-07-15 | 2020-09-29 | International Business Machines Corporation | Calculation of digest segmentations for input data using similar data in a data deduplication system |
US9268786B2 (en) | 2013-07-15 | 2016-02-23 | International Business Machines Corporation | Applying a minimum size bound on content defined segmentation of data |
US10296597B2 (en) | 2013-07-15 | 2019-05-21 | International Business Machines Corporation | Read ahead of digests in similarity based data deduplicaton |
US10073853B2 (en) | 2013-07-17 | 2018-09-11 | International Business Machines Corporation | Adaptive similarity search resolution in a data deduplication system |
US9519805B2 (en) * | 2013-08-01 | 2016-12-13 | Cellco Partnership | Digest obfuscation for data cryptography |
US20150066976A1 (en) * | 2013-08-27 | 2015-03-05 | Lighthouse Document Technologies, Inc. (d/b/a Lighthouse eDiscovery) | Automated identification of recurring text |
US9785643B1 (en) * | 2013-09-06 | 2017-10-10 | Veritas Technologies Llc | Systems and methods for reclaiming storage space in deduplicating data systems |
US9336260B2 (en) | 2013-10-16 | 2016-05-10 | Netapp, Inc. | Technique for global deduplication across datacenters with minimal coordination |
CN104714859B (zh) * | 2013-12-17 | 2017-10-03 | 南京壹进制信息技术股份有限公司 | 一种海量文件的快速备份与恢复的方法 |
US10229056B1 (en) * | 2014-03-25 | 2019-03-12 | EMC IP Holding Company LLC | Alignment fixing on a storage system during continuous data replication to deduplicated storage |
TWI511037B (zh) * | 2014-05-09 | 2015-12-01 | Wistron Corp | 儲存叢集化系統與提供對叢集式儲存的存取的方法 |
US9645888B1 (en) | 2014-06-02 | 2017-05-09 | EMC IP Holding Company LLC | Caching of backup chunks |
WO2016003481A1 (en) * | 2014-07-04 | 2016-01-07 | Hewlett-Packard Development Company, L.P. | Data deduplication |
EP3213211A4 (en) | 2014-10-29 | 2017-09-06 | Hewlett-Packard Enterprise Development LP | Data restoration using allocation maps |
DE202016107158U1 (de) * | 2015-05-27 | 2017-01-24 | Google Inc. | System zur automatischen cloudbasierten Volldatensicherung und Wiederherstellung von mobilen Geräten |
US10621151B2 (en) * | 2015-09-25 | 2020-04-14 | Netapp Inc. | Elastic, ephemeral in-line deduplication service |
US10261946B2 (en) | 2016-01-12 | 2019-04-16 | International Business Machines Corporation | Rebalancing distributed metadata |
US10255288B2 (en) * | 2016-01-12 | 2019-04-09 | International Business Machines Corporation | Distributed data deduplication in a grid of processors |
US10242021B2 (en) | 2016-01-12 | 2019-03-26 | International Business Machines Corporation | Storing data deduplication metadata in a grid of processors |
US20180024767A1 (en) * | 2016-07-19 | 2018-01-25 | Western Digital Technologies, Inc. | Reference Set Construction for Data Deduplication |
KR102306672B1 (ko) * | 2016-11-23 | 2021-09-29 | 삼성전자주식회사 | 데이터 중복 제거를 수행하는 스토리지 시스템, 스토리지 시스템 및 데이터 처리 시스템의 동작방법 |
US11644992B2 (en) * | 2016-11-23 | 2023-05-09 | Samsung Electronics Co., Ltd. | Storage system performing data deduplication, method of operating storage system, and method of operating data processing system |
EP3659043B1 (en) * | 2017-08-25 | 2023-02-22 | Huawei Technologies Co., Ltd. | Apparatus and method for storing received data blocks as deduplicated data blocks |
US10911433B1 (en) * | 2017-09-27 | 2021-02-02 | Amazon Technologies, Inc. | Network traffic distribution using certificate scanning in agent-based architecture |
CN109726037B (zh) * | 2017-10-27 | 2023-07-21 | 伊姆西Ip控股有限责任公司 | 用于备份数据的方法、设备和计算机程序产品 |
US20200034244A1 (en) * | 2018-07-26 | 2020-01-30 | EMC IP Holding Company LLC | Detecting server pages within backups |
US11269733B2 (en) * | 2018-11-13 | 2022-03-08 | Exagrid Systems, Inc. | Synthetic full backups and deduplication backup storage with landing zone |
US20200349012A1 (en) * | 2019-05-01 | 2020-11-05 | EMC IP Holding Company LLC | Method and system for full restore point creation using incremental backups |
US11829250B2 (en) * | 2019-09-25 | 2023-11-28 | Veritas Technologies Llc | Systems and methods for efficiently backing up large datasets |
US11429573B2 (en) * | 2019-10-16 | 2022-08-30 | Dell Products L.P. | Data deduplication system |
US20210191820A1 (en) * | 2019-12-20 | 2021-06-24 | EMC IP Holding Company LLC | Method and system for performing incremental backups of fragmented user data |
CN113448491B (zh) * | 2020-03-26 | 2024-05-17 | 伊姆西Ip控股有限责任公司 | 存储系统的数据迁移 |
US20220398169A1 (en) * | 2021-06-11 | 2022-12-15 | Qnap Systems, Inc. | Method, system and computer-readable medium for synthetic incremental data backup |
TWI789984B (zh) * | 2021-06-11 | 2023-01-11 | 威聯通科技股份有限公司 | 合成增量資料備份方法、系統及電腦可讀取儲存媒體 |
Family Cites Families (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5204966A (en) * | 1990-03-09 | 1993-04-20 | Digital Equipment Corporation | System for controlling access to a secure system by verifying acceptability of proposed password by using hashing and group of unacceptable passwords |
ATE172309T1 (de) * | 1993-07-01 | 1998-10-15 | Legent Corp | Anordnung und verfahren zur verteilten datenverwaltung in vernetzten rechnersystemen |
WO1996025801A1 (en) * | 1995-02-17 | 1996-08-22 | Trustus Pty. Ltd. | Method for partitioning a block of data into subblocks and for storing and communicating such subblocks |
WO1996032685A1 (en) * | 1995-04-11 | 1996-10-17 | Kinetech, Inc. | Identifying data in a data processing system |
JP3597697B2 (ja) | 1998-03-20 | 2004-12-08 | 富士通株式会社 | 文書要約装置およびその方法 |
US6374266B1 (en) * | 1998-07-28 | 2002-04-16 | Ralph Shnelvar | Method and apparatus for storing information in a data processing system |
US6487561B1 (en) | 1998-12-31 | 2002-11-26 | Emc Corporation | Apparatus and methods for copying, backing up, and restoring data using a backup segment size larger than the storage block size |
US8311946B1 (en) * | 1999-10-15 | 2012-11-13 | Ebrary | Method and apparatus for improved information transactions |
US6667700B1 (en) | 2002-10-30 | 2003-12-23 | Nbt Technology, Inc. | Content-based segmentation scheme for data compression in storage and transmission including hierarchical segment representation |
US7065619B1 (en) | 2002-12-20 | 2006-06-20 | Data Domain, Inc. | Efficient data storage system |
US7055008B2 (en) * | 2003-01-22 | 2006-05-30 | Falconstor Software, Inc. | System and method for backing up data |
US8280926B2 (en) | 2003-08-05 | 2012-10-02 | Sepaton, Inc. | Scalable de-duplication mechanism |
US8938595B2 (en) | 2003-08-05 | 2015-01-20 | Sepaton, Inc. | Emulated storage system |
US7814056B2 (en) | 2004-05-21 | 2010-10-12 | Computer Associates Think, Inc. | Method and apparatus for data backup using data blocks |
US8725705B2 (en) * | 2004-09-15 | 2014-05-13 | International Business Machines Corporation | Systems and methods for searching of storage data with reduced bandwidth requirements |
US7523098B2 (en) * | 2004-09-15 | 2009-04-21 | International Business Machines Corporation | Systems and methods for efficient data searching, storage and reduction |
US7756833B2 (en) | 2004-09-22 | 2010-07-13 | Microsoft Corporation | Method and system for synthetic backup and restore |
US20080243769A1 (en) * | 2007-03-30 | 2008-10-02 | Symantec Corporation | System and method for exporting data directly from deduplication storage to non-deduplication storage |
US8352692B1 (en) * | 2007-03-30 | 2013-01-08 | Symantec Corporation | Utilizing peer-to-peer services with single instance storage techniques |
US7844117B2 (en) | 2007-09-07 | 2010-11-30 | Xerox Corporation | Method for identifying images under distortion via noise characterization and bregman optimal matrix approximations |
US7962452B2 (en) * | 2007-12-28 | 2011-06-14 | International Business Machines Corporation | Data deduplication by separating data from meta data |
US8447938B2 (en) * | 2008-01-04 | 2013-05-21 | International Business Machines Corporation | Backing up a deduplicated filesystem to disjoint media |
EP2235640A2 (en) * | 2008-01-16 | 2010-10-06 | Sepaton, Inc. | Scalable de-duplication mechanism |
US8041679B1 (en) * | 2008-06-04 | 2011-10-18 | Symantec Operating Corporation | Synthetic differential backups creation for a database using binary log conversion |
US8244681B2 (en) * | 2008-06-09 | 2012-08-14 | Symantec Operating Corporation | Creating synthetic backup images on a remote computer system |
US8099572B1 (en) * | 2008-09-30 | 2012-01-17 | Emc Corporation | Efficient backup and restore of storage objects in a version set |
US8751462B2 (en) * | 2008-11-14 | 2014-06-10 | Emc Corporation | Delta compression after identity deduplication |
US8412677B2 (en) | 2008-11-26 | 2013-04-02 | Commvault Systems, Inc. | Systems and methods for byte-level or quasi byte-level single instancing |
US8315985B1 (en) | 2008-12-18 | 2012-11-20 | Symantec Corporation | Optimizing the de-duplication rate for a backup stream |
US8200926B1 (en) * | 2009-05-28 | 2012-06-12 | Symantec Corporation | Methods and systems for creating full backups |
US8255365B2 (en) * | 2009-06-08 | 2012-08-28 | Symantec Corporation | Source classification for performing deduplication in a backup operation |
US8904125B1 (en) * | 2009-09-03 | 2014-12-02 | Symantec Corporation | Systems and methods for creating reference-based synthetic backups |
US8346787B1 (en) * | 2009-09-15 | 2013-01-01 | Symantec Corporation | Method and apparatus for continuous data protection |
US8311964B1 (en) * | 2009-11-12 | 2012-11-13 | Symantec Corporation | Progressive sampling for deduplication indexing |
US8380678B2 (en) | 2009-11-24 | 2013-02-19 | Symantec Corporation | Tracking files which have been processed by a backup or a restore operation |
US8156306B1 (en) | 2009-12-18 | 2012-04-10 | Emc Corporation | Systems and methods for using thin provisioning to reclaim space identified by data reduction processes |
US9501365B2 (en) * | 2009-12-28 | 2016-11-22 | Netapp, Inc. | Cloud-based disaster recovery of backup data and metadata |
US20120011101A1 (en) | 2010-07-12 | 2012-01-12 | Computer Associates Think, Inc. | Integrating client and server deduplication systems |
US8682873B2 (en) * | 2010-12-01 | 2014-03-25 | International Business Machines Corporation | Efficient construction of synthetic backups within deduplication storage system |
US8442945B1 (en) * | 2012-01-03 | 2013-05-14 | Don Doerner | No touch synthetic full backup |
-
2010
- 2010-12-01 US US12/958,205 patent/US8682873B2/en active Active
-
2011
- 2011-11-16 EP EP11787825.6A patent/EP2646915B1/en active Active
- 2011-11-16 KR KR1020137016583A patent/KR101599113B1/ko active Active
- 2011-11-16 CN CN201180057803.5A patent/CN103229147B/zh active Active
- 2011-11-16 AU AU2011335219A patent/AU2011335219B2/en active Active
- 2011-11-16 CA CA2817119A patent/CA2817119C/en active Active
- 2011-11-16 JP JP2013541283A patent/JP5878548B2/ja active Active
- 2011-11-16 WO PCT/EP2011/070290 patent/WO2012072419A1/en active Application Filing
-
2012
- 2012-06-04 US US13/488,180 patent/US8682854B2/en active Active
-
2013
- 2013-03-13 US US13/801,756 patent/US9697222B2/en active Active
- 2013-03-13 US US13/801,765 patent/US9852145B2/en active Active
- 2013-03-13 US US13/801,785 patent/US9031921B2/en not_active Expired - Fee Related
- 2013-03-13 US US13/801,774 patent/US9858286B2/en active Active
-
2015
- 2015-04-21 US US14/691,787 patent/US9575983B2/en not_active Expired - Fee Related
-
2017
- 2017-11-17 US US15/816,205 patent/US10585857B2/en active Active
- 2017-11-29 US US15/825,272 patent/US10621142B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
CA2817119C (en) | 2019-09-10 |
US20180095986A1 (en) | 2018-04-05 |
US20150227545A1 (en) | 2015-08-13 |
US20180081898A1 (en) | 2018-03-22 |
EP2646915A1 (en) | 2013-10-09 |
US9575983B2 (en) | 2017-02-21 |
US20130232120A1 (en) | 2013-09-05 |
CN103229147A (zh) | 2013-07-31 |
US8682854B2 (en) | 2014-03-25 |
US9852145B2 (en) | 2017-12-26 |
US20120239625A1 (en) | 2012-09-20 |
US20130232117A1 (en) | 2013-09-05 |
JP5878548B2 (ja) | 2016-03-08 |
US9697222B2 (en) | 2017-07-04 |
AU2011335219B2 (en) | 2015-06-04 |
US10621142B2 (en) | 2020-04-14 |
US20120143835A1 (en) | 2012-06-07 |
US10585857B2 (en) | 2020-03-10 |
WO2012072419A1 (en) | 2012-06-07 |
KR20130123410A (ko) | 2013-11-12 |
CA2817119A1 (en) | 2012-06-07 |
US20130232116A1 (en) | 2013-09-05 |
US9858286B2 (en) | 2018-01-02 |
JP2014503886A (ja) | 2014-02-13 |
US9031921B2 (en) | 2015-05-12 |
AU2011335219A1 (en) | 2013-04-04 |
CN103229147B (zh) | 2016-03-16 |
US20130232119A1 (en) | 2013-09-05 |
US8682873B2 (en) | 2014-03-25 |
EP2646915B1 (en) | 2017-09-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101599113B1 (ko) | 중복제거 저장 시스템내에서 합성 백업 | |
US9043540B2 (en) | Systems and methods for tracking block ownership | |
US8918400B2 (en) | Data set index record preservation | |
US9715505B1 (en) | Method and system for maintaining persistent live segment records for garbage collection | |
AU2013210018B2 (en) | Location independent files | |
EP3333730A1 (en) | Data processing device, data processing program and data processing method | |
EP3495964B1 (en) | Apparatus and program for data processing | |
CN113821476B (zh) | 数据处理方法及装置 | |
US20220197861A1 (en) | System and method for reducing read amplification of archival storage using proactive consolidation | |
CN112416879B (zh) | 一种基于ntfs文件系统的块级数据去重方法 | |
US20240143213A1 (en) | Fingerprint tracking structure for storage system | |
TWI475419B (zh) | 用於在儲存系統上存取檔案的方法和系統 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0105 | International application |
Patent event date: 20130626 Patent event code: PA01051R01D Comment text: International Patent Application |
|
A201 | Request for examination | ||
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20131024 Comment text: Request for Examination of Application |
|
PG1501 | Laying open of application | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20150119 Patent event code: PE09021S01D |
|
E90F | Notification of reason for final refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Final Notice of Reason for Refusal Patent event date: 20150714 Patent event code: PE09021S02D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20160105 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20160224 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20160224 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
FPAY | Annual fee payment |
Payment date: 20200129 Year of fee payment: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20200129 Start annual number: 5 End annual number: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20210128 Start annual number: 6 End annual number: 6 |
|
PR1001 | Payment of annual fee |
Payment date: 20220127 Start annual number: 7 End annual number: 7 |
|
PR1001 | Payment of annual fee |
Payment date: 20240201 Start annual number: 9 End annual number: 9 |
|
PR1001 | Payment of annual fee |
Payment date: 20250211 Start annual number: 10 End annual number: 10 |