JP7647078B2 - 情報処理装置、重複除去方法及び重複除去プログラム - Google Patents
情報処理装置、重複除去方法及び重複除去プログラム Download PDFInfo
- Publication number
- JP7647078B2 JP7647078B2 JP2020203773A JP2020203773A JP7647078B2 JP 7647078 B2 JP7647078 B2 JP 7647078B2 JP 2020203773 A JP2020203773 A JP 2020203773A JP 2020203773 A JP2020203773 A JP 2020203773A JP 7647078 B2 JP7647078 B2 JP 7647078B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- similar
- segment
- storage device
- chunk
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
1a,91a RAM
1b CPU
1c I/F
1d ODD
1e LANインタフェース
2a,92a ディスク
3 アプリケーション
11 重複インデックス
12 類似インデックス
13 論物アドレスマッピング情報
14 キャッシュデータ
21 重複判定部
22 類似判定部
23 差分処理部
24 更新部
31 論物アドレスマッピング情報
32 データ
92 ストレージノード
Claims (5)
- 互いに類似するデータに対して互いに異なる値をとる第一ハッシュ関数を用いて記憶装置への書き込みデータと同一の同一データが前記記憶装置にないと判定される場合に、前記書き込みデータに類似する類似データが前記記憶装置にあるか否かを、前記第一ハッシュ関数と異なる第二ハッシュ関数であって、互いに類似するデータに対して互いに同一の値をとる前記第二ハッシュ関数を用いてハミング距離に基づいて判定する類似判定部と、
前記類似判定部により前記書き込みデータと前記第二ハッシュ関数の値が同一値となる前記類似データが前記記憶装置にあると判定された場合に、前記書き込みデータと前記類似データの差分、または、前記書き込みデータと前記類似データの排他的論理和を前記記憶装置に書き込む書き込み部と、
を有する情報処理装置。 - 前記書き込みデータは複数のチャンクに分割され、
前記類似判定部は、前記チャンクごとに前記書き込みデータと重複する重複データがあるか否かを判定し、前記チャンクごとの重複データの有無に基づいて前記差分を計算する、
請求項1に記載の情報処理装置。 - 前記データと該データの類似判定に用いられるフィンガープリントと該データに含まれるチャンクの物理アドレスとを対応付けて類似インデックスとして記憶するとともに、前記チャンクと該チャンクの論理アドレスと物理アドレスとを対応付けて論物情報として記憶する記憶部と、
前記類似判定部により前記類似データがあると判定された場合に、前記書き込みデータに基づいて前記類似インデックス及び前記論物情報を更新する更新部と、
をさらに有する請求項2に記載の情報処理装置。 - コンピュータが、
互いに類似するデータに対して互いに異なる値をとる第一ハッシュ関数を用いて記憶装置への書き込みデータと同一の同一データが前記記憶装置にないと判定される場合に、前記書き込みデータに類似する類似データが前記記憶装置にあるか否かを、前記第一ハッシュ関数と異なる第二ハッシュ関数であって、互いに類似するデータに対して互いに同一の値をとる前記第二ハッシュ関数を用いてハミング距離に基づいて判定し、
前記書き込みデータと前記第二ハッシュ関数の値が同一値となる前記類似データが前記記憶装置にあると判定した場合に、前記書き込みデータと前記類似データの差分、または、前記書き込みデータと前記類似データの排他的論理和を前記記憶装置に書き込む、
処理を実行する重複除去方法。 - コンピュータに、
互いに類似するデータに対して互いに異なる値をとる第一ハッシュ関数を用いて記憶装置への書き込みデータと同一の同一データが前記記憶装置にないと判定される場合に、前記書き込みデータに類似する類似データが前記記憶装置にあるか否かを、前記第一ハッシュ関数と異なる第二ハッシュ関数であって、互いに類似するデータに対して互いに同一の値をとる前記第二ハッシュ関数を用いてハミング距離に基づいて判定し、
前記書き込みデータと前記第二ハッシュ関数の値が同一値となる前記類似データが前記記憶装置にあると判定した場合に、前記書き込みデータと前記類似データの差分、または、前記書き込みデータと前記類似データの排他的論理和を前記記憶装置に書き込む、
処理を実行させる重複除去プログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2020203773A JP7647078B2 (ja) | 2020-12-08 | 2020-12-08 | 情報処理装置、重複除去方法及び重複除去プログラム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2020203773A JP7647078B2 (ja) | 2020-12-08 | 2020-12-08 | 情報処理装置、重複除去方法及び重複除去プログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2022091062A JP2022091062A (ja) | 2022-06-20 |
| JP7647078B2 true JP7647078B2 (ja) | 2025-03-18 |
Family
ID=82060793
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2020203773A Active JP7647078B2 (ja) | 2020-12-08 | 2020-12-08 | 情報処理装置、重複除去方法及び重複除去プログラム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP7647078B2 (ja) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN119213285A (zh) | 2022-06-03 | 2024-12-27 | 富士胶片株式会社 | 校准部件、能量测定装置、能量测定方法及能量测定程序 |
Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2016181479A1 (ja) | 2015-05-12 | 2016-11-17 | 株式会社日立製作所 | ストレージシステムおよび記憶制御方法 |
| JP2017191432A (ja) | 2016-04-13 | 2017-10-19 | 富士通株式会社 | 情報記憶装置、重複除去方法、および重複除去プログラム |
| JP2018045305A (ja) | 2016-09-12 | 2018-03-22 | 株式会社東芝 | ストレージ装置、及びプログラム |
| JP2019020906A (ja) | 2017-07-13 | 2019-02-07 | 富士通株式会社 | 情報処理装置及びプログラム |
| JP2019046023A (ja) | 2017-08-31 | 2019-03-22 | 富士通株式会社 | 情報処理装置、情報処理方法及びプログラム |
| US20200364516A1 (en) | 2019-05-15 | 2020-11-19 | EMC IP Holding Company LLC | Data compression using nearest neighbor cluster |
-
2020
- 2020-12-08 JP JP2020203773A patent/JP7647078B2/ja active Active
Patent Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2016181479A1 (ja) | 2015-05-12 | 2016-11-17 | 株式会社日立製作所 | ストレージシステムおよび記憶制御方法 |
| JP2017191432A (ja) | 2016-04-13 | 2017-10-19 | 富士通株式会社 | 情報記憶装置、重複除去方法、および重複除去プログラム |
| JP2018045305A (ja) | 2016-09-12 | 2018-03-22 | 株式会社東芝 | ストレージ装置、及びプログラム |
| JP2019020906A (ja) | 2017-07-13 | 2019-02-07 | 富士通株式会社 | 情報処理装置及びプログラム |
| JP2019046023A (ja) | 2017-08-31 | 2019-03-22 | 富士通株式会社 | 情報処理装置、情報処理方法及びプログラム |
| US20200364516A1 (en) | 2019-05-15 | 2020-11-19 | EMC IP Holding Company LLC | Data compression using nearest neighbor cluster |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2022091062A (ja) | 2022-06-20 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| USRE49148E1 (en) | Reclaiming space occupied by duplicated data in a storage system | |
| USRE49011E1 (en) | Mapping in a storage system | |
| US20210157523A1 (en) | Storage system | |
| US8954710B2 (en) | Variable length encoding in a storage system | |
| US9454477B2 (en) | Logical sector mapping in a flash storage array | |
| US8639669B1 (en) | Method and apparatus for determining optimal chunk sizes of a deduplicated storage system | |
| US8539148B1 (en) | Deduplication efficiency | |
| US8712963B1 (en) | Method and apparatus for content-aware resizing of data chunks for replication | |
| US9977746B2 (en) | Processing of incoming blocks in deduplicating storage system | |
| US10055420B1 (en) | Method to optimize random IOS of a storage device for multiple versions of backups using incremental metadata | |
| JP6320432B2 (ja) | データ重複排除における、類似性探索に基づくダイジェスト検索 | |
| US10936228B2 (en) | Providing data deduplication in a data storage system with parallelized computation of crypto-digests for blocks of host I/O data | |
| US11455122B2 (en) | Storage system and data compression method for storage system | |
| US8538933B1 (en) | Deduplicating range of data blocks | |
| US20170199893A1 (en) | Storing data deduplication metadata in a grid of processors | |
| JP7647078B2 (ja) | 情報処理装置、重複除去方法及び重複除去プログラム | |
| CN104298614A (zh) | 数据块在存储设备中存储方法和存储设备 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230804 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240731 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240813 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20241011 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20241105 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20241219 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20250204 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20250217 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7647078 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |