JP5154566B2 - 多数の選択基準を用いるデータ管理方法およびシステム - Google Patents
多数の選択基準を用いるデータ管理方法およびシステム Download PDFInfo
- Publication number
- JP5154566B2 JP5154566B2 JP2009539422A JP2009539422A JP5154566B2 JP 5154566 B2 JP5154566 B2 JP 5154566B2 JP 2009539422 A JP2009539422 A JP 2009539422A JP 2009539422 A JP2009539422 A JP 2009539422A JP 5154566 B2 JP5154566 B2 JP 5154566B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- function
- content
- chunk
- processing unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/17—Details of further file system functions
- G06F16/174—Redundancy elimination performed by the file system
- G06F16/1748—De-duplication implemented within the file system, e.g. based on file segments
- G06F16/1752—De-duplication implemented within the file system, e.g. based on file segments based on file chunks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F7/00—Methods or arrangements for processing data by operating upon the order or content of the data handled
- G06F7/22—Arrangements for sorting or merging computer data on continuous record carriers, e.g. tape, drum, disc
- G06F7/24—Sorting, i.e. extracting data from one or more carriers, rearranging the data in numerical or other ordered sequence, and rerecording the sorted data on the original carrier or on a different carrier or set of carriers sorting methods in general
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/16—Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Computer Hardware Design (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
Philip Koopman, 32-Bit Cyclic Redundancy Codes for Internet Ap plications, Proceedings of the 2002 Conference on Dependable Systems and Netwo rks, 2002 Jonathan Stone and Michael Greenwald, Performance of Checksums and CRCs over Real Data, IEEE/ACM Transactions on Networking, 1998 Val Henson and Richard Henderson, An Analysis of Compare-by-Ha sh, proceedings of the Ninth Workshop on Hot Topics in Operating Systems, Lihu e, Hawaii, May 2003, pp. 13-18 Raj Jain, A Comparison of Hashing Schemes for Address Lookup i n Computer Networks, IEEE Transactions on Communications, 1992.
Claims (27)
- コンピュータで実施されるデータ管理方法であって、
処理ユニットにおいて、データストリーム中の、データの複数のウインドウの一部を、ボックスカーサム関数、倍数直線一致発生器(MLCG)関数、またはrolN-xor関数を含む第1の、コンテンツで規定される選択関数を用いて予め選択するステップと、
処理ユニットにおいて、予め選択された、前記複数のウインドウの前記一部のサブセットを、所与の特性を最大化する第2の、コンテンツで規定される選択関数を用いて選択するステップと、
を有し、
前記第1の、コンテンツで規定される選択関数は、前記第2の、コンテンツで規定される選択関数よりもデータブロック境界を選択するのが速い、
コンピュータで実施されるデータ管理方法。 - 前記第1の、コンテンツで規定される関数は前記第2の、コンテンツで規定される関数よりも、ウインドウを選択するのが速い、請求項1に記載の方法。
- 前記第1の、コンテンツで規定される関数は前記ボックスカーサム関数であり、該ボックスカーサム関数は、前記ボックスカーサムの値の選択基準と結合されている、請求項1に記載の方法。
- 前記第2の、コンテンツで規定される関数はRabin指紋、SHA-1関数、またはCRC32c関数を含む、請求項1に記載の方法。
- 前記第1の、コンテンツで規定される関数は、ローリングウインドウ関数、スライディングウインドウ関数、またはムービングウインドウ関数を含む、請求項1に記載の方法。
- 前記の複数のウインドウは、ハッシングのためのデータグループを定めるのに使用され、前記データストリーム中のブレイクポイントを決定する速度が大きくされる、請求項1に記載の方法。
- 前記処理ユニットにおいて、前記サブセットの1つまたは複数のチャンクポイントによって定まるデータチャンクサイズの値を生成するステップをさらに有し、生成された値は前記データチャンクに含まれる基底データを示す、請求項1に記載の方法。
- 前記処理ユニットにおいて、前記生成された値を、以前に生成された1つまたは複数の値と比較して、前記生成された値が、前記の以前に生成された1つまたは複数の値と等しいかどうか判定するステップをさらに有する、請求項7に記載の方法。
- 前記処理ユニットにおいて、データ重複が存在すると判定するステップと、
前記処理ユニットにおいて、重複データを有すると判定されたデータチャンク内のデータをさらに処理するのを停止するステップと、
をさらに有する、請求項8に記載の方法。 - 前記処理ユニットにおいて、前記の生成された値を、データ重複がない場合に格納するステップをさらに有する、請求項8に記載の方法。
- 前記処理ユニットにおいて、前記第2の、コンテンツで規定される関数によって選択された、データの新しいウインドウまたはデータチャンクに含まれる基底データを、以前に定められた、データの1つまた複数のウインドウまたは1つまたは複数のデータチャンクからの以前に発生した基底データと比較するステップをさらに有する、請求項1に記載の方法。
- 前記処理ユニットにおいて、データの前記新しいウインドウに含まれる基底データを、該基底データが前記の以前に発生した基底データと等しくなければ出力するステップと、
前記処理ユニットにおいて、前記の新しいデータチャンクに含まれる前記基底データを、該基底データが前記の以前に発生した基底データと等しければ出力しないステップと、
をさらに有する、請求項11に記載の方法。 - 前記処理ユニットにおいて、データのウインドウまたはデータチャンクに含まれる基底データを示す、データのウインドウまたはデータチャンクの値を生成するステップをさらに有する、請求項1に記載の方法。
- 前記処理ユニットにおいて、前記生成された値を、前記の以前に生成されたまたは発生した1つまたは複数の値と比較するステップをさらに有する、請求項13に記載の方法。
- 前記処理ユニットにおいて、前記の生成された値を、該生成された値が前記の以前に生成されたまたは発生した1つまたは複数の値と等しくなければ出力するステップと、
前記処理ユニットにおいて、前記の生成された値を、該生成された値が前記の以前に生成されたまたは発生した1つまたは複数の値と等しければ出力しないステップと、
をさらに有する、請求項14に記載の方法。 - データ管理のために、データストリーム中の境界ポイントを求める、コンピュータで実施される方法であって、
前記処理ユニットにおいて、データストリーム中の複数の境界ポイントの一部分を、ボックスカーサム関数、倍数直線一致発生器(MLCG)関数、またはrolN-xor関数を含む第1の、コンテンツで規定される選択関数を用いて予め選択するステップと、
前記処理ユニットにおいて、予め選択された、前記複数の境界ポイントの前記一部分のサブセットを、所与の特性を最大化する第2の、コンテンツで規定される選択関数を用いて選択するステップと、
前記処理ユニットにおいて、前記複数の境界ポイントの前記一部分の前記サブセットによって求められたデータのチャンクの値を生成するステップと、
を有し、
前記第1の、コンテンツで規定される選択関数は、前記第2の、コンテンツで規定される選択関数よりも境界ポイントを選択するのが速い、
データ管理のために、データストリーム中の境界ポイントを求める、コンピュータで実施される方法。 - 前記処理ユニットにおいて、前記の生成された値を、重複を検出するようにまたは前記の生成された値を格納するように、1つまたは複数の格納された値と比較するステップをさらに有する、請求項16に記載の方法。
- 値を生成することが、ハッシングによって行われる、請求項17に記載の方法。
- 前記処理ユニットにおいて、1つまたは複数の境界ポイントによって定まるデータのチャンクに含まれるデータをハッシングすることによって見出された重複データを除去するステップをさらに有する、請求項18に記載の方法。
- 処理ユニットと、
データブレイクポイントまたはウインドウの第1のセットを予め選択するように構成された、ボックスカーサム関数、倍数直線一致発生器(MLCG)関数、またはrolN-xor関数を含む第1の、コンテンツで規定される選択関数モジュールと、
前記の予め選択されたデータブレイクポイントまたはウインドウのサブセットを選択するように構成された、所与の特性を最大化する第2の、コンテンツで規定される選択関数モジュールと、
を有し、
前記第1の、コンテンツで規定される選択関数モジュールは前記第2の、コンテンツで規定される選択関数モジュールよりも速くデータブレイクポイントまたはウインドウを処理する
データ処理システム。 - 前記第1の、コンテンツで規定される選択関数モジュールはボックスカーサム関数を含み、前記第2の、コンテンツで規定される選択関数モジュールはRabin関数を含む、請求項20に記載のデータ処理システム。
- 前記データ処理システムはハッシングシステムであり、コンテンツで規定される1つまた複数のデータブロックまたは1つまたは複数のチャンクポイントを出力する、請求項21に記載のデータ処理システム。
- ボックスカーサム関数、倍数直線一致発生器(MLCG)関数、またはrolN-xor関数を含む、コンテンツで規定される予選択関数を用いて、データブレイクポイントまたはウインドウの第1のセットを予め選択する手段と、
所与の特性を最大化する、コンテンツで規定される選択関数を用いて、前記の予め選択されたデータブレイクポイントまたはウインドウのサブセットを選択し、出力する手段と、
を有し、
前記の予め選択する手段は、前記データブレイクポイントまたはウインドウを前記の選択する手段よりも速く処理する、
データ処理システム。 - 前記サブセットの前記1つまたは複数のデータブレイクポイントまたは1つまたは複数のウインドウの各々の値を生成する手段をさらに有する、請求項23に記載のデータ処理システム。
- 前記のデータブレイクポイントまたはウインドウの第1のセットを予め選択する手段はローリングボックスサム関数を実行し、前記の予め選択されたデータブレイクポイントまたはウインドウのサブセットを選択し、出力する手段はRabin関数を実行し、値を生成する前記手段はSHA-1関数を実行する、請求項24に記載のデータ処理システム。
- 前記の生成された値はハッシュ値である、請求項25に記載のデータ処理システム。
- 前記データ処理システムはハッシングシステムであり、コンテンツで規定される1つまた複数のデータブロックまたは1つまたは複数のチャンクポイントを出力する、請求項23に記載のデータ処理システム。
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US11/566,122 US7844581B2 (en) | 2006-12-01 | 2006-12-01 | Methods and systems for data management using multiple selection criteria |
| US11/566,122 | 2006-12-01 | ||
| PCT/US2007/085357 WO2008067226A1 (en) | 2006-12-01 | 2007-11-21 | Methods and systems for data management using multiple selection criteria |
Publications (3)
| Publication Number | Publication Date |
|---|---|
| JP2010512565A JP2010512565A (ja) | 2010-04-22 |
| JP2010512565A5 JP2010512565A5 (ja) | 2010-10-07 |
| JP5154566B2 true JP5154566B2 (ja) | 2013-02-27 |
Family
ID=39469410
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2009539422A Active JP5154566B2 (ja) | 2006-12-01 | 2007-11-21 | 多数の選択基準を用いるデータ管理方法およびシステム |
Country Status (9)
| Country | Link |
|---|---|
| US (1) | US7844581B2 (ja) |
| EP (1) | EP2087418A4 (ja) |
| JP (1) | JP5154566B2 (ja) |
| KR (1) | KR101541146B1 (ja) |
| CN (1) | CN101379465B (ja) |
| AU (1) | AU2007325319B2 (ja) |
| CA (1) | CA2640736C (ja) |
| TW (1) | TWI459726B (ja) |
| WO (1) | WO2008067226A1 (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8776568B2 (en) * | 2009-08-25 | 2014-07-15 | Nippon Steel & Sumitomo Metal Corporation | Bent member and an apparatus and method for its manufacture |
Families Citing this family (53)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20080005391A1 (en) | 2006-06-05 | 2008-01-03 | Bugra Gedik | Method and apparatus for adaptive in-operator load shedding |
| US20090204636A1 (en) * | 2008-02-11 | 2009-08-13 | Microsoft Corporation | Multimodal object de-duplication |
| US7890480B2 (en) * | 2008-02-11 | 2011-02-15 | International Business Machines Corporation | Processing of deterministic user-defined functions using multiple corresponding hash tables |
| US9766983B2 (en) * | 2008-03-05 | 2017-09-19 | Ca, Inc. | Proximity and in-memory map based signature searching for duplicate data |
| US7539710B1 (en) * | 2008-04-11 | 2009-05-26 | International Business Machines Corporation | Method of and system for deduplicating backed up data in a client-server environment |
| US8122069B2 (en) * | 2008-07-09 | 2012-02-21 | Hewlett-Packard Development Company, L.P. | Methods for pairing text snippets to file activity |
| US7953752B2 (en) * | 2008-07-09 | 2011-05-31 | Hewlett-Packard Development Company, L.P. | Methods for merging text snippets for context classification |
| US8117343B2 (en) * | 2008-10-28 | 2012-02-14 | Hewlett-Packard Development Company, L.P. | Landmark chunking of landmarkless regions |
| US8140491B2 (en) * | 2009-03-26 | 2012-03-20 | International Business Machines Corporation | Storage management through adaptive deduplication |
| US8538188B2 (en) * | 2009-08-04 | 2013-09-17 | Mitre Corporation | Method and apparatus for transferring and reconstructing an image of a computer readable medium |
| US8180740B1 (en) * | 2009-08-12 | 2012-05-15 | Netapp, Inc. | System and method for eliminating duplicate data by generating data fingerprints using adaptive fixed-length windows |
| US8924439B2 (en) * | 2009-09-01 | 2014-12-30 | Verizon Patent And Licensing Inc. | System for and method of partial file hashing |
| US8407193B2 (en) * | 2010-01-27 | 2013-03-26 | International Business Machines Corporation | Data deduplication for streaming sequential data storage applications |
| JP5372853B2 (ja) * | 2010-07-08 | 2013-12-18 | 株式会社日立製作所 | デジタルシーケンス特徴量算出方法及びデジタルシーケンス特徴量算出装置 |
| US8397080B2 (en) * | 2010-07-29 | 2013-03-12 | Industrial Technology Research Institute | Scalable segment-based data de-duplication system and method for incremental backups |
| US8495093B2 (en) | 2010-08-18 | 2013-07-23 | International Business Machines Corporation | Multiway trie data structure that dynamically adjusts node sizes in a manner that reduces memory footprint and improves access speed |
| US20120137303A1 (en) * | 2010-11-26 | 2012-05-31 | Hitachi, Ltd. | Computer system |
| WO2012112121A1 (en) * | 2011-02-17 | 2012-08-23 | Jitcomm Networks Pte Ltd | Parallel data partitioning |
| JP5708107B2 (ja) * | 2011-03-23 | 2015-04-30 | 日本電気株式会社 | 重複ファイル検出装置 |
| WO2012140686A1 (en) * | 2011-04-11 | 2012-10-18 | Hitachi, Ltd. | Data management method and data management system |
| JP5719037B2 (ja) * | 2011-08-19 | 2015-05-13 | 株式会社日立製作所 | ストレージ装置及び重複データ検出方法 |
| US8880493B2 (en) * | 2011-09-28 | 2014-11-04 | Hewlett-Packard Development Company, L.P. | Multi-streams analytics |
| KR101382273B1 (ko) * | 2011-09-30 | 2014-04-10 | 인하대학교 산학협력단 | Ssd 저장장치의 마모도 감소를 위한 ssd 기반 서버급 저장장치의 복합적 데이터 중복제거 방법 |
| US9569439B2 (en) | 2011-10-31 | 2017-02-14 | Elwha Llc | Context-sensitive query enrichment |
| US9672218B2 (en) | 2012-02-02 | 2017-06-06 | Hewlett Packard Enterprise Development Lp | Systems and methods for data chunk deduplication |
| WO2013158066A1 (en) | 2012-04-16 | 2013-10-24 | Hewlett-Packard Development Company, L.P. | File upload based on hash value comparison |
| US20150088840A1 (en) * | 2012-05-01 | 2015-03-26 | Kave Eshghi | Determining segment boundaries for deduplication |
| US9164688B2 (en) | 2012-07-03 | 2015-10-20 | International Business Machines Corporation | Sub-block partitioning for hash-based deduplication |
| KR101956031B1 (ko) * | 2012-10-15 | 2019-03-11 | 삼성전자 주식회사 | 데이터 압축 장치 및 방법, 데이터 압축 장치를 포함하는 메모리 시스템 |
| US10592347B2 (en) | 2013-05-16 | 2020-03-17 | Hewlett Packard Enterprise Development Lp | Selecting a store for deduplicated data |
| WO2014185916A1 (en) | 2013-05-16 | 2014-11-20 | Hewlett-Packard Development Company, L.P. | Selecting a store for deduplicated data |
| CN105446964B (zh) * | 2014-05-30 | 2019-04-26 | 国际商业机器公司 | 用于文件的重复数据删除的方法及装置 |
| US9514312B1 (en) * | 2014-09-05 | 2016-12-06 | Symantec Corporation | Low-memory footprint fingerprinting and indexing for efficiently measuring document similarity and containment |
| US10372695B2 (en) * | 2014-12-27 | 2019-08-06 | Intel Corporation | Technologies for computing rolling hashes |
| US9805180B2 (en) * | 2015-10-27 | 2017-10-31 | Blackberry Limited | Message sender authentication |
| JP6113816B1 (ja) * | 2015-11-18 | 2017-04-12 | 株式会社東芝 | 情報処理システム、情報処理装置、及びプログラム |
| EP3282588B1 (en) * | 2016-08-09 | 2019-09-25 | Siemens Aktiengesellschaft | Method, system and program product for data transmission with a reduced data volume |
| US10795859B1 (en) | 2017-04-13 | 2020-10-06 | EMC IP Holding Company LLC | Micro-service based deduplication |
| US10795860B1 (en) * | 2017-04-13 | 2020-10-06 | EMC IP Holding Company LLC | WAN optimized micro-service based deduplication |
| US11461269B2 (en) | 2017-07-21 | 2022-10-04 | EMC IP Holding Company | Metadata separated container format |
| US10860212B1 (en) | 2017-07-21 | 2020-12-08 | EMC IP Holding Company LLC | Method or an apparatus to move perfect de-duplicated unique data from a source to destination storage tier |
| US10459633B1 (en) | 2017-07-21 | 2019-10-29 | EMC IP Holding Company LLC | Method for efficient load balancing in virtual storage systems |
| US10936543B1 (en) | 2017-07-21 | 2021-03-02 | EMC IP Holding Company LLC | Metadata protected sparse block set for SSD cache space management |
| US10949088B1 (en) | 2017-07-21 | 2021-03-16 | EMC IP Holding Company LLC | Method or an apparatus for having perfect deduplication, adapted for saving space in a deduplication file system |
| US11113153B2 (en) | 2017-07-27 | 2021-09-07 | EMC IP Holding Company LLC | Method and system for sharing pre-calculated fingerprints and data chunks amongst storage systems on a cloud local area network |
| US10481813B1 (en) | 2017-07-28 | 2019-11-19 | EMC IP Holding Company LLC | Device and method for extending cache operational lifetime |
| US10929382B1 (en) | 2017-07-31 | 2021-02-23 | EMC IP Holding Company LLC | Method and system to verify integrity of a portion of replicated data |
| US11093453B1 (en) | 2017-08-31 | 2021-08-17 | EMC IP Holding Company LLC | System and method for asynchronous cleaning of data objects on cloud partition in a file system with deduplication |
| US10866928B2 (en) | 2018-09-10 | 2020-12-15 | Netapp, Inc. | Methods for optimized variable-size deduplication using two stage content-defined chunking and devices thereof |
| US11061932B2 (en) | 2018-10-06 | 2021-07-13 | Teradata Us, Inc. | Methods and system for managing storage with multiple simultaneous data temperature models |
| US10938961B1 (en) * | 2019-12-18 | 2021-03-02 | Ndata, Inc. | Systems and methods for data deduplication by generating similarity metrics using sketch computation |
| US12517869B2 (en) * | 2023-09-29 | 2026-01-06 | Acronis International Gmbh | Systems and methods for executing jump-based content-defined data chunking |
| US20260111451A1 (en) * | 2024-10-18 | 2026-04-23 | Dell Products L.P. | Performing digital file analysis using graph-based representations and machine learning techniques |
Family Cites Families (30)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5990810A (en) * | 1995-02-17 | 1999-11-23 | Williams; Ross Neil | Method for partitioning a block of data into subblocks and for storing and communcating such subblocks |
| US6263336B1 (en) * | 1997-02-27 | 2001-07-17 | Seiko Epson Corporation | Text structure analysis method and text structure analysis device |
| JP3541930B2 (ja) * | 1998-08-13 | 2004-07-14 | 富士通株式会社 | 符号化装置及び復号化装置 |
| DE60123442D1 (de) * | 2000-08-31 | 2006-11-09 | Ontrack Data Internat Inc | System und verfahren für datenverwaltung |
| US6810398B2 (en) * | 2000-11-06 | 2004-10-26 | Avamar Technologies, Inc. | System and method for unorchestrated determination of data sequences using sticky byte factoring to determine breakpoints in digital sequences |
| US6658423B1 (en) * | 2001-01-24 | 2003-12-02 | Google, Inc. | Detecting duplicate and near-duplicate files |
| EP1244221A1 (en) * | 2001-03-23 | 2002-09-25 | Sun Microsystems, Inc. | Method and system for eliminating data redundancies |
| CN1294514C (zh) * | 2001-08-20 | 2007-01-10 | 信息中心科技有限公司 | 高效的计算机文件备份系统和方法 |
| US6667700B1 (en) * | 2002-10-30 | 2003-12-23 | Nbt Technology, Inc. | Content-based segmentation scheme for data compression in storage and transmission including hierarchical segment representation |
| US20050060643A1 (en) * | 2003-08-25 | 2005-03-17 | Miavia, Inc. | Document similarity detection and classification system |
| US7472254B2 (en) * | 2003-10-10 | 2008-12-30 | Iora, Ltd. | Systems and methods for modifying a set of data objects |
| US7281006B2 (en) * | 2003-10-23 | 2007-10-09 | International Business Machines Corporation | System and method for dividing data into predominantly fixed-sized chunks so that duplicate data chunks may be identified |
| US8135683B2 (en) * | 2003-12-16 | 2012-03-13 | International Business Machines Corporation | Method and apparatus for data redundancy elimination at the block level |
| US20060047855A1 (en) * | 2004-05-13 | 2006-03-02 | Microsoft Corporation | Efficient chunking algorithm |
| US7555531B2 (en) * | 2004-04-15 | 2009-06-30 | Microsoft Corporation | Efficient algorithm and protocol for remote differential compression |
| US7269689B2 (en) * | 2004-06-17 | 2007-09-11 | Hewlett-Packard Development Company, L.P. | System and method for sharing storage resources between multiple files |
| US7487138B2 (en) * | 2004-08-25 | 2009-02-03 | Symantec Operating Corporation | System and method for chunk-based indexing of file system content |
| US7680798B2 (en) * | 2004-11-20 | 2010-03-16 | International Business Machines Corporation | Method, device and system for automatic retrieval of similar objects in a network of devices |
| US7487169B2 (en) * | 2004-11-24 | 2009-02-03 | International Business Machines Corporation | Method for finding the longest common subsequences between files with applications to differential compression |
| US7564458B2 (en) * | 2004-12-15 | 2009-07-21 | Microsoft Corporation | System and method for interactively linking data to shapes in a diagram |
| WO2006094365A1 (en) * | 2005-03-11 | 2006-09-14 | Rocksoft Limited | Method for storing data with reduced redundancy using data clusters |
| US7984018B2 (en) * | 2005-04-18 | 2011-07-19 | Microsoft Corporation | Efficient point-to-multipoint data reconciliation |
| US7636767B2 (en) * | 2005-11-29 | 2009-12-22 | Cisco Technology, Inc. | Method and apparatus for reducing network traffic over low bandwidth links |
| US7844652B2 (en) * | 2006-04-11 | 2010-11-30 | Emc Corporation | Efficient computation of sketches |
| CN101427248B (zh) * | 2006-04-27 | 2013-05-22 | 英特尔公司 | 用于基于内容的分割与挖掘的基于系统的方法 |
| US8412682B2 (en) * | 2006-06-29 | 2013-04-02 | Netapp, Inc. | System and method for retrieving and using block fingerprints for data deduplication |
| US7504969B2 (en) * | 2006-07-11 | 2009-03-17 | Data Domain, Inc. | Locality-based stream segmentation for data deduplication |
| US7843823B2 (en) * | 2006-07-28 | 2010-11-30 | Cisco Technology, Inc. | Techniques for balancing throughput and compression in a network communication system |
| US7797323B1 (en) * | 2006-10-11 | 2010-09-14 | Hewlett-Packard Development Company, L.P. | Producing representative hashes for segments of a file |
| JP2008131594A (ja) * | 2006-11-24 | 2008-06-05 | Nippon Telegr & Teleph Corp <Ntt> | アプリケーション制御システムおよび制御方法 |
-
2006
- 2006-12-01 US US11/566,122 patent/US7844581B2/en active Active
-
2007
- 2007-11-21 EP EP07854739A patent/EP2087418A4/en not_active Withdrawn
- 2007-11-21 WO PCT/US2007/085357 patent/WO2008067226A1/en not_active Ceased
- 2007-11-21 AU AU2007325319A patent/AU2007325319B2/en not_active Ceased
- 2007-11-21 CA CA2640736A patent/CA2640736C/en not_active Expired - Fee Related
- 2007-11-21 CN CN2007800041298A patent/CN101379465B/zh not_active Expired - Fee Related
- 2007-11-21 JP JP2009539422A patent/JP5154566B2/ja active Active
- 2007-11-21 KR KR1020087021627A patent/KR101541146B1/ko active Active
- 2007-11-30 TW TW096145707A patent/TWI459726B/zh not_active IP Right Cessation
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8776568B2 (en) * | 2009-08-25 | 2014-07-15 | Nippon Steel & Sumitomo Metal Corporation | Bent member and an apparatus and method for its manufacture |
Also Published As
| Publication number | Publication date |
|---|---|
| CN101379465B (zh) | 2013-03-27 |
| KR20090094055A (ko) | 2009-09-03 |
| CN101379465A (zh) | 2009-03-04 |
| EP2087418A1 (en) | 2009-08-12 |
| WO2008067226A1 (en) | 2008-06-05 |
| US20080133446A1 (en) | 2008-06-05 |
| EP2087418A4 (en) | 2012-06-13 |
| CA2640736C (en) | 2014-10-14 |
| US7844581B2 (en) | 2010-11-30 |
| JP2010512565A (ja) | 2010-04-22 |
| TW200835174A (en) | 2008-08-16 |
| AU2007325319A1 (en) | 2008-06-05 |
| AU2007325319B2 (en) | 2011-11-17 |
| KR101541146B1 (ko) | 2015-07-31 |
| TWI459726B (zh) | 2014-11-01 |
| CA2640736A1 (en) | 2008-06-05 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP5154566B2 (ja) | 多数の選択基準を用いるデータ管理方法およびシステム | |
| KR101414970B1 (ko) | 고속의 효율적 데이터 관리 및/또는 처리를 위한 방법 및 시스템 | |
| Xia et al. | {FastCDC}: A fast and efficient {Content-Defined} chunking approach for data deduplication | |
| US8112477B2 (en) | Content identification for peer-to-peer content retrieval | |
| CN111382434B (zh) | 用于检测恶意文件的系统和方法 | |
| CN101803203B (zh) | 使用数据依赖组块的优化数据流压缩 | |
| US7733910B2 (en) | Data segmentation using shift-varying predicate function fingerprinting | |
| US9696936B2 (en) | Applying a maximum size bound on content defined segmentation of data | |
| JP2009528624A (ja) | クエリの一部に基づくキャッシュクエリ結果の提供 | |
| US10817474B2 (en) | Adaptive rate compression hash processor | |
| US9244830B2 (en) | Hierarchical content defined segmentation of data | |
| US20150088840A1 (en) | Determining segment boundaries for deduplication | |
| CN113728304A (zh) | 分布式存储系统中的粒度改变检测 | |
| US20160132519A1 (en) | Applying a minimum size bound on content defined segmentation of data | |
| US11347424B1 (en) | Offset segmentation for improved inline data deduplication | |
| CN118013087A (zh) | 一种密文检索方法、设备、装置及存储介质 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100823 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100823 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120710 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121001 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121106 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121205 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151214 Year of fee payment: 3 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 5154566 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |