发明公开
CN105740266A 用于数据去重的方法和设备
无效 - 撤回
- 专利标题: 用于数据去重的方法和设备
- 专利标题(英): Data deduplication method and device
-
申请号: CN201410755974.0申请日: 2014-12-10
-
公开(公告)号: CN105740266A公开(公告)日: 2016-07-06
- 发明人: 朱国峰 , 方敏 , 郑家阳
- 申请人: 国际商业机器公司
- 申请人地址: 美国纽约阿芒克
- 专利权人: 国际商业机器公司
- 当前专利权人: 国际商业机器公司
- 当前专利权人地址: 美国纽约阿芒克
- 代理机构: 北京市金杜律师事务所
- 代理商 酆迅; 陈颖
- 主分类号: G06F17/30
- IPC分类号: G06F17/30
摘要:
本发明的实施例公开了一种用于数据去重的方法,包括:在所述数据中获取一个当前文件;根据所述当前文件中至少一个预定位置处的采样数据块,确定是否存有相似的历史文件;响应于不存在相似的历史文件,以文件为单位存储所述当前文件以及相应的元数据;响应于存在相似的历史文件,对所述当前文件采用以块为单位的去重操作。通过本申请的方案,能够提高数据去重的效率。