-
公开(公告)号:CN115328703A
公开(公告)日:2022-11-11
申请号:CN202211034878.8
申请日:2022-08-26
Applicant: 华中科技大学
Abstract: 本发明公开了一种基于差量压缩的重删系统中的碎片重写方法及控制器,属于数据存储技术领域,包括:对于存储数据块的每一个内存分段,统计各容器被其中重复数据块和差量数据块引用的次数,以筛选出被引用次数最大的T个容器,将当前内存分段中引用所筛选容器的重复数据块和差量数据块标记为非碎片化数据块,将引用其余容器的自重复数据块和差量数据块标记为碎片化数据块;进一步结合容器的稀疏性、模拟恢复缓存和滑动窗口识别数据块是否为碎片;遍历数据块,若为非碎片化的重复数据块,则进行去重;若为非碎片化的差量数据块,则进行差量压缩;若为碎片化数据块或非重复数据块,则重写。本发明能够在保证去重率的情况下提高系统恢复性能。
-
公开(公告)号:CN115438009A
公开(公告)日:2022-12-06
申请号:CN202211018482.4
申请日:2022-08-24
Applicant: 华中科技大学
IPC: G06F16/174 , G06K9/62
Abstract: 本发明公开了一种基于SIMD指令集的数据块特征并行提取方法及差量压缩方法,属于计算机存储技术领域,包括:将数据块划分为等长的N个子块,相邻子块相互重叠;设置N个相同大小的滑动窗口在N个子块上自左向右同步滑动,滑动步长为K个字节,每滑动至一个位置,则将各窗口内左侧的K个字节并行加载到向量寄存器L中,将各窗口外右侧的K个字节并行加载到向量寄存器R中,之后逐字节、并行地从向量寄存器L和R取各子块相应的相应字节,以计算指纹,并更新各子块存储于向量寄存器F中的特征;当滑动窗口抵达子块尾部时,将F中的特征组合为数据块特征并写入内存。本发明能够在保证相似性检测的检测效果的前提下,有效提高相似性检测的吞吐量。
-