基于奇偶编码和局部均值迭代的鲁棒DNA图像存储方法及系统

    公开(公告)号:CN118733803A

    公开(公告)日:2024-10-01

    申请号:CN202410768995.X

    申请日:2024-06-14

    申请人: 大连大学

    摘要: 本发明公开了基于奇偶编码和局部均值迭代的鲁棒DNA图像存储方法及系统,涉及DNA存储技术领域;根据二进制不同位置的数据对像素具有不同权重的影响,将数据分为高影响数据和低影响数据,利用rs纠错码对高影响数据进行保护。将加入纠错码的数据转为二进制数据,十六位为一组,每组的1‑4和9‑13根据奇编码规则进行映射,其余根据四种偶编码规则进行映射。根据生化约束和易错相邻碱基进行筛选,拼接在设定长度的DNA序列中,并在DNA序列固定位置添加标识位。在解码时判断标识位的位置,对标识位发生偏移或者错误的序列保存索引。通过图像大小和序列长度进行筛选错误索引序列,获得丢失序列索引并保存。根据丢失和错误的序列索引,计算在图像中的特定位置。

    基于非冗余德布鲁因图的DNA存储数据重建方法及系统

    公开(公告)号:CN118782143A

    公开(公告)日:2024-10-15

    申请号:CN202410768990.7

    申请日:2024-06-14

    申请人: 大连大学

    摘要: 本发明公开了基于非冗余德布鲁因图的DNA存储数据重建方法及系统,涉及DNA存储技术领域;包括将莱文斯坦距离小于等于设定阈值的DNA序列划分到同一个聚类子图;将DNA序列之间具有最小莱文斯坦距离的节点连边,度数最大的节点代表该聚类子图中的骨干序列;将骨干序列作为测序数据对齐的模板序列,构造束搜索图;根据束搜索算法进行错误纠正和筛选最佳优选路径,得到共识序列;构造非冗余德布鲁因图;删除权值低于设定阈值的边所连接的节点;根据非冗余德布鲁因图中节点信息以及共识序列进行路径选择;路径选择后的序列即为重建后的序列。本发明能够在保持数据完整性的同时,尽可能减小对存储密度的影响,从而实现更为高效和可靠的DNA数据存储。

    一种基于局部敏感哈希函数的DNA序列聚类方法、系统、电子设备及可读存储介质

    公开(公告)号:CN118629513A

    公开(公告)日:2024-09-10

    申请号:CN202410847922.X

    申请日:2024-06-27

    申请人: 大连大学

    摘要: 本发明公开了一种基于局部敏感哈希函数的DNA序列聚类方法、系统、电子设备及可读存储介质,涉及DNA存储数据重建技术领域;首先在DNA存储数据重建阶段使更接近原始参考序列的测序数据作为聚类时的初始簇中心,降低聚类过程中的计算误差。其次通过划分索引集和哈希映射方式对需要聚类的DNA测序数据进行降维,有效简化数据的表示形式和计算复杂性。然后通过在哈希误差列表上进行相似性检索能够容忍更多的序列错误,提高聚类的鲁棒性。最后更新每个簇的中心序列,并将莱文斯坦距离相近的两个聚类中心代表的簇进行合并。本发明能够在保证不增加编码密度的基础上,提高了聚类精度,保证了数据重建效率,从而实现更为高效和可靠的DNA数据存储。