基于非冗余德布鲁因图的DNA存储数据重建方法及系统
摘要:
本发明公开了基于非冗余德布鲁因图的DNA存储数据重建方法及系统,涉及DNA存储技术领域;包括将莱文斯坦距离小于等于设定阈值的DNA序列划分到同一个聚类子图;将DNA序列之间具有最小莱文斯坦距离的节点连边,度数最大的节点代表该聚类子图中的骨干序列;将骨干序列作为测序数据对齐的模板序列,构造束搜索图;根据束搜索算法进行错误纠正和筛选最佳优选路径,得到共识序列;构造非冗余德布鲁因图;删除权值低于设定阈值的边所连接的节点;根据非冗余德布鲁因图中节点信息以及共识序列进行路径选择;路径选择后的序列即为重建后的序列。本发明能够在保持数据完整性的同时,尽可能减小对存储密度的影响,从而实现更为高效和可靠的DNA数据存储。
0/0