从古DNA数据中过滤现代DNA污染的方法及其应用

    公开(公告)号:CN110970086A

    公开(公告)日:2020-04-07

    申请号:CN201811161836.4

    申请日:2018-09-30

    IPC分类号: G16B5/00 G16B20/30 G16B30/00

    摘要: 本申请公开了一种从古DNA数据中过滤现代DNA污染的方法及其应用。本申请过滤现代DNA污染的方法,包括对古DNA的Illumina二代测序原始数据进行古DNA特征过滤,具体包括根据古DNA脱氨基特征对Illumina二代测序原始数据进行现代DNA污染过滤,即过滤后保留古DNA脱氨基造成的5’端至少N个C->T突变,和/或3’端至少M个C->T突变的读长。本申请的方法,能对目前广泛使用的Illumina平台数据进行处理,本申请采用最适合于古DNA的对比对算法和参数,在适合的N和M值下,能使过滤后的污染率达到0,是目前为止过滤强度最大的方法之一,为后续的古DNA的深入研究奠定了基础。