用于检测和去除针对拷贝数改变调用的污染的方法和系统
摘要:
描述了用于进行序列读出数据的迭代的污染检测和分割的方法和系统。所述方法基于将在样品中检测的多个单核苷酸多态性(SNP)的次要等位基因频率(MAF)的分布与多个选定SNP基因座的次要等位基因频率的预期分布进行比较并调整MAF阈值,所述MAF阈值用于在异常SNP(表现出与多个选定SNP的预期MAF值分布不同的MAF值分布的SNP)与符合多个选定SNP基因座的次要等位基因频率的预期分布的SNP之间进行区分。所述方法可用于估计样品中的污染程度并提供样品的序列读出数据的分割,并且还可包括建立预测一个或更多个基因座之拷贝数的拷贝数模型。
0/0