用于检测和去除针对拷贝数改变调用的污染的方法和系统

    公开(公告)号:CN118103916A

    公开(公告)日:2024-05-28

    申请号:CN202280067612.5

    申请日:2022-10-07

    摘要: 描述了用于进行序列读出数据的迭代的污染检测和分割的方法和系统。所述方法基于将在样品中检测的多个单核苷酸多态性(SNP)的次要等位基因频率(MAF)的分布与多个选定SNP基因座的次要等位基因频率的预期分布进行比较并调整MAF阈值,所述MAF阈值用于在异常SNP(表现出与多个选定SNP的预期MAF值分布不同的MAF值分布的SNP)与符合多个选定SNP基因座的次要等位基因频率的预期分布的SNP之间进行区分。所述方法可用于估计样品中的污染程度并提供样品的序列读出数据的分割,并且还可包括建立预测一个或更多个基因座之拷贝数的拷贝数模型。

    用于检测拷贝数改变的方法和系统

    公开(公告)号:CN118103524A

    公开(公告)日:2024-05-28

    申请号:CN202280067609.3

    申请日:2022-10-07

    摘要: 本文中描述了用于调用拷贝数改变(CNA)的方法和系统,包括用于将基于网格的拷贝数模型拟合至序列读出数据的方法和系统。该方法可包括针对多个遗传基因座生成次要等位基因覆盖率和主要等位基因覆盖率、转换等位基因覆盖数据以及将拷贝数网格模型拟合至数据。然后可使用拟合拷贝数网格模型来分配拷贝数状态或调用拷贝数改变。拷贝数网格模型和转换的等位基因覆盖率数据可被显示以考虑所呈现的模型,其允许更有效的数据解释以及拷贝数状态或拷贝数改变的调用。

    用于自动调用拷贝数改变的方法和系统

    公开(公告)号:CN118103525A

    公开(公告)日:2024-05-28

    申请号:CN202280067616.3

    申请日:2022-10-07

    摘要: 描述了用于自动调用拷贝数改变(CNA)的方法和系统。所述方法和系统利用来自对象的样品中一个或更多个亚基因组区间内的一个或更多个基因座的基于测序的覆盖率数据、等位基因分数数据、分割数据和拷贝数模型数据来检测基因座的扩增和缺失,并应用多个阈值和过滤程序以在不需要过程匹配的对照和手动处理测序数据的同时提供具有改善的可靠性的CNA的自动调用。

    用于识别拷贝数改变的系统和方法

    公开(公告)号:CN118369726A

    公开(公告)日:2024-07-19

    申请号:CN202280080958.9

    申请日:2022-11-01

    摘要: 本申请描述了用于确定针对基因组中的靶基因组区段的拷贝数的方法。所述方法可包括例如:获得针对多个基因组区段的多个测序深度信号,其中测序深度信号对应于与基因组区段中的基因座对齐的序列读段的数量,并且其中所述多个基因组区段包括靶基因组区段;从所述多个测序深度信号确定针对所述多个基因组区段的第一、第二和第三统计矩;从所述第一、第二和第三统计矩确定针对所述样品的肿瘤纯度和肿瘤倍性;以及基于针对所述靶基因组区段的所述测序深度信号、所述肿瘤纯度和所述肿瘤倍性来确定所述靶基因组区段的所述拷贝数。所述方法可进一步包括:基于所确定的拷贝数来生成针对所述样品的基因组图谱。