基于测序数据识别肿瘤纯度和绝对拷贝数的方法及装置

    公开(公告)号:CN111755068A

    公开(公告)日:2020-10-09

    申请号:CN202010567812.X

    申请日:2020-06-19

    IPC分类号: G16B20/20 G16B20/30 G16B30/00

    摘要: 本申请公开了一种基于测序数据识别肿瘤纯度和绝对拷贝数的方法及装置。本申请方法包括,将质控后的下机数据比对到参考基因组上,并进行变异检测和人群数据库注释,使用纯度预测软件对肿瘤和正常样本预处理好的数据进行试验,获得纯度和拷贝数信息模型;对于符合正常分布的模型,进一步筛选出高肿瘤细胞分数亚克隆区域探针支持数最多的模型,并结合BAF与allele1和allele2拷贝数的匹配率定义最优模型。本申请的方法,快速高效的校正了纯度检测软件的模型,能更准确的得到肿瘤的纯度和绝对拷贝数信息;保障准确性的同时,避免了人工校验的繁琐过程,节省了人工成本,为后续肿瘤基因组进化以及肿瘤内异质性研究奠定了基础。

    基于测序数据识别肿瘤纯度和绝对拷贝数的方法及装置

    公开(公告)号:CN111755068B

    公开(公告)日:2021-02-19

    申请号:CN202010567812.X

    申请日:2020-06-19

    IPC分类号: G16B20/20 G16B20/30 G16B30/00

    摘要: 本申请公开了一种基于测序数据识别肿瘤纯度和绝对拷贝数的方法及装置。本申请方法包括,将质控后的下机数据比对到参考基因组上,并进行变异检测和人群数据库注释,使用纯度预测软件对肿瘤和正常样本预处理好的数据进行试验,获得纯度和拷贝数信息模型;对于符合正常分布的模型,进一步筛选出高肿瘤细胞分数亚克隆区域探针支持数最多的模型,并结合BAF与allele1和allele2拷贝数的匹配率定义最优模型。本申请的方法,快速高效的校正了纯度检测软件的模型,能更准确的得到肿瘤的纯度和绝对拷贝数信息;保障准确性的同时,避免了人工校验的繁琐过程,节省了人工成本,为后续肿瘤基因组进化以及肿瘤内异质性研究奠定了基础。