一种检测样本污染率的方法及装置

    公开(公告)号:CN115083529B

    公开(公告)日:2023-03-14

    申请号:CN202210811098.3

    申请日:2022-07-11

    IPC分类号: G16B50/30 G16B20/30

    摘要: 一种检测样本污染率的方法及装置,该方法包括:位点MAF提取步骤,包括提取待测样本的测序数据中的位点在数据库中的MAF;过滤步骤,包括过滤去除不符合条件的SNP位点;错误率计算步骤,包括计算不同碱基替换的错误率;似然值计算步骤,包括计算待测样本在不同污染率下的似然值;候选污染率计算步骤,包括根据每个SNP位点计算的似然值对数与位点深度计算加权平均值,选择加权平均值最大的似然值对应的污染率为候选污染率;优化步骤,包括根据优化函数优化候选污染率,获得最终的样本污染率。该方法的分析结果可信度高。

    一种检测样本污染率的方法及装置

    公开(公告)号:CN115083529A

    公开(公告)日:2022-09-20

    申请号:CN202210811098.3

    申请日:2022-07-11

    IPC分类号: G16B50/30 G16B20/30

    摘要: 一种检测样本污染率的方法及装置,该方法包括:位点MAF提取步骤,包括提取待测样本的测序数据中的位点在数据库中的MAF;过滤步骤,包括过滤去除不符合条件的SNP位点;错误率计算步骤,包括计算不同碱基替换的错误率;似然值计算步骤,包括计算待测样本在不同污染率下的似然值;候选污染率计算步骤,包括根据每个SNP位点计算的似然值对数与位点深度计算加权平均值,选择加权平均值最大的似然值对应的污染率为候选污染率;优化步骤,包括根据优化函数优化候选污染率,获得最终的样本污染率。该方法的分析结果可信度高。

    一种单样本肿瘤DNA拷贝数变异检测的方法和装置

    公开(公告)号:CN112634987B

    公开(公告)日:2021-07-27

    申请号:CN202011562169.8

    申请日:2020-12-25

    IPC分类号: G16B20/20 G16B30/00 G16B40/00

    摘要: 本申请公开了一种单样本肿瘤DNA拷贝数变异检测的方法和装置。本申请的方法和装置,利用动态基线波动水平模拟参考人群基准水平,基于每个捕获区域参考人群基准水平波动,计算临床组织样本构建训练集样本RC值相对于参考人群在每个捕获区域的Z‑score值,利用该统计学打分值训练每个目标捕获区域的SVR模型;在进行单样本肿瘤DNA拷贝数变异检测时,利用各个区域的SVR模型计算该区域的Ratio值,最后按照注释和过滤规则,输出发生拷贝数变异的区域。本申请解决了现有的拷贝数变异检测方法和软件在单样本情况下无法进行拷贝数变异检测的困境,克服了由于测序环境方面的因素导致的灵敏度低、准确率低等缺陷。