一种基于血液循环肿瘤DNA的拷贝数变异检测方法和装置

    公开(公告)号:CN114502744B

    公开(公告)日:2023-06-23

    申请号:CN201980101069.4

    申请日:2019-12-11

    IPC分类号: C12Q1/6869

    摘要: 一种基于血液循环肿瘤DNA的拷贝数变异检测方法和装置,拷贝数变异检测方法包括:获取待测样本的血液循环肿瘤DNA的待测区域的测序数据,其包括待测区域的测序深度信息;计算待测样本中每个子捕获区域与其相应的锚点区域的平均测序深度的比值;将待测样本中每个子捕获区域与其相应的锚点区域的平均测序深度的比值与拷贝数变异检测模型进行比较并计算显著性;根据显著性的计算结果,确定待测样本的待测区域的拷贝数变异情况。每个待测CNV基因对应的捕获区域寻找若干个锚点区域,在计算待测CNV区域的相对深度时,用锚点区域代替整体区域,有效降低了待测区域的拷贝数在不同训练样本间的差异,对小片段CNV的检测灵敏度大大提高。

    构建机器学习模型的方法、系统及用途

    公开(公告)号:CN116264103A

    公开(公告)日:2023-06-16

    申请号:CN202111530888.6

    申请日:2021-12-14

    IPC分类号: G16B40/00

    摘要: 本申请一种构建机器学习模型的方法,所述机器学习模型用于预测新抗原。该方法包括:(1)获取训练集合,所述训练集合中包括多个已知新抗原多肽片段和多个阴性对照多肽片段;(2)针对所述多个已知新抗原多肽片段和多个阴性对照多肽片段的每一个,分别确定下列特征至少之一:癌种及基因特异的泛癌种表达谱、多肽片段的氨基酸理化性质和人类白细胞抗原的权重;(3)利用步骤(2)中所确定的特征,进行机器学习,以便获得可以用于预测新抗原的机器学习模型。本发明方法可获得同一个患者较为全面的DNA、RNA、蛋白质层面的信息,进而准确预测新抗原,也可用于Mbp级别大小的靶向测序试剂盒中的CNV检测方法的开发。

    一种基于血液循环肿瘤DNA的拷贝数变异检测方法和装置

    公开(公告)号:CN114502744A

    公开(公告)日:2022-05-13

    申请号:CN201980101069.4

    申请日:2019-12-11

    IPC分类号: C12Q1/6869

    摘要: 一种基于血液循环肿瘤DNA的拷贝数变异检测方法和装置,拷贝数变异检测方法包括:获取待测样本的血液循环肿瘤DNA的待测区域的测序数据,其包括待测区域的测序深度信息;计算待测样本中每个子捕获区域与其相应的锚点区域的平均测序深度的比值;将待测样本中每个子捕获区域与其相应的锚点区域的平均测序深度的比值与拷贝数变异检测模型进行比较并计算显著性;根据显著性的计算结果,确定待测样本的待测区域的拷贝数变异情况。每个待测CNV基因对应的捕获区域寻找若干个锚点区域,在计算待测CNV区域的相对深度时,用锚点区域代替整体区域,有效降低了待测区域的拷贝数在不同训练样本间的差异,对小片段CNV的检测灵敏度大大提高。