构建机器学习模型的方法、系统及用途

    公开(公告)号:CN116264103A

    公开(公告)日:2023-06-16

    申请号:CN202111530888.6

    申请日:2021-12-14

    IPC分类号: G16B40/00

    摘要: 本申请一种构建机器学习模型的方法,所述机器学习模型用于预测新抗原。该方法包括:(1)获取训练集合,所述训练集合中包括多个已知新抗原多肽片段和多个阴性对照多肽片段;(2)针对所述多个已知新抗原多肽片段和多个阴性对照多肽片段的每一个,分别确定下列特征至少之一:癌种及基因特异的泛癌种表达谱、多肽片段的氨基酸理化性质和人类白细胞抗原的权重;(3)利用步骤(2)中所确定的特征,进行机器学习,以便获得可以用于预测新抗原的机器学习模型。本发明方法可获得同一个患者较为全面的DNA、RNA、蛋白质层面的信息,进而准确预测新抗原,也可用于Mbp级别大小的靶向测序试剂盒中的CNV检测方法的开发。