一种基于XGBoost的癌旁组织中DNA甲基化预测方法

    公开(公告)号:CN115273977A

    公开(公告)日:2022-11-01

    申请号:CN202210837114.6

    申请日:2022-07-15

    Abstract: 本发明公开了一种基于XGBoost的癌旁组织中DNA甲基化预测方法,包括获取癌组织、癌旁组织甲基化数据集,构建癌组织、癌旁组织训练矩阵以及癌组织、癌旁组织测试矩阵;获取癌旁组织训练矩阵中所有CpG位点的相关CpG位点集合,构建训练特征数据集;获取癌旁组织测试矩阵中所有CpG位点的相关CpG位点集合,构建测试特征数据集;构建XGBoost模型,通过训练特征数据集训练XGBoost模型,根据训练后的XGBoost模型依次对癌旁组织测试矩阵中所有相关CpG位点集合进行预测,获取预测值,根据测试特征数据集和预测值对模型进行评价,当满足评价条件时保存模型,根据模型对癌旁组织的甲基化数据进行预测。提高了预测癌旁组织中的甲基化数据的准确率,准确表达癌旁组织中的甲基化水平。

    一种集成多组学特征的DNA甲基化预测方法

    公开(公告)号:CN116758993A

    公开(公告)日:2023-09-15

    申请号:CN202310718721.5

    申请日:2023-06-16

    Abstract: 本发明公开了一种集成多组学特征的DNA甲基化预测方法,包括确定待预测CpG位点,获取癌旁组织中CpG位点的多组学特征集,获取癌组织中CpG位点的甲基化特征集,基于Pearson相关系数分别计算癌组织CpG位点的甲基化特征与癌旁组织的miRNA、mRNA、甲基化特征之间的相关系数,根据相关系数的取值分别选择K个miRNA、Q个mRNA、L个甲基化特征,并构建多组学相关特征集,基于深度神经网络构建DNA甲基化预测模型,根据多组学相关特征集对DNA甲基化预测模型进行训练,计算训练后的DNA甲基化预测模型的评估指标,当评估指标满足阈值时获取评估后的DNA甲基化预测模型,根据评估后的DNA甲基化预测模型对癌组织的甲基化进行预测。提高了DNA甲基化的预测准确性。

Patent Agency Ranking