一种基于XGBoost的癌旁组织中DNA甲基化预测方法

    公开(公告)号:CN115273977A

    公开(公告)日:2022-11-01

    申请号:CN202210837114.6

    申请日:2022-07-15

    Abstract: 本发明公开了一种基于XGBoost的癌旁组织中DNA甲基化预测方法,包括获取癌组织、癌旁组织甲基化数据集,构建癌组织、癌旁组织训练矩阵以及癌组织、癌旁组织测试矩阵;获取癌旁组织训练矩阵中所有CpG位点的相关CpG位点集合,构建训练特征数据集;获取癌旁组织测试矩阵中所有CpG位点的相关CpG位点集合,构建测试特征数据集;构建XGBoost模型,通过训练特征数据集训练XGBoost模型,根据训练后的XGBoost模型依次对癌旁组织测试矩阵中所有相关CpG位点集合进行预测,获取预测值,根据测试特征数据集和预测值对模型进行评价,当满足评价条件时保存模型,根据模型对癌旁组织的甲基化数据进行预测。提高了预测癌旁组织中的甲基化数据的准确率,准确表达癌旁组织中的甲基化水平。

Patent Agency Ranking