-
公开(公告)号:CN107918725B
公开(公告)日:2021-09-07
申请号:CN201711465834.X
申请日:2017-12-28
Applicant: 大连海事大学
Abstract: 本发明公开了一种基于机器学习选择最优特征的DNA甲基化预测方法,本发明首先通过使用不同的机器学习算法一搜索不同个数的最强相关CpG位点,构建不同模型的最强相关CpG位点集合,然后利用不同的机器学习算法二对不同的模型的最强相关CpG位点集合进行测试,对测试结果与真实实验的结果进行比较,根据评价指标确定最优模型所使用的最强相关CpG位点个数和机器学习算法类型,从而完成了基于多个最强CpG位点的预测模型的建立。本发明提高了最强CpG位点的搜索效率,从而提高预测模型预测性能。
-
公开(公告)号:CN111429970A
公开(公告)日:2020-07-17
申请号:CN201911343021.2
申请日:2019-12-24
Applicant: 大连海事大学
Abstract: 本发明实施例公开了一种基于极端梯度提升方法进行特征选择来获取多基因风险评分的方法及系统,所述方法包括:基于给定的SNP位点个数并对SNP位点的碱基序列进行离散化数值处理;基于极端梯度提升方法,创建特征重要性排序模型并搜索出所述模型对应的最佳性能指标参数;基于所述模型进行特征重要性排序以选择出前k个SNP位点;基于多基因风险评分方法,依次对每一样本数据进行评分。本发明为用户提供客观的理论数据处理方法,以在未来的个性化医疗和精准医学进行辅助性应用。
-
公开(公告)号:CN107918725A
公开(公告)日:2018-04-17
申请号:CN201711465834.X
申请日:2017-12-28
Applicant: 大连海事大学
Abstract: 本发明公开了一种基于机器学习选择最优特征的DNA甲基化预测方法,本发明首先通过使用不同的机器学习算法一搜索不同个数的最强相关CpG位点,构建不同模型的最强相关CpG位点集合,然后利用不同的机器学习算法二对不同的模型的最强相关CpG位点集合进行测试,对测试结果与真实实验的结果进行比较,根据评价指标确定最优模型所使用的最强相关CpG位点个数和机器学习算法类型,从而完成了基于多个最强CpG位点的预测模型的建立。本发明提高了最强CpG位点的搜索效率,从而提高预测模型预测性能。
-
公开(公告)号:CN111429970B
公开(公告)日:2024-03-22
申请号:CN201911343021.2
申请日:2019-12-24
Applicant: 大连海事大学
Abstract: 本发明实施例公开了一种基于极端梯度提升方法进行特征选择来获取多基因风险评分的方法及系统,所述方法包括:基于给定的SNP位点个数并对SNP位点的碱基序列进行离散化数值处理;基于极端梯度提升方法,创建特征重要性排序模型并搜索出所述模型对应的最佳性能指标参数;基于所述模型进行特征重要性排序以选择出前k个SNP位点;基于多基因风险评分方法,依次对每一样本数据进行评分。本发明为用户提供客观的理论数据处理方法,以在未来的个性化医疗和精准医学进行辅助性应用。
-
-
-