可变剪切事件预测的机器学习模型的训练方法和预测方法及应用

    公开(公告)号:CN116469456B

    公开(公告)日:2023-12-15

    申请号:CN202310454928.6

    申请日:2023-04-21

    摘要: 本发明涉及一种用于可变剪切事件预测的机器学习模型的训练方法和可变剪切事件的预测方法及应用。该用于可变剪切事件预测的机器学习模型的训练方法包括:确定用于获取可变剪切事件的预测结果的候选软件;基于所述候选软件获得机器学习模型的训练真集;以及,使用所述机器学习模型的训练真集对预定机器学习模型进行训练,所述预定机器学习模型采用从所述候选软件中确定的多个软件对可变剪切事件的预测结果获得单一可变剪切事件预测结果。本发明的方法能够显著提高预测结果的置信度,可以(56)对比文件Wangrui Liu et al..Integratingmachine learning to construct aberrantalternative splicing event relatedclassifiers to predict prognosis andimmunotherapy response in patients withhepatocellular carcinoma《.Front.Pharmacol.》.2022,第13卷全文.Kristoffer Vitting-Seerup etal..spliceR: an R package forclassification of alternative splicingand prediction of coding potential fromRNA-seq data《.BMC Bioinformatics》.2014,全文.

    对测序序列进行变异模拟的方法及其应用

    公开(公告)号:CN109920485B

    公开(公告)日:2023-10-31

    申请号:CN201910202272.2

    申请日:2019-03-18

    IPC分类号: G16B30/00

    摘要: 本发明公开了对测序序列进行变异模拟的方法及其应用,其中,对测序序列进行变异模拟的方法包括:获取待模拟区域的碱基序列;将所述碱基序列进行变异状态标记,以便得到标记后的特征串;选取待添加的变异;将所述待添加的变异整合至所述标记后的特征串上,以便得到添加变异后的特征串;以及将所述添加变异后的特征串进行碱基还原,以便得到变异模拟后的序列。该方法通过对碱基序列的变异状态进行标记,设定碱基的变异类型,从而对各种变异进行模拟,变异模拟的方法简单,生成速度快,并能根据需要设计特殊的变异组合用于测试,变异模拟后的序列的仿真程度高。