基于核心家系的串联重复变异分型检测方法及其应用

    公开(公告)号:CN116855617B

    公开(公告)日:2024-08-02

    申请号:CN202311109723.0

    申请日:2023-08-31

    IPC分类号: C12Q1/6888 C12Q1/6869

    摘要: 本发明公开了一种基于核心家系的串联重复变异分型检测方法及其应用。方法包括:基于父本的测序数据集和母本的测序数据集,对子代的测序数据集进行第一分型和组装;以得到的子代单倍型基因组为参考,分别对父本和母本基因组进行单核苷酸位点变异检测,并对父本的测序数据集和母本的测序数据集分别进行第二分型,得到两套父本单倍型基因组、两套母本单倍型基因组,并明确由父本遗传到子代的单倍型基因组、以及由母本遗传到子代的单倍型基因组;对单倍型基因组分别进行串联重复变异检测。本发明提供一种基于三代长读长测序技术,高准确度、全基因组覆盖的串联重复区域变异检测方法;而且本发明方法能得到遗传过程中串联重复发生变异的单倍型信息。

    可变剪切事件预测的机器学习模型的训练方法和预测方法及应用

    公开(公告)号:CN116469456B

    公开(公告)日:2023-12-15

    申请号:CN202310454928.6

    申请日:2023-04-21

    摘要: 本发明涉及一种用于可变剪切事件预测的机器学习模型的训练方法和可变剪切事件的预测方法及应用。该用于可变剪切事件预测的机器学习模型的训练方法包括:确定用于获取可变剪切事件的预测结果的候选软件;基于所述候选软件获得机器学习模型的训练真集;以及,使用所述机器学习模型的训练真集对预定机器学习模型进行训练,所述预定机器学习模型采用从所述候选软件中确定的多个软件对可变剪切事件的预测结果获得单一可变剪切事件预测结果。本发明的方法能够显著提高预测结果的置信度,可以(56)对比文件Wangrui Liu et al..Integratingmachine learning to construct aberrantalternative splicing event relatedclassifiers to predict prognosis andimmunotherapy response in patients withhepatocellular carcinoma《.Front.Pharmacol.》.2022,第13卷全文.Kristoffer Vitting-Seerup etal..spliceR: an R package forclassification of alternative splicingand prediction of coding potential fromRNA-seq data《.BMC Bioinformatics》.2014,全文.