可变剪切事件预测的机器学习模型的训练方法和预测方法及应用

    公开(公告)号:CN116469456B

    公开(公告)日:2023-12-15

    申请号:CN202310454928.6

    申请日:2023-04-21

    摘要: 本发明涉及一种用于可变剪切事件预测的机器学习模型的训练方法和可变剪切事件的预测方法及应用。该用于可变剪切事件预测的机器学习模型的训练方法包括:确定用于获取可变剪切事件的预测结果的候选软件;基于所述候选软件获得机器学习模型的训练真集;以及,使用所述机器学习模型的训练真集对预定机器学习模型进行训练,所述预定机器学习模型采用从所述候选软件中确定的多个软件对可变剪切事件的预测结果获得单一可变剪切事件预测结果。本发明的方法能够显著提高预测结果的置信度,可以(56)对比文件Wangrui Liu et al..Integratingmachine learning to construct aberrantalternative splicing event relatedclassifiers to predict prognosis andimmunotherapy response in patients withhepatocellular carcinoma《.Front.Pharmacol.》.2022,第13卷全文.Kristoffer Vitting-Seerup etal..spliceR: an R package forclassification of alternative splicingand prediction of coding potential fromRNA-seq data《.BMC Bioinformatics》.2014,全文.

    基因变异信息的检测方法和装置

    公开(公告)号:CN118380045B

    公开(公告)日:2024-09-10

    申请号:CN202410807227.0

    申请日:2024-06-21

    IPC分类号: G16B20/20 G16B30/10 G06F18/22

    摘要: 本发明提供了一种基因变异信息的检测方法和装置。该检测方法包括:将参考基因组和待测基因组按照染色体成对进行拆分,获得多个染色体对;将多个染色体对进行Mummer比对,获得每个染色体对所对应的Mummer比对结果;对每个染色体对所对应的Mummer比对结果进行SyRI和Assemblitics分析,获得SyRI分析结果和Assemblitics分析结果;对Mummer比对结果、SyRI分析结果和Assemblitics分析结果中的变异信息进行整合,得到全基因组范围的变异信息。利用不同种类的检测软件分析处理每对染色体,通过特定的整合方式,能够较快地得到对变异位置进行基因注释的具体信息。

    一种微小染色体组装鉴定装置、方法及其应用

    公开(公告)号:CN118335196A

    公开(公告)日:2024-07-12

    申请号:CN202410761258.7

    申请日:2024-06-13

    IPC分类号: G16B30/10 G16B30/20

    摘要: 本发明公开了一种微小染色体组装鉴定装置,包括:数据获取模块,被设置为基于样本获取基因测序数据;组装模块,被设置为将数据获取模块获取的基因测序数据组装成为染色体水平的序列;比对模块,被设置为将组装模块组装的染色体水平的序列与数据库模块中存储序列的数据进行比对,筛选获得候选微小染色体序列;数据库模块,存储已知的微小染色体序列数据;判定模块,被设置为根据微小染色体特征判定输入的候选微小染色体序列中最终的微小染色体。本装置可以对基因测序数据进行染色体水平的组装,通过与构建的微小染色体库进行比对,并根据微小染色体特征稳定鉴定出组装基因组中的微小染色体。

    对基因组组装错误进行识别的方法和纠错的方法与相关装置

    公开(公告)号:CN118351933A

    公开(公告)日:2024-07-16

    申请号:CN202410785624.2

    申请日:2024-06-18

    IPC分类号: G16B20/30

    摘要: 本发明提供了一种对基因组组装错误进行识别的方法和纠错的方法与相关装置。对基因组组装错误进行识别的方法包括:将第一测序数据回比到第一组装基因组,其中,第一组装基因组为利用第一测序数据组装而成,第一测序数据为三代测序数据;对第一组装基因组进行程序滑窗,并计算每个窗口的窗口深度及所有上述窗口的平均窗口深度;查找出高于或低于深度阈值的窗口,记为基因组组装错误区域;上述深度阈值为平均窗口深度的设定百分比。本发明涉及基因组学和生物信息学领域,解决了现有技术中三代测序数据组装基因组时在部分复杂区域组装出来的结果存在准确性低的问题。应用本发明的技术方案有助于进一步提高基因组组装结果的准确性。

    基因组注释的方法及电子装置

    公开(公告)号:CN118398090B

    公开(公告)日:2024-09-06

    申请号:CN202410835943.X

    申请日:2024-06-26

    摘要: 本发明提供了一种基因组注释的方法及电子装置。其中,基因组注释的方法包括S1)将样本基因组序列进行基因结构预测,获得预测基因集;S2)将预测基因集进行BUSCO评估,获得BUSCO评估文件;S3)利用BUSCO评估文件对所述预测基因集进行修正,获得修正基因集;S4)对修正基因集进行基因组注释,获得基因组注释文件;基因结构预测包括转录组预测、从头预测和同源预测。能够解决现有技术中用于基因组注释的预测基因集的完整性差的问题,适用于基因组注释领域。