-
公开(公告)号:CN116469456B
公开(公告)日:2023-12-15
申请号:CN202310454928.6
申请日:2023-04-21
申请人: 浙江安诺优达生物科技有限公司 , 安诺优达基因科技(北京)有限公司
IPC分类号: G16B5/00 , G16B20/30 , G06F18/214 , G06N20/00
摘要: 本发明涉及一种用于可变剪切事件预测的机器学习模型的训练方法和可变剪切事件的预测方法及应用。该用于可变剪切事件预测的机器学习模型的训练方法包括:确定用于获取可变剪切事件的预测结果的候选软件;基于所述候选软件获得机器学习模型的训练真集;以及,使用所述机器学习模型的训练真集对预定机器学习模型进行训练,所述预定机器学习模型采用从所述候选软件中确定的多个软件对可变剪切事件的预测结果获得单一可变剪切事件预测结果。本发明的方法能够显著提高预测结果的置信度,可以(56)对比文件Wangrui Liu et al..Integratingmachine learning to construct aberrantalternative splicing event relatedclassifiers to predict prognosis andimmunotherapy response in patients withhepatocellular carcinoma《.Front.Pharmacol.》.2022,第13卷全文.Kristoffer Vitting-Seerup etal..spliceR: an R package forclassification of alternative splicingand prediction of coding potential fromRNA-seq data《.BMC Bioinformatics》.2014,全文.
-
公开(公告)号:CN116855617A
公开(公告)日:2023-10-10
申请号:CN202311109723.0
申请日:2023-08-31
IPC分类号: C12Q1/6888 , C12Q1/6869
摘要: 本发明公开了一种基于核心家系的串联重复变异分型检测方法及其应用。方法包括:基于父本的测序数据集和母本的测序数据集,对子代的测序数据集进行第一分型和组装;以得到的子代单倍型基因组为参考,分别对父本和母本基因组进行单核苷酸位点变异检测,并对父本的测序数据集和母本的测序数据集分别进行第二分型,得到两套父本单倍型基因组、两套母本单倍型基因组,并明确由父本遗传到子代的单倍型基因组、以及由母本遗传到子代的单倍型基因组;对单倍型基因组分别进行串联重复变异检测。本发明提供一种基于三代长读长测序技术,高准确度、全基因组覆盖的串联重复区域变异检测方法;而且本发明方法能得到遗传过程中串联重复发生变异的单倍型信息。
-
公开(公告)号:CN117095742A
公开(公告)日:2023-11-21
申请号:CN202311109741.9
申请日:2023-08-31
摘要: 本发明公开了一种基于核心家系的串联重复变异分型检测装置及其应用。该装置包括子代分型和组装单元、亲本分型单元和单倍型检测单元;其中,所述子代分型和组装单元用于对子代的测序数据集进行第一分型和组装,得到两套子代单倍型基因组;所述亲本分型单元,用于以得到的子代单倍型基因组为参考,分别对父本和母本基因组进行单核苷酸位点变异检测,并对父本的测序数据集和母本的测序数据集分别进行第二分型,并明确由父本遗传到子代的单倍型基因组、由母本遗传到子代的单倍型基因组;所述单倍型检测单元,用于分别对单倍型基因组进行串联重复变异检测。本发明的装置针对串联重复区域变异检测具有高准确度、全基因组覆盖的优点。
-
公开(公告)号:CN116469456A
公开(公告)日:2023-07-21
申请号:CN202310454928.6
申请日:2023-04-21
申请人: 浙江安诺优达生物科技有限公司 , 安诺优达基因科技(北京)有限公司
IPC分类号: G16B5/00 , G16B20/30 , G06F18/214 , G06N20/00
摘要: 本发明涉及一种用于可变剪切事件预测的机器学习模型的训练方法和可变剪切事件的预测方法及应用。该用于可变剪切事件预测的机器学习模型的训练方法包括:确定用于获取可变剪切事件的预测结果的候选软件;基于所述候选软件获得机器学习模型的训练真集;以及,使用所述机器学习模型的训练真集对预定机器学习模型进行训练,所述预定机器学习模型采用从所述候选软件中确定的多个软件对可变剪切事件的预测结果获得单一可变剪切事件预测结果。本发明的方法能够显著提高预测结果的置信度,可以达到更加准确的可变剪切事件的预测效果。
-
公开(公告)号:CN117235515A
公开(公告)日:2023-12-15
申请号:CN202310445007.3
申请日:2023-04-21
申请人: 浙江安诺优达生物科技有限公司 , 安诺优达基因科技(北京)有限公司
IPC分类号: G06F18/214 , G06N20/00
摘要: 本发明涉及一种用于可变剪切事件预测的机器学习模型的训练装置和可变剪切事件的预测装置及应用。训练装置包括获取候选软件单元、获得训练真集单元和训练单元,其中,所述获取候选软件单元,用于确定获取可变剪切事件的预测结果的候选软件;所述获得训练真集单元,基于所述候选软件获得机器学习模型的训练真集;所述训练单元,用于使用所述机器学习模型的训练真集对预定机器学习模型进行训练,所述预定机器学习模型采用从所述候选软件中确定的多个软件对可变剪切事件的预测结果获得单一可变剪切事件预测结果。本发明的装置能够显著提高预测结果的置信度,可以达到更加准确的可变剪切事件的预测效果。
-
公开(公告)号:CN118380045B
公开(公告)日:2024-09-10
申请号:CN202410807227.0
申请日:2024-06-21
申请人: 安诺优达基因科技(北京)有限公司
摘要: 本发明提供了一种基因变异信息的检测方法和装置。该检测方法包括:将参考基因组和待测基因组按照染色体成对进行拆分,获得多个染色体对;将多个染色体对进行Mummer比对,获得每个染色体对所对应的Mummer比对结果;对每个染色体对所对应的Mummer比对结果进行SyRI和Assemblitics分析,获得SyRI分析结果和Assemblitics分析结果;对Mummer比对结果、SyRI分析结果和Assemblitics分析结果中的变异信息进行整合,得到全基因组范围的变异信息。利用不同种类的检测软件分析处理每对染色体,通过特定的整合方式,能够较快地得到对变异位置进行基因注释的具体信息。
-
公开(公告)号:CN118335196A
公开(公告)日:2024-07-12
申请号:CN202410761258.7
申请日:2024-06-13
申请人: 安诺优达基因科技(北京)有限公司
摘要: 本发明公开了一种微小染色体组装鉴定装置,包括:数据获取模块,被设置为基于样本获取基因测序数据;组装模块,被设置为将数据获取模块获取的基因测序数据组装成为染色体水平的序列;比对模块,被设置为将组装模块组装的染色体水平的序列与数据库模块中存储序列的数据进行比对,筛选获得候选微小染色体序列;数据库模块,存储已知的微小染色体序列数据;判定模块,被设置为根据微小染色体特征判定输入的候选微小染色体序列中最终的微小染色体。本装置可以对基因测序数据进行染色体水平的组装,通过与构建的微小染色体库进行比对,并根据微小染色体特征稳定鉴定出组装基因组中的微小染色体。
-
公开(公告)号:CN118351933A
公开(公告)日:2024-07-16
申请号:CN202410785624.2
申请日:2024-06-18
申请人: 安诺优达基因科技(北京)有限公司
IPC分类号: G16B20/30
摘要: 本发明提供了一种对基因组组装错误进行识别的方法和纠错的方法与相关装置。对基因组组装错误进行识别的方法包括:将第一测序数据回比到第一组装基因组,其中,第一组装基因组为利用第一测序数据组装而成,第一测序数据为三代测序数据;对第一组装基因组进行程序滑窗,并计算每个窗口的窗口深度及所有上述窗口的平均窗口深度;查找出高于或低于深度阈值的窗口,记为基因组组装错误区域;上述深度阈值为平均窗口深度的设定百分比。本发明涉及基因组学和生物信息学领域,解决了现有技术中三代测序数据组装基因组时在部分复杂区域组装出来的结果存在准确性低的问题。应用本发明的技术方案有助于进一步提高基因组组装结果的准确性。
-
公开(公告)号:CN111968706B
公开(公告)日:2021-02-12
申请号:CN202011121158.6
申请日:2020-10-20
申请人: 安诺优达基因科技(北京)有限公司
IPC分类号: G16B30/20
摘要: 本发明提供一种获得目标样本的目标测序数据的方法,其包括:对第一样本进行第一测序,得到第一样本的第一序列集;对第二样本进行第一测序,得到第二样本的第一序列集;对第二样本进行第二测序,得到第二样本的第二序列集;采用第一样本的第一序列集对第二样本的第二序列集进行筛选,获得第一样本的第二序列集;所述第一样本为目标样本,所述第一样本的第二序列集为目标样本的目标测序数据。
-
公开(公告)号:CN118398090B
公开(公告)日:2024-09-06
申请号:CN202410835943.X
申请日:2024-06-26
申请人: 安诺优达基因科技(北京)有限公司
摘要: 本发明提供了一种基因组注释的方法及电子装置。其中,基因组注释的方法包括S1)将样本基因组序列进行基因结构预测,获得预测基因集;S2)将预测基因集进行BUSCO评估,获得BUSCO评估文件;S3)利用BUSCO评估文件对所述预测基因集进行修正,获得修正基因集;S4)对修正基因集进行基因组注释,获得基因组注释文件;基因结构预测包括转录组预测、从头预测和同源预测。能够解决现有技术中用于基因组注释的预测基因集的完整性差的问题,适用于基因组注释领域。
-
-
-
-
-
-
-
-
-