-
公开(公告)号:CN118098335A
公开(公告)日:2024-05-28
申请号:CN202311509725.9
申请日:2023-11-14
申请人: 江西师范大学 , 江西云络科技有限公司
IPC分类号: G16B5/00 , G16B30/00 , G16B40/00 , G06N3/0442 , G06N3/048 , G06N3/08 , G06F18/213 , G06F18/24
摘要: 本发明属于分子信息技术领域,具体涉及一种高可信的蛋白质二级结构领域模型预测方法及构件系统,本方法将输入的氨基酸序列进行切割或者补足,然后将其进行正交编码和profile编码,使用两种编码的拼接形式作为预测模型的输入数据;通过使用双向门控循环单元提取氨基酸序列的全局特征和局部特征信息;将提取的全局特征信息经过两个全连接层的处理,在进行多次非线性变换;预测模型计算所得到的结果,达到蛋白质8类二级结构预测的目的。本发明在蛋白质二级结构预测速度上有着明显的提升,能够很好的提高蛋白质8类二级结构的预测精度,同时具有很好的扩展性。
-
公开(公告)号:CN118280456B
公开(公告)日:2024-08-20
申请号:CN202410702738.6
申请日:2024-06-03
申请人: 江西师范大学
摘要: 本发明属于生物信息学和软件工程领域,公开了一种线粒体DNA数据规范化方法及集成应用平台,该方法从线粒体基因组公共数据库中获取不同类型物种的线粒体基因组文件;嵌套遍历线粒体基因组文件,获取线粒体基因组文件中各个物种的注释信息和基因序列,线粒体基因组文件中包含多个物种的基因信息,每条基因信息中又包含多条注释信息;分析每一个序列坐标对应的基因类型,根据基因类型指定替换方案;比较每个基因的相邻基因和序列坐标;进行反向互补和切片调零,对参考序列版本和原始客户提交的注释版本进行比较,并列举差异;进行注释核验,输出规范化的基因顺序及基因顺序图。本发明可根据用户提供的生物基因文件进行数据规范化。
-
公开(公告)号:CN118280456A
公开(公告)日:2024-07-02
申请号:CN202410702738.6
申请日:2024-06-03
申请人: 江西师范大学
摘要: 本发明属于生物信息学和软件工程领域,公开了一种线粒体DNA数据规范化方法及集成应用平台,该方法从线粒体基因组公共数据库中获取不同类型物种的线粒体基因组文件;嵌套遍历线粒体基因组文件,获取线粒体基因组文件中各个物种的注释信息和基因序列,线粒体基因组文件中包含多个物种的基因信息,每条基因信息中又包含多条注释信息;分析每一个序列坐标对应的基因类型,根据基因类型指定替换方案;比较每个基因的相邻基因和序列坐标;进行反向互补和切片调零,对参考序列版本和原始客户提交的注释版本进行比较,并列举差异;进行注释核验,输出规范化的基因顺序及基因顺序图。本发明可根据用户提供的生物基因文件进行数据规范化。
-
-