-
公开(公告)号:CN118280456B
公开(公告)日:2024-08-20
申请号:CN202410702738.6
申请日:2024-06-03
申请人: 江西师范大学
摘要: 本发明属于生物信息学和软件工程领域,公开了一种线粒体DNA数据规范化方法及集成应用平台,该方法从线粒体基因组公共数据库中获取不同类型物种的线粒体基因组文件;嵌套遍历线粒体基因组文件,获取线粒体基因组文件中各个物种的注释信息和基因序列,线粒体基因组文件中包含多个物种的基因信息,每条基因信息中又包含多条注释信息;分析每一个序列坐标对应的基因类型,根据基因类型指定替换方案;比较每个基因的相邻基因和序列坐标;进行反向互补和切片调零,对参考序列版本和原始客户提交的注释版本进行比较,并列举差异;进行注释核验,输出规范化的基因顺序及基因顺序图。本发明可根据用户提供的生物基因文件进行数据规范化。
-
公开(公告)号:CN117133351B
公开(公告)日:2024-01-23
申请号:CN202311378396.9
申请日:2023-10-24
申请人: 江西师范大学
IPC分类号: G16B20/00
摘要: 本发明属于分子生物学和生物信息学技术领域,公开了一种优化的线粒体基因重排量化方法,输入一条基准基因序列和待量化基因序列;待量化基因序列逐列与基准基因序列进行异或运算,将运算结果按差异程度由高到低存储到划分数组中;取划分数组中差异程度最高的N个位置将基准基因序列和每个待量化基因序列分别划分为N+1个数组段;指定滑动窗口的距离,使用滑动窗口技术在数组段内滑动,在滑动窗口内对每一段划分后的数组段分别计算基因得分;根据基因得分更新相对重排频率值数组和重排频率累加值数组并输出。本发明可以量化不同线粒体基因簇内的重排事件,从而显著地展示出不同类群线粒体基因组结构的差异性,具有较高的准确性。
-
公开(公告)号:CN117133351A
公开(公告)日:2023-11-28
申请号:CN202311378396.9
申请日:2023-10-24
申请人: 江西师范大学
IPC分类号: G16B20/00
摘要: 本发明属于分子生物学和生物信息学技术领域,公开了一种优化的线粒体基因重排量化方法,输入一条基准基因序列和待量化基因序列;待量化基因序列逐列与基准基因序列进行异或运算,将运算结果按差异程度由高到低存储到划分数组中;取划分数组中差异程度最高的N个位置将基准基因序列和每个待量化基因序列分别划分为N+1个数组段;指定滑动窗口的距离,使用滑动窗口技术在数组段内滑动,在滑动窗口内对每一段划分后的数组段分别计算基因得分;根据基因得分更新相对重排频率值数组和重排频率累加值数组并输出。本发明可以量化不同线粒体基因簇内的重排事件,从而显著地展示出不同类群线粒体基因组结构的差异性,具有较高的准确性。
-
公开(公告)号:CN118280456A
公开(公告)日:2024-07-02
申请号:CN202410702738.6
申请日:2024-06-03
申请人: 江西师范大学
摘要: 本发明属于生物信息学和软件工程领域,公开了一种线粒体DNA数据规范化方法及集成应用平台,该方法从线粒体基因组公共数据库中获取不同类型物种的线粒体基因组文件;嵌套遍历线粒体基因组文件,获取线粒体基因组文件中各个物种的注释信息和基因序列,线粒体基因组文件中包含多个物种的基因信息,每条基因信息中又包含多条注释信息;分析每一个序列坐标对应的基因类型,根据基因类型指定替换方案;比较每个基因的相邻基因和序列坐标;进行反向互补和切片调零,对参考序列版本和原始客户提交的注释版本进行比较,并列举差异;进行注释核验,输出规范化的基因顺序及基因顺序图。本发明可根据用户提供的生物基因文件进行数据规范化。
-
公开(公告)号:CN118098335A
公开(公告)日:2024-05-28
申请号:CN202311509725.9
申请日:2023-11-14
申请人: 江西师范大学 , 江西云络科技有限公司
IPC分类号: G16B5/00 , G16B30/00 , G16B40/00 , G06N3/0442 , G06N3/048 , G06N3/08 , G06F18/213 , G06F18/24
摘要: 本发明属于分子信息技术领域,具体涉及一种高可信的蛋白质二级结构领域模型预测方法及构件系统,本方法将输入的氨基酸序列进行切割或者补足,然后将其进行正交编码和profile编码,使用两种编码的拼接形式作为预测模型的输入数据;通过使用双向门控循环单元提取氨基酸序列的全局特征和局部特征信息;将提取的全局特征信息经过两个全连接层的处理,在进行多次非线性变换;预测模型计算所得到的结果,达到蛋白质8类二级结构预测的目的。本发明在蛋白质二级结构预测速度上有着明显的提升,能够很好的提高蛋白质8类二级结构的预测精度,同时具有很好的扩展性。
-
公开(公告)号:CN118522347A
公开(公告)日:2024-08-20
申请号:CN202410989228.1
申请日:2024-07-23
申请人: 江西师范大学
摘要: 本发明属于分子生物学和生物信息学技术领域,涉及一种基于同源性分析和区域加权的线粒体基因组重排量化方法。该方法先输入一条基准序列和n条待量化序列;手工多序列比对,将基准序列与n条待量化序列对齐;再对照基准序列,将n条待量化序列从控制区到复制起始点进行分区;然后将待量化序列和基准序列的同位置基因进行比较判断,根据判断结果进行加权计分,得到每条待量化序列中所有基因的分数;最后根据所有基因的分数计算得到物种每条待量化序列的重排量化分数RS以及每种基因的单基因重排频率RF。本发明方法能够准确识别并统计真实数据中的几乎所有情况,确保了数据分析的全面性和准确性,其量化结果能更好地推断出物种的同源性关系。
-
公开(公告)号:CN117116361B
公开(公告)日:2024-01-26
申请号:CN202311387196.X
申请日:2023-10-25
申请人: 江西师范大学
摘要: 本发明公开了一种基于固定框架的12sRNA二级结构可视化方法,依据12sRNA序列的茎环结构标定12sRNA二级结构可视化图框架,根据12sRNA序列的点括号序列,提取发卡环、内环和多环的位置下标分别存入发卡环、内环、多环位置下标二维数组,给内环位置下标二维数组设置标记;然后拆分发卡环、多环序列和带标记的茎‑内环序列,并重排茎‑内环序列;根据茎‑内环序列与茎环位置文档绘制茎‑内环部分;根据发卡环序列与发卡环位置文档绘制发卡环部分;根据多环序列与多环位置文档绘制多环部分。本发明能够根据12sRNA的碱基序列以及点括号序列可视化12sRNA序列的二级结构图片。(56)对比文件Hong Wang 等.RNAsmc: A integratedtool for comparing RNA secondarystructure and evaluating allostericeffects《.Computational and StructuralBiotechnology Journal》.2023,第21卷965-973.胥杰.基于混沌模拟退火的RNA二级结构预测的研究《.中国优秀硕士学位论文全文数据库基础科学辑》.2011,第2011年卷(第3期),A006-82.
-
公开(公告)号:CN117116361A
公开(公告)日:2023-11-24
申请号:CN202311387196.X
申请日:2023-10-25
申请人: 江西师范大学
摘要: 本发明公开了一种基于固定框架的12sRNA二级结构可视化方法,依据12sRNA序列的茎环结构标定12sRNA二级结构可视化图框架,根据12sRNA序列的点括号序列,提取发卡环、内环和多环的位置下标分别存入发卡环、内环、多环位置下标二维数组,给内环位置下标二维数组设置标记;然后拆分发卡环、多环序列和带标记的茎‑内环序列,并重排茎‑内环序列;根据茎‑内环序列与茎环位置文档绘制茎‑内环部分;根据发卡环序列与发卡环位置文档绘制发卡环部分;根据多环序列与多环位置文档绘制多环部分。本发明能够根据12sRNA的碱基序列以及点括号序列可视化12sRNA序列的二级结构图片。
-
公开(公告)号:CN116628526A
公开(公告)日:2023-08-22
申请号:CN202310740101.1
申请日:2023-06-21
申请人: 江西师范大学
IPC分类号: G06F18/23 , G06F18/214 , G06N3/088 , G06F17/16
摘要: 本发明涉及一种基于采样算法优化与无监督聚类的软件缺陷预测方法,包括1)数据集过采样:根据原始数据集类别比例信息和设定的平衡系数,计算少数类样本需要生成的数据量并生成,得到平衡数据集;2)数据集标准化:对平衡数据集进行标准化处理,得到标准数据集;3)无监督聚类:构建聚类模型,将标准数据集输入到聚类模型中进行聚类操作,把标准数据集划分成2类;4)聚类结果确认:对聚类分成的2类进行确认类别处理,判断数据所代表的软件有无缺陷;5)预测评价指标:构建模型评价指标,获取模型评价指标信息,衡量软件缺陷预测的准确度。本发明方法流程设计合理,使用方便,与传统的算法相比,具有采样效果更好,聚类结果更准确的优势。
-
-
-
-
-
-
-
-