-
公开(公告)号:CN118038991B
公开(公告)日:2024-07-16
申请号:CN202410441360.9
申请日:2024-04-12
申请人: 宁波甬恒瑶瑶智能科技有限公司
摘要: 本发明公开了基因序列处理方法、系统、电子设备及存储介质,涉及数据处理技术领域,包括获取基因序列,计算GC含量;查找基因结构,输出结构信息;对基因序列进行处理,输出模拟转录链,获取遗传密码子表,输出碱基排列以及排列名;对模拟转录链进行替换,输出模拟翻译链;对基因序列进行格式变化,存储至数据库;本发明用于解决现有技术中因缺少对基因序列的基因表达进行处理及分析,从而导致在后续对基因序列的功能进行分析时,仍需对基因序列进行基因表达的处理,分析处理不够全面细致,分析的效率降低的问题。
-
公开(公告)号:CN118072835A
公开(公告)日:2024-05-24
申请号:CN202410474853.2
申请日:2024-04-19
申请人: 宁波甬恒瑶瑶智能科技有限公司
IPC分类号: G16B40/00 , G16B50/30 , G06F18/15 , G06F18/213 , G06F18/243 , G06N5/01
摘要: 本发明提供基于机器学习的生物信息学数据处理方法、系统及介质,涉及数据处理技术领域,包括:创建样品数据库和已知数据库;对样品数据库中的蛋白质分子进行编码,得到样品编码库,对已知数据库中的蛋白质分子进行编码,得到已知编码库;对样品编码库中的蛋白质分子编码进行识别分类,得到缺失数据集和正常数据集;对正常数据集进行特征提取,得到正常特征集;对缺失数据集进行预补全,得到估计值数据集;训练随机森林模型对正常特征集进行分类;基于训练完成的随机森林模型对估计值数据集进行特征补全,得到补全数据;本发明用于解决现有的识别方法不能有效地对缺失的生物信息学数据进行精准补全,因此在后续的分类上也会存在缺陷的问题。
-
公开(公告)号:CN118072835B
公开(公告)日:2024-09-17
申请号:CN202410474853.2
申请日:2024-04-19
申请人: 宁波甬恒瑶瑶智能科技有限公司
IPC分类号: G16B40/00 , G16B50/30 , G06F18/15 , G06F18/213 , G06F18/243 , G06N5/01
摘要: 本发明提供基于机器学习的生物信息学数据处理方法、系统及介质,涉及数据处理技术领域,包括:创建样品数据库和已知数据库;对样品数据库中的蛋白质分子进行编码,得到样品编码库,对已知数据库中的蛋白质分子进行编码,得到已知编码库;对样品编码库中的蛋白质分子编码进行识别分类,得到缺失数据集和正常数据集;对正常数据集进行特征提取,得到正常特征集;对缺失数据集进行预补全,得到估计值数据集;训练随机森林模型对正常特征集进行分类;基于训练完成的随机森林模型对估计值数据集进行特征补全,得到补全数据;本发明用于解决现有的识别方法不能有效地对缺失的生物信息学数据进行精准补全,因此在后续的分类上也会存在缺陷的问题。
-
公开(公告)号:CN118194836A
公开(公告)日:2024-06-14
申请号:CN202410355767.X
申请日:2024-03-27
申请人: 宁波甬恒瑶瑶智能科技有限公司
IPC分类号: G06F40/174 , G06F40/177 , G06F40/186 , G06F40/109 , G06F16/248 , G06F16/2458 , G06F16/2457
摘要: 本发明公开了一种兼具科研绘图和图表自动排版拼接的方法及系统,涉及排版拼接技术领域,包括:获取数据信息,基于数据信息制作数据表;基于时间点以及具体数值绘制趋势统计图,对趋势统计图进行计算分析,基于计算结果输出异常判断信息以及变化趋势;对数据分组进行分析,基于分析结果以及变化趋势绘制比较统计图;对数据表、趋势统计图以及比较统计图进行排版;本发明用于解决现有技术中因缺少对数据进行处理和分析,不能够选择合适的可视化方法和工具,进而无法展示数据之间的关系,以及科研人员需要花费一定时间使用绘图工具,导致绘图效率低下以及数据信息表达不够完全的问题。
-
公开(公告)号:CN118230830A
公开(公告)日:2024-06-21
申请号:CN202410434594.0
申请日:2024-04-11
申请人: 宁波甬恒瑶瑶智能科技有限公司
摘要: 本发明涉及生物工程技术领域,本发明公开了一种生物积块的系统信息数据库建立方法及系统,包括先是获取M个生物积块的基因序列,根据M个基因序列所对应的第一生物信息,将M个基因序列分为N个第一基因序列集合,基于N个第一基因序列集合生成N个相对应的加密字符串,通过数字隐写将加密字符串嵌入至所述第一基因序列集合中,获得N个第二基因序列集合,基于N个第二基因序列集合所对应的第二生物信息进行聚类,获得H个第三基因序列集合,最后基于H个第三基因序列集合构建基因信息数据库,这样根据基因数据库的特点进行加密,不仅保证了基因信息数据库的安全性,为研究人员和工程师提供便利。
-
公开(公告)号:CN118038991A
公开(公告)日:2024-05-14
申请号:CN202410441360.9
申请日:2024-04-12
申请人: 宁波甬恒瑶瑶智能科技有限公司
摘要: 本发明公开了基因序列处理方法、系统、电子设备及存储介质,涉及数据处理技术领域,包括获取基因序列,计算GC含量;查找基因结构,输出结构信息;对基因序列进行处理,输出模拟转录链,获取遗传密码子表,输出碱基排列以及排列名;对模拟转录链进行替换,输出模拟翻译链;对基因序列进行格式变化,存储至数据库;本发明用于解决现有技术中因缺少对基因序列的基因表达进行处理及分析,从而导致在后续对基因序列的功能进行分析时,仍需对基因序列进行基因表达的处理,分析处理不够全面细致,分析的效率降低的问题。
-
-
-
-
-