基于机器学习的质谱图分子式计算方法

    公开(公告)号:CN113484400B

    公开(公告)日:2022-11-22

    申请号:CN202110747845.7

    申请日:2021-07-01

    摘要: 本发明提供了一种基于机器学习的质谱图分子式计算方法,具体步骤包括:输入已知的质谱图数据;根据有机物分子式领域知识规律遍历搜索出一个峰所有的可能解;结合分子式的信息确认特征,对多组可能的特征进行排列组合;根据已知信息确认正确解,利用逻辑回归进行训练,比对不同特征组合的召回率,确认训练特征和训练模型;遍历出所有的可能解并利用训练模型进行筛选。本发明对所有的遍历求解都依据有机物分子式的一般领域知识规律进行筛选,防止分类器过拟合,并对分类特征进行正则化和分块处理,增加了筛选精度;故本发明的基于机器学习的质谱图分子式计算方法具有快速、准确率高、对质谱图信息利用率高等优点。

    基于机器学习的质谱图分子式计算方法

    公开(公告)号:CN113484400A

    公开(公告)日:2021-10-08

    申请号:CN202110747845.7

    申请日:2021-07-01

    IPC分类号: G01N27/62 G16C20/50 G16C20/70

    摘要: 本发明提供了一种基于机器学习的质谱图分子式计算方法,具体步骤包括:输入已知的质谱图数据;根据有机物分子式领域知识规律遍历搜索出一个峰所有的可能解;结合分子式的信息确认特征,对多组可能的特征进行排列组合;根据已知信息确认正确解,利用逻辑回归进行训练,比对不同特征组合的召回率,确认训练特征和训练模型;遍历出所有的可能解并利用训练模型进行筛选。本发明对所有的遍历求解都依据有机物分子式的一般领域知识规律进行筛选,防止分类器过拟合,并对分类特征进行正则化和分块处理,增加了筛选精度;故本发明的基于机器学习的质谱图分子式计算方法具有快速、准确率高、对质谱图信息利用率高等优点。