-
公开(公告)号:CN108052801A
公开(公告)日:2018-05-18
申请号:CN201711235673.5
申请日:2017-11-30
申请人: 中国科学院计算技术研究所
IPC分类号: G06F19/28
摘要: 本发明涉及一种基于正则表达式的N糖结构库构建方法与系统,包括:将五糖核心中每个单糖作为一个节点,为各节点进行编号以明确节点所代表的单糖类别,根据各节点间的连接关系和编号,计算五糖核心中每个节点的正则表达式,并将所有正则表达式集合,作为x糖结构字符串码,其中x为糖结构所具有的节点数;以正则表达式为基础,通过枚举法生成节点数目为x+1的糖结构的字符串码,作为x+1糖结构字符串码;根据x+1糖结构字符串码,对生成的节点数目为x+1的各个糖结构去冗余并判断其结构的合理性,将合理且没有冗余的x+1糖结构输出到文本文件中,并将文本文件作为N糖结构库。本发明节省了枚举糖库过程中的空间开销,还有效地提高了糖结构的枚举速度。
-
公开(公告)号:CN108052801B
公开(公告)日:2020-06-26
申请号:CN201711235673.5
申请日:2017-11-30
申请人: 中国科学院计算技术研究所
IPC分类号: G16B50/30
摘要: 本发明涉及一种基于正则表达式的N糖结构库构建方法与系统,包括:将五糖核心中每个单糖作为一个节点,为各节点进行编号以明确节点所代表的单糖类别,根据各节点间的连接关系和编号,计算五糖核心中每个节点的正则表达式,并将所有正则表达式集合,作为x糖结构字符串码,其中x为糖结构所具有的节点数;以正则表达式为基础,通过枚举法生成节点数目为x+1的糖结构的字符串码,作为x+1糖结构字符串码;根据x+1糖结构字符串码,对生成的节点数目为x+1的各个糖结构去冗余并判断其结构的合理性,将合理且没有冗余的x+1糖结构输出到文本文件中,并将文本文件作为N糖结构库。本发明节省了枚举糖库过程中的空间开销,还有效地提高了糖结构的枚举速度。
-
公开(公告)号:CN106018535B
公开(公告)日:2018-11-09
申请号:CN201610309699.9
申请日:2016-05-11
申请人: 中国科学院计算技术研究所
IPC分类号: G01N27/62
摘要: 本发明提供一种完整糖肽鉴定的方法,包括:对于任一待鉴定的实测串联质谱,遍历糖链结构数据库,对于其中每个糖链结构:根据当前串联谱图的母离子质量,推断出碎裂测试中所有可能获得的糖肽Y离子的质量,进而计算匹配到当前二级谱图的谱峰的数目,并将这个匹配谱峰的数目作为对应情形下的糖肽Y离子与当前二级谱图匹配的粗打分结果;取粗打分前K名的糖链结构作为候选糖链结构;对于当前串联谱图,遍历所有的候选糖链结构,对于每一候选糖链结构进行实测谱和肽段的理论谱的谱谱匹配打分,以及实测谱和糖链结构的理论谱的谱谱匹配打分,进而得出糖肽结构鉴定结果。本发明能够提高完整糖肽规模化鉴定的可靠性且计算复杂度低。
-
公开(公告)号:CN106018535A
公开(公告)日:2016-10-12
申请号:CN201610309699.9
申请日:2016-05-11
申请人: 中国科学院计算技术研究所
IPC分类号: G01N27/62
CPC分类号: G01N27/62
摘要: 本发明提供一种完整糖肽鉴定的方法,包括:对于任一待鉴定的实测串联质谱,遍历糖链结构数据库,对于其中每个糖链结构:根据当前串联谱图的母离子质量,推断出碎裂测试中所有可能获得的糖肽Y离子的质量,进而计算匹配到当前二级谱图的谱峰的数目,并将这个匹配谱峰的数目作为对应情形下的糖肽Y离子与当前二级谱图匹配的粗打分结果;取粗打分前K名的糖链结构作为候选糖链结构;对于当前串联谱图,遍历所有的候选糖链结构,对于每一候选糖链结构进行实测谱和肽段的理论谱的谱谱匹配打分,以及实测谱和糖链结构的理论谱的谱谱匹配打分,进而得出糖肽结构鉴定结果。本发明能够提高完整糖肽规模化鉴定的可靠性且计算复杂度低。
-
-
-