-
公开(公告)号:CN107622184A
公开(公告)日:2018-01-23
申请号:CN201710904787.8
申请日:2017-09-29
申请人: 中国科学院计算技术研究所
IPC分类号: G06F19/24
摘要: 本发明提供了一种氨基酸可信度评估模型训练方法。该方法包括:根据包含待训练氨基酸的训练肽段产生所述待训练氨基酸的背景肽段集合;从所述训练肽段和所述待训练氨基酸提取多个特征;以所提取的多个特征作为输入向量,以所述待训练氨基酸是否正确作为输出,训练分类模型,得到氨基酸可信度评估模型。本发明获得氨基酸可信度评估模型可用于氨基酸可信度评估和修饰位点定位的评估,提高了氨基酸可信度评估的准确率并且改善了修饰位点定位的评估性能。
-
公开(公告)号:CN110349621B
公开(公告)日:2021-08-27
申请号:CN201910482412.6
申请日:2019-06-04
申请人: 中国科学院计算技术研究所
摘要: 本发明提出一种肽段‑谱图匹配可信度检验方法、系统、存储介质及装置,包括:将待检测结果中图谱数据输入至开放式搜索引擎,得到待检测结果的鉴定结果;获取限定式搜索引擎对待检测结果的打分,得到第一分值,同时提取第一分值排前n名候选肽段;获取开放式搜索引擎对鉴定结果的打分,得到第二分值,同时提取第二分值排前n名候选肽段;预测每个候选肽段的理论谱图,计算每张理论谱图与待检测结果中图谱数据的余弦相似度,并统计余弦相似度中的最高值;提取由待检测结果的第一分值、第二分值、余弦相似度和最高余弦相似度值组成的四维特征;将四维特征输入至使用SVM训练的离线模型,得到待检测结果的可信度检验结果。
-
公开(公告)号:CN107729719B
公开(公告)日:2020-05-26
申请号:CN201710913734.2
申请日:2017-09-30
申请人: 中国科学院计算技术研究所
摘要: 本发明提一种从头测序方法,该方法包括:在通过酶切产生的两个数据集中查找镜像肽段对应的镜像谱图;从所述镜像谱图中检测高可信谱峰和普通谱峰;根据所述高可信谱峰和普通谱峰构建有向无环图,其中,所述高可信谱峰对应的结点是高可信结点,普通谱峰对应的结点是普通结点;基于所构建的有向无环图生成候选肽段。本发明的方法利用镜像谱图相互佐证,能够提高肽段从头测序的准确率。
-
公开(公告)号:CN107622184B
公开(公告)日:2020-01-21
申请号:CN201710904787.8
申请日:2017-09-29
申请人: 中国科学院计算技术研究所
IPC分类号: G16B40/00
摘要: 本发明提供了一种氨基酸可信度评估模型训练方法。该方法包括:根据包含待训练氨基酸的训练肽段产生所述待训练氨基酸的背景肽段集合;从所述训练肽段和所述待训练氨基酸提取多个特征;以所提取的多个特征作为输入向量,以所述待训练氨基酸是否正确作为输出,训练分类模型,得到氨基酸可信度评估模型。本发明获得氨基酸可信度评估模型可用于氨基酸可信度评估和修饰位点定位的评估,提高了氨基酸可信度评估的准确率并且改善了修饰位点定位的评估性能。
-
公开(公告)号:CN110349621A
公开(公告)日:2019-10-18
申请号:CN201910482412.6
申请日:2019-06-04
申请人: 中国科学院计算技术研究所
摘要: 本发明提出一种肽段-谱图匹配可信度检验方法、系统、存储介质及装置,包括:将待检测结果中图谱数据输入至开放式搜索引擎,得到待检测结果的鉴定结果;获取限定式搜索引擎对待检测结果的打分,得到第一分值,同时提取第一分值排前n名候选肽段;获取开放式搜索引擎对鉴定结果的打分,得到第二分值,同时提取第二分值排前n名候选肽段;预测每个候选肽段的理论谱图,计算每张理论谱图与待检测结果中图谱数据的余弦相似度,并统计余弦相似度中的最高值;提取由待检测结果的第一分值、第二分值、余弦相似度和最高余弦相似度值组成的四维特征;将四维特征输入至使用SVM训练的离线模型,得到待检测结果的可信度检验结果。
-
公开(公告)号:CN106770605B
公开(公告)日:2019-03-26
申请号:CN201611019740.5
申请日:2016-11-14
申请人: 中国科学院计算技术研究所
IPC分类号: G01N27/62
摘要: 本发明提供了从头测序方法,其包括将待解析的谱图转化为质谱连接图,统计所述质谱连接图中各条路径的得分,提取路径得分高的前若干条普通路径和修饰路径作为候选肽段,其中,所述普通路径为仅由普通边组的路径,所述修改路径为由普通边和修饰边组成的路径且其中仅包含一条修饰边;以及对于每个候选肽段进行肽谱匹配打分,取肽谱匹配打分最高的候选肽段作为所述谱图对应的肽段。该方法可以支持上千种意外修饰的发现,而且不会对肽段鉴定的速度有较大影响。另外,还可以更细粒度地区分相似肽段序列,改善了肽段鉴定的准确率。
-
公开(公告)号:CN106770605A
公开(公告)日:2017-05-31
申请号:CN201611019740.5
申请日:2016-11-14
申请人: 中国科学院计算技术研究所
IPC分类号: G01N27/62
CPC分类号: G01N27/62
摘要: 本发明提供了从头测序方法,其包括将待解析的谱图转化为质谱连接图,统计所述质谱连接图中各条路径的得分,提取路径得分高的前若干条普通路径和修饰路径作为候选肽段,其中,所述普通路径为仅由普通边组的路径,所述修改路径为由普通边和修饰边组成的路径且其中仅包含一条修饰边;以及对于每个候选肽段进行肽谱匹配打分,取肽谱匹配打分最高的候选肽段作为所述谱图对应的肽段。该方法可以支持上千种意外修饰的发现,而且不会对肽段鉴定的速度有较大影响。另外,还可以更细粒度地区分相似肽段序列,改善了肽段鉴定的准确率。
-
公开(公告)号:CN107729719A
公开(公告)日:2018-02-23
申请号:CN201710913734.2
申请日:2017-09-30
申请人: 中国科学院计算技术研究所
摘要: 本发明提一种从头测序方法,该方法包括:在通过酶切产生的两个数据集中查找镜像肽段对应的镜像谱图;从所述镜像谱图中检测高可信谱峰和普通谱峰;根据所述高可信谱峰和普通谱峰构建有向无环图,其中,所述高可信谱峰对应的结点是高可信结点,普通谱峰对应的结点是普通结点;基于所构建的有向无环图生成候选肽段。本发明的方法利用镜像谱图相互佐证,能够提高肽段从头测序的准确率。
-
-
-
-
-
-
-