-
公开(公告)号:CN106033501B
公开(公告)日:2018-11-30
申请号:CN201510112890.X
申请日:2015-03-16
申请人: 中国科学院计算技术研究所
IPC分类号: G06F19/18
摘要: 本发明提供一种交联二肽快速鉴定方法,包括:1)提取待鉴定串联谱图中的有效谱峰,根据各个有效谱峰对应的质量,查找碎片索引得到相应的肽段序列作为候选α肽序列,其中所述碎片索引记录了各个碎片质量及其对应的肽段序列;2)对于每个候选α肽序列,根据所述待鉴定串联谱图的母离子质量计算相应的β肽质量,进而得到相应的候选β肽序列,将候选α肽序列和相应的候选β肽序列组合得到候选交联二肽;3)将步骤2)所得的候选交联二肽与串联谱图进行精细匹配,得出鉴定结果。本发明不需使用特殊交联剂;搜索速度快,鉴定效率高;搜索灵敏度高。
-
公开(公告)号:CN104134015B
公开(公告)日:2017-05-03
申请号:CN201410360277.5
申请日:2014-07-25
申请人: 中国科学院计算技术研究所
IPC分类号: G06F19/10
摘要: 本发明提供一种蛋白质翻译后修饰的定位方法,包括对于一条蛋白质序列,计算发生的修饰的总质量,得到该总质量对应的一个或多个修饰组合;将与所述蛋白质序列上的每个氨基酸对应的一个或多个修饰集合作为图中的顶点,根据所述一个或多个修饰组合连接该顶点,并且根据与所述蛋白质序列对应的谱图设置该顶点的权值。其中,所述修饰集合是从所述蛋白质序列的第一个氨基酸到对应的氨基酸上能够发生的修饰的集合并且是所述一个或多个修饰组合中的一个修饰组合的子集。所述方法还包括根据路径上所有顶点的权值选择所述图中的路径,并且将该路径转换为修饰位点信息。本发明提高了对修饰位点的定位速度,并且同时支持用户指定的任意修饰。
-
公开(公告)号:CN106198706A
公开(公告)日:2016-12-07
申请号:CN201610497295.7
申请日:2016-06-29
申请人: 中国科学院计算技术研究所
IPC分类号: G01N27/62
CPC分类号: G01N33/6848
摘要: 本发明提供一种对多肽交联肽段进行质谱鉴定的假发现率控制方法,包括:1)对于每张谱图,基于肽段匹配模型,在存储了单条肽段结构的数据库中进行搜索,得出匹配的n肽交联的鉴定结果;数据库既包括真实肽段结构也包括诱饵肽段结构;2)对于每个谱图的鉴定结果,根据该鉴定结果中分别匹配到真实肽段结构和诱饵假肽段结构的肽段数目,将该鉴定结果归类至鉴定结果集合Rk,其中Rk来表示n肽交联鉴定结果中,有k条肽段为诱饵肽段结构,(n-k)条肽段为真实肽段结构的鉴定结果集合,0≤k≤n,n为不小于3的自然数;3)计算n肽交联的假发现率FDR(n)。本发明更加准确地估计多肽交联肽段质谱鉴定的假发现率;能够帮助提高鉴定的准确率和鉴定率。
-
公开(公告)号:CN102445544B
公开(公告)日:2013-10-30
申请号:CN201010508217.5
申请日:2010-10-15
申请人: 中国科学院计算技术研究所
摘要: 本发明公开了一种提高单同位素峰判断准确率的方法和系统。所述方法,包括下列步骤:根据选定的串联质谱,确定候选同位素峰簇;根据所述候选同位素峰簇的色谱流出曲线的相似度和强度比值,确定同位素峰簇的起止;根据所述同位素峰簇的起止,确定单同位素峰的质量;判断是否还有串联质谱没有确定单同位素峰,若是,则返回选择新的串联质谱,确定候选同位素峰簇,否则,结束。
-
公开(公告)号:CN102411666A
公开(公告)日:2012-04-11
申请号:CN201010292060.7
申请日:2010-09-26
申请人: 中国科学院计算技术研究所
摘要: 本发明有关于一种蛋白质鉴定的大规模分布式并行加速方法及其系统,其中该方法包括:步骤1,用并行处理方法,对蛋白质序列进行理论酶切得到肽序列,对肽序列进行排序、去冗余处理,以创建肽索引文件块;步骤2,对质谱谱图进行排序,并将排序后的质谱谱图进行平均划分,得到多个谱图数据块;步骤3,将谱图数据块平均分配给多个主进程,各主进程对所分配的谱图数据块进行排序,依次指派给空闲的从进程进行肽谱匹配鉴定;步骤4,用并行处理方法,汇总鉴定结果,利用鉴定得到的肽序列推断对应的蛋白质序列,生成输出文件。本发明在处理器核规模达到几百甚至超过千个以上,进行蛋白质鉴定能取得满意的加速效率。
-
公开(公告)号:CN106770605B
公开(公告)日:2019-03-26
申请号:CN201611019740.5
申请日:2016-11-14
申请人: 中国科学院计算技术研究所
IPC分类号: G01N27/62
摘要: 本发明提供了从头测序方法,其包括将待解析的谱图转化为质谱连接图,统计所述质谱连接图中各条路径的得分,提取路径得分高的前若干条普通路径和修饰路径作为候选肽段,其中,所述普通路径为仅由普通边组的路径,所述修改路径为由普通边和修饰边组成的路径且其中仅包含一条修饰边;以及对于每个候选肽段进行肽谱匹配打分,取肽谱匹配打分最高的候选肽段作为所述谱图对应的肽段。该方法可以支持上千种意外修饰的发现,而且不会对肽段鉴定的速度有较大影响。另外,还可以更细粒度地区分相似肽段序列,改善了肽段鉴定的准确率。
-
公开(公告)号:CN108052801A
公开(公告)日:2018-05-18
申请号:CN201711235673.5
申请日:2017-11-30
申请人: 中国科学院计算技术研究所
IPC分类号: G06F19/28
摘要: 本发明涉及一种基于正则表达式的N糖结构库构建方法与系统,包括:将五糖核心中每个单糖作为一个节点,为各节点进行编号以明确节点所代表的单糖类别,根据各节点间的连接关系和编号,计算五糖核心中每个节点的正则表达式,并将所有正则表达式集合,作为x糖结构字符串码,其中x为糖结构所具有的节点数;以正则表达式为基础,通过枚举法生成节点数目为x+1的糖结构的字符串码,作为x+1糖结构字符串码;根据x+1糖结构字符串码,对生成的节点数目为x+1的各个糖结构去冗余并判断其结构的合理性,将合理且没有冗余的x+1糖结构输出到文本文件中,并将文本文件作为N糖结构库。本发明节省了枚举糖库过程中的空间开销,还有效地提高了糖结构的枚举速度。
-
公开(公告)号:CN103776891A
公开(公告)日:2014-05-07
申请号:CN201310397694.2
申请日:2013-09-04
申请人: 中国科学院计算技术研究所
IPC分类号: G01N27/62
摘要: 本发明涉及一种检测差异表达蛋白质的方法,面向定量蛋白质组学中的基于一级谱图信息的标记和非标记的相对定量数据分析,包括肽谱匹配、可信度评价、肽段信号提取、肽段比值计算、蛋白质比值计算、统计学分析,根据某蛋白质在两种或多种样品中对应的质谱信号强度比值判断其是否是差异表达蛋白质。对于近百GB的规模的质谱实验采集的数据,快速地自动化分析,对不同蛋白质在质谱仪中的信号尽可能精准地提取蛋白质信号;从统计学意义上确定蛋白质差异表达,并对结果的准确性进行评价。
-
公开(公告)号:CN101477089B
公开(公告)日:2012-06-13
申请号:CN200910076588.8
申请日:2009-01-09
申请人: 中国科学院计算技术研究所
摘要: 本发明提供一种蛋白质翻译后修饰的发现方法,包括:利用蛋白质样品的实验串联质谱数据中的肽色谱保留时间以及肽质量计算所有谱图之间的谱图差异向量;建立可能包含修饰质量的候选修饰质量区间;在每个所述的候选修饰质量区间上,估计所述谱图差异向量的混合分布,计算所述混合分布中各个分布的标准差,由所述标准差确定所述候选修饰质量区间内由所述蛋白质翻译后修饰导致的分布;计算由所述蛋白质翻译后修饰导致的分布的均值,由所述均值的质量分量得到所述蛋白质翻译后修饰的精确质量实验值,由所述均值的保留时间分量得到所述蛋白质翻译后修饰对肽色谱保留时间的影响。本发明的方法具有高效、准确、鲁棒的优点。
-
公开(公告)号:CN102445544A
公开(公告)日:2012-05-09
申请号:CN201010508217.5
申请日:2010-10-15
申请人: 中国科学院计算技术研究所
摘要: 本发明公开了一种提高单同位素峰判断准确率的方法和系统。所述方法,包括下列步骤:根据选定的串联质谱,确定候选同位素峰簇;根据所述候选同位素峰簇的色谱流出曲线的相似度和强度比值,确定同位素峰簇的起止;根据所述同位素峰簇的起止,确定单同位素峰的质量;判断是否还有串联质谱没有确定单同位素峰,若是,则返回选择新的串联质谱,确定候选同位素峰簇,否则,结束。
-
-
-
-
-
-
-
-
-