利用L-EDA筛选卵巢癌体液预后标记物的方法

    公开(公告)号:CN102478562B

    公开(公告)日:2014-07-23

    申请号:CN201010558383.6

    申请日:2010-11-25

    IPC分类号: G01N30/88

    摘要: 本发明公开了一种利用改进的分布估计算法(L-EDA)从体液代谢组轮廓筛选卵巢癌预后标记物的方法。采用液相色谱质谱联用仪对体液代谢物进行分析得到代谢组轮廓,构建概率分布模型对代谢组轮廓进行分析,筛选潜在的卵巢癌预后标记物。不同于传统的分布估计算法,L-EDA对迭代搜索过程中生成的候选属性子集的大小加以限定,并给出一种新的概率分布模型更新策略,使得对于属性的评价更为精确、合理,同时提高了算法的执行效率。L-EDA筛选出的属性子集能够体现代谢组轮廓数据各个组别之间的特征,构建支持向量机(SupportVectorMachine,SVM)分类模型进行交叉验证分析,正确率达到99.06%。

    一种通用的大规模代谢组学数据的校正方法

    公开(公告)号:CN106706820B

    公开(公告)日:2018-05-25

    申请号:CN201510778032.9

    申请日:2015-11-13

    IPC分类号: G01N30/86

    摘要: 本发明公开了一种通用的大规模代谢组学数据的校正方法,首先采用色谱‑质谱联用仪对样品进行分析得到代谢组轮廓,通过计算相邻两个质量控制样品(QC)中代谢物响应强度的比值,将比值从小到大排序后,筛选总比值个数的5%作为离散点,将这5%的离散点平均分配到排序后比值的两端,从而建立模型去筛选代谢组数据中的随机误差,利用比值的线性拟合模型对随机误差进行校正。然后利用线性回归模型构建虚拟QC方法,实现大规模代谢数据集的系统误差校正。本发明可以高效、准确地校正大规模代谢组数据的随机误差和系统误差,实现多批次、不同仪器代谢组数据的整合,改善大规模代谢组数据的质量。

    一种代谢组深度注释方法

    公开(公告)号:CN114594171B

    公开(公告)日:2023-12-15

    申请号:CN202011407735.8

    申请日:2020-12-03

    摘要: 本发明公开了一种复杂生物样本代谢组深度注释方法。该方法通过对生物样本提取物进行基于超高效液相色谱‑高分辨质谱的非靶向代谢组学分析,获取生物样本的代谢组色谱‑质谱信息,再根据所获非靶向代谢组学数据中的实验一级质谱离子质荷比和实验保留时间,从代谢组学数据库筛选匹配的候选代谢物;进一步根据候选代谢物的分子指纹相似性构建代谢物分子结构关联网络。然后,利用非靶向超高效液相色谱‑高分辨质谱代谢组实验数据,以分子结构关联网络作为背景网络,进行代谢组规模化定性。本发明方法不依赖于大规模的实验二级谱图数据库,定性的覆盖度和可靠性更高。(56)对比文件孔宏伟 等.基于液相色谱-质谱联用的代谢组学研究中代谢物的结构鉴定进展《.色谱》.2014,第32卷(第10期),Shanshan Xu 等.Metabolomics Based onUHPLC-Orbitrap-MS and Global NaturalProduct Social Molecular NetworkingReveals Effects of Time Scale andEnvironment of Storage on the Metabolitesand Taste Quality of Raw Pu-erh Tea.《Journal of Agricultural and FoodChemistry》.2019,第67卷(第43期),Brian E. Sedio 等.A protocol forhigh-throughput,untargeted forestcommunity metabolomics using massspectrometry molecular networks.《Applications in Plant Sciences》.2018,第6卷(第3期),Huibin Shen 等.Metaboliteidentification through multiple kernellearning on fragmentation trees.《Bioinformatics》.2014,第30卷

    一种代谢组深度注释方法
    7.
    发明公开

    公开(公告)号:CN114594171A

    公开(公告)日:2022-06-07

    申请号:CN202011407735.8

    申请日:2020-12-03

    摘要: 本发明公开了一种复杂生物样本代谢组深度注释方法。该方法通过对生物样本提取物进行基于超高效液相色谱‑高分辨质谱的非靶向代谢组学分析,获取生物样本的代谢组色谱‑质谱信息,再根据所获非靶向代谢组学数据中的实验一级质谱离子质荷比和实验保留时间,从代谢组学数据库筛选匹配的候选代谢物;进一步根据候选代谢物的分子指纹相似性构建代谢物分子结构关联网络。然后,利用非靶向超高效液相色谱‑高分辨质谱代谢组实验数据,以分子结构关联网络作为背景网络,进行代谢组规模化定性。本发明方法不依赖于大规模的实验二级谱图数据库,定性的覆盖度和可靠性更高。

    一种通用的大规模代谢组学数据的校正方法

    公开(公告)号:CN106706820A

    公开(公告)日:2017-05-24

    申请号:CN201510778032.9

    申请日:2015-11-13

    IPC分类号: G01N30/86

    CPC分类号: G01N30/8665

    摘要: 本发明公开了一种通用的大规模代谢组学数据的校正方法,首先采用色谱-质谱联用仪对样品进行分析得到代谢组轮廓,通过计算相邻两个质量控制样品(QC)中代谢物响应强度的比值,将比值从小到大排序后,筛选总比值个数的5%作为离散点,将这5%的离散点平均分配到排序后比值的两端,从而建立模型去筛选代谢组数据中的随机误差,利用比值的线性拟合模型对随机误差进行校正。然后利用线性回归模型构建虚拟QC方法,实现大规模代谢数据集的系统误差校正。本发明可以高效、准确地校正大规模代谢组数据的随机误差和系统误差,实现多批次、不同仪器代谢组数据的整合,改善大规模代谢组数据的质量。

    一种基于保留时间锁定-气相色谱-四极杆质谱选择性离子扫描的化学轮廓分析方法

    公开(公告)号:CN102798684B

    公开(公告)日:2015-04-15

    申请号:CN201110133061.1

    申请日:2011-05-21

    IPC分类号: G01N30/72

    摘要: 本发明公开了一种保留时间锁定-气相色谱-四极杆质谱-选择性离子扫描进行化学轮廓分析的方法,首先采用气相色谱-质谱全扫描方法分析质量控制样品,采用质谱自动去卷积和峰识别系统对获得的全扫描信息进行质谱去卷积和峰识别,从AMDIS的结果文件中提取识别的化合物所对应的色谱保留时间信息,并根据该信息对不同保留时间的色谱峰进行分组;然后从原始数据文件中提取质谱信息,进行特征离子选定。建立保留时间锁定的GC-MS方法并对待分析的所有样品在该方法下进行选择离子检测。本发明使得采用气相色谱-质谱得到的化学轮廓分析数据的可靠性、有效性和可操作性得到提高。本方法也可推广到以液相色谱-质谱为基础的化学轮廓分析。

    一种通用的气相色谱-质谱全组分定量分析方法

    公开(公告)号:CN102798683B

    公开(公告)日:2014-10-22

    申请号:CN201110133018.5

    申请日:2011-05-21

    IPC分类号: G01N30/72

    摘要: 本发明公开了一种基于气相色谱-质谱的化合物全组分定量分析方法,首先采用气相色谱-质谱全扫描方法获得待分析样品的数据信息,采用质谱自动去卷积和峰识别系统对所获得的全扫描数据信息进行质谱去卷积和峰识别。根据峰识别结果,从原始数据文件中提取质谱信息,计算化合物离子的特征值,筛选化合物特征离子,最终利用特征离子建立选择性离子扫描定量分析方法。本发明的核心在于通过化合物离子的特征值对化合物特征离子进行筛选。本方法可给出多个特征离子及其特征性评价指标-特征值。给出的多个特征离子可以分别作为定量离子和定量候选离子。