一种环境样本中抗生素抗性基因的高通量检测方法和系统

    公开(公告)号:CN113943787A

    公开(公告)日:2022-01-18

    申请号:CN202111282530.6

    申请日:2021-11-01

    摘要: 本发明实施例公开了一种环境样本中抗生素抗性基因的高通量检测方法和系统,对环境样本的宏基因组DNA进行提取和测序建库,获得宏基因组数据;对所述宏基因组数据进行质量控制,后进行拼接,获得拼接序列;将所述拼接序列进行基因预测和蛋白质翻译,获取具有完整序列的基因;对具有完整序列的所述基因进行抗生素抗性基因的预测和筛选,获得第一抗生素抗性基因,并对其来源进行预测,并提取出未检测到来源的第二抗生素抗性基因的序列并对其蛋白质序列进行提取和来源检测;对所述来源信息进行分类地位解析,获得所述环境样本中抗生素抗性基因的组成。该方法能实现对环境样本抗生素抗性基因的全面检测和分析,从而对环境样本进行有效的检测。

    一种环境样本中抗生素抗性基因的高通量检测方法和系统

    公开(公告)号:CN113943787B

    公开(公告)日:2024-07-26

    申请号:CN202111282530.6

    申请日:2021-11-01

    摘要: 本发明实施例公开了一种环境样本中抗生素抗性基因的高通量检测方法和系统,对环境样本的宏基因组DNA进行提取和测序建库,获得宏基因组数据;对所述宏基因组数据进行质量控制,后进行拼接,获得拼接序列;将所述拼接序列进行基因预测和蛋白质翻译,获取具有完整序列的基因;对具有完整序列的所述基因进行抗生素抗性基因的预测和筛选,获得第一抗生素抗性基因,并对其来源进行预测,并提取出未检测到来源的第二抗生素抗性基因的序列并对其蛋白质序列进行提取和来源检测;对所述来源信息进行分类地位解析,获得所述环境样本中抗生素抗性基因的组成。该方法能实现对环境样本抗生素抗性基因的全面检测和分析,从而对环境样本进行有效的检测。

    一种环境样本中病原细菌毒力因子的高通量检测方法和系统

    公开(公告)号:CN113936740A

    公开(公告)日:2022-01-14

    申请号:CN202111282533.X

    申请日:2021-11-01

    摘要: 本发明实施例公开了一种环境样本中病原细菌毒力因子的高通量检测方法和系统,对环境样本的宏基因组DNA进行提取和测序建库,获得宏基因组数据;对所述宏基因组数据进行质量控制,获得高质量宏基因组数据;将所述高质量宏基因组数据进行拼接,获得拼接序列;将所述拼接序列进行基因预测和蛋白质翻译,获取具有完整序列的基因;对具有完整序列的所述基因进行病原细菌毒力因子的预测和筛选,获得所述环境样本中病原细菌毒力因子的种类、基因序列及其对应的产物。检测速度快,通量高,能全面的对样本中的病原细菌及其毒力因子进行有效的识别和鉴定。

    一种基于OrthoMCL聚类结果的快速分析方法

    公开(公告)号:CN110808085B

    公开(公告)日:2023-03-21

    申请号:CN201911044264.6

    申请日:2019-10-30

    IPC分类号: G16B25/00 G16B50/00

    摘要: 本发明公开了一种基于OrthoMCL聚类结果的快速分析方法,属于比较基因组学和生物信息学领域,该方法以OrthoMCL聚类结果为基础,建立自动对泛基因组分析中各类蛋白的识别,包括所有代表性蛋白质、核心蛋白质、单拷贝核心蛋白质和物种特异性蛋白质。基于这些蛋白质各自的分类,对这些分类的蛋白质在各自物种中存在的个数进行统计,并按照类别将结果进行输出。该方法实现了对各种分类中蛋白质的代表性序列的输出以及各类蛋白在每个物种中的代表性序列的输出。此外,该方法也将蛋白质同源聚类结果按照每一个同源蛋白质对应的序列进行输出,为实现泛基因组分析中更为高级的个性化分析奠定基础。

    一种基于OrthoMCL聚类结果的快速分析方法

    公开(公告)号:CN110808085A

    公开(公告)日:2020-02-18

    申请号:CN201911044264.6

    申请日:2019-10-30

    IPC分类号: G16B25/00 G16B50/00

    摘要: 本发明公开了一种基于OrthoMCL聚类结果的快速分析方法,属于比较基因组学和生物信息学领域,该方法以OrthoMCL聚类结果为基础,建立自动对泛基因组分析中各类蛋白的识别,包括所有代表性蛋白质、核心蛋白质、单拷贝核心蛋白质和物种特异性蛋白质。基于这些蛋白质各自的分类,对这些分类的蛋白质在各自物种中存在的个数进行统计,并按照类别将结果进行输出。该方法实现了对各种分类中蛋白质的代表性序列的输出以及各类蛋白在每个物种中的代表性序列的输出。此外,该方法也将蛋白质同源聚类结果按照每一个同源蛋白质对应的序列进行输出,为实现泛基因组分析中更为高级的个性化分析奠定基础。