微生物的种特异共有序列的获得方法、装置及应用

    公开(公告)号:CN111477276A

    公开(公告)日:2020-07-31

    申请号:CN202010254696.6

    申请日:2020-04-02

    IPC分类号: G16B30/10 G16B25/20

    摘要: 本发明的提供一种微生物的种特异共有序列的获得方法,至少包括以下步骤:S100,寻找候选共有序列:基于聚类算法对属于同一菌种的各个目标菌株的特异性序列进行聚类,获得多个候选种特异共有序列;S200,验证和获得初次筛选种特异共有序列:判断候选种特异共有序列是否满足以下条件:1)株种覆盖度满足预设值;2)有效拷贝数满足预设值;若候选种特异共有序列满足以上所有条件,则为种特异共有序列。本发明的方法灵敏度高;可在组装不完整的基序中寻找重复序列;获得的种特异性共有序列精确,可识别到亚种水平;识别的共有序列保守性强,以最少的共有序列尽可能达到株种覆盖度的最大值;所有的逻辑模块都带有多重验证,准确性高。

    微生物目标片段中特异性区域的识别方法、装置及应用

    公开(公告)号:CN111477274A

    公开(公告)日:2020-07-31

    申请号:CN202010254403.4

    申请日:2020-04-02

    IPC分类号: G16B30/10 G16B40/00

    摘要: 本发明的微生物目标片段中特异性区域的识别方法,包括步骤:S100,将微生物目标片段与一个或多个对比菌株全基因组序列分别进行一对一比对,去除相似性超过预设值的片段,获得若干剩余片段,作为第一轮切割片段T1~Tn;S200,将所述第一轮切割片段T1~Tn分别与其余对比菌株的全基因组序列比对,去除相似性超过预设值的片段,获得剩余切割片段的集合作为微生物目标片段的候选特异性区域;S300,验证和获得特异性区域。本发明准确性高;灵敏度高,可识别到亚种水平;具有双重验证模块,结果准确。有些rRNA基因同物种无法区分,并且不是所有质粒都有物种特异性,也不具有普遍性,本发明可以适用于任何病原体全基因组中识别特异性区域。

    微生物目标片段中多拷贝区域的识别方法、装置及应用

    公开(公告)号:CN111477275B

    公开(公告)日:2020-12-25

    申请号:CN202010254690.9

    申请日:2020-04-02

    IPC分类号: G16B30/10 G16B40/00

    摘要: 本发明提供一种微生物目标片段中多拷贝区域的识别方法,至少包括以下步骤:S100:寻找候选多拷贝区域:对微生物目标片段进行内部比对,寻找相似性满足预设值的待测序列对应的区域作为候选多拷贝区域,所述相似性是指待测序列的覆盖率与匹配率的乘积;S200:验证获得多拷贝区域:获得候选多拷贝区域拷贝数的中值;若候选多拷贝区域拷贝数的中值大于1,则记为多拷贝区域。与文献数据库对比,本发明的微生物目标片段中多拷贝区域的识别方法准确性高,灵敏度高,识别出未发现的多拷贝区域;可在组装不完整的基序中寻找重复序列;与16srRNA相比更加全面,16srRNA不都是多拷贝。

    微生物的种特异共有序列的获得方法、装置及应用

    公开(公告)号:CN111477276B

    公开(公告)日:2020-12-15

    申请号:CN202010254696.6

    申请日:2020-04-02

    IPC分类号: G16B30/10 G16B25/20

    摘要: 本发明的提供一种微生物的种特异共有序列的获得方法,至少包括以下步骤:S100,寻找候选共有序列:基于聚类算法对属于同一菌种的各个目标菌株的特异性序列进行聚类,获得多个候选种特异共有序列;S200,验证和获得初次筛选种特异共有序列:判断候选种特异共有序列是否满足以下条件:1)株种覆盖度满足预设值;2)有效拷贝数满足预设值;若候选种特异共有序列满足以上所有条件,则为种特异共有序列。本发明的方法灵敏度高;可在组装不完整的基序中寻找重复序列;获得的种特异性共有序列精确,可识别到亚种水平;识别的共有序列保守性强,以最少的共有序列尽可能达到株种覆盖度的最大值;所有的逻辑模块都带有多重验证,准确性高。

    微生物目标片段中特异性区域的识别方法、装置及应用

    公开(公告)号:CN111477274B

    公开(公告)日:2020-11-24

    申请号:CN202010254403.4

    申请日:2020-04-02

    IPC分类号: G16B30/10 G16B40/00

    摘要: 本发明的微生物目标片段中特异性区域的识别方法,包括步骤:S100,将微生物目标片段与一个或多个对比菌株全基因组序列分别进行一对一比对,去除相似性超过预设值的片段,获得若干剩余片段,作为第一轮切割片段T1~Tn;S200,将所述第一轮切割片段T1~Tn分别与其余对比菌株的全基因组序列比对,去除相似性超过预设值的片段,获得剩余切割片段的集合作为微生物目标片段的候选特异性区域;S300,验证和获得特异性区域。本发明准确性高;灵敏度高,可识别到亚种水平;具有双重验证模块,结果准确。有些rRNA基因同物种无法区分,并且不是所有质粒都有物种特异性,也不具有普遍性,本发明可以适用于任何病原体全基因组中识别特异性区域。

    微生物目标片段中多拷贝区域的识别方法、装置及应用

    公开(公告)号:CN111477275A

    公开(公告)日:2020-07-31

    申请号:CN202010254690.9

    申请日:2020-04-02

    IPC分类号: G16B30/10 G16B40/00

    摘要: 本发明提供一种微生物目标片段中多拷贝区域的识别方法,至少包括以下步骤:S100:寻找候选多拷贝区域:对微生物目标片段进行内部比对,寻找相似性满足预设值的待测序列对应的区域作为候选多拷贝区域,所述相似性是指待测序列的覆盖率与匹配率的乘积;S200:验证获得多拷贝区域:获得候选多拷贝区域拷贝数的中值;若候选多拷贝区域拷贝数的中值大于1,则记为多拷贝区域。与文献数据库对比,本发明的微生物目标片段中多拷贝区域的识别方法准确性高,灵敏度高,识别出未发现的多拷贝区域;可在组装不完整的基序中寻找重复序列;与16srRNA相比更加全面,16srRNA不都是多拷贝。