一种基于OrthoMCL聚类结果的快速分析方法
摘要:
本发明公开了一种基于OrthoMCL聚类结果的快速分析方法,属于比较基因组学和生物信息学领域,该方法以OrthoMCL聚类结果为基础,建立自动对泛基因组分析中各类蛋白的识别,包括所有代表性蛋白质、核心蛋白质、单拷贝核心蛋白质和物种特异性蛋白质。基于这些蛋白质各自的分类,对这些分类的蛋白质在各自物种中存在的个数进行统计,并按照类别将结果进行输出。该方法实现了对各种分类中蛋白质的代表性序列的输出以及各类蛋白在每个物种中的代表性序列的输出。此外,该方法也将蛋白质同源聚类结果按照每一个同源蛋白质对应的序列进行输出,为实现泛基因组分析中更为高级的个性化分析奠定基础。
公开/授权文献
0/0