-
公开(公告)号:CN118782150A
公开(公告)日:2024-10-15
申请号:CN202310369852.7
申请日:2023-04-07
申请人: 中国科学院天津工业生物技术研究所
IPC分类号: G16B30/20 , G16B30/10 , G16B40/00 , G16B10/00 , G06N3/0475 , G06N3/08 , G06F18/214 , G06F18/21
摘要: 本发明公开了一种基于深度学习模型的热稳定性新酶设计改造方法。通过将蛋白质热稳定性判别模型和蛋白质序列生成模型进行融合,直接生成出具有热稳定性特征的新酶序列。本发明利用耐热物种最适生长温度信息,应用深度学习模型提取耐热物种热稳特征,避免了耐热蛋白数据不足的缺陷和手动提取特征带来的偏倚性;利用蛋白质序列生成模型,可以有效扩展蛋白质序列空间;两个模型数据反馈循环直接生成具有热稳特征的新酶序列,可以克服传统定向进化方法的路径依赖问题和显著减少定向进化筛选库的大小;利用本发明,可以高效获得具有热稳定性特征的新酶序列。