基于大规模语言模型的多肽与TCR分子结合关系预测方法

    公开(公告)号:CN118942553A

    公开(公告)日:2024-11-12

    申请号:CN202411020937.5

    申请日:2024-07-29

    Applicant: 中南大学

    Inventor: 李敏 王猛 伍天睿

    Abstract: 本发明公开了基于大规模语言模型的多肽与TCR分子结合关系预测方法,其包括以下步骤:S100、获取待测结合关系的多肽序列和TCR分子上的CDR3片段序列,对待测序列分别进行预处理得到目标输入序列;S200、将所述目标输入序列中的每个氨基酸残基进行特征编码,输出每个序列的编码矩阵;S300、将所述编码矩阵分别输入至训练好的结合关系预测模型中的双向GRU模块中,输出每个序列的全局特征矩阵;S400、将所述每对序列的全局特征矩阵合并后,输入至训练好的结合关系预测模型中的大规模语言模型RetNet中,输出每对序列的关系矩阵;S500、将所述每对序列的关系矩阵输入至结合关系预测模型中,输出所述待测结合关系的多肽序列和TCR分子上的CDR3片段序列的结合概率。

Patent Agency Ranking