-
公开(公告)号:CN118942553A
公开(公告)日:2024-11-12
申请号:CN202411020937.5
申请日:2024-07-29
Applicant: 中南大学
IPC: G16B40/00 , G16B5/00 , G16B50/00 , G06N3/0442 , G06N3/08
Abstract: 本发明公开了基于大规模语言模型的多肽与TCR分子结合关系预测方法,其包括以下步骤:S100、获取待测结合关系的多肽序列和TCR分子上的CDR3片段序列,对待测序列分别进行预处理得到目标输入序列;S200、将所述目标输入序列中的每个氨基酸残基进行特征编码,输出每个序列的编码矩阵;S300、将所述编码矩阵分别输入至训练好的结合关系预测模型中的双向GRU模块中,输出每个序列的全局特征矩阵;S400、将所述每对序列的全局特征矩阵合并后,输入至训练好的结合关系预测模型中的大规模语言模型RetNet中,输出每对序列的关系矩阵;S500、将所述每对序列的关系矩阵输入至结合关系预测模型中,输出所述待测结合关系的多肽序列和TCR分子上的CDR3片段序列的结合概率。