多肽氨基酸序列生成模型训练及相关产品

    公开(公告)号:CN117711532A

    公开(公告)日:2024-03-15

    申请号:CN202410165333.3

    申请日:2024-02-05

    摘要: 本发明提供一种多肽氨基酸序列生成模型训练及相关产品。该方法的一具体实施方式包括:通过利用与目标受体之间结合有活性的活性多肽氨基酸序列,再对活性多肽氨基酸序列进行词元切分得到活性多肽词元序列,再将活性多肽词元序列的片段和相应向后移位一个词元之后的移位词元序列分别进行特征嵌入表示,并分别作为样本特征数据的样本多肽词元特征序列和期望输出的标签词元特征序列,再以样本多肽词元特征序列作为输入数据,以标签词元特征序列作为监督数据对多肽氨基酸序列生成模型进行训练。进而,多肽氨基酸序列生成模型可以预测与目标受体之间具有结合活性的多肽氨基酸序列。