基于几何图神经网络的蛋白质信号肽的预测方法及装置
摘要:
本发明涉及一种基于几何图神经网络的蛋白质信号肽的预测方法及装置,其方法包括:获取数据集中的蛋白质序列,提取其中信号肽的字符序列;对所述信号肽进行特征提取,得到所述信号肽的序列进化特征、物理化学特征、结构特征、统计特征;将进化特征、物理化学特征、结构特征、统计特征进行融合,得到多维向量;根据所述字符序列和所述多维向量构建信号肽的特征图;将所述特征图作为几何图神经网络模型的输入,训练所述几何图神经网络直至其误差低于阈值,保存所述几何图神经网络模型并将其用于预测待预测信号肽。本发明结合几何图神经网络和字符序列,在保留了特征提取的原始信息同时,减少了模型过拟合,提高了信号肽预测的准确率。
0/0