蛋白质结合位点的预测方法、装置、设备及存储介质

    公开(公告)号:CN107563150A

    公开(公告)日:2018-01-09

    申请号:CN201710770933.2

    申请日:2017-08-31

    IPC分类号: G06F19/18 G06F19/12

    摘要: 本发明适用生物信息技术领域,提供了一种蛋白质结合位点的预测方法、装置、设备及存储介质,该方法包括:接收待预测的蛋白质序列,使用预设的滑动窗口和滑动步长对蛋白质序列进行序列划分,得到多个氨基酸子序列,根据这些氨基酸子序列构建蛋白质序列的词向量,对词元素进行文档特征提取,根据提取的文档特征构建蛋白质序列的文档特征向量,对这些氨基酸子序列进行蛋白质链生物学特征提取,根据提取的生物学特征构建蛋白质序列的生物学特征向量,使用预设的氨基酸残基分类模型对使用文档特征向量和生物学特征向量表示的氨基酸子序列进行分类,得到蛋白质序列的氨基酸残基类型,从而提高了蛋白质结合位点预测的准确性和泛用性。

    蛋白质结合位点的预测方法、装置、设备及存储介质

    公开(公告)号:CN107563150B

    公开(公告)日:2021-03-19

    申请号:CN201710770933.2

    申请日:2017-08-31

    IPC分类号: G16B20/30 G16B40/00

    摘要: 本发明适用生物信息技术领域,提供了一种蛋白质结合位点的预测方法、装置、设备及存储介质,该方法包括:接收待预测的蛋白质序列,使用预设的滑动窗口和滑动步长对蛋白质序列进行序列划分,得到多个氨基酸子序列,根据这些氨基酸子序列构建蛋白质序列的词向量,对词元素进行文档特征提取,根据提取的文档特征构建蛋白质序列的文档特征向量,对这些氨基酸子序列进行蛋白质链生物学特征提取,根据提取的生物学特征构建蛋白质序列的生物学特征向量,使用预设的氨基酸残基分类模型对使用文档特征向量和生物学特征向量表示的氨基酸子序列进行分类,得到蛋白质序列的氨基酸残基类型,从而提高了蛋白质结合位点预测的准确性和泛用性。