-
公开(公告)号:CN109460473A
公开(公告)日:2019-03-12
申请号:CN201811388476.1
申请日:2018-11-21
Applicant: 中南大学
Abstract: 本发明提供了一种基于症状提取和特征表示的电子病历多标签分类方法,考虑到疾病与症状以及症状间的关联关系对电子病历的疾病标签多分类问题的影响,采用两种不同的症状表征方法:使用TF-IDF构建症状向量以及使用word2vec学习症状向量。将从电子病历中抽取的两种症状向量序列分别作为所述两个双向LSTM模型的输入序列,训练两个双向LSTM模型;对于未知疾病标签的电子病历,将从其中提取的症状对应的两种症状向量构成两种症状向量序列,分别输入两个训练好的双向LSTM模型,得到两个概率向量;对两个概率向量进行加权组合,得到最终的分类向量。本方法分类效果和适用性好。
-
公开(公告)号:CN113744799A
公开(公告)日:2021-12-03
申请号:CN202111037945.7
申请日:2021-09-06
Applicant: 中南大学
Abstract: 本发明公开了一种基于端到端学习的化合物和蛋白质相互作用与亲和力预测方法,包括:将化合物的分子式转换为原子邻接图,使用图注意力网络学习化合物每个原子的表征向量;将蛋白质氨基酸序列切分为残基序列,使用卷积神经网络模型学习残基的表征向量;构建双向注意力网络模型来融合所有原子和残基的表征向量,得到化合物特征向量和蛋白质特征向量;使用神经网络并根据化合物和蛋白质的特征向量,对化合物与蛋白质之间的相互作用以及亲和力进行预测。本发明既可以用于化合物和蛋白质相互作用的预测,又能够预测二者之间的结合亲和力,而且预测准确性好。
-
公开(公告)号:CN109460473B
公开(公告)日:2021-11-02
申请号:CN201811388476.1
申请日:2018-11-21
Applicant: 中南大学
Abstract: 本发明提供了一种基于症状提取和特征表示的电子病历多标签分类方法,考虑到疾病与症状以及症状间的关联关系对电子病历的疾病标签多分类问题的影响,采用两种不同的症状表征方法:使用TF‑IDF构建症状向量以及使用word2vec学习症状向量。将从电子病历中抽取的两种症状向量序列分别作为所述两个双向LSTM模型的输入序列,训练两个双向LSTM模型;对于未知疾病标签的电子病历,将从其中提取的症状对应的两种症状向量构成两种症状向量序列,分别输入两个训练好的双向LSTM模型,得到两个概率向量;对两个概率向量进行加权组合,得到最终的分类向量。本方法分类效果和适用性好。
-
公开(公告)号:CN109887540A
公开(公告)日:2019-06-14
申请号:CN201910035394.7
申请日:2019-01-15
Applicant: 中南大学
Abstract: 本发明公开了一种基于异构网络嵌入的药物靶标相互作用预测方法,该方法基于化学结构相似的药物往往能与相似的靶标相互作用的假设,将药物-药物相似性网络、靶标-靶标相似性网络以及药物-靶标相互作用网络合并到药物-靶标异构网络中;使用基于起始节点的游走序列,构建神经网络分类模型并将游走序列作为其输入,对分类模型进行训练并学习得到所有节点的向量表示;对于药物-靶标相互作用的预测,给定一对药物-靶标对,从学习得到的节点向量中提取对应的药物和靶标的向量表示,并对两个向量进行Hadamard积运算,将得到的结果作为随机森林分类器的输入,得到最终的预测结果。根据实验验证可知,本方法预测效果和适用性较好。
-
公开(公告)号:CN113744799B
公开(公告)日:2023-10-13
申请号:CN202111037945.7
申请日:2021-09-06
Applicant: 中南大学
Abstract: 本发明公开了一种基于端到端学习的化合物和蛋白质相互作用与亲和力预测方法,包括:将化合物的分子式转换为原子邻接图,使用图注意力网络学习化合物每个原子的表征向量;将蛋白质氨基酸序列切分为残基序列,使用卷积神经网络模型学习残基的表征向量;构建双向注意力网络模型来融合所有原子和残基的表征向量,得到化合物特征向量和蛋白质特征向量;使用神经网络并根据化合物和蛋白质的特征向量,对化合物与蛋白质之间的相互作用以及亲和力进行预测。本发明既可以用于化合物和蛋白质相互作用的预测,又能够预测二者之间的结合亲和力,而且预测准确性好。
-
公开(公告)号:CN116013428A
公开(公告)日:2023-04-25
申请号:CN202310097306.2
申请日:2023-02-10
Applicant: 中南大学
IPC: G16C20/50 , G16C20/70 , G16B15/30 , G16B40/00 , G06N3/0895
Abstract: 本发明公开了一种基于自监督学习的药物靶标通用预测方法、设备及介质,方法包括:使用化合物特征提取模块提取药物特征向量:将药物分子结构拆分成子结构序列,并将每个子结构转换为向量编码得到序列向量,输入到编码器中进行特征提取;其中,利用掩码语言模型预测、分子描述符预测和分子官能团预测并基于药物样本的特征向量对化合物特征提取模块及这三个预测模型进行自监督训练,得到所述化合物特征提取模块;提取靶标的特征向量;基于药物和靶标的特征向量,使用自动机器学习模型进行药物与靶标之间的任务预测。本发明适用于包括药物‑靶标相互作用、结合亲和力和作用机制等预测任务,且在各个任务上的预测准度都优于同类型的预测方法。
-
-
-
-
-