-
公开(公告)号:CN111951885B
公开(公告)日:2022-05-03
申请号:CN202010803348.X
申请日:2020-08-11
Applicant: 湖南大学
Abstract: 本发明属于生物信息学、智能优化、计算机应用领域,公开了一种基于局部有偏的蛋白质结构预测方法。本发明包括步骤:计算目标个体变异窗口片段与片段库片段的疏水尺度差以及片段库中各片段的二级结构得分;对片段库中各片段统计并排序;选择最佳片段进行片段组装,通过蒙特卡洛机制判断是否接收以确定变异个体;计算变异个体与随机个体交叉片段的二级结构得分以确定交叉个体;通过随机数取值决定比较目标个体和交叉个体能量值或二级结构分数来选择下一代目标个体。本发明避免了传统构象空间优化方法的不足,如:采样效率低,预测精度较低。本发明借助于氨基酸疏水特性及其局部结构特征,实现了改进的结构模型评分方法。
-
公开(公告)号:CN111916145B
公开(公告)日:2022-03-11
申请号:CN202010725014.5
申请日:2020-07-24
Applicant: 湖南大学
Abstract: 本发明属于生物信息学领域,公开了基于图表示学习的新冠病毒靶标预测和药物发现方法,通过构造包含药物、靶标、副作用、疾病之间的作用关系的异构网络,并使用图卷积神经网络集成它本身及其各种领域拓扑结构信息,并结合注意力机制来反映不同类型的邻域信息对节点的重要程度,进而学习节点自身的特征表示,最后通过拓扑重建过程来强制提取药物和靶标的特征表示,得到边权表示关系作用强度的重定位网络。根据个别抑制新冠病毒的药物在这个重定位网络中的潜在关系,预测新型冠状病毒的靶标,并筛选出可能抑制新型冠状病毒的药物。通过这种方式,本发明能较为有效地筛选出可能抑制新型冠状病毒的药物,加快药物研发,具有十分重要的推广应用价值。
-
公开(公告)号:CN113611356A
公开(公告)日:2021-11-05
申请号:CN202110865026.2
申请日:2021-07-29
Applicant: 湖南大学
Abstract: 本发明属于计算机科学领域,公开了一种基于自监督图表征学习的药物重定位预测方法。首先探索发现生物异质网络中不同实体之间的多中心结构特征,并被用于元路径设计;其次,通过基于路径检测的自监督学习机制训练深度Transformer编码器,生成可以反映生物异质网络中全局信息的表征向量;同时,通过集成生物医学实体掩码任务来捕获网络节点之间的局部关联信息;最后,将来自不同任务模型的表征拼接起来作为特征向量,并利用传统的支持向量机模型预测生药物‑靶标的相互作用关系。本发明通过自监督图表征模型捕获了生物异质网络中的局部‑全局信息,进而提高了药物重定位预测精度,同时降低了对生物医学标注数据的依赖性,更加符合生物医药的实际应用。
-
公开(公告)号:CN112967751A
公开(公告)日:2021-06-15
申请号:CN202110299297.6
申请日:2021-03-21
Applicant: 湖南大学
Abstract: 本发明属于生物信息学、智能优化、计算机应用领域,公开了基于进化搜索的蛋白质构象空间优化方法。本发明包括:用氨基酸序列在第0代时的随机构象初始化种群;将种群中个体按照势能值排序;选择低势能个体作为当前采样前的父代个体,对每一个父代个体应用片段替换技术进行修改生成子代个体;对得到的每一个子代个体,应用最小化策略进行一系列的片段替换运动,映射到附近的极小值状态;将经过最小化策略处理后的所有子代个体与种群中其他个体形成的并集经过截断选择后选出新的种群。本发明改进了基本进化方法的不足,如:容易过早收敛到次优区域。本发明借助于以局部贪婪搜索为特征的最小化步骤,实现了采样能力更高的蛋白质构象空间探索方法。
-
公开(公告)号:CN112309505A
公开(公告)日:2021-02-02
申请号:CN202011226196.8
申请日:2020-11-05
Applicant: 湖南大学
Abstract: 本发明属于计算机科学领域,公开了一种基于网络表征的抗新冠炎症药物发现方法。首先通过融合DrugBank、UniProt、HPRD、SIDER、CTD、NDFRT和STRING等多个数据库构建多源、异构、大规模的生物医药网络;然后,通过随机游走的方式在网络中进行序列采样构成网络序列库,利用Transformer的深层双向编码器表征技术对进行表征,得到每个节点的表征向量;利用归纳矩阵分解技术进行靶标‑药物相互作用预测,发现潜在的抗COVID‑19炎症药物,推理出相关药物的作用机理。本发明通过集成多源异构的信息,多样化的数据为药物研发提供了一个多层关联知识,进而提高了预测精度;其次,通过Transformer模型融合了多头注意力机制,可以不同程度的捕获网络节点之间的关联性与网络节点的物理距离,进而改善表征的性能。
-
公开(公告)号:CN114758722B
公开(公告)日:2024-06-28
申请号:CN202210427451.8
申请日:2022-04-21
Applicant: 湖南大学
IPC: G16B30/00 , G16B40/00 , G06F18/2321 , G06N3/045 , G06N3/0475 , G06N3/094
Abstract: 本发明公开了一种基于生成式对抗网络的基因序列插补方法,通过无监督聚类算法将基因序列按照缺失片段的分布情况分为两类,两个生成器分别学习并构造相应的基因序列缺失分布模型;再分别构建两个生成式对抗网络,通过注入与原数据等量的随机噪声,生成缺失片段的插补结果,并根据对方缺失分布模型的预测结果,丢弃此完整数据的部分信息,最后判别与真实数据的差异性,根据反馈调整插补模型,进而得到高精度的插补结果。本发明可以在不同类型的数据集上进行插补,具有良好的鲁棒性;能模拟基因数据产生缺失的过程,又避免了插补片段与掩盖片段重叠,能够防止训练中产生无意义的迭代;提高了插补的精度和效率,能够运用于大规模数据集的处理。
-
公开(公告)号:CN114496303B
公开(公告)日:2024-06-04
申请号:CN202210011416.8
申请日:2022-01-06
Applicant: 湖南大学
IPC: G16H70/40 , G16B20/10 , G16B40/00 , G06N3/042 , G06N3/0464 , G06N3/0455 , G06N3/08
Abstract: 本发明属于计算机科学领域,公开了一种基于多通道神经网络的抗癌药物筛选方法。本发明通过图卷积网络提取图结构的药物分子图特征,一维卷积提取常规向量格式的药物分子指纹和细胞系miRNA特征,自编码器提取超高维的基因拷贝数特征,可以融合不同数据结构和维度的特征信息。本发明可以解决不同输入特征数据结构不同和数据复杂度高的问题,从而有效融合药物的全局和局部结构信息,以及来自不同组学数据的细胞系特征,提高药物敏感性预测的精度,进而提高抗癌药物筛选的效率。同时,多信息源的融合提高了模型的鲁棒性,使其在数据标签不足时,仍能保持稳定的性能。
-
公开(公告)号:CN114974610B
公开(公告)日:2024-05-31
申请号:CN202210391128.X
申请日:2022-04-14
Applicant: 湖南大学
IPC: G16H70/40 , G16B5/00 , G16B40/00 , G06N3/042 , G06N3/0455 , G06N3/0464 , G06N3/084
Abstract: 本发明属于计算机科学领域,公开了基于图神经网络和自动编码器的抗癌药物敏感性预测方法。首先从PubChem、CCLE和PRISM数据库中获取相关数据,然后根据所提取的信息和K近邻的方法构建药物细胞系对稀疏相似性矩阵A;其次,利用自动编码器对细胞系的高维特征进行降维,并将药物的特征和细胞系的特征进行拼接之后得到药物细胞系对的特征矩阵X;再次,将A和X作为输入,利用初始残差连接图神经网络学习网络中每个节点的表征;最后使用全连接层预测药物细胞系对之间的敏感性数值。本发明充分将药物、细胞系和DCP之间的相似性信息进行融合,并将图卷积神经网络和初始残差连接进行融合,提高了药物与细胞系对之间的敏感性预测精度。
-
公开(公告)号:CN116206678A
公开(公告)日:2023-06-02
申请号:CN202310223854.5
申请日:2023-03-09
Applicant: 湖南大学
IPC: G16B15/30 , G16B15/20 , G16B40/00 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于多壳层和扩展连接性指纹的药靶亲和力预测方法,使用PDBbind数据库中的蛋白质‑配体复合物作为数据集;对大分子蛋白质和小分子配体的结合口袋建模,从配体的几何中心向外构建N个壳层,根据蛋白质原子的空间坐标把蛋白质原子对应到各个壳层;通过原子符号、显式价、等特征把配体原子分为多种类别;把所有特异性原子对作为该壳层的特征,叠加多个壳层的特征得到复合物的特征向量;通过对复合物特征的3D切片,使用Transformer学习壳层原子对特征。本发明解决现有方法无法表征长程相互作用的问题;通过对复合物特征的3D切片,使得Transformer能够很好的学习到壳层原子对特征,进而改变了表征的性能。
-
公开(公告)号:CN114974610A
公开(公告)日:2022-08-30
申请号:CN202210391128.X
申请日:2022-04-14
Applicant: 湖南大学
Abstract: 本发明属于计算机科学领域,公开了基于图神经网络和自动编码器的抗癌药物敏感性预测方法。首先从PubChem、CCLE和PRISM数据库中获取相关数据,然后根据所提取的信息和K近邻的方法构建药物细胞系对稀疏相似性矩阵A;其次,利用自动编码器对细胞系的高维特征进行降维,并将药物的特征和细胞系的特征进行拼接之后得到药物细胞系对的特征矩阵X;再次,将A和X作为输入,利用初始残差连接图神经网络学习网络中每个节点的表征;最后使用全连接层预测药物细胞系对之间的敏感性数值。本发明充分将药物、细胞系和DCP之间的相似性信息进行融合,并将图卷积神经网络和初始残差连接进行融合,提高了药物与细胞系对之间的敏感性预测精度。
-
-
-
-
-
-
-
-
-