基于RNN神经网络的可迁移病人分类系统

    公开(公告)号:CN110111901B

    公开(公告)日:2023-04-18

    申请号:CN201910407569.2

    申请日:2019-05-16

    Applicant: 湖南大学

    Abstract: 本发明属于医疗数据挖掘领域,具体公开了基于RNN神经网络的可迁移病人分类系统。该系统包括:输入模块、数据处理模块、分类模块;输入模块用于获取原始病历数据;数据处理模块包括数据预处理单元、病人时序序列生成单元,用于将输入模块读入的原始病历数据转换成病人时序序列;分类模块包括模型构建单元、模型预测单元、迁移单元,用于将RNN神经网络与Attention(注意力)机制结合,构建病人分类模型,然后将数据处理模块得到的病人时序序列输入到模型进行训练,最后将训练好的模型迁移到不同数据集上进行病人分类预测。本发明具有通过挖掘电子病历数据,构建病人分类模型,在不同医疗数据集上进行病人死亡风险分类来辅助医生诊疗的优势。

    一种基于元路径和双向编码器的生物网络链接预测方法

    公开(公告)号:CN112308326A

    公开(公告)日:2021-02-02

    申请号:CN202011226195.3

    申请日:2020-11-05

    Applicant: 湖南大学

    Abstract: 本发明属于计算机科学领域,公开了一种基于元路径和双向编码器的生物网络链接预测方法。首选构建了多源异构的药物信息网络,同时设计多种语义路径进行序列采样,构成大规模的语义信息库;其次,将深度Transformer编码器与掩码语言模型(masked language model)有机融合设计出深度双向的编码表征模型有效地提取每个节点的低纬表征向量;最后,利用归纳矩阵补全(Inductive matrix completion)技术进行疾病‑蛋白关联关系、蛋白‑药物相互作用、药物‑副作用关联关系等生物链接预测,进而完成从疾病—靶标—药物—副作用的药物研发技术体系。

    一种基于共享字典学习的基因表达谱分类方法

    公开(公告)号:CN110033824A

    公开(公告)日:2019-07-19

    申请号:CN201910296287.X

    申请日:2019-04-13

    Applicant: 湖南大学

    Abstract: 本发明属于基因表达谱分类领域,公开了一种基于共享字典学习的基因表达谱分类方法,属于稀疏字典学习在生物大数据上的挖掘和应用。本方法首先构建一个共享字典,该字典能够获取所有类别的样本;然后训练字典,在训练字典的同时还训练投影矩阵,并且投影矩阵对测试样本的投影可以加宽不同类型样本之间的距离;最后,通过使用字典重建测试样本的系数编码向量之间的距离判定类别。该方法能够快速高效地对基因表达谱数据分类,这有助于区分癌症种类及其亚型,帮助从分子层面认识肿瘤的致病机理,并为彻底治疗肿瘤提供基因层次的解决方案。该方法具有共享样本的能力,少量样本时能保持稳定的投影能力,和一般的分类方法相比较,分类准确度有很大提升。

    一种基于网络表征的抗新冠炎症药物发现方法

    公开(公告)号:CN112309505A

    公开(公告)日:2021-02-02

    申请号:CN202011226196.8

    申请日:2020-11-05

    Applicant: 湖南大学

    Abstract: 本发明属于计算机科学领域,公开了一种基于网络表征的抗新冠炎症药物发现方法。首先通过融合DrugBank、UniProt、HPRD、SIDER、CTD、NDFRT和STRING等多个数据库构建多源、异构、大规模的生物医药网络;然后,通过随机游走的方式在网络中进行序列采样构成网络序列库,利用Transformer的深层双向编码器表征技术对进行表征,得到每个节点的表征向量;利用归纳矩阵分解技术进行靶标‑药物相互作用预测,发现潜在的抗COVID‑19炎症药物,推理出相关药物的作用机理。本发明通过集成多源异构的信息,多样化的数据为药物研发提供了一个多层关联知识,进而提高了预测精度;其次,通过Transformer模型融合了多头注意力机制,可以不同程度的捕获网络节点之间的关联性与网络节点的物理距离,进而改善表征的性能。

    一种基于深度学习的基因表达谱距离度量方法

    公开(公告)号:CN110033041A

    公开(公告)日:2019-07-19

    申请号:CN201910296276.1

    申请日:2019-04-13

    Applicant: 湖南大学

    Abstract: 本发明属于基因表达谱分类领域,公开了一种基于深度学习的基因表达谱距离度量方法,属于深度学习在生物大数据上的挖掘和应用。首先,设计了一种适用于基因特征度量学习的卷积神经网络模型来提取数据的特征,然后运用改进的余弦距离来计算数据之间的距离,最后通过分类算法的分类效果来衡量该方法的优良。该方法能够快速高效地度量出不同的基因表达谱之间的相似度,为后续的基因分类、聚类、差异性表达分析、化合物筛查等研究提供数据。相比较传统的基因富集方法,这种方法显著提高了数据之间的距离度量效果,并且可以有效的减少基因表达谱分析时候的人工干预,避免了常规深度网络易产生的过拟合现象,该方法有较强的可迁移性。

    一种基于深度学习的基因表达谱距离度量方法

    公开(公告)号:CN110033041B

    公开(公告)日:2022-05-03

    申请号:CN201910296276.1

    申请日:2019-04-13

    Applicant: 湖南大学

    Abstract: 本发明属于基因表达谱分类领域,公开了一种基于深度学习的基因表达谱距离度量方法,属于深度学习在生物大数据上的挖掘和应用。首先,设计了一种适用于基因特征度量学习的卷积神经网络模型来提取数据的特征,然后运用改进的余弦距离来计算数据之间的距离,最后通过分类算法的分类效果来衡量该方法的优良。该方法能够快速高效地度量出不同的基因表达谱之间的相似度,为后续的基因分类、聚类、差异性表达分析、化合物筛查等研究提供数据。相比较传统的基因富集方法,这种方法显著提高了数据之间的距离度量效果,并且可以有效的减少基因表达谱分析时候的人工干预,避免了常规深度网络易产生的过拟合现象,该方法有较强的可迁移性。

    一种基于元路径和双向编码器的生物网络链接预测方法

    公开(公告)号:CN112308326B

    公开(公告)日:2022-12-13

    申请号:CN202011226195.3

    申请日:2020-11-05

    Applicant: 湖南大学

    Abstract: 本发明属于计算机科学领域,公开了一种基于元路径和双向编码器的生物网络链接预测方法。首选构建了多源异构的药物信息网络,同时设计多种语义路径进行序列采样,构成大规模的语义信息库;其次,将深度Transformer编码器与掩码语言模型(masked language model)有机融合设计出深度双向的编码表征模型有效地提取每个节点的低纬表征向量;最后,利用归纳矩阵补全(Inductive matrix completion)技术进行疾病‑蛋白关联关系、蛋白‑药物相互作用、药物‑副作用关联关系等生物链接预测,进而完成从疾病—靶标—药物—副作用的药物研发技术体系。

    一种基于卷积神经网络的阴道病理图像分类方法

    公开(公告)号:CN110136113B

    公开(公告)日:2022-06-07

    申请号:CN201910399732.5

    申请日:2019-05-14

    Applicant: 湖南大学

    Abstract: 本发明属于计算机视觉及机器学习技术领域,公开了一种基于卷积神经网络的阴道病理图像分类方法。本发明包括步骤:使用上采样方法,得到类别平衡的阴道病理图像数据集;利用数据增强方法扩增阴道病理图像数据集;利用扩增的阴道病理图像数据集对图像分类卷积神经网络进行训练;利用交叉熵损失函数,结合BP算法对图像分类卷积神经网络进行网络参数更新;通过训练后的最优图像分类卷积神经网络对输入图像进行分类。本发明避免了传统特征提取方法的局限,如:高度依赖于医护人员的经验知识,耗费大量的时间和精力完成,提取出有区分性的高质量特征也往往存在一定的困难,而且准确率低,本发明借助于卷积神经网络,实现阴道病理图像的高精度分类。

    一种基于自编码器的基因表达谱特征学习方法

    公开(公告)号:CN111276187B

    公开(公告)日:2021-09-10

    申请号:CN202010029068.8

    申请日:2020-01-12

    Applicant: 湖南大学

    Abstract: 本发明属于计算机科学领域,公开了一种基于自编码器的基因表达谱特征学习方法,通过将基因表达谱文件按实验条件提取所需要的数据,先对提取的样本数据进行处理,得到能直接用于模型的输入数据,再将多个多通道自编码器逐层叠加,得到包含多个隐藏层的深度多通道自编码器模型,接着用深度多通道自编码器模型从高维稀疏的基因表达谱数据中提取出维度相对较低,且能有效区分原始数据的特征表示,最后验证模型预测的特征的好坏。本发明充分发挥深度学习能准确获取数据特征的优势,结合卷积神经网络的多通道和自编码器的特征学习能力,设计一种新的多通道自编码器模型,从而更好的学习到维度相对较低,且能有效区分原始基因表达谱数据的特征表示。

    一种基于网络表征的抗新冠炎症药物发现方法

    公开(公告)号:CN112309505B

    公开(公告)日:2021-08-17

    申请号:CN202011226196.8

    申请日:2020-11-05

    Applicant: 湖南大学

    Abstract: 本发明属于计算机科学领域,公开了一种基于网络表征的抗新冠炎症药物发现方法。首先通过融合DrugBank、UniProt、HPRD、SIDER、CTD、NDFRT和STRING等多个数据库构建多源、异构、大规模的生物医药网络;然后,通过随机游走的方式在网络中进行序列采样构成网络序列库,利用Transformer的深层双向编码器表征技术对进行表征,得到每个节点的表征向量;利用归纳矩阵分解技术进行靶标‑药物相互作用预测,发现潜在的抗COVID‑19炎症药物,推理出相关药物的作用机理。本发明通过集成多源异构的信息,多样化的数据为药物研发提供了一个多层关联知识,进而提高了预测精度;其次,通过Transformer模型融合了多头注意力机制,可以不同程度的捕获网络节点之间的关联性与网络节点的物理距离,进而改善表征的性能。

Patent Agency Ranking