-
公开(公告)号:CN109697285A
公开(公告)日:2019-04-30
申请号:CN201811523661.7
申请日:2018-12-13
Applicant: 中南大学
Abstract: 本发明公开了一种增强语义表示的层次BiLSTM中文电子病历疾病编码标注方法,对输入的电子病历文本进行预处理后,考虑中文词语构成中,单个汉字包含具体语义,利用引入关注机制的BiLSTM提取字符级特征向量表示,获得单个汉字的语义及构词特征;将字符级词向量表示与利用word2vec训练得到的词语级别的向量表示进行拼接,得到字符特征增强的词语向量表示;以特征词向量表示的文本序列作为输入,再次利用BiLSTM学习整个电子病历中的上下文特征,并采用关注机制,计算各个特征词的贡献度,得到上下文特征加权的文本向量表示,提高了预测效果。本发明的方法适用于基于中文电子病历文本的疾病标签分类任务,并有效提高了分类效果。
-
公开(公告)号:CN106485096B
公开(公告)日:2019-03-26
申请号:CN201610915233.3
申请日:2016-10-20
Applicant: 中南大学
IPC: G16B25/10
Abstract: 本发明公开了一种基于双向随机游走和多标签学习的miRNA‑环境因子关系预测方法。考虑到单一的生物数据的不完整,采用不同的生物数据和不同相似性度量方法分别计算miRNA和环境因子的相似性。另外,为了减少单个相似性度量噪声,本发明引入相似性矩阵融合方法来提高最终的miRNA和环境因子相似性可靠性。在此基础上,采用双向随机游走算法和多标签学习方法来预测潜在的miRNA‑环境因子关系。本发明简单有效,通过与其他方法比较,及在已知数据集上测试表明,该发明在miRNA‑环境因子潜在关系方面具有较好的预测性能。案例分析表明,本发明能够发现一些潜在的环境因子对应miRNA,能为生物学家进行miRNA‑环境因子发现的进一步实验提供有价值的参考信息。
-
公开(公告)号:CN108830040A
公开(公告)日:2018-11-16
申请号:CN201810578523.2
申请日:2018-06-07
Applicant: 中南大学
Abstract: 本发明公开了一种基于细胞系和药物相似性网络的药物敏感性预测方法,包括:构建药物相似性网络、细胞系相似性网络以及药物-细胞系关系网络;分别依据药物相似性网络、细胞系相似性网络、药物-细胞系关系网络获取对应的药物邻接矩阵、细胞系邻接矩阵、药物-细胞系关系初矩阵;基于药物邻接矩阵、细胞系邻接矩阵、药物-细胞系关系初矩阵采用不平衡的双随机游走算法得到药物-细胞系的药物敏感性预测矩阵,其中,采用不平衡的双随机游走公式游走完成后得到的药物-细胞系的药物敏感性预测矩阵中各个元素为相对应药物对细胞系预测的敏感性数值。本发明充分考虑药物相似性网络和细胞系相似性网络的特性,进而提高了药物敏感性预测结果的可靠性。
-
公开(公告)号:CN108804871A
公开(公告)日:2018-11-13
申请号:CN201710301362.8
申请日:2017-05-02
Applicant: 中南大学
IPC: G06F19/18
Abstract: 本发明公开了一种基于最大邻居子网的关键蛋白质识别方法,首先根据亚细胞定位信息对获得的蛋白质相互作用网络进行子网划分,位于相同亚细胞位置的蛋白质被划分到相同的子网,从而得到多个在同一亚细胞区间内具有相互作用关系的蛋白质子网络。然后对每个蛋白质对应的所在的最大子网进行拓扑特征分析,计算其基于共同邻居的关键性综合评分值,分值越高表示该蛋白质越趋向于是关键的,从而利用得分排序来预测潜在的关键蛋白质。本发明在简单实用的基础上,能够很好的提高关键蛋白质识别的准确率,为研究人员进行关键蛋白质的实验分析和更深层次的研究提供重要的参考价值和实用价值。
-
公开(公告)号:CN108647484A
公开(公告)日:2018-10-12
申请号:CN201810472698.5
申请日:2018-05-17
Applicant: 中南大学
IPC: G06F19/00
Abstract: 本发明公开了一种基于多元信息集成和最小二乘法的药物关系预测方法,包括步骤1:获取待研究的药物集合的药物关系矩阵;步骤2:计算每个药物与其余药物的高斯核相似性;步骤3:根据药物集合中所有药物的特征信息采用余弦角相似性方法计算每个药物与其余药物的特征相似性;特征信息包括化学信息、生物信息以及表征信息;步骤4:计算每两个药物之间的高斯核相似性和特征相似性的均值得到每两个药物之间的药物相似性,并基于每两个药物之间的药物相似性构成出药物集合的药物相似性矩阵;步骤5:基于药物相似性矩阵以及药物关系矩阵采用最小二乘法进行药物对的关联关系分数计算得到药物关系预测矩阵。
-
公开(公告)号:CN108509768A
公开(公告)日:2018-09-07
申请号:CN201810287578.8
申请日:2018-03-31
Applicant: 中南大学
IPC: G06F19/18
Abstract: 本发明公开了一种基于蛋白质时空子网络的关键蛋白质识别方法及识别系统,包括如下步骤:步骤1:获取原始蛋白质网络;步骤2:构建不同时刻的活性蛋白质集合;步骤3:构建不同亚细胞结构中的蛋白质集合;步骤4:依据蛋白质节点之间的连接关系、不同时刻的活性蛋白质集合、不同亚细胞结构中的蛋白质集合组建各类亚细胞结构在不同时刻的时空子网络;步骤5:获取每个蛋白质节点的最大度中心性值;步骤6:按照蛋白质节点的最大度中心性对所有蛋白质节点进行降序排列,再选定排前的M个蛋白质节点作为预测的关键蛋白质。通过上述方法能够提高关键蛋白质的识别准确率。
-
公开(公告)号:CN108491686A
公开(公告)日:2018-09-04
申请号:CN201810277009.5
申请日:2018-03-30
Applicant: 中南大学
Abstract: 本发明公开了一种基于双向XGBoost的基因调控网络构建方法,针对时间序列基因表达数据的特点,分析t时刻基因的表达值与其他基因t时刻点前与后的关系,建立local-in和local-out双向模型;在单个模型中,将基因调控网络构建划分为多个回归方程,充分考虑高阶时滞的情形,采用XGBoost对单个回归方程中特征的权重进行评价,最终获得调控关系的排序;采用归一化残差对每个独立回归方程中的特征进行二次加权,并融双向模型对同一对调控关系的权重,作为最终每对基因调控关系的打分值。本发明适用于时间序列基因表达数据下的不同规模大小的基因调控网络的构建,并能有效提高网络推断的准确性。
-
公开(公告)号:CN105930684A
公开(公告)日:2016-09-07
申请号:CN201610266442.X
申请日:2016-04-26
Applicant: 中南大学
IPC: G06F19/12
CPC classification number: G16B5/00
Abstract: 本发明公开了基于基因表达与亚细胞定位信息的蛋白质网络精炼方法,利用时间相关模型与时间不相关模型过滤基因表达数据;对S‑PIN中的每条边e(u,v),如果边e连接的两个蛋白质节点u和v在所有时间点都不同时满足活性的判决条件,则将边e(u,v)从S‑PIN中移除;对S‑PIN中的每条边e(u,v),如果边e连接的两个蛋白质节点u和v不出现在任意一个共同的亚细胞位置中,则将边e(u,v)从S‑PIN中移除;输出过滤后的S‑PIN的边集E,即为精炼后的蛋白质网络TS‑PIN。有效提高基于网络的关键蛋白质预测方法预测关键蛋白质的准确率。
-
公开(公告)号:CN102945333A
公开(公告)日:2013-02-27
申请号:CN201210513154.1
申请日:2012-12-04
Applicant: 中南大学
IPC: G06F19/18
Abstract: 本发明公开了一种基于先验知识和网络拓扑特性的关键蛋白预测方法。基于对已知关键蛋白之间拓扑关系的分析发现关键蛋白之间联系紧密,将边聚集系数作为评估两个关键蛋白紧密程度的参数,并利用部分已知关键蛋白,以及其邻居节点与这些已知关键蛋白之间的共簇系数来预测新的关键蛋白。本发明实现简单,只需根据PPI信息和部分已知关键蛋白信息就能够较准确地预测未知关键蛋白,既能用于非加权PPI网络,也能用于加权PPI网络,解决了化学实验方法成本昂贵、耗时等问题。
-
公开(公告)号:CN100557616C
公开(公告)日:2009-11-04
申请号:CN200810030832.2
申请日:2008-03-18
Applicant: 中南大学
IPC: G06F19/00
Abstract: 本发明公开了一种基于距离判定的蛋白质复合物识别方法,基于对已知蛋白质复合物中蛋白质顶点之间的最短距离一般不超过2的发现,将蛋白质顶点之间的最短距离作为蛋白质复合物识别的一个重要参数,并利用蛋白质顶点与蛋白质复合物之间的作用概率来控制识别的蛋白质复合物的稠密程度。本发明实现简单,能够通过蛋白质相互作用网络识别大量已知的具有生物意义的蛋白质复合物,对蛋白质相互作用大规模数据中普遍存在的比例较高的假阳性和假阴性具有很好的健壮性,有效地解决了化学实验成本昂贵,单次识别数量少以及很难识别动态复合物的生物学难题。
-
-
-
-
-
-
-
-
-