基于主题注意力的深度学习文本分类模型训练方法

    公开(公告)号:CN114925197B

    公开(公告)日:2024-06-11

    申请号:CN202210312063.5

    申请日:2022-03-28

    申请人: 中南大学

    发明人: 张祖平 彭杰 龙哲

    IPC分类号: G06F16/35 G06N20/00

    摘要: 本公开实施例中提供了一种基于主题注意力的深度学习文本分类模型训练方法,属于计算技术领域,具体包括:根据原始文本构建文本数据集;得到文本的数字化表示、文本的掩盖序列、文本的数字标签;得到样本,并将样本分为训练集和验证集;初始化前向网络中变量;得到表征文本的一组词向量;得到原始注意力矩阵;得到目标注意力矩阵;根据目标注意力矩阵,得到概率矩阵;计算注意力头输出;得到注意力输出;计算主题输出;计算主题概率向量;计算交叉熵损失;计算前向网络变量的梯度;更新网络变量;迭代计算交叉熵损失以及梯度;当迭代达到预设次数或模型损失趋于稳定,迭代停止。通过本公开的方案提高了模型的并行性、稳定性、可视性和准确率。

    一种细胞培养预测方法及装置、电子设备、存储介质

    公开(公告)号:CN117235673B

    公开(公告)日:2024-01-30

    申请号:CN202311514464.X

    申请日:2023-11-15

    申请人: 中南大学

    摘要: 器执行所述细胞培养预测方法。本发明能够对细本发明提供了一种细胞培养预测方法及装 胞培养进行有效筛选,降低细胞培养和筛选成置、电子设备、存储介质,该细胞培养预测方法包 本。括获得细胞培养的待预测数据集;获得特征数据;将所述特征数据输入至融合预测模型中进行预测,并获得预测结果。该装置用于实现该细胞培养预测方法。该电子设备包括相互连接的处理器和存储器,所述存储器用于存储所述细胞培养预测方法的计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指(56)对比文件庄少颖;史劲松.重组抗CD20单克隆抗体细胞培养工艺优化.名医.2020,(第12期),356-357+359.

    一种细胞培养预测方法及装置、电子设备、存储介质

    公开(公告)号:CN117235673A

    公开(公告)日:2023-12-15

    申请号:CN202311514464.X

    申请日:2023-11-15

    申请人: 中南大学

    摘要: 本发明提供了一种细胞培养预测方法及装置、电子设备、存储介质,该细胞培养预测方法包括获得细胞培养的待预测数据集;获得特征数据;将所述特征数据输入至融合预测模型中进行预测,并获得预测结果。该装置用于实现该细胞培养预测方法。该电子设备包括相互连接的处理器和存储器,所述存储器用于存储所述细胞培养预测方法的计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行所述细胞培养预测方法。该存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行所述细胞培养预测方法。本发明能够对细胞培养进行有效筛选,降低细胞培养和筛选成本。

    面向流数据的增量式时态频繁模式并行挖掘方法

    公开(公告)号:CN109471877B

    公开(公告)日:2022-04-22

    申请号:CN201811292708.3

    申请日:2018-11-01

    申请人: 中南大学

    IPC分类号: G06F16/2455 G06F16/2458

    摘要: 本发明提供了一种面向流数据的增量式时态频繁模式并行挖掘方法,包括两部分,第一部分为时态频繁模式和时态次频繁模式的增量式挖掘,第二部分是时态频繁模式树的重建。本发明在获取了当前数据集的K‑项集计数后通过历史的频繁模式树和历史次频繁模式的信息对每个频繁模式的时态频繁度进行更新计算,将更新完时态频繁度的频繁模式根据阈值分别加入到时态频繁模式集合和时态次频繁模式集合中。本发明能以最小的空间代价来保存时态频繁模式的历史信息,提高频繁模式挖掘的准确性。

    一种基于组合矩阵计算语义距离的文本分类方法

    公开(公告)号:CN109933670B

    公开(公告)日:2021-06-04

    申请号:CN201910209354.X

    申请日:2019-03-19

    申请人: 中南大学

    摘要: 本发明公开了一种基于组合矩阵计算语义距离的文本分类方法,包括步骤:S1、对中文文本进行处理,生成基于词袋模型的向量空间模型;S2、对于全部文本集合,使用生成的词袋模型文本向量作为训练语料,采用word2vec训练词向量,并结合训练出来的词向量和文本向量,构成一个文本矩阵;S3、对文本矩阵进行交叉运算,得到文本之间的语义距离。本发明提出的文本向量的表示和语义距离的计算方法,既克服了传统的词袋模型的缺陷,也改善了TF‑IDF算法的不足,从而可以训练出更好的分类模型来提升文本分类的准确性。

    基于KL距离相似性度量的研究热点演变行为检测方法

    公开(公告)号:CN109408782B

    公开(公告)日:2020-07-03

    申请号:CN201811216206.2

    申请日:2018-10-18

    申请人: 中南大学

    IPC分类号: G06F40/194 G06F40/284

    摘要: 本发明公开了一种基于KL距离相似性度量的研究热点演变行为检测方法,其将刊物主题性和刊物的时序性相结合,提出了时序刊物主题模型TS‑JTM,以实现学术刊物的时态热点抽取,在此基础上建立基于时间序列的主题快照刊物研究热点演变模型,同时,利用概率分布KL距离相似性度量方法,提出了度量相邻时刻主题快照中主题演变行为的检测方法,以实现对刊物中研究热点演变的细粒度分析。

    一种预测微生物和疾病关系的方法

    公开(公告)号:CN107610784A

    公开(公告)日:2018-01-19

    申请号:CN201710832012.4

    申请日:2017-09-15

    申请人: 中南大学

    IPC分类号: G16H50/70 G06K9/62

    摘要: 本发明公开了一种预测微生物和疾病关系的方法,根据已知的微生物-疾病关系数据和基于症状的疾病相似性数据构建微生物相似性网络和疾病相似性网络,然后通过网络一致性投影来预测潜在的微生物和疾病之间的关系。本发明与以前的技术相比,集成了基于症状的疾病相似性数据,且整个计算过程无需任何参数,适用于已知微生物-疾病关系数据很少的情况,能够更加准确地预测出微生物和疾病的关系。本发明是一种基于全局的计算方法,因此可以大规模地预测出多对微生物-疾病之间的关系,并且能够有效地解决生物实验方法的盲目性、成本高的问题。

    基于属性构建概念格的增加算法

    公开(公告)号:CN106484863A

    公开(公告)日:2017-03-08

    申请号:CN201610884054.8

    申请日:2016-10-10

    申请人: 中南大学

    IPC分类号: G06F17/30

    CPC分类号: G06F16/901

    摘要: 本发明公开了一种基于属性构建概念格的增加算法,对每个属性设置一个id字段,用来赋给当前概念的visited字段,通过比较每个概念的visited字段,来标记该概念是否已经访问过,在一次增加属性或者增加对象的过程中,如果某个概念是第二次访问,则可直接将该概念的newConcept字段指向的新概念作为候选结点,从而减少了递归访问次数,也因此相应减少了运行时间;在增加属性构建概念格的过程中,确定某一个标准生成概念的外延,再通过K.Find(X)函数直接定位到具有这个外延的概念,也同样大大地降低了现有算法中递归的次数和比较的次数,运行时间大幅度减少。

    基于RLS-ELM的多模态融合图像分类方法

    公开(公告)号:CN104715260B

    公开(公告)日:2016-06-01

    申请号:CN201510097438.0

    申请日:2015-03-05

    申请人: 中南大学

    IPC分类号: G06K9/62 G06K9/46

    摘要: 本发明公开了一种基于RLS-ELM的多模态融合图像分类方法,其特征在于,包括如下步骤:步骤1:获取多个被试对象的rs-fMRI、sMRI以及DTI数据,并进行预处理,剔除不符合规定的被试数据;步骤2:计算rs-fMRI数据中各体素的ReHo值;步骤3:计算sMRI数据中各体素的灰质密度值;步骤4:计算DTI数据中各体素的FA值;步骤5:将各体素的ReHo、灰质密度以及FA值连接成一个新特征矩阵A;步骤6:对新的特征矩阵A进行PCA降维处理;步骤7:对RLS-ELM分类器进行训练,获得已训练的RLS-ELM的分类器。本发明基于RLS-ELM的多模态融合图像分类方法使得分类准确度和分类速度得到显著提升,实现疾病的早发现早诊断早治疗,对于揭示疾病进展的临床医学研究过程中具有重要的意义。

    一种基于学术关系网络的专家学术距离评估方法

    公开(公告)号:CN104933111A

    公开(公告)日:2015-09-23

    申请号:CN201510299330.X

    申请日:2015-06-03

    申请人: 中南大学

    IPC分类号: G06F17/30

    CPC分类号: G06F17/30595

    摘要: 本发明公开了一种基于学术关系网络的专家学术距离评估方法,包括如下步骤:第一步,提取学术社区结构特征、关系跳数结构特征、关系权重结构特征以及邻里重叠度结构特征;学术社区结构特征区分两人是否在同一学术社区;学术关系跳数结构特征表示两人直接相连或达到通过人物的个数;学术关系权重表示在学术关系网络里,人物到其他人物的权重值;邻里重叠度表示共同朋友的数量;第二步,使用变异系数的灰色关联算法来综合评估以上的四个学术距离结构特征,得到综合的学术距离值。这种方法计算简便,能有效评估出是否回避,能显著提高科技评价及评审的公平与准确性。