一种面向稀疏数据的个性化情感分析方法与装置

    公开(公告)号:CN111325027B

    公开(公告)日:2023-04-28

    申请号:CN202010102417.4

    申请日:2020-02-19

    申请人: 东南大学

    摘要: 本发明公开了一种面向稀疏数据的个性化情感分析方法与装置,通过对具有相似打分习惯的用户分组,利用分组信息来增强用户表示,实现个性化的情感分析。本方法包括:文档预处理;使用基于深度神经网络的基础情感分析模型计算得到情感打分基础;使用基于群组的个性化分析模型计算得到情感打分偏移和波动;结合情感打分基础和情感打分偏移计算最终情感打分。本方法相比之前的个性化情感分析方法,可以在用户文本数据稀疏的情况下学习得到良好的用户表示,在个性化情感分析中,可以有效地对用户建模,更准确地进行个性化情感分析。

    基于双层多门控专家混合模型(MMOE)的多任务NL2SQL方法

    公开(公告)号:CN115809314A

    公开(公告)日:2023-03-17

    申请号:CN202211448380.6

    申请日:2022-11-18

    申请人: 东南大学

    摘要: 本发明公开了基于双层多门控专家混合模型(MMOE)的多任务NL2SQL方法,包括以下步骤:步骤1编码层构建步骤,用于获取问题和表模式的嵌入表示;步骤2多门控循环神经网络混合层构建步骤,用于利用多门控专家混合模型,进一步提取不同类型的语义信息,步骤3多门控注意力池化混合层构建步骤,用于利用多门控专家混合模型,获取不同子任务下的问题的向量表示;步骤4子任务学习层构建步骤,用于对各项子任务进行预测;步骤5多任务NL2SQL模型训练步骤,用于构建损失函数,构建优化函数。本发明在查询匹配正确率上的提升尤为显著,说明本发明的模型对于NL2SQL的数据集有着显著的效果提升。

    基于显式及隐式特征解耦的NL2SQL方法

    公开(公告)号:CN115796029A

    公开(公告)日:2023-03-14

    申请号:CN202211502427.2

    申请日:2022-11-28

    申请人: 东南大学

    摘要: 本发明公开了基于显式及隐式特征解耦的NL2SQL方法,包括以下步骤:(1)构建特定子模块专家系统的步骤;(2)结合多次随机失活和专家系统步骤;(3)构建多次随机失活和专家系统专用损失函数的步骤;(4)训练不同子系统进行显式解耦步骤,包括将不同子系统之间进行分别训练;(5)构建子系统输出显式特征耦合专家系统编码模型,包括构建子系统输出显式特征耦合专家系统编码模型,用于整合不同子系统输出;(6)训练最终耦合的NL2SQL方法模型步骤,用于得到最终耦合完成的模型。本发明的实验结果,显示本发明的方法较之以往的模型在逻辑准确率方面有了很大的提升,本发明的模型对于NL2SQL任务有着显著的效果提升。

    一种基于端到端记忆网络的短期风电功率预测方法

    公开(公告)号:CN111160620B

    公开(公告)日:2022-06-17

    申请号:CN201911247976.8

    申请日:2019-12-06

    IPC分类号: G06Q10/04 G06Q50/06 G06N3/04

    摘要: 本发明公开了一种基于端到端记忆网络的短期风电功率预测方法,包括如下步骤:采集风电场数据;将采集的风电场数据划分为历史数据、被预测多节点天气数据和功率数据,并对历史数据和被预测多节点天气数据进行归一化处理;利用多头自注意力机制模型对历史数据进行编码,将编码后的特征向量存入端到端记忆网络的记忆池;采用注意力机制对被预测多节点天气数据进行编码,并将编码结果作为端到端记忆网络的输入向量;将功率数据作为端到端记忆网络的输出向量进行端到端记忆网络的训练;使用训练好的端到端记忆网络对风机输出功率进行预测。本发明方法相比以往短期风电功率预测方法,能够关注到历史数据中隐含的信息,具有更高的预测精度和稳定性。

    一种面向新闻文本的基于深度聚类模型的事件线抽取方法

    公开(公告)号:CN111125520A

    公开(公告)日:2020-05-08

    申请号:CN201911270225.8

    申请日:2019-12-11

    申请人: 东南大学

    IPC分类号: G06F16/9535 G06F40/295

    摘要: 本发明公开了一种面向新闻文本的基于深度聚类模型的事件线抽取方法,包括:新闻文本预处理;文本的初始隐事件表示预训练;按照发布时间对语料中新闻文本进行分组;基于深度聚类模型确定各组中每条新闻所属的事件线;对各组中事件线编号相同的事件元素进行后处理,得到事件的结构化展示;对各组抽取出的具有相同事件线编号的事件进行后处理得到事件线。本发明采用神经网络模型自动抽取文本中隐含的事件特征,避免了手动选取和构建特征,并且抽取得到的文本的隐含事件特征能够为下游应用提供支持;能够同时进行事件特征抽取和事件线提取,减少了误差传播的可能性。相比于以往的事件线抽取方法,本发明具有更高的抽取准确率与召回率。

    一种基于纠错输出编码的无需消歧的无监督词性标注方法

    公开(公告)号:CN105955955B

    公开(公告)日:2018-08-28

    申请号:CN201610292680.8

    申请日:2016-05-05

    申请人: 东南大学

    IPC分类号: G06F17/27

    摘要: 本发明公开了一种基于纠错输出编码的无需消歧的无监督词性标注方法,包括两个主要步骤:(1)基于词性字典生成训练数据。(2)基于纠错输出编码进行训练与测试。本发明不需标注语料,可以应用于不易获得标注语料的语言的词性标注问题;不需消歧,避免了迭代式消歧过程中的错误传播问题;采用神经语言模型自动生成训练和测试使用的特征,避免了手动选取和构建特征。

    基于三阶段的小样本嵌套命名实体识别方法和系统

    公开(公告)号:CN116776885A

    公开(公告)日:2023-09-19

    申请号:CN202310784041.3

    申请日:2023-06-29

    申请人: 东南大学

    摘要: 本发明公开了一种基于三阶段的小样本嵌套命名实体识别方法和系统,首先根据原始嵌套NER数据集采样,保证每种类别采样得到的实体数量一致,初步构建嵌套NER小样本数据集;再从原始嵌套NER数据集的训练集、验证集以及测试集中分别采样K个实体实例,得到嵌套NER小样本训练数据集、验证集以及测试集;再构建嵌套NER模型,分别构建实体定位子模型、实体抽取子模型以及实体分类子模型,捕捉内层实体和外层实体的嵌套关系,构建特殊的软提示模板;最后训练嵌套NER模型,更好的支持小样本场景下的模型训练。

    一种基于真空度引导的汽轮机输出功率预测方法

    公开(公告)号:CN115455698A

    公开(公告)日:2022-12-09

    申请号:CN202211121409.X

    申请日:2022-09-15

    IPC分类号: G06F30/20 G06N3/04 G06N3/08

    摘要: 一种基于真空度引导的汽轮机输出功率预测方法,包括:采集汽轮机和凝汽器原始数据,并划分成历史数据序列、被预测节点的汽轮机数据和凝汽器数据;采用编码器‑解码器框架,并额外提出一个连接模块;在编码器中采用LSTM网络编码凝汽器工况信息并预测真空度,并将真空度的信息编码到隐状态表示中;在连接模块,通过注意机制和CNN分别捕捉编码器局部和全局真空信息;在解码器中,将编码器包含的真空度信息隐状态和细胞状态用于初始化,并将局部、全局真空信息、汽轮机的工况信息作为解码器的输入进行编码并预测汽轮机输出功率,直至MSE损失函数收敛,完成网络训练。通过训练好的网络对汽轮机输出功率进行预测。