-
公开(公告)号:CN111325027B
公开(公告)日:2023-04-28
申请号:CN202010102417.4
申请日:2020-02-19
申请人: 东南大学
IPC分类号: G06F40/289 , G06F40/30 , G06N3/0442 , G06N3/0455 , G06N3/048 , G06N3/047 , G06N3/08
摘要: 本发明公开了一种面向稀疏数据的个性化情感分析方法与装置,通过对具有相似打分习惯的用户分组,利用分组信息来增强用户表示,实现个性化的情感分析。本方法包括:文档预处理;使用基于深度神经网络的基础情感分析模型计算得到情感打分基础;使用基于群组的个性化分析模型计算得到情感打分偏移和波动;结合情感打分基础和情感打分偏移计算最终情感打分。本方法相比之前的个性化情感分析方法,可以在用户文本数据稀疏的情况下学习得到良好的用户表示,在个性化情感分析中,可以有效地对用户建模,更准确地进行个性化情感分析。
-
公开(公告)号:CN115809314A
公开(公告)日:2023-03-17
申请号:CN202211448380.6
申请日:2022-11-18
申请人: 东南大学
IPC分类号: G06F16/33 , G06F16/332 , G06F40/30 , G06F16/35 , G06N3/08 , G06N3/0442 , G06N3/04
摘要: 本发明公开了基于双层多门控专家混合模型(MMOE)的多任务NL2SQL方法,包括以下步骤:步骤1编码层构建步骤,用于获取问题和表模式的嵌入表示;步骤2多门控循环神经网络混合层构建步骤,用于利用多门控专家混合模型,进一步提取不同类型的语义信息,步骤3多门控注意力池化混合层构建步骤,用于利用多门控专家混合模型,获取不同子任务下的问题的向量表示;步骤4子任务学习层构建步骤,用于对各项子任务进行预测;步骤5多任务NL2SQL模型训练步骤,用于构建损失函数,构建优化函数。本发明在查询匹配正确率上的提升尤为显著,说明本发明的模型对于NL2SQL的数据集有着显著的效果提升。
-
公开(公告)号:CN115796029A
公开(公告)日:2023-03-14
申请号:CN202211502427.2
申请日:2022-11-28
申请人: 东南大学
IPC分类号: G06F30/27 , G06F16/242 , G06F18/24 , G06N3/0442 , G06N3/08 , G06F111/08 , G06F111/04
摘要: 本发明公开了基于显式及隐式特征解耦的NL2SQL方法,包括以下步骤:(1)构建特定子模块专家系统的步骤;(2)结合多次随机失活和专家系统步骤;(3)构建多次随机失活和专家系统专用损失函数的步骤;(4)训练不同子系统进行显式解耦步骤,包括将不同子系统之间进行分别训练;(5)构建子系统输出显式特征耦合专家系统编码模型,包括构建子系统输出显式特征耦合专家系统编码模型,用于整合不同子系统输出;(6)训练最终耦合的NL2SQL方法模型步骤,用于得到最终耦合完成的模型。本发明的实验结果,显示本发明的方法较之以往的模型在逻辑准确率方面有了很大的提升,本发明的模型对于NL2SQL任务有着显著的效果提升。
-
公开(公告)号:CN111160620B
公开(公告)日:2022-06-17
申请号:CN201911247976.8
申请日:2019-12-06
申请人: 江苏方天电力技术有限公司 , 东南大学
摘要: 本发明公开了一种基于端到端记忆网络的短期风电功率预测方法,包括如下步骤:采集风电场数据;将采集的风电场数据划分为历史数据、被预测多节点天气数据和功率数据,并对历史数据和被预测多节点天气数据进行归一化处理;利用多头自注意力机制模型对历史数据进行编码,将编码后的特征向量存入端到端记忆网络的记忆池;采用注意力机制对被预测多节点天气数据进行编码,并将编码结果作为端到端记忆网络的输入向量;将功率数据作为端到端记忆网络的输出向量进行端到端记忆网络的训练;使用训练好的端到端记忆网络对风机输出功率进行预测。本发明方法相比以往短期风电功率预测方法,能够关注到历史数据中隐含的信息,具有更高的预测精度和稳定性。
-
公开(公告)号:CN112785029A
公开(公告)日:2021-05-11
申请号:CN202011221935.4
申请日:2020-11-05
申请人: 江苏方天电力技术有限公司 , 东南大学
摘要: 本发明公开了一种基于深度聚类模型的充电站用电量预测方法,包括:充电站数据的增强及预处理;基于深度聚类模型的特征映射,充电站所属簇的确定;基于最近邻算法的充电站电量预测。本发明方法使用深度神经网络同时学习充电站数据的特征表示和簇的分配,通过将数据映射到隐层特征空间,迭代地优化聚类目标和重构损失,减少了误差传播的可能性;进一步使用最近邻算法对充电站用电量进行预测。本方法相比于以往的充电站用电预测方法,能够挖掘到数据的隐含特征,缩小搜索空间,具有更高的预测精度。
-
公开(公告)号:CN111125520A
公开(公告)日:2020-05-08
申请号:CN201911270225.8
申请日:2019-12-11
申请人: 东南大学
IPC分类号: G06F16/9535 , G06F40/295
摘要: 本发明公开了一种面向新闻文本的基于深度聚类模型的事件线抽取方法,包括:新闻文本预处理;文本的初始隐事件表示预训练;按照发布时间对语料中新闻文本进行分组;基于深度聚类模型确定各组中每条新闻所属的事件线;对各组中事件线编号相同的事件元素进行后处理,得到事件的结构化展示;对各组抽取出的具有相同事件线编号的事件进行后处理得到事件线。本发明采用神经网络模型自动抽取文本中隐含的事件特征,避免了手动选取和构建特征,并且抽取得到的文本的隐含事件特征能够为下游应用提供支持;能够同时进行事件特征抽取和事件线提取,减少了误差传播的可能性。相比于以往的事件线抽取方法,本发明具有更高的抽取准确率与召回率。
-
-
公开(公告)号:CN114942937B
公开(公告)日:2024-07-19
申请号:CN202210403424.7
申请日:2022-04-18
申请人: 江苏方天电力技术有限公司 , 东南大学
IPC分类号: G06F16/242 , G06F16/2458 , G06F8/30
摘要: 本发明公开了基于限制性约束的带噪NL2SQL方法和装置,包括以下步骤:(1)NL2SQL知识库构建步骤,构造由查询问题、SQL查询语句以及表结构一一对应的数据条目,初步构建知识库;(2)带噪NL2SQL数据集构建步骤,用于根据NL2SQL知识库划分训练集、验证集以及测试集,人工引入噪声标签,构建带噪NL2SQL数据集;(3)带噪NL2SQL模型构建步骤,用于分别构建带噪子任务编码模型、无噪子任务编码模型;为了消除带噪子任务对其他任务的影响,构建限定性约束的方法缓解噪声对模型的影响;(4)带噪NL2SQL模型训练步骤,用于构建损失函数,构建优化函数。本发明的模型和最近一些先进的方法进行了比较,实验结果显示本发明的方法较之有了很大的提升。
-
公开(公告)号:CN116776885A
公开(公告)日:2023-09-19
申请号:CN202310784041.3
申请日:2023-06-29
申请人: 东南大学
IPC分类号: G06F40/295 , G06F16/35 , G06F18/214 , G06F18/241 , G06N3/0499 , G06N3/08 , G06N3/047
摘要: 本发明公开了一种基于三阶段的小样本嵌套命名实体识别方法和系统,首先根据原始嵌套NER数据集采样,保证每种类别采样得到的实体数量一致,初步构建嵌套NER小样本数据集;再从原始嵌套NER数据集的训练集、验证集以及测试集中分别采样K个实体实例,得到嵌套NER小样本训练数据集、验证集以及测试集;再构建嵌套NER模型,分别构建实体定位子模型、实体抽取子模型以及实体分类子模型,捕捉内层实体和外层实体的嵌套关系,构建特殊的软提示模板;最后训练嵌套NER模型,更好的支持小样本场景下的模型训练。
-
公开(公告)号:CN115455698A
公开(公告)日:2022-12-09
申请号:CN202211121409.X
申请日:2022-09-15
申请人: 江苏方天电力技术有限公司 , 东南大学
摘要: 一种基于真空度引导的汽轮机输出功率预测方法,包括:采集汽轮机和凝汽器原始数据,并划分成历史数据序列、被预测节点的汽轮机数据和凝汽器数据;采用编码器‑解码器框架,并额外提出一个连接模块;在编码器中采用LSTM网络编码凝汽器工况信息并预测真空度,并将真空度的信息编码到隐状态表示中;在连接模块,通过注意机制和CNN分别捕捉编码器局部和全局真空信息;在解码器中,将编码器包含的真空度信息隐状态和细胞状态用于初始化,并将局部、全局真空信息、汽轮机的工况信息作为解码器的输入进行编码并预测汽轮机输出功率,直至MSE损失函数收敛,完成网络训练。通过训练好的网络对汽轮机输出功率进行预测。
-
-
-
-
-
-
-
-
-