-
公开(公告)号:CN113780012B
公开(公告)日:2023-12-29
申请号:CN202111165245.6
申请日:2021-09-30
Applicant: 东南大学
IPC: G06F16/332 , G06F16/35 , G06F18/2415 , G06N3/0442 , G06N3/0455 , G06N3/084 , G16H20/70 , G06F40/35
Abstract: 本发明公开了基于预训练语言模型的抑郁症访谈对话生成方法,包括通过固定问题采集用户的基本信息;按策略抽取预设问题库中的部分问题,构建向用户提问的主问题流;对用户回复进行情绪极性分类,并选取相应回复句作为对用户情绪的响应;使用微调后的预训练语言模型GPT‑2,根据当前问题和用户回复,生成与用户回复相关的后续问题。本发明的系统主要包括:语音识别与合成模块、预设问题库、主问题流构建模块、情绪分类与响应模块和后续问题生成模块。本发明相较于之前完全使用固定模板的对话生成方法,微调后的预训练语言模型能生成更灵活的后续问题,可以进行更有效的抑郁诊断访谈,因而具有更好的效果。
-
公开(公告)号:CN116776893A
公开(公告)日:2023-09-19
申请号:CN202310784012.7
申请日:2023-06-29
Applicant: 东南大学
IPC: G06F40/30 , G06F16/242 , G06F16/2452 , G06N3/042 , G06N3/047 , G06N3/048 , G06N3/0442 , G06N3/08
Abstract: 本发明公开了一种基于分层特征解耦的NL2SQL方法和系统,首先构建形如(查询问题的自然语言描述,SQL查询语句,对应的数据库模式)的三元组组成的NL2SQL数据集;再构建NL2SQL模型,所述NL2SQL模型由输入模块、语义表示模块、子句特征解耦模块、子任务特征解耦模块、子任务预测模块和SQL查询语句输出模块组成,依次构建上述模块,实现NL2SQL任务;最后设置训练参数、构造损失函数,对NL2SQL模型进行训练,实现NL2SQL任务。
-
公开(公告)号:CN116775859A
公开(公告)日:2023-09-19
申请号:CN202310784055.5
申请日:2023-06-29
Applicant: 东南大学
IPC: G06F16/34 , G06F40/186 , G06N3/0895 , G06N3/088 , G06N3/0442 , G06N3/0455
Abstract: 本发明公开了一种基于反模版解耦的无监督意见摘要生成方法及系统,首先构建并训练意见摘要的反模板生成模型,利用对比学习和变分自编码器,将意见作为监督信号,得到意见的表示,取若干意见表示的平均进行解码,初步得到意见的反模版;再构建解耦文本表示意见摘要生成模型,将意见摘要的表示解耦成内容、模板两部分,得到内容的表示向量;最后训练无监督的意见摘要模型,将内容表示向量输入无监督的意见摘要模型的解码器中,通过解码器重构原始文本,完成意见摘要的生成。本方法通过在文本信息中训练生成文本表示的“反模版”表示,利用正交解耦的方式来去除文本表示中的模版信息,从而减少冗余信息,摘要生成更加准确,工作效率更高。
-
公开(公告)号:CN111125520B
公开(公告)日:2023-04-21
申请号:CN201911270225.8
申请日:2019-12-11
Applicant: 东南大学
IPC: G06F16/9535 , G06F40/295
Abstract: 本发明公开了一种面向新闻文本的基于深度聚类模型的事件线抽取方法,包括:新闻文本预处理;文本的初始隐事件表示预训练;按照发布时间对语料中新闻文本进行分组;基于深度聚类模型确定各组中每条新闻所属的事件线;对各组中事件线编号相同的事件元素进行后处理,得到事件的结构化展示;对各组抽取出的具有相同事件线编号的事件进行后处理得到事件线。本发明采用神经网络模型自动抽取文本中隐含的事件特征,避免了手动选取和构建特征,并且抽取得到的文本的隐含事件特征能够为下游应用提供支持;能够同时进行事件特征抽取和事件线提取,减少了误差传播的可能性。相比于以往的事件线抽取方法,本发明具有更高的抽取准确率与召回率。
-
公开(公告)号:CN114819354A
公开(公告)日:2022-07-29
申请号:CN202210464493.9
申请日:2022-04-29
Applicant: 江苏方天电力技术有限公司 , 东南大学
Abstract: 本发明公开了一种基于残差记忆网络的凝汽器真空度预测方法,包括:采集凝汽器相关的原始数据,对每一组原始数据划分成历史数据序列、被预测节点工况数据和被预测节点凝汽器真空度数据;利用长短时记忆网络将历史数据编码存入端到端残差记忆网络的记忆池中,将被预测节点工况数据编码作为端到端残差记忆网络的输入,将被预测节点凝汽器真空度数据作为端到端残差记忆网络的目标输出,训练端到端残差记忆网络,直至MSE损失函数收敛,完成对端到端残差记忆网络的训练;实时采集凝汽器相关的原始数据,输入训练好的端到端残差记忆网络中,预测出凝汽器真空度。本发明方法能够捕获历史数据中隐含的周期性特征、时序特征,具有更高的预测精度和稳定性。
-
公开(公告)号:CN110059190A
公开(公告)日:2019-07-26
申请号:CN201910312836.8
申请日:2019-04-18
Applicant: 东南大学
Abstract: 本发明公开了一种基于社交媒体内容和结构的用户实时观点检测方法,该方法主要包括:基于微博API和哈希标签实时地爬取事件相关的微博以及微博作者的社交网络信息;基于微博文本和用户的社交网络信息,利用哈希标签和远程监督技术生成训练数据;基于动态神经网络模型训练,完成用户级别的动态观点检测。本发明不需要大量标注语料,可以预测用户在下个时间段的关于某一主题的立场,得益于循环神经网络对用户行为的模拟,有着更高的准确率;可以在用户语料缺失的情况下利用社交网络信息预测用户观点;可以在获得新的微博数据,动态地在已训练好的动态神经网络上进行迭代,避免了从头开始训练费时的问题。
-
公开(公告)号:CN111325027B
公开(公告)日:2023-04-28
申请号:CN202010102417.4
申请日:2020-02-19
Applicant: 东南大学
IPC: G06F40/289 , G06F40/30 , G06N3/0442 , G06N3/0455 , G06N3/048 , G06N3/047 , G06N3/08
Abstract: 本发明公开了一种面向稀疏数据的个性化情感分析方法与装置,通过对具有相似打分习惯的用户分组,利用分组信息来增强用户表示,实现个性化的情感分析。本方法包括:文档预处理;使用基于深度神经网络的基础情感分析模型计算得到情感打分基础;使用基于群组的个性化分析模型计算得到情感打分偏移和波动;结合情感打分基础和情感打分偏移计算最终情感打分。本方法相比之前的个性化情感分析方法,可以在用户文本数据稀疏的情况下学习得到良好的用户表示,在个性化情感分析中,可以有效地对用户建模,更准确地进行个性化情感分析。
-
公开(公告)号:CN115809314A
公开(公告)日:2023-03-17
申请号:CN202211448380.6
申请日:2022-11-18
Applicant: 东南大学
IPC: G06F16/33 , G06F16/332 , G06F40/30 , G06F16/35 , G06N3/08 , G06N3/0442 , G06N3/04
Abstract: 本发明公开了基于双层多门控专家混合模型(MMOE)的多任务NL2SQL方法,包括以下步骤:步骤1编码层构建步骤,用于获取问题和表模式的嵌入表示;步骤2多门控循环神经网络混合层构建步骤,用于利用多门控专家混合模型,进一步提取不同类型的语义信息,步骤3多门控注意力池化混合层构建步骤,用于利用多门控专家混合模型,获取不同子任务下的问题的向量表示;步骤4子任务学习层构建步骤,用于对各项子任务进行预测;步骤5多任务NL2SQL模型训练步骤,用于构建损失函数,构建优化函数。本发明在查询匹配正确率上的提升尤为显著,说明本发明的模型对于NL2SQL的数据集有着显著的效果提升。
-
公开(公告)号:CN115796029A
公开(公告)日:2023-03-14
申请号:CN202211502427.2
申请日:2022-11-28
Applicant: 东南大学
IPC: G06F30/27 , G06F16/242 , G06F18/24 , G06N3/0442 , G06N3/08 , G06F111/08 , G06F111/04
Abstract: 本发明公开了基于显式及隐式特征解耦的NL2SQL方法,包括以下步骤:(1)构建特定子模块专家系统的步骤;(2)结合多次随机失活和专家系统步骤;(3)构建多次随机失活和专家系统专用损失函数的步骤;(4)训练不同子系统进行显式解耦步骤,包括将不同子系统之间进行分别训练;(5)构建子系统输出显式特征耦合专家系统编码模型,包括构建子系统输出显式特征耦合专家系统编码模型,用于整合不同子系统输出;(6)训练最终耦合的NL2SQL方法模型步骤,用于得到最终耦合完成的模型。本发明的实验结果,显示本发明的方法较之以往的模型在逻辑准确率方面有了很大的提升,本发明的模型对于NL2SQL任务有着显著的效果提升。
-
公开(公告)号:CN111160620B
公开(公告)日:2022-06-17
申请号:CN201911247976.8
申请日:2019-12-06
Applicant: 江苏方天电力技术有限公司 , 东南大学
Abstract: 本发明公开了一种基于端到端记忆网络的短期风电功率预测方法,包括如下步骤:采集风电场数据;将采集的风电场数据划分为历史数据、被预测多节点天气数据和功率数据,并对历史数据和被预测多节点天气数据进行归一化处理;利用多头自注意力机制模型对历史数据进行编码,将编码后的特征向量存入端到端记忆网络的记忆池;采用注意力机制对被预测多节点天气数据进行编码,并将编码结果作为端到端记忆网络的输入向量;将功率数据作为端到端记忆网络的输出向量进行端到端记忆网络的训练;使用训练好的端到端记忆网络对风机输出功率进行预测。本发明方法相比以往短期风电功率预测方法,能够关注到历史数据中隐含的信息,具有更高的预测精度和稳定性。
-
-
-
-
-
-
-
-
-