-
公开(公告)号:CN116245139A
公开(公告)日:2023-06-09
申请号:CN202310436199.1
申请日:2023-04-23
申请人: 中国人民解放军国防科技大学
IPC分类号: G06N3/042 , G06N3/0464 , G06F18/24 , G06N3/08 , G06F16/35
摘要: 本申请公开一种图神经网络模型训练方法和装置、事件检测方法和装置、电子设备及计算机存储介质,能够提高事件检测模型的性能。图神经网络模型训练方法包括:获取训练数据集,训练数据集包括训练文本和训练文本对应的标签事件类型;进行至少一次迭代,以得到事件检测模型,迭代包括:利用第一图神经网络模型和第二图神经网络模型,分别对训练文本进行事件检测,以得到第一预测事件类型和第二预测事件类型;根据第一预测事件类型、第二预测事件类型以及标签事件类型,计算损失值;在第一预测事件类型和第二预测事件类型之间的第三差异满足预设条件的情况下,调整第一图神经网络模型和第二图神经网络模型的参数,以最小化损失值。
-
公开(公告)号:CN118569684A
公开(公告)日:2024-08-30
申请号:CN202411040195.2
申请日:2024-07-31
申请人: 中国人民解放军国防科技大学
IPC分类号: G06Q10/0637 , G06N20/00 , G06N5/04 , G06Q10/0631
摘要: 本申请公开了一种基于大语言模型的突发事件在线决策方法及系统,涉及突发事件应急管理领域,该方法通过建立离线决策模型设计构建针对大语言模型在线决策的微调训练数据集,利用在线决策微调训练数据集,采用提示工程和模型微调技术对大语言模型进行微调训练,使大语言模型获得在线决策的能力。本申请所提出的方法有效性在仿真数据和实际案例数据实验中得到了验证,实验结果显示了本申请微调的大语言模型具备了在线决策能力,可较好地满足突发事件的应急管理和处置对及时决策的要求。
-
公开(公告)号:CN118277574A
公开(公告)日:2024-07-02
申请号:CN202410712345.3
申请日:2024-06-04
申请人: 中国人民解放军国防科技大学
IPC分类号: G06F16/35 , G06F40/211 , G06F40/284 , G06F40/295 , G06F40/30 , G06N3/042 , G06N3/0464 , G06N3/0442 , G06N3/0455
摘要: 本申请公开一种事件抽取模型和军事事件类型的预测方法,事件抽取模型中输入部分的BERT编码模块和命名实体标签嵌入层将文本序列和命名实体信息转换为两个向量表示序列,而后使用Bi‑LSTM进一步融合。图卷积网络部分将句法依存关系和实体关系信息转换为输入文本的两个邻接矩阵,将关系标签嵌入后得到的两个表示张量拼接以融合两种关系,利用多层GCN中的EANU和NAEU模块学习token和关系标签的向量表示,后将各层token向量表示加权后传入输出部分。输出部分使用Softmax将token向量表示映射为事件标签的概率分布,采用加权交叉熵损失函数加强模型对正例token的预测。
-
公开(公告)号:CN117235282A
公开(公告)日:2023-12-15
申请号:CN202311252850.6
申请日:2023-09-26
申请人: 中国人民解放军国防科技大学
IPC分类号: G06F16/36 , G06F16/332
摘要: 本发明中提供了一种基于多重联邦的多域知识图谱数据敏捷管理方法,所述方法包括为领域内多个独立数据源设置域内控制节点,其中能够经由所述域内控制节点访问所述多个独立数据源中的每个独立数据源;为所述域内控制节点设置域间控制节点,其中能够经由所述域间控制节点访问所述域内控制节点;以及设置多域控制节点以实现对所述域间控制节点的统一管理。通过本发明的处理方案,提升了多域知识图谱数据的统一管理与共享交换能力。
-
公开(公告)号:CN118277574B
公开(公告)日:2024-09-03
申请号:CN202410712345.3
申请日:2024-06-04
申请人: 中国人民解放军国防科技大学
IPC分类号: G06F16/35 , G06F40/211 , G06F40/284 , G06F40/295 , G06F40/30 , G06N3/042 , G06N3/0464 , G06N3/0442 , G06N3/0455
摘要: 本申请公开一种事件抽取模型和军事事件类型的预测方法,事件抽取模型中输入部分的BERT编码模块和命名实体标签嵌入层将文本序列和命名实体信息转换为两个向量表示序列,而后使用Bi‑LSTM进一步融合。图卷积网络部分将句法依存关系和实体关系信息转换为输入文本的两个邻接矩阵,将关系标签嵌入后得到的两个表示张量拼接以融合两种关系,利用多层GCN中的EANU和NAEU模块学习token和关系标签的向量表示,后将各层token向量表示加权后传入输出部分。输出部分使用Softmax将token向量表示映射为事件标签的概率分布,采用加权交叉熵损失函数加强模型对正例token的预测。
-
公开(公告)号:CN118569214A
公开(公告)日:2024-08-30
申请号:CN202411040149.2
申请日:2024-07-31
申请人: 中国人民解放军国防科技大学
摘要: 本公开提供了一种基于大语言模型的表格‑文本数据生成方法和装置,涉及人工智能技术领域,尤其涉及自然语言处理领域和大模型领域。具体实现方案为:基于各个第一表格处理指令,各个第一表格和各个第一表格处理结果,构建第一训练数据集,第一表格处理结果为表格和描述性文本中任一个;基于各个第二表格处理指令,各个第二表格和各个第二表格处理结果,构建第二训练数据集,第二表格处理结果为描述性文本;采用第一训练数据集和第二训练数据集对第一大语言模型依次进行训练,得到表格文本数据生成模型;将目标表格处理指令和目标表格输入表格文本数据生成模型,得到目标表格处理结果,其中,目标表格处理结果为描述性文本。
-
公开(公告)号:CN116245139B
公开(公告)日:2023-07-07
申请号:CN202310436199.1
申请日:2023-04-23
申请人: 中国人民解放军国防科技大学
IPC分类号: G06N3/042 , G06N3/0464 , G06F18/24 , G06N3/08 , G06F16/35
摘要: 本申请公开一种图神经网络模型训练方法和装置、事件检测方法和装置、电子设备及计算机存储介质,能够提高事件检测模型的性能。图神经网络模型训练方法包括:获取训练数据集,训练数据集包括训练文本和训练文本对应的标签事件类型;进行至少一次迭代,以得到事件检测模型,迭代包括:利用第一图神经网络模型和第二图神经网络模型,分别对训练文本进行事件检测,以得到第一预测事件类型和第二预测事件类型;根据第一预测事件类型、第二预测事件类型以及标签事件类型,计算损失值;在第一预测事件类型和第二预测事件类型之间的第三差异满足预设条件的情况下,调整第一图神经网络模型和第二图神经网络模型的参数,以最小化损失值。
-
-
-
-
-
-