-
公开(公告)号:CN117033608B
公开(公告)日:2023-12-22
申请号:CN202311266604.6
申请日:2023-09-28
Applicant: 中国电子科技集团公司第十研究所
IPC: G06F16/332 , G06F16/36 , G06N5/022
Abstract: 本发明公开了一种基于大语言模型的知识图谱生成式问答方法及系统,所述方法包括:构建大语言模型微调训练数据,训练数据包括提示语句、问题集和答案集;其中,提示语句包括提示模版和实例数据;基于LoRA微调大语言模型;通过子图检索策略为经LoRA微调后的大语言模型提供问答知识库;将经LoRA微调后的大语言模型作为问答推理模型,将问题文本输入问答推理模型,问答推理模型基于提供的问答知识库,生成问题答案。本发明的大模型不再仅根据问题文本生成答案,而是将图谱信息与问题共同构建为模型提示语句,生成问题答案,从而保证答案更准确、可溯源。(56)对比文件Guangyu Wang 等.ClinicalGPT: LargeLanguage Models Finetuned with DiverseMedical Data and ComprehensiveEvaluation.https://doi.org/10.48550/arXiv.2306.09968.2023,1-11.
-
公开(公告)号:CN115510180A
公开(公告)日:2022-12-23
申请号:CN202211206614.6
申请日:2022-09-30
Applicant: 中国电子科技集团公司第十研究所
Abstract: 本发明提供一种面向多领域的复杂事件要素抽取方法,属于信息抽取技术领域,解决了传统要素抽取模型应用领域单一,对复杂事件的抽取能力不足的问题;包括要素抽取模型的构建部分和要素抽取模型的应用部分;其中构建部分,根据事件要素标签体系,形成事件要素数据集,使用事件要素数据集,对预训练语言模型进行要素抽取任务的迭代训练,训练完成后即得到要素抽取模型;应用部分,将训练完成的要素抽取模型面向多领域进行应用,对多领域文本语料进行事件检测,得到事件句数据,使用要素抽取模型进行要素抽取工作,对要素抽取工作的结果进行确认后,开展要素抽取模型的增量优化训练;本发明能够实现模型的跨域迁移应用和复杂事件的要素抽取。
-
公开(公告)号:CN119783804A
公开(公告)日:2025-04-08
申请号:CN202411732275.4
申请日:2024-11-29
Applicant: 中国电子科技集团公司第十研究所
Abstract: 本发明公开了一种基于大语言模型引导图构建的事件因果关系识别装置及方法,属于自然语言处理领域,包括:大语言模型选择事件图模块、事件关系图简化模块和事件关系图节点表征模块;大语言模型选择事件图模块,用于利用大语言模型所包含的隐性知识,从事件句集合中筛选出与目标事件相关的其他事件,构建事件候选集;事件关系图简化模块,用于通过对事件关系图进行简化,减少图中无关事件的噪声传递;事件关系图节点表征与关系预测模块,用于通过自注意力机制计算图网络中任一节点对其他节点的影响。本发明提升了因果事件判断的全面性、准确性和处理的时效性。
-
公开(公告)号:CN119886301A
公开(公告)日:2025-04-25
申请号:CN202411897809.9
申请日:2024-12-23
Applicant: 中国电子科技集团公司第十研究所
IPC: G06N5/022 , G06F16/35 , G06F16/335 , G06F40/289
Abstract: 本发明公开了一种面向多领域的热点事件演绎模式挖掘装置及方法,属于自然语言处理领域,包括:底图构建模块、报文识别模块、事件提取模块、脉络梳理模块和模式生成模块,底图构建模块构建关注热点事件的历史演绎模式图作为模式挖掘的基础,报文识别模块从海量文本素材中筛选出关注主题下的新闻文本素材,事件提取模块将新闻文本素材中的事件句信息抽取出来,脉络梳理模块将相关事件句梳理形成模式发展脉络,模式生成模块实现热点事件演绎模式的挖掘。本发明直观的展示了关注热点事件的发展和演变情况,从而实现了关注热点事件演绎模式的挖掘。
-
公开(公告)号:CN118133028B
公开(公告)日:2024-07-30
申请号:CN202410558199.3
申请日:2024-05-08
Applicant: 中国电子科技集团公司第十研究所
IPC: G06F18/214 , G06F18/10 , G06F18/2321 , G06V10/774 , G06V10/82 , G06V10/762 , G06N3/0455 , G06N3/084 , G06N3/0895
Abstract: 本发明公开了一种面向非对称跨域多模态数据的协同处理方法,包括:S1:根据设定类别获取不同模态的数据;S2:对不同模态的数据进行自增强和互增强操作,得到扩增后的跨模态样本数据;S3:构建异质跨模态数据表示学习模型,采用自监督对比表征方式对模型进行训练;S4:根据模型输出的特征向量,在本征对比空间进行聚类,将同一实例的跨模态数据进行关联,得到关联对;S5:基于关联好的跨模态数据,融合专家判别反馈,对异质跨模态数据表示学习模型进行优化训练。本发明通过异质跨模态数据的自增强和互增强,解决了当下数据困境的问题,同时对模型进行反馈优化训练,实现多模态特征层的度量和运算,提高了模型输出结果的准确性。
-
公开(公告)号:CN117033608A
公开(公告)日:2023-11-10
申请号:CN202311266604.6
申请日:2023-09-28
Applicant: 中国电子科技集团公司第十研究所
IPC: G06F16/332 , G06F16/36 , G06N5/022
Abstract: 本发明公开了一种基于大语言模型的知识图谱生成式问答方法及系统,所述方法包括:构建大语言模型微调训练数据,训练数据包括提示语句、问题集和答案集;其中,提示语句包括提示模版和实例数据;基于LoRA微调大语言模型;通过子图检索策略为经LoRA微调后的大语言模型提供问答知识库;将经LoRA微调后的大语言模型作为问答推理模型,将问题文本输入问答推理模型,问答推理模型基于提供的问答知识库,生成问题答案。本发明的大模型不再仅根据问题文本生成答案,而是将图谱信息与问题共同构建为模型提示语句,生成问题答案,从而保证答案更准确、可溯源。
-
公开(公告)号:CN118133028A
公开(公告)日:2024-06-04
申请号:CN202410558199.3
申请日:2024-05-08
Applicant: 中国电子科技集团公司第十研究所
IPC: G06F18/214 , G06F18/10 , G06F18/2321 , G06V10/774 , G06V10/82 , G06V10/762 , G06N3/0455 , G06N3/084 , G06N3/0895
Abstract: 本发明公开了一种面向非对称跨域多模态数据的协同处理方法,包括:S1:根据设定类别获取不同模态的数据;S2:对不同模态的数据进行自增强和互增强操作,得到扩增后的跨模态样本数据;S3:构建异质跨模态数据表示学习模型,采用自监督对比表征方式对模型进行训练;S4:根据模型输出的特征向量,在本征对比空间进行聚类,将同一实例的跨模态数据进行关联,得到关联对;S5:基于关联好的跨模态数据,融合专家判别反馈,对异质跨模态数据表示学习模型进行优化训练。本发明通过异质跨模态数据的自增强和互增强,解决了当下数据困境的问题,同时对模型进行反馈优化训练,实现多模态特征层的度量和运算,提高了模型输出结果的准确性。
-
-
-
-
-
-