-
公开(公告)号:CN118747526A
公开(公告)日:2024-10-08
申请号:CN202410763060.2
申请日:2024-06-13
申请人: 中国科学院自动化研究所 , 国家电网有限公司客户服务中心 , 国网浙江省电力有限公司营销服务中心 , 中国电力科学研究院有限公司
IPC分类号: G06N5/022 , G06F18/213 , G06F40/268 , G06F40/20 , G06F16/35
摘要: 本发明提供一种基于增强提示的可控回复生成方法、装置及存储介质。该基于增强提示的可控回复生成方法包括:获取多轮对话历史文本;对所述多轮对话历史文本进行词级别的文本特征提取,获得词级别文本特征;基于所述词级别文本特征和大语言模型生成回复。本发明提供的基于增强提示的可控回复生成方法、装置及存储介质,对多轮对话历史进行词级别的文本特征提取,基于这些词级文本特征利用大语言模型可以生成上下文一致的回复,提高生成回复的情感属性控制准确率,使回复能够符合预定义控制属性要求,从而提升用户体验。
-
公开(公告)号:CN117828099A
公开(公告)日:2024-04-05
申请号:CN202311868562.3
申请日:2023-12-29
申请人: 中国电力科学研究院有限公司
IPC分类号: G06F16/36 , G06F16/33 , G06F40/211 , G06F40/279
摘要: 本申请涉及一种基于大型语言模型的电力数据信息抽取方法和装置,包括根据目标句子、预设的电力信息抽取提示模板和选定的语言模型,得到信息抽取结果,通过结果验证提示模板和语言模型得到信息抽取结果中的待验证实体是否是一个实体的验证结果,将待验证实体则加入候选集集合并更新至电力知识库,并以Json格式输出目标句子的信息抽取结果。本申请解决了传统信息抽取对数据的依赖、上下文信息利用不充分等问题;提高大型语言模型的抽取能力,同时可以将未存在知识库的实体保存到知识库中,也解决了传统信息抽取需要大量标注数据的问题,同时提高信息抽取的泛化性能和实用性。本申请还涉及一种计算机设备和存储介质。
-
公开(公告)号:CN117370577A
公开(公告)日:2024-01-09
申请号:CN202311346828.8
申请日:2023-10-17
申请人: 中国电力科学研究院有限公司
IPC分类号: G06F16/36 , G06F40/30 , G06F40/211 , G06F16/332
摘要: 本申请提供了一种语义大模型内容生成方法、装置、电子设备和存储介质,应用于计算机技术领域。所述方法包括对预设电力领域知识库或预设知识图谱的文本进行分割,得到各子文本;对所述子文本进行转化,得到对应的第一数值向量;对提问文本进行转化,得到对应的第二数值向量;根据所述第二数值向量,在各所述第一数值向量中检索出目标数值向量;根据所述目标数值向量对应的子文本,得到目标上下文;将所述提问文本、目标上下文发送至预设语义大模型,生成目标内容。提高对内容生成的准确性。
-
公开(公告)号:CN117556016A
公开(公告)日:2024-02-13
申请号:CN202311596284.0
申请日:2023-11-27
申请人: 中国电力科学研究院有限公司
IPC分类号: G06F16/332 , G06F16/33 , G06F16/36 , G06F40/30 , G06N5/022
摘要: 本申请涉及一种基于语义与结构采样策略的实体对齐方法,包括将选择的未标注实体的上一次迭代得到的边界不确定性数值和未标记实体链接的其他实体的上一次迭代的边界不确定性数值迭代计算,得到未标记实体的边界不确定性的数值,根据未标记实体的边界不确定性的数值,选择标注实体标注并更新标记数据集,利用更新后标记数据集实体对齐模型训练,重复上述步骤,直到实体对齐模型满足预设训练结果。本申请优先标注对知识图谱融合更有价值的数据,更新语义表征模型和实体对齐模型,提升采样策略的效果,不断迭代上述过程,在有限的预算下,可以实现更好的实体对齐效果。本申请还涉及一种基于语义与结构采样策略的实体对齐装置、设备和存储介质。
-
公开(公告)号:CN117034934A
公开(公告)日:2023-11-10
申请号:CN202311002054.7
申请日:2023-08-09
申请人: 中国电力科学研究院有限公司
IPC分类号: G06F40/295 , G06F40/30 , G06F18/25 , G06V10/80 , G06V30/19 , G06V10/82 , G06N3/0442 , G06N3/045
摘要: 本发明属于多模态命名实体识别领域,具体涉及电力设备多模态命名实体识别方法、系统、设备及介质,本发明采用共现实体方法获取在文本和图像中都出现过的实体,既能确保文本和图像匹配也能减少图像噪声;通过提取实体三元组进而采用实体辅助方法既可以补充语义信息又可以减少语义消歧。本发明采用了共现实体和提取三元组的实体辅助方法,有助于提高多模态命名实体识别精度,准确识别图像或文本中存在的实体,尤其在图文关联度更高的数据中表现更优。同时,本发明不限于在电力设备方面,可构建其它领域知识库拓展到其它领域进行多模态命名实体识别。
-
公开(公告)号:CN118643864A
公开(公告)日:2024-09-13
申请号:CN202410829126.3
申请日:2024-06-25
申请人: 中国电力科学研究院有限公司 , 国家电网有限公司
IPC分类号: G06N3/0442 , G06N3/006 , G06N3/084 , G06N3/0985 , G06N3/0455 , G06Q50/06
摘要: 本发明属于文本数据检测技术领域,公开了一种面向电力智能客服的文本数据检测方法及相关装置;其中,所述文本数据检测方法包括:获取待检测的文本数据;利用预先训练好的文本数据检测模型对待检测的文本数据进行检测,获得预测出的对话摘要数据;其中,文本数据检测模型采用序列到序列模型,且序列到序列模型中的编码器和解码器采用双向长短期记忆神经网络;双向长短期记忆神经网络的学习率和隐含层神经元个数超参数组合经优化算法优化获得。本发明将序列到序列模型中的循环神经网络改进为双向长短期记忆神经网络,防止了文本序列中的重要特征信息被遗忘;对超参数组合进行优化,提升了序列到序列模型对文本特征的检测精度。
-
公开(公告)号:CN118396642A
公开(公告)日:2024-07-26
申请号:CN202410449850.3
申请日:2024-04-15
申请人: 中国电力科学研究院有限公司 , 国网福建省电力有限公司电力科学研究院 , 国网福建省电力有限公司 , 国家电网有限公司
IPC分类号: G06Q30/018 , G06Q10/20 , G06Q50/06 , G06N5/022
摘要: 本发明属于电力自动化领域,公开了一种电力设备故障溯源方法、系统、计算机设备及存储介质,包括:获取电力设备故障描述并进行实体识别,得到电力设备实体和故障实体;根据电力设备实体和故障实体,从电力设备故障知识图谱库中选取若干子图;将若干子图中的所有节点进行社区划分得到若干社区,并遍历各社区,计算社区内任意两节点的实体相关度,并将各节点与其实体相关度前N大的节点之间的边作为增强边;其中,N为预设常数;融合若干子图和增强边,得到增强知识图谱;根据增强知识图谱,调用预训练的电力设备故障溯源模型,得到故障原因。通过对知识图谱的有效增强,有效克服单一图谱数据不完备及语义关联性缺失等问题,提升数据的完备性,然后基于增强知识图谱进行故障原因溯源,实现对电力设备故障原因的准确溯源。
-
-
-
-
-
-