-
公开(公告)号:CN118733706B
公开(公告)日:2025-01-24
申请号:CN202410838596.6
申请日:2024-06-26
Applicant: 国网智能电网研究院有限公司 , 国网江苏省电力有限公司无锡供电分公司 , 国家电网有限公司
IPC: G06F16/334 , G06F16/3331 , G06F16/332 , G06Q50/06
Abstract: 本申请涉及机器学习技术领域,提供基于检索增强的电力标准问答模型训练方法及系统。所述方法包括:基于大数据采集电力领域数据,构建电力标准文档;构建问答数据库;训练检索模型;训练答复模型;联合优化检索与答复模型,生成联合优化结果;构建初始问答模型,回溯训练并输出电力标准问答模型。本申请解决了现有电力标准问答模型采用基于规则或模板的方法,导致缺乏灵活性和泛化能力,难以应对电力标准文档的复杂性和多样性,进而在理解和解析文档时容易出现偏差或误解,使得回答不准确的技术问题,实现了基于输入文本的语义相似度,利用的问答模型,对电力标准知识的精准高效匹配,提高电力标准问答模型的准确性、专业性和可靠性的效果。
-
公开(公告)号:CN118709761A
公开(公告)日:2024-09-27
申请号:CN202410829537.2
申请日:2024-06-25
Applicant: 国网智能电网研究院有限公司 , 国网江苏省电力有限公司无锡供电分公司 , 国家电网有限公司
IPC: G06N5/022 , G06N5/04 , G06N5/045 , G06N5/01 , G06F18/241 , G06F18/243
Abstract: 本发明公开了一种基于大模型的电力标签知识分类方法及系统,涉及数据处理领域。所述方法包括:收集电力源端数据,确定有效源端数据;确定层次标签图谱,监督训练开源大模型;引入无标签标准语义库确定初始化分类模型;读取下游任务特征,进行有监督调整,确定分类大模型;接收预分类任务,进行分类决策,确定分类结果;若所述预分类任务的分类结果为空置,接收新增缺陷类型,执行类增量学习。采用本方法解决了现有技术中电力知识标签由于具有高度专业性,导致标签类别数据稀少,可解释性差的技术问题,实现了引入领域知识来增强模型的可解释性,达到对标准知识的标签分类,并用于预测和推断新的样本数据的技术效果。
-
公开(公告)号:CN118733706A
公开(公告)日:2024-10-01
申请号:CN202410838596.6
申请日:2024-06-26
Applicant: 国网智能电网研究院有限公司 , 国网江苏省电力有限公司无锡供电分公司 , 国家电网有限公司
IPC: G06F16/33 , G06F16/332 , G06Q50/06
Abstract: 本申请涉及机器学习技术领域,提供基于检索增强的电力标准问答模型训练方法及系统。所述方法包括:基于大数据采集电力领域数据,构建电力标准文档;构建问答数据库;训练检索模型;训练答复模型;联合优化检索与答复模型,生成联合优化结果;构建初始问答模型,回溯训练并输出电力标准问答模型。本申请解决了现有电力标准问答模型采用基于规则或模板的方法,导致缺乏灵活性和泛化能力,难以应对电力标准文档的复杂性和多样性,进而在理解和解析文档时容易出现偏差或误解,使得回答不准确的技术问题,实现了基于输入文本的语义相似度,利用的问答模型,对电力标准知识的精准高效匹配,提高电力标准问答模型的准确性、专业性和可靠性的效果。
-
公开(公告)号:CN118709761B
公开(公告)日:2025-02-18
申请号:CN202410829537.2
申请日:2024-06-25
Applicant: 国网智能电网研究院有限公司 , 国网江苏省电力有限公司无锡供电分公司 , 国家电网有限公司
IPC: G06N5/022 , G06N5/04 , G06N5/045 , G06N5/01 , G06F18/241 , G06F18/243
Abstract: 本发明公开了一种基于大模型的电力标签知识分类方法及系统,涉及数据处理领域。所述方法包括:收集电力源端数据,确定有效源端数据;确定层次标签图谱,监督训练开源大模型;引入无标签标准语义库确定初始化分类模型;读取下游任务特征,进行有监督调整,确定分类大模型;接收预分类任务,进行分类决策,确定分类结果;若所述预分类任务的分类结果为空置,接收新增缺陷类型,执行类增量学习。采用本方法解决了现有技术中电力知识标签由于具有高度专业性,导致标签类别数据稀少,可解释性差的技术问题,实现了引入领域知识来增强模型的可解释性,达到对标准知识的标签分类,并用于预测和推断新的样本数据的技术效果。
-
公开(公告)号:CN118607623A
公开(公告)日:2024-09-06
申请号:CN202410698148.0
申请日:2024-05-31
Applicant: 国网智能电网研究院有限公司 , 国网浙江省电力有限公司 , 国家电网有限公司
Abstract: 本发明提出了一种基于自然语言处理技术的知识图谱自动更新方法,该基于自然语言处理技术的知识图谱自动更新方法通过四个关键步骤实现:建立语义解析模型,利用知识图谱表示技术映射更新请求,智能化更新策略调整更新方式,以及通过自动化测试和验证系统进行全面验证。此外,方法还应用机器学习算法优化更新策略,以应对图谱规模扩大所带来的挑战。该方案的创新在于智能化的更新流程,利用人工智能和自然语言处理技术实现自动化更新和修正,从而降低人工干预和错误风险,提高效率和准确性,简化图谱维护过程。
-
公开(公告)号:CN119106664A
公开(公告)日:2024-12-10
申请号:CN202411108350.X
申请日:2024-08-13
Applicant: 国网智能电网研究院有限公司
IPC: G06F40/16 , G06F40/30 , G06N3/0475 , G06N3/045 , G06N3/094
Abstract: 本发明属于人工智能领域,公开了一种语义大模型增量预训练方法及相关装置,包括:获取专业领域增量训练样本、语义大模型和语义大模型预训练样本;将语义大模型作为生成器和判别器构建对抗生成网络,并基于专业领域增量训练样本和语义大模型预训练样本训练对抗生成网络;获取训练后的对抗生成网络中的生成器,得到专业领域增量预训练大模型。可有效避免语义大模型在拟合专业领域增量训练样本时发生灾难性遗忘的风险,也有效避免了模型崩溃问题。可以在专业领域的数据基础上使用较小的算力、样本和时间成本完成增量训练,可借助语义大模型本身的理解能力,更好地学习和适应专业领域的专业术语、知识结构和业务逻辑,提高在专业领域的应用效果。
-
公开(公告)号:CN119067233A
公开(公告)日:2024-12-03
申请号:CN202411034052.0
申请日:2024-07-30
Applicant: 国网智能电网研究院有限公司
IPC: G06N20/00 , G06F18/214 , G06F18/241 , G06F16/35
Abstract: 本发明属于机器学习技术领域,公开了一种专业领域文本大模型的多阶段预训练方法及相关装置;其中,所述多阶段预训练方法包括:基于获取的全量数据,采用混合随机采样的方式对待预训练的文本大模型进行预设轮次的训练,获得一次训练后的文本大模型;对全量数据进行分批次采样,并计算获得各批次采样数据对应的交叉熵损失,基于各批次采样数据对应的交叉熵损失对全量数据进行难度分类,获得各个预设难度等级的预训练数据集;基于各个预设难度等级的预训练数据集,对一次训练后的文本大模型进行由易到难的分阶段预训练,获得多阶段预训练后的专业领域文本大模型。本发明技术方案训练获得的文本大模型具有更好的测试结果以及更好的模型鲁棒性。
-
公开(公告)号:CN119131826A
公开(公告)日:2024-12-13
申请号:CN202411185184.3
申请日:2024-08-27
Applicant: 国网智能电网研究院有限公司 , 中国电力科学研究院有限公司
IPC: G06V30/416 , G06V30/412 , G06V30/14 , G06V30/19 , G06V10/82 , G06N3/0455 , G06Q50/06 , G06V30/146 , G06V30/148 , G06V30/18 , G06N3/0464
Abstract: 本发明公开一种电力知识图片内容提取方法和系统,属于电力知识提取技术领域,方法包括:获取电力知识图片;采用预先训练的电力领域内容提取模型将所述电力知识图片识别成文字信息;通过数据质量判别器对所述文字信息进行质量判断,若质量判别为优,则输出对应的格式化信息,否则将所述文字信息通过电力专家标注成对应的格式化信息。该方法的电力领域内容提取模型能快速的识别文字信息,并通过数据质量判别器对所述文字信息进行质量判断,准确性更高,处理效率更高。
-
公开(公告)号:CN117668183A
公开(公告)日:2024-03-08
申请号:CN202311617146.6
申请日:2023-11-29
Applicant: 国网智能电网研究院有限公司
IPC: G06F16/332 , G06F16/31 , G06N20/00 , G06F16/33
Abstract: 本发明涉及人工智能技术领域,公开了一种电力专用插件构建以及电力设备检索问答方法,电力专用插件构建方法包括:获取预训练模型以及训练数据;使用预训练模型初始化检索模型和重排模型;采用分步迭代优化方法基于训练数据对检索模型和重排模型进行联合训练;使用联合训练后的检索模型和重排模型构建电力专用插件。本发明采用分步迭代优化方法联合训练检索模型和重排模型,使用训练后的检索模型和重排模型构建电力专用插件构建,采用插件化的方式将该电力专用插件与大语言模型结合,实现了为大语言模型补充电力专业知识的目的,达到了将传统电力领域任务与大语言模型相结合的效果,解决了大语言模型缺乏电力领域专业知识的问题。
-
公开(公告)号:CN119150962A
公开(公告)日:2024-12-17
申请号:CN202411229090.1
申请日:2024-09-03
Applicant: 国网智能电网研究院有限公司 , 中国电力科学研究院有限公司 , 国网江苏省电力有限公司 , 国网江苏省电力有限公司南通供电分公司
IPC: G06N5/02 , G06F16/80 , G06F18/25 , G06F18/2415 , G06V30/148 , G06N3/0455 , G06N3/096
Abstract: 本发明公开一种私域半结构化知识表示方法、系统及相关装置,属于自然语言处理技术领域,方法包括:获取的表格文本序列;利用OCR或文档解析获取所述表格文本序列的Markdown形式文本序列,并利用启发式规则进行粗粒度的表格格式修正;采用预先训练的表格类别判别模型对格式修正后的表格进行类别判定,得到分类结果和类别概率;根据所述分类结果和类别概率,并利用教师模型进行表格知识蒸馏得到表格知识文本;基于模型自检的投票机制,从所述表格知识文本中投票出教师模型最认可的表格知识的最后文本表示。该方法提高了私域半结构化知识表示的完整性和准确性,对表格知识候选进行打分,增加了方法的容错,提升了鲁棒性。
-
-
-
-
-
-
-
-
-