-
公开(公告)号:CN119761303A
公开(公告)日:2025-04-04
申请号:CN202411806487.2
申请日:2024-12-10
Applicant: 国网四川省电力公司
Inventor: 李金龙 , 王彦沣 , 叶希 , 朱童 , 李旻 , 周剑 , 高剑 , 袁贵川 , 路轶 , 张才斌 , 胡晓通 , 廖斌杰 , 郭亮 , 唐伦 , 黄格超 , 欧阳雪彤 , 李甘 , 胡鑫 , 李春艳 , 申萌均 , 王曦 , 范成围 , 石鹏 , 王永灿 , 白珈于 , 李成 , 张棣 , 雷晓红 , 谭明亮 , 冯琪 , 李亚军
IPC: G06F40/103 , G06F40/258 , G06N5/025
Abstract: 本发明公开了一种稳定规程规则化抽取方法、装置及存储介质,包括以下步骤:文档预处理;将稳定规程文件转换为指定格式的文件;表格识别与标题匹配;识别表格内容以及识别表格中表头包含的内容;根据表格信息与预设标题模板,匹配表格对应的标题内容;按照业务字段需求构建提示工程,根据限定字段抽取实际对应的实体内容;融合规则抽取与大模型抽取的结果,最终实现稳定规定断面限额的自动录入并关联设备模型。本发明提供一种融合规则化与大模型的信息抽取方法,以解决现有断面限额人工录入电子化技术的缺点。通过规则化限定专业领域名词范围,融合电力规则化能力与大模型抽取能力,实现无需大量人工干预的智能化信息抽取能力。