-
公开(公告)号:CN119625748A
公开(公告)日:2025-03-14
申请号:CN202411299562.0
申请日:2024-09-18
Applicant: 国家电网有限公司 , 北京科东电力控制系统有限责任公司 , 国网辽宁省电力有限公司
Abstract: 本发明公开了一种基于图像识别技术的电力标准结构化方法,通过对电力标准PDF文件OCR文字提取,获取电力标准文件的所有文字。再通过OCR自愈机制提升模型识别电力标准文件的所有文字的准确率,获取精确的电力标准文件的所有文字,再提取电力标准元信息,然后进行电力标准正文内容条目化;通过深入研究电力标准文件的存储形式和特点,结合图像识别、自然语言处理等技术,实现对电力标准文件的精准识别、内容提取和结构化存储,为电力行业的信息化建设和高效运作提供有力支持。
-
公开(公告)号:CN120011531A
公开(公告)日:2025-05-16
申请号:CN202411923906.0
申请日:2024-12-25
Applicant: 国家电网有限公司 , 北京科东电力控制系统有限责任公司 , 国网电力科学研究院有限公司
IPC: G06F16/334 , G06F16/35 , G06F16/338 , G06F18/22 , G06F40/289 , G06F40/216
Abstract: 本发明公开了一种基于词族推荐的调控检索系统及方法,其中,该系统包括:获取模块,用于得到预处理后的电力领域的文本数据;构建模块,用于基于词频对所述电力领域词库进行分类,得到电力领域专业词库;解析模块,用于根据主题描述构建电力领域词族;映射模块,用于根据业务标签对电力领域词族进行扩展,得到具有业务指向性的电力领域词族;检索模块,用于根据补充后的检索语句进行检索,得到初始检索结果;排序模块,用于根据所述排列顺序确定检索结果。其利用预训练语言模型和聚类算法进行电力领域知识挖掘和语义理解,实现对电力领域知识的智能化检索和业务信息的有效匹配,增强了电力调度系统的稳定性与安全性。
-