-
公开(公告)号:CN118313365A
公开(公告)日:2024-07-09
申请号:CN202410393584.7
申请日:2024-04-01
申请人: 国网江苏省电力有限公司信息通信分公司
IPC分类号: G06F40/194 , G06F40/289 , G06F40/205 , G06F40/216 , G06F16/35 , G06F18/22 , G06N3/04 , G06N3/084 , G06N3/0455
摘要: 一种基于自然语言处理的配网项目查重方法,步骤包括:(一)项目名称查重阶段:101)采用分词工具将项目名称进行分词;102)采用自然语言处理算法进行查重,若查重结果大于设定的阈值,则进入项目建议书/可行性研究报告查重复核阶段;(二)项目建议书/可行性研究报告查重复核阶段:201)采用解析提取算法从文档中提取出需参与查重的关键内容;202)采用自然语言处理算法进行查重计算,若查重结果大于设定的阈值,则判定为疑似重复,产生预警数据。通过本方法提升配网项目查重效果,为配网项目的申请等相关工作提供有效的参考以避免重复申请、重复研究的现象发生,以尽可能地利用现有的资源全面提升项目研究的质量。