-
公开(公告)号:CN112633852B
公开(公告)日:2023-06-16
申请号:CN202011624108.X
申请日:2020-12-30
Applicant: 广东电网有限责任公司电力调度控制中心
IPC: G06Q10/10 , G06F40/216 , G06F40/232 , G06F40/279 , G06V30/146 , G06V30/19
Abstract: 本发明公开了一种业务文档的审查系统,通过新词发现模块将从待审查文档中确定并剔除专业新词,得到剔除后的文档,通过错别字纠正模块纠正所述剔除后的文档中的错误文本部分,得到纠正后的文档,通过第三方单位实体从所述纠正后的文档中识别并剔除外协单位,得到二次剔除后的文档,通过识别所述二次剔除后的文档中的图像信息,得到解析后的文档,以及通过查重模块利用相似度评分规则,对所述解析后的文档进行相似度评分。从而提高业务文档审查的效率,提高审查的信息化和数字化程度。
-
公开(公告)号:CN112633852A
公开(公告)日:2021-04-09
申请号:CN202011624108.X
申请日:2020-12-30
Applicant: 广东电网有限责任公司电力调度控制中心
IPC: G06Q10/10 , G06F40/216 , G06F40/232 , G06F40/279 , G06K9/32 , G06K9/62
Abstract: 本发明公开了一种业务文档的审查系统,通过新词发现模块将从待审查文档中确定并剔除专业新词,得到剔除后的文档,通过错别字纠正模块纠正所述剔除后的文档中的错误文本部分,得到纠正后的文档,通过第三方单位实体从所述纠正后的文档中识别并剔除外协单位,得到二次剔除后的文档,通过识别所述二次剔除后的文档中的图像信息,得到解析后的文档,以及通过查重模块利用相似度评分规则,对所述解析后的文档进行相似度评分。从而提高业务文档审查的效率,提高审查的信息化和数字化程度。
-