-
公开(公告)号:CN115035541B
公开(公告)日:2025-03-14
申请号:CN202210735421.3
申请日:2022-06-27
Applicant: 中核核电运行管理有限公司
IPC: G06V30/422 , G06V30/14 , G06V30/148
Abstract: 本发明提供了一种大尺寸复杂pdf工程图纸文本检测与识别方法,包括以下步骤:步骤S1:预处理pdf工程图纸,生成对应的高分辨率图像;步骤S2:将高分辨率图像切割为若干低分辨率的子图,并根据位置记录子图对应顺序;步骤S3:进行第一次子图文本检测,初步定位子图中的文本区域范围,输出范围对应的位置坐标;步骤S4:将子图中的文本区域位置坐标映射到原大图中,去除其中的重复数据,并根据去重后的位置坐标获取对应文本区域图像;步骤S5:进行第二次文本检测,精确定位文本区域中的文本,并裁剪对应的文本块;步骤S6:对文本块进行文本识别,提取文本块中的文本内容,以及对应的坐标位置。本发明提供的方法提高了复杂图纸的文本识别准确率。
-
公开(公告)号:CN116304726A
公开(公告)日:2023-06-23
申请号:CN202211092796.9
申请日:2022-09-08
Applicant: 中核核电运行管理有限公司
IPC: G06F18/22 , G06N5/02 , G06F40/284 , G06F40/166 , G06Q10/0875
Abstract: 本发明提供了一种基于语义库和知识图谱的物资相似性分析方法,包括以下步骤:S1:判断两个物资的决定性属性是否相似,若其中任一个决定性属性不相似,则两个物资为非重码物资,否则进入S2;S2:根据非决定性属性权重及每个字段的距离计算字段部分的相似度;S3:结合所有知识图谱路径和权重值计算图谱部分的相似度;S4:将字段部分的相似度和图谱部分的相似度相加获得最终物资相似度,通过最终物资相似度判断两个物资是否为高相似度。本发明提供的物资相似性分析方法优化相似度算法的准确性。
-
公开(公告)号:CN115035541A
公开(公告)日:2022-09-09
申请号:CN202210735421.3
申请日:2022-06-27
Applicant: 中核核电运行管理有限公司
IPC: G06V30/422 , G06V30/14 , G06V30/148
Abstract: 本发明提供了一种大尺寸复杂pdf工程图纸文本检测与识别方法,包括以下步骤:步骤S1:预处理pdf工程图纸,生成对应的高分辨率图像;步骤S2:将高分辨率图像切割为若干低分辨率的子图,并根据位置记录子图对应顺序;步骤S3:进行第一次子图文本检测,初步定位子图中的文本区域范围,输出范围对应的位置坐标;步骤S4:将子图中的文本区域位置坐标映射到原大图中,去除其中的重复数据,并根据去重后的位置坐标获取对应文本区域图像;步骤S5:进行第二次文本检测,精确定位文本区域中的文本,并裁剪对应的文本块;步骤S6:对文本块进行文本识别,提取文本块中的文本内容,以及对应的坐标位置。本发明提供的方法提高了复杂图纸的文本识别准确率。
-
-