-
公开(公告)号:CN113065404B
公开(公告)日:2023-02-24
申请号:CN202110249213.8
申请日:2021-03-08
申请人: 国网河北省电力有限公司 , 国网河北省电力有限公司雄安新区供电公司
IPC分类号: G06V30/412 , G06V30/146 , G06V30/19 , G06V10/82 , G06N3/0442
摘要: 本发明属于票据文本检测领域,具体涉及一种基于等宽文字片段的内容检测系统和方法。其中系统包括,特征提取模块,用于读取独立图片并输出该独立图片的特征图;第一预测模块,用于读取特征图并输出第一候选区信息;第一输出模块,用于读取第一候选区信息并输出第一文本区域;第二预测模块,用于读取特征图并输出第二候选区信息;以及,第二输出模块,用于读取第一文本区域并使用第二候选区信息修正后输出第二文本区域。其中方法是使用具有文本核标注的独立图片组成训练集对系统中特征提取模块、第一预测模块和第二预测模块调用的深度学习神经网络进行训练;在应用阶段仅使用第一预测模块获得的第一文本区域作为系统输出。
-
公开(公告)号:CN113065550B
公开(公告)日:2022-11-11
申请号:CN202110268438.8
申请日:2021-03-12
申请人: 国网河北省电力有限公司 , 国网河北省电力有限公司雄安新区供电公司
IPC分类号: G06V20/62 , G06V30/146 , G06V10/82 , G06N3/04
摘要: 本发明属于于场景文本识别领域,涉及一种基于自注意力机制的文本识别方法,由处理器执行一卷积神经网络算法指令实现,其包括:接收包含文本内容的场景图片;使用卷积神经网络其第一卷积模块提取场景图片的第一特征图M,其自注意力机制模块将第一特征图M编码为第二特征图Matt,其第二卷积模块提取第二特征图Matt通道方向的一维特征向量F;使用卷积神经网络其第三卷积模块根据第二特征图Matt和一维特征向量F获得场景图片的文本内容识别结果;第三卷积模块包含以一维特征向量F为初始隐含层的循环卷积模块以及用于对第二特征图Matt解码并设于循环卷积模块中循环单元输出的二维注意力机制模块。该方法能够对弯曲、倾斜等不规则文本实现较好的识别。
-
公开(公告)号:CN113064978A
公开(公告)日:2021-07-02
申请号:CN202110251849.6
申请日:2021-03-08
申请人: 国网河北省电力有限公司 , 国网河北省电力有限公司雄安新区供电公司
IPC分类号: G06F16/332 , G06F16/33 , G06F40/284 , G06F40/289 , G06Q10/06 , G06Q30/02
摘要: 本发明公开了基于特征词匹配的项目工期合理性判断方法及装置,涉及自然语言处理技术领域;方法包括S1历史项目关键词抽取,处理器从历史项目内容信息文本中抽取历史项目关键词,S2构建多层级项目信息库,处理器根据历史项目关键词构建多层级项目信息库,S3项目信息库分级搜索,处理器从项目进展报告中抽取新项目关键词,将新项目关键词遍历多层级项目信息库与历史项目关键词进行分级搜索匹配并获得匹配结果,S4项目工期合理性判断,根据匹配结果判断合理性;装置包括历史项目关键词抽取模块、构建多层级项目信息库模块、项目信息库分级搜索模块和项目工期合理性判断模块;其通过步骤S1至S4等,实现了新项目工期价格合理性判断。
-
公开(公告)号:CN113159020B
公开(公告)日:2023-06-06
申请号:CN202110262362.8
申请日:2021-03-10
申请人: 国网河北省电力有限公司 , 国网河北省电力有限公司雄安新区供电公司
IPC分类号: G06V20/62 , G06V30/19 , G06V10/82 , G06N3/0464
摘要: 本发明公开了一种基于核尺度扩张的文本检测方法,涉及文本检测技术领域,尤其是一种文本检测方法,包括如下步骤:通过ResNet18网络对图片提取特征;通过FPN网络对所述ResNet18网络提取的所述特征提取深层语义信息并将提取的所述深层语义信息以及提取的所述特征进行融合产生融合特征;对所述融合特征提取不同尺度的文本中心核以及提取全局特征;利用区域权重算法对所述不同尺度的文本中心核以及所述全局特征进行区域融合得到最终的检测结果。本发明主要针对自然场景下中的复杂文本内容进行检测。通过基于分割的思想对文本预测多种核来避免常见的粘连问题,同时全局特征的使用进一步修正来生成的区域。该方法能够有效的解决复杂环境下的文本检测问题。
-
公开(公告)号:CN113159021A
公开(公告)日:2021-07-23
申请号:CN202110262508.9
申请日:2021-03-10
申请人: 国网河北省电力有限公司 , 国网河北省电力有限公司雄安新区供电公司
摘要: 本发明公开了一种基于上下文信息的文本检测方法,涉及文本检测技术领域,尤其是一种基于上下文信息的文本检测方法,包括如下步骤:输入图片,对图片进行缩放;用ResNet50网络对输入的图片进行特征提取;对ResNet50的最后四个block提取的特征进行空间上的特征融合;通过上下文模块对可能是文本的区域进行进一步加强;对每个固定大小的ROI区域特征图进行卷积操作,输出每个ROI区域是文本区域的得分、对ROI区域的修正以及修正后每个ROI区域的分割图;结合文本框的打分和全局分割图每个像素的得分重新进行打分,以确定每个预测得到的文本框的置信度。本发明设计的上下文模块借鉴了空间注意力的机制,提高了网络预测的精度;有效抑制了预测结果中假阳性预测的产生。
-
公开(公告)号:CN113159020A
公开(公告)日:2021-07-23
申请号:CN202110262362.8
申请日:2021-03-10
申请人: 国网河北省电力有限公司 , 国网河北省电力有限公司雄安新区供电公司
摘要: 本发明公开了一种基于核尺度扩张的文本检测方法,涉及文本检测技术领域,尤其是一种文本检测方法,包括如下步骤:通过ResNet18网络对图片提取特征;通过FPN网络对所述ResNet18网络提取的所述特征提取深层语义信息并将提取的所述深层语义信息以及提取的所述特征进行融合产生融合特征;对所述融合特征提取不同尺度的文本中心核以及提取全局特征;利用区域权重算法对所述不同尺度的文本中心核以及所述全局特征进行区域融合得到最终的检测结果。本发明主要针对自然场景下中的复杂文本内容进行检测。通过基于分割的思想对文本预测多种核来避免常见的粘连问题,同时全局特征的使用进一步修正来生成的区域。该方法能够有效的解决复杂环境下的文本检测问题。
-
公开(公告)号:CN113065550A
公开(公告)日:2021-07-02
申请号:CN202110268438.8
申请日:2021-03-12
申请人: 国网河北省电力有限公司 , 国网河北省电力有限公司雄安新区供电公司
摘要: 本发明属于于场景文本识别领域,涉及一种基于自注意力机制的文本识别方法,由处理器执行一卷积神经网络算法指令实现,其包括:接收包含文本内容的场景图片;使用卷积神经网络其第一卷积模块提取场景图片的第一特征图M,其自注意力机制模块将第一特征图M编码为第二特征图Matt,其第二卷积模块提取第二特征图Matt通道方向的一维特征向量F;使用卷积神经网络其第三卷积模块根据第二特征图Matt和一维特征向量F获得场景图片的文本内容识别结果;第三卷积模块包含以一维特征向量F为初始隐含层的循环卷积模块以及用于对第二特征图Matt解码并设于循环卷积模块中循环单元输出的二维注意力机制模块。该方法能够对弯曲、倾斜等不规则文本实现较好的识别。
-
公开(公告)号:CN113065549A
公开(公告)日:2021-07-02
申请号:CN202110266211.X
申请日:2021-03-09
申请人: 国网河北省电力有限公司 , 国网河北省电力有限公司雄安新区供电公司
摘要: 本发明公开了基于深度学习的文档信息抽取方法及装置,涉及文档信息抽取技术领域;方法包括S1文本检测,处理器获取共享特征向量X的文字区域特征向量;S2文本识别,获取基于文字区域特征向量的注意力图;S3视觉协作机制,根据共享特征向量X的文字区域特征向量获取视觉特征并发送至信息抽取模块;S4语义协作机制,根据基于共享特征向量X的注意力图获取语义特征并发送至信息抽取模块;S5信息抽取,根据视觉特征和语义特征从共享特征向量X中抽取信息;装置包括文本检测模块、文本识别模块、视觉协作机制模块、语义协作机制模块和信息抽取模块共五个程序模块;其通过步骤S1至步骤S5等,实现了从文档图片中检测识别和信息提取。
-
公开(公告)号:CN113065406A
公开(公告)日:2021-07-02
申请号:CN202110249694.2
申请日:2021-03-08
申请人: 国网河北省电力有限公司 , 国网河北省电力有限公司雄安新区供电公司
摘要: 本发明公开了一种基于编解码结构识别发票文本的报账智能平台,涉及财务报账平台技术领域;其包括图片生成器和终端以及文本图片特征提取模块、卷积神经网络特征编码模块和门控循环神经网络序列解码模块,文本图片特征提取模块,用于第一卷积神经网络对制式图片特征提取并获得三维特征向量矩阵F;卷积神经网络特征编码模块,用于第二卷积神经网络将三维特征向量矩阵F转换为可供门控循环神经网络序列解码输入的待解码特征向量G;门控循环神经网络序列解码模块,用于门控循环神经网络将待解码特征向量G解码并获得发票文本图片中对应的文字;其通过图片生成器和终端以及上述程序模块等,实现了财务报账平台识别发票图片中的长文本。
-
公开(公告)号:CN113065404A
公开(公告)日:2021-07-02
申请号:CN202110249213.8
申请日:2021-03-08
申请人: 国网河北省电力有限公司 , 国网河北省电力有限公司雄安新区供电公司
摘要: 本发明属于票据文本检测领域,具体涉及一种基于等宽文字片段的内容检测系统和方法。其中系统包括,特征提取模块,用于读取独立图片并输出该独立图片的特征图;第一预测模块,用于读取特征图并输出第一候选区信息;第一输出模块,用于读取第一候选区信息并输出第一文本区域;第二预测模块,用于读取特征图并输出第二候选区信息;以及,第二输出模块,用于读取第一文本区域并使用第二候选区信息修正后输出第二文本区域。其中方法是使用具有文本核标注的独立图片组成训练集对系统中特征提取模块、第一预测模块和第二预测模块调用的深度学习神经网络进行训练;在应用阶段仅使用第一预测模块获得的第一文本区域作为系统输出。
-
-
-
-
-
-
-
-
-