-
公开(公告)号:CN115187996A
公开(公告)日:2022-10-14
申请号:CN202211102098.2
申请日:2022-09-09
申请人: 中电科新型智慧城市研究院有限公司
IPC分类号: G06V30/162 , G06V30/148 , G06V30/19
摘要: 本申请适用于数据识别技术领域,提供了一种语义识别方法、装置、终端设备和存储介质。其中,上述语义识别方法具体包括:分别对待识别文本中的各个文字进行向量化,得到各个文字的字符向量;获取所述各个文字的图像向量,所述图像向量用于表征相应文字的原始象形文字图像的全局特征和局部特征;根据所述字符向量和所述图像向量,确定相应文字的语义分类结果,所述语义分类结果包括相应文字所属的一个或多个语义分类;将同一所述语义分类的文字进行组合,得到所述待识别文本的语义识别结果。本申请的实施例可以提高语义识别的准确性。
-
公开(公告)号:CN115147856A
公开(公告)日:2022-10-04
申请号:CN202210804642.1
申请日:2022-07-08
申请人: 上海弘玑信息技术有限公司
IPC分类号: G06V30/413 , G06V30/414 , G06V30/146 , G06V30/162
摘要: 本申请属于图像处理技术领域,公开了一种表格信息提取的方法及电子设备,该方法包括,确定待处理图像中的背景区域,背景区域为待处理图像中未包含文本信息的区域;根据背景区域中各像素的纵坐标以及横坐标,分别获得每一纵坐标的像素数量以及每一横坐标的像素数量;根据各纵坐标的像素数量,以及各横坐标的像素数量,确定目标表格的各个表格行坐标以及各个表格列坐标;根据目标表格的各个表格行坐标以及各个表格列坐标,获得目标表格的表格信息。这样,降低了图像界面中表格信息提取时耗费的人力成本和时间成本。
-
公开(公告)号:CN115063823A
公开(公告)日:2022-09-16
申请号:CN202210761538.9
申请日:2022-06-29
申请人: OPPO广东移动通信有限公司
IPC分类号: G06V30/414 , G06V30/148 , G06V30/162
摘要: 本申请实施例公开了一种图像处理方法、装置、计算机设备、存储介质及程序产品,属于光学字符识别技术领域。上述方法包括:对目标图像的文本响应图以及文本间隙响应图进行二值化合并,获取候选区域二值图;提取所述候选区域二值图中的初始检测框;从所述候选区域二值图中的所述初始检测框中获取各个入口像素和各个出口像素;根据各个所述入口像素和各个所述出口像素确定相邻两行文本之间的分割线;根据分割线确定文本检测框。上述方案提高了对文本检测框的提取准确性。
-
公开(公告)号:CN115062876A
公开(公告)日:2022-09-16
申请号:CN202210989621.1
申请日:2022-08-18
申请人: 京华信息科技股份有限公司
IPC分类号: G06Q10/04 , G06Q10/06 , G06Q10/10 , G06N3/00 , G06V30/412 , G06V30/414 , G06V30/162 , G06V30/164
摘要: 本发明涉及一种计算机应用技术,揭露了一种基于OCR的流程快速建模方法、系统、设备及存储介质。本发明对目标审批流程进行多维度的特征采集,并组建申请表集合,其中包括多类申请表;依次确定各类申请表的审批用户,并构建申请表‑审批用户列表;获得申请表审批任务,并确定所述申请表审批任务中目标申请表的类型,结合所述申请表‑审批用户列表匹配目标审批用户集合;构建任务分配模型并分析确定处理所述申请表审批任务的目标审批用户;基于OCR构建表单识别模型,并获得所述目标申请表的识别信息;生成标准目标申请表并发送至所述目标审批用户进行审批。本发明可优化审批流程,同时提高审批效率,进而提高决策频度和工作质量。
-
公开(公告)号:CN114998900A
公开(公告)日:2022-09-02
申请号:CN202210621030.9
申请日:2022-06-02
申请人: 武汉工程大学
IPC分类号: G06V30/146 , G06V30/162 , G06V30/164
摘要: 本申请提供了一种维吾尔文印刷页倾斜校正方法,包括:S1:确定待校正维吾尔文印刷的目标图像;S2:采用降噪算法对所述目标图像进行预处理,得到降噪后图像;S3:采用扫描投影切分方式识别所述降噪后图像中的行首像素;S4:基于所述行首像素进行Hough变换确定文档倾斜角;S5:基于所述文档倾斜角对所述目标图像使用刚体变换得到校正图像。本发明提供的方法,用于高效、准确去除文档图像倾斜现象,为后续文段切分提供有利条件。
-
公开(公告)号:CN114973275A
公开(公告)日:2022-08-30
申请号:CN202210708633.2
申请日:2022-06-22
申请人: 信华信技术股份有限公司
IPC分类号: G06V30/19 , G06V30/162 , G06V30/146 , G06V30/164 , G06F40/284 , G06F40/289 , G06F40/30
摘要: 本发明公开了一种基于深度学习技术的图文乱码识别方法,包括以下步骤:步骤S1:获取待乱码识别的文件图像信息;步骤S1.1:将待乱码识别的文件固定在稳光环境中;步骤S1.2:通过扫描仪扫描或相机拍摄生成待处理的标签图像信息;步骤S2:将待处理的图像信息送入到OCR识别模块中进行数据预处理、文本区域检测及文字内容识别;步骤S2.1:OCR识别模块中涵盖数据预处理、文本区域检测及文字内容识别三部分功能;步骤S3:将OCR识别模块的输出结果送入到乱码判别模块中。本发明的有益效果是,通过深度学习算法训练图文检测与识别模型,结合设定阈值与语义分析技术进行生产图文乱码信息的存在性判定。
-
公开(公告)号:CN114972371A
公开(公告)日:2022-08-30
申请号:CN202210235718.3
申请日:2022-03-11
申请人: 湖北工业大学
IPC分类号: G06T7/11 , G06N3/04 , G06N3/08 , G06T7/194 , G06V30/162
摘要: 本发明公开了一种用于对抗阴影区干涉行为的文档图像二值化系统及方法,系统包括视觉搜索单元、特征分解单元和脉冲振荡单元,三个区域的输入均为灰度图像且都独立进行工作,然而整体功能的实现需要通过信息的互联。视觉搜索单元通过预搜索和精细搜索输出灰度图像分解级数N并将其传递到特征分解单元用于确定双极细胞层数M。特征分解单元由M=N‑1层双极细胞与分解层构成,用于获得图像分解子集并将最高级别分解子集传递至水平细胞以控制抑制性突触作用范围。脉冲振荡单元能够直接实现图像的二值化编码,需要通过判定来决定是否激活同步遏制层来针对性地优化神经计算机制,脉冲振荡单元的输出为最终的二值图像。
-
公开(公告)号:CN114845180A
公开(公告)日:2022-08-02
申请号:CN202210379101.9
申请日:2022-04-12
申请人: 福州新知智联科技有限公司
IPC分类号: H04Q9/00 , G06V30/14 , G06V30/162 , G06V30/19
摘要: 本发明公开了一种低功耗数字识别远传抄表装置及其识别方法。利用抄表装置的采集水表图像传输给MCU芯片,MCU芯片采用局部自适应阈值算法对包含水表数字区域的原始图像进行二值化处理,提取水表数字区域的二值图;再次提取每个数字区域;使用形态学腐蚀和膨胀运算去除每个水表数字区域的背景区域;判断提取的每个数字区域是不是半字区域,若是则进行将半字区域扩充成全字区域后计算全字区域与模板库中的每个数字模板的相似度,挑选概率最大的模板区域为最终的数字识别结果,将识别结果通过无线通信模块传输至水务服务器。本发明用以解决现有摄像直读式远传抄表装置的功耗高,且传输速率慢的问题。
-
公开(公告)号:CN112733837B
公开(公告)日:2022-08-02
申请号:CN201911030274.4
申请日:2019-10-28
申请人: 北京易真学思教育科技有限公司
IPC分类号: G06V30/146 , G06V20/62 , G06V30/162
摘要: 本申请实施例提供一种文本图像的校正方法、设备及计算机可读存储介质,该文本图像的校正方法包括:对目标图像进行检测,并确定至少两个文本块;在至少两个文本块中确定互为邻近文本块的至少一对文本块,并将至少一对文本块中每一对文本块进行合并确定出至少一个文本行;对至少一个文本行进行校正。因为利用互为邻近文本块的双向匹配关系确定了文本行,在对文本行进行扭曲校正时更加准确。
-
公开(公告)号:CN114529913A
公开(公告)日:2022-05-24
申请号:CN202210164924.X
申请日:2022-02-22
申请人: 重庆大学
IPC分类号: G06V30/224 , G06V20/62 , G06V30/162 , G06V30/19
摘要: 本发明的提供的一种图像识别方法,包括以下步骤:S1.实时采集具有数字标识的目标的图像信息;S2.对实时采集的图像信息以及样本图像进行预处理;S3.将实时采集的图像信息与样本图像进行相似度计算;S3.筛选出与当前样本图像相似度小于设定阈值的实时图像信息,并将当前实时图像信息中的数字标识识别为样本图像中的数字标识。通过上述方法,能够对工业识别表面的数字标识进行准确识别,从而利于后续处理维护,而且能够有效提高识别效率,保证识别精度。
-
-
-
-
-
-
-
-
-