一种基于图像连通域的文字位置计算、编排及识别算法

    公开(公告)号:CN115909366A

    公开(公告)日:2023-04-04

    申请号:CN202211417747.8

    申请日:2022-11-14

    摘要: Tr(Text Recognition)文字识别技术识别率较高,但其存在两个缺点:1)仅将图片中的每个文字块内容进行识别,返回的识别结果无序;2)在多个文字识别请求同时发出时,受计算机CPU限制,识别速度将变得非常慢。本发明公开了一种基于图像连通域的文字位置计算、编排及识别算法,该方法为:通过算法寻找文字连通域,计算连通域最小外接矩形,对最小外接矩形位置进行排序处理,按顺序将矩形位置区域图片转为Base64发送至Nginx反向代理服务器,由Nginx将请求转发至文字识别服务,最终得到图片有序的文字识别结果。本发明实现了文字区域的搜寻及排序算法,并通过反向代理实现文字识别服务的负载均衡,提高了文字识别的准确率和效率。