发明授权
- 专利标题: 一种基于文本行匹配的跨图文本阅读方法
-
申请号: CN202110538489.8申请日: 2021-05-18
-
公开(公告)号: CN113342997B公开(公告)日: 2022-11-11
- 发明人: 李宏亮 , 戴禹 , 李宏瑞 , 何书航
- 申请人: 成都快眼科技有限公司
- 申请人地址: 四川省成都市高新区天府五街200号3号楼B区8楼
- 专利权人: 成都快眼科技有限公司
- 当前专利权人: 成都快眼科技有限公司
- 当前专利权人地址: 四川省成都市高新区天府五街200号3号楼B区8楼
- 代理机构: 成都九鼎天元知识产权代理有限公司
- 代理商 徐静
- 主分类号: G06F16/38
- IPC分类号: G06F16/38 ; G06N3/04
摘要:
本发明提供一种基于文本行匹配的跨图文本阅读方法,包括:步骤10,获取输入的两张文本图像;步骤20,提取出文本行位置,过滤不可读文本行并进行特征提取,得到文本行特征;步骤30,获得文本行匹配结果:步骤31,将文本行位置和文本行特征进行特征编码得到节点特征;步骤32,对节点特征进行自优化和交叉优化得到优化后的节点特征;步骤33,利用优化后的节点特征计算打分矩阵,得到文本行匹配结果;步骤4,根据文本行匹配结果拼接文本行特征,并提取出对应文本得到文本识别结果;步骤5,融合文本识别结果,得到文本阅读结果。本发明能够充分利用文本的先验信息,在文本行级别上完成跨图文本阅读任务,取得了比像素级合并和阅读方法更好的效果。
公开/授权文献
- CN113342997A 一种基于文本行匹配的跨图文本阅读方法 公开/授权日:2021-09-03