发明公开
- 专利标题: 文本图像识别模型训练方法、文本图像识别方法和设备
-
申请号: CN202210837800.3申请日: 2022-07-15
-
公开(公告)号: CN117475444A公开(公告)日: 2024-01-30
- 发明人: 侯冰基 , 熊龙飞 , 黄旭进
- 申请人: 珠海金山办公软件有限公司 , 北京金山办公软件股份有限公司 , 武汉金山办公软件有限公司
- 申请人地址: 广东省珠海市高新区唐家湾镇前岛环路321号金山软件园5号楼
- 专利权人: 珠海金山办公软件有限公司,北京金山办公软件股份有限公司,武汉金山办公软件有限公司
- 当前专利权人: 珠海金山办公软件有限公司,北京金山办公软件股份有限公司,武汉金山办公软件有限公司
- 当前专利权人地址: 广东省珠海市高新区唐家湾镇前岛环路321号金山软件园5号楼
- 代理机构: 北京路浩知识产权代理有限公司
- 代理商 陈新生
- 主分类号: G06V30/19
- IPC分类号: G06V30/19 ; G06V30/148 ; G06V30/14 ; G06V10/82 ; G06N3/08 ; G06V30/146
摘要:
本发明提供一种文本图像识别模型训练方法、文本图像识别方法和设备,涉及图像处理技术领域。该方法包括:在训练文本图像识别模型时,可以先获取多个竖排文本图像样本,以及各竖排文本图像样本对应的文本内容和文本朝向;将对多个竖排文本图像样本旋转得到的横向排布的多个目标竖排文本图像样本输入至初始文本图像识别模型中,得到各竖排文本图像样本对应的预测文本内容和预测文本朝向;根据各竖排文本图像样本对应的文本内容、文本朝向、预测文本内容以及预测文本朝向,对初始文本图像识别模型的模型参数进行更新,这样训练得到的文本图像识别模型可以准确地识别任意文本朝向的竖排文本图像,从而提高了识别结果的准确度。