- 专利标题: 一种基于seq2seq语言模型的文字识别方法及系统
-
申请号: CN202310131709.4申请日: 2023-02-16
-
公开(公告)号: CN116311275B公开(公告)日: 2023-09-19
- 发明人: 王德军 , 于龙洋 , 孟博 , 彭阳 , 朱建豪 , 李舒蕾
- 申请人: 中南民族大学 , 武汉空天软件技术有限公司
- 申请人地址: 湖北省武汉市洪山区民族大道708号、823号;
- 专利权人: 中南民族大学,武汉空天软件技术有限公司
- 当前专利权人: 中南民族大学,武汉空天软件技术有限公司
- 当前专利权人地址: 湖北省武汉市洪山区民族大道708号、823号;
- 代理机构: 湖北科智达知识产权代理事务所
- 代理商 胡涛
- 主分类号: G06V30/16
- IPC分类号: G06V30/16 ; G06V30/18 ; G06V30/19 ; G06V10/82 ; G06N3/0455 ; G06N3/0464 ; G06N3/08
摘要:
本发明公开了一种基于seq2seq语言模型的文字识别方法及系统,其方法步骤:获取将要识别的含有文字信息的图片;对输入的图片进行图像分割、图像二值化和角度矫正预处理,去除图片中的干扰信息;将图片输入到融合文字识别模型和seq2seq语言模型的文字识别方法中,得到图片中的文字信息。本发明有益效果:本发明通过使用CRNN文字识别模型和seq2seq语言模型相融合,获取了文字的视觉特征和语言特征,并将得到的特征和结果进行融合迭代,从而逐步获取更具有鲁棒性的识别结果,提高了文字识别尤其是在部分文字被遮挡时的正确率。
公开/授权文献
- CN116311275A 一种基于seq2seq语言模型的文字识别方法及系统 公开/授权日:2023-06-23