一种基于seq2seq语言模型的文字识别方法及系统

发明授权

CN116311275B 一种基于seq2seq语言模型的文字识别方法及系统有权

请登陆查看更多内容

专利标题： 一种基于seq2seq语言模型的文字识别方法及系统
申请号： CN202310131709.4

申请日： 2023-02-16
公开(公告)号： CN116311275B

公开(公告)日： 2023-09-19
发明人: 王德军 , 于龙洋 , 孟博 , 彭阳 , 朱建豪 , 李舒蕾
申请人： 中南民族大学 , 武汉空天软件技术有限公司
申请人地址： 湖北省武汉市洪山区民族大道708号、823号;
专利权人： 中南民族大学,武汉空天软件技术有限公司
当前专利权人： 中南民族大学,武汉空天软件技术有限公司
当前专利权人地址： 湖北省武汉市洪山区民族大道708号、823号;
代理机构： 湖北科智达知识产权代理事务所
代理商 胡涛
主分类号： G06V30/16
IPC分类号： G06V30/16 ; G06V30/18 ; G06V30/19 ; G06V10/82 ; G06N3/0455 ; G06N3/0464 ; G06N3/08

摘要：

本发明公开了一种基于seq2seq语言模型的文字识别方法及系统，其方法步骤：获取将要识别的含有文字信息的图片；对输入的图片进行图像分割、图像二值化和角度矫正预处理，去除图片中的干扰信息；将图片输入到融合文字识别模型和seq2seq语言模型的文字识别方法中，得到图片中的文字信息。本发明有益效果：本发明通过使用CRNN文字识别模型和seq2seq语言模型相融合，获取了文字的视觉特征和语言特征，并将得到的特征和结果进行融合迭代，从而逐步获取更具有鲁棒性的识别结果，提高了文字识别尤其是在部分文字被遮挡时的正确率。

公开/授权文献

CN116311275A 一种基于seq2seq语言模型的文字识别方法及系统公开/授权日：2023-06-23

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06V	图像或视频识别或理解
G06V30/00	字符识别；数字墨迹识别；面向文档的基于图像的模式识别（文档等的扫描、传输或复制 H04N1/00）
G06V30/10	.字符识别
G06V30/16	..图像预处理