Invention Grant
- Patent Title: 基于自注意力机制的文本识别方法
-
Application No.: CN202110268438.8Application Date: 2021-03-12
-
Publication No.: CN113065550BPublication Date: 2022-11-11
- Inventor: 刘义江 , 陈蕾 , 侯栋梁 , 池建昆 , 范辉 , 阎鹏飞 , 魏明磊 , 李云超 , 姜琳琳 , 辛锐 , 陈曦 , 杨青 , 沈静文 , 吴彦巧 , 姜敬 , 檀小亚 , 师孜晗
- Applicant: 国网河北省电力有限公司 , 国网河北省电力有限公司雄安新区供电公司
- Applicant Address: 河北省石家庄市富强大街32号;
- Assignee: 国网河北省电力有限公司,国网河北省电力有限公司雄安新区供电公司
- Current Assignee: 国网河北省电力有限公司,国网河北省电力有限公司雄安新区供电公司
- Current Assignee Address: 河北省石家庄市富强大街32号;
- Agency: 石家庄新世纪专利商标事务所有限公司
- Agent 董金国; 黄敬霞
- Main IPC: G06V20/62
- IPC: G06V20/62 ; G06V30/146 ; G06V10/82 ; G06N3/04

Abstract:
本发明属于于场景文本识别领域,涉及一种基于自注意力机制的文本识别方法,由处理器执行一卷积神经网络算法指令实现,其包括:接收包含文本内容的场景图片;使用卷积神经网络其第一卷积模块提取场景图片的第一特征图M,其自注意力机制模块将第一特征图M编码为第二特征图Matt,其第二卷积模块提取第二特征图Matt通道方向的一维特征向量F;使用卷积神经网络其第三卷积模块根据第二特征图Matt和一维特征向量F获得场景图片的文本内容识别结果;第三卷积模块包含以一维特征向量F为初始隐含层的循环卷积模块以及用于对第二特征图Matt解码并设于循环卷积模块中循环单元输出的二维注意力机制模块。该方法能够对弯曲、倾斜等不规则文本实现较好的识别。
Public/Granted literature
- CN113065550A 基于自注意力机制的文本识别方法 Public/Granted day:2021-07-02
Information query