- 专利标题: 一种基于整字和偏旁部首的层次化建模方法及系统
-
申请号: CN202110523430.1申请日: 2021-05-13
-
公开(公告)号: CN113221885B公开(公告)日: 2022-09-06
- 发明人: 杨争艳 , 吴嘉嘉 , 张为泰 , 宋彦
- 申请人: 中国科学技术大学
- 申请人地址: 安徽省合肥市包河区金寨路96号
- 专利权人: 中国科学技术大学
- 当前专利权人: 中国科学技术大学
- 当前专利权人地址: 安徽省合肥市包河区金寨路96号
- 代理机构: 北京科迪生专利代理有限责任公司
- 代理商 金怡
- 主分类号: G06V20/62
- IPC分类号: G06V20/62 ; G06V10/44 ; G06V10/764 ; G06V10/82 ; G06K9/62 ; G06N3/04 ; G06N3/08
摘要:
本发明涉及一种基于整字和偏旁部首的层次化建模方法及系统,其方法包括:S1:将文本行图像经过卷积神经网络和循环神经网络,得到文本行图像的序列特征;S2:将文本行图像的序列特征,输入有注意力机制的整字解码模块,得到整字的上下文特征向量以及整字的解码结果;S3:将整字的上下文特征向量输入偏旁部首解码模块,得到整字层级下的各个偏旁部首的解码结果;S4:利用置信度得分融合策略,将整字和各偏旁部首的解码置信度进行融合,得到整字的识别结果。本发明提供的方法,不仅能实现整字的识别,同时实现该时刻偏旁部首的识别,通过整字和偏旁部首解码置信度融合的策略,不仅能够提升低频字的识别效果,同时最大化地保证了非低频字识别的效果。
公开/授权文献
- CN113221885A 一种基于整字和偏旁部首的层次化建模方法及系统 公开/授权日:2021-08-06