-
公开(公告)号:CN113221884A
公开(公告)日:2021-08-06
申请号:CN202110522161.7
申请日:2021-05-13
申请人: 中国科学技术大学
摘要: 本发明涉及一种基于低频字存储记忆的文本识别方法及系统,其方法包括:S1:统计训练集中低频字;S2:将待识别的文本行图像进行预处理后,将其输入卷积神经网络以及循环神经网络,获得序列特征;S3:根据序列特征和低频字,利用带注意力机制的解码器,分别获得序列特征的上下文信息和低频字的关联特征;S4:将序列特征的上下文信息与低频字关联特征分别经过一个门控机制,获得各自的置信度;将二者的置信度进行融合,得到文本行图像的识别结果。本发明提供的方法,在识别过程中不仅使用了文本图像的上下文信息,还利用注意力机制将低频字的关联特征引入到每一帧的文字识别中,引入门控机制以防止低频字的关联特征对非低频字的识别造成干扰。
-
公开(公告)号:CN113392825B
公开(公告)日:2024-04-30
申请号:CN202110666915.6
申请日:2021-06-16
申请人: 中国科学技术大学 , 科大讯飞股份有限公司
IPC分类号: G06V30/14 , G06V30/146 , G06V30/18 , G06V30/19 , G06V10/82 , G06N3/0464 , G06N3/08
摘要: 本申请公开了一种文本识别方法、装置、设备及存储介质,本申请获取待识别文本所在的图像区域对应的文本图片,进一步对于待识别的文本图片,对其提取至少两个不同方向上的图像特征,进而基于提取的至少两个不同方向上的图像特征,识别文本图片中包含的文本内容。由此可见,对于待识别的文本图片,鉴于其文本内容方向上的多样化,本申请在进行图像特征提取时强化了所提取的方向信息,也即,从两个及以上的不同方向对文本图片进行特征提取,使得提取的图像特征包含了文本图片中待识别文本的多个方向上的特征信息,在此基础上,基于提取的图像特征,能够更加准确的识别文本图片中所包含的文本内容,提高了文本识别的准确度。
-
公开(公告)号:CN113221884B
公开(公告)日:2022-09-06
申请号:CN202110522161.7
申请日:2021-05-13
申请人: 中国科学技术大学
摘要: 本发明涉及一种基于低频字存储记忆的文本识别方法及系统,其方法包括:S1:统计训练集中低频字;S2:将待识别的文本行图像进行预处理后,将其输入卷积神经网络以及循环神经网络,获得序列特征;S3:根据序列特征和低频字,利用带注意力机制的解码器,分别获得序列特征的上下文信息和低频字的关联特征;S4:将序列特征的上下文信息与低频字关联特征分别经过一个门控机制,获得各自的置信度;将二者的置信度进行融合,得到文本行图像的识别结果。本发明提供的方法,在识别过程中不仅使用了文本图像的上下文信息,还利用注意力机制将低频字的关联特征引入到每一帧的文字识别中,引入门控机制以防止低频字的关联特征对非低频字的识别造成干扰。
-
公开(公告)号:CN113221885A
公开(公告)日:2021-08-06
申请号:CN202110523430.1
申请日:2021-05-13
申请人: 中国科学技术大学
摘要: 本发明涉及一种基于整字和偏旁部首的层次化建模方法及系统,其方法包括:S1:将文本行图像经过卷积神经网络和循环神经网络,得到文本行图像的序列特征;S2:将文本行图像的序列特征,输入有注意力机制的整字解码模块,得到整字的上下文特征向量以及整字的解码结果;S3:将整字的上下文特征向量输入偏旁部首解码模块,得到整字层级下的各个偏旁部首的解码结果;S4:利用置信度得分融合策略,将整字和各偏旁部首的解码置信度进行融合,得到整字的识别结果。本发明提供的方法,不仅能实现整字的识别,同时实现该时刻偏旁部首的识别,通过整字和偏旁部首解码置信度融合的策略,不仅能够提升低频字的识别效果,同时最大化地保证了非低频字识别的效果。
-
公开(公告)号:CN113221885B
公开(公告)日:2022-09-06
申请号:CN202110523430.1
申请日:2021-05-13
申请人: 中国科学技术大学
摘要: 本发明涉及一种基于整字和偏旁部首的层次化建模方法及系统,其方法包括:S1:将文本行图像经过卷积神经网络和循环神经网络,得到文本行图像的序列特征;S2:将文本行图像的序列特征,输入有注意力机制的整字解码模块,得到整字的上下文特征向量以及整字的解码结果;S3:将整字的上下文特征向量输入偏旁部首解码模块,得到整字层级下的各个偏旁部首的解码结果;S4:利用置信度得分融合策略,将整字和各偏旁部首的解码置信度进行融合,得到整字的识别结果。本发明提供的方法,不仅能实现整字的识别,同时实现该时刻偏旁部首的识别,通过整字和偏旁部首解码置信度融合的策略,不仅能够提升低频字的识别效果,同时最大化地保证了非低频字识别的效果。
-
-
-
-