-
公开(公告)号:CN116978021A
公开(公告)日:2023-10-31
申请号:CN202211144562.4
申请日:2022-09-20
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G06V30/18 , G06V30/19 , G06V30/146 , G06V30/14 , G06V10/82 , G06N3/0464 , G06N3/048 , G06N3/09
摘要: 本申请公开了一种文本字符的识别方法、装置以及存储介质,可应用于包含字符识别的地图或车联网场景中。通过获取提取待识别图像中的字符特征;并根据预设包围框配置检索向量;然后将检索向量与字符特征对应的编码向量进行关联得到目标文本特征;进而基于目标文本特征进行解码,以根据解码后的特征信息识别得到待识别图像对应的文本内容信息以及字符位置信息。从而实现基于字符粒度的文本字符识别过程,由于采用包围框对文本字符进行字符定位,并在字符对齐后进行识别,避免了字符之间的相互干扰,提高了文本字符的准确性。