发明公开
- 专利标题: 弯曲文本识别方法、装置、设备和介质
-
申请号: CN202310670621.X申请日: 2023-06-07
-
公开(公告)号: CN116958989A公开(公告)日: 2023-10-27
- 发明人: 王翔翔 , 王斌 , 包志敏 , 刘银松 , 姜德强
- 申请人: 腾讯科技(深圳)有限公司
- 申请人地址: 广东省深圳市南山区高新区科技中一路腾讯大厦35层
- 专利权人: 腾讯科技(深圳)有限公司
- 当前专利权人: 腾讯科技(深圳)有限公司
- 当前专利权人地址: 广东省深圳市南山区高新区科技中一路腾讯大厦35层
- 代理机构: 广州三环专利商标代理有限公司
- 代理商 贾允
- 主分类号: G06V30/148
- IPC分类号: G06V30/148 ; G06T7/187 ; G06V10/774 ; G06V10/82 ; G06N3/0464 ; G06T7/73 ; G06V30/19 ; G06V20/70
摘要:
本申请提供了弯曲文本识别方法、装置、设备和介质,涉及人工智能技术领域,可以应用于云技术、人工智能、智慧交通、辅助驾驶等场景,包括获取包含待识别文本的目标图像;对目标图像进行高层特征提取,得到文本方向特征,文本方向特征包括目标图像对应的多个特征点的特征方向信息,特征方向信息用于指示特征点对应的字符的文字朝向;基于文本方向特征对目标图像进行文本图像特征提取,得到文本特征图,文本方向特征用于确定文本图像特征提取过程中目标图像的空间采样位置;基于文本特征图进行文本识别,得到待识别文本对应的文本识别结果。本申请能够提升空间采样与文字朝向的适配性,实现不同朝向文字的特征提取,显著提升弯曲文本的识别精度。