- 专利标题: 光学字符识别模型训练和识别方法、装置、设备及介质
-
申请号: CN202110341261.X申请日: 2021-03-30
-
公开(公告)号: CN113033431B公开(公告)日: 2023-08-08
- 发明人: 黄聚 , 谢群义 , 李煜林 , 钦夏孟 , 章成全 , 姚锟
- 申请人: 北京百度网讯科技有限公司
- 申请人地址: 北京市海淀区上地十街10号百度大厦2层
- 专利权人: 北京百度网讯科技有限公司
- 当前专利权人: 北京百度网讯科技有限公司
- 当前专利权人地址: 北京市海淀区上地十街10号百度大厦2层
- 代理机构: 北京品源专利代理有限公司
- 代理商 孟金喆
- 主分类号: G06V30/413
- IPC分类号: G06V30/413 ; G06V20/62 ; G06V30/18 ; G06V10/82 ; G06F40/30 ; G06N3/044 ; G06N3/0442
摘要:
本公开公开了一种光学字符识别模型训练和识别方法、装置、设备及介质,涉及人工智能技术领域,尤其涉及计算机视觉和深度学习技术,可用于OCR场景下。具体实现方案为:对样本图像进行特征提取,得到样本特征数据;将所述样本特征数据输入至光学字符识别模型,以确定所述样本特征数据中的文字区域对应的局部特征数据,并提取所述局部特征数据中的语义信息,根据所述语义信息,确定所述文字区域的预测类别;根据所述预测类别和所述文字区域的标签类别,对所述光学字符识别模型进行训练。本公开提高了光学字符识别模型的类别预测结果的准确度。
公开/授权文献
- CN113033431A 光学字符识别模型训练和识别方法、装置、设备及介质 公开/授权日:2021-06-25