发明公开
- 专利标题: 一种自然场景图片中的文本字体的识别方法
-
申请号: CN201810104830.7申请日: 2018-02-02
-
公开(公告)号: CN108376244A公开(公告)日: 2018-08-07
- 发明人: 连宙辉 , 王逸之 , 唐英敏 , 肖建国
- 申请人: 北京大学
- 申请人地址: 北京市海淀区颐和园路5号
- 专利权人: 北京大学
- 当前专利权人: 北京大学
- 当前专利权人地址: 北京市海淀区颐和园路5号
- 代理机构: 北京万象新悦知识产权代理事务所
- 代理商 黄凤茹
- 主分类号: G06K9/00
- IPC分类号: G06K9/00 ; G06K9/20 ; G06K9/34 ; G06K9/62 ; G06N3/08 ; G06T7/90
摘要:
本发明公布了一种自然场景图片中的文本字体的识别方法,通过图片合成方法获得大量融合不同字体文本的具体类似真实效果的自然场景图片,利用图片训练得到字体识别器和文本定位器,通过文本定位器从互联网图片中定位出更多文本图片,再利用迁移学习方法,通过字体识别器从图片中进一步学习,进一步提高识别的准确度。本发明采用自动合成高质量训练图片的方案,避免了耗时耗力的人工标注,大幅度降低成本,使得字体分类器具有更好的识别精度。此外,本发明引入迁移学习方法,充分利用大量无字体标签的图片,进一步增强字体分类器的准确度。
公开/授权文献
- CN108376244B 一种自然场景图片中的文本字体的识别方法 公开/授权日:2022-03-25