发明公开
- 专利标题: 一种利用掩码语言模型建模的图片敏感文字检测方法
-
申请号: CN202211579126.X申请日: 2022-12-08
-
公开(公告)号: CN118172778A公开(公告)日: 2024-06-11
- 发明人: 张建兵 , 王洪科 , 何亮 , 黄书剑 , 戴新宇 , 陈家骏
- 申请人: 南京大学
- 申请人地址: 江苏省南京市栖霞区仙林大道163号
- 专利权人: 南京大学
- 当前专利权人: 南京大学
- 当前专利权人地址: 江苏省南京市栖霞区仙林大道163号
- 代理机构: 江苏圣典律师事务所
- 代理商 胡建华
- 主分类号: G06V30/148
- IPC分类号: G06V30/148 ; G06V30/14 ; G06N20/00
摘要:
本发明提出了一种利用掩码语言模型建模的图片敏感文字检测方法,包括:光学字符识别模块、关键位置召回模块、掩码重建模块、重建结果选择模块和文字敏感性检测模块;待检测图片依次经过光学字符识别模块、关键位置召回模块、掩码重建模块、重建结果选择模块和文字敏感性检测模块,得到最终的图片敏感文字检测结果。本发明方法简单直接,可理解性强;不需要人工标注数据训练模型,成本低廉;可以作为现有的图片敏感文字检测系统的扩充,用途广泛;通过掩码语言模型对关键位置的文本进行重建,既能够对光学字符识别出错的文字进行纠错,也可以还原出被故意修改的地方原本的文字,有助于减少图片敏感文字检测系统错检漏检情况的发生。