一种利用掩码语言模型建模的图片敏感文字检测方法

发明公开

CN118172778A 一种利用掩码语言模型建模的图片敏感文字检测方法审中-实审

请登陆查看更多内容

专利标题： 一种利用掩码语言模型建模的图片敏感文字检测方法
申请号： CN202211579126.X

申请日： 2022-12-08
公开(公告)号： CN118172778A

公开(公告)日： 2024-06-11
发明人: 张建兵 , 王洪科 , 何亮 , 黄书剑 , 戴新宇 , 陈家骏
申请人： 南京大学
申请人地址： 江苏省南京市栖霞区仙林大道163号
专利权人： 南京大学
当前专利权人： 南京大学
当前专利权人地址： 江苏省南京市栖霞区仙林大道163号
代理机构： 江苏圣典律师事务所
代理商 胡建华
主分类号： G06V30/148
IPC分类号： G06V30/148 ; G06V30/14 ; G06N20/00

摘要：

本发明提出了一种利用掩码语言模型建模的图片敏感文字检测方法，包括：光学字符识别模块、关键位置召回模块、掩码重建模块、重建结果选择模块和文字敏感性检测模块；待检测图片依次经过光学字符识别模块、关键位置召回模块、掩码重建模块、重建结果选择模块和文字敏感性检测模块，得到最终的图片敏感文字检测结果。本发明方法简单直接，可理解性强；不需要人工标注数据训练模型，成本低廉；可以作为现有的图片敏感文字检测系统的扩充，用途广泛；通过掩码语言模型对关键位置的文本进行重建，既能够对光学字符识别出错的文字进行纠错，也可以还原出被故意修改的地方原本的文字，有助于减少图片敏感文字检测系统错检漏检情况的发生。

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06V	图像或视频识别或理解
G06V30/00	字符识别；数字墨迹识别；面向文档的基于图像的模式识别（文档等的扫描、传输或复制 H04N1/00）
G06V30/10	.字符识别
G06V30/14	..图像采集
G06V30/148	...字符区域的分割