-
公开(公告)号:CN117079027A
公开(公告)日:2023-11-17
申请号:CN202311041187.5
申请日:2023-08-18
申请人: 嵩山实验室 , 河南信大网御科技有限公司
IPC分类号: G06V10/764 , G06V20/30 , G06V10/44 , G06V10/774 , G06F16/951
摘要: 本发明提供一种联合图像目标检测和图像分类的有害网址检测识别方法,包括以下步骤:采用上下滑动截图方式获取待检网址的长截图;基于训练好的图像目标检测模型对长截图进行目标检测;在未检测到有害目标元素时,基于训练好的图像分类模型对长截图进行分类,获得分类结果;在检测到有害目标元素时,对有害目标元素进行有害类别映射,获得映射结果;同时,判断有害目标元素是否为预设共性有害目标,若是,则基于训练好的图像分类模型对长截图进行分类,获得分类结果;根据分类结果和/或映射结果进行融合决策,获得有害网址类别。
-
公开(公告)号:CN117132995A
公开(公告)日:2023-11-28
申请号:CN202311041188.X
申请日:2023-08-18
申请人: 嵩山实验室 , 河南信大网御科技有限公司
IPC分类号: G06V30/19 , G06V30/18 , G06F16/951 , G06V10/82 , G06N3/0442
摘要: 本发明提供一种联合OCR模型和NLP模型的互联网有害信息检测方法,包括以下步骤:通过网络爬虫获取网站的第一文本数据和图片数据,利用训练好的第一改进NLP模型,对第一文本数据进行处理,得到第一判别结果;利用OCR模型识别图片数据中的文字目标,并对文字目标进行识别,获得第二文本数据,利用训练好的第二改进NLP模型,对识别出的第二文本数据进行处理,得到第二判别结果;将第一文本与第二文本进行拼接,得到第三文本数据,利用训练好的第三改进NLP模型,对第三文本数据进行处理,得到第三判别结果;将第一判别结果、第二判别结果以及第三判别结果送入训练好的综合研判模型进行综合研判,获得最终分类结果。
-