发明公开
- 专利标题: 网页恶意篡改识别方法、系统及可读存储介质
-
申请号: CN202211322297.4申请日: 2022-10-27
-
公开(公告)号: CN115396237A公开(公告)日: 2022-11-25
- 发明人: 陈晓莉 , 和建文 , 冯国栋 , 赵祥廷 , 张晶晶 , 章亮
- 申请人: 浙江鹏信信息科技股份有限公司 , 中国移动通信集团云南有限公司
- 申请人地址: 浙江省杭州市余杭区仓前街道向往街1008号14幢9-10层;
- 专利权人: 浙江鹏信信息科技股份有限公司,中国移动通信集团云南有限公司
- 当前专利权人: 浙江鹏信信息科技股份有限公司,中国移动通信集团云南有限公司
- 当前专利权人地址: 浙江省杭州市余杭区仓前街道向往街1008号14幢9-10层;
- 代理机构: 浙江永鼎律师事务所
- 代理商 王日精
- 主分类号: H04L9/40
- IPC分类号: H04L9/40 ; H04L43/12 ; G06F16/951 ; G06K9/62 ; G06N3/04
摘要:
本发明涉及网页恶意篡改识别方法、系统及可读存储介质,识别方法包括:S1、爬取待测网页的图片数据和文本数据;S2、判断待测网页的数据信息与预设网页的数据信息是否相同;若否,则转至步骤S3;S3、利用VGG卷积神经网络的全连接层的输出作为SVM分类器的输入构成的第一分类模型对待测网页的图片数据进行分类,得到第一分类标签及其对应的置信度;利用BERT神经网络拼接双向LSTM神经网络并在输出前添加注意力构成的第二分类模型对待测网页的文本数据进行分类,得到第二分类标签及其对应的置信度;S4、判断各置信度是否超出置信度阈值;若是,则输出网页存在恶意篡改告警。本发明有效提升了网页恶意篡改识别的精度和效率。