发明公开
CN107181730A 一种仿冒网站监测识别方法及系统
无效 - 驳回
- 专利标题: 一种仿冒网站监测识别方法及系统
- 专利标题(英): Plagiarism website monitoring identification method and system
-
申请号: CN201710145302.1申请日: 2017-03-13
-
公开(公告)号: CN107181730A公开(公告)日: 2017-09-19
- 发明人: 王海洋 , 李雪梅 , 杜慧 , 刘衍琦 , 刘玮 , 程学旗
- 申请人: 烟台中科网络技术研究所 , 中国科学院计算技术研究所
- 申请人地址: 山东省烟台市高新区蓝海路1号蓝海国际软件园A座;
- 专利权人: 烟台中科网络技术研究所,中国科学院计算技术研究所
- 当前专利权人: 烟台中科网络技术研究所,中国科学院计算技术研究所
- 当前专利权人地址: 山东省烟台市高新区蓝海路1号蓝海国际软件园A座;
- 代理机构: 北京轻创知识产权代理有限公司
- 代理商 杨立; 王博
- 主分类号: H04L29/06
- IPC分类号: H04L29/06
摘要:
本发明公开了一种仿冒网站监测识别方法及系统,方法包括:S1、分别对被仿冒网站和待检测网站进行页面解析,得到解析后的被仿冒网页和待检测网页;S2、分别对解析后的被仿冒网页和待检测网页进行特征提取,得到被仿冒网页和待检测网页的网页特征;S3、计算被仿冒网页与待检测网页的网页特征的相似性,得到对应于网页特征中所有特征的所有计算结果;S4、对所有计算结果进行集成汇总,得到集成汇总结果;S5、将集成汇总结果与预设阈值进行比较,如果集成汇总结果大于预设阈值,则待检测网站为仿冒网站。本发明的有益效果是:同时考虑了网页URL、网页内容以及网页图像的相似性,并对三个相似性进行集成汇总,提高对仿冒网站进行识别的准确性。