-
公开(公告)号:CN107239704A
公开(公告)日:2017-10-10
申请号:CN201710374994.7
申请日:2017-05-24
申请人: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC分类号: G06F21/56
CPC分类号: G06F21/562
摘要: 本发明公开了一种恶意网页发现方法及装置,所述方法包括:确定每个预先选取的低可信度用户的网页资源访问集合;从确定的访问集合中确定出所有低可信度用户的网页资源访问交集;对所述访问交集中网页资源进行恶意网页检测,根据检测结果,确定恶意网页。本发明有效地解决现有恶意网页分类技术易漏判、准确率低和效率低的问题。
-
公开(公告)号:CN108628703A
公开(公告)日:2018-10-09
申请号:CN201810225421.2
申请日:2018-03-19
申请人: 中国科学院信息工程研究所 , 国家计算机网络与信息安全管理中心
摘要: 本发明提供一种基于视觉相似性镜像网站发现方法及系统,该方法的步骤包括:对网页页面进行初步分块,将得到的块作为DOM树的结点;对可分割的结点继续分割,将分出的新块作为该结点的孩子结点;对于不可分割的结点,将该结点的块作为页面块存入页面块池中,如此循环迭代分块,直至得到全部的页面块;检测出页面中的分隔条,确定分割条的权重;基于分割条的权重进行重建,得到语义块;将语义块转换成图像,提取图像的签名特征;根据上述步骤提取目标网页和基准网页的各语义块的签名特征,基于签名特征通过EMD距离算法计算目标网页和基准网页之间的距离,如果该距离小于一设定阈值,则判定该目标网页的网站属于镜像网站。
-
公开(公告)号:CN108628703B
公开(公告)日:2022-06-17
申请号:CN201810225421.2
申请日:2018-03-19
申请人: 中国科学院信息工程研究所 , 国家计算机网络与信息安全管理中心
摘要: 本发明提供一种基于视觉相似性镜像网站发现方法及系统,该方法的步骤包括:对网页页面进行初步分块,将得到的块作为DOM树的结点;对可分割的结点继续分割,将分出的新块作为该结点的孩子结点;对于不可分割的结点,将该结点的块作为页面块存入页面块池中,如此循环迭代分块,直至得到全部的页面块;检测出页面中的分隔条,确定分割条的权重;基于分割条的权重进行重建,得到语义块;将语义块转换成图像,提取图像的签名特征;根据上述步骤提取目标网页和基准网页的各语义块的签名特征,基于签名特征通过EMD距离算法计算目标网页和基准网页之间的距离,如果该距离小于一设定阈值,则判定该目标网页的网站属于镜像网站。
-
公开(公告)号:CN108768921B
公开(公告)日:2021-03-09
申请号:CN201810264535.8
申请日:2018-03-28
申请人: 中国科学院信息工程研究所 , 国家计算机网络与信息安全管理中心
摘要: 本发明提供一种基于特征检测的恶意网页发现方法,包括以下步骤:通过读取URL文件,提取URL相关网络行为特征;通过读取DNS文件,提取域名相关网络行为特征;通过读取NetFlow文件,提取流量相关网络行为特征;针对URL相关网络行为特征,域名相关网络行为特征及流量相关网络行为特征进行规则匹配,根据匹配结果识别恶意URL。同时,基于实时捕获的网络流,构建了实现上述方法的在线的具有检测及识别功能的系统,并通过该系统实施在线网页识别,能从实时网络流中实时识别恶意网页的URL。
-
公开(公告)号:CN108768921A
公开(公告)日:2018-11-06
申请号:CN201810264535.8
申请日:2018-03-28
申请人: 中国科学院信息工程研究所 , 国家计算机网络与信息安全管理中心
摘要: 本发明提供一种基于特征检测的恶意网页发现方法,包括以下步骤:通过读取URL文件,提取URL相关网络行为特征;通过读取DNS文件,提取域名相关网络行为特征;通过读取NetFlow文件,提取流量相关网络行为特征;针对URL相关网络行为特征,域名相关网络行为特征及流量相关网络行为特征进行规则匹配,根据匹配结果识别恶意URL。同时,基于实时捕获的网络流,构建了实现上述方法的在线的具有检测及识别功能的系统,并通过该系统实施在线网页识别,能从实时网络流中实时识别恶意网页的URL。
-
公开(公告)号:CN113343810B
公开(公告)日:2023-03-21
申请号:CN202110590381.3
申请日:2021-05-28
申请人: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所
IPC分类号: G06V20/40 , G06V40/10 , G06V10/774
摘要: 本发明提出一种基于时序多样性与相关性的行人重识别模型训练方法,包括以下步骤:获取训练样本数据,所述训练样本数据包括多个包含行人的视频序列;将所述训练样本数据输入至初始模型中采样各所述包含行人的视频序列的多帧视频,并且提取所述多帧视频的帧级别特征,聚合所述帧级别特征得到视频级别特征;基于所述视频级别特征计算视频级别损失;基于所述视频级别损失对所述初始模型的模型参数进行优化,得到行人重识别模型。
-
公开(公告)号:CN111737551B
公开(公告)日:2022-08-05
申请号:CN202010452949.0
申请日:2020-05-26
申请人: 国家计算机网络与信息安全管理中心
IPC分类号: G06F16/953 , G06F16/951 , G06N3/08 , G06N3/04
摘要: 本发明公开一种基于异构图注意力神经网络的暗网线索检测方法:步骤一、对暗网进行文本采集;步骤二、针对采集到的暗网文本信息,进行事件标题、关键词及实体提取,构建动态异构信息网络;步骤三、对构建的异构信息网络中的节点进行embedding处理,并得到各节点的特征向量;步骤四、对异构信息网络的图结构进行学习;步骤五、根据对异构信息网络的图结构学习得到的结果,对异构信息网络中的节点进行线索类别分类,从而完成对暗网信息的线索检测。本发明利用了外部知识库作为依托,并且采用了两套方法来对构建的异构信息网络的图结构进行学习,具有良好的线索检测效果。
-
公开(公告)号:CN110427264B
公开(公告)日:2021-11-30
申请号:CN201910578638.6
申请日:2019-06-28
申请人: 中国科学院计算技术研究所 , 国家计算机网络与信息安全管理中心
IPC分类号: G06F9/50 , G06F16/951
摘要: 本发明提出一种基于Kubernetes的JS解析方法及系统,包括:多台物理机、采集结果库、系统监控模块和解析任务控制模块;物理机,用于根据任务部署JS解析Pod,执行网页采集,将得到的采集结果存至采集结果库;系统监控模块,用于自动读取物理机的机器信息;解析任务控制模块,用于查询系统监控模块,得到各物理机的机器信息,以计算各物理机应部署的JS解析Pod个数,调用Kubernetes API调整各物理机的JS解析Pod个数。本发明有效的利用了空闲时间执行JS解析相关任务,并减小了JS解析的资源消耗。
-
公开(公告)号:CN111859980A
公开(公告)日:2020-10-30
申请号:CN202010549951.X
申请日:2020-06-16
申请人: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC分类号: G06F40/30 , G06F40/289 , G06F16/9536 , G06N3/04 , G06N3/08
摘要: 本申请涉及一种讽刺类型的文本识别方法、装置、设备及计算机可读介质。该方法包括:获取待处理文本,待处理文本来自于社交媒体网络平台;采用多种方式提取待处理文本的目标特征信息,目标特征信息为从特征集合中选择出来的多个特征信息的加权和表示;根据第一神经网络模型对目标特征信息的识别结果确定待处理文本的文本类型,第一神经网络模型是采用具有标记信息的训练数据对第二神经网络模型进行训练后得到的,标记信息用于标记训练数据是否为目标类型。本申请从多个维度捕获词间关联特征,并从讽刺文本的情感倾向转换出发,挖掘词语间的冲突性,进而充分体现句子中地所蕴含的讽刺含义,最终准确、合理地识别讽刺文本。
-
公开(公告)号:CN111832622A
公开(公告)日:2020-10-27
申请号:CN202010531569.6
申请日:2020-06-11
申请人: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所
摘要: 本发明提出一种特定人物丑化图片识别方法和系统,包括:获取包含特定人物的图片集,该图片集包括多张漫画和多张照片,该图片集中每张图片标有代表是否丑化的预设标签,以该图片集中漫画和照片分别作为训练数据,训练卷积神经网络模型,得到特定人物漫画识别网络和特定人物照片识别网络;通过前置网络判断待识别图片是否属于漫画,若是,则将该待识别图片发送至该特定人物漫画识别网络,得到该待识别图片的特定人物丑化图片识别结果,否则对该待识别图片进行人脸对比,判断该待识别图片是否包括该特定人物,若是则通过该特定人物照片识别网络,得到该待识别图片的特定人物丑化图片识别结果,否则得到该待识别图片不包括该特定人物的识别结果。
-
-
-
-
-
-
-
-
-