-
公开(公告)号:CN108776844B
公开(公告)日:2021-09-14
申请号:CN201810332563.9
申请日:2018-04-13
Applicant: 中国科学院信息工程研究所
IPC: G06Q10/04 , G06Q50/00 , G06F16/9536
Abstract: 本发明提供一种基于上下文感知张量分解的社交网络用户行为预测方法及系统,该方法的步骤包括:获取用户的社交网络数据,经预处理得到完整的社交数据;基于社交数据,构建目标张量、辅助张量、用户相似性矩阵、消息主题相似矩阵及用户影响力矩阵;根据上述目标张量、辅助张量、用户相似性矩阵、消息主题相似矩阵及用户影响力矩阵,构建张量分解模型,协同分解目标张量和辅助张量,计算分解损失函数值,获得最优的转发消息用户、被转发消息以及发布消息用户的潜在特征矩阵和核心张量;根据上述的潜在特征矩阵和核心张量,补全辅助张量,对用户转发行为进行预测。
-
公开(公告)号:CN113194064A
公开(公告)日:2021-07-30
申请号:CN202110282017.0
申请日:2021-03-16
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种基于图卷积神经网络的webshell检测方法及装置,包括:解析流量数据包;根据流量间的跳转关系构建流量关联图,并依据流量关联图,得到该流量数据包的邻接矩阵;获取流量关联图中每一节点的特征向量;将邻接矩阵与特征向量输入双层GCN模型,得到webshell检测结果。本发明在特征提取阶段除了对常规的流量特征进行提取外,还根据流量间的跳转关系,建立图模型,提取流量间的关联特征,并引入了深度学习领域的图卷积技术,从而提高了webshell检测准确率。
-
公开(公告)号:CN112307170A
公开(公告)日:2021-02-02
申请号:CN202011199788.5
申请日:2020-10-29
Applicant: 首都师范大学 , 中国科学院信息工程研究所
IPC: G06F16/33 , G06F16/35 , G06F21/55 , G06F40/211 , G06F40/295 , G06K9/62
Abstract: 本发明提供一种关系抽取模型的训练方法、关系抽取方法、设备及介质,涉及威胁情报关系处理技术领域。该方法包括:对数据集中每个文本语料中的多个句子实例进行特征处理,得到每个句子实例的初始特征;通过特征转换器对初始特征进行转换,得到每个句子实例的句子特征;通过句子实例选择器,根据每个句子实例的句子特征,从多个句子实例中选择目标句子实例;通过关系分类器对目标句子实例进行关系分类,得到目标句子实例的实体关系分类结果;根据实体关系分类结果和预先标注实体关系,对句子实例选择器和关系分类器的参数进行训练优化,得到目标关系抽取模型。本发明通过优化关系抽取模型,提高模型的关系分类精度。
-
公开(公告)号:CN110717049A
公开(公告)日:2020-01-21
申请号:CN201910805363.5
申请日:2019-08-29
Applicant: 四川大学 , 中国科学院信息工程研究所
Abstract: 本发明为一种面向文本数据的威胁情报知识图谱构建方法。实现了从文本威胁情报数据中自动化提取出关键信息,构建威胁情报知识图谱的功能。提出了一种面向文本数据的威胁情报知识图谱构建方法。该方法首先定义威胁情报领域的本体结构,利用基于多因素的威胁情报命名实体识别模型与基于图神经网络的威胁情报实体关系抽取模型从文本数据中获取威胁情报实体与关系三元组,最后通过图数据库存储信息,构成威胁情报知识图谱。
-
公开(公告)号:CN109858018A
公开(公告)日:2019-06-07
申请号:CN201811589770.9
申请日:2018-12-25
Applicant: 中国科学院信息工程研究所
IPC: G06F17/27
Abstract: 本发明涉及一种面向威胁情报的实体识别方法及系统。该方法包括:1)对作为训练语料的威胁情报文本进行粗分词;2)构建威胁情报实体常用词词典库与规则库,对粗分词的结果进行词典匹配与规则匹配;3)基于匹配结果,为每个词标注实体标签,形成训练集;4)构建特征模板,同时建立指示词库来完善特征模板的筛选形式,使用特征模板为训练集生成其上下文特征并筛选,将筛选后得到的特征输入机器学习模型进行参数迭代训练;5)对待识别的威胁情报文本进行粗分词、词典匹配和规则匹配,利用训练完成的机器学习模型进行实体识别。本发明采用了规则、词典、模型相结合的手段完成威胁情报实体抽取,显著提高了威胁情报的实体识别精度。
-
公开(公告)号:CN108776844A
公开(公告)日:2018-11-09
申请号:CN201810332563.9
申请日:2018-04-13
Applicant: 中国科学院信息工程研究所
Abstract: 本发明提供一种基于上下文感知张量分解的社交网络用户行为预测方法及系统,该方法的步骤包括:获取用户的社交网络数据,经预处理得到完整的社交数据;基于社交数据,构建目标张量、辅助张量、用户相似性矩阵、消息主题相似矩阵及用户影响力矩阵;根据上述目标张量、辅助张量、用户相似性矩阵、消息主题相似矩阵及用户影响力矩阵,构建张量分解模型,协同分解目标张量和辅助张量,计算分解损失函数值,获得最优的转发消息用户、被转发消息以及发布消息用户的潜在特征矩阵和核心张量;根据上述的潜在特征矩阵和核心张量,补全辅助张量,对用户转发行为进行预测。
-
公开(公告)号:CN118313710A
公开(公告)日:2024-07-09
申请号:CN202410051633.9
申请日:2024-01-12
Applicant: 中国科学院信息工程研究所
IPC: G06Q10/0639 , G06Q10/04 , G06F17/18 , G06F18/22 , G06F16/31 , G06F16/35 , G06F16/36 , G06F16/951 , G06F40/295 , G06N5/022
Abstract: 本发明公开了一种多层次动态黑客组织画像方法,其步骤包括:1)从各威胁情报来源获取黑客组织的威胁情报,并按照黑客组织对所获取的威胁情报信息进行索引;2)将每一黑客组织的威胁情报信息归纳为资源性、社会性以及技术性三个维度;3)针对每一维度的威胁情报信息进行定量分析,得到对应维度的画像数据;4)根据黑客组织各维度的画像数据,该黑客组织的攻击技术特征与活动态势特征生成该黑客组织的画像。本发明结合时间信息来刻画黑客组织的动态特征,从而更好的为黑客组织的溯源追踪提供维度丰富、内涵深刻且动态的画像情报知识。
-
公开(公告)号:CN114422170B
公开(公告)日:2023-01-17
申请号:CN202111489960.5
申请日:2021-12-08
Applicant: 中国科学院信息工程研究所
IPC: H04L9/40 , H04L9/32 , H04L61/4511 , H04L67/02 , H04L69/22
Abstract: 本发明公开一种从IP地址反向获取域名的方法及系统,属于互联网技术领域,通过从输入的IP地址上获取不同类型的数据,然后分别从不同数据中抽取候选域名列表,再根据不同数据的特征从候选域名列表中选择出该IP上托管的域名,即IP‑域名对应关系。最后利用DNS系统,对获取的IP‑域名对应关系进行正向的验证。本发明能够抵御DNS劫持攻击,提取出具有高准确性的IP‑域名对应关系。
-
公开(公告)号:CN110532480B
公开(公告)日:2022-06-17
申请号:CN201910634014.1
申请日:2019-07-15
Applicant: 中国科学院信息工程研究所
IPC: G06F16/9536 , G06F16/36 , G06F16/35
Abstract: 本发明公开了一种用于人读威胁情报推荐的知识图谱构建方法及威胁情报推荐方法。本发明通过爬取微博安全大V发布的人读威胁情报等作为原始数据,构建了用于人读威胁情报推荐的知识图谱,然后将知识图谱中的实体和实体关系抽象成低维度的向量表示e;对于每一条人读威胁情报Ii,生成人读威胁情报向量e(Ij);将用户向量e(u)归一化结果和向量e(Ij)归一化结果拼接并添加对应的标记值,作为网络输入,训练该长短期记忆神经网络;对于一候选人读威胁情报,生成其对应的人读威胁情报向量并与用户u的用户向量拼接,然后输入网络,得出用户u是否会点击该候选人读威胁情报,根据判断结果确定是否将其推荐给用户u。
-
公开(公告)号:CN112926327B
公开(公告)日:2022-05-20
申请号:CN202110230354.5
申请日:2021-03-02
Applicant: 首都师范大学 , 中国科学院信息工程研究所
IPC: G06F40/295 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本申请提供了一种实体识别方法、装置、设备及存储介质,该方法包括:获取原始威胁情报文本;针对每一原始威胁情报文本,按照分词所属实体的实体类型,对该原始威胁情报文本中的每一个分词进行标记,得到训练样本;将训练样本输入实体识别模型,利用该训练样本中的每一个分词以及该分词对应的所述实体标记,对该实体识别模型进行训练,得到训练好的实体识别模型,其中,实体识别模型在训练过程中使用的损失函数用于减小所属实体标记相同的分词之间的空间距离以及增大所属实体标记不同的分词之间的空间距离;将待识别的威胁情报文本输入训练好的实体识别模型中,得到实体识别结果。可以提高对威胁情报领域内特定类型实体的识别准确度。
-
-
-
-
-
-
-
-
-