-
公开(公告)号:CN116599929A
公开(公告)日:2023-08-15
申请号:CN202310524079.7
申请日:2023-05-10
Applicant: 中国科学院软件研究所
IPC: H04L61/5007 , H04L69/16 , G06F18/213 , G06F18/214 , G06N3/084
Abstract: 本发明公开了一种基于图嵌入与生成模型的IP地址定位方法,其步骤包括:1)采集多个已知IP设备的地理位置以及辅助定位特征;2)根据所述辅助定位特征构建由各IP节点构成的图结构;3)利用图嵌入模型生成所述图结构中每个IP节点的特征向量;4)对每一IP设备的地理位置信息进行离散化处理,将同一区域内的IP设备设置相同的地理信息离散编码;5)使用生成模型对每个IP节点的特征向量进行特征降维,并用该IP节点对应的地理信息离散编码进行监督训练优化生成模型,将优化后的生成模型作为降维网络;6)对于一待定位的IP设备k,生成该IP设备k的特征向量并将其输入降维网络,预测得到该IP设备k的定位结果。
-
公开(公告)号:CN116707928A
公开(公告)日:2023-09-05
申请号:CN202310718233.4
申请日:2023-06-16
Applicant: 中国科学院软件研究所
IPC: H04L9/40 , G06F40/295 , G06N3/048 , G06N3/084 , G06N5/022
Abstract: 本发明涉及一种规则匹配与预训练语言模型相结合的威胁知识抽取方法和系统。该法包括:确定需要抽取的网络安全实体类型;编制规则匹配过程所需的规则;将非结构化威胁情报文本经过规则匹配过程,得到初步实体标注结果,并将其向量化;将非结构化威胁情报文本输入预训练语言模型,获得文本的向量化表示,将规则匹配过程获取的标注向量与预训练语言模型获得的向量化表示进行拼接,并输入下游深度神经网络,获得最终实体标注结果。本发明将规则匹配模型与预训练语言模型相结合,应用于网络安全威胁知识抽取,够有效地从自然语言型威胁情报中抽取出网络安全领域相关实体。
-
公开(公告)号:CN118940145A
公开(公告)日:2024-11-12
申请号:CN202410943933.8
申请日:2024-07-15
Applicant: 中国科学院软件研究所
IPC: G06F18/2415 , G06F18/28 , G06F40/289 , G06F18/22 , G06F18/213 , G06F18/25 , G06N3/045 , G06N3/047
Abstract: 本发明公开了一种威胁数据的分类分级识别方法及系统,属于自然语言处理领域。本发明构建精细化的网络安全数据字典,对获取的网络流量数据进行词典的词语匹配确定命中文本,再通过Bert模型和相似度计算获取相似度最高的命中文本,然后将拼接特征经过信息融合和特征值指数运算确定类别,再然后经过特征提取并与观测属性匹配确定重要程度级别,最后经过敏感度分数计算确定具体的等级。本发明实现了对网络流量的威胁数据的特征精准刻画和精准分类分级。
-
-