-
公开(公告)号:CN118536508A
公开(公告)日:2024-08-23
申请号:CN202410365412.9
申请日:2024-03-28
申请人: 广州大学
IPC分类号: G06F40/295 , G06F40/284 , G06F40/211 , G06F18/2415 , G06F18/2431 , G06F18/27 , G06N3/045 , G06N3/0442 , G06N3/08 , G06F21/56 , H04L9/40
摘要: 本发明公开了一种基于自回归标签子序列的威胁实体抽取方法,方法包括下述步骤:获取威胁情报文本集合,包括多个句子序列;每一个句子序列中包含多个令牌;构建命名实体识别模型,包括令牌编码器、词性编码器、标签编码器及双向序列注意力模块;将威胁情报文本集合输入令牌编码器中通过子序列特征提取得到令牌特征;把威胁情报文本集合输入词性编码器中提炼和增强每个令牌的词性特征;使用标签编码器随机初始化标签嵌入表并编码标签序列得到序列顺序依赖性特征;将令牌特征、词性特征及序列顺序依赖性特征输入双向序列注意力模块中得到命名实体标签;基于命名实体标签构建威胁实体的攻击指纹图。
-
公开(公告)号:CN116720501A
公开(公告)日:2023-09-08
申请号:CN202310680849.7
申请日:2023-06-08
申请人: 广州大学
IPC分类号: G06F40/205 , G06F40/253 , G06F40/30
摘要: 本说明书实施例提供了一种面向开源网络威胁情报的攻击实体及关系抽取方法及系统,其中,方法包括:S1.对网络威胁情报的文本信息进行分句处理,将所述文本信息拆分为单句;S2.基于信息抽取UIE框架与文本标注工具doccano,对所述单句内容是否与攻击行为相关进行分类标注,并删除与攻击行为无关的文本内容,保留攻击文本;S3.基于Spacy依存语法树规则与攻击实体保护机制结合,对攻击文本进行解析;S4.基于语义角色标注SRL获取文本信息中攻击实体以及攻击实体间的关系。本发明提高了CTI情报攻击语义信息抽取的准确率,能够更好地加强纵深防御,实现了主动防御、攻击检测、应急响应和溯源取证。
-
公开(公告)号:CN116600135A
公开(公告)日:2023-08-15
申请号:CN202310669192.4
申请日:2023-06-06
申请人: 广州大学
摘要: 本发明提供了一种基于无损压缩的溯源图压缩方法及系统,其中,方法包括:将溯源图转化为无向图,并在无向图中采用随机游走算法获取θ组细化样本,将θ组细化样本估计值的平均值作为溯源图的平均度估计值;对溯源图建立节点映射和边映射,根据节点映射和边映射合并溯源图的节点及相应边,其中,节点映射记录溯源图中子节点与所有父节点的映射,边映射记录溯源图中一对节点间边的映射;对进行合并边的时间戳通过增量编码进行压缩,对溯源图中边的时间戳的数据类型为长整型的边通过哥伦布编码进行压缩。本申请采用无损压缩的方式,将所有节点的父节点合并,可以实现比删除冗余事件更好的压缩效果。
-
-