关系抽取模型的训练方法、关系抽取方法、设备及介质

    公开(公告)号:CN112307170A

    公开(公告)日:2021-02-02

    申请号:CN202011199788.5

    申请日:2020-10-29

    摘要: 本发明提供一种关系抽取模型的训练方法、关系抽取方法、设备及介质,涉及威胁情报关系处理技术领域。该方法包括:对数据集中每个文本语料中的多个句子实例进行特征处理,得到每个句子实例的初始特征;通过特征转换器对初始特征进行转换,得到每个句子实例的句子特征;通过句子实例选择器,根据每个句子实例的句子特征,从多个句子实例中选择目标句子实例;通过关系分类器对目标句子实例进行关系分类,得到目标句子实例的实体关系分类结果;根据实体关系分类结果和预先标注实体关系,对句子实例选择器和关系分类器的参数进行训练优化,得到目标关系抽取模型。本发明通过优化关系抽取模型,提高模型的关系分类精度。

    一种实体识别方法、装置、设备及存储介质

    公开(公告)号:CN112926327B

    公开(公告)日:2022-05-20

    申请号:CN202110230354.5

    申请日:2021-03-02

    摘要: 本申请提供了一种实体识别方法、装置、设备及存储介质,该方法包括:获取原始威胁情报文本;针对每一原始威胁情报文本,按照分词所属实体的实体类型,对该原始威胁情报文本中的每一个分词进行标记,得到训练样本;将训练样本输入实体识别模型,利用该训练样本中的每一个分词以及该分词对应的所述实体标记,对该实体识别模型进行训练,得到训练好的实体识别模型,其中,实体识别模型在训练过程中使用的损失函数用于减小所属实体标记相同的分词之间的空间距离以及增大所属实体标记不同的分词之间的空间距离;将待识别的威胁情报文本输入训练好的实体识别模型中,得到实体识别结果。可以提高对威胁情报领域内特定类型实体的识别准确度。

    一种基于动态分析技术的恶意PowerShell检测方法及系统

    公开(公告)号:CN116611059A

    公开(公告)日:2023-08-18

    申请号:CN202310089403.7

    申请日:2023-02-09

    IPC分类号: G06F21/56

    摘要: 本发明提出一种基于动态分析技术的恶意PowerShell检测方法及系统。该方法包括以下步骤:在PowerShell配置文件以及CLR中设置监控点,运行PowerShell代码,捕获PowerShell的运行时信息;以进程为单位将单个进程捕获到的所有PowerShell代码运行时信息转换为按照调用先后顺序的形式进行存储,形成行为序列数据集;综合SHAP、Permutation以及Boruta算法发掘行为序列数据集中潜在的恶意行为序列,汇总生成恶意行为特征库;将捕获的待检测PowerShell代码的运行时信息与恶意行为特征库进行对比,从而检测PowerShell的恶意性,如果匹配成功则阻断恶意PowerShell进程的执行。本发明设置的监控点位于PowerShell命令以及CLR中,监控粒度更详细,语义信息更加丰富,便于提取恶意序列实施监控,在PowerShell运行时检测PowerShell的恶意性,能够及时阻断恶意PowerShell的执行。

    基于上下文感知张量分解的社交网络用户行为预测方法

    公开(公告)号:CN108776844B

    公开(公告)日:2021-09-14

    申请号:CN201810332563.9

    申请日:2018-04-13

    摘要: 本发明提供一种基于上下文感知张量分解的社交网络用户行为预测方法及系统,该方法的步骤包括:获取用户的社交网络数据,经预处理得到完整的社交数据;基于社交数据,构建目标张量、辅助张量、用户相似性矩阵、消息主题相似矩阵及用户影响力矩阵;根据上述目标张量、辅助张量、用户相似性矩阵、消息主题相似矩阵及用户影响力矩阵,构建张量分解模型,协同分解目标张量和辅助张量,计算分解损失函数值,获得最优的转发消息用户、被转发消息以及发布消息用户的潜在特征矩阵和核心张量;根据上述的潜在特征矩阵和核心张量,补全辅助张量,对用户转发行为进行预测。

    基于图卷积神经网络的webshell检测方法及装置

    公开(公告)号:CN113194064A

    公开(公告)日:2021-07-30

    申请号:CN202110282017.0

    申请日:2021-03-16

    IPC分类号: H04L29/06 G06N3/04 H04L29/08

    摘要: 本发明公开了一种基于图卷积神经网络的webshell检测方法及装置,包括:解析流量数据包;根据流量间的跳转关系构建流量关联图,并依据流量关联图,得到该流量数据包的邻接矩阵;获取流量关联图中每一节点的特征向量;将邻接矩阵与特征向量输入双层GCN模型,得到webshell检测结果。本发明在特征提取阶段除了对常规的流量特征进行提取外,还根据流量间的跳转关系,建立图模型,提取流量间的关联特征,并引入了深度学习领域的图卷积技术,从而提高了webshell检测准确率。

    一种面向文本数据的威胁情报知识图谱构建方法

    公开(公告)号:CN110717049A

    公开(公告)日:2020-01-21

    申请号:CN201910805363.5

    申请日:2019-08-29

    IPC分类号: G06F16/36 G06F16/35 H04L29/06

    摘要: 本发明为一种面向文本数据的威胁情报知识图谱构建方法。实现了从文本威胁情报数据中自动化提取出关键信息,构建威胁情报知识图谱的功能。提出了一种面向文本数据的威胁情报知识图谱构建方法。该方法首先定义威胁情报领域的本体结构,利用基于多因素的威胁情报命名实体识别模型与基于图神经网络的威胁情报实体关系抽取模型从文本数据中获取威胁情报实体与关系三元组,最后通过图数据库存储信息,构成威胁情报知识图谱。