缓解神经网络对未知类样本产生错误分类的方法及装置

    公开(公告)号:CN111507396B

    公开(公告)日:2023-08-08

    申请号:CN202010297682.2

    申请日:2020-04-15

    申请人: 广州大学

    摘要: 本发明公开了一种缓解神经网络对未知类样本产生错误分类的方法及装置,所述方法在训练神经网络的时候,将原始训练集和未知类样本训练集输入到神经网络中进行训练,对于原始训练集通过第一损失函数进行训练,对于未知类样本训练集通过第二损失函数进行训练,当神经网络的总损失函数达到最小值时,神经网络训练完成,由于只有当神经网络对原始训练集中的训练样本的类别做出最高置信度的正确预测时,第一损失函数的损失值最小,而当神经网络对未知类样本的训练样本的类别做出最低置信度的错误预测时,第二损失函数的损失值最小,因此通过实施本发明实施例能缓解现有神经网络对于未知类样本产生高置信度错误分类的问题。

    一种基于K最近邻图的分布外检测技术

    公开(公告)号:CN116467650A

    公开(公告)日:2023-07-21

    申请号:CN202310222879.3

    申请日:2023-03-08

    申请人: 广州大学

    摘要: 本发明涉及计算机视觉和深度学习技术领域,且公开了基于K最近邻图的分布外检测技术,首先使用神经网络对分布内训练数据进行特征提取;其次把分布内数据集的特征作为结点,使用这些结点初始化并重建K最近邻图;测试时,在K最近邻图中搜索测试样本的K个最近邻结点,并为测试样本计算分布外检测分数;如果分布外检测分数小于阈值,则判断测试样本为分布内数据,并把代表该样本的结点加入K最近邻图,否则判断该测试样本为分布外数据。该基于K最近邻图的分布外检测技术,通过构建K最近邻图,加快了搜索最近邻结点的速度;在计算特征距离的时候,在余弦相似度的基础上,增加特征的全局代表性的权重,充分利用了更具分布内全局代表性的特征。

    基于知识体的分布式知识图谱构建系统及方法

    公开(公告)号:CN111813953B

    公开(公告)日:2023-07-07

    申请号:CN202010577664.X

    申请日:2020-06-23

    申请人: 广州大学

    摘要: 本发明公开了一种基于知识体的分布式知识图谱构建系统及方法,系统采用软构件思想,将知识图谱分解为一个个运行的知识体,以此构建基于知识体的分布式知识图谱。其中,知识体工厂用于生成和组装知识体,知识体库存储知识体并建立目录索引,知识体检索器用于从知识体目录检索知识体和从构件库中检索基础构件,知识体部署器用于把知识体部署到知识体容器中运行,目录服务用于将该运行的知识体注册到知识体目录中。构建得到的分布式网络安全知识图谱支持就近的网络安全知识匹配和网络安全事件发现,多个知识体之间可以交互,也支持多知识体面向任务的协同计算和协同推理,以发现复杂攻击和更大规模的网络安全事件。

    一种实体匹配方法和装置
    105.
    发明授权

    公开(公告)号:CN113609304B

    公开(公告)日:2023-05-23

    申请号:CN202110818313.8

    申请日:2021-07-20

    申请人: 广州大学

    IPC分类号: G06F16/36

    摘要: 本发明涉及实体匹配技术领域,公开了一种实体匹配方法和装置,所述方法包括:获取第一数据集和第二数据集,数据集包括若干条实体记录,实体记录包括若干个属性;获取第一数据集和第二数据集的笛卡尔乘积,得到第三数据集,根据实体记录中多个属性间的预设潜在关系,将第三数据集中每个实体记录进行句子组合,获得包括第二组合的第四数据集;将第四数据集中的第二组合输入到预设的Bert模型,Bert模型用于判断第二组合的两个句子否匹配并输出匹配结果。有益效果:将第三数据集中的实体记录替换为根据属性潜在关系生成的句子,可以使第二组合输入到Bert模型中的数据保留属性之间的联系,使数据集的实体记录匹配结果更加准确。

    一种恶意代码检测方法及系统

    公开(公告)号:CN111143842B

    公开(公告)日:2022-07-01

    申请号:CN201911270920.4

    申请日:2019-12-12

    申请人: 广州大学

    IPC分类号: G06F21/56 G06K9/62

    摘要: 本发明公开了一种恶意代码检测方法及系统,方法包括:S1、将每个恶意代码运行过程中的WindowsAPI动作序列视作一个具有上下文关系的文本,分别使用TF‑IDF和Doc2vec进行特征抽取;S2、在分别获得TF‑IDF和Doc2vec特征矩阵后,将TF‑IDF和Doc2vec抽取到的特征进行拼接,降维后获得恶意代码的特征矩阵;S3、构造基于聚类的集成分类改进模型,采用多个基学习器对数据集进行分类,并在最后采用投票的方式获得最终分类结果,S4、在预测阶段将样本分别输入每个基学习器中与之最近的单一类别类簇/SVM分类器中并输出预测类别,最后根据投票原则,学习器输出类别中占多数的类别为最终预测类别。本发明将TF‑IDF和Doc2vec结合,不仅考虑恶意代码动作序列中API的频率,也考虑动作序列的上下文关联,提高恶意代码检测的准确性。

    知识图谱推荐系统的对抗攻击方法、系统、设备及介质

    公开(公告)号:CN114143035A

    公开(公告)日:2022-03-04

    申请号:CN202111297518.2

    申请日:2021-11-04

    申请人: 广州大学

    IPC分类号: H04L9/40 G06N5/02

    摘要: 本发明涉及网络安全技术领域,尤其涉及一种知识图谱推荐系统的对抗攻击方法、系统、设备及介质,包括:若将新用户确定为攻击目标,则以新用户为起点,依次在各指定跳数范围内获取对应的目标商品节点数量和边数量;并根据目标商品节点数量和边数量,得到推荐权重;对所述新用户添加目标商品叶子节点和边,并更新推荐权重;根据更新后的推荐权重,得到攻击成功率和攻击发现概率;解决了现有对知识图谱的攻击扰动过大,容易暴露攻击行为,且难以对某一特定实体发起有目标攻击,难以应对使用量较多的交互式推荐系统的问题,本发明在保证交互式知识图谱扰动较小的情况下,通过添加目标商品叶子节点和边实现了对抗攻击,攻击方式更高效。

    文本对抗样本生成方法、系统、计算机设备和存储介质

    公开(公告)号:CN114091448A

    公开(公告)日:2022-02-25

    申请号:CN202111237436.9

    申请日:2021-10-22

    申请人: 广州大学

    摘要: 本发明公开了文本对抗样本生成方法、系统、计算机设备和存储介质。所述方法包括:对获取的数据集中的单词进行tf‑idf得分计算,得到所述数据集的词性词典和不同标签对应的攻击词集;从所述数据集中选择与原始样本的标签相对应的攻击词集,并从中选择攻击得分最高的单词作为攻击词;根据预设的句子模板,选择所述攻击词的词性对应的句法规则,从所述词性词典中选择规则对应的单词,与所述攻击词共同构成符合所述句法规则的句子;根据预设的添加条件,将所述句子添加到所述原始样本中,得到新样本;根据预设的迭代条件对所述新样本进行多轮迭代计算,得到对抗样本。本发明能够避免拼写和语法错误,具有低修改率和高攻击性,提高了攻击效率。

    基于集成学习的恶意软件加密流量检测方法

    公开(公告)号:CN113704762A

    公开(公告)日:2021-11-26

    申请号:CN202111024464.2

    申请日:2021-09-02

    申请人: 广州大学

    摘要: 本发明公开了一种基于集成学习的恶意软件加密流量检测方法,方法包括下述步骤:收集加密流量样本集,所述加密流量样本集包括多个异构特征;基于加密流量样本集的多个异构特征,构建相应的多个特征分类器;基于所述多个特征分类器构建恶意软件加密流量检测模型,所述恶意软件加密流量检测模型利用多个特征分类器的多数投票来判断主机是否感染恶意软件。本发明可解决现有恶意软件流量检测系统检出率低,误报率高的问题,相对于深度报文检测DPI技术,本发明不需要对加密数据包进行解密,只需根据数据包的可观察特征就能适用于恶意加密流量的检测,并且具有高检出率,低误报率的特性。