-
公开(公告)号:CN114386511B
公开(公告)日:2023-06-23
申请号:CN202210035910.8
申请日:2022-01-11
Applicant: 广州大学
IPC: G06F18/241 , G06F18/214 , G06N3/0464 , G06N3/08
Abstract: 本发明提供基于多维度特征融合和模型集成的恶意软件家族分类方法,包括S1获取恶意软件PE文件,根据获取的PE文件提取多个维度的恶意软件特征;其中恶意软件特征包括:Ember特征、TF‑IDF特征和Asm2Vec;S2根据提取的恶意软件特征进行特征融合和特征选择处理,得到恶意软件家族分类特征集;S3以XGBoost作为基础模型,根据得到的恶意软件家族分类特征集中的特征分别单独训练基础模型,并根据训练好的基础模型对训练集样本进行预测,根据得到预测结果计算各特征在对应各家族上的权重值;并采用加权软投票的方式来计算恶意软件家族分类预测结果。本发明有助于提高恶意软件家族分类的性能和泛化能力。
-
公开(公告)号:CN113609304B
公开(公告)日:2023-05-23
申请号:CN202110818313.8
申请日:2021-07-20
Applicant: 广州大学
IPC: G06F16/36
Abstract: 本发明涉及实体匹配技术领域,公开了一种实体匹配方法和装置,所述方法包括:获取第一数据集和第二数据集,数据集包括若干条实体记录,实体记录包括若干个属性;获取第一数据集和第二数据集的笛卡尔乘积,得到第三数据集,根据实体记录中多个属性间的预设潜在关系,将第三数据集中每个实体记录进行句子组合,获得包括第二组合的第四数据集;将第四数据集中的第二组合输入到预设的Bert模型,Bert模型用于判断第二组合的两个句子否匹配并输出匹配结果。有益效果:将第三数据集中的实体记录替换为根据属性潜在关系生成的句子,可以使第二组合输入到Bert模型中的数据保留属性之间的联系,使数据集的实体记录匹配结果更加准确。
-
公开(公告)号:CN116028804A
公开(公告)日:2023-04-28
申请号:CN202211426095.4
申请日:2022-11-14
Applicant: 广州大学
IPC: G06F18/214 , G06F18/241 , G06N3/04 , G06N3/08
Abstract: 本发明涉及人工智能领域,且公开了一种基于标签重复率的联邦学习梯度防御方法,经对梯度泄露数据的关系方程式的秩分析,揭示了批样本中如果存在相同的标签且所获得的标签预测概率相近时,可有效地降低梯度泄露攻击的效果,即难以从梯度中重构出输入样本。因此我们在数据集加载阶段中,对数据集的样本按照标签种类放置在对应的标签桶,然后在标签桶内将样本按置信度放置在对应的置信度层,最后按照标签重复个数的设定来构成样本组合,并打乱样本组合构成新的数据集,该基于标签重复率的联邦学习梯度防御方法,通过对梯度泄露数据的关系方程式的秩分析,从理论上论证了标签重复率对梯度泄露攻击的防御,并在实际应用中得到了验证。
-
公开(公告)号:CN111444346B
公开(公告)日:2023-04-18
申请号:CN202010248226.9
申请日:2020-03-31
Applicant: 广州大学
IPC: G06F16/35 , G06F40/216 , G06F40/284 , G06N3/0475 , G06N3/045 , G06N3/094
Abstract: 本发明公开了一种用于文本分类的词向量对抗样本生成方法及装置,所述方法包括:对需要文本分类的英文文本进行初始化和词嵌入,转化为对应的向量表示;根据损失函数对英文文本的单词词向量反复进行偏导运算,直至神经网络模型输出的分类结果出错;基于修改后的单词词向量,采用欧式距离公式选取空间内最靠近被修改词向量的单词,构造攻击替代词集;根据攻击替代词集对英文文本的单词进行随机替换,生成对抗样本。本发明能够有效生成针对文本分类的词向量对抗样本,在保证不改变语义、不被人察觉且不影响人类对于文本的识别分类的前提下,使得神经网络文本分类器识别出错,并保证对抗样本在降低神经网络识别概率的同时不出现非法字符。
-
公开(公告)号:CN111522953B
公开(公告)日:2023-04-07
申请号:CN202010342065.X
申请日:2020-04-24
Applicant: 广州大学
IPC: G06F16/35
Abstract: 本发明公开了一种针对朴素贝叶斯分类器的边际攻击方法,步骤包括:获取文本分类器的文本类别,并且计算两个所述文本类别之间的频率比;以所述频率比作为索引,对词汇表进行排序,得到敏感词集;随机选取若干个敏感词添加到原始样本,得到对抗样本;将所述对抗样本输入到文本分类器,得到错误分类的文本类别。本发明提供了一种针对朴素贝叶斯分类器的边际攻击方法、装置及存储介质,能够高效攻击基于朴素贝叶斯的文本分类器。
-
公开(公告)号:CN115774788A
公开(公告)日:2023-03-10
申请号:CN202211455237.X
申请日:2022-11-21
Applicant: 电子科技大学 , 电子科技大学(深圳)高等研究院 , 广州大学
Abstract: 本发明公开了一种用于知识图谱嵌入模型的负采样方法,包括以下步骤:S1:初始化n个包含N个负样本的存储空间;S2:根据给定的正样本三元组,基于实体集合ε中全部实体生成负样本集合,通过均匀采样,从负样本集合中采样得到2*N1个负样本;S3:将步骤S2得到的若干个负样本添加至所储空间;S4:对存储空间中的负样本进行重要性评估;S5:对存储空间中所有负样本的重要性进行排序,保留重要性分数高的N3个样本;S6:从保留的负样本中均匀采样N个负样本组成HNS;S7:重复步骤S2‑S6n次;S8:对模型进行迭代训练。本发明提供的技术方案占用资源少,运行效率高,广泛适用于各种知识图谱模型。
-
公开(公告)号:CN115713115A
公开(公告)日:2023-02-24
申请号:CN202211426982.1
申请日:2022-11-15
Applicant: 广州大学
IPC: G06N5/01 , G06F18/23 , G06F18/2135
Abstract: 本发明涉及人工智能领域,且公开了一种抑制罗生门效应的树代理模型的建立方法,包括以下步骤:第一步:策略分析阶段,通过无监督学习进行策略的挖掘,确定节点分裂时候的特征以及特征值的选择,策略分析阶段又分为3个子阶段包括降维、合并聚类等价层以及策略抽取;第二步:树建立阶段,包括分裂和聚合操作以及基于策略层级的建树过程;第三步:基于策略层级的建树,该抑制罗生门效应的树代理模型的建立方法,逐层挖掘多层感知机的聚类分布信息,降低树节点分裂的多样性,从而抑制整体树生长的罗生门效应。
-
-
公开(公告)号:CN115412328A
公开(公告)日:2022-11-29
申请号:CN202211014967.6
申请日:2022-08-23
Applicant: 广州大学 , 中国电力科学研究院有限公司 , 国网上海市电力公司
Abstract: 本发明公开了一种基于机器学习的攻击路径溯源和攻击源头检测方法,包括:构建大型网络有向攻击图,针对不同的源主机和目标主机进行统一编号,并将相邻主机之间的可达性存储为二维邻接矩阵,利用深度优先遍历算法和二维邻接矩阵找出源主机和目标主机之间所有可达路径,从所有可达路径中筛选出符合依照事件时间顺序的实际可行路径,对实际可行路径的权重进行初始化,利用路径排序算法计算攻击源头概率,选出概率值最大的作为攻击源头,对计算攻击源头概率过程中路径权重不断迭代寻优,得出最优情况下的路径权重值;本发明有效提升了攻击源头检测的效率,能够发现在整个大型网络中与该起攻击事件密切相关的多个节点,可为防御者快速找到突破口。
-
公开(公告)号:CN115408516A
公开(公告)日:2022-11-29
申请号:CN202210807194.0
申请日:2022-07-11
Applicant: 广州大学
Abstract: 本发明公开了一种基于扰动敏感性差异的对抗样本检测方法,包括以下步骤:步骤1:利用攻击算法生成对抗样本;步骤2:利用梯度估计确定重要单词;步骤3:扰动重要单词,提取对抗特征;步骤4:对抗特征作为训练数据,训练二分类对抗检测器;步骤5:将待测文本输入对抗检测器,输出结果。本发明利用扰动敏感性差异提取对抗特征,较现有技术中通过复杂的表征向量构建方法,大大提升提取效率。本发明的对抗特征提取方法是建立在对抗样本的普遍性特定上,通用性强。较现有技术只能检测针对某种或者某类攻击手段生成的对抗样本,具有普适应和可推广性。
-
-
-
-
-
-
-
-
-