一种实体匹配方法和装置
    82.
    发明授权

    公开(公告)号:CN113609304B

    公开(公告)日:2023-05-23

    申请号:CN202110818313.8

    申请日:2021-07-20

    Applicant: 广州大学

    Abstract: 本发明涉及实体匹配技术领域,公开了一种实体匹配方法和装置,所述方法包括:获取第一数据集和第二数据集,数据集包括若干条实体记录,实体记录包括若干个属性;获取第一数据集和第二数据集的笛卡尔乘积,得到第三数据集,根据实体记录中多个属性间的预设潜在关系,将第三数据集中每个实体记录进行句子组合,获得包括第二组合的第四数据集;将第四数据集中的第二组合输入到预设的Bert模型,Bert模型用于判断第二组合的两个句子否匹配并输出匹配结果。有益效果:将第三数据集中的实体记录替换为根据属性潜在关系生成的句子,可以使第二组合输入到Bert模型中的数据保留属性之间的联系,使数据集的实体记录匹配结果更加准确。

    一种基于标签重复率的联邦学习梯度防御方法

    公开(公告)号:CN116028804A

    公开(公告)日:2023-04-28

    申请号:CN202211426095.4

    申请日:2022-11-14

    Applicant: 广州大学

    Abstract: 本发明涉及人工智能领域,且公开了一种基于标签重复率的联邦学习梯度防御方法,经对梯度泄露数据的关系方程式的秩分析,揭示了批样本中如果存在相同的标签且所获得的标签预测概率相近时,可有效地降低梯度泄露攻击的效果,即难以从梯度中重构出输入样本。因此我们在数据集加载阶段中,对数据集的样本按照标签种类放置在对应的标签桶,然后在标签桶内将样本按置信度放置在对应的置信度层,最后按照标签重复个数的设定来构成样本组合,并打乱样本组合构成新的数据集,该基于标签重复率的联邦学习梯度防御方法,通过对梯度泄露数据的关系方程式的秩分析,从理论上论证了标签重复率对梯度泄露攻击的防御,并在实际应用中得到了验证。

    一种用于文本分类的词向量对抗样本生成方法及装置

    公开(公告)号:CN111444346B

    公开(公告)日:2023-04-18

    申请号:CN202010248226.9

    申请日:2020-03-31

    Applicant: 广州大学

    Abstract: 本发明公开了一种用于文本分类的词向量对抗样本生成方法及装置,所述方法包括:对需要文本分类的英文文本进行初始化和词嵌入,转化为对应的向量表示;根据损失函数对英文文本的单词词向量反复进行偏导运算,直至神经网络模型输出的分类结果出错;基于修改后的单词词向量,采用欧式距离公式选取空间内最靠近被修改词向量的单词,构造攻击替代词集;根据攻击替代词集对英文文本的单词进行随机替换,生成对抗样本。本发明能够有效生成针对文本分类的词向量对抗样本,在保证不改变语义、不被人察觉且不影响人类对于文本的识别分类的前提下,使得神经网络文本分类器识别出错,并保证对抗样本在降低神经网络识别概率的同时不出现非法字符。

    一种针对朴素贝叶斯分类器的边际攻击方法、装置及存储介质

    公开(公告)号:CN111522953B

    公开(公告)日:2023-04-07

    申请号:CN202010342065.X

    申请日:2020-04-24

    Applicant: 广州大学

    Abstract: 本发明公开了一种针对朴素贝叶斯分类器的边际攻击方法,步骤包括:获取文本分类器的文本类别,并且计算两个所述文本类别之间的频率比;以所述频率比作为索引,对词汇表进行排序,得到敏感词集;随机选取若干个敏感词添加到原始样本,得到对抗样本;将所述对抗样本输入到文本分类器,得到错误分类的文本类别。本发明提供了一种针对朴素贝叶斯分类器的边际攻击方法、装置及存储介质,能够高效攻击基于朴素贝叶斯的文本分类器。

    一种抑制罗生门效应的树代理模型的建立方法

    公开(公告)号:CN115713115A

    公开(公告)日:2023-02-24

    申请号:CN202211426982.1

    申请日:2022-11-15

    Applicant: 广州大学

    Abstract: 本发明涉及人工智能领域,且公开了一种抑制罗生门效应的树代理模型的建立方法,包括以下步骤:第一步:策略分析阶段,通过无监督学习进行策略的挖掘,确定节点分裂时候的特征以及特征值的选择,策略分析阶段又分为3个子阶段包括降维、合并聚类等价层以及策略抽取;第二步:树建立阶段,包括分裂和聚合操作以及基于策略层级的建树过程;第三步:基于策略层级的建树,该抑制罗生门效应的树代理模型的建立方法,逐层挖掘多层感知机的聚类分布信息,降低树节点分裂的多样性,从而抑制整体树生长的罗生门效应。

    一种基于扰动敏感性差异的对抗样本检测方法

    公开(公告)号:CN115408516A

    公开(公告)日:2022-11-29

    申请号:CN202210807194.0

    申请日:2022-07-11

    Applicant: 广州大学

    Abstract: 本发明公开了一种基于扰动敏感性差异的对抗样本检测方法,包括以下步骤:步骤1:利用攻击算法生成对抗样本;步骤2:利用梯度估计确定重要单词;步骤3:扰动重要单词,提取对抗特征;步骤4:对抗特征作为训练数据,训练二分类对抗检测器;步骤5:将待测文本输入对抗检测器,输出结果。本发明利用扰动敏感性差异提取对抗特征,较现有技术中通过复杂的表征向量构建方法,大大提升提取效率。本发明的对抗特征提取方法是建立在对抗样本的普遍性特定上,通用性强。较现有技术只能检测针对某种或者某类攻击手段生成的对抗样本,具有普适应和可推广性。

Patent Agency Ranking