一种用于神经机器翻译的字符级对抗样本生成方法及装置

    公开(公告)号:CN111460837A

    公开(公告)日:2020-07-28

    申请号:CN202010248326.1

    申请日:2020-03-31

    Applicant: 广州大学

    Abstract: 本发明公开了一种用于神经机器翻译的字符级对抗样本生成方法及装置,所述方法包括:从需要翻译的文本中随机选定源语言句子;根据预设的攻击方式组合随机修改源语言句子的单词,生成对抗样本;其中,所述攻击方式包括交换攻击、中间随机攻击、完全随机攻击和键盘错误攻击。本发明通过交换、中间随机、完全随机、键盘错误四种攻击方式修改源语言句子,在最小程度上对语句进行更改,生成在最大限度上不引发人类察觉的对抗样本,在不需要知晓被攻击模型的内部结构和参数的情况下,仅需要调用神经网络得到翻译译文,使得神经机器翻译模型的翻译质量大大降低,提高对抗样本的成功率,并且极大降低了算法的时间和复杂度,提高对抗样本的生成效率。

    一种基于Apriori算法挖掘二维数据间关联规则的方法

    公开(公告)号:CN111309787A

    公开(公告)日:2020-06-19

    申请号:CN202010136449.6

    申请日:2020-03-02

    Applicant: 广州大学

    Abstract: 本发明公开了一种基于Apriori算法挖掘二维数据间关联规则的方法,通过获取关系型数据库中的二维连续型数据表,对二维连续型数据表进行离散化处理,得到二维离散化数据表,然后通过Apriori算法挖掘出二维离散化数据表中各数据之间的频繁项集,并生成频繁项集的关联规则,同时计算每一条规则的置信度,最后根据亲密度计算公式、每一条规则的置信度以及频繁项集的关联规则,计算得到二层级数据的关联规则,可以挖掘二维数据表属性之间的关联规则,从而确定属性间的亲密关系。

    一种传感云环境下的数据源质量评估方法

    公开(公告)号:CN110011847A

    公开(公告)日:2019-07-12

    申请号:CN201910256445.9

    申请日:2019-03-29

    Applicant: 广州大学

    Abstract: 本发明实施例公开了一种传感云环境下的数据源质量评估方法,包括:获取传感云存储数据源的当前和历史监测数据,所述传感云是云计算和无线传感器网络的结合体,用于收集来自多个传感器节点或传感器子网络的监测数据并加以处理;基于空间关联性和时间关联性整合数据源的监测数据并确定数据真值;基于所述数据真值生成数据源的初始质量评估向量,并根据质量规则调整所述数据源的初始质量评估向量;根据调整后的所述数据源的初始质量评估向量计算所述数据源的最终质量评估结果。采用本发明,可以多角度描述数据源质量,对数据源质量的刻画更为全面。

    一种面向多分类的不平衡数据预处理方法、装置及设备

    公开(公告)号:CN109033148A

    公开(公告)日:2018-12-18

    申请号:CN201810599969.3

    申请日:2018-06-11

    Applicant: 广州大学

    Abstract: 本发明公开一种面向多分类的不平衡数据预处理方法、装置、设备,方法包括:接收最终样本集大小及样例集的不平衡比,得出每个类别的理想样例个数;根据理想样例个数和实际样例个数判断少数类样例集和多数类样例集;对少数类样例集中的样例,计算k近邻中其他类样例和少数类样例的个数,以分类标记;对少数类样例集中的样例,根据样例的标记进行删除、保存、复制或合成,得到最终少数类样例集;对多数类样例集中的样例,计算k近邻中该多数类样例和其他类样例的个数,以分类标记;对多数类样例集中的样例,根据样例的标记进行删除或保存,得到最终多数类样例集;生成最终样本集。本发明使得最终样本集能有效提高多分类算法的准确性。

    基于话题表示与多维特征嵌入的群体行为预测方法

    公开(公告)号:CN117454143B

    公开(公告)日:2024-08-02

    申请号:CN202311179820.7

    申请日:2023-09-13

    Applicant: 广州大学

    Abstract: 本发明公开了一种基于话题表示与多维特征嵌入的群体行为预测方法,具体为:S1话题表示:通过N‑gram模型获取话题中文本的词项序列,通过TF‑IDF评估词项序列中词项的重要程度来构建保留词典,将词典与LDA主题模型的主题分析结果进行对比,形成词项序列集,从而有效地表示及区分话题,提升行为预测的准确率。S2特征表示与融合:对用户行为设置权重,根据用户间的联系程度设置衡量因子,最后为用户间的连接边设置综合权重,以此重构话题消息传播网络,再采用Node2vec算法获取节点的嵌入向量表示得到网络结构特征向量。S3、构建群体行为预测模型:基于混合深度神经网络模型,学习和表示词项序列集,将属性和结构两个维度的特征作为嵌入特征,实现用户群体行为的预测。

    基于自监督图注意力网络的人员群体预测方法及装置

    公开(公告)号:CN117435935A

    公开(公告)日:2024-01-23

    申请号:CN202311176803.8

    申请日:2023-09-13

    Applicant: 广州大学

    Abstract: 本发明公开了一种基于自监督图注意力网络的人员群体预测方法及装置,包括:构建属性图,将属性图输入到改进的GAT模型,得到人员嵌入;将所述属性图中的属性经过拉普拉斯平滑滤波器过滤,对齐改进的GAT模型输出的嵌入特征维度,由此作为改进的GAT模型输出嵌入的监督嵌入;随机遮盖人员嵌入,预测结果计算损失并通过自监督训练模型;利用新的数据得到新人员的嵌入并利用训练好的GAT模型聚类划分人员群体,计算、聚合相似度获得人员群体预测结果。本发明以改进的GAT模型构建人员群体预测模型获得新节点的嵌入,使用拉普拉斯滤波器过滤后的属性矩阵作为监督嵌入,通过随机遮盖已有嵌入来训练改进的GAT模型,从而提高了人员群体预测方法的通用性和泛化性。

Patent Agency Ranking