-
公开(公告)号:CN111460837A
公开(公告)日:2020-07-28
申请号:CN202010248326.1
申请日:2020-03-31
Applicant: 广州大学
IPC: G06F40/58 , G06F40/232 , G06F40/284
Abstract: 本发明公开了一种用于神经机器翻译的字符级对抗样本生成方法及装置,所述方法包括:从需要翻译的文本中随机选定源语言句子;根据预设的攻击方式组合随机修改源语言句子的单词,生成对抗样本;其中,所述攻击方式包括交换攻击、中间随机攻击、完全随机攻击和键盘错误攻击。本发明通过交换、中间随机、完全随机、键盘错误四种攻击方式修改源语言句子,在最小程度上对语句进行更改,生成在最大限度上不引发人类察觉的对抗样本,在不需要知晓被攻击模型的内部结构和参数的情况下,仅需要调用神经网络得到翻译译文,使得神经机器翻译模型的翻译质量大大降低,提高对抗样本的成功率,并且极大降低了算法的时间和复杂度,提高对抗样本的生成效率。
-
公开(公告)号:CN111371611A
公开(公告)日:2020-07-03
申请号:CN202010133626.5
申请日:2020-02-28
Applicant: 广州大学
Abstract: 本发明公开了一种基于深度学习的加权网络社区发现方法及装置。所述方法包括:对给定的加权网络图进行预处理,得到二阶邻相似度矩阵;通过深度稀疏自编码器提取所述二阶邻相似度矩阵的低维特征,得到低维特征矩阵;根据聚类算法对所述低维特征矩阵进行聚类,得到社区发现结果。本发明能够综合考虑节点与邻居节点,及与邻居节点的邻居节点之间的联系,提高社区发现的准确度。
-
公开(公告)号:CN111309787A
公开(公告)日:2020-06-19
申请号:CN202010136449.6
申请日:2020-03-02
Applicant: 广州大学
IPC: G06F16/2458 , G06N5/02
Abstract: 本发明公开了一种基于Apriori算法挖掘二维数据间关联规则的方法,通过获取关系型数据库中的二维连续型数据表,对二维连续型数据表进行离散化处理,得到二维离散化数据表,然后通过Apriori算法挖掘出二维离散化数据表中各数据之间的频繁项集,并生成频繁项集的关联规则,同时计算每一条规则的置信度,最后根据亲密度计算公式、每一条规则的置信度以及频繁项集的关联规则,计算得到二层级数据的关联规则,可以挖掘二维数据表属性之间的关联规则,从而确定属性间的亲密关系。
-
公开(公告)号:CN110011847A
公开(公告)日:2019-07-12
申请号:CN201910256445.9
申请日:2019-03-29
Applicant: 广州大学
Abstract: 本发明实施例公开了一种传感云环境下的数据源质量评估方法,包括:获取传感云存储数据源的当前和历史监测数据,所述传感云是云计算和无线传感器网络的结合体,用于收集来自多个传感器节点或传感器子网络的监测数据并加以处理;基于空间关联性和时间关联性整合数据源的监测数据并确定数据真值;基于所述数据真值生成数据源的初始质量评估向量,并根据质量规则调整所述数据源的初始质量评估向量;根据调整后的所述数据源的初始质量评估向量计算所述数据源的最终质量评估结果。采用本发明,可以多角度描述数据源质量,对数据源质量的刻画更为全面。
-
公开(公告)号:CN109033148A
公开(公告)日:2018-12-18
申请号:CN201810599969.3
申请日:2018-06-11
Applicant: 广州大学
IPC: G06F17/30
Abstract: 本发明公开一种面向多分类的不平衡数据预处理方法、装置、设备,方法包括:接收最终样本集大小及样例集的不平衡比,得出每个类别的理想样例个数;根据理想样例个数和实际样例个数判断少数类样例集和多数类样例集;对少数类样例集中的样例,计算k近邻中其他类样例和少数类样例的个数,以分类标记;对少数类样例集中的样例,根据样例的标记进行删除、保存、复制或合成,得到最终少数类样例集;对多数类样例集中的样例,计算k近邻中该多数类样例和其他类样例的个数,以分类标记;对多数类样例集中的样例,根据样例的标记进行删除或保存,得到最终多数类样例集;生成最终样本集。本发明使得最终样本集能有效提高多分类算法的准确性。
-
公开(公告)号:CN117454143B
公开(公告)日:2024-08-02
申请号:CN202311179820.7
申请日:2023-09-13
Applicant: 广州大学
IPC: G06F18/213 , G06F18/25 , G06F40/216 , G06N3/0442 , G06N3/045 , G06N3/048 , G06Q50/00 , G06N3/08
Abstract: 本发明公开了一种基于话题表示与多维特征嵌入的群体行为预测方法,具体为:S1话题表示:通过N‑gram模型获取话题中文本的词项序列,通过TF‑IDF评估词项序列中词项的重要程度来构建保留词典,将词典与LDA主题模型的主题分析结果进行对比,形成词项序列集,从而有效地表示及区分话题,提升行为预测的准确率。S2特征表示与融合:对用户行为设置权重,根据用户间的联系程度设置衡量因子,最后为用户间的连接边设置综合权重,以此重构话题消息传播网络,再采用Node2vec算法获取节点的嵌入向量表示得到网络结构特征向量。S3、构建群体行为预测模型:基于混合深度神经网络模型,学习和表示词项序列集,将属性和结构两个维度的特征作为嵌入特征,实现用户群体行为的预测。
-
公开(公告)号:CN118378188A
公开(公告)日:2024-07-23
申请号:CN202410546128.1
申请日:2024-05-06
Applicant: 广州大学
IPC: G06F18/2433 , G06F18/213 , G06N3/0455 , G06N3/0895 , G06F16/901 , G06F18/22
Abstract: 本发明公开了一种基于对比表示学习的系统级溯源图中异常节点检测方法及装置,包括:通过不同的日志采集工具对不同系统内核级审计日志进行采集;对采集得到的审计日志进行解析后构造溯源图,并对溯源图的溯源数据进行存储;对所述溯源图中的节点进行处理,包括赋予节点标签和获取节点特征;将经过节点数据处理后的节点输入对比自编码器进行训练,得到训练好的对比自编码器;将待检测溯源图节点集合输入至预先训练好的对比编码器进行编码,在编码后的低维潜在空间中进行基于绝对中位差的异常节点检测。本发明通过对比自编码器的表示学习,有效检测溯源图中异常节点,解决了模型鲁棒性不足及性能退化问题。
-
公开(公告)号:CN116361476B
公开(公告)日:2024-05-17
申请号:CN202211455256.2
申请日:2022-11-21
Applicant: 电子科技大学 , 电子科技大学(深圳)高等研究院 , 广州大学
IPC: G06F16/36 , G06F18/22 , G06F18/214
Abstract: 本发明公开了一种基于插值法的知识图谱负样本合成方法,包括以下步骤:S1:候选集筛选:从负样本中筛选负样本集合cand_il,作为mixup操作的候选集;S2:mixup样本合成:选择cand_il中的负样本进行合成得到cand_im,再将cand_im中的负样本和正样本#imgabs0#进行二次mixup合成;S3:训练更新:将得到的负样本集合cand_il、cand_im、cand_ik再筛选得到cand_is,并将其用于模型训练和更新强负样本集合#imgabs1#本发明易于实现,运算速度快,不增加原始嵌入模型的复杂度;能增强虚拟负样本的多样性,提升知识图谱嵌入模型的性能,易于叠加到已有的知识图谱嵌入模型中。
-
公开(公告)号:CN117435935A
公开(公告)日:2024-01-23
申请号:CN202311176803.8
申请日:2023-09-13
Applicant: 广州大学
IPC: G06F18/23 , G06F18/2135 , G06N3/042 , G06N3/0895 , G06F18/22 , G06N3/047 , G06N3/048
Abstract: 本发明公开了一种基于自监督图注意力网络的人员群体预测方法及装置,包括:构建属性图,将属性图输入到改进的GAT模型,得到人员嵌入;将所述属性图中的属性经过拉普拉斯平滑滤波器过滤,对齐改进的GAT模型输出的嵌入特征维度,由此作为改进的GAT模型输出嵌入的监督嵌入;随机遮盖人员嵌入,预测结果计算损失并通过自监督训练模型;利用新的数据得到新人员的嵌入并利用训练好的GAT模型聚类划分人员群体,计算、聚合相似度获得人员群体预测结果。本发明以改进的GAT模型构建人员群体预测模型获得新节点的嵌入,使用拉普拉斯滤波器过滤后的属性矩阵作为监督嵌入,通过随机遮盖已有嵌入来训练改进的GAT模型,从而提高了人员群体预测方法的通用性和泛化性。
-
公开(公告)号:CN113837253B
公开(公告)日:2024-01-19
申请号:CN202111080178.8
申请日:2021-09-15
Applicant: 广州大学
IPC: G06F18/214 , G06N3/082 , G06N3/0464 , G06N3/084
Abstract: 本申请涉及一种单步对抗训练方法、系统、设备、存储介质及产品,其方法包括对干净样本和对应的标签进行FGSM对抗攻击;同时,基于上限值,对待生成的FGSM对抗样本的步长进行裁剪,获取裁剪样本;对干净样本和裁剪样本进行对抗训练,直至所有训练数据完成一次前向计算及反向传播的过程;重复获取干净样本和裁剪样本,并对干净样本和裁剪样本进行对抗训练,直至完成全部的对抗训练,获得模型以防御攻击。解决了现有对抗训练方法鲁棒性差或者用时过长的问题。本申请具有改善对抗训练方法的鲁棒性能和缩短训练时长的效果。
-
-
-
-
-
-
-
-
-