基于代表对象的数据流监控方法及装置、介质和设备

    公开(公告)号:CN110493817B

    公开(公告)日:2023-01-06

    申请号:CN201910779183.4

    申请日:2019-08-22

    Abstract: 本发明公开了一种基于代表对象的数据流监控方法及装置、介质和设备,包括:获取无线传感网络中各节点上对象的初始局部值;计算各个对象的当前全局值;选取出代表对象和异常对象,跟踪监控代表对象和异常对象在各节点上的数据流;判定代表对象在各节点上是否具有最大局部值,不具有则调整,使代表对象在各节点上具有最大局部值;各节点实时监测其自身数据流,实时获取各对象在该节点上的当前局部值,在代表对象在该节点上的当前局部值不为该节点上的最大局部值情况下,判定代表对象当前全局值是否为最大全局值,不是则重新获取代表对象;是则调整,使代表对象在各节点上具有最大局部值;本发明方法可以有效降低监控数据流的通信开销和功耗。

    一种重构联邦学习中输入数据的方法

    公开(公告)号:CN115527081A

    公开(公告)日:2022-12-27

    申请号:CN202211115836.7

    申请日:2022-09-14

    Applicant: 广州大学

    Abstract: 本发明涉及人工智能技术领域,公开了一种重构联邦学习中输入数据的方法,其包括如下步骤:S1:随机初始化N组伪样本,初始化梯度反演的超参;S2:执行动超参探索模块,获得合适的超参;S3:运行分布式梯度反演算法模块;S4:执行伪样本组的初始梯度反演模块,在指定的初始迭代次数Tinit后停止;S5:执行最小损失组合优化模块,构成群一致正则项,反复次数Ttotal‑in后,最终选择一组最小损失组合样本;S6:执行最小损失组合最终梯度反演,最小损失组合样本迭代次数Tend后结束,形成最终的重构目标样本。本发明采用端对端梯度反演E2EGI方法,可实现分布式模型梯度重构输入,重构出批大小不低于256的样本。

    一种基于轴心词加权检索标准的双语词汇映射学习方法

    公开(公告)号:CN115496059A

    公开(公告)日:2022-12-20

    申请号:CN202210918041.3

    申请日:2022-08-01

    Applicant: 广州大学

    Abstract: 本发明涉及无监督词翻译技术领域,公开了一种基于轴心词加权检索标准的双语词汇映射学习方法,包括以下步骤:初始化t=0,设置迭代次数T,设置超参数μ和k,设置成绩数组R={},对于所有来自词典Lx和Ly的候选词对lx和ly,根据词典获得对应的词向量x和y。该基于轴心词加权检索标准的双语词汇映射学习方法,将加权移动平均的思路结合到对齐的迭代过程中,使得优化的效果更加稳定。相比现有双语词典检索技术,本发明生成的双语词典以及优化后的多语言词向量更适用于特定领域的下游任务,同时,本发明结合了加权移动平均思路,有利于缓解新旧词典差别太大导致剧烈波动的问题。

    一种结合依存句法的无监督机器翻译提升方法

    公开(公告)号:CN115270822A

    公开(公告)日:2022-11-01

    申请号:CN202210664732.5

    申请日:2022-06-14

    Applicant: 广州大学

    Abstract: 本发明涉及机器翻译技术领域,公开了一种结合依存句法的无监督机器翻译提升方法,句法编码解码阶段;结合依存句法规则的去噪阶段;词法以及句法的回译阶段,提出了一种基于一定的依存句法规范下的加噪方法,对比当前的加噪方法,更好地维持了语句的句法性。该结合依存句法的无监督机器翻译提升方法,学习到语句内部的依存句法结构,提升训练时间效率,仅需要少量的手工标注,即可通过约束加噪中的增加、删除以及替换过程使得句子依旧符合一定的句法规范,采用独立的词法编码器、词法解码器与句法解码器的模型设计方案;提出了结合依存句法结构进行回译的优化方法,通过在回译过程中加入了依存句法上的回译损失,维持一定的句法准确性。

    一种面向威胁情报图谱的攻防行为和时空信息抽取方法

    公开(公告)号:CN115080756A

    公开(公告)日:2022-09-20

    申请号:CN202210259684.1

    申请日:2022-06-09

    Applicant: 广州大学

    Abstract: 本发明涉及网络安全技术领域,且公开了一种面向威胁情报图谱的攻防行为和时空信息抽取方法,包括以下步骤,S1、使用jieba与Bert模型将语句分词和向量化,S2、探测该句所有的关系,S3、时间戳、IP地址抽取,S4、一体化联合翻译解码方案,S5、将时空数据与三元组进行加权软投票,S6、数据重拼接与输出。该面向威胁情报图谱的攻防行为和时空信息抽取方法,本发明是目前为数不多的针对网络安全中的威胁情报信息的攻防行为的模式与其时空信息进行结合的一个模型,并对其相应的文本信息进行了实体和关系的明确定义和抽取模式的发明,在一定程度上为定义真实安全场景中常见的概念抽取问题提供了可行的思路。

    一种基于数据包的加密流量分类系统

    公开(公告)号:CN114866486A

    公开(公告)日:2022-08-05

    申请号:CN202210271454.7

    申请日:2022-03-18

    Applicant: 广州大学

    Abstract: 本发明涉及网络数据技术领域,且公开了一种基于数据包的加密流量分类系统,由捕获流量、分析数据包和流量分类三部分功能构成;捕获流量,在两个IP与对应端口号之间传输的所有数据包即网络流,该基于数据包的加密流量分类系统,目标是提供一种有效的方法来利用原始PCAP文件的信息,通过收集网络流数据包,构建机器学习模型,对加密流量进行分类,拦截恶意流量,构建特征矩阵时,除了获得基本的时空特征、头部特征、负载数据和统计特征外,还提出了数据包行为特征,数据包的行为表现了正常流量和恶意流量的区别,与此同时,本发明重点关注了加密协议尤其是TLS协议不同版本的区别,同时引入到模型中进行分析,从而提高系统对于加密流量的分类能力。

    群智感知环境下真值发现算法的多轮次数据投毒攻击系统

    公开(公告)号:CN114866272A

    公开(公告)日:2022-08-05

    申请号:CN202210271451.3

    申请日:2022-03-18

    Applicant: 广州大学

    Abstract: 本发明涉及数据投毒技术领域,且公开了群智感知环境下真值发现算法的多轮次数据投毒攻击系统,TruthFinder公布上一轮的聚合真值利用恶意工人在上一轮提交的数据和Ground Truth计算出奖励值reward、估计状态和观测值三元组(Truthg,Trutha,Truthf),reward为t时刻恶意工人执行动作后得到的回报,估计状态用于t+1时刻输入模型做决策,储存到经验池中,用于训练模型。该群智感知环境下真值发现算法的多轮次数据投毒攻击系统,场景为多轮次的连续数据投毒场景和针对连续数据的数据投毒攻击场景,比全局信息优化法数据投毒和自举法数据投毒更加实用,可研究性更高,其次本发明不需要额外获取到正常工人的数据和TruthFinder的设置,因此本发明实施起来更加简单。

    一种结合词向量多特征融合的新词发现方法

    公开(公告)号:CN114298029A

    公开(公告)日:2022-04-08

    申请号:CN202111523723.6

    申请日:2021-12-14

    Applicant: 广州大学

    Abstract: 本发明公开了一种结合词向量多特征融合的新词发现方法,该方法步骤包括:对语料进行特征标注,计算属性对互信息矩阵和自信息矩阵,计算候选特征属性对得分;聚类词向量,找到对应的最近邻类中心向量,并找出该类中心向量对应的词作为词向量特征属性,遍历所有词向量特征属性对,计算词向量特征属性对自信息矩阵和互信息矩阵,计算所有词向量特征属性对得分;对所有候选特征属性对得分配置优化权重系数后求和计算总得分;总得分超过新词阈值时提取候选词对对应得分向量到样本集合;更新权重系数并迭代训练至损失函数收敛获得最终的权重系数;重新计算候选词对总得分,输出超过新词阈值的新词。本发明实现更合理的新词评价方法,更加有效地挖掘潜在的新词。

Patent Agency Ranking