-
公开(公告)号:CN118052260A
公开(公告)日:2024-05-17
申请号:CN202410387893.3
申请日:2024-04-01
Applicant: 兰州交通大学
IPC: G06N3/0495 , G06N3/084 , G06N3/0464 , G06N3/0442
Abstract: 一种深度神经网络模型动态分层梯度压缩方法,将梯度稀疏化压缩方法与流水线并行技术相结合,为每层神经网络匹配一个合适的阈值,通过在后续迭代时动态调整该阈值,实现对每层网络传输梯度的自适应压缩。之后,结合给定的模型结构和硬件配置信息,利用启发式动态规划算法求解最佳的层梯度组合通信方式,将多层小尺度梯度张量合并为一层通信。最后,将求解出的最优的层梯度合并组合应用于具体的训练迭代过程,在保证模型训练精度的同时,提升大规模深度神经网络模型训练速度,实现计算与通信最大化重叠,提高计算资源利用率,为充分利用硬件计算资源,提升深度神经网络模型训练速度提供一个有效的解决方法。
-
公开(公告)号:CN115994567B
公开(公告)日:2024-03-22
申请号:CN202211688400.7
申请日:2022-12-28
Applicant: 兰州交通大学
IPC: G06N3/063
Abstract: 一种深度神经网络模型并行计算任务异步调度方法,采用改进的流水线模型并行任务调度优化方法,建立适合大规模模型计算任务的多迭代异步并行任务管理机制;结合给定的模型结构和硬件配置信息,通过启发式动态规划算法设计计算任务和计算资源分配机制;设计计算资源和任务运行时调度策略,控制微批量单元调度过程,对设备默认流进行优化,最大限度消除计算节点计算和通信的相互依赖关系,实现计算与通信最大化重叠。本发明在不增加额外开销和无需特殊硬件支持情况下,降低模型切分难度、实现神经网络模型计算任务和计算资源合理匹配、实现计算与通信最大重叠,提高计算资源利用率。实验证明,本发明将大规模深度神经网络模型训练速度平均提升2.8倍。
-
公开(公告)号:CN111866869B
公开(公告)日:2023-06-23
申请号:CN202010645474.7
申请日:2020-07-07
Applicant: 兰州交通大学
IPC: G06F16/587 , H04W12/02 , H04W16/22 , H04W64/00
Abstract: 本发明提出了一种面向边缘计算的联邦学习室内定位隐私保护方法,该方法基于联邦学习和差分隐私保护技术,在边缘计算环境下进行室内定位模型的可信联邦训练,训练过程中各参与用户不共享训练数据,只通过共享定位模型参数进行室内定位模型的分布式训练和可信聚合,同时,通过端云协同的迭代方式更新模型参数,不断优化室内定位模型,实现多用户定位模型训练的隐私保护和协同获益。实验结果表明,与传统集中式的模型训练方法和基于联邦学习的模型训练方法相比,本发明不仅能提供可证明的隐私保护,而且在增加极小计算开销的情况下保证了模型的定位效果。
-
公开(公告)号:CN111988845A
公开(公告)日:2020-11-24
申请号:CN202010915760.0
申请日:2020-09-03
Applicant: 兰州交通大学
Abstract: 一种边缘计算架构下的差分私有多源无线信号指纹融合室内定位方法,其为:(1)边缘设备将自己拥有的信息强度RSS数据经添加拉普拉斯噪声后随机发送到附近边缘节点;(2)边缘节点接收到RSS数据后,将相同位置收集到的WiFi和蓝牙的RSS数据进行聚合,并对其进行统一标定后发送给边缘服务器;(3)边缘服务器将接收到的噪声标记和未标记样本整合在一起,并利用图拉普拉斯流行约束对WiFi和BLE的RSS数据进行差分隐私保护的特征融合,并将所有经过隐私保护处理后的数据集发送到云服务器;(4)云服务器拟合学习参数,进行满足差分私有的机器学习模型训练,生成安全可信的室内定位模型。本发明不仅能够提供可证明的隐私保护,而且可以保证较高的定位精度和较少的资源消耗。
-
公开(公告)号:CN115994567A
公开(公告)日:2023-04-21
申请号:CN202211688400.7
申请日:2022-12-28
Applicant: 兰州交通大学
IPC: G06N3/063
Abstract: 一种深度神经网络模型并行计算任务异步调度方法,采用改进的流水线模型并行任务调度优化方法,建立适合大规模模型计算任务的多迭代异步并行任务管理机制;结合给定的模型结构和硬件配置信息,通过启发式动态规划算法设计计算任务和计算资源分配机制;设计计算资源和任务运行时调度策略,控制微批量单元调度过程,对设备默认流进行优化,最大限度消除计算节点计算和通信的相互依赖关系,实现计算与通信最大化重叠。本发明在不增加额外开销和无需特殊硬件支持情况下,降低模型切分难度、实现神经网络模型计算任务和计算资源合理匹配、实现计算与通信最大重叠,提高计算资源利用率。实验证明,本发明将大规模深度神经网络模型训练速度平均提升2.8倍。
-
公开(公告)号:CN115686779A
公开(公告)日:2023-02-03
申请号:CN202211261147.7
申请日:2022-10-14
Applicant: 兰州交通大学
Abstract: 本发明公开了一种用于边缘计算系统的基于DQN的自适应边缘计算任务调度方法,该方法中代理分别获取任务配置信息、计算节点配置信息并以此作为输入神经网络的环境状态信息;根据以往训练的损失值进行神经网络最终输出的计算,再根据最终输出和近几次训练的损失值为任务选择计算节点,最后基于损失值进行学习经验的存储。最终实现任务与计算节点的最优匹配,本发明为充分利用边缘计算资源,提升任务处理的实时性,降低系统开销提供了一个有效的解决方法。
-
公开(公告)号:CN111866869A
公开(公告)日:2020-10-30
申请号:CN202010645474.7
申请日:2020-07-07
Applicant: 兰州交通大学
Abstract: 本发明提出了一种面向边缘计算的联邦学习室内定位隐私保护方法,该方法基于联邦学习和差分隐私保护技术,在边缘计算环境下进行室内定位模型的可信联邦训练,训练过程中各参与用户不共享训练数据,只通过共享定位模型参数进行室内定位模型的分布式训练和可信聚合,同时,通过端云协同的迭代方式更新模型参数,不断优化室内定位模型,实现多用户定位模型训练的隐私保护和协同获益。实验结果表明,与传统集中式的模型训练方法和基于联邦学习的模型训练方法相比,本发明不仅能提供可证明的隐私保护,而且在增加极小计算开销的情况下保证了模型的定位效果。
-
公开(公告)号:CN118296612B
公开(公告)日:2024-11-01
申请号:CN202410495528.4
申请日:2024-04-24
Applicant: 兰州交通大学
IPC: G06F21/57 , G06F18/241 , G06N3/0464 , G06N3/08
Abstract: 一种基于序列和图双通道模型的源代码漏洞检测方法VulD‑SG,其首先从公开的源代码漏洞数据集MSR中切分得到C语言源代码数据集,使用Joern工具生成源代码的程序依赖图PDG并取得其程序切片;其次,构建一个双通道的局部模型模块,分为上下两个部分,上部分为基于序列的特征向量提取模型,下部分为基于图的特征向量提取模型。融合模型阶段将基于序列的特征向量提取模型和基于图的特征向量提取模型的输出使用全连接层连接,最后输出漏洞检测的结果。本发明有效解决了传统的基于序列模型缺少源代码结构信息和基于图模型缺少源代码语法语义信息的问题。此外,通过设计融合模型,提升了漏洞检测的准确率。
-
公开(公告)号:CN118052260B
公开(公告)日:2024-08-02
申请号:CN202410387893.3
申请日:2024-04-01
Applicant: 兰州交通大学
IPC: G06N3/0495 , G06N3/084 , G06N3/0464 , G06N3/0442
Abstract: 一种深度神经网络模型动态分层梯度压缩方法,将梯度稀疏化压缩方法与流水线并行技术相结合,为每层神经网络匹配一个合适的阈值,通过在后续迭代时动态调整该阈值,实现对每层网络传输梯度的自适应压缩。之后,结合给定的模型结构和硬件配置信息,利用启发式动态规划算法求解最佳的层梯度组合通信方式,将多层小尺度梯度张量合并为一层通信。最后,将求解出的最优的层梯度合并组合应用于具体的训练迭代过程,在保证模型训练精度的同时,提升大规模深度神经网络模型训练速度,实现计算与通信最大化重叠,提高计算资源利用率,为充分利用硬件计算资源,提升深度神经网络模型训练速度提供一个有效的解决方法。
-
公开(公告)号:CN118296612A
公开(公告)日:2024-07-05
申请号:CN202410495528.4
申请日:2024-04-24
Applicant: 兰州交通大学
IPC: G06F21/57 , G06F18/241 , G06N3/0464 , G06N3/08
Abstract: 一种基于序列和图双通道模型的源代码漏洞检测方法VulD‑SG,其首先从公开的源代码漏洞数据集MSR中切分得到C语言源代码数据集,使用Joern工具生成源代码的程序依赖图PDG并取得其程序切片;其次,构建一个双通道的局部模型模块,分为上下两个部分,上部分为基于序列的特征向量提取模型,下部分为基于图的特征向量提取模型。融合模型阶段将基于序列的特征向量提取模型和基于图的特征向量提取模型的输出使用全连接层连接,最后输出漏洞检测的结果。本发明有效解决了传统的基于序列模型缺少源代码结构信息和基于图模型缺少源代码语法语义信息的问题。此外,通过设计融合模型,提升了漏洞检测的准确率。
-
-
-
-
-
-
-
-
-