一种异构算力环境下的模型训练任务分配方法及系统

    公开(公告)号:CN119376958A

    公开(公告)日:2025-01-28

    申请号:CN202411975476.7

    申请日:2024-12-31

    Abstract: 本发明属于分布式训练领域,提供了一种异构算力环境下的模型训练任务分配方法及系统,构建一个分层的深度强化学习模型,用于在终端层、边缘层和云计算层之间进行优化拆分点的选择和资源分配,从而实现高效的计算任务分配和模型训练。通过设计多个子策略网络来应对不同算力需求的任务。结合了资源感知模块,以衡量每层的计算资源、网络带宽和延迟等状态。启发式算法用于初步估计拆分点范围,减少无关位置的探索,优化搜索效率。针对神经网络模型计算所需要的资源,以浮点运算的数量来衡量。在拆分点的选择中,主要采取深度强化学习的方法结合资源感知模块,通过结构优化寻找最优的拆分点,以实现模型的有效拆分,并在两端侧完成高效的联合训练。

    一种边缘计算中具有依赖关系任务的计算卸载方法及系统

    公开(公告)号:CN116755882A

    公开(公告)日:2023-09-15

    申请号:CN202310720676.7

    申请日:2023-06-16

    Abstract: 本公开提供了一种边缘计算中具有依赖关系任务的计算卸载方法及系统,涉及边缘计算技术领域,包括初始化卸载环境,获取具有依赖关系的任务序列构建有向无环图DAG,对具有依赖关系的任务序列卸载问题建模为马尔可夫决策过程;引入关键任务的优先级概念,根据任务的优先级值对DAG的任务序列进行拓扑排序,将任务嵌入到一系列向量中,获取任务嵌入序列;将任务序列卸载问题转换为序列到序列预测问题,将任务嵌入序列输入到序列到序列神经网络中,所述序列到序列神经网络中引入注意力机制,输出每个任务的卸载决策;用户设备和边缘服务器根据每个任务的卸载决策协同完成所有任务的卸载执行。本公开能有效平衡任务时延和能耗的计算任务卸载。

Patent Agency Ranking