面向分布式大模型流水线并行训练的边缘计算方法及装置

    公开(公告)号:CN119829254A

    公开(公告)日:2025-04-15

    申请号:CN202510024957.8

    申请日:2025-01-07

    Abstract: 本发明公开了面向分布式大模型流水线并行训练的边缘计算方法及装置。该方法的实施过程涵盖了几个关键步骤,旨在高效地处理复杂的深度学习模型和海量数据。首先,系统接收一个大模型训练任务,该任务携带了关键信息,包括大模型的类别、各层的详细结构以及mini‑batch的大小。随后,系统根据这些信息进行深入分析,生成一个专门针对分布式大模型的流水线并行训练调度策略,以优化训练过程并确保资源的高效利用。最后,生成的调度策略将被发送至边缘计算节点,指导这些节点执行大模型训练任务。通过这一系列精心设计的步骤,该方法不仅能够有效实现面向分布式大模型的流水线并行训练,还充分发挥了边缘计算的优势,从而显著提升整体训练效率。

Patent Agency Ranking