一种深度学习模型的训练方法和训练单机

    公开(公告)号:CN114997416A

    公开(公告)日:2022-09-02

    申请号:CN202210596830.X

    申请日:2022-05-30

    IPC分类号: G06N20/00 G06F9/50 G06F9/54

    摘要: 本发明公开了一种深度学习模型的训练方法和训练单机,涉及深度学习技术领域。该方法的一具体实施方式包括:读取训练样本,从训练单机本地内存获取稀疏参数,从第一训练器本地获取稠密参数;训练单机上的第一训练器和各个第二训练器共享训练单机本地内存中的稀疏参数;在正向传播过程中根据稠密参数和稀疏参数计算损失值,在反向传播过程中得到稠密参数梯度和稀疏参数梯度;与其他训练器进行稠密参数梯度和稀疏参数梯度的同步,计算出最终的稠密参数梯度和最终的稀疏参数梯度;基于最终的稠密参数梯度更新第一训练器本地的稠密参数,基于最终的稀疏参数梯度更新训练单机本地内存的稀疏参数。该实施方式能够解决内存不足和参数梯度失效的技术问题。