- 专利标题: 模型训练方法、装置、电子设备和计算机可读存储介质
-
申请号: CN202011552010.8申请日: 2020-12-24
-
公开(公告)号: CN112631775B公开(公告)日: 2024-06-18
- 发明人: 陈庆澍 , 欧阳剑 , 王勇 , 赵志彪
- 申请人: 北京百度网讯科技有限公司
- 申请人地址: 北京市海淀区上地十街10号百度大厦2层
- 专利权人: 北京百度网讯科技有限公司
- 当前专利权人: 北京百度网讯科技有限公司
- 当前专利权人地址: 北京市海淀区上地十街10号百度大厦2层
- 代理机构: 北京市金杜律师事务所
- 代理商 赵林琳; 张昊
- 主分类号: G06F9/50
- IPC分类号: G06F9/50 ; G06N3/08 ; G06N3/084 ; G06N3/10
摘要:
本公开公开了模型训练方法、装置、电子设备和计算机可读存储介质,涉及人工智能领域,尤其涉及深度学习领域和人工智能芯片领域。具体实现方案为:通过一个计算单元对一个训练数据集执行前向计算操作序列以及反向计算操作序列中包括的第一反向计算操作,以基于第一反向计算操作确定第一计算结果和模型的第一梯度;至少基于第一梯度,确定第一同步梯度;基于所述第一计算结果对所述一个训练数据集执行所述反向计算操作序列中包括的第二反向计算操作,以基于所述第二反向计算操作至少确定所述模型的第二梯度;至少基于第二梯度,确定第二同步梯度;以及至少基于第一同步梯度和第二同步梯度更新模型的参数。以此方式,实现了高效准确的并行训练。
公开/授权文献
- CN112631775A 模型训练方法、装置、电子设备和计算机可读存储介质 公开/授权日:2021-04-09