- 专利标题: 神经网络分布式训练系统、方法、装置、计算单元及介质
-
申请号: CN202210652215.6申请日: 2022-06-09
-
公开(公告)号: CN114912587B公开(公告)日: 2023-05-26
- 发明人: 吴长平 , 李华毅 , 张亚林
- 申请人: 上海燧原科技有限公司
- 申请人地址: 上海市浦东新区中国(上海)自由贸易试验区临港新片区业盛路188号A-522室
- 专利权人: 上海燧原科技有限公司
- 当前专利权人: 上海燧原科技有限公司
- 当前专利权人地址: 上海市浦东新区中国(上海)自由贸易试验区临港新片区业盛路188号A-522室
- 代理机构: 北京品源专利代理有限公司
- 代理商 蔡舒野
- 主分类号: G06N3/04
- IPC分类号: G06N3/04 ; G06N3/08 ; G06N3/063
摘要:
本发明公开了神经网络分布式训练系统、方法、装置、计算单元及介质。该系统包括:神经网络芯片和主机;神经网络芯片包括多个计算单元,各计算单元上分别设置有内存屏障;各计算单元,用于根据数据分片进行前向传播计算,得到单机代价函数;根据单机代价函数计算与单机代价函数匹配的梯度分区;在满足内存屏障释放时机时,将梯度分区发送至主机;主机,用于对接收到的全部计算单元的梯度分区进行全局梯度规约,并将得到的全局梯度反馈至各计算单元;各计算单元,还用于根据接收的全局梯度,更新单机计算参数。通过本发明的技术方案,能够减小神经网络芯片和主机之间的梯度状态同步时间,提高了分布式训练的效率。
公开/授权文献
- CN114912587A 神经网络分布式训练系统、方法、装置、计算单元及介质 公开/授权日:2022-08-16