- 专利标题: 深度学习模型的分布式训练方法、装置、设备及存储介质
-
申请号: CN202110884863.X申请日: 2021-08-03
-
公开(公告)号: CN113610241A公开(公告)日: 2021-11-05
- 发明人: 田丽红 , 胡辰 , 许涛
- 申请人: 曙光信息产业(北京)有限公司
- 申请人地址: 北京市海淀区东北旺西路8号院36号楼
- 专利权人: 曙光信息产业(北京)有限公司
- 当前专利权人: 曙光信息产业(北京)有限公司
- 当前专利权人地址: 北京市海淀区东北旺西路8号院36号楼
- 代理机构: 北京品源专利代理有限公司
- 代理商 陈金忠
- 主分类号: G06N20/00
- IPC分类号: G06N20/00
摘要:
本发明实施例公开了一种深度学习模型的分布式训练方法、装置、设备及存储介质。该方法包括:获取目标深度学习模型的TensorFlow训练代码;确定所述TensorFlow训练代码的目标逻辑及封装类型;根据与所述目标逻辑及封装类型匹配的处理策略对所述TensorFlow训练代码进行调整;运行调整后的TensorFlow训练代码,以实现对所述目标深度学习模型的Horovod分布式训练。上述技术方案在Tensorflow代码背景下,自动实现深度学习模型的Horovod分布式训练计算的技术效果。
公开/授权文献
- CN113610241B 深度学习模型的分布式训练方法、装置、设备及存储介质 公开/授权日:2024-05-10