深度学习模型的分布式训练方法、装置、设备及存储介质

发明公开

CN113610241A 深度学习模型的分布式训练方法、装置、设备及存储介质有权

请登陆查看更多内容

专利标题： 深度学习模型的分布式训练方法、装置、设备及存储介质
申请号： CN202110884863.X

申请日： 2021-08-03
公开(公告)号： CN113610241A

公开(公告)日： 2021-11-05
发明人: 田丽红 , 胡辰 , 许涛
申请人： 曙光信息产业(北京)有限公司
申请人地址： 北京市海淀区东北旺西路8号院36号楼
专利权人： 曙光信息产业(北京)有限公司
当前专利权人： 曙光信息产业(北京)有限公司
当前专利权人地址： 北京市海淀区东北旺西路8号院36号楼
代理机构： 北京品源专利代理有限公司
代理商 陈金忠
主分类号： G06N20/00
IPC分类号： G06N20/00

摘要：

本发明实施例公开了一种深度学习模型的分布式训练方法、装置、设备及存储介质。该方法包括：获取目标深度学习模型的TensorFlow训练代码；确定所述TensorFlow训练代码的目标逻辑及封装类型；根据与所述目标逻辑及封装类型匹配的处理策略对所述TensorFlow训练代码进行调整；运行调整后的TensorFlow训练代码，以实现对所述目标深度学习模型的Horovod分布式训练。上述技术方案在Tensorflow代码背景下，自动实现深度学习模型的Horovod分布式训练计算的技术效果。

公开/授权文献

CN113610241B 深度学习模型的分布式训练方法、装置、设备及存储介质公开/授权日：2024-05-10

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06N	基于特定计算模型的计算机系统
G06N20/00	机器学习