发明公开
- 专利标题: 云端协同的深度学习模型分布式训练方法及系统
-
申请号: CN202010240843.4申请日: 2020-03-31
-
公开(公告)号: CN111444019A公开(公告)日: 2020-07-24
- 发明人: 朱凤华 , 韦越 , 陈世超 , 熊刚 , 叶佩军 , 商秀芹 , 胡斌 , 王飞跃
- 申请人: 中国科学院自动化研究所
- 申请人地址: 北京市海淀区中关村东路95号
- 专利权人: 中国科学院自动化研究所
- 当前专利权人: 中国科学院自动化研究所
- 当前专利权人地址: 北京市海淀区中关村东路95号
- 代理机构: 北京市恒有知识产权代理事务所
- 代理商 郭文浩; 尹文会
- 主分类号: G06F9/50
- IPC分类号: G06F9/50 ; G06N3/08
摘要:
本发明涉及一种云端协同的深度学习模型分布式训练方法及系统,所述训练方法包括:客户端接收用户输入的关于深度学习网络的训练任务;客户端根据所述训练任务调取网络配置和训练信息;云服务器根据网络配置和本地设备的资源情况,筛选出能够用于训练的各训练本地设备;云服务器根据所述网络配置和训练信息,生成多个训练子任务;云服务器将各训练子任务分别发送到不同的训练本地设备中;云服务器与各训练本地设备根据网络配置,对对应的训练子任务进行训练,以实现对深度学习网络的分布式训练。本发明通过云端协同实现了分布式资源的发现和筛选,从而可在深度学习模型分布式训练时合理有效的利用资源。
公开/授权文献
- CN111444019B 云端协同的深度学习模型分布式训练方法及系统 公开/授权日:2024-01-26