分布式模型训练方法、系统及相关装置

发明授权

请登陆查看更多内容

专利标题： 分布式模型训练方法、系统及相关装置
申请号： CN202111323472.7

申请日： 2021-11-10
公开(公告)号： CN113762512B

公开(公告)日： 2022-03-18
发明人: 任涛 , 何航 , 谷宁波 , 牛建伟 , 戴彬 , 邱源 , 胡哲源 , 胡舒程 , 姚依明 , 李青锋
申请人： 北京航空航天大学杭州创新研究院
申请人地址： 浙江省杭州市滨江区长河街道创慧街18号
专利权人： 北京航空航天大学杭州创新研究院
当前专利权人： 北京航空航天大学杭州创新研究院
当前专利权人地址： 浙江省杭州市滨江区长河街道创慧街18号
代理机构： 北京超凡宏宇专利代理事务所
代理商 张欣欣
主分类号： G06N3/08
IPC分类号： G06N3/08 ; G06N3/04 ; G06F9/50

摘要：

本申请提供分布式模型训练方法、系统及相关装置中，该系统部署包括管理设备以及多个终端设备且部署有DDPG模型；DDPG模型包括Critic网络以及Actor网络，Actor网络包括第一在线网络以及第二在线网络，每个终端设备部署有第一在线网络，管理设备部署有Critic网络以及第二在线网络；而用于训练第二在线网络的策略样本采集自经验池，由各终端设备通过自身部署的第一在线网络生成，因此，策略样本的状态空间仅涉及单个终端设备，因此，该方法不仅能够避免采集全局状态所需要的耗时，而且还能降低状态空间的维度。

公开/授权文献

CN113762512A 分布式模型训练方法、系统及相关装置公开/授权日：2021-12-07

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06N	基于特定计算模型的计算机系统
G06N3/00	基于生物学模型的计算机系统
G06N3/02	.采用神经网络模型
G06N3/08	..学习方法