ADAPTIVE LEARNING RATE SCHEDULE IN DISTRIBUTED STOCHASTIC GRADIENT DESCENT

发明申请

US20190303787A1 ADAPTIVE LEARNING RATE SCHEDULE IN DISTRIBUTED STOCHASTIC GRADIENT DESCENT 审中-公开

请登陆查看更多内容

专利标题： ADAPTIVE LEARNING RATE SCHEDULE IN DISTRIBUTED STOCHASTIC GRADIENT DESCENT
申请号： US15938830

申请日： 2018-03-28
公开(公告)号： US20190303787A1

公开(公告)日： 2019-10-03
发明人: PARIJAT DUBE , Sanghamitra Dutta , Gauri Joshi , Priya A. Nagpurkar
申请人： INTERNATIONAL BUSINESS MACHINES CORPORATION
主分类号： G06N7/08
IPC分类号： G06N7/08 ; G06F9/50 ; G06K9/62 ; G06F15/18

ADAPTIVE LEARNING RATE SCHEDULE IN DISTRIBUTED STOCHASTIC GRADIENT DESCENT

摘要：

A method for performing machine learning includes assigning processing jobs to a plurality of model learners, using a central parameter server. The processing jobs includes solving gradients based on a current set of parameters. As the results from the processing job are returned, the set of parameters is iterated. A degree of staleness of the solving of the second gradient is determined based on a difference between the set of parameters when the jobs are assigned and the set of parameters when the jobs are returned. The learning rates used to iterate the parameters based on the solved gradients are proportional to the determined degrees of staleness.

公开/授权文献

US11182689B2 Adaptive learning rate schedule in distributed stochastic gradient descent 公开/授权日：2021-11-23

信息查询

Global Dossier Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06N	基于特定计算模型的计算机系统
G06N7/00	基于特定数学模式的计算机系统
G06N7/08	.采用混沌模型或者非线性系统模型的