-
公开(公告)号:CN117112145B
公开(公告)日:2024-02-13
申请号:CN202311336127.6
申请日:2023-10-16
Applicant: 之江实验室
IPC: G06F9/455 , G06F18/214 , G06N3/0464 , G06N3/08
Abstract: 本申请涉及一种训练模型分配方法、装置、计算机设备和存储介质。所述方法包括:获取待训练模型的模型信息和训练数据集;将训练模型根据层级信息划分为至少两个子模型,并将各子模型分配至训练集群中各机器节点;将各子模型根据计算参数信息划分为至少两个子模型切片,并将各子模型切片分配至训练集群中各机器节点的各计算处理器;将训练数据集根据计算参数信息划分为至少两个训练子数据集,并将各训练子数据集分配至训练集群中各计算处理器;根据训练集群中所有计算处理器,以及所有计算处理器对应的子模型切片和训练数据子集,对待训练模型进行训练。采用本申请的方法能够提高模型训练效率。
-
公开(公告)号:CN117112145A
公开(公告)日:2023-11-24
申请号:CN202311336127.6
申请日:2023-10-16
Applicant: 之江实验室
IPC: G06F9/455 , G06F18/214 , G06N3/0464 , G06N3/08
Abstract: 本申请涉及一种训练模型分配方法、装置、计算机设备和存储介质。所述方法包括:获取待训练模型的模型信息和训练数据集;将训练模型根据层级信息划分为至少两个子模型,并将各子模型分配至训练集群中各机器节点;将各子模型根据计算参数信息划分为至少两个子模型切片,并将各子模型切片分配至训练集群中各机器节点的各计算处理器;将训练数据集根据计算参数信息划分为至少两个训练子数据集,并将各训练子数据集分配至训练集群中各计算处理器;根据训练集群中所有计算处理器,以及所有计算处理器对应的子模型切片和训练数据子集,对待训练模型进行训练。采用本申请的方法能够提高模型训练效率。
-