发明授权
- 专利标题: 大模型的分布式训练方法、装置及电子设备
-
申请号: CN202410276489.9申请日: 2024-03-12
-
公开(公告)号: CN117875362B公开(公告)日: 2024-07-09
- 发明人: 田楷 , 晏文仲 , 陈立名 , 代文静 , 黄金 , 曹彬 , 胡江洪 , 方超群 , 王凯 , 陈运泽
- 申请人: 菲特(天津)检测技术有限公司
- 申请人地址: 天津市滨海新区天津自贸试验区(空港经济区)西七道28号天津智汇谷人工智能产业基地南楼1-3层
- 专利权人: 菲特(天津)检测技术有限公司
- 当前专利权人: 菲特(天津)检测技术有限公司
- 当前专利权人地址: 天津市滨海新区天津自贸试验区(空港经济区)西七道28号天津智汇谷人工智能产业基地南楼1-3层
- 代理机构: 北京超凡宏宇知识产权代理有限公司
- 代理商 严小艳
- 主分类号: G06N3/042
- IPC分类号: G06N3/042 ; G06N3/0464 ; G06N3/063 ; G06N3/098 ; G06V10/764 ; G06V10/776 ; G06V10/82
摘要:
本发明提供了一种大模型的分布式训练方法、装置及电子设备,涉及人工智能技术领域,本发明能够获取资源需求配置信息和待训练的大模型的模型配置信息;基于资源需求配置信息和模型配置信息,依次对大模型的模型结构和应用数据进行流水线并行和张量并行的切分;对当前切分结果进行时间维度和资源维度的评价,得到当前评价指数值;基于当前评价指数值对当前切分结果进行优化,得到大模型的目标切分结果,以基于目标切分结果对大模型进行分布式训练。这样用户只需要给出资源需求和大模型的模型配置信息,即可进行动态组网,且优化时考虑了时间维度和资源维度,因此可以提高训练精度,最大化并行性能。
公开/授权文献
- CN117875362A 大模型的分布式训练方法、装置及电子设备 公开/授权日:2024-04-12