发明公开
- 专利标题: 模型训练方法、装置、电子设备和存储介质
-
申请号: CN202111511703.7申请日: 2021-12-06
-
公开(公告)号: CN114330510A公开(公告)日: 2022-04-12
- 发明人: 李磊 , 林衍凯 , 任宣丞 , 赵光香 , 李鹏 , 周杰 , 孙栩
- 申请人: 北京大学 , 腾讯科技(深圳)有限公司
- 申请人地址: 北京市海淀区颐和园路5号;
- 专利权人: 北京大学,腾讯科技(深圳)有限公司
- 当前专利权人: 北京大学,腾讯科技(深圳)有限公司
- 当前专利权人地址: 北京市海淀区颐和园路5号;
- 代理机构: 深圳翼盛智成知识产权事务所
- 代理商 李玉婷
- 主分类号: G06K9/62
- IPC分类号: G06K9/62 ; G06N3/04 ; G06N3/08
摘要:
本申请实施例公开了一种模型训练方法、装置、电子设备和存储介质,该方法涉及人工智能领域中的深度学习方向,包括:获取教师模型和学生模型;获取第一预测结果,第一预测结果由教师模型对样本数据集中的样本数据进行预测得到;获取教师模型对第一预测结果的可信度,可信度用于表征第一预测结果的可信程度;根据可信度更新第一预测结果,将更新后的第一预测结果作为第二预测结果;获取第二预测结果与学生模型预测样本数据的结果之间的差异;基于差异,更新学生模型的参数,以训练学生模型。本申请实施例通过教师模型对样本数据预测的可信度,能够准确地确定出样本数据对应的标签,以提升对学生模型的训练效果和效率。
公开/授权文献
- CN114330510B 模型训练方法、装置、电子设备和存储介质 公开/授权日:2024-06-25