模型训练方法、装置、电子设备和存储介质

发明公开

请登陆查看更多内容

专利标题： 模型训练方法、装置、电子设备和存储介质
申请号： CN202111511703.7

申请日： 2021-12-06
公开(公告)号： CN114330510A

公开(公告)日： 2022-04-12
发明人: 李磊 , 林衍凯 , 任宣丞 , 赵光香 , 李鹏 , 周杰 , 孙栩
申请人： 北京大学 , 腾讯科技(深圳)有限公司
申请人地址： 北京市海淀区颐和园路5号;
专利权人： 北京大学,腾讯科技(深圳)有限公司
当前专利权人： 北京大学,腾讯科技(深圳)有限公司
当前专利权人地址： 北京市海淀区颐和园路5号;
代理机构： 深圳翼盛智成知识产权事务所
代理商 李玉婷
主分类号： G06K9/62
IPC分类号： G06K9/62 ; G06N3/04 ; G06N3/08

摘要：

本申请实施例公开了一种模型训练方法、装置、电子设备和存储介质，该方法涉及人工智能领域中的深度学习方向，包括：获取教师模型和学生模型；获取第一预测结果，第一预测结果由教师模型对样本数据集中的样本数据进行预测得到；获取教师模型对第一预测结果的可信度，可信度用于表征第一预测结果的可信程度；根据可信度更新第一预测结果，将更新后的第一预测结果作为第二预测结果；获取第二预测结果与学生模型预测样本数据的结果之间的差异；基于差异，更新学生模型的参数，以训练学生模型。本申请实施例通过教师模型对样本数据预测的可信度，能够准确地确定出样本数据对应的标签，以提升对学生模型的训练效果和效率。

公开/授权文献

CN114330510B 模型训练方法、装置、电子设备和存储介质公开/授权日：2024-06-25

信息查询

中国专利公布公告

审查信息

Global Dossier

Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06K	图形数据读取（图像或视频识别或理解G06V）；数据的呈现；记录载体；处理记录载体
G06K9/00	识别模式的方法或装置（图形读取或将机械参数模式（例如力或存在）转换为电信号的方法或装置 G06K11/00）（图像或视频识别或理解 G06V）（语音识别 G10L15/00 )
G06K9/62	.应用电子设备进行识别的方法或装置