Invention Publication
- Patent Title: 轻量级神经网络模型训练方法、系统、装置及存储介质
-
Application No.: CN202111080711.0Application Date: 2021-09-15
-
Publication No.: CN113807499APublication Date: 2021-12-17
- Inventor: 宋士吉 , 王朝飞 , 黄高 , 杨琪森
- Applicant: 清华大学
- Applicant Address: 北京市海淀区双清路30号
- Assignee: 清华大学
- Current Assignee: 清华大学
- Current Assignee Address: 北京市海淀区双清路30号
- Agency: 北京润泽恒知识产权代理有限公司
- Agent 苟冬梅
- Main IPC: G06N3/04
- IPC: G06N3/04 ; G06N3/08 ; G06N5/02

Abstract:
一种轻量级神经网络模型训练方法、系统、装置及存储介质,轻量级神经网络模型训练方法包括:将学生模型的第一训练数据集输入至预先训练得到的教师模型,根据教师模型的输出,结合难度值计算方法,对所有样本进行难度值计算并排序后,得到第二训练数据集;将第二训练数据集划分为多个不同难度等级的训练子集;根据训练子集的难度等级次序,按照一定的输入方式并结合知识蒸馏策略,对所述学生模型进行训练。该方法将大型神经网络模型的知识按照预定义顺序迁移给轻量级网络模型,一方面可以降低轻量级网络模型的训练开销,另一方面还可以提升轻量级网络模型的性能。
Information query