基于参数高效模块和多教师知识蒸馏的知识蒸馏方法
摘要:
本发明公开了一种基于参数高效模块和多教师知识蒸馏的知识蒸馏方法,所述方法包括:获取下游任务数据集,根据预先构建的参数高效性多教师模型生成多个子教师模型,对每个子教师模型进行微调,得到多个微调子教师模型;根据下游任务数据集对待训练的学生模型进行训练,根据下游任务数据集和多个微调子教师模型生成该次训练的监督信号,根据监督信号和学生模型在该次训练过程中得到的训练结果,更新参数,当达到预设训练条件时,得到并输出训练完成的学生模型;获取目标处理数据,将目标处理数据输入到训练完成的学生模型,输出目标结果。本发明可以在训练学生模型时兼顾效率和准确率,从而通过训练好的学生模型生成准确的目标结果。
0/0