发明公开
- 专利标题: 基于参数高效模块和多教师知识蒸馏的知识蒸馏方法
-
申请号: CN202410860737.4申请日: 2024-06-28
-
公开(公告)号: CN118747507A公开(公告)日: 2024-10-08
- 发明人: 漆舒汉 , 黄驿诚 , 吴宇琳 , 王轩 , 张加佳 , 施少怀
- 申请人: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
- 申请人地址: 广东省深圳市南山区桃源街道深圳大学城哈尔滨工业大学校区
- 专利权人: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
- 当前专利权人: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
- 当前专利权人地址: 广东省深圳市南山区桃源街道深圳大学城哈尔滨工业大学校区
- 代理机构: 深圳市君胜知识产权代理事务所
- 代理商 朱阳波
- 主分类号: G06N3/042
- IPC分类号: G06N3/042 ; G06N3/045 ; G06N3/096 ; G06N3/084 ; G06N3/09 ; G06N3/0495
摘要:
本发明公开了一种基于参数高效模块和多教师知识蒸馏的知识蒸馏方法,所述方法包括:获取下游任务数据集,根据预先构建的参数高效性多教师模型生成多个子教师模型,对每个子教师模型进行微调,得到多个微调子教师模型;根据下游任务数据集对待训练的学生模型进行训练,根据下游任务数据集和多个微调子教师模型生成该次训练的监督信号,根据监督信号和学生模型在该次训练过程中得到的训练结果,更新参数,当达到预设训练条件时,得到并输出训练完成的学生模型;获取目标处理数据,将目标处理数据输入到训练完成的学生模型,输出目标结果。本发明可以在训练学生模型时兼顾效率和准确率,从而通过训练好的学生模型生成准确的目标结果。