知识蒸馏方法、装置、终端设备及介质
摘要:
本申请适用于人工智能技术领域,提供了一种知识蒸馏方法、装置、终端设备及介质,该方法包括:指示学生模型和收敛后的教师模型,分别对样本集中的测试样本进行实体识别,得到预测序列和序列概率;根据教师模型和学生模型的预测序列和序列概率,对学生模型进行参数更新;若参数更新后的学生模型未收敛,则返回执行指示学生模型和收敛后的教师模型,分别对样本集中的测试样本进行实体识别的步骤,直至学生模型收敛。本申请由于基于预测序列和序列概率进行计算的复杂度较低,使得基于教师模型和学生模型的预测序列和序列概率,对学生模型进行参数更新的速度较快,提高了知识蒸馏效率。
公开/授权文献
0/0