- 专利标题: 唇语识别模型的处理方法、装置、计算机设备和存储介质
-
申请号: CN202110703815.6申请日: 2021-06-24
-
公开(公告)号: CN113822125B公开(公告)日: 2024-04-30
- 发明人: 何盛烽 , 任苏成 , 孙子荀 , 邓大付 , 王巨宏 , 刘婷婷
- 申请人: 华南理工大学 , 腾讯科技(深圳)有限公司
- 申请人地址: 广东省广州市番禺区大学城华南理工大学;
- 专利权人: 华南理工大学,腾讯科技(深圳)有限公司
- 当前专利权人: 华南理工大学,腾讯科技(深圳)有限公司
- 当前专利权人地址: 广东省广州市番禺区大学城华南理工大学;
- 代理机构: 华进联合专利商标代理有限公司
- 代理商 董慧
- 主分类号: G06V40/16
- IPC分类号: G06V40/16 ; G06V40/20 ; G06V10/82 ; G06N3/042 ; G06N3/0464 ; G06N3/084 ; G06V20/40 ; G06V10/80
摘要:
本申请涉及一种唇语识别模型的处理方法、装置、计算机设备和存储介质。所述方法涉及人工智能的计算机视觉技术,将整个蒸馏过程划分为交替训练的学生训练阶段与大师训练阶段,在大师训练阶段,利用临时训练样本对前次交替训练更新的学生模型再次更新,获得的临时学生模型通过验证样本向大师模型反馈当前的学习状态,引导大师模型根据当前反馈自适应地调整教学知识;此外,大师模型还接受大师训练样本的监督,通过大师训练样本所确定的大师识别损失来调整教学内容。接着在学生训练阶段对学生模型进行训练,如此反复迭代多次之后根据学生模型获得唇语识别模型。上述方案能够在提升大师模型教学知识准确性的同时灵活调整教学内容,提升知识蒸馏效果。
公开/授权文献
- CN113822125A 唇语识别模型的处理方法、装置、计算机设备和存储介质 公开/授权日:2021-12-21