发明公开
- 专利标题: 口语评测方法、装置、设备及存储介质
-
申请号: CN202311642830.X申请日: 2023-11-29
-
公开(公告)号: CN117746893A公开(公告)日: 2024-03-22
- 发明人: 王超 , 吴奎 , 盛志超 , 李浩 , 张凯波 , 王士进 , 刘聪 , 胡国平
- 申请人: 科大讯飞股份有限公司
- 申请人地址: 安徽省合肥市高新区望江西路666号
- 专利权人: 科大讯飞股份有限公司
- 当前专利权人: 科大讯飞股份有限公司
- 当前专利权人地址: 安徽省合肥市高新区望江西路666号
- 代理机构: 北京集佳知识产权代理有限公司
- 代理商 牛玉霜
- 主分类号: G10L25/30
- IPC分类号: G10L25/30 ; G10L25/51 ; G10L15/26 ; G10L25/03
摘要:
本申请公开了一种口语评测方法、装置、设备及存储介质,本申请配置了文本语音对齐模型,该模型的输入为目标音频的音频表征及参考文本,模型被配置为提取参考文本的嵌入表征,并将嵌入表征与音频表征进行拼接,基于拼接表征解码得到对齐结果,对齐结果包括了目标音频的识别文本及识别文本与参考文本的对齐信息,由此可见,本申请文本语音对齐模型可端到端的直接预测得到对齐结果,避免了传统方案识别结果中产生的级联误差。在得到对齐结果后可以进一步基于对齐结果和参考文本来计算目标音频的完整度测评结果,提高了口语完整度测评结果的准确度。