口语评测方法、装置、设备及存储介质

发明公开

请登陆查看更多内容

专利标题： 口语评测方法、装置、设备及存储介质
申请号： CN202311642830.X

申请日： 2023-11-29
公开(公告)号： CN117746893A

公开(公告)日： 2024-03-22
发明人: 王超 , 吴奎 , 盛志超 , 李浩 , 张凯波 , 王士进 , 刘聪 , 胡国平
申请人： 科大讯飞股份有限公司
申请人地址： 安徽省合肥市高新区望江西路666号
专利权人： 科大讯飞股份有限公司
当前专利权人： 科大讯飞股份有限公司
当前专利权人地址： 安徽省合肥市高新区望江西路666号
代理机构： 北京集佳知识产权代理有限公司
代理商 牛玉霜
主分类号： G10L25/30
IPC分类号： G10L25/30 ; G10L25/51 ; G10L15/26 ; G10L25/03

摘要：

本申请公开了一种口语评测方法、装置、设备及存储介质，本申请配置了文本语音对齐模型，该模型的输入为目标音频的音频表征及参考文本，模型被配置为提取参考文本的嵌入表征，并将嵌入表征与音频表征进行拼接，基于拼接表征解码得到对齐结果，对齐结果包括了目标音频的识别文本及识别文本与参考文本的对齐信息，由此可见，本申请文本语音对齐模型可端到端的直接预测得到对齐结果，避免了传统方案识别结果中产生的级联误差。在得到对齐结果后可以进一步基于对齐结果和参考文本来计算目标音频的完整度测评结果，提高了口语完整度测评结果的准确度。

信息查询

中国专利公布公告

审查信息

Global Dossier

Espacenet

IPC分类:

G	物理
G10	乐器；声学
G10L	语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码
G10L25/00	不限于组G10L 15/00-G10L 21/00的语言或者声音分析技术(当利用语音检测器来感知一些信号特殊特征的基于半导体的静噪放大器，如无信号时的感知入H03G3/34)
G10L25/27	.以分析方法为特征的
G10L25/30	..利用神经网络