- 专利标题: 一种不良前导音识别方法、装置、存储介质和计算机设备
-
申请号: CN202010752821.6申请日: 2020-07-30
-
公开(公告)号: CN114067834B公开(公告)日: 2024-08-09
- 发明人: 于乐 , 张卫强 , 袁捷 , 张峰 , 李祥军 , 江为强 , 邱勤
- 申请人: 中国移动通信集团有限公司 , 清华大学
- 申请人地址: 北京市西城区金融大街29号;
- 专利权人: 中国移动通信集团有限公司,清华大学
- 当前专利权人: 中国移动通信集团有限公司,清华大学
- 当前专利权人地址: 北京市西城区金融大街29号;
- 代理机构: 北京汇思诚业知识产权代理有限公司
- 代理商 汪源
- 主分类号: G10L25/51
- IPC分类号: G10L25/51 ; G10L15/02 ; G10L25/24 ; G10L25/45 ; H04M3/22
摘要:
本发明实施例提供了一种不良前导音识别方法、装置、存储介质和计算机设备。通过根据获取的多个语音数据生成每个语音数据对应的多维特征向量;根据多个多维特征向量生成每个语音数据对应的前导音概率;从多个前导音概率中提取概率最大值,概率最大值包括最大的前导音概率;判断概率最大值是否大于设定门限;若判断出概率最大值大于设定门限,则将概率最大值对应的语音数据的前导音设置为不良前导音。本发明实施例中,通过提取生成的前导音概率的概率最大值,将大于设定门限的概率最大值对应的语音数据的前导音设置为不良前导音,提高了识别不良前导音的准确性。
公开/授权文献
- CN114067834A 一种不良前导音识别方法、装置、存储介质和计算机设备 公开/授权日:2022-02-18