一种不良前导音识别方法、装置、存储介质和计算机设备

发明授权

CN114067834B 一种不良前导音识别方法、装置、存储介质和计算机设备有权

请登陆查看更多内容

专利标题： 一种不良前导音识别方法、装置、存储介质和计算机设备
申请号： CN202010752821.6

申请日： 2020-07-30
公开(公告)号： CN114067834B

公开(公告)日： 2024-08-09
发明人: 于乐 , 张卫强 , 袁捷 , 张峰 , 李祥军 , 江为强 , 邱勤
申请人： 中国移动通信集团有限公司 , 清华大学
申请人地址： 北京市西城区金融大街29号;
专利权人： 中国移动通信集团有限公司,清华大学
当前专利权人： 中国移动通信集团有限公司,清华大学
当前专利权人地址： 北京市西城区金融大街29号;
代理机构： 北京汇思诚业知识产权代理有限公司
代理商 汪源
主分类号： G10L25/51
IPC分类号： G10L25/51 ; G10L15/02 ; G10L25/24 ; G10L25/45 ; H04M3/22

摘要：

本发明实施例提供了一种不良前导音识别方法、装置、存储介质和计算机设备。通过根据获取的多个语音数据生成每个语音数据对应的多维特征向量；根据多个多维特征向量生成每个语音数据对应的前导音概率；从多个前导音概率中提取概率最大值，概率最大值包括最大的前导音概率；判断概率最大值是否大于设定门限；若判断出概率最大值大于设定门限，则将概率最大值对应的语音数据的前导音设置为不良前导音。本发明实施例中，通过提取生成的前导音概率的概率最大值，将大于设定门限的概率最大值对应的语音数据的前导音设置为不良前导音，提高了识别不良前导音的准确性。

公开/授权文献

CN114067834A 一种不良前导音识别方法、装置、存储介质和计算机设备公开/授权日：2022-02-18

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G10	乐器；声学
G10L	语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码
G10L25/00	不限于组G10L 15/00-G10L 21/00的语言或者声音分析技术(当利用语音检测器来感知一些信号特殊特征的基于半导体的静噪放大器，如无信号时的感知入H03G3/34)
G10L25/48	.专门适用于特定用途
G10L25/51	..比较或判别