发明授权
- 专利标题: 语音端点检测方法及设备
-
申请号: CN201810606354.9申请日: 2018-06-13
-
公开(公告)号: CN108877778B公开(公告)日: 2019-09-17
- 发明人: 李超 , 朱唯鑫
- 申请人: 百度在线网络技术(北京)有限公司
- 申请人地址: 北京市海淀区上地十街10号百度大厦三层
- 专利权人: 百度在线网络技术(北京)有限公司
- 当前专利权人: 百度在线网络技术(北京)有限公司
- 当前专利权人地址: 北京市海淀区上地十街10号百度大厦三层
- 代理机构: 北京同立钧成知识产权代理有限公司
- 代理商 孙静; 刘芳
- 主分类号: G10L15/05
- IPC分类号: G10L15/05 ; G10L15/08 ; G10L15/26
摘要:
本发明实施例提供一种语音端点检测方法及设备,该方法包括对待检测语音进行分帧处理,得到多个待检测的音帧;获取各待检测音帧的声学特征,并将各待检测音帧的声学特征依次输入至语音活动性检测VAD模型;其中,VAD模型用于将待检测语音中的前N个语音帧分类为噪声帧、将第N+1个语音帧至最后一个语音帧分类为语音帧以及将最后一个语音帧之后的M个噪声帧分类为语音帧,N和M为整数;根据VAD模型输出的分类结果确定语音段的起点和终点;其中,起点对应首个被分类为语音帧的音帧,终点对应最后一个被分类为语音帧的音帧。本发明实施例可以提高语音端点检测的准确度。
公开/授权文献
- CN108877778A 语音端点检测方法及设备 公开/授权日:2018-11-23