发明公开
- 专利标题: 基于运动的语音活动检测
- 专利标题(英): Motion-based voice activity detection
-
申请号: CN201210051770.X申请日: 2012-03-01
-
公开(公告)号: CN102708857A公开(公告)日: 2012-10-03
- 发明人: R·K-S·关
- 申请人: 微软公司
- 申请人地址: 美国华盛顿州
- 专利权人: 微软公司
- 当前专利权人: 微软技术许可有限责任公司
- 当前专利权人地址: 美国华盛顿州
- 代理机构: 上海专利商标事务所有限公司
- 代理商 杨洁
- 优先权: 13/039,184 2011.03.02 US
- 主分类号: G10L11/02
- IPC分类号: G10L11/02 ; G10L19/00 ; G10L15/14 ; G10L15/26
摘要:
本发明涉及基于运动的语音活动检测。在常规的系统中,单独地基于诸如零交叉或能级的音频流的特性或特征来计算语音检测系统的输入。本发明涉及基于各种输入来判定接收音频流的系统是否应处于语音或非语音这两种状态之一的判定规则。除音频流以外,判定规则可结合基于运动的流作为判定规则的输入。权利要求书针对接收数据流,确定与数据流相关联的至少一个非音频元素是否指示该数据流包括语音,并且,响应于确定与数据流相关联的至少一个非音频元素指示该数据流包括语音,对与该数据流相关联的至少一个音频元素执行语音到文本转换。