发明授权
- 专利标题: 基于唇部检测的查询端点化
-
申请号: CN201711049276.9申请日: 2017-10-31
-
公开(公告)号: CN108573701B公开(公告)日: 2021-11-30
- 发明人: 金澯佑 , R.C.农皮乌尔 , M.A.U.巴奇亚尼
- 申请人: 谷歌有限责任公司
- 申请人地址: 美国加利福尼亚州
- 专利权人: 谷歌有限责任公司
- 当前专利权人: 谷歌有限责任公司
- 当前专利权人地址: 美国加利福尼亚州
- 代理机构: 北京市柳沈律师事务所
- 代理商 邵亚丽
- 优先权: 15/458,214 20170314 US
- 主分类号: G10L15/22
- IPC分类号: G10L15/22 ; G06K9/00
摘要:
描述了用于改善由用户提交的言语查询的端点检测的系统和方法。在一些实施方式中,接收同步的视频数据和音频数据。确定包括与脸部上的唇部移动对应的图像的视频数据的帧序列。基于对应于帧序列的第一帧的第一音频数据和对应于帧序列的最后一帧的第二音频数据来端点化音频数据。端点化的音频数据的录音由自动语音识别器生成。然后生成的录音被提供用于输出。
公开/授权文献
- CN108573701A 基于唇部检测的查询端点化 公开/授权日:2018-09-25