基于唇部检测的查询端点化

发明授权

请登陆查看更多内容

专利标题： 基于唇部检测的查询端点化
申请号： CN201711049276.9

申请日： 2017-10-31
公开(公告)号： CN108573701B

公开(公告)日： 2021-11-30
发明人: 金澯佑 , R.C.农皮乌尔 , M.A.U.巴奇亚尼
申请人： 谷歌有限责任公司
申请人地址： 美国加利福尼亚州
专利权人： 谷歌有限责任公司
当前专利权人： 谷歌有限责任公司
当前专利权人地址： 美国加利福尼亚州
代理机构： 北京市柳沈律师事务所
代理商 邵亚丽
优先权： 15/458,214 20170314 US
主分类号： G10L15/22
IPC分类号： G10L15/22 ; G06K9/00

摘要：

描述了用于改善由用户提交的言语查询的端点检测的系统和方法。在一些实施方式中，接收同步的视频数据和音频数据。确定包括与脸部上的唇部移动对应的图像的视频数据的帧序列。基于对应于帧序列的第一帧的第一音频数据和对应于帧序列的最后一帧的第二音频数据来端点化音频数据。端点化的音频数据的录音由自动语音识别器生成。然后生成的录音被提供用于输出。

公开/授权文献

CN108573701A 基于唇部检测的查询端点化公开/授权日：2018-09-25

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G10	乐器；声学
G10L	语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码
G10L15/00	语音识别（G10L17/00优先）
G10L15/22	.在语音识别过程中（例如在人机对话过程中）使用的程序