发明公开
- 专利标题: 基于计算机视觉辅助的正面人机交互语音识别方法及系统
-
申请号: CN201811448360.2申请日: 2018-11-30
-
公开(公告)号: CN109410957A公开(公告)日: 2019-03-01
- 发明人: 邱霖恺 , 刘维 , 王贤俊 , 高刚强 , 郑文侃 , 宋煌钟
- 申请人: 福建实达电脑设备有限公司
- 申请人地址: 福建省福州市马尾区君竹路(自贸试验区内)
- 专利权人: 福建实达电脑设备有限公司
- 当前专利权人: 福建实达电脑设备有限公司
- 当前专利权人地址: 福建省福州市马尾区君竹路(自贸试验区内)
- 代理机构: 福州元创专利商标代理有限公司
- 代理商 蔡学俊
- 主分类号: G10L17/22
- IPC分类号: G10L17/22 ; G10L15/22 ; G06K9/00 ; G10L21/02
摘要:
本发明涉及基于计算机视觉辅助的正面人机交互语音识别方法及系统,通过在传统语音识别流程中加入视频信号输入,与语音信号一同识别;在人脸识别和人脸唇部运动识别中进行语音辅助,判断是否所要识别的目标正在说话;同时,通过人脸识别和辅助定位,判断说话人方位,并利用相应方位,对指定方向声源信号进行增强处理。本发明可以有效增强在特定环境下,例如自助零售终端、银行自助终端、保险自助终端等需要客户正面面对设备的人机交互使用场景,对客户语音命令和语音输入信息识别的准确率。
公开/授权文献
- CN109410957B 基于计算机视觉辅助的正面人机交互语音识别方法及系统 公开/授权日:2023-05-23