-
公开(公告)号:CN111599366A
公开(公告)日:2020-08-28
申请号:CN202010424470.6
申请日:2020-05-19
Applicant: 科大讯飞股份有限公司
IPC: G10L17/20 , G10L17/22 , G10L21/0216 , G10L21/0232
Abstract: 本申请公开了一种车载多音区语音处理的方法和相关装置,该方法包括:通过各个车载座椅传感器检测得到包括至少一个位置方向的位置信息;利用回声消除技术和窄波束算法处理多路麦克风音频得到多路音频;结合位置信息和多路音频综合确定语音识别的目标方向。由此可见,在多路音频的基础上,将各个车载座椅传感器检测得到位置信息作为辅助信息,综合确定语音识别的目标方向,能够有效避免恶劣语音唤醒场景下车载多音区语音交互过程中语音唤醒时的声源定位干扰,以提高车载多音区语音交互过程中语音唤醒时声源定位的准确性,从而实现更精准的车载多音区语音交互,提升车载多音区语音交互的用户体验。
-
公开(公告)号:CN111599366B
公开(公告)日:2024-04-12
申请号:CN202010424470.6
申请日:2020-05-19
Applicant: 科大讯飞股份有限公司
IPC: G10L17/20 , G10L17/22 , G10L21/0216 , G10L21/0232
Abstract: 本申请公开了一种车载多音区语音处理的方法和相关装置,该方法包括:通过各个车载座椅传感器检测得到包括至少一个位置方向的位置信息;利用回声消除技术和窄波束算法处理多路麦克风音频得到多路音频;结合位置信息和多路音频综合确定语音识别的目标方向。由此可见,在多路音频的基础上,将各个车载座椅传感器检测得到位置信息作为辅助信息,综合确定语音识别的目标方向,能够有效避免恶劣语音唤醒场景下车载多音区语音交互过程中语音唤醒时的声源定位干扰,以提高车载多音区语音交互过程中语音唤醒时声源定位的准确性,从而实现更精准的车载多音区语音交互,提升车载多音区语音交互的用户体验。
-