-
公开(公告)号:CN111400438A
公开(公告)日:2020-07-10
申请号:CN202010107441.7
申请日:2020-02-21
申请人: 镁佳(北京)科技有限公司
IPC分类号: G06F16/33 , G06F16/332 , G06F16/35 , G06F40/211 , G06F40/289
摘要: 本公开涉及一种用户多意图的识别方法及装置,存储介质及车辆,以解决现有多意图识别技术的成本过高的问题,所述方法包括:获取对话文本信息;将所述对话文本信息输入分句模型进行分句处理,其中,所述分句模型的训练样本是根据单意图语料组合得到的;若根据所述分句模型的输出得到多个单语句,则将所述多个单语句依次输入单语句识别模型,得到多个意图识别结果。
-
公开(公告)号:CN111354363A
公开(公告)日:2020-06-30
申请号:CN202010107278.4
申请日:2020-02-21
申请人: 镁佳(北京)科技有限公司
摘要: 本公开涉及一种车载语音识别方法、装置、可读存储介质及电子设备。方法包括:获取车辆内的音频信息;根据所述音频信息和训练后的语音识别模型,确定与所述音频信息相匹配的文本信息;在对语音识别模型进行训练时,由于是采用车辆内特定场景下的历史音频信息和与该历史音频信息相匹配的文本信息进行训练的,所以,训练后的语音识别模型能够适应车载语音场景,进而在利用该语音识别模型对车辆内的音频信息进行识别时,可以提高语音识别模型的识别率,以使语音识别模型准确地识别出文本信息,提升用户的使用体验。
-
公开(公告)号:CN111161757B
公开(公告)日:2021-09-03
申请号:CN201911373874.0
申请日:2019-12-27
申请人: 镁佳(北京)科技有限公司
IPC分类号: G10L25/48 , G10L25/18 , G10L21/028 , G01S5/24
摘要: 本公开涉及一种声源定位方法、装置、可读存储介质及电子设备。该方法包括:从N个麦克风中获取目标音频信号,其中,每一所述麦克风设置在不同位置,N为大于等于3的整数;从N条所述目标音频信号中提取多维度音频特征;根据所述多维度音频特征和预先训练的声源定位模型,确定所述目标音频的声源位置。如此,基于声源定位模型确定目标音频的声源位置,可以提高确定声源位置的准确度。并且,通过多维度音频特征确定声源位置,相较于现有技术仅通过相位差确定声源位置,进一步提高了所确定的声源位置的准确度,以及鲁棒性。
-
公开(公告)号:CN111161757A
公开(公告)日:2020-05-15
申请号:CN201911373874.0
申请日:2019-12-27
申请人: 镁佳(北京)科技有限公司
IPC分类号: G10L25/48 , G10L25/18 , G10L21/028 , G01S5/24
摘要: 本公开涉及一种声源定位方法、装置、可读存储介质及电子设备。该方法包括:从N个麦克风中获取目标音频信号,其中,每一所述麦克风设置在不同位置,N为大于等于3的整数;从N条所述目标音频信号中提取多维度音频特征;根据所述多维度音频特征和预先训练的声源定位模型,确定所述目标音频的声源位置。如此,基于声源定位模型确定目标音频的声源位置,可以提高确定声源位置的准确度。并且,通过多维度音频特征确定声源位置,相较于现有技术仅通过相位差确定声源位置,进一步提高了所确定的声源位置的准确度,以及鲁棒性。
-
-
-