专利检索 ap:("镁佳(北京)科技有限公司") AND inv:"莫凡" 第 1 页

1.

发明公开
车载语音识别方法、装置、可读存储介质及电子设备无效

公开(公告)号：CN111354363A

公开(公告)日：2020-06-30

申请号：CN202010107278.4

申请日：2020-02-21

申请人： 镁佳(北京)科技有限公司

发明人： 莫凡 , 孙珏 , 薛思皓 , 毛丽旦·玉素甫江

IPC分类号： G10L15/26 , G10L15/06

摘要： 本公开涉及一种车载语音识别方法、装置、可读存储介质及电子设备。方法包括：获取车辆内的音频信息；根据所述音频信息和训练后的语音识别模型，确定与所述音频信息相匹配的文本信息；在对语音识别模型进行训练时，由于是采用车辆内特定场景下的历史音频信息和与该历史音频信息相匹配的文本信息进行训练的，所以，训练后的语音识别模型能够适应车载语音场景，进而在利用该语音识别模型对车辆内的音频信息进行识别时，可以提高语音识别模型的识别率，以使语音识别模型准确地识别出文本信息，提升用户的使用体验。

2.

发明公开
人机对话方法、装置、可读存储介质及电子设备有权

公开(公告)号：CN111353035A

公开(公告)日：2020-06-30

申请号：CN202010166023.5

申请日：2020-03-11

申请人： 镁佳(北京)科技有限公司

发明人： 夏妍 , 莫凡 , 林锋

IPC分类号： G06F16/332 , G06F40/289 , G06F40/30 , G06F40/126 , G06N3/04 , G06N3/08

摘要： 本公开涉及一种人机对话方法、装置、可读存储介质及电子设备。方法包括：在接收到用户当前输入的文本信息后，从人机对话系统中读取第一对话状态；根据文本信息和第一对话状态，确定第二对话状态和文本信息对应的意图、领域、问题类型、第二槽值对；将第二槽值对与第二对话状态结合，得到当前对话状态；根据当前对话状态、意图、领域及问题类型对文本信息进行语义理解。由此，可对用户当前输入的文本信息的理解提供全面的信息支持，即使当前输入的文本信息采用基于上文的共指和省略，也可获取到正确执行命令必须的槽位，因而能准确高效地对用户当前输入的文本信息进行理解。并且，无需存储用户当前输入的文本信息的诸多上文信息，可节省存储空间。

3.

发明授权
声源定位方法、装置、可读存储介质及电子设备有权

公开(公告)号：CN111161757B

公开(公告)日：2021-09-03

申请号：CN201911373874.0

申请日：2019-12-27

申请人： 镁佳(北京)科技有限公司

发明人： 莫凡 , 孙珏 , 刘士杰

IPC分类号： G10L25/48 , G10L25/18 , G10L21/028 , G01S5/24

摘要： 本公开涉及一种声源定位方法、装置、可读存储介质及电子设备。该方法包括：从N个麦克风中获取目标音频信号，其中，每一所述麦克风设置在不同位置，N为大于等于3的整数；从N条所述目标音频信号中提取多维度音频特征；根据所述多维度音频特征和预先训练的声源定位模型，确定所述目标音频的声源位置。如此，基于声源定位模型确定目标音频的声源位置，可以提高确定声源位置的准确度。并且，通过多维度音频特征确定声源位置，相较于现有技术仅通过相位差确定声源位置，进一步提高了所确定的声源位置的准确度，以及鲁棒性。

4.

发明授权
人机对话方法、装置、可读存储介质及电子设备有权

公开(公告)号：CN111353035B

公开(公告)日：2021-02-19

申请号：CN202010166023.5

申请日：2020-03-11

申请人： 镁佳(北京)科技有限公司

发明人： 夏妍 , 莫凡 , 林锋

IPC分类号： G06F16/332 , G06F40/289 , G06F40/30 , G06F40/126 , G06N3/04 , G06N3/08

摘要： 本公开涉及一种人机对话方法、装置、可读存储介质及电子设备。方法包括：在接收到用户当前输入的文本信息后，从人机对话系统中读取第一对话状态；根据文本信息和第一对话状态，确定第二对话状态和文本信息对应的意图、领域、问题类型、第二槽值对；将第二槽值对与第二对话状态结合，得到当前对话状态；根据当前对话状态、意图、领域及问题类型对文本信息进行语义理解。由此，可对用户当前输入的文本信息的理解提供全面的信息支持，即使当前输入的文本信息采用基于上文的共指和省略，也可获取到正确执行命令必须的槽位，因而能准确高效地对用户当前输入的文本信息进行理解。并且，无需存储用户当前输入的文本信息的诸多上文信息，可节省存储空间。

5.

发明公开
声源定位方法、装置、可读存储介质及电子设备有权

公开(公告)号：CN111161757A

公开(公告)日：2020-05-15

申请号：CN201911373874.0

申请日：2019-12-27

申请人： 镁佳(北京)科技有限公司

发明人： 莫凡 , 孙珏 , 刘士杰

IPC分类号： G10L25/48 , G10L25/18 , G10L21/028 , G01S5/24

摘要： 本公开涉及一种声源定位方法、装置、可读存储介质及电子设备。该方法包括：从N个麦克风中获取目标音频信号，其中，每一所述麦克风设置在不同位置，N为大于等于3的整数；从N条所述目标音频信号中提取多维度音频特征；根据所述多维度音频特征和预先训练的声源定位模型，确定所述目标音频的声源位置。如此，基于声源定位模型确定目标音频的声源位置，可以提高确定声源位置的准确度。并且，通过多维度音频特征确定声源位置，相较于现有技术仅通过相位差确定声源位置，进一步提高了所确定的声源位置的准确度，以及鲁棒性。