一种语音交互方法以及语音交互系统

    公开(公告)号:CN110503943A

    公开(公告)日:2019-11-26

    申请号:CN201810473045.9

    申请日:2018-05-17

    发明人: 孙珏 徐曼

    摘要: 本发明涉及一种语音交互方法以及语音交互系统。该方法包括:预处理步骤,对输入的语音信息进行预处理并输出语音段;语义识别步骤,对所述预处理步骤输出的语音段进行语义识别并输出语义信息;性别分类步骤,对所述预处理步骤输出的语音段识别出用户性别并输出性别信息;以及融合处理步骤,融合所述性别信息和所述语义信息而获得对于所述语音信息的个性化回复信息。根据本发明的音交互方法以及语音交互系统,能够根据用户的性别进行区分回复,提高用户体验,提高语音交互的智能化。

    特定领域语言模型生成方法及语音数据标注系统

    公开(公告)号:CN110930993A

    公开(公告)日:2020-03-27

    申请号:CN201811099240.6

    申请日:2018-09-20

    发明人: 孙珏 李洁琼 邵鹏

    IPC分类号: G10L15/06

    摘要: 本发明涉及一种特定领域语言模型生成方法,包括:基于第一文本集建立第一语言模型;基于第一语言模型来进行特定领域的语料扩展,以获得第二文本集;基于第二文本集建立第二语言模型;针对第一文本集和第二文本集的重合词元,将重合词元在第一语言模型上的词概率与其在第二语言模型上的词概率进行插值运算,以建立第三语言模型。这种方法集成了通用语言模型的适用广度,以及特定领域中对专业词汇的识别精度的特征,有利于提高新语言模型的识别准确度和应用普适性。

    用于确定语音结束点的方法、装置和计算机存储介质

    公开(公告)号:CN110875033A

    公开(公告)日:2020-03-10

    申请号:CN201811026257.9

    申请日:2018-09-04

    发明人: 孙珏 徐曼

    摘要: 本发明涉及语音识别技术,特别涉及用于确定语音结束点的方法、装置和计算机存储介质。按照本发明一个方面的用于确定语音结束点的方法包含下列步骤:a)对语音信号进行监测以确定是否进入停顿状态;b)响应于停顿状态的进入,基于从该停顿状态之前的语音信号所确定的语义内容得到相应的延迟时长;以及c)如果在自该停顿状态起的延迟时长内未进入话音状态,则将该延迟时长结束的时刻确定为语音结束点。

    车辆配置方法、系统、车机以及车辆

    公开(公告)号:CN109273002A

    公开(公告)日:2019-01-25

    申请号:CN201811260569.6

    申请日:2018-10-26

    发明人: 徐曼 孙珏

    IPC分类号: G10L15/22 G10L17/00

    CPC分类号: G10L15/22 G10L17/005

    摘要: 本发明属于语音识别技术领域,具体提供了一种车辆配置方法、系统、车机以及车辆,旨在解决现有技术更换驾乘人员时需要重新手动设置个性化配置的问题。为此目的,本发明提供了一种车辆配置方法,包括获取用户的语音信息并识别语音信息对应的用户声纹信息;根据预设的多个声纹信息与多个用户ID的一一对应关系获取用户声纹信息对应的用户ID;执行预先与用户声纹信息对应的用户ID关联的车辆配置操作。基于上述步骤,根据本发明提供的方法,车辆会根据用户之前的个性化配置自动执行与该用户ID关联的车辆配置操作,提高了用户的用车体验,还可以根据不同用户的ID执行与其对应的车辆配置操作,提高了车辆的智能性。

    定位汽车内语音源的方法

    公开(公告)号:CN111323753A

    公开(公告)日:2020-06-23

    申请号:CN201811525489.9

    申请日:2018-12-13

    IPC分类号: G01S5/24

    摘要: 本发明涉及一种定位汽车内语音源的方法,包括:识别语音源发出的语音,以提取唤醒识别语音;计算唤醒识别语音的波前分别到达不同麦克风阵列的第一时间差;以及至少基于第一时间差和不同麦克风阵列的位置来确定用户所在的位置。其不仅能够准确地进行语音源定位,还能够对驾驶员语音提供更高级别的智能响应,从而确保行车安全。

    语音识别装置和方法、语音交互系统和方法

    公开(公告)号:CN111091819A

    公开(公告)日:2020-05-01

    申请号:CN201811166607.1

    申请日:2018-10-08

    发明人: 李国庆 孙珏

    摘要: 本发明涉及一种语音识别装置和方法、语音交互系统和方法。本发明的语音识别装置能够接收用户的语音输入,并且能够从远端语音识别模块在线接收其对所述语音输入在线处理后输出的第一语音识别结果;所述语音识别装置还包括:本地语音识别模块,其被配置有基于二值化神经网络算法构建的第二声学模型;其中,所述本地语音识别模块至少通过所述第二声学模型对从所述语音输入提取的语音特征进行处理以输出第二语音识别结果。本发明的语音识别及时、准确,受网络连接状况影响小,用户体验好。

    基于声纹信息的语音识别方法及智能交互设备

    公开(公告)号:CN110853632A

    公开(公告)日:2020-02-28

    申请号:CN201810953612.0

    申请日:2018-08-21

    发明人: 孙珏 莫凡

    IPC分类号: G10L15/22 G10L17/06

    摘要: 本发明涉及一种基于声纹信息的语音识别方法,包括:识别设备获取用户的语音信息;利用语音识别模型对第一语音信息进行识别以获得第一识别结果;基于第一识别结果、用户的注册声纹信息和第一语音信息来调节语音识别模型。其显著提高了语音识别的准确率,并有效避免识别设备的误唤醒、误应答。

    语音识别方法及智能设备

    公开(公告)号:CN110808050A

    公开(公告)日:2020-02-18

    申请号:CN201810877097.2

    申请日:2018-08-03

    发明人: 孙珏

    IPC分类号: G10L15/26 G10L15/02 G06F40/30

    摘要: 本发明涉及一种用于智能设备的语音识别方法,包括如下步骤:采集第一音频数据,并从中提取至少一个语音词;基于语音词进行唤醒识别,以确定是否唤醒智能设备;基于智能设备的唤醒而采集第二音频数据,并从中提取至少一个三音素;基于每个三音素相应的后验概率进行语音识别;基于语音识别的结果进行意图分析以确定智能设备是否进行响应。其可以有效避免智能设备的误启动、误响应,还能够更准确地判明用户意图以进行智能响应,有利于提高用户的使用体验。

    用于车机系统的用户个性化离线语音识别方法及其系统

    公开(公告)号:CN110120221A

    公开(公告)日:2019-08-13

    申请号:CN201910491042.2

    申请日:2019-06-06

    IPC分类号: G10L15/22 G10L15/26 G10L15/06

    摘要: 本发明涉及用于车机系统的用户个性化离线语音识别方法及其系统。该方法包括下述步骤:收集步骤,收集车机系统的用户的在线自动语音识别结果;筛选步骤,对所述在线自动语音识别结果进行筛选得到在线语音模型的语料;训练步骤,对于所述在线语音模型的语料进行训练生成在线语音模型;以及融合步骤,将所述在线语音模型与已知的通用语言模型进行融合得到新语言模型。根据本发明,能够使得离线识别的结果尽最大可能逼近在线语音识别的识别结果,提高识别率,提升用户体验。