一种音频数据处理方法及装置、存储介质

    公开(公告)号:CN110164431B

    公开(公告)日:2023-01-06

    申请号:CN201811361659.4

    申请日:2018-11-15

    IPC分类号: G10L15/22 G10L15/06 G10L15/26

    摘要: 本发明实施例提供了一种音频数据处理方法及装置、存储介质,该方法包括:获取语音检测模型,所述语音检测模型为具有历史积累特性的至少一个检测通路的音频数据和语音识别结果的对应关系;基于检测到的所述至少一个检测通路的数量,确定参考对象;所述参考对象为进行重置操作判断的因素;基于所述参考对象,确定重置时间点,所述重置时间点为在保证语音识别性能的情况下,初始化所述语音检测模型中的历史积累的时刻;在所述重置时间点到达时,重置所述语音检测模型。

    语音处理系统、方法、设备、语音识别系统及存储介质

    公开(公告)号:CN110517677A

    公开(公告)日:2019-11-29

    申请号:CN201910797459.1

    申请日:2019-08-27

    IPC分类号: G10L15/22 G10L21/0216

    摘要: 本申请公开了一种基于人工智能的语音处理系统,包括:声音采集模块,用于采集声音信号;空间谱分析模块,用于分析所述声音信号得到空间谱;语音标注模块,用于根据所述空间谱标注所述声音信号中是否包含给定方位角附近的语音信号得到标注结果,向与其对应的自适应波束形成器发送所述标注结果;所述自适应波束形成器,用于根据所述标注结果更新自身系数,对所述声音信号进行增强得到增强语音信号,所述增强语音信号用于语音识别。通过新增空间谱分析模块和语音标注模块,实现对声音信号中是否包含指定方向的语音进行标注,为波束形成器进行语音增强提供参考信息,以提高语音识别性能。本申请还公开了对应的方法、设备、语音识别系统及介质。

    一种音频数据处理方法及装置

    公开(公告)号:CN110120217B

    公开(公告)日:2023-11-24

    申请号:CN201910390481.4

    申请日:2019-05-10

    摘要: 本发明实施例公开了一种音频数据处理方法及装置,该音频数据处理方法包括:获取拾音信号,根据第一驾驶方向参数信息,确定拾音信号所包含的第一预处理信号,根据第二驾驶方向参数信息,确定拾音信号所包含的第二预处理信号;根据第一预处理信号与第二预处理信号对应的信噪比,确定分离参数信息,根据分离参数信息,确定第一预处理信号对应的第一分离信号,以及第二预处理信号对应的第二分离信号;获取第一分离信号与第二分离信号所包含的异常信号,将异常信号进行消除,得到第一驾驶方向对应的第一音频信号,以及第二驾驶方向对应的第二音频信号。采用本发明实施例,可以提高语音识别的准确率。

    一种人工智能的数据检测方法及装置、存储介质

    公开(公告)号:CN110517680B

    公开(公告)日:2023-02-03

    申请号:CN201910809694.6

    申请日:2018-11-15

    IPC分类号: G10L15/22 G10L15/06 G10L15/26

    摘要: 本发明实施例提供了一种人工智能的数据检测方法及装置、存储介质,该方法包括:针对至少一个方向支路的语音检测时,采用语音检测模型对至少一个方向支路中的待检测音频数据进行语音识别,得到每一个方向支路的当前检测结果;基于每一个方向支路的当前检测结果对自身方向支路对应的语音检测模型进行重置操作,得到重置时间点;在重置时间点到达时,重置每一个方向支路的语音检测模型;根据每一个方向支路的重置后语音检测模型对至少一个方向支路分别进行语音识别。

    声音采集设备
    5.
    发明授权

    公开(公告)号:CN110351633B

    公开(公告)日:2022-05-24

    申请号:CN201910741189.2

    申请日:2018-12-27

    IPC分类号: H04R3/00

    摘要: 本申请是关于一种声音采集设备,涉及声学处理技术领域。声音采集设备包括声音信号处理芯片及声音采集组件阵列,阵列包括两个第一声音采集组件、两个第二声音采集组件以及两个第三声音采集组件;两个第二声音采集组件位于两个该第一声音采集组件之间的连线一侧,且两个第三声音采集组件位于该连线的另一侧;两个第二声音采集组件以该连线的中垂线对称,且两个第三声音采集组件以该中垂线对称;两个第一声音采集组件之间的距离大于两个第二声音采集组件之间的距离,且两个第一声音采集组件之间的距离大于两个第三声音采集组件之间的距离。上述组件适应狭长外观设计,同时提高声音信号处理效率。

    一种人工智能的数据检测方法及装置、存储介质

    公开(公告)号:CN110415698B

    公开(公告)日:2022-05-13

    申请号:CN201910809813.8

    申请日:2018-11-15

    摘要: 本发明实施例提供了一种人工智能的数据检测方法及装置、存储介质,该方法包括:获取待检测音频数据;当检测到的检测通路的主检测通路和备份检测通路时,通过重置和启动控制器控制主检测通路的重置,以及控制备份检测通路的重置和启动,得到每个检测通路的重置后语音检测模型;利用重置后语音检测模型对主检测通路和备份检测通路的待检测音频数据进行识别,得到主检测通路的主检测结果和备份检测通路备份检测结果;将主检测结果和备份检测结果进行综合处理后,输出总检测结果。

    音频信号处理方法、装置、设备及存储介质

    公开(公告)号:CN111798860A

    公开(公告)日:2020-10-20

    申请号:CN202010693891.9

    申请日:2020-07-17

    摘要: 本公开揭示了一种音频信号处理方法、装置、设备及存储介质,属于语音处理领域。方法包括:获取麦克风阵列中不同麦克风采集的至少两个音频信号;通过第一滤波器对至少两个音频信号进行滤波得到第一目标波束;通过第二滤波器对至少两个音频信号进行滤波得到第一干扰波束;通过第三滤波器获取第一干扰波束的第二干扰波束;将第一目标波束与第二干扰波束之差确定为第一音频处理输出;自适应更新第二滤波器和第三滤波器中的至少一个,在更新完成后根据第二滤波器和第三滤波器更新第一滤波器。该方法可以在干扰移动情形下减小干扰泄露。

    一种音频数据处理方法及装置、存储介质

    公开(公告)号:CN110164431A

    公开(公告)日:2019-08-23

    申请号:CN201811361659.4

    申请日:2018-11-15

    IPC分类号: G10L15/22 G10L15/06 G10L15/26

    摘要: 本发明实施例提供了一种音频数据处理方法及装置、存储介质,该方法包括:获取语音检测模型,所述语音检测模型为具有历史积累特性的至少一个检测通路的音频数据和语音识别结果的对应关系;基于检测到的所述至少一个检测通路的数量,确定参考对象;所述参考对象为进行重置操作判断的因素;基于所述参考对象,确定重置时间点,所述重置时间点为在保证语音识别性能的情况下,初始化所述语音检测模型中的历史积累的时刻;在所述重置时间点到达时,重置所述语音检测模型。

    信号生成的方法、基于人工智能的语音识别方法及装置

    公开(公告)号:CN110517702B

    公开(公告)日:2022-10-04

    申请号:CN201910843381.2

    申请日:2019-09-06

    摘要: 本申请公开了一信号生成的方法,该方法应用于人工智能领域,包括:当通过麦克风阵列获取目标语音帧对应的语音输入信号时,根据语音输入信号获取待估计角度对应的第一信号能量,待估计角度在入射方位角范围内;根据目标语音帧所对应的语音输入信号以及波束形成器系数,确定目标语音帧对应的第二信号能量;根据第一信号能量以及第二信号能量,确定待估计角度对应的空间特征;根据空间特征生成目标语音帧对应的目标控制信号。本申请还公开了一种基于人工智能的语音识别方法及装置。本申请能够分别确定来自各个待估计角度方向上的空间特征,基于空间特征生成相应的控制信号,提升控制信号的准确性和鲁棒性,提高前处理系统对语音信号增强的性能。

    音频信号处理方法、装置、设备及存储介质

    公开(公告)号:CN111798860B

    公开(公告)日:2022-08-23

    申请号:CN202010693891.9

    申请日:2020-07-17

    摘要: 本公开揭示了一种音频信号处理方法、装置、设备及存储介质,属于语音处理领域。方法包括:获取麦克风阵列中不同麦克风采集的至少两个音频信号;通过第一滤波器对至少两个音频信号进行滤波得到第一目标波束;通过第二滤波器对至少两个音频信号进行滤波得到第一干扰波束;通过第三滤波器获取第一干扰波束的第二干扰波束;将第一目标波束与第二干扰波束之差确定为第一音频处理输出;自适应更新第二滤波器和第三滤波器中的至少一个,在更新完成后根据第二滤波器和第三滤波器更新第一滤波器。该方法可以在干扰移动情形下减小干扰泄露。