语音识别方法、装置、设备以及计算机可读存储介质

    公开(公告)号:CN107680597B

    公开(公告)日:2019-07-09

    申请号:CN201710994268.5

    申请日:2017-10-23

    摘要: 本发明实施例公开了一种语音识别方法、装置、设备以及计算机可读存储介质,其中所述方法包括根据预设规则对待测语音信息进行分帧和声学特征提取以得到帧级语音特征序列;将所述帧级语音特征序列依次分为n个信息块;将所有信息块并行输入预设的双向长短时递归神经网络模型中;获取每个信息块对应的前向识别结果以及后向识别结果在所述预设的双向长短时递归神经网络模型的输出层的相应的神经元结点下的输出结果,以得到所述待测语音信息的语音识别结果。本发明可以极大地提高语音识别的效果,有效缩短了语音解码的时延。

    多语言深神经网络
    3.
    发明授权

    公开(公告)号:CN105229725B

    公开(公告)日:2019-06-25

    申请号:CN201480025694.2

    申请日:2014-03-05

    IPC分类号: G10L15/16

    摘要: 本文描述了涉及多语言深神经网络(MDNN)的各种技术。MDNN包括多个隐藏层,其中所述多个隐藏层的权重参数的值是在训练阶段期间基于训练数据在多种语言的声学原始特征方面学习的。MDNN进一步包括针对每一目标语言分别训练的softmax层,从而利用使用多种源语言联合训练的隐藏层值。MDNN是能自适应的,使得新softmax层可被添加在现有隐藏层顶上,其中新softmax层对应于新目标语言。

    一种语音识别方法、设备及计算机可读存储介质

    公开(公告)号:CN109545226A

    公开(公告)日:2019-03-29

    申请号:CN201910014557.3

    申请日:2019-01-04

    摘要: 本发明实施例公开了一种语音识别方法、设备及计算机可读存储介质,其中方法包括:获取待检测的第一数字语音信号,所述第一数字语音信号是由数字密码组成的,所述数字密码由多个数字组成;对所述第一数字语音信号进行预设分割处理,得到多个第二数字语音信号;根据预设的信号处理方法对每个第二数字语音信号进行处理,确定出与每个第二数字语音信号对应的对数梅尔功率频谱,并从所述对数梅尔功率频谱中提取每个第二数字语音信号的目标特征信息;对每个第二数字语音信号的目标特征信息进行识别,得到与每个第二数字语音信号对应的目标数字;根据所述目标数字确定与所述第一数字语音信号对应的目标数字密码,以提高语音识别的性能和有效性。

    一种婴儿语音声音翻译器
    5.
    发明公开

    公开(公告)号:CN109065074A

    公开(公告)日:2018-12-21

    申请号:CN201811114296.4

    申请日:2018-09-25

    摘要: 本发明公开了一种婴儿语音声音翻译器,包括壳体、手持拾声装置、带硅胶护套的信号线、滤波/降噪器、声音后处理器、声音识别处理器、信号反馈与传输模块、显示屏、按键、电源。本发明可在婴儿啼哭时,将手持拾声装置放置于距离婴儿口部10cm处,按开始键,系统自动采集10s~15s时长的声音片段,声音经滤波/降噪后传输给声音后处理系统,系统对声音进行特征提取和音色、音调、响度、能量、频率等参数运算,声音识别处理器中通过BP神经网络训练的饥饿、瞌睡、疼痛、无聊、恐惧、不适六种生理状态会与运算结果进行识别和匹配,匹配的结果通过显示屏显示出来。其优点在于:有助于婴儿哭声识别与翻译,提高婴儿护理的质量与效率,减少婴儿护理中的误判和延判。

    一种对抗样本的生成方法及装置

    公开(公告)号:CN109036389A

    公开(公告)日:2018-12-18

    申请号:CN201810984846.1

    申请日:2018-08-28

    发明人: 孙思宁

    IPC分类号: G10L15/06 G10L15/16

    CPC分类号: G10L15/063 G10L15/16

    摘要: 本发明公开了一种对抗样本的生成方法及装置,涉及数据分析技术领域,主要目的在于结合训练模型的参数生成具有训练针对性的对抗样本,以提升训练模型的鲁棒性。本发明主要的技术方案为:获取一组训练样本,所述训练样本至少包含输入数据以及对应的标签值;利用随机梯度下降算法和所述训练样本更新训练模型的模型参数;根据所述模型参数以及训练模型的超参数确定对抗扰动值,所述超参数为所述训练模型初始化时随机生成的;根据所述对抗扰动值生成所述训练样本对应的对抗样本。本发明用于训练样本的扩充以及模型训练。