一种语音识别方法、设备及计算机可读存储介质

    公开(公告)号:CN109545226A

    公开(公告)日:2019-03-29

    申请号:CN201910014557.3

    申请日:2019-01-04

    摘要: 本发明实施例公开了一种语音识别方法、设备及计算机可读存储介质,其中方法包括:获取待检测的第一数字语音信号,所述第一数字语音信号是由数字密码组成的,所述数字密码由多个数字组成;对所述第一数字语音信号进行预设分割处理,得到多个第二数字语音信号;根据预设的信号处理方法对每个第二数字语音信号进行处理,确定出与每个第二数字语音信号对应的对数梅尔功率频谱,并从所述对数梅尔功率频谱中提取每个第二数字语音信号的目标特征信息;对每个第二数字语音信号的目标特征信息进行识别,得到与每个第二数字语音信号对应的目标数字;根据所述目标数字确定与所述第一数字语音信号对应的目标数字密码,以提高语音识别的性能和有效性。

    语音模仿方法、终端设备及计算机可读存储介质

    公开(公告)号:CN109308903A

    公开(公告)日:2019-02-05

    申请号:CN201810868960.8

    申请日:2018-08-02

    摘要: 本发明适用于语音处理技术领域,提供了语音模仿方法、终端设备及计算机可读存储介质,包括:将获取到的原始语音数据通过预设的生成对抗网络GAN转换成包含原始语音数据中对话内容的第一梅尔谱图,再根据预设的自回归神经网络模型,将原始语音数据转换成包含原始语音数据的语言特征的第二梅尔谱图,最后根据第一梅尔谱图、第二梅尔谱图以及预设的模仿目标的梅尔谱图,生成与模仿目标具有相同语言特征的语音数据。通过生成对抗网络和自回归神经网络模型对原始语音数据进行处理,提高了语音模拟的真实度和清晰度,保证了在语音模拟过程中的原始性。

    声学特征提取方法、装置、存储介质及终端设备

    公开(公告)号:CN109147818A

    公开(公告)日:2019-01-04

    申请号:CN201811273425.4

    申请日:2018-10-30

    发明人: 陈岩

    IPC分类号: G10L25/24 G10L25/21

    CPC分类号: G10L25/24 G10L25/21

    摘要: 本申请实施例中提供的一种声学特征提取方法、装置、存储介质及终端设备,该方法包括:获取待处理语音信号;对所述待处理语音信号进行分帧处理,得到以帧为单位的连续的语音数据块,其中,每两个相邻帧的语音数据块中,前一帧的语音数据块中的最后一个数据和后一帧的语音数据块中的第一个数据在时域上保持连续;对所述语音数据块进行加窗处理和傅里叶变换处理,以得到语音能量谱;将所述语音能量谱通过梅尔滤波器组,以得到梅尔频谱数据;根据所述梅尔频谱数据确定梅尔频率倒谱系数。通过采用上述技术方案,可以降低提取梅尔频率倒谱系数时对每帧数据的算法的次数,可以降低提取声学特征带来的功耗。

    柜台语音监控方法、装置、计算机设备及存储介质

    公开(公告)号:CN109087648A

    公开(公告)日:2018-12-25

    申请号:CN201810952270.0

    申请日:2018-08-21

    发明人: 黄锦伦

    摘要: 本发明公开一种柜台语音监控方法、装置、计算机设备及存储介质,该方法包括通过麦克风阵列采集原始语音数据;对原始语音数据进行数据预处理,获取目标语音数据;对目标语音数据进行声纹特征提取,获取目标声纹特征;采用预先训练的语音识别模型对目标声纹特征进行识别,获取与目标声纹特征对应的目标文字数据;对目标文字数据进行识别,获取识别结果;若识别结果为目标文字数据包含敏感词,则在目标文字数据中对敏感词进行突出处理,获取敏感文字数据;基于麦克风阵列标识和采集时间查询值班安排表,获取对应的柜台人员信息;将敏感文字数据和柜台人员信息关联存储在数据库中,以解决对柜台人员不能实时语音监控而导致处理不及时的问题。

    服务器、身份验证方法及计算机可读存储介质

    公开(公告)号:CN107517207A

    公开(公告)日:2017-12-26

    申请号:CN201710715433.9

    申请日:2017-08-20

    摘要: 本发明涉及一种服务器、身份验证方法及计算机可读存储介质,服务器包括存储器及与存储器连接的处理器,存储器中存储有可在处理器上运行的身份验证系统,身份验证系统被处理器执行时实现如下步骤:在收到身份验证请求后,随机向该客户端发送语音获取文本;接收客户端发送的用户播报的密码语音,识别出密码语音对应的密码字符;若密码字符与该语音获取文本对应的标准密码字符一致,则构建该密码语音的当前声纹特征向量,并根据预定的映射关系确定对应的标准声纹特征向量,利用预先确定的距离计算公式计算当前声纹特征向量与所确定的标准声纹特征向量之间的距离,根据距离对用户进行身份验证。本发明能够提高身份验证的安全性。