语音模仿方法、终端设备及计算机可读存储介质

    公开(公告)号:CN109308903A

    公开(公告)日:2019-02-05

    申请号:CN201810868960.8

    申请日:2018-08-02

    摘要: 本发明适用于语音处理技术领域,提供了语音模仿方法、终端设备及计算机可读存储介质,包括:将获取到的原始语音数据通过预设的生成对抗网络GAN转换成包含原始语音数据中对话内容的第一梅尔谱图,再根据预设的自回归神经网络模型,将原始语音数据转换成包含原始语音数据的语言特征的第二梅尔谱图,最后根据第一梅尔谱图、第二梅尔谱图以及预设的模仿目标的梅尔谱图,生成与模仿目标具有相同语言特征的语音数据。通过生成对抗网络和自回归神经网络模型对原始语音数据进行处理,提高了语音模拟的真实度和清晰度,保证了在语音模拟过程中的原始性。

    一种婴儿语音声音翻译器
    2.
    发明公开

    公开(公告)号:CN109065074A

    公开(公告)日:2018-12-21

    申请号:CN201811114296.4

    申请日:2018-09-25

    摘要: 本发明公开了一种婴儿语音声音翻译器,包括壳体、手持拾声装置、带硅胶护套的信号线、滤波/降噪器、声音后处理器、声音识别处理器、信号反馈与传输模块、显示屏、按键、电源。本发明可在婴儿啼哭时,将手持拾声装置放置于距离婴儿口部10cm处,按开始键,系统自动采集10s~15s时长的声音片段,声音经滤波/降噪后传输给声音后处理系统,系统对声音进行特征提取和音色、音调、响度、能量、频率等参数运算,声音识别处理器中通过BP神经网络训练的饥饿、瞌睡、疼痛、无聊、恐惧、不适六种生理状态会与运算结果进行识别和匹配,匹配的结果通过显示屏显示出来。其优点在于:有助于婴儿哭声识别与翻译,提高婴儿护理的质量与效率,减少婴儿护理中的误判和延判。

    一种语音合成方法及装置
    3.
    发明公开

    公开(公告)号:CN109036377A

    公开(公告)日:2018-12-18

    申请号:CN201810834892.3

    申请日:2018-07-26

    IPC分类号: G10L13/10 G10L25/30

    CPC分类号: G10L13/10 G10L25/30

    摘要: 本发明提供一种语音合成方法及装置,涉及计算机技术领域,方法包括:确定待发声的文本信息对应的音素序列;所述音素序列包括多个音素信息,各音素信息的排序与所述文本信息中各文字的排序一致;所述音素信息包括音素信息对应的文字的声母、韵母以及音调;将所述音素序列输入语音发声模型,确定所述文本信息对应的语音特征向量,所述语音发声模型是对发声样本进行神经网络训练得到的;所述语音特征向量用于通过播放装置进行播放。由于考虑了中文发声的声母、韵母以及音调的关系,模拟出的声音具有更高的真实性,且可以适用于由音素构成的各种方言以及其它语种,具有很高的扩展性。

    一种异常路况信息识别方法、装置及终端设备

    公开(公告)号:CN108764042A

    公开(公告)日:2018-11-06

    申请号:CN201810381142.5

    申请日:2018-04-25

    发明人: 曾光 刘奇玮 张祺

    摘要: 本发明适用于车联网技术领域,提供了一种异常路况信息识别方法、装置及终端设备,所述方法包括:获取至少一个采集装置发送的路况信息;将路况信息输入深度学习模型,得到路况信息的初步识别结果;根据预设规则和初步识别结果向第一采集装置发送控制信号,所述控制信号用于指示第一采集装置采集路况的参考信息;第一采集装置为初步识别结果对应的采集装置;根据参考信息和初步识别结果确定最终异常识别结果。本发明通过充分利用路况信息,实现了对路况信息的综合识别,改善了对路况信息的识别效果,从而进一步加强了道路安全管理。