-
公开(公告)号:CN109308903A
公开(公告)日:2019-02-05
申请号:CN201810868960.8
申请日:2018-08-02
申请人: 平安科技(深圳)有限公司
IPC分类号: G10L21/007 , G10L25/24 , G10L25/30
CPC分类号: G10L21/007 , G10L25/24 , G10L25/30
摘要: 本发明适用于语音处理技术领域,提供了语音模仿方法、终端设备及计算机可读存储介质,包括:将获取到的原始语音数据通过预设的生成对抗网络GAN转换成包含原始语音数据中对话内容的第一梅尔谱图,再根据预设的自回归神经网络模型,将原始语音数据转换成包含原始语音数据的语言特征的第二梅尔谱图,最后根据第一梅尔谱图、第二梅尔谱图以及预设的模仿目标的梅尔谱图,生成与模仿目标具有相同语言特征的语音数据。通过生成对抗网络和自回归神经网络模型对原始语音数据进行处理,提高了语音模拟的真实度和清晰度,保证了在语音模拟过程中的原始性。
-
公开(公告)号:CN109065074A
公开(公告)日:2018-12-21
申请号:CN201811114296.4
申请日:2018-09-25
申请人: 河南理工大学
摘要: 本发明公开了一种婴儿语音声音翻译器,包括壳体、手持拾声装置、带硅胶护套的信号线、滤波/降噪器、声音后处理器、声音识别处理器、信号反馈与传输模块、显示屏、按键、电源。本发明可在婴儿啼哭时,将手持拾声装置放置于距离婴儿口部10cm处,按开始键,系统自动采集10s~15s时长的声音片段,声音经滤波/降噪后传输给声音后处理系统,系统对声音进行特征提取和音色、音调、响度、能量、频率等参数运算,声音识别处理器中通过BP神经网络训练的饥饿、瞌睡、疼痛、无聊、恐惧、不适六种生理状态会与运算结果进行识别和匹配,匹配的结果通过显示屏显示出来。其优点在于:有助于婴儿哭声识别与翻译,提高婴儿护理的质量与效率,减少婴儿护理中的误判和延判。
-
公开(公告)号:CN109036377A
公开(公告)日:2018-12-18
申请号:CN201810834892.3
申请日:2018-07-26
申请人: 中国银联股份有限公司
摘要: 本发明提供一种语音合成方法及装置,涉及计算机技术领域,方法包括:确定待发声的文本信息对应的音素序列;所述音素序列包括多个音素信息,各音素信息的排序与所述文本信息中各文字的排序一致;所述音素信息包括音素信息对应的文字的声母、韵母以及音调;将所述音素序列输入语音发声模型,确定所述文本信息对应的语音特征向量,所述语音发声模型是对发声样本进行神经网络训练得到的;所述语音特征向量用于通过播放装置进行播放。由于考虑了中文发声的声母、韵母以及音调的关系,模拟出的声音具有更高的真实性,且可以适用于由音素构成的各种方言以及其它语种,具有很高的扩展性。
-
公开(公告)号:CN108805088A
公开(公告)日:2018-11-13
申请号:CN201810613215.9
申请日:2018-06-14
申请人: 南京云思创智信息科技有限公司
CPC分类号: G06K9/00892 , G06F17/2785 , G06K9/6288 , G10L25/30 , G10L25/63
摘要: 本发明公开了一种基于多模态情绪识别系统的生理信号分析子系统,它包括数据采集设备、输出设备,其特征在于:它还包括情绪分析软件系统,所述情绪分析软件系统通过对所述数据采集设备得到的数据进行综合分析推理,最终把结果输出至所述输出设备上;所述情绪分析软件系统包括基于非接触式的生理信号的情绪识别子系统。本发明突破性的打通了五大单模态的情绪识别,创新性的利用深度神经网络将多个单模态的信息由神经网络编码、深度的关联和理解后进行综合判断,大幅度的提高了准确率,适用于绝大多数一般问询互动类应用场景。
-
公开(公告)号:CN108764042A
公开(公告)日:2018-11-06
申请号:CN201810381142.5
申请日:2018-04-25
申请人: 深圳市科思创动科技有限公司
CPC分类号: G06K9/00711 , G06N3/0454 , G10L25/30 , G10L25/51
摘要: 本发明适用于车联网技术领域,提供了一种异常路况信息识别方法、装置及终端设备,所述方法包括:获取至少一个采集装置发送的路况信息;将路况信息输入深度学习模型,得到路况信息的初步识别结果;根据预设规则和初步识别结果向第一采集装置发送控制信号,所述控制信号用于指示第一采集装置采集路况的参考信息;第一采集装置为初步识别结果对应的采集装置;根据参考信息和初步识别结果确定最终异常识别结果。本发明通过充分利用路况信息,实现了对路况信息的综合识别,改善了对路况信息的识别效果,从而进一步加强了道路安全管理。
-
公开(公告)号:CN108630198A
公开(公告)日:2018-10-09
申请号:CN201810225109.3
申请日:2018-03-19
申请人: 三星电子株式会社
CPC分类号: G10L25/30 , G10L15/063 , G10L15/16 , G10L15/187 , G10L2015/0635
摘要: 公开一种用于训练声学模型的方法和设备。一种声学模型的训练方法包括:基于语音序列来构建窗级输入数据;将窗级输入数据输入到声学模型;基于声学模型的输出来计算序列级误差;基于序列级误差来获取窗级误差;基于窗级误差来更新声学模型。
-
公开(公告)号:CN108630194A
公开(公告)日:2018-10-09
申请号:CN201710173404.4
申请日:2017-03-22
申请人: 湖南本来文化发展有限公司
发明人: 邱念
CPC分类号: G10L15/063 , G06F17/2881 , G06F17/289 , G10L15/16 , G10L15/187 , G10L15/19 , G10L15/34 , G10L25/30
摘要: 本发明公开了一种基于GSP算法翻译四川口音和意大利语的同传箱,包括:1)同传箱主体部分、2)同传箱线缆及音频输入话筒和音频输出耳机、3)云端存储的四川口音音频大数据信息库、4)云端存储的意大利语语音大数据信息库、5)云端存储的汉语语法及发音规则数据库、6)云端存储的意大利语语法及发音规则数据库、7)云计算中心搭载的GSP算法人工智能模块,七个模块构成;用于为大型国际会议提供人工智能的同传翻译,且能够识别中国用户的四川口音和意大利语,翻译的准确率高,且比人工翻译更稳定,不会随着会议时间的延长导致翻译人员疲劳而产生的翻译错误。
-
公开(公告)号:CN108364346A
公开(公告)日:2018-08-03
申请号:CN201810189748.9
申请日:2018-03-08
申请人: 腾讯科技(深圳)有限公司 , 腾讯云计算(北京)有限责任公司
发明人: 潘伟洲
摘要: 本发明属于图像处理领域,公开了一种构建三维人脸模型的方法、装置和计算机可读存储介质,以根据人体生物特征快速、便捷地构建人脸三维模型。所述方法包括:提取目标人物的声纹特征;将目标人物的声纹特征输入已训练神经网络模型,以输出目标人物的人脸特征点距离信息;根据目标人物的人脸特征点距离信息,调整通用人脸模型以构建目标人物的三维人脸模型。本发明提供的技术方案一方面构建三维人脸模型的方法相比于现有技术要快捷、方便;另一方面,通过提取目标人物的声纹特征来构建三维人脸模型,有利于以声辨人,可以应用在军事、刑侦等特殊场合。
-
公开(公告)号:CN107808659A
公开(公告)日:2018-03-16
申请号:CN201711253194.6
申请日:2017-12-02
申请人: 宫文峰
IPC分类号: G10L15/02 , G10L15/06 , G10L15/16 , G10L21/0208 , G10L25/24 , G10L25/30 , G10L25/51 , G10L25/78 , G06K9/62
CPC分类号: G10L15/02 , G06K9/6227 , G06K9/6256 , G10L15/063 , G10L15/16 , G10L21/0208 , G10L25/24 , G10L25/30 , G10L25/51 , G10L25/78
摘要: 一种智能语音信号模式识别系统装置,包含有框体10,所述框体10设置有腔体,在框体10中设置有语音采集模块1、语音识别模块2、中央处理器3、无线信号收发装置4、显示屏8、存储器33、网络模块31、内存卡32、扬声器35和电源9,语音采集模块1包含有话筒11、无线对讲机12和固定录音器13,语音识别模块2包含有语音输入单元20、语音预处理单元21、语音信号特征提取单元22、特征匹配判别分类单元23,语音信号由语音采集模块1采集,采集到的信号由语音识别模块2处理,数据信号由存储器33保存,人机交互的操作流程以及结果的输出的可视化由显示屏8显示,因此,人们识别语音信号更方便。
-
公开(公告)号:CN107636693A
公开(公告)日:2018-01-26
申请号:CN201580080124.8
申请日:2015-03-20
申请人: 弗劳恩霍夫应用研究促进协会 , 柏林技术大学
发明人: 塞巴斯蒂安·巴赫 , 沃耶西·萨梅克 , 克劳斯-罗伯特·穆勒 , 亚历山大·宾德 , 格雷格里·蒙塔翁
CPC分类号: G06N3/02 , G06F17/2765 , G06K9/4628 , G06K9/6247 , G06N3/0481 , G06N3/08 , G10L25/30
摘要: 通过穿过人工神经网络反向传播初始相关性分数,将从网络输出导出的初始相关性分数重新分布到项目集合上,来获得对应用人工神经网络的项目集合的相关性分数指派的任务,从而获得每个项目的相关性分数。具体地,这种反向传播适用于更广泛的人工神经网络集合,和/或实现更低的计算工作,这通过用以下方式同样地执行反向传播来实现:使得对于每个神经元,根据分布函数将相应神经元的下游邻居神经元集合的初步重新分布的相关性分数分布在相应神经元的上游邻居神经元集合上。
-
-
-
-
-
-
-
-
-