-
公开(公告)号:CN106710589B
公开(公告)日:2019-07-30
申请号:CN201611239071.2
申请日:2016-12-28
申请人: 百度在线网络技术(北京)有限公司
CPC分类号: G10L15/02 , G06K9/4628 , G06K9/6274 , G06N3/04 , G06N3/0454 , G06N3/08 , G10L15/16 , G10L15/22 , G10L15/24 , G10L15/30 , G10L25/18
摘要: 本发明提出一种基于人工智能的语音特征提取方法及装置,其中,方法包括:对待识别语音进行频谱分析,得到待识别语音的语谱图,利用图像识别算法中的Inception卷积结构,对语谱图进行特征提取,得到待识别语音的语音特征。本发明中,通过对待识别语音进行频谱分析,将连续的待识别语音转换成语谱图进行表示,由于Inception卷积结构为可以精准识别图像特征的有效的图像识别方式,利用Inception卷积结构对语谱图进行识别,提取出待识别语音较为准确的语音特征,进而可以提高语音识别的准确率。
-
公开(公告)号:CN107680597B
公开(公告)日:2019-07-09
申请号:CN201710994268.5
申请日:2017-10-23
申请人: 平安科技(深圳)有限公司
摘要: 本发明实施例公开了一种语音识别方法、装置、设备以及计算机可读存储介质,其中所述方法包括根据预设规则对待测语音信息进行分帧和声学特征提取以得到帧级语音特征序列;将所述帧级语音特征序列依次分为n个信息块;将所有信息块并行输入预设的双向长短时递归神经网络模型中;获取每个信息块对应的前向识别结果以及后向识别结果在所述预设的双向长短时递归神经网络模型的输出层的相应的神经元结点下的输出结果,以得到所述待测语音信息的语音识别结果。本发明可以极大地提高语音识别的效果,有效缩短了语音解码的时延。
-
公开(公告)号:CN105229725B
公开(公告)日:2019-06-25
申请号:CN201480025694.2
申请日:2014-03-05
申请人: 微软技术许可有限责任公司
IPC分类号: G10L15/16
CPC分类号: G10L15/063 , G06N3/0454 , G06N3/084 , G10L15/16
摘要: 本文描述了涉及多语言深神经网络(MDNN)的各种技术。MDNN包括多个隐藏层,其中所述多个隐藏层的权重参数的值是在训练阶段期间基于训练数据在多种语言的声学原始特征方面学习的。MDNN进一步包括针对每一目标语言分别训练的softmax层,从而利用使用多种源语言联合训练的隐藏层值。MDNN是能自适应的,使得新softmax层可被添加在现有隐藏层顶上,其中新softmax层对应于新目标语言。
-
公开(公告)号:CN109545226A
公开(公告)日:2019-03-29
申请号:CN201910014557.3
申请日:2019-01-04
申请人: 平安科技(深圳)有限公司
CPC分类号: G10L15/265 , G10L15/063 , G10L15/10 , G10L15/144 , G10L15/16 , G10L25/24
摘要: 本发明实施例公开了一种语音识别方法、设备及计算机可读存储介质,其中方法包括:获取待检测的第一数字语音信号,所述第一数字语音信号是由数字密码组成的,所述数字密码由多个数字组成;对所述第一数字语音信号进行预设分割处理,得到多个第二数字语音信号;根据预设的信号处理方法对每个第二数字语音信号进行处理,确定出与每个第二数字语音信号对应的对数梅尔功率频谱,并从所述对数梅尔功率频谱中提取每个第二数字语音信号的目标特征信息;对每个第二数字语音信号的目标特征信息进行识别,得到与每个第二数字语音信号对应的目标数字;根据所述目标数字确定与所述第一数字语音信号对应的目标数字密码,以提高语音识别的性能和有效性。
-
公开(公告)号:CN109065074A
公开(公告)日:2018-12-21
申请号:CN201811114296.4
申请日:2018-09-25
申请人: 河南理工大学
摘要: 本发明公开了一种婴儿语音声音翻译器,包括壳体、手持拾声装置、带硅胶护套的信号线、滤波/降噪器、声音后处理器、声音识别处理器、信号反馈与传输模块、显示屏、按键、电源。本发明可在婴儿啼哭时,将手持拾声装置放置于距离婴儿口部10cm处,按开始键,系统自动采集10s~15s时长的声音片段,声音经滤波/降噪后传输给声音后处理系统,系统对声音进行特征提取和音色、音调、响度、能量、频率等参数运算,声音识别处理器中通过BP神经网络训练的饥饿、瞌睡、疼痛、无聊、恐惧、不适六种生理状态会与运算结果进行识别和匹配,匹配的结果通过显示屏显示出来。其优点在于:有助于婴儿哭声识别与翻译,提高婴儿护理的质量与效率,减少婴儿护理中的误判和延判。
-
公开(公告)号:CN109063831A
公开(公告)日:2018-12-21
申请号:CN201810849491.5
申请日:2017-10-30
申请人: 上海寒武纪信息科技有限公司
CPC分类号: G06F7/5443 , G06F9/30007 , G06F9/30029 , G06F9/30036 , G06F9/30181 , G06F9/382 , G06F9/3826 , G06F9/3867 , G06F13/28 , G06F17/153 , G06F17/16 , G06F17/2809 , G06K9/00268 , G06K9/00288 , G06K9/627 , G06N3/0454 , G06N3/063 , G06N3/08 , G06N3/084 , G06Q30/0251 , G06Q30/0271 , G06Q30/0631 , G06T1/20 , G06T1/60 , G06T3/0012 , G06T3/4053 , G06T5/009 , G06T2200/28 , G10L15/16 , G10L15/26 , G10L15/285
摘要: 本发明提供一种人工智能处理器及人工智能处理器执行向量加和指令方法,所述处理器设置于计算装置内,所述计算装置用于神经网络运算指令,本申请提供的技术方案具有能耗低的优点。
-
公开(公告)号:CN109036389A
公开(公告)日:2018-12-18
申请号:CN201810984846.1
申请日:2018-08-28
申请人: 出门问问信息科技有限公司
发明人: 孙思宁
CPC分类号: G10L15/063 , G10L15/16
摘要: 本发明公开了一种对抗样本的生成方法及装置,涉及数据分析技术领域,主要目的在于结合训练模型的参数生成具有训练针对性的对抗样本,以提升训练模型的鲁棒性。本发明主要的技术方案为:获取一组训练样本,所述训练样本至少包含输入数据以及对应的标签值;利用随机梯度下降算法和所述训练样本更新训练模型的模型参数;根据所述模型参数以及训练模型的超参数确定对抗扰动值,所述超参数为所述训练模型初始化时随机生成的;根据所述对抗扰动值生成所述训练样本对应的对抗样本。本发明用于训练样本的扩充以及模型训练。
-
公开(公告)号:CN109034383A
公开(公告)日:2018-12-18
申请号:CN201810849488.3
申请日:2017-10-30
申请人: 上海寒武纪信息科技有限公司
CPC分类号: G06F7/5443 , G06F9/30007 , G06F9/30029 , G06F9/30036 , G06F9/30181 , G06F9/382 , G06F9/3826 , G06F9/3867 , G06F13/28 , G06F17/153 , G06F17/16 , G06F17/2809 , G06K9/00268 , G06K9/00288 , G06K9/627 , G06N3/0454 , G06N3/063 , G06N3/08 , G06N3/084 , G06Q30/0251 , G06Q30/0271 , G06Q30/0631 , G06T1/20 , G06T1/60 , G06T3/0012 , G06T3/4053 , G06T5/009 , G06T2200/28 , G10L15/16 , G10L15/26 , G10L15/285
摘要: 本发明提供一种神经网络处理器及神经网络处理器执行矩阵相乘指令方法,所述处理器设置于计算装置内,所述计算装置用于神经网络运算指令,本申请提供的技术方案具有能耗低的优点。
-
公开(公告)号:CN108735202A
公开(公告)日:2018-11-02
申请号:CN201810204872.8
申请日:2018-03-13
申请人: 百度(美国)有限责任公司
CPC分类号: G10L15/16 , G06F3/16 , G06N3/049 , G06N3/08 , G10L15/063 , G10L15/18 , G10L21/0208 , G10L2015/088
摘要: 本文中描述了用于创建和使用小占用资源关键词检索(KWS)系统的卷积递归神经网络(CRNN)的系统和方法。受到大型最新语音识别系统的启发,在实施方式中,将利用时域和频域中数据的结构的卷积层的优势与递归层结合,从而利用整个经处理的帧的上下文。考虑到性能与模型尺寸权衡之比,对架构参数的效果进行实验以确定优选的模型实施方式。提供了各种训练策略来提高性能。在实施方式中,通过仅使用~230k个参数并得到可接受的低延迟性,CRNN模型实施方式在广泛的环境中展现出高准确性和稳健的性能。
-
公开(公告)号:CN108670128A
公开(公告)日:2018-10-19
申请号:CN201810488657.5
申请日:2018-05-21
申请人: 深圳市沃特沃德股份有限公司
发明人: 刘先名
CPC分类号: A47L11/24 , A47L11/4011 , G10L15/063 , G10L15/16 , G10L15/22 , G10L17/04 , G10L17/22
摘要: 本发明揭示了语音控制扫地机器人的方法和扫地机器人,其中方法包括通过语音采集器采集当前用户的第一语音信号;判断第一语音信号是否与预设语音唤醒指令相匹配;若是,则唤醒扫地机器人进入工作状态;若否,则提示输入的第一语音信号错误。通过对用户声音信息的采集与识别,实现对扫地机器人语音控制的效果,极大地提高了用户的使用体验。
-
-
-
-
-
-
-
-
-