-
公开(公告)号:CN105070288A
公开(公告)日:2015-11-18
申请号:CN201510382215.9
申请日:2015-07-02
申请人: 百度在线网络技术(北京)有限公司
CPC分类号: G10L15/22 , G10L15/16 , G10L15/1815 , G10L25/09 , G10L25/21 , G10L25/24 , G10L25/30 , G10L25/51 , G10L25/63 , G10L2015/223 , G10L2015/227
摘要: 本发明实施例公开了一种车载语音指令识别方法和装置。所述方法包括:获取用户输入的语音指令;根据预先训练的深层神经网络DNN模型确定用户的基本信息;根据所述用户的基本信息对语音指令进行内容识别,并根据识别的内容以及用户输入所述语音指令的场景页面上下文确定至少一个用户可能意图;根据所述DNN模型确定用户可能意图的置信度;根据所述置信度从所述用户可能意图中确定用户真实意图;根据所述用户真实意图执行对应的动作。本发明实施例提供的车载语音指令识别方法和装置能够有效的提高语音指令的正确识别率。
-
公开(公告)号:CN102044242B
公开(公告)日:2012-01-25
申请号:CN200910206840.2
申请日:2009-10-15
申请人: 华为技术有限公司
发明人: 王喆
IPC分类号: G10L11/02
摘要: 本发明实施例公开了语音激活检测方法、装置和电子设备。其中的方法包括:从音频帧中获取时域分类参数和频域分类参数,获取所述时域分类参数与时域分类参数在历史背景噪声帧中的长时滑动平均值之间的第一距离,获取所述频域分类参数与频域分类参数在历史背景噪声帧中的长时滑动平均值之间的第二距离,根据所述第一距离和第二距离以及基于所述第一距离和第二距离的判决多项式组判决所述音频帧为前景语音帧还是为背景噪声帧,所述判决多项式组中的至少一个系数为变量,所述变量随语音激活检测工作方式或输入信号特征而变化。上述技术方案可使判决准则具有自适应调节能力,从而提高了语音激活检测的性能。
-
公开(公告)号:CN102044242A
公开(公告)日:2011-05-04
申请号:CN200910206840.2
申请日:2009-10-15
申请人: 华为技术有限公司
发明人: 王喆
IPC分类号: G10L11/02
摘要: 本发明实施例公开了语音激活检测方法、装置和电子设备。其中的方法包括:从音频帧中获取时域分类参数和频域分类参数,获取所述时域分类参数与时域分类参数在历史背景噪声帧中的长时滑动平均值之间的第一距离,获取所述频域分类参数与频域分类参数在历史背景噪声帧中的长时滑动平均值之间的第二距离,根据所述第一距离和第二距离以及基于所述第一距离和第二距离的判决多项式组判决所述音频帧为前景语音帧还是为背景噪声帧,所述判决多项式组中的至少一个系数为变量,所述变量随语音激活检测工作方式或输入信号特征而变化。上述技术方案可使判决准则具有自适应调节能力,从而提高了语音激活检测的性能。
-
公开(公告)号:CN106372607A
公开(公告)日:2017-02-01
申请号:CN201610804032.6
申请日:2016-09-05
申请人: 努比亚技术有限公司
CPC分类号: G06K9/00744 , G06K9/00268 , G06K9/00758 , G06K9/6201 , G06K9/6215 , G10L25/03 , G10L25/09 , G10L25/18 , G10L25/21 , G10L25/24 , G10L25/57
摘要: 本发明公开了一种从视频中提取图片的方法,所述方法包括步骤:接收用户输入的参考对象;确定参考对象的特征参数信息;获取目标视频中与特征参数信息匹配的一或多个视频段;提取一或多个视频段中的图片。本发明还公开了一种从视频中提取图片的移动终端。本发明公开的实施方案,可以方便用户快速从目标视频中提取自己想要的图片,避免了繁琐的操作过程,给用户带来极大的方便。
-
公开(公告)号:CN103413553B
公开(公告)日:2016-03-09
申请号:CN201310364530.X
申请日:2013-08-20
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G10L19/028 , G10L19/032
CPC分类号: G10L19/02 , G10L19/032 , G10L25/09 , G10L25/21
摘要: 本发明公开了一种音频编码方法、音频解码方法、编码端、解码端和系统,属于网络技术领域。所述方法包括:根据音频参数确定音频信号是否为指定信号类型;对属于指定信号类型的音频信号和/或不属于指定信号类型的音频信号进行标记;其中,标记过程可以在编码端或者解码端进行,用于在解码时对指定信号类型的音频信号进行增强处理。本发明通过音频参数确定音频信号是否为指定信号类型,只对指定信号类型进行增强,解决了音频信号由于编解码而引入的量化噪声在对音频信号进行增强的同时也被增强而影响音频信号的感知的问题;达到了保证音频信号的感知的效果,并且相对于传统的从时域变换到频域中进行增强的方法减少了运算复杂度。
-
公开(公告)号:CN103839551A
公开(公告)日:2014-06-04
申请号:CN201210477149.X
申请日:2012-11-22
申请人: 鸿富锦精密工业(深圳)有限公司 , 鸿海精密工业股份有限公司
发明人: 叶源
IPC分类号: G10L21/02
CPC分类号: G10L21/0316 , G10H1/22 , G10H1/366 , G10L25/09
摘要: 本发明涉及一种音频处理系统及方法,该音频处理系统应用于电子设备中,电子设备用于接收音频信息,音频信息包括第一信号及第二信号,第一信号为影响电子设备音频输出效果的信号,第二信号的幅值大于第一信号的幅值,电子设备包括处理器及储存器,存储器存储表示第一信号特征的预设过零率、第一幅值及第二幅值,第一、第二幅值分别表示第一信号的最大幅值及最小幅值,音频处理系统包括:获取模块,用于获取音频信息;划分模块,将音频信息划分为若干个音频段落;读取模块,读取音频段落内的语音信号的过零率及幅值;判断模块,判断当前音频段落内的语音信号是否为第一信号;及处理模块,将第一信号进行抑制处理以消除第一信号。
-
公开(公告)号:CN102348150A
公开(公告)日:2012-02-08
申请号:CN201110206440.9
申请日:2011-07-22
申请人: 索尼公司
发明人: 关矢俊之
IPC分类号: H04R3/00
CPC分类号: G10L21/0208 , G10L21/0216 , G10L25/09
摘要: 本发明提供了一种音频信号处理装置,包括:幅度检测器,配置为通过将包括噪声信号的音频信号的幅度值与阈值比较,检测所述音频信号的噪声开始点;频率特征计算器,配置为计算至少表示所述噪声开始点之后的音频信号的频率特性的频率特征;以及噪声确定器,配置为基于所述频率特征,确定在所述噪声开始点之后的音频信号中连续包括等于或高于参考频率的高频分量的段,作为噪声段。
-
公开(公告)号:CN1113345C
公开(公告)日:2003-07-02
申请号:CN97113136.8
申请日:1997-05-16
申请人: 信浓绢糸株式会社
发明人: 田中伸
CPC分类号: G10H1/40 , G10H2210/385 , G10L21/01 , G10L21/04 , G10L25/09 , G11B20/10527 , G11B27/005 , G11B2220/20 , G11B2220/2545
摘要: 一种重现音频信号的方法,可以在不改变音频信号的音调和质量的情况下改变重现速度。对音频信号滤波以提取基本音频信号(d)。检测基本音频信号(d)中的零交叉点(D)。在时间轴上根据零交叉点(D)将原始音频信号(a)划分成多个帧。使帧变窄,并根据余下的帧将原始音频信号(a)重现为声音,以加速重现速度。另一方面,通过重复帧(C1,C2,…)重现原始音频信号(a),以使重现速度放慢。
-
公开(公告)号:CN105070288B
公开(公告)日:2018-08-07
申请号:CN201510382215.9
申请日:2015-07-02
申请人: 百度在线网络技术(北京)有限公司
CPC分类号: G10L15/22 , G10L15/16 , G10L15/1815 , G10L25/09 , G10L25/21 , G10L25/24 , G10L25/30 , G10L25/51 , G10L25/63 , G10L2015/223 , G10L2015/227
摘要: 本发明实施例公开了种车载语音指令识别方法和装置。所述方法包括:获取用户输入的语音指令;根据预先训练的深层神经网络DNN模型确定用户的基本信息;根据所述用户的基本信息对语音指令进行内容识别,并根据识别的内容以及用户输入所述语音指令的场景页面上下文确定至少个用户可能意图;根据所述DNN模型确定用户可能意图的置信度;根据所述置信度从所述用户可能意图中确定用户真实意图;根据所述用户真实意图执行对应的动作。本发明实施例提供的车载语音指令识别方法和装置能够有效的提高语音指令的正确识别率。
-
公开(公告)号:CN107665713A
公开(公告)日:2018-02-06
申请号:CN201710034582.9
申请日:2017-01-17
申请人: 联发科技股份有限公司
CPC分类号: G10L25/09 , G10L19/00 , G10L25/21 , H03G3/3089 , H03G7/007 , G10L19/0017 , G10L19/16
摘要: 本发明揭露一种音频编解码系统及其方法。其中所述音频编解码系统包含:存储器,用于缓存音频帧;信号功率检测器,用于检测缓存在所述存储器的所述音频帧的信号功率电平,以生成信号功率前瞻值;过零检测器,对于所述信号功率前瞻值的改变,配置所述过零检测器检测缓存在所述存储器的所述音频帧的过零点,以取得增益控制的可用校准点;以及动态范围增强增益控制器,用于将所述增益控制划分在所述可用校准点执行。本发明提供的音频编解码系统与音频编解码方法可取得平滑并且具有无缝编解码性能的增益控制。
-
-
-
-
-
-
-
-
-