-
公开(公告)号:CN106663421B
公开(公告)日:2018-07-06
申请号:CN201480080290.3
申请日:2014-07-08
申请人: 三菱电机株式会社
IPC分类号: G10L15/32 , G10L15/065 , G10L15/10
CPC分类号: G10L15/10 , G10L15/01 , G10L15/065 , G10L15/32
摘要: 本发明的目的在于提供一种能在抑制无用处理的同时,获得妥当性较高的识别效果的技术。声音识别装置(1)包括第1~第3声音识别部(11~13)及控制部(14)。控制部(14)在基于由第1及第2声音识别部(11、12)获取的识别结果,判定为使第3声音识别部(13)识别输入声音的情况下,利用包含由第1及第2声音识别部(11、12)中的至少一方获取的候补字符串的词典,使第3声音识别部(13)识别输入声音。
-
公开(公告)号:CN107851434A
公开(公告)日:2018-03-27
申请号:CN201580081920.3
申请日:2015-11-04
申请人: 鲁汶大学
IPC分类号: G10L15/065 , G10L15/18 , G10L15/22
CPC分类号: G10L15/22 , G10L15/06 , G10L15/065 , G10L15/16 , G10L15/1815 , G10L15/1822 , G10L25/27 , G10L2015/223 , G10L2015/226 , G10L2015/228
摘要: 本公开涉及使用自适应增量学习方法的语音识别系统和方法。更具体地说,本公开涉及自学话音用户界面中的自适应增量学习。
-
公开(公告)号:CN103810995B
公开(公告)日:2018-02-23
申请号:CN201310757116.5
申请日:2013-11-13
申请人: 通用汽车环球科技运作有限责任公司
IPC分类号: G10L15/065
CPC分类号: G10L15/065 , G10L15/183 , G10L15/22
摘要: 本发明涉及用于语音系统的调节方法和系统。提供了用于调节语音系统的方法和系统。在一个例子中,一种方法包括:记录来自语音系统的语音数据;从语音数据中检测用户特征;以及基于用户特征选择性地更新语言模型。
-
公开(公告)号:CN103928027B
公开(公告)日:2018-01-26
申请号:CN201310756824.7
申请日:2013-11-13
申请人: 通用汽车环球科技运作有限责任公司
CPC分类号: G10L15/065 , G10L15/183 , G10L15/22
摘要: 本发明涉及用于语音系统的自适应方法和系统。提供了用于调节语音系统的方法和系统。在一个例子中,一种方法包括从语音系统中载入语音数据;处理该语音数据以获得与任务请求和交互行为中的至少一个相关联的用户能力的模式;并且基于用户能力选择性地更新系统提示和交互序列中的至少一个。
-
公开(公告)号:CN106992002A
公开(公告)日:2017-07-28
申请号:CN201710041764.9
申请日:2017-01-20
申请人: 福特全球技术公司
发明人: 阿里·哈萨尼 , 斯科特·安德鲁·安曼 , 弗朗索瓦·沙雷特 , 布丽奇特·弗朗西丝·莫拉·理查森 , 金塔拉斯·文森特·普斯科瑞斯 , 季安 , 兰杰尼·兰加拉詹 , 约翰·爱德华·胡伯
IPC分类号: G10L15/20 , G10L15/08 , G10L21/0216 , H04L12/40
CPC分类号: G10L15/20 , G10L15/065 , G10L15/08 , G10L15/22 , G10L25/84 , G10L2015/081 , G10L2015/223 , G10L21/0216 , H04L12/40 , H04L2012/40215 , H04L2012/40273
摘要: 本公开涉及一种用于改进含噪语音识别的动态声学模型切换。一种用于车辆的自动语音识别系统包括控制器,所述控制器被配置为:基于车辆的车厢中的周围环境噪声和车辆的操作参数来从声学模型库中选择声学模型。所述控制器还被配置为:将选择的声学模型应用于含噪语音,以改进对所述含噪语音的识别。
-
公开(公告)号:CN106205622A
公开(公告)日:2016-12-07
申请号:CN201610503207.X
申请日:2016-06-29
申请人: 联想(北京)有限公司
发明人: 石伟兴
摘要: 本实施例公开了一种信息处理方法及电子设备,所述信息处理方法包括:获得由从设备采集的音频数据;获得与所述从设备对应的语境数据;其中,所述语境数据用于表征所述从设备采集的所述音频数据的语音环境;获得依据所述语境数据识别所述音频数据的识别结果。
-
公开(公告)号:CN105336323A
公开(公告)日:2016-02-17
申请号:CN201510662027.1
申请日:2015-10-14
申请人: 清华大学
IPC分类号: G10L15/00 , G10L15/06 , G10L15/065 , G10L25/39
CPC分类号: G10L15/005 , G10L15/063 , G10L15/065 , G10L25/39
摘要: 本申请提供了一种维语语音识别的方法和装置,包括:将维语语音帧对应的声学特征作为自适应声学模型中的汉语声学模型的参数输入,经过线性变换和非线性变换将所述汉语声学模型下的维语语音帧对应的声学特征变换到汉语声学模型的高维非线性特征空间分布;将所述维语语音帧对应的汉语声学模型的高维非线性特征空间分布作为自适应声学模型中的维语声学模型的参数输入到所述维语声学模型中,训练所述维语声学模型,获得重构的自适应声学模型;使用遗传算法或者穷举算法筛选所述重构的自适应声学模型,获得最优自适应声学模型;使用所述最优自适应声学模型进行维语语音的识别,从而解决了维语语料不足和语音识别准确率低的问题。
-
公开(公告)号:CN103810995A
公开(公告)日:2014-05-21
申请号:CN201310757116.5
申请日:2013-11-13
申请人: 通用汽车环球科技运作有限责任公司
CPC分类号: G10L15/065 , G10L15/183 , G10L15/22
摘要: 本发明涉及用于语音系统的调节方法和系统。提供了用于调节语音系统的方法和系统。在一个例子中,一种方法包括:记录来自语音系统的语音数据;从语音数据中检测用户特征;以及基于用户特征选择性地更新语言模型。
-
公开(公告)号:CN101460996A
公开(公告)日:2009-06-17
申请号:CN200780020484.4
申请日:2007-01-16
申请人: 日本电气株式会社
IPC分类号: G10L15/20
CPC分类号: G10L15/065 , G10L2015/025
摘要: 对多个音素的每个或将声音分割成簇的每个单位,将由声压与特征量的组构成的声音模型存储在声音模型存储部(3)中。当提供输入信号时,由特征量变换部(2)算出特征量和声压,由声压比较部(4)求出输入信号与声音模型之每个的声压比,由距离算出部(5)算出输入信号与声音模型之每个的特征量的距离,由增益算出部(6)根据声压的比与距离的信息,算出增益的值,由声压补正部(7)补正输入信号的声压。
-
公开(公告)号:CN101443732A
公开(公告)日:2009-05-27
申请号:CN200780017032.0
申请日:2007-05-09
申请人: 皇家飞利浦电子股份有限公司
发明人: J·翁弗里德
CPC分类号: G10L15/28 , G06F8/656 , G10L15/065 , G10L15/32
摘要: 本发明涉及用于从数据处理装置上的第一自适应数据处理版本(V1)转换至第二自适应数据处理版本(V2)的方法和系统,其中,所述第一自适应数据处理版本(V1)采用至少一个基于数据处理结果受到连续调整的数据模型(dm),所述第二自适应数据处理版本(V2)也采用了至少一个受到连续调整的数据模型(DM),所述方法和系统的特征在于,在第一阶段内,与所述第一数据处理版本(V1)并行采用第二自适应数据处理版本(V2),由此连续调整所述与第一版本(V1)相关的所述至少一个数据模型(dm)以及与所述第二版本(V2)相关数据模型(DM),所述方法和系统的特征还在于检验利用所述第二版本(V2)的数据处理的性能以符合质量标准,而后,在第二阶段内,一旦满足了所述质量标准,就输出利用所述第二版本(V2)的数据处理的结果,以供使用。本发明还涉及其上记录有计算机程序的计算机程序产品,所述程序用于执行这样的方法。
-
-
-
-
-
-
-
-
-