-
公开(公告)号:CN1531722A
公开(公告)日:2004-09-22
申请号:CN02810586.9
申请日:2002-03-22
申请人: 高通股份有限公司
CPC分类号: G10L15/142 , G10L15/07 , G10L15/10 , G10L15/12 , G10L15/144 , G10L15/32
摘要: 揭示了一种语音识别(VR)系统,该系统采用独立于扬声器(SI)(230和232)和依赖于扬声器(SD)(234)的声学模型的组合。至少一个SI声学模型(230和232)用于和至少一个SD声学模型(234)的组合,以提供至少能相同与纯SI声学模型的语音识别性能的水平。所揭示的SI/SD VR系统可继续使用无人指导的训练,来更新在一个和多个SD声学模型(234)中的声学模板。混合的VR系统随后使用与至少一个SI声学模型(230和232)组合中所更新的SD声学模型(234),提供在VR测试过程中改良的VR性能。
-
公开(公告)号:CN1454381A
公开(公告)日:2003-11-05
申请号:CN01815363.1
申请日:2001-09-05
申请人: 高通股份有限公司
IPC分类号: G10L15/26
CPC分类号: G10L15/32 , G10L15/12 , G10L15/142
摘要: 一种组合语音识别引擎(104,108,112,114)并用映射函数求解单个语音识别引擎(104,106,112,114)间差异的方法和系统。将说话者独立型语音识别引擎104和说话者依赖型语音识别引擎106组合在一起。将隐马尔可夫模型(HMM)引擎(108,114)和动态时间偏差(DTW)引擎(104,106,112)组合在一起。
-
公开(公告)号:CN102714037B
公开(公告)日:2014-09-03
申请号:CN201080058579.7
申请日:2010-12-22
申请人: 高通股份有限公司
IPC分类号: G10L19/002
CPC分类号: G10L19/002 , G10L19/0212 , G10L19/035
摘要: 用于音频和语音处理的方法和装置包括:生成多个帧,其中所述帧中的每个帧包括多个变换系数;以及向所述帧中的每个帧中的变换系数分配比特,使得同一帧中的变换系数中的至少两个具有不同的比特分配并且向所述帧中的至少两个帧中的变换系数分配的比特总数相等。
-
公开(公告)号:CN102171943B
公开(公告)日:2014-03-12
申请号:CN200980138373.2
申请日:2009-10-07
申请人: 高通股份有限公司
IPC分类号: H04B1/7176 , H04B14/02
CPC分类号: H04B1/7176 , H04B1/719 , H04B14/026 , H04B2001/6908
摘要: 本文公开了一种介质接入控制的系统和方法。所述方法包括使用脉分多址来定义脉冲位置以提供用于接入介质的并行的正交信道,其中,所述脉分多址包括跳时序列和用于区分并行的正交信道的偏移。此外,所述方法包括处理与至少一个正交信道关联的信号。
-
公开(公告)号:CN1531722B
公开(公告)日:2011-07-27
申请号:CN02810586.9
申请日:2002-03-22
申请人: 高通股份有限公司
CPC分类号: G10L15/142 , G10L15/07 , G10L15/10 , G10L15/12 , G10L15/144 , G10L15/32
摘要: 揭示了一种语音识别(VR)系统,该系统采用语者无关(SI)(230和232)和语者特定(SD)(234)的声学模型的组合。至少一个SI声学模型(230和232)用于和至少一个SD声学模型(234)的组合,以提供至少与纯SI声学模型的语音识别性能相同的水平。所揭示的SI/SD VR系统可连续使用非监督式的训练,来更新在一个和多个SD声学模型(234)中的声学模板。混合的VR系统随后使用与至少一个SI声学模型(230和232)组合的经更新的SD声学模型(234),在VR测试过程中提供改良的VR性能。
-
-
公开(公告)号:CN101221758A
公开(公告)日:2008-07-16
申请号:CN200710196696.X
申请日:2002-03-22
申请人: 高通股份有限公司
CPC分类号: G10L15/142 , G10L15/07 , G10L15/10 , G10L15/12 , G10L15/144 , G10L15/32
摘要: 本发明涉及使用隐含语者自适应的语音识别系统。具体地,揭示了一种语音识别(VR)系统,该系统采用语者无关(SI)(230和232)和语者特定(SD)(234)的声学模型的组合。至少一个SI声学模型(230和232)用于和至少一个SD声学模型(234)的组合,以提供至少与纯SI声学模型的语音识别性能相同的水平。所揭示的SI/SD VR系统可连续使用非监督式的训练,来更新在一个和多个SD声学模型(234)中的声学模板。混合的VR系统随后使用与至少一个SI声学模型(230和232)组合的经更新的SD声学模型(234),在VR测试过程中提供改良的VR性能。
-
公开(公告)号:CN1602515A
公开(公告)日:2005-03-30
申请号:CN02814395.7
申请日:2002-05-17
申请人: 高通股份有限公司 , 演讲作品国际股份有限公司
IPC分类号: G10L15/28
摘要: 用于在一分布式话音识别系统中发送语音活动的系统和方法。所述分布式话音识别系统包括一在一用户单元中的当地的VR引擎和一在一服务器上的服务器VR引擎。所述当地的VR引擎包括一从一语音信号中抽取特征的特征抽取(FE)模块、以及一检测在一语音信号中的话音活动的话音活动检测模块(VAD)。话音活动的指示在特征之前从用户单元发送给服务器。
-
-
公开(公告)号:CN101221759B
公开(公告)日:2015-04-22
申请号:CN200710196697.4
申请日:2002-03-22
申请人: 高通股份有限公司
CPC分类号: G10L15/142 , G10L15/07 , G10L15/10 , G10L15/12 , G10L15/144 , G10L15/32
摘要: 本发明涉及使用隐含语者自适应的语音识别系统。具体地,揭示了一种语音识别(VR)系统,该系统采用语者无关(SI)(230和232)和语者特定(SD)(234)的声学模型的组合。至少一个SI声学模型(230和232)用于和至少一个SD声学模型(234)的组合,以提供至少与纯SI声学模型的语音识别性能相同的水平。所揭示的SI/SD VR系统可连续使用非监督式的训练,来更新在一个和多个SD声学模型(234)中的声学模板。混合的VR系统随后使用与至少一个SI声学模型(230和232)组合的经更新的SD声学模型(234),在VR测试过程中提供改良的VR性能。
-
-
-
-
-
-
-
-
-