-
公开(公告)号:CN1971711A
公开(公告)日:2007-05-30
申请号:CN200610093086.2
申请日:2006-06-20
申请人: 哈曼贝克自动系统-威美科公司
IPC分类号: G10L21/02
CPC分类号: G10L21/02 , G10L15/065 , G10L15/20 , G10L21/0208
摘要: 本发明提供了用于增强语音信号频率响应的系统。基于输入语音信号计算经时平均语音频谱形状估计。可在使用一阶IIR滤波或者“漏积分器”的频域内计算平均语音频谱形状估计。这样,平均语音频谱形状估计适于随时间在声音路径的声特性中的变化或者在可影响系统频率响应的电音频路径中的任何变化。可通过比较平均语音频谱形状估计与期望的目标频谱形状确定频谱修正因子。可把频谱修正因子(单位dB)加到输入语音信号的频谱中以增强或者调整输入语音信号的频谱到期望的频谱形状,并且从修正的频谱重新合成增强的语音信号。
-
公开(公告)号:CN1494712A
公开(公告)日:2004-05-05
申请号:CN02806068.7
申请日:2002-01-30
申请人: 高通股份有限公司
CPC分类号: G10L15/065 , G10L15/30
摘要: 语音识别系统在对照依赖于说话者的声学模型(238)进行语音识别模式匹配之前把依赖于说话者的修正函数应用于声学特征矢量。自适应引擎(224)把一组声学特征矢量X与自适应模型(228)进行匹配,以选出依赖于说话者的特征矢量修正函数f(),然后把它应用于X以形成一组经修正的声学特征矢量f(X)。然后通过经修正的声学特征矢量f(X)与依赖于说话者的声学模型(238)的相关来进行语音识别。
-
公开(公告)号:CN1465043A
公开(公告)日:2003-12-31
申请号:CN02802578.4
申请日:2002-06-07
申请人: 索尼公司
发明人: 赫尔穆特·卢克
IPC分类号: G10L15/06
CPC分类号: G10L15/07 , G10L15/065
摘要: 一种语音识别装置,其能够对多个用户作高精确度的语音识别。根据用存储单元(13)中存储的一个或多个变换函数变换输入声音的变换结果,模型自适应单元(12)检测最佳地使输入声音适应声学模型的变换函数,并将输入声音分配给最佳变换函数。此外,自适应单元(12)通过使用分配给变换函数的所有输入声音,更新:为其分配了新输入声音的变换函数。选择单元(14)在存储单元(13)中存储的一个或多个变换函数中选择用来变换输入声音的变换函数,而变换单元(5)通过使用所选择的变换函数变换输入声音。匹配单元(6)在用变换函数变换的输入声音和声学模型之间执行匹配。本发明适用于用来识别声音的装置。
-
公开(公告)号:CN1386265A
公开(公告)日:2002-12-18
申请号:CN01801963.3
申请日:2001-07-09
申请人: 松下电器产业株式会社
CPC分类号: G10L15/02 , G10L15/065
摘要: 本发明利用话筒1采集说话者发出的语音,通过A/D变换器2提供给信号延迟单元3及声级推定单元4。声级推定单元4根据提供的数字语音信号进行声级推定值的计算。信号延迟单元3将延迟了预定的声级上升沿时间的数字语音信号提供给声级调整单元5,声级调整单元5根据声级推定值进行数字语音信号的声级调整,将声级调整后的输出提供给语音识别单元6,语音识别单元6根据提供的声级调整后的输出,进行语音识别。
-
公开(公告)号:CN1294377A
公开(公告)日:2001-05-09
申请号:CN00133013.6
申请日:2000-10-27
申请人: 松下电器产业株式会社
CPC分类号: G10L15/065 , G10L21/003
摘要: 本发明的输入语音音程标准化装置(Tr)用于对不特定说话者发出的输入语音(Sva)进行识别的语音识别装置(VRAp),将该输入语音标准化为语音识别最佳音程,其中识别对象语音生成器(9、11、3、5)按规定音程(Ni)单位使输入语音(Svd)变化,生成识别对象语音信号(Svc(Ni)),一致概率计算器(15)计算识别对象语音信号与语音识别标准数据(Psf)多个单词(Sr(m))之间的一致概率(P),音程变换器(9、11、3、5)在第1位一致概率(Pmax)达到规定概率以上前,反复使识别对象语音信号的音程变化。
-
公开(公告)号:CN1264888A
公开(公告)日:2000-08-30
申请号:CN99126502.5
申请日:1999-12-17
申请人: 索尼国际(欧洲)股份有限公司 , 索尼公司
IPC分类号: G10L15/00
CPC分类号: G10L15/065 , G10L15/063 , G10L2015/0638
摘要: 在未受监控或在线自动语音识别系统中,为了防止对误识别字的自适应,置信度测量值被使用,或者用户的反应被解释以判断是否已识别的音节、几个音节、一个字、几个字或整个发音应该被用于说话者无关模型组到说话者自适应模型组的自适应,在自适应被执行的情况下,判断对该识别出的发音或部分识别出的发音进行多强的自适应。此外,说话者自适应性能的确认被进行以确保识别率永远不会(明显)降低,而只会升高或保持在同一水平。
-
-
-
-
-