通过分析源信号的冗余特征进行稳健话音识别的方法

    公开(公告)号:CN1653519B

    公开(公告)日:2012-04-04

    申请号:CN03810691.4

    申请日:2003-03-19

    IPC分类号: G10L15/20 G10L15/02

    CPC分类号: G10L15/02 G10L15/20

    摘要: 通过分析冗余特征对数字化语音信号进行处理以提供更稳健的话音识别的方法。对源语音信号应用初级变换,从中提取初级特征。对所述源语音信号或对所提取的初级特征应用至少一个次级变换的每一个,以得到至少一组和所述初级特征统计上相关的次级特征。然后至少应用一个预先确定的函数对所述初级特征和所述次级特征进行联合。通过对这一联合和预先确定的话音识别模板进行模式匹配产生识别答案。

    有效存储语音识别模型的系统和方法

    公开(公告)号:CN100527224C

    公开(公告)日:2009-08-12

    申请号:CN02804816.4

    申请日:2002-01-10

    CPC分类号: G10L15/06

    摘要: 一种通过改进语音识别(VR)模板的存储而改进语音识别的方法和系统。改进了的存储意味着可在存储器中存储更多VR模型。存储在存储器中的VR模型越多,VR系统更稳健,从而VR系统更精确。有损压缩技术用于压缩VR模型。在一个实施例中,A-律压缩和A-律扩展用于压缩和扩展VR模型。在另一实施例中,μ-律压缩和μ-律扩展用于压缩并扩展VR模型。VR模型在训练过程期间被压缩,且它们在语音识别期间被扩展。

    通过分析源信号的冗余特征进行稳健话音识别的方法

    公开(公告)号:CN1653519A

    公开(公告)日:2005-08-10

    申请号:CN03810691.4

    申请日:2003-03-19

    IPC分类号: G10L15/20 G10L15/02

    CPC分类号: G10L15/02 G10L15/20

    摘要: 通过分析冗余特征对数字化语音信号进行处理以提供更稳健的话音识别的方法。对源语音信号应用初级变换,从中提取初级特征。对所述源语音信号或对所提取的初级特征应用至少一个次级变换的每一个,以得到至少一组和所述初级特征统计上相关的次级特征。然后至少应用一个预先确定的函数对所述初级特征和所述次级特征进行联合。通过对这一联合和预先确定的话音识别模板进行模式匹配产生识别答案。