维语语音识别方法和装置

    公开(公告)号:CN105336323A

    公开(公告)日:2016-02-17

    申请号:CN201510662027.1

    申请日:2015-10-14

    申请人: 清华大学

    摘要: 本申请提供了一种维语语音识别的方法和装置,包括:将维语语音帧对应的声学特征作为自适应声学模型中的汉语声学模型的参数输入,经过线性变换和非线性变换将所述汉语声学模型下的维语语音帧对应的声学特征变换到汉语声学模型的高维非线性特征空间分布;将所述维语语音帧对应的汉语声学模型的高维非线性特征空间分布作为自适应声学模型中的维语声学模型的参数输入到所述维语声学模型中,训练所述维语声学模型,获得重构的自适应声学模型;使用遗传算法或者穷举算法筛选所述重构的自适应声学模型,获得最优自适应声学模型;使用所述最优自适应声学模型进行维语语音的识别,从而解决了维语语料不足和语音识别准确率低的问题。

    增益控制系统、增益控制方法和增益控制程序

    公开(公告)号:CN101460996A

    公开(公告)日:2009-06-17

    申请号:CN200780020484.4

    申请日:2007-01-16

    IPC分类号: G10L15/20

    CPC分类号: G10L15/065 G10L2015/025

    摘要: 对多个音素的每个或将声音分割成簇的每个单位,将由声压与特征量的组构成的声音模型存储在声音模型存储部(3)中。当提供输入信号时,由特征量变换部(2)算出特征量和声压,由声压比较部(4)求出输入信号与声音模型之每个的声压比,由距离算出部(5)算出输入信号与声音模型之每个的特征量的距离,由增益算出部(6)根据声压的比与距离的信息,算出增益的值,由声压补正部(7)补正输入信号的声压。

    用于从第一自适应数据处理版本转换至第二自适应数据处理版本的方法

    公开(公告)号:CN101443732A

    公开(公告)日:2009-05-27

    申请号:CN200780017032.0

    申请日:2007-05-09

    发明人: J·翁弗里德

    IPC分类号: G06F9/445 G10L15/06

    摘要: 本发明涉及用于从数据处理装置上的第一自适应数据处理版本(V1)转换至第二自适应数据处理版本(V2)的方法和系统,其中,所述第一自适应数据处理版本(V1)采用至少一个基于数据处理结果受到连续调整的数据模型(dm),所述第二自适应数据处理版本(V2)也采用了至少一个受到连续调整的数据模型(DM),所述方法和系统的特征在于,在第一阶段内,与所述第一数据处理版本(V1)并行采用第二自适应数据处理版本(V2),由此连续调整所述与第一版本(V1)相关的所述至少一个数据模型(dm)以及与所述第二版本(V2)相关数据模型(DM),所述方法和系统的特征还在于检验利用所述第二版本(V2)的数据处理的性能以符合质量标准,而后,在第二阶段内,一旦满足了所述质量标准,就输出利用所述第二版本(V2)的数据处理的结果,以供使用。本发明还涉及其上记录有计算机程序的计算机程序产品,所述程序用于执行这样的方法。