英语口语机考系统中网络语音识别方法

    公开(公告)号:CN102436809A

    公开(公告)日:2012-05-02

    申请号:CN201110321538.9

    申请日:2011-10-21

    申请人: 东南大学

    摘要: 本发明涉及了一种在英语口语机考系统中实现网络语音识别的方案。本方案对传统的谱相减(SS)降噪声技术和倒谱均值规整(CMN)降噪声技术进行改进,同时结合等同于连续状态隐马尔可夫模型(HMM)的概率尺度DP识别方法,提出了一种在英语网考系统中非特定人的网络语音识别方案,并利用其实现了实际环境下网络语音识别装置。本方案采用上述方法,将具有输入幅值谱自适应的SS方法和基于渐进自适应方式MAP算法的CMN方法相结合,大大降低了环境噪声对识别系统的影响。同时,本方案在传统的DP方法基础上,利用概率尺度的DP算法进行识别,使得DSP语音识别装置能够适用于户外不同场合的、非特定人的语音识别,从而使得识别系统范围和识别精度得到了提高。

    一种应用于英语口语网络机考系统的语音识别装置

    公开(公告)号:CN102436815B

    公开(公告)日:2012-12-19

    申请号:CN201110268976.3

    申请日:2011-09-13

    申请人: 东南大学

    IPC分类号: G10L19/00 G10L19/02 G10L15/06

    摘要: 本发明公开了一种用于英语口语网络机考的语音识别装置,属于语音识别的应用领域。该装置由输入I/O、模数转换器、数字信号处理器模块、分别通过程序总线与数据总线与数字信号处理器模块相连的程序存储器和数据存储器、输出I/O组成。其中数字信号处理器模块包括特征提取子模块、训练子模块和识别子模块,完成对输入语音的训练和识别过程。该装置结构简单,具有一定的实时性,并且具有较短的训练时间、较高的识别精度和较小的硬件存储开销,语音识别率高,识别效果好,可以很好地应用于英语口语网络机考中。

    一种应用于英语口语网络机考系统的语音识别装置

    公开(公告)号:CN102436815A

    公开(公告)日:2012-05-02

    申请号:CN201110268976.3

    申请日:2011-09-13

    申请人: 东南大学

    IPC分类号: G10L19/00 G10L19/02 G10L15/06

    摘要: 本发明公开了一种用于英语口语网络机考的语音识别装置,属于语音识别的应用领域。该装置由输入I/O、模数转换器、数字信号处理器模块、分别通过程序总线与数据总线与数字信号处理器模块相连的程序存储器和数据存储器、输出I/O组成。其中数字信号处理器模块包括特征提取子模块、训练子模块和识别子模块,完成对输入语音的训练和识别过程。该装置结构简单,具有一定的实时性,并且具有较短的训练时间、较高的识别精度和较小的硬件存储开销,语音识别率高,识别效果好,可以很好地应用于英语口语网络机考中。

    英语口语机考系统中网络语音识别方法

    公开(公告)号:CN102436809B

    公开(公告)日:2013-04-24

    申请号:CN201110321538.9

    申请日:2011-10-21

    申请人: 东南大学

    IPC分类号: G10L15/02 G10L15/08 G10L21/02

    摘要: 本发明涉及一种在英语口语机考系统中实现网络语音识别的方案。本方案对传统的谱相减(SS)降噪声技术和倒谱均值规整(CMN)降噪声技术进行改进,同时结合等同于连续状态隐马尔可夫模型(HMM)的概率尺度DP识别方法,提出了一种在英语网考系统中非特定人的网络语音识别方案,并利用其实现了实际环境下网络语音识别装置。本方案采用上述方法,将具有输入幅值谱自适应的SS方法和基于渐进自适应方式MAP算法的CMN方法相结合,大大降低了环境噪声对识别系统的影响。同时,本方案在传统的DP方法基础上,利用概率尺度的DP算法进行识别,使得DSP语音识别装置能够适用于户外不同场合的、非特定人的语音识别,从而使得识别系统范围和识别精度得到了提高。

    一种应用于英语口语网络机考系统的语音识别装置

    公开(公告)号:CN202307118U

    公开(公告)日:2012-07-04

    申请号:CN201120340996.2

    申请日:2011-09-13

    申请人: 东南大学

    IPC分类号: G10L19/00 G10L19/02 G10L15/06

    摘要: 本实用新型公开了一种用于英语口语网络机考的语音识别装置,属于语音识别的应用领域。该装置由输入I/O、模数转换器、数字信号处理器模块、分别通过程序总线与数据总线与数字信号处理器模块相连的程序存储器和数据存储器、输出I/O组成。其中数字信号处理器模块包括特征提取子模块、训练子模块和识别子模块,完成对输入语音的训练和识别过程。该装置结构简单,具有一定的实时性,并且具有较短的训练时间、较高的识别精度和较小的硬件存储开销,语音识别率高,识别效果好,可以很好地应用于英语口语网络机考中。