一种基于统计语言模型得分规整的语音识别方法及系统

    公开(公告)号:CN109427330B

    公开(公告)日:2023-04-07

    申请号:CN201710790753.0

    申请日:2017-09-05

    Abstract: 本发明一种基于统计语言模型得分规整的语音识别方法,所述方法包括:步骤1)建立和训练若干个基于多尺度马尔科夫假设的统计语言模型;包括:k阶统计N元文法语言模型,k‑1个不同阶数的统计N元文法语言模型和k‑1个不同阶数的改进的统计N元文法语言模型;步骤2)将待识别语音进行第一遍解码,得到L条候选语音s;步骤3)利用步骤1)的若干个基于多尺度马尔科夫假设的统计语言模型计算L条候选语音s的语言模型得分,结合声学模型得分计算出每条候选语音的得分;步骤4)选出得分最高的候选语音作为第二遍解码结果;该结果为最终的识别结果。本发明的方法对于识别错误具有良好的容错性,能够有效的提升语音识别的正确率。

    一种神经网络声学模型压缩及语音识别方法

    公开(公告)号:CN106847268B

    公开(公告)日:2020-04-24

    申请号:CN201510881044.4

    申请日:2015-12-03

    Abstract: 本发明提供了一种神经网络声学模型的压缩方法,所述方法包括:将神经网络声学模型的输出层权值矩阵W的行向量按照指定的维数划分为若干个子向量;对若干个子向量进行一级矢量量化,获得一级码本,用一级码本向量代替矩阵W的子向量,得到矩阵W*;利用矩阵W和W*,计算残差矩阵R,并对R的向量进行二级矢量量化;获得二级码本,用二级码本向量代替矩阵R的向量,得到矩阵R*;最后用矩阵W*和R*表示权值矩阵W。本发明的方法能够降低神经网络声学模型的存储空间,同时大大降低量化误差,避免了码本规模呈指数增长。

    声学模型训练构造方法、及声学模型和语音识别系统

    公开(公告)号:CN105609100B

    公开(公告)日:2019-08-20

    申请号:CN201410602463.5

    申请日:2014-10-31

    Abstract: 本发明提供一种声学模型的训练构造方法和基于训练方法的隐马尔科夫声学模型和语音识别系统,所述训练方法为:(1)基于训练数据和预先给定的状态聚类,计算得到每类的帧数统计量和类内散度矩阵。(2)对于模型中表示非语音的状态类,当其对应的帧数统计量远大于状态类的平均统计量时,对其进行统计量抑制平滑。(3)对于模型中表示语音的状态类,当其对应的帧数统计量远小于状态类的平均统计量时,对其进行统计量抑制平滑。(4)基于类内散度矩阵和平滑后的类统计量,计算异方差线性判别分析矩阵。(5)将计算得到的异方差线性判别分析矩阵用于语音特征和模型的降维,并重新迭代得到降维后的稳定声学模型。本发明最终提高声学模型的识别性能。

    一种神经网络声学模型的分布式并行训练方法及系统

    公开(公告)号:CN106297774B

    公开(公告)日:2019-07-09

    申请号:CN201510291080.5

    申请日:2015-05-29

    Abstract: 本发明提供一种神经网络声学模型的分布式并行训练方法及系统,所述方法包含:步骤101)将各组训练数据分别输入一个客户端;步骤102)客户端接收输入的训练数据,并采用总线在客户端设置的若干个GPU和第一CPU之间传递参数,所述参数包含:模型权重和梯度;各个GPU基于输入的模型权重参数计算梯度,并将计算得到的梯度输入至第一CPU中;第一CPU利用GPU上传的梯度更新客户端中的模型副本,将更新后的权重参数回传给各个GPU,用于进行新的梯度计算,同时,第一CPU累积各GPU输入的梯度,根据累积结果更新参数服务器中的模型;步骤103)采用网络资源将各个客户端CPU累积得到的最新的梯度信息输入服务器,然后更新服务器中存储的神经网络声学模型。

    一种基于支配相关的多稀疏声源定位方法

    公开(公告)号:CN105403860B

    公开(公告)日:2017-10-31

    申请号:CN201410451825.5

    申请日:2014-08-19

    Abstract: 本发明涉及一种基于支配相关的多稀疏声源定位方法,包括:将通过麦克风阵列接收的声源信号转化成数字声音信号;提取每个麦克风的数字声音信号的频谱;利用相邻时间相同频点上所有麦克风的数字声音信号的频谱计算每个频点上的空间相关矩阵;提取空间相关矩阵的主特征向量;确定每个频点上所有麦克风对的时间延迟集合;采用迭代的方法,计算每个频点上处于支配地位的声源入射方向的方位角;对所有频点上的处于支配地位声源入射方向的方位角进行统计分析,确定最终的声源入射方向和声源个数。该方法考虑了声学鲁棒性,适用于多稀疏声源的实时定位。

    一种基于长短时记忆网络的语言模型重估方法

    公开(公告)号:CN106803422A

    公开(公告)日:2017-06-06

    申请号:CN201510844693.7

    申请日:2015-11-26

    Abstract: 本发明提出了一种基于长短时记忆网络的语言模型重估方法及系统,所述方法包含:步骤100)输入待识别的语言信息,并对输入的待识别的语言信息进行预处理;步骤101)用N元文法语言模型对预处理后的信息进行一遍解码,然后从中选取M个最优的候选结果;步骤102)在获得的M个最优的候选结果中引入一遍解码的识别结果作为历史句子信息;步骤103)用高元文法语言模型对选取的M个最优的候选结果进行重评估;步骤104)用基于LSTM结构的神经网络训练语言模型对引入历史句子信息的M个最优的候选结果进行重评估;步骤105)将用高元文法语言模型进行重评估的结果与用LSTM神经网络语言模型重评估的结果进行融合,选出最优结果,作为待识别的语言信息的最终识别结果。

    一种基于音频模板的语音关键词检索方法

    公开(公告)号:CN106297776A

    公开(公告)日:2017-01-04

    申请号:CN201510266553.6

    申请日:2015-05-22

    Abstract: 本发明涉及一种基于音频模板的语音关键词检索方法,包括:首先将语音样例模板和待检索语音转换成概率分布的序列,然后通过动态时间规整对语音样例模板和待检索语音进行匹配,获得待检索语音中关键词起止时间点和每个出现位置的声学置信度得分,最后对不同语音样例模板获得的得分进行规整,排序后得到检索结果。本发明的检索过程完全不要求特定语种的信息,最大化通用性和可移植性,同时减小检索过程中的运算量,加快了关键词检索的速度。

    一种神经网络声学模型的分布式并行训练方法及系统

    公开(公告)号:CN106297774A

    公开(公告)日:2017-01-04

    申请号:CN201510291080.5

    申请日:2015-05-29

    Abstract: 本发明提供一种神经网络声学模型的分布式并行训练方法及系统,所述方法包含:步骤101)将各组训练数据分别输入一个客户端;步骤102)客户端接收输入的训练数据,并采用总线在客户端设置的若干个GPU和第一CPU之间传递参数,所述参数包含:模型权重和梯度;各个GPU基于输入的模型权重参数计算梯度,并将计算得到的梯度输入至第一CPU中;第一CPU利用GPU上传的梯度更新客户端中的模型副本,将更新后的权重参数回传给各个GPU,用于进行新的梯度计算,同时,第一CPU累积各GPU输入的梯度,根据累积结果更新参数服务器中的模型;步骤103)采用网络资源将各个客户端CPU累积得到的最新的梯度信息输入服务器,然后更新服务器中存储的神经网络声学模型。

    声学模型训练构造方法、及声学模型和语音识别系统

    公开(公告)号:CN105609100A

    公开(公告)日:2016-05-25

    申请号:CN201410602463.5

    申请日:2014-10-31

    Abstract: 本发明提供一种声学模型的训练构造方法和基于训练方法的隐马尔科夫声学模型和语音识别系统,所述训练方法为:(1)基于训练数据和预先给定的状态聚类,计算得到每类的帧数统计量和类内散度矩阵。(2)对于模型中表示非语音的状态类,当其对应的帧数统计量远大于状态类的平均统计量时,对其进行统计量抑制平滑。(3)对于模型中表示语音的状态类,当其对应的帧数统计量远小于状态类的平均统计量时,对其进行统计量抑制平滑。(4)基于类内散度矩阵和平滑后的类统计量,计算异方差线性判别分析矩阵。(5)将计算得到的异方差线性判别分析矩阵用于语音特征和模型的降维,并重新迭代得到降维后的稳定声学模型。本发明最终提高声学模型的识别性能。

    一种基于词矢量的短文本分类模型生成方法与分类方法

    公开(公告)号:CN105335446A

    公开(公告)日:2016-02-17

    申请号:CN201410398780.X

    申请日:2014-08-13

    Abstract: 本发明涉及一种基于词矢量的短文本分类模型生成方法,包括:采集数据,并对所采集的数据进行领域标注,将这些已标注的数据作为训练数据;对训练数据做预处理;查询词矢量词典,将训练数据中所包含的文本数据转化为向量数据,并且将所述向量数据按照领域进行分隔;对每一个领域内的向量数据采用高斯模型进行模型训练,得到高斯模型参数的最优值,从而得到该领域所对应的高斯模型;所有训练数据的各个领域所对应的高斯模型组成分类模型。

Patent Agency Ranking