-
公开(公告)号:CN112802476A
公开(公告)日:2021-05-14
申请号:CN202011607654.2
申请日:2020-12-30
申请人: 深圳追一科技有限公司
摘要: 本申请涉及一种语音识别方法和装置、服务器、计算机可读存储介质,包括:获取对语音数据进行解码得到语音识别网格lattice,语音识别网格lattice中包括多个词序列以及每个所述词序列对应的第一得分。根据预设词集合中所包含的预设词,在词序列中定位到预设词所在的目标词序列。对目标词序列对应的第一得分进行调整得到第二得分,将第一得分及第二得分中得分最高的词序列,作为语音数据的语言识别结果。可以基于预设词集合中所包含的预设词,在词序列中定位到预设词所在的目标词序列,并采用对目标词序列的得分进行调整的方式,实现了对解码得到语音识别结果的过程的干预,进而提高所得到的语音识别结果的准确性。
-
公开(公告)号:CN112802461A
公开(公告)日:2021-05-14
申请号:CN202011607655.7
申请日:2020-12-30
申请人: 深圳追一科技有限公司
摘要: 本申请涉及一种语音识别方法和装置、服务器、计算机可读存储介质,包括:对待处理的语音数据进行声学特征提取,将所提取的声学特征输入声学模型,计算声学特征的声学模型得分。采用主解码网络及子解码网络,对声学特征及声学特征的声学模型得分进行解码得到语音识别结果。该语音识别方法,并未对待识别场景重新训练解码网络,而是对待识别场景中的目标命名实体进行训练得到子解码图,再采用主解码网络及子解码网络进行解码得到语音识别结果。所以,针对待识别场景中的目标命名实体,基于子解码网络就可以对目标命名实体进行准确地解码。且因为未对待识别场景重新训练解码网络,所以大大缩短训练时间长,提高语音识别效率。
-
公开(公告)号:CN112802476B
公开(公告)日:2023-10-24
申请号:CN202011607654.2
申请日:2020-12-30
申请人: 深圳追一科技有限公司
摘要: 本申请涉及一种语音识别方法和装置、服务器、计算机可读存储介质,包括:获取对语音数据进行解码得到语音识别网格lattice,语音识别网格lattice中包括多个词序列以及每个所述词序列对应的第一得分。根据预设词集合中所包含的预设词,在词序列中定位到预设词所在的目标词序列。对目标词序列对应的第一得分进行调整得到第二得分,将第一得分及第二得分中得分最高的词序列,作为语音数据的语言识别结果。可以基于预设词集合中所包含的预设词,在词序列中定位到预设词所在的目标词序列,并采用对目标词序列的得分进行调整的方式,实现了对解码得到语音识别结果的过程的干预,进而提高所得到的语音识别结果的准确性。
-
公开(公告)号:CN112802461B
公开(公告)日:2023-10-24
申请号:CN202011607655.7
申请日:2020-12-30
申请人: 深圳追一科技有限公司
摘要: 本申请涉及一种语音识别方法和装置、服务器、计算机可读存储介质,包括:对待处理的语音数据进行声学特征提取,将所提取的声学特征输入声学模型,计算声学特征的声学模型得分。采用主解码网络及子解码网络,对声学特征及声学特征的声学模型得分进行解码得到语音识别结果。该语音识别方法,并未对待识别场景重新训练解码网络,而是对待识别场景中的目标命名实体进行训练得到子解码图,再采用主解码网络及子解码网络进行解码得到语音识别结果。所以,针对待识别场景中的目标命名实体,基于子解码网络就可以对目标命名实体进行准确地解码。且因为未对待识别场景重新训练解码网络,所以大大缩短训练时间长,提高语音识别效率。
-
公开(公告)号:CN112687266A
公开(公告)日:2021-04-20
申请号:CN202011527331.2
申请日:2020-12-22
申请人: 深圳追一科技有限公司
摘要: 本申请提供了一种语音识别方法、装置、计算机设备和存储介质。该方法包括:获取对待识别的音频进行初步解码得到的词图;获取所述音频所属的目标业务场景下的场景语料数据;根据所述场景语料数据训练N元语法语言模型,并使用所述N元语法语言模型对所述词图进行重排序;将重排序后的词图中每条路径上的词序列,输入至预先训练得到的神经网络语言模型,以通过神经网络语言模型对重排序后的词图进行再次重排序,以对对重排序后各边对应的概率进行修正;所述神经网络语言模型,是使用不分场景的第一原始语料数据训练得到;根据再次重排序后的词图,输出针对所述音频的语音识别结果。本申请的方案能够提高语音识别准确性。
-
公开(公告)号:CN112687266B
公开(公告)日:2023-07-21
申请号:CN202011527331.2
申请日:2020-12-22
申请人: 深圳追一科技有限公司
摘要: 本申请提供了一种语音识别方法、装置、计算机设备和存储介质。该方法包括:获取对待识别的音频进行初步解码得到的词图;获取所述音频所属的目标业务场景下的场景语料数据;根据所述场景语料数据训练N元语法语言模型,并使用所述N元语法语言模型对所述词图进行重排序;将重排序后的词图中每条路径上的词序列,输入至预先训练得到的神经网络语言模型,以通过神经网络语言模型对重排序后的词图进行再次重排序,以对对重排序后各边对应的概率进行修正;所述神经网络语言模型,是使用不分场景的第一原始语料数据训练得到;根据再次重排序后的词图,输出针对所述音频的语音识别结果。本申请的方案能够提高语音识别准确性。
-
-
-
-
-