专利检索 ap:("深圳追一科技有限公司") AND inv:"赵金昊" 第 1 页

1.

发明公开
语音识别方法和装置、服务器、计算机可读存储介质审中-实审

公开(公告)号：CN112802476A

公开(公告)日：2021-05-14

申请号：CN202011607654.2

申请日：2020-12-30

申请人： 深圳追一科技有限公司

发明人： 周维聪 , 袁丁 , 赵金昊 , 吴悦

IPC分类号： G10L15/26 , G10L15/02 , G10L25/24 , G10L15/14 , G10L15/16

摘要： 本申请涉及一种语音识别方法和装置、服务器、计算机可读存储介质，包括：获取对语音数据进行解码得到语音识别网格lattice，语音识别网格lattice中包括多个词序列以及每个所述词序列对应的第一得分。根据预设词集合中所包含的预设词，在词序列中定位到预设词所在的目标词序列。对目标词序列对应的第一得分进行调整得到第二得分，将第一得分及第二得分中得分最高的词序列，作为语音数据的语言识别结果。可以基于预设词集合中所包含的预设词，在词序列中定位到预设词所在的目标词序列，并采用对目标词序列的得分进行调整的方式，实现了对解码得到语音识别结果的过程的干预，进而提高所得到的语音识别结果的准确性。

2.

发明公开
语音识别方法和装置、服务器、计算机可读存储介质审中-实审

公开(公告)号：CN112802461A

公开(公告)日：2021-05-14

申请号：CN202011607655.7

申请日：2020-12-30

申请人： 深圳追一科技有限公司

发明人： 周维聪 , 袁丁 , 赵金昊 , 刘云峰

IPC分类号： G10L15/14 , G10L25/24 , G10L15/16 , G10L15/26 , G10L15/02

摘要： 本申请涉及一种语音识别方法和装置、服务器、计算机可读存储介质，包括：对待处理的语音数据进行声学特征提取，将所提取的声学特征输入声学模型，计算声学特征的声学模型得分。采用主解码网络及子解码网络，对声学特征及声学特征的声学模型得分进行解码得到语音识别结果。该语音识别方法，并未对待识别场景重新训练解码网络，而是对待识别场景中的目标命名实体进行训练得到子解码图，再采用主解码网络及子解码网络进行解码得到语音识别结果。所以，针对待识别场景中的目标命名实体，基于子解码网络就可以对目标命名实体进行准确地解码。且因为未对待识别场景重新训练解码网络，所以大大缩短训练时间长，提高语音识别效率。

3.

发明授权
语音识别方法和装置、服务器、计算机可读存储介质有权

公开(公告)号：CN112802476B

公开(公告)日：2023-10-24

申请号：CN202011607654.2

申请日：2020-12-30

申请人： 深圳追一科技有限公司

发明人： 周维聪 , 袁丁 , 赵金昊 , 吴悦

IPC分类号： G10L15/26 , G10L15/02 , G10L25/24 , G10L15/14 , G10L15/16

摘要： 本申请涉及一种语音识别方法和装置、服务器、计算机可读存储介质，包括：获取对语音数据进行解码得到语音识别网格lattice，语音识别网格lattice中包括多个词序列以及每个所述词序列对应的第一得分。根据预设词集合中所包含的预设词，在词序列中定位到预设词所在的目标词序列。对目标词序列对应的第一得分进行调整得到第二得分，将第一得分及第二得分中得分最高的词序列，作为语音数据的语言识别结果。可以基于预设词集合中所包含的预设词，在词序列中定位到预设词所在的目标词序列，并采用对目标词序列的得分进行调整的方式，实现了对解码得到语音识别结果的过程的干预，进而提高所得到的语音识别结果的准确性。

4.

发明授权
语音识别方法和装置、服务器、计算机可读存储介质有权

公开(公告)号：CN112802461B

公开(公告)日：2023-10-24

申请号：CN202011607655.7

申请日：2020-12-30

申请人： 深圳追一科技有限公司

发明人： 周维聪 , 袁丁 , 赵金昊 , 刘云峰

IPC分类号： G10L15/14 , G10L25/24 , G10L15/16 , G10L15/26 , G10L15/02

摘要： 本申请涉及一种语音识别方法和装置、服务器、计算机可读存储介质，包括：对待处理的语音数据进行声学特征提取，将所提取的声学特征输入声学模型，计算声学特征的声学模型得分。采用主解码网络及子解码网络，对声学特征及声学特征的声学模型得分进行解码得到语音识别结果。该语音识别方法，并未对待识别场景重新训练解码网络，而是对待识别场景中的目标命名实体进行训练得到子解码图，再采用主解码网络及子解码网络进行解码得到语音识别结果。所以，针对待识别场景中的目标命名实体，基于子解码网络就可以对目标命名实体进行准确地解码。且因为未对待识别场景重新训练解码网络，所以大大缩短训练时间长，提高语音识别效率。

5.

发明公开
语音识别方法、装置、计算机设备和存储介质审中-实审

公开(公告)号：CN112687266A

公开(公告)日：2021-04-20

申请号：CN202011527331.2

申请日：2020-12-22

申请人： 深圳追一科技有限公司

发明人： 赵金昊 , 袁丁 , 周维聪 , 刘云峰 , 吴悦

IPC分类号： G10L15/16 , G10L15/02

摘要： 本申请提供了一种语音识别方法、装置、计算机设备和存储介质。该方法包括：获取对待识别的音频进行初步解码得到的词图；获取所述音频所属的目标业务场景下的场景语料数据；根据所述场景语料数据训练N元语法语言模型，并使用所述N元语法语言模型对所述词图进行重排序；将重排序后的词图中每条路径上的词序列，输入至预先训练得到的神经网络语言模型，以通过神经网络语言模型对重排序后的词图进行再次重排序，以对对重排序后各边对应的概率进行修正；所述神经网络语言模型，是使用不分场景的第一原始语料数据训练得到；根据再次重排序后的词图，输出针对所述音频的语音识别结果。本申请的方案能够提高语音识别准确性。

6.

发明授权
语音识别方法、装置、计算机设备和存储介质有权

公开(公告)号：CN112687266B

公开(公告)日：2023-07-21

申请号：CN202011527331.2

申请日：2020-12-22

申请人： 深圳追一科技有限公司

发明人： 赵金昊 , 袁丁 , 周维聪 , 刘云峰 , 吴悦

IPC分类号： G10L15/16 , G10L15/02

摘要： 本申请提供了一种语音识别方法、装置、计算机设备和存储介质。该方法包括：获取对待识别的音频进行初步解码得到的词图；获取所述音频所属的目标业务场景下的场景语料数据；根据所述场景语料数据训练N元语法语言模型，并使用所述N元语法语言模型对所述词图进行重排序；将重排序后的词图中每条路径上的词序列，输入至预先训练得到的神经网络语言模型，以通过神经网络语言模型对重排序后的词图进行再次重排序，以对对重排序后各边对应的概率进行修正；所述神经网络语言模型，是使用不分场景的第一原始语料数据训练得到；根据再次重排序后的词图，输出针对所述音频的语音识别结果。本申请的方案能够提高语音识别准确性。