两遍端到端语音识别

发明公开

请登陆查看更多内容

专利标题： 两遍端到端语音识别
申请号： CN202080040756.2

申请日： 2020-12-03
公开(公告)号： CN114270434A

公开(公告)日： 2022-04-01
发明人: 塔拉·C·赛纳特 , 何彦璋 , 李博 , 阿伦·纳拉亚南 , 庞若鸣 , 安托万·让·布吕盖 , 张硕英 , 李炜
申请人： 谷歌有限责任公司
申请人地址： 美国加利福尼亚州
专利权人： 谷歌有限责任公司
当前专利权人： 谷歌有限责任公司
当前专利权人地址： 美国加利福尼亚州
代理机构： 中原信达知识产权代理有限责任公司
代理商 李宝泉; 周亚荣
优先权： 62/943,703 20191204 US
国际申请： PCT/US2020/063012 2020.12.03
国际公布： WO2021/113443 EN 2021.06.10
进入国家日期： 2021-12-01
主分类号： G10L15/06
IPC分类号： G10L15/06 ; G10L15/16 ; G10L15/22 ; G10L15/26

摘要：

两遍自动语音识别(ASR)模型能够被用于执行流传输设备上ASR以生成在音频数据中捕获的话语的文本表示。各种实施方式包括ASR模型的用于生成在音频数据中捕获的话语的(多个)流传输候选识别的第一遍部分。例如，该第一遍部分能够包括循环神经网络变换器(RNN‑T)解码器。各种实施方式包括ASR模型的用于修订话语的(多个)流传输候选识别并且生成话语的文本表示的第二遍部分。例如，该第二遍部分能够包括听参加拼写(LAS)解码器。各种实施方式包括在RNN‑T解码器与LAS解码器之间共享的共享编码器。

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G10	乐器；声学
G10L	语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码
G10L15/00	语音识别（G10L17/00优先）
G10L15/06	.创建基准模板；训练语音识别系统，例如对说话者声音特征的适应（G10L15/14优先）