发明公开
CN114270434A 两遍端到端语音识别
审中-实审
- 专利标题: 两遍端到端语音识别
-
申请号: CN202080040756.2申请日: 2020-12-03
-
公开(公告)号: CN114270434A公开(公告)日: 2022-04-01
- 发明人: 塔拉·C·赛纳特 , 何彦璋 , 李博 , 阿伦·纳拉亚南 , 庞若鸣 , 安托万·让·布吕盖 , 张硕英 , 李炜
- 申请人: 谷歌有限责任公司
- 申请人地址: 美国加利福尼亚州
- 专利权人: 谷歌有限责任公司
- 当前专利权人: 谷歌有限责任公司
- 当前专利权人地址: 美国加利福尼亚州
- 代理机构: 中原信达知识产权代理有限责任公司
- 代理商 李宝泉; 周亚荣
- 优先权: 62/943,703 20191204 US
- 国际申请: PCT/US2020/063012 2020.12.03
- 国际公布: WO2021/113443 EN 2021.06.10
- 进入国家日期: 2021-12-01
- 主分类号: G10L15/06
- IPC分类号: G10L15/06 ; G10L15/16 ; G10L15/22 ; G10L15/26
摘要:
两遍自动语音识别(ASR)模型能够被用于执行流传输设备上ASR以生成在音频数据中捕获的话语的文本表示。各种实施方式包括ASR模型的用于生成在音频数据中捕获的话语的(多个)流传输候选识别的第一遍部分。例如,该第一遍部分能够包括循环神经网络变换器(RNN‑T)解码器。各种实施方式包括ASR模型的用于修订话语的(多个)流传输候选识别并且生成话语的文本表示的第二遍部分。例如,该第二遍部分能够包括听参加拼写(LAS)解码器。各种实施方式包括在RNN‑T解码器与LAS解码器之间共享的共享编码器。