- 专利标题: 用于减小生产语音模型中的原则性偏差的系统和方法
-
申请号: CN201810159989.9申请日: 2018-02-26
-
公开(公告)号: CN108510985B公开(公告)日: 2022-11-18
- 发明人: 埃里克·巴顿伯格 , 瑞万·蔡尔德 , 亚当·科茨 , 克里斯托弗·丰纳 , 雅舍施·高尔 , 黄家骥 , 俊熙雄 , 阿贾伊·卡恩纳恩 , 马库斯·基尔 , 奥提尓·库马尔 , 刘海容 , 维奈·朗 , 桑吉夫·萨西斯 , 大卫·西塔潘 , 安鲁普·西瑞兰姆 , 朱臻垚
- 申请人: 百度(美国)有限责任公司
- 申请人地址: 美国加利福尼亚州
- 专利权人: 百度(美国)有限责任公司
- 当前专利权人: 百度(美国)有限责任公司
- 当前专利权人地址: 美国加利福尼亚州
- 代理机构: 北京英赛嘉华知识产权代理有限责任公司
- 代理商 马晓亚; 王艳春
- 优先权: 62/463,547 20170224 US 15/884,239 20180130 US
- 主分类号: G10L15/22
- IPC分类号: G10L15/22 ; G10L15/16
摘要:
本文中描述的是识别和解决端对端语音模型中的偏差源的系统和方法。在一个或多个实施方式中,端对端模型可以是递归神经网络,该递归神经网络具有两个2D卷积输入层,接着是多个双向递归层以及在softmax层之前的一个完全连接层。在一个或多个实施方式中,使用CTC损失函数训练端对端,以从音频的对数频谱直接预测字符的序列。通过优化的递归层和与对齐信息一起训练,可去除所配置的模型中的一些不希望有的偏差,这些不希望有的偏差是通过使用仅纯粹前向递归而引起的。
公开/授权文献
- CN108510985A 用于减小生产语音模型中的原则性偏差的系统和方法 公开/授权日:2018-09-07