-
公开(公告)号:CN101490741A
公开(公告)日:2009-07-22
申请号:CN200780026479.4
申请日:2007-05-15
申请人: 微软公司
CPC分类号: G10L25/78 , G10L15/22 , G10L15/26 , H04M3/5158 , H04M2203/2027
摘要: 应答机检测模块被用来确定呼叫接听者是真实的个人还是应答机。该应答机检测模块包括语音识别器和呼叫分析模块。语音识别器接收呼叫接听者对呼叫的可听响应。语音识别器处理该可听响应并提供指示所识别的语音的输出。呼叫分析模块处理语音识别器的输出来生成指示呼叫接听者是个人还是应答机的输出。
-
公开(公告)号:CN102737278A
公开(公告)日:2012-10-17
申请号:CN201210089488.0
申请日:2012-03-30
申请人: 微软公司
IPC分类号: G06N3/08
CPC分类号: G06N3/08 , G06N3/02 , G06N3/04 , G06N3/0454
摘要: 本发明涉及结合非线性随机投影、受限波尔兹曼机、以及基于批量的可并行优化来使用的深凸网络。本文公开了一种包括以下动作的方法:使得处理器访问深结构化的、已分层的、或分等级的模型(称为深凸网络,被保持在计算机可读介质中),其中该深结构化的模型包括具有所分配的权重的多个层。这一已分层模型可以产生输出,该输出担当用于与隐马尔科夫模型中的各状态之间的转移概率相组合的分数,以及担当用于形成全语音识别器的语言模型分数。该方法联合使用非线性随机投影和RBM权重,并且它将较低模块的输出与原始数据进行堆叠以建立它的紧接的较高模块。执行基于批量的凸优化来学习深凸网络的权重的一部分,从而使它适于并行计算来完成训练。该方法还可包括使用基于序列而非一组不相关帧的优化准则来对该深度结构化的模型的权重、转移概率和语言模型分数进行联合地充分优化的动作。
-
公开(公告)号:CN101490741B
公开(公告)日:2012-01-11
申请号:CN200780026479.4
申请日:2007-05-15
申请人: 微软公司
CPC分类号: G10L25/78 , G10L15/22 , G10L15/26 , H04M3/5158 , H04M2203/2027
摘要: 应答机检测模块被用来确定呼叫接听者是真实的个人还是应答机。该应答机检测模块包括语音识别器和呼叫分析模块。语音识别器接收呼叫接听者对呼叫的可听响应。语音识别器处理该可听响应并提供指示所识别的语音的输出。呼叫分析模块处理语音识别器的输出来生成指示呼叫接听者是个人还是应答机的输出。
-
-