-
公开(公告)号:CN101609671A
公开(公告)日:2009-12-23
申请号:CN200910088866.1
申请日:2009-07-21
Applicant: 北京邮电大学
IPC: G10L15/00
Abstract: 本发明实施例公开了一种基于字词混合的连续语音识别结果评价方法,包括:根据输入的语音识别结果序列和参考序列,生成字词混合的R-T匹配平面;根据DP算法在R-T平面中进行匹配,局部匹配路径采用基于字词混合的多匹配路径,并采用多种路径得分函数;进行路径回溯,获取最佳匹配结果,统计语音识别性能相关信息。还公开了一种基于字词混合的连续语音识别结果评价装置,利用本发明实施例,能够有效降低识别结果评价中的虚假错误,有效提高基于词的连续语音识别结果评价精度。
-
公开(公告)号:CN101609672B
公开(公告)日:2011-09-07
申请号:CN200910088867.6
申请日:2009-07-21
Applicant: 北京邮电大学
IPC: G10L15/00
Abstract: 本发明实施例公开了一种语音识别语义置信特征提取的方法,包括:通过主题模型对语音识别结果进行推理,获取识别结果的主题结构;利用推理结果计算得到词的主题分布;从识别结果中选取一定数目、声学后验概率大于某个阈值、并且主题性强的词作为锚点词(Anchor Words);利用锚点词的主题分布,计算得到整个识别结果的基准主题分布;使用识别结果中词的主题分布,比较其与识别结果基准主题分布之间的相似性,作为词的语义置信特征。还公开了一种语音识别语义置信特征提取装置,为置信度标注提供了语义高层信息的指导,从而能够更准确的描述和分析语音识别结果,提高置信度标注的精度。
-
公开(公告)号:CN101609671B
公开(公告)日:2011-09-07
申请号:CN200910088866.1
申请日:2009-07-21
Applicant: 北京邮电大学
IPC: G10L15/00
Abstract: 本发明实施例公开了一种基于字词混合的连续语音识别结果评价方法,包括:根据输入的语音识别结果序列和参考序列,生成字词混合的R-T匹配平面;根据DP算法在R-T平面中进行匹配,局部匹配路径采用基于字词混合的多匹配路径,并采用多种路径得分函数;进行路径回溯,获取最佳匹配结果,统计语音识别性能相关信息。还公开了一种基于字词混合的连续语音识别结果评价装置,利用本发明实施例,能够有效降低识别结果评价中的虚假错误,有效提高基于词的连续语音识别结果评价精度。
-
公开(公告)号:CN101609672A
公开(公告)日:2009-12-23
申请号:CN200910088867.6
申请日:2009-07-21
Applicant: 北京邮电大学
IPC: G10L15/00
Abstract: 本发明实施例公开了一种语音识别语义置信特征提取的方法,包括:通过主题模型对语音识别结果进行推理,获取识别结果的主题结构;利用推理结果计算得到词的主题分布;从识别结果中选取一定数目、声学后验概率大于某个阈值、并且主题性强的词作为锚点词(Anchor Words);利用锚点词的主题分布,计算得到整个识别结果的基准主题分布;使用识别结果中词的主题分布,比较其与识别结果基准主题分布之间的相似性,作为词的语义置信特征。还公开了一种语音识别语义置信特征提取装置,为置信度标注提供了语义高层信息的指导,从而能够更准确的描述和分析语音识别结果,提高置信度标注的精度。
-
-
-