-
公开(公告)号:CN101609672B
公开(公告)日:2011-09-07
申请号:CN200910088867.6
申请日:2009-07-21
Applicant: 北京邮电大学
IPC: G10L15/00
Abstract: 本发明实施例公开了一种语音识别语义置信特征提取的方法,包括:通过主题模型对语音识别结果进行推理,获取识别结果的主题结构;利用推理结果计算得到词的主题分布;从识别结果中选取一定数目、声学后验概率大于某个阈值、并且主题性强的词作为锚点词(Anchor Words);利用锚点词的主题分布,计算得到整个识别结果的基准主题分布;使用识别结果中词的主题分布,比较其与识别结果基准主题分布之间的相似性,作为词的语义置信特征。还公开了一种语音识别语义置信特征提取装置,为置信度标注提供了语义高层信息的指导,从而能够更准确的描述和分析语音识别结果,提高置信度标注的精度。
-
公开(公告)号:CN119204182A
公开(公告)日:2024-12-27
申请号:CN202411259298.8
申请日:2024-09-09
Applicant: 中国民航科学技术研究院 , 北京邮电大学
IPC: G06N5/022 , G06N3/0464 , G06N3/0455 , G06N3/047 , G06N3/0442 , G06N3/0895 , G06N5/04 , G06F40/295 , G06F40/30 , G06F16/35 , G06F16/36 , G06Q50/40
Abstract: 本发明公开了一种民航服务领域知识图谱构建方法、系统及存储介质,其方法包括:S1、BERT‑BiLSTM‑CRF算法模型进行实体抽取处理并得到相互关联的实体向量序列、特征向量序列、标注序列;S2、卷积神经网络模型抽取句子向量以及所包含的实体向量并采用n个过滤器识别抽取得到实体‑关系‑实体的三元组数据库;S3、通过条件随机场实体节点整合模型整合标注信息对应存储于实体并作为实体的属性值;S4、利用三元组数据库及整合后实体的属性值进行链接融合构建得到民航知识图谱。本发明能够基于民航知识文本数据库获得全面、准确实体间关系的民航知识图谱,可以满足乘客知识问答、查询外,还可以作为培训和教育资源,提升了整体服务水平。
-
公开(公告)号:CN101609671B
公开(公告)日:2011-09-07
申请号:CN200910088866.1
申请日:2009-07-21
Applicant: 北京邮电大学
IPC: G10L15/00
Abstract: 本发明实施例公开了一种基于字词混合的连续语音识别结果评价方法,包括:根据输入的语音识别结果序列和参考序列,生成字词混合的R-T匹配平面;根据DP算法在R-T平面中进行匹配,局部匹配路径采用基于字词混合的多匹配路径,并采用多种路径得分函数;进行路径回溯,获取最佳匹配结果,统计语音识别性能相关信息。还公开了一种基于字词混合的连续语音识别结果评价装置,利用本发明实施例,能够有效降低识别结果评价中的虚假错误,有效提高基于词的连续语音识别结果评价精度。
-
公开(公告)号:CN101609672A
公开(公告)日:2009-12-23
申请号:CN200910088867.6
申请日:2009-07-21
Applicant: 北京邮电大学
IPC: G10L15/00
Abstract: 本发明实施例公开了一种语音识别语义置信特征提取的方法,包括:通过主题模型对语音识别结果进行推理,获取识别结果的主题结构;利用推理结果计算得到词的主题分布;从识别结果中选取一定数目、声学后验概率大于某个阈值、并且主题性强的词作为锚点词(Anchor Words);利用锚点词的主题分布,计算得到整个识别结果的基准主题分布;使用识别结果中词的主题分布,比较其与识别结果基准主题分布之间的相似性,作为词的语义置信特征。还公开了一种语音识别语义置信特征提取装置,为置信度标注提供了语义高层信息的指导,从而能够更准确的描述和分析语音识别结果,提高置信度标注的精度。
-
-
-