发明公开
- 专利标题: 语音识别文本纠错方法及装置
-
申请号: CN202211290277.3申请日: 2022-10-21
-
公开(公告)号: CN117951247A公开(公告)日: 2024-04-30
- 发明人: 马坚 , 李敏 , 曾谁飞 , 刘卫强 , 孔令磊 , 张景瑞
- 申请人: 青岛海尔电冰箱有限公司 , 海尔智家股份有限公司
- 申请人地址: 山东省青岛市崂山区海尔路1号海尔工业园;
- 专利权人: 青岛海尔电冰箱有限公司,海尔智家股份有限公司
- 当前专利权人: 青岛海尔电冰箱有限公司,海尔智家股份有限公司
- 当前专利权人地址: 山东省青岛市崂山区海尔路1号海尔工业园;
- 代理机构: 苏州威世朋知识产权代理事务所
- 代理商 杨志飞
- 主分类号: G06F16/33
- IPC分类号: G06F16/33 ; G06F16/335 ; G06F16/35 ; G06F40/194 ; G06F40/30
摘要:
本发明揭示了一种语音识别文本纠错方法及装置,方法包括:将语音数据转译为文本数据;在语料库中使用文本相似度模型筛选与文本数据的语义相似的相似文本集合;在语料库中筛选与文本数据的编辑距离在预设阈值范围内的距离集合;通过二分类模型,判断文本数据的每一位的值是第一值还是第二值;在相似文本集合和距离集合中筛选与文本数据的文本长度相同、且每个指定位置的内容与所述文本数据的内容均相同的候选文本集合;在候选文本集合中取出现频率最高的文本为已纠错文本。运用该语音识别文本纠错方法及装置,可以以不对语句分词的形式确定出已纠错文本,实现文本的纠错,从而更清楚地识别用户的真实需求。