语音识别文本纠错方法及装置

发明公开

请登陆查看更多内容

专利标题： 语音识别文本纠错方法及装置
申请号： CN202211290277.3

申请日： 2022-10-21
公开(公告)号： CN117951247A

公开(公告)日： 2024-04-30
发明人: 马坚 , 李敏 , 曾谁飞 , 刘卫强 , 孔令磊 , 张景瑞
申请人： 青岛海尔电冰箱有限公司 , 海尔智家股份有限公司
申请人地址： 山东省青岛市崂山区海尔路1号海尔工业园;
专利权人： 青岛海尔电冰箱有限公司,海尔智家股份有限公司
当前专利权人： 青岛海尔电冰箱有限公司,海尔智家股份有限公司
当前专利权人地址： 山东省青岛市崂山区海尔路1号海尔工业园;
代理机构： 苏州威世朋知识产权代理事务所
代理商 杨志飞
主分类号： G06F16/33
IPC分类号： G06F16/33 ; G06F16/335 ; G06F16/35 ; G06F40/194 ; G06F40/30

摘要：

本发明揭示了一种语音识别文本纠错方法及装置，方法包括：将语音数据转译为文本数据；在语料库中使用文本相似度模型筛选与文本数据的语义相似的相似文本集合；在语料库中筛选与文本数据的编辑距离在预设阈值范围内的距离集合；通过二分类模型，判断文本数据的每一位的值是第一值还是第二值；在相似文本集合和距离集合中筛选与文本数据的文本长度相同、且每个指定位置的内容与所述文本数据的内容均相同的候选文本集合；在候选文本集合中取出现频率最高的文本为已纠错文本。运用该语音识别文本纠错方法及装置，可以以不对语句分词的形式确定出已纠错文本，实现文本的纠错，从而更清楚地识别用户的真实需求。

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06F	电数字数据处理（基于特定计算模型的计算机系统入G06N）
G06F16/00	信息检索；数据库结构；文件系统结构
G06F16/30	.•非结构文本数据（文档管理系统入G06F 16/93）
G06F16/33	..••查询