- 专利标题: 一种多阶段语音与文本容错对齐的方法及装置
-
申请号: CN202210625881.0申请日: 2022-06-02
-
公开(公告)号: CN115062599B公开(公告)日: 2024-09-06
- 发明人: 陶冶 , 徐锴 , 鲁超峰 , 彭国纯 , 程辉 , 吴边 , 唐志峰
- 申请人: 青岛科技大学
- 申请人地址: 山东省青岛市崂山区松岭路99号
- 专利权人: 青岛科技大学
- 当前专利权人: 青岛科技大学
- 当前专利权人地址: 山东省青岛市崂山区松岭路99号
- 代理机构: 青岛联智专利商标事务所有限公司
- 代理商 邵新华
- 主分类号: G06F40/194
- IPC分类号: G06F40/194 ; G06F40/189 ; G10L15/26
摘要:
本发明公开了一种多阶段语音与文本容错对齐的方法及装置,包括:将语音转换成文字,形成识别文本的第一阶段;在原始文本与识别文本中,通过寻找最长递增子序列搜索锚点的第二阶段;根据锚点在句子中的位置关系,在识别文本中划分出初步对齐段和未对齐段的第三阶段;对未对齐段重复执行第二、三阶段,直到未对齐段不再发生变化或者没有新的锚点出现为止的第四阶段;针对未对齐段,采用相似度计算函数在识别文本中寻找与原始文本中最相似的字词作为句子边界,对未对齐段进行初步对准的第五阶段;判断初步对齐的句子是精确对准还是错误对准的第六阶段。本发明的文语对齐方法可以有效解决连续、非完全匹配的长语音与文本的句子级的对准问题。
公开/授权文献
- CN115062599A 一种多阶段语音与文本容错对齐的方法及装置 公开/授权日:2022-09-16