一种多阶段语音与文本容错对齐的方法及装置

发明授权

请登陆查看更多内容

专利标题： 一种多阶段语音与文本容错对齐的方法及装置
申请号： CN202210625881.0

申请日： 2022-06-02
公开(公告)号： CN115062599B

公开(公告)日： 2024-09-06
发明人: 陶冶 , 徐锴 , 鲁超峰 , 彭国纯 , 程辉 , 吴边 , 唐志峰
申请人： 青岛科技大学
申请人地址： 山东省青岛市崂山区松岭路99号
专利权人： 青岛科技大学
当前专利权人： 青岛科技大学
当前专利权人地址： 山东省青岛市崂山区松岭路99号
代理机构： 青岛联智专利商标事务所有限公司
代理商 邵新华
主分类号： G06F40/194
IPC分类号： G06F40/194 ; G06F40/189 ; G10L15/26

摘要：

本发明公开了一种多阶段语音与文本容错对齐的方法及装置，包括：将语音转换成文字，形成识别文本的第一阶段；在原始文本与识别文本中，通过寻找最长递增子序列搜索锚点的第二阶段；根据锚点在句子中的位置关系，在识别文本中划分出初步对齐段和未对齐段的第三阶段；对未对齐段重复执行第二、三阶段，直到未对齐段不再发生变化或者没有新的锚点出现为止的第四阶段；针对未对齐段，采用相似度计算函数在识别文本中寻找与原始文本中最相似的字词作为句子边界，对未对齐段进行初步对准的第五阶段；判断初步对齐的句子是精确对准还是错误对准的第六阶段。本发明的文语对齐方法可以有效解决连续、非完全匹配的长语音与文本的句子级的对准问题。

公开/授权文献

CN115062599A 一种多阶段语音与文本容错对齐的方法及装置公开/授权日：2022-09-16

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06F	电数字数据处理（基于特定计算模型的计算机系统入G06N）
G06F40/00	处理自然语言数据（语音分析或综合，语音识别G10L）
G06F40/10	.文本处理（自然语言分析G06F 40/20;语义分析G06F 40/30;自然语言处理或翻译G06F 40/40）
G06F40/194	..计算文件之间的差异