一种端到端中文语音文本纠错方法、装置和存储介质

发明授权

CN114444479B 一种端到端中文语音文本纠错方法、装置和存储介质有权

请登陆查看更多内容

专利标题： 一种端到端中文语音文本纠错方法、装置和存储介质
申请号： CN202210371315.1

申请日： 2022-04-11
公开(公告)号： CN114444479B

公开(公告)日： 2022-06-24
发明人: 杜振东
申请人： 南京云问网络技术有限公司
申请人地址： 江苏省南京市鼓楼区建宁路65号2楼203室
专利权人： 南京云问网络技术有限公司
当前专利权人： 南京云问网络技术有限公司
当前专利权人地址： 江苏省南京市鼓楼区建宁路65号2楼203室
代理机构： 南京瑞华腾知识产权代理事务所
代理商 胡海
主分类号： G06F40/232
IPC分类号： G06F40/232 ; G06F40/30 ; G06F16/35 ; G10L15/06

摘要：

本发明提出了一种端到端中文语音文本纠错方法、装置和存储介质，该方法包括如下步骤：基于语音识别数据集构建语音纠错数据集，语音纠错数据集包括待纠错样本和正确样本；获取纯文本数据，并对纯文本数据进行预处理；采用预处理后的纯文本数据进行模型训练，获得融入语音信息的预训练语言模型；从待纠错样本的句子中提取拼音和字，输入至融入语音信息的预训练语言模型，获得语义序列表征；采用语义序列表征进行模型训练，获得端到端语音文本纠错模型；将待纠错文本输入至端到端语音文本纠错模型中，获得纠错后文本。本发明实现了语音信息的融入，语义和拼音信息的双重编码，以及针对语音文本的实时纠错，同时提升了针对语音文本的纠错效果。

公开/授权文献

CN114444479A 一种端到端中文语音文本纠错方法、装置和存储介质公开/授权日：2022-05-06

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06F	电数字数据处理（基于特定计算模型的计算机系统入G06N）
G06F40/00	处理自然语言数据（语音分析或综合，语音识别G10L）
G06F40/20	.自然语言分析（自然语言的语义分析入G06F40/30）
G06F40/232	..拼写校正，例如拼写差错程序或加元音符