Invention Publication
- Patent Title: 语音批数据生成与混淆方法、语音模型训练方法及装置
-
Application No.: CN202311687308.3Application Date: 2023-12-06
-
Publication No.: CN117765935APublication Date: 2024-03-26
- Inventor: 介飞 , 张海俊 , 汪锦想 , 于振华
- Applicant: 科大讯飞股份有限公司
- Applicant Address: 安徽省合肥市高新开发区望江西路666号
- Assignee: 科大讯飞股份有限公司
- Current Assignee: 科大讯飞股份有限公司
- Current Assignee Address: 安徽省合肥市高新开发区望江西路666号
- Agency: 北京路浩知识产权代理有限公司
- Agent 孟紫琴
- Main IPC: G10L15/06
- IPC: G10L15/06 ; G06F18/214 ; G06F18/241 ; G06N3/04

Abstract:
本发明提供一种语音批数据生成与混淆方法、语音模型训练方法及装置,其中语音批数据生成与混淆方法包括:获取各类别语音数据的样本索引序列;对各类别语音数据的样本索引序列进行混淆,并基于预设类别比例,从混淆后各类别样本索引序列中抽取样本索引,生成多个固定比例数据索引块;对多个固定比例数据索引块进行混淆,并基于混淆后固定比例数据索引块,生成索引批数据。本发明提供的方法及装置,可以保证混淆后任意以固定数据索引块大小为粒度的局部范围内批数据的各个类别样本数量比例稳定,从而增强训练模型的稳定性与泛化能力。
Information query