一种音频导读自动生成方法和系统

发明授权

请登陆查看更多内容

专利标题： 一种音频导读自动生成方法和系统
申请号： CN202310676882.2

申请日： 2023-06-08
公开(公告)号： CN116453525B

公开(公告)日： 2023-10-20
发明人: 张辰 , 张芳
申请人： 北京奇趣万物科技有限公司
申请人地址： 北京市丰台区南四环西路188号十七区18号楼11层1101-23室
专利权人： 北京奇趣万物科技有限公司
当前专利权人： 北京奇趣万物科技有限公司
当前专利权人地址： 北京市丰台区南四环西路188号十七区18号楼11层1101-23室
代理机构： 北京辰权知识产权代理有限公司
代理商 刘广达
主分类号： G10L17/02
IPC分类号： G10L17/02 ; G10L17/04 ; G10L17/14 ; G10L17/18 ; G10L17/22 ; G10L15/18

摘要：

本申请提供一种音频导读自动生成方法和系统，方法包括：向第一用户展示和提示所述第一用户发声阅读第一阅读材料，获取第一用户的音频记录；解析所述第一用户的音频记录，提取所述音频记录的特征信息，以获取所述第一用户的发声规律，所述发声规律为文字、拼音、声调、声纹、语速、和音强的映射关系；将所述第一阅读材料的文本、所述音频记录的特征信息和发声规律输入并训练预设神经网络；获取第二阅读材料的文本，将所述第二阅读材料的文本输入训练后的神经网络中，输出具有相同发声规律的音频导读文件；向第二用户展示所述第二阅读材料，根据用户的操作指示打开相应文本材料页数或段落，并向所述第二用户播放相应的所述音频导读文件的相应页数或段落的音频。

公开/授权文献

CN116453525A 一种音频导读自动生成方法和系统公开/授权日：2023-07-18

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G10	乐器；声学
G10L	语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码
G10L17/00	讲话者辨认或验证
G10L17/02	.预处理操作，例如：片断选择；模式表示或模拟，例如基于线性判别式分析(LDA)或主要部件；特征选择或提取