发明授权
- 专利标题: 一种音频导读自动生成方法和系统
-
申请号: CN202310676882.2申请日: 2023-06-08
-
公开(公告)号: CN116453525B公开(公告)日: 2023-10-20
- 发明人: 张辰 , 张芳
- 申请人: 北京奇趣万物科技有限公司
- 申请人地址: 北京市丰台区南四环西路188号十七区18号楼11层1101-23室
- 专利权人: 北京奇趣万物科技有限公司
- 当前专利权人: 北京奇趣万物科技有限公司
- 当前专利权人地址: 北京市丰台区南四环西路188号十七区18号楼11层1101-23室
- 代理机构: 北京辰权知识产权代理有限公司
- 代理商 刘广达
- 主分类号: G10L17/02
- IPC分类号: G10L17/02 ; G10L17/04 ; G10L17/14 ; G10L17/18 ; G10L17/22 ; G10L15/18
摘要:
本申请提供一种音频导读自动生成方法和系统,方法包括:向第一用户展示和提示所述第一用户发声阅读第一阅读材料,获取第一用户的音频记录;解析所述第一用户的音频记录,提取所述音频记录的特征信息,以获取所述第一用户的发声规律,所述发声规律为文字、拼音、声调、声纹、语速、和音强的映射关系;将所述第一阅读材料的文本、所述音频记录的特征信息和发声规律输入并训练预设神经网络;获取第二阅读材料的文本,将所述第二阅读材料的文本输入训练后的神经网络中,输出具有相同发声规律的音频导读文件;向第二用户展示所述第二阅读材料,根据用户的操作指示打开相应文本材料页数或段落,并向所述第二用户播放相应的所述音频导读文件的相应页数或段落的音频。
公开/授权文献
- CN116453525A 一种音频导读自动生成方法和系统 公开/授权日:2023-07-18