一种基于歌词和旋律的端到端音乐音频生成的方法

发明公开

CN117198252A 一种基于歌词和旋律的端到端音乐音频生成的方法审中-实审

请登陆查看更多内容

专利标题： 一种基于歌词和旋律的端到端音乐音频生成的方法
申请号： CN202311238966.4

申请日： 2023-09-25
公开(公告)号： CN117198252A

公开(公告)日： 2023-12-08
发明人: 马星宇
申请人： 成都开心音符科技有限公司
申请人地址： 四川省成都市中国(四川)自由贸易试验区成都高新区天府三街199号B区16层B3-2、B4、B5、B6单元
专利权人： 成都开心音符科技有限公司
当前专利权人： 成都开心音符科技有限公司
当前专利权人地址： 四川省成都市中国(四川)自由贸易试验区成都高新区天府三街199号B区16层B3-2、B4、B5、B6单元
代理机构： 济南凳凳知识产权代理有限公司
代理商 宋奇奇
主分类号： G10H1/00
IPC分类号： G10H1/00

摘要：

本发明公开了一种基于歌词和旋律的端到端音乐音频生成的方法，涉及多媒体内容处理技术领域。该方法包括对音频文件、音乐的原始信息以及音乐评论信息进行处理，将提取音频文件中的歌词和旋律并将信息进行合并，将处理后的音乐原始信息、合并后的音频信息和音乐评论信息进行特征融合，将特征融合后的信息输入模型进行训练，经模型后输出隐层特征并经过声音信号模型语音分析合成系统输出wav格式音频，优化了现有直接生成音频的音乐生成模型的输入端，并将文本转语音或者歌声合成的思想用到了音乐生成领域，采用更精细的数据处理方式，让数据的分布尽量集中，从而使得模型更容易收敛。

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G10	乐器；声学
G10H	电声乐器；由机电装置或电子发生器产生音调的乐器，或从数据存储器合成音调的乐器
G10H1/00	电声乐器的零部件（也可适用于其他乐器的键盘入G10B，G10C；用于产生混响或回声的装置入G10K15/08）