- 专利标题: 一种面向影视配乐的跨模态音乐生成方法和装置
-
申请号: CN202411025431.3申请日: 2024-07-30
-
公开(公告)号: CN118551074B公开(公告)日: 2024-10-25
- 发明人: 尤伟涛 , 吴俊贤 , 左鹤达 , 刘宣慧
- 申请人: 浙江大学
- 申请人地址: 浙江省杭州市西湖区余杭塘路866号
- 专利权人: 浙江大学
- 当前专利权人: 浙江大学
- 当前专利权人地址: 浙江省杭州市西湖区余杭塘路866号
- 代理机构: 杭州天勤知识产权代理有限公司
- 代理商 胡红娟
- 主分类号: G06F16/68
- IPC分类号: G06F16/68 ; G06F18/213 ; G06N3/0455
摘要:
本发明公开了一种面向影视配乐的跨模态音乐生成方法和装置,该生成方法仅仅且同时对空间特征适配器和时序控制器进行训练,与现有技术相比,本发明可以仅仅将需要训练的空间特征适配器和时序控制器加载到GPU中,且不需要分别对空间特征适配器和时序控制器进行训练,从而显著减少内存的使用,提高训练速度。通过训练完成的空间特征适配器和最终音乐查询向量从视觉特征向量中筛选出与音乐相关的音乐特征,以及通过训练完成的时序控制器能够预测出与视频的内容较为一致的预测音乐嵌入,从而得到与视频内容较为一致且较为真实的预测音乐。
公开/授权文献
- CN118551074A 一种面向影视配乐的跨模态音乐生成方法和装置 公开/授权日:2024-08-27