一种面向影视配乐的跨模态音乐生成方法和装置

发明授权

CN118551074B 一种面向影视配乐的跨模态音乐生成方法和装置有权

请登陆查看更多内容

专利标题： 一种面向影视配乐的跨模态音乐生成方法和装置
申请号： CN202411025431.3

申请日： 2024-07-30
公开(公告)号： CN118551074B

公开(公告)日： 2024-10-25
发明人: 尤伟涛 , 吴俊贤 , 左鹤达 , 刘宣慧
申请人： 浙江大学
申请人地址： 浙江省杭州市西湖区余杭塘路866号
专利权人： 浙江大学
当前专利权人： 浙江大学
当前专利权人地址： 浙江省杭州市西湖区余杭塘路866号
代理机构： 杭州天勤知识产权代理有限公司
代理商 胡红娟
主分类号： G06F16/68
IPC分类号： G06F16/68 ; G06F18/213 ; G06N3/0455

摘要：

本发明公开了一种面向影视配乐的跨模态音乐生成方法和装置，该生成方法仅仅且同时对空间特征适配器和时序控制器进行训练，与现有技术相比，本发明可以仅仅将需要训练的空间特征适配器和时序控制器加载到GPU中，且不需要分别对空间特征适配器和时序控制器进行训练，从而显著减少内存的使用，提高训练速度。通过训练完成的空间特征适配器和最终音乐查询向量从视觉特征向量中筛选出与音乐相关的音乐特征，以及通过训练完成的时序控制器能够预测出与视频的内容较为一致的预测音乐嵌入，从而得到与视频内容较为一致且较为真实的预测音乐。

公开/授权文献

CN118551074A 一种面向影视配乐的跨模态音乐生成方法和装置公开/授权日：2024-08-27

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06F	电数字数据处理（基于特定计算模型的计算机系统入G06N）
G06F16/00	信息检索；数据库结构；文件系统结构
G06F16/60	.•音频数据
G06F16/68	..••使用元数据的特征检索,例如,不来自内容或者元数据派生的