发明公开
- 专利标题: 一种自动化相册幻灯片视频合成方法及装置
-
申请号: CN202410835587.1申请日: 2024-06-26
-
公开(公告)号: CN118869908A公开(公告)日: 2024-10-29
- 发明人: 王岚君 , 乔哲雨 , 陈睿东 , 李静秋 , 刘安安 , 王文杰 , 王晓琼 , 饶玮 , 陈帅
- 申请人: 天津大学 , 北京酷讯科技有限公司
- 申请人地址: 天津市南开区卫津路92号;
- 专利权人: 天津大学,北京酷讯科技有限公司
- 当前专利权人: 天津大学,北京酷讯科技有限公司
- 当前专利权人地址: 天津市南开区卫津路92号;
- 代理机构: 天津市北洋有限责任专利代理事务所
- 代理商 李林娟
- 主分类号: H04N5/265
- IPC分类号: H04N5/265 ; G06V10/764 ; G06V10/82 ; G06N3/0464 ; G06N3/048 ; G06N3/08 ; H04N21/44 ; H04N21/439 ; H04N5/278 ; G10L13/02
摘要:
本发明公开了一种自动化相册幻灯片视频合成方法及装置,方法包括:使用图像美学评估模型对用户输入的图片进行美学质量评分,根据模型的评分结果,对图片进行排序和筛选,选择最佳的图片;利用图像理解大模型对最佳的图片进行内容分析,使用自然语言处理大模型自动生成与图片内容匹配的文案;将生成的文案转化为语音,使用语音合成生成配有时间戳的语音文件,输出格式包含时间戳的句子或短语;使用图文匹配进行分析,确保所选文案与图片内容之间的关键词匹配,应用去重策略;使用视频编辑框架,整合筛选后的图像、合成的文案、语音及音乐,自动编辑并输出最终的幻灯片视频。装置包括:处理器和存储器。