- 专利标题: 一种融合人声特征与人脸特征的智能视频剪辑方法
-
申请号: CN202310704953.5申请日: 2023-06-14
-
公开(公告)号: CN116916089B公开(公告)日: 2024-09-20
- 发明人: 徐可佳 , 陈金强 , 徐智衍 , 陈安桐 , 沈洋 , 唐鹏飞 , 邓胡一万 , 张一超
- 申请人: 西南交通大学
- 申请人地址: 四川省成都市二环路北一段111号
- 专利权人: 西南交通大学
- 当前专利权人: 西南交通大学
- 当前专利权人地址: 四川省成都市二环路北一段111号
- 代理机构: 成都东恒知盛知识产权代理事务所
- 代理商 何健雄
- 主分类号: H04N21/44
- IPC分类号: H04N21/44 ; H04N21/439
摘要:
本发明涉及视频剪辑技术领域,涉及一种融合人声特征与人脸特征的智能视频剪辑方法,包括:S1、场景镜头拆分,将输入的视频拆分成多个场景镜头片段,然后对每个场景镜头片段进行滑窗切片;S2、智能视频剪辑S2.1、对切片后的片段进行目标检测和显著性检测;S2.2、多主角类视频的判定:判定片段是否为多人物主角类,若是,则采用人声与人脸智能匹配方法;S2.3、通过人声与人脸智能匹配方法分析得到视频每段的说话人主体目标框,再通过按比例对视频进行裁剪,再对多片段和原语音进行合成,最后对视频进行平滑即可输出最后的裁剪的短视频结果。本发明能够应对多主角人物视频自动剪辑中的音画不匹配。
公开/授权文献
- CN116916089A 一种融合人声特征与人脸特征的智能视频剪辑方法 公开/授权日:2023-10-20