一种融合人声特征与人脸特征的智能视频剪辑方法

发明授权

CN116916089B 一种融合人声特征与人脸特征的智能视频剪辑方法有权

请登陆查看更多内容

专利标题： 一种融合人声特征与人脸特征的智能视频剪辑方法
申请号： CN202310704953.5

申请日： 2023-06-14
公开(公告)号： CN116916089B

公开(公告)日： 2024-09-20
发明人: 徐可佳 , 陈金强 , 徐智衍 , 陈安桐 , 沈洋 , 唐鹏飞 , 邓胡一万 , 张一超
申请人： 西南交通大学
申请人地址： 四川省成都市二环路北一段111号
专利权人： 西南交通大学
当前专利权人： 西南交通大学
当前专利权人地址： 四川省成都市二环路北一段111号
代理机构： 成都东恒知盛知识产权代理事务所
代理商 何健雄
主分类号： H04N21/44
IPC分类号： H04N21/44 ; H04N21/439

摘要：

本发明涉及视频剪辑技术领域，涉及一种融合人声特征与人脸特征的智能视频剪辑方法，包括：S1、场景镜头拆分，将输入的视频拆分成多个场景镜头片段，然后对每个场景镜头片段进行滑窗切片；S2、智能视频剪辑S2.1、对切片后的片段进行目标检测和显著性检测；S2.2、多主角类视频的判定：判定片段是否为多人物主角类，若是，则采用人声与人脸智能匹配方法；S2.3、通过人声与人脸智能匹配方法分析得到视频每段的说话人主体目标框，再通过按比例对视频进行裁剪，再对多片段和原语音进行合成，最后对视频进行平滑即可输出最后的裁剪的短视频结果。本发明能够应对多主角人物视频自动剪辑中的音画不匹配。

公开/授权文献

CN116916089A 一种融合人声特征与人脸特征的智能视频剪辑方法公开/授权日：2023-10-20

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

H	电学
H04	电通信技术
H04N	图像通信，如电视
H04N21/00	可选的内容分发，例如交互式电视,或视频点播[VOD]（运动视频数据的实时双向传输入H04N7/14）
H04N21/40	.专门适用于接收内容或者与内容交互的客户端设备，如STB〔机顶盒〕；相关操作
H04N21/43	..内容或者附加数据的处理，例如解复用来自数字视频流的附加数据；基本客户端操作，例如：本地网络的监控或者译码器时钟的同步；客户端中间件
H04N21/44	...视频基本流的处理，例如：将从本地存储器获得的视频剪辑与输入视频流进行拼接，或者按照MPEG-4场景图呈现场景