-
公开(公告)号:CN117609548A
公开(公告)日:2024-02-27
申请号:CN202311326840.2
申请日:2023-10-13
Applicant: 中国科学院信息工程研究所
IPC: G06F16/738 , G06V20/40 , G06F18/22 , G06V10/74 , G06V20/62 , G06V10/25 , G06N3/0455 , G06N3/09 , H04N21/8549
Abstract: 本发明涉及一种基于预训练模型的视频多模态目标要素抽取与视频摘要合成方法及系统。该方法包括:对用户的自定义文稿进行预处理;通过预训练模型提取视频中的关键要素;将用户的自定义文稿中的句子与提取的视频中的关键要素进行匹配;根据匹配的结果自动生成结果视频。本发明能够处理用户提供的自定义文案,并根据文案的不同生成不同的摘要视频结果,在实现关键信息抽取的同时,充分考虑了用户的自定义需求,能够实现多样化剪辑,从而更好地促进信息的检索与传播。