基于多特征融合的视频描述方法

Invention Grant

Please log in to see more content

Patent Title: 基于多特征融合的视频描述方法
Application No.: CN201710281305.8

Application Date: 2017-04-26
Publication No.: CN107256221B

Publication Date: 2020-11-03
Inventor: 刘纯平 , 徐鑫 , 林欣 , 刘海宾 , 季怡
Applicant: 苏州大学
Applicant Address: 江苏省苏州市工业园区仁爱路199号
Assignee: 苏州大学
Current Assignee: 苏州大学
Current Assignee Address: 江苏省苏州市工业园区仁爱路199号
Agency: 北京市科名专利代理事务所
Agent 郭杨
Main IPC: G06F16/74
IPC: G06F16/74 ; G06F40/134 ; G06K9/00 ; G06K9/62

Abstract:

本发明公开了一种基于多特征融合的视频描述方法，其特征在于：1)通过融合传统CNN特征和SIFT流特征提取视频的深层时空特征；2)根据步骤1)提取的深层时空特征，采用加入以平均池化特征作为视频整体特征的S2VT句子生成模型生成相应的句子描述；3)采用word2vec词向量替换one‑hot vector词表征优化步骤2)中的句子生成模型。本方法优点是通过多特征融合，能更好地提取到更加鲁棒的时空特征，同时在句子生成模型中加入平均池化特征，以便视觉信息与单词间建立更多联系，最后采用word2vec词向量方法替换one‑hot vector词表征，在单词与单词之间建立更多的联系，有效提高视频描述性能。

Public/Granted literature

CN107256221A 基于多特征融合的视频描述方法 Public/Granted day:2017-10-17

Information query

Chinese Patent Announcement Global Dossier Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06F	电数字数据处理（基于特定计算模型的计算机系统入G06N）
G06F16/00	信息检索；数据库结构；文件系统结构
G06F16/70	.•视频数据
G06F16/74	..••浏览或可视化（用于请求或与视频内容交互的最终用户界面，例如视频点播界面或电子节目指南，H04N 21/472）