一种视频识别方法

发明公开

请登陆查看更多内容

专利标题： 一种视频识别方法
申请号： CN202311560317.6

申请日： 2023-11-21
公开(公告)号： CN117523454A

公开(公告)日： 2024-02-06
发明人: 黄高 , 王语霖 , 张颢继 , 乐阳 , 宋士吉
申请人： 清华大学
申请人地址： 北京市海淀区双清路30号
专利权人： 清华大学
当前专利权人： 清华大学
当前专利权人地址： 北京市海淀区双清路30号
代理机构： 北京润泽恒知识产权代理有限公司
代理商 苟冬梅
主分类号： G06V20/40
IPC分类号： G06V20/40 ; G06V10/764 ; G06V10/44 ; G06V10/42 ; G06V10/82 ; G06N3/047 ; G06N3/0464 ; G06N3/084

摘要：

本公开提供了一种视频识别方法，涉及计算机技术领域，旨在高效地实现视频识别。所述方法包括：将目标视频输入视频识别模型，得到全局特征提取网络输出的目标视频的各个视频帧的全局特征图；将各个视频帧的全局特征图输入策略网络，得到多个目标视频帧；其中，目标视频帧包含的信息量大于非目标视频帧包含的信息量；将每个目标视频帧的全局特征图输入策略网络，得到每个目标视频帧的目标图像区域；其中，目标图像区域包含的信息量大于非目标图像区域包含的信息量；将每个目标视频帧的目标图像区域输入局部特征提取网络，得到每个目标视频帧的局部特征图；将每个目标视频帧的局部特征图输入分类器，得到目标视频的识别结果。

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06V	图像或视频识别或理解
G06V20/00	场景；特定场景元素（控制数码相机 H04N5/232）
G06V20/40	.在视频内容中（提取叠加文本 G06V20/62）（视频检索 G06F16/70）（在视频服务器中处理视频基本流H04N21/234）（在视频客户端中处理视频基本流H04N21/44）