发明公开
CN117523454A 一种视频识别方法
审中-实审
- 专利标题: 一种视频识别方法
-
申请号: CN202311560317.6申请日: 2023-11-21
-
公开(公告)号: CN117523454A公开(公告)日: 2024-02-06
- 发明人: 黄高 , 王语霖 , 张颢继 , 乐阳 , 宋士吉
- 申请人: 清华大学
- 申请人地址: 北京市海淀区双清路30号
- 专利权人: 清华大学
- 当前专利权人: 清华大学
- 当前专利权人地址: 北京市海淀区双清路30号
- 代理机构: 北京润泽恒知识产权代理有限公司
- 代理商 苟冬梅
- 主分类号: G06V20/40
- IPC分类号: G06V20/40 ; G06V10/764 ; G06V10/44 ; G06V10/42 ; G06V10/82 ; G06N3/047 ; G06N3/0464 ; G06N3/084
摘要:
本公开提供了一种视频识别方法,涉及计算机技术领域,旨在高效地实现视频识别。所述方法包括:将目标视频输入视频识别模型,得到全局特征提取网络输出的目标视频的各个视频帧的全局特征图;将各个视频帧的全局特征图输入策略网络,得到多个目标视频帧;其中,目标视频帧包含的信息量大于非目标视频帧包含的信息量;将每个目标视频帧的全局特征图输入策略网络,得到每个目标视频帧的目标图像区域;其中,目标图像区域包含的信息量大于非目标图像区域包含的信息量;将每个目标视频帧的目标图像区域输入局部特征提取网络,得到每个目标视频帧的局部特征图;将每个目标视频帧的局部特征图输入分类器,得到目标视频的识别结果。