专利检索 ap:("武汉理工大学") AND inv:"梁全恩" 第 1 页

1.

发明公开
一种基于多时间尺度卷积的视频行为识别方法及装置审中-实审

公开(公告)号：CN113869235A

公开(公告)日：2021-12-31

申请号：CN202111157693.1

申请日：2021-09-30

申请人： 武汉理工大学

发明人： 陈西江 , 杜晓妍 , 梁全恩 , 吴浩 , 韩贤权

IPC分类号： G06K9/00 , G06K9/62 , G06N3/04

摘要： 本发明提供了一种基于多时间尺度卷积的视频行为识别方法及装置，其方法包括：构建至少一个多时间尺度卷积模块；将所述至少一个多时间尺度卷积模块嵌入至预设的骨架网络中，形成目标特征提取模型；通过所述目标特征提取模型提取视频中的行为特征；构建行为识别模型，并通过所述行为识别模型对所述行为特征进行识别。本发明通过目标特征提取模型对视频中的行为特征进行提取，由于多时间尺度卷积模块中的卷积核参数是可以学习调整的，可有效的提取视频不同帧间的时空特征，提高行为特征提取的准确性。并且，也不会出信息丢失问题，进一步提高行为特征提取的准确性，从而可提高对视频行为识别的识别准确性。