一种基于多时间尺度卷积的视频行为识别方法及装置

    公开(公告)号:CN113869235A

    公开(公告)日:2021-12-31

    申请号:CN202111157693.1

    申请日:2021-09-30

    IPC分类号: G06K9/00 G06K9/62 G06N3/04

    摘要: 本发明提供了一种基于多时间尺度卷积的视频行为识别方法及装置,其方法包括:构建至少一个多时间尺度卷积模块;将所述至少一个多时间尺度卷积模块嵌入至预设的骨架网络中,形成目标特征提取模型;通过所述目标特征提取模型提取视频中的行为特征;构建行为识别模型,并通过所述行为识别模型对所述行为特征进行识别。本发明通过目标特征提取模型对视频中的行为特征进行提取,由于多时间尺度卷积模块中的卷积核参数是可以学习调整的,可有效的提取视频不同帧间的时空特征,提高行为特征提取的准确性。并且,也不会出信息丢失问题,进一步提高行为特征提取的准确性,从而可提高对视频行为识别的识别准确性。