发明授权
- 专利标题: 一种基于时空注意力机制的手语识别方法
-
申请号: CN201911023322.7申请日: 2019-10-25
-
公开(公告)号: CN111091045B公开(公告)日: 2022-08-23
- 发明人: 罗元 , 李丹 , 张毅 , 汪杰 , 陈顺
- 申请人: 重庆邮电大学
- 申请人地址: 重庆市南岸区南山街道崇文路2号
- 专利权人: 重庆邮电大学
- 当前专利权人: 重庆邮电大学
- 当前专利权人地址: 重庆市南岸区南山街道崇文路2号
- 代理机构: 重庆市恒信知识产权代理有限公司
- 代理商 李金蓉
- 主分类号: G06V40/20
- IPC分类号: G06V40/20 ; G06V10/77 ; G06V10/774 ; G06V10/82 ; G06V10/764 ; G06V10/46 ; G06N3/04
摘要:
本发明公开了一种基于时空注意力机制的手语识别方法,首先将手语视频采样为具有统一长度的连续手语序列作为模型的输入。然后将视频帧序列输入到由3D残差块构成的空间注意力网络中,使得网络能够自动关注空间中的显著区域。随后将提取的卷积特征经过ConvLSTM卷积长短时记忆网络解析后提取出长时间的序列特征,同时分配不同视频帧的时间注意力权重生成视频的特征表示。最后,生成的特征表示经过Softmax分类器,以向量的形式输出分类类别。本发明能够降低冗余信息对识别的干扰,提高识别准确率。
公开/授权文献
- CN111091045A 一种基于时空注意力机制的手语识别方法 公开/授权日:2020-05-01