-
公开(公告)号:CN116524596A
公开(公告)日:2023-08-01
申请号:CN202310507915.0
申请日:2023-05-08
申请人: 大连理工大学
IPC分类号: G06V40/20 , G06V20/40 , G06V10/40 , G06V10/62 , G06V10/764 , G06V10/80 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/08
摘要: 本发明属于计算机视觉与视频动作识别领域,公开了一种基于动作粒度分组结构的体育视频动作识别方法,提出了一种基于动作粒度的层次化分组结构,设计了一种轻量级的多尺度时空建模与信息融合机制。步骤如下:视频抽帧,分段随机帧采样,视频帧预处理,选取骨干网络,在骨干网络中插入动作粒度分组模块实现多尺度时空特征聚合,使用全连接层和softmax层进行类别预测,使用交叉熵损失对动作类别进行训练,训练及验证。通过使用本发明可有效的提取多粒度动作信息,适用于包含多层次类别的体育视频动作识别,并显著提高体育视频动作识别的精度。本发明作为一种基于动作粒度分组结构的体育视频动作识别方法,可广泛应用于体育视频动作识别领域。
-
公开(公告)号:CN114187655A
公开(公告)日:2022-03-15
申请号:CN202111430274.0
申请日:2021-11-29
申请人: 大连理工大学
IPC分类号: G06V40/20 , G06V40/10 , G06V10/774 , G06V10/762 , G06V10/74 , G06T7/66 , G06N3/08 , G06V10/82 , G06K9/62
摘要: 本发明属于人工智能与行人重识别领域,公开了一种基于联合训练策略的无监督行人重识别方法。针对摄像机间域间隙较大的问题,提出了一种摄像机间不变性特征学习方法,旨在让模型学习到可以区分不同摄像机下的不变性特征的能力。包括以下步骤:行人图像特征提取;聚类并分配伪标签;计算行人质心和摄像机质心;挖掘边缘特征和摄像机间不变性特征;行人实例特征和摄像机质心的更新;利用对比损失更新模型的参数。通过使用本发明可以有效的减少标签噪声,降低了摄像机间域间隙,并显著提高行人重识别的精度。本发明作为一种基于联合训练策略的无监督行人重识别方法,可广泛应用于行人重识别领域。
-
公开(公告)号:CN114187655B
公开(公告)日:2024-08-13
申请号:CN202111430274.0
申请日:2021-11-29
申请人: 大连理工大学
IPC分类号: G06V40/20 , G06V40/10 , G06V10/774 , G06V10/762 , G06V10/74 , G06T7/66 , G06N3/088 , G06V10/82
摘要: 本发明属于人工智能与行人重识别领域,公开了一种基于联合训练策略的无监督行人重识别方法。针对摄像机间域间隙较大的问题,提出了一种摄像机间不变性特征学习方法,旨在让模型学习到可以区分不同摄像机下的不变性特征的能力。包括以下步骤:行人图像特征提取;聚类并分配伪标签;计算行人质心和摄像机质心;挖掘边缘特征和摄像机间不变性特征;行人实例特征和摄像机质心的更新;利用对比损失更新模型的参数。通过使用本发明可以有效的减少标签噪声,降低了摄像机间域间隙,并显著提高行人重识别的精度。本发明作为一种基于联合训练策略的无监督行人重识别方法,可广泛应用于行人重识别领域。
-
公开(公告)号:CN116797966A
公开(公告)日:2023-09-22
申请号:CN202310516184.6
申请日:2023-05-09
申请人: 大连理工大学
IPC分类号: G06V20/40 , G06V40/10 , G06V10/40 , G06V10/82 , G06V10/80 , G06V10/764 , G06V10/774 , G06N3/0464 , G06N3/08 , G06N3/048 , G06N3/047
摘要: 本发明属于人工智能与视频行人重识别领域,公开一种基于注意力时空图网络的视频行人重识别方法,提出一种多粒度注意力时空图网络方法,旨在不破坏行人身体结构的同时关注前景信息,减少背景干扰,融合多粒度时态信息,同时抑制异常帧的特征表达。步骤如下:提取行人原始帧级特征;提取各帧级行人关键区域信息;提取全局分支特征;多粒度空间注意力图网络更新帧级特征;多粒度时间注意力图网络获取行人视频序列级特征;损失函数训练网络。通过使用本发明可减少破坏身体结构,降低背景噪声的干扰,并抑制异常帧信息表达,显著提升视频行人重识别的性能。本发明作为一种基于注意力时空图网络的视频行人重识别方法,可广泛应用于视频行人重识别领域。
-
-
-