-
公开(公告)号:CN119314224A
公开(公告)日:2025-01-14
申请号:CN202411337275.4
申请日:2024-09-25
Applicant: 重庆邮电大学
IPC: G06V40/20 , G06V20/40 , G06V10/82 , G06V10/80 , G06N3/0464 , G06N3/045 , G06N3/0985
Abstract: 本发明涉及一种基于小样本学习的第一人称行为识别方法和装置,包括遵循小样本学习设置,通过第一人称视频样本构建元训练任务和元测试任务;利用元训练任务对第一人称行为识别模型进行元训练,其中,所述第一人称行为识别模型包括:特征提取模块和集合匹配度量模块;所述特征提取模块用于提取第一人称视频样本的多尺度视频特征;所述集合匹配度量模块用于根据第一人称视频样本的多尺度视频特征计算查询集中第一人称视频样本和支持集的匹配分数,并根据匹配分数识别用户的行为类别;利用训练好的第一人称行为识别模型对元测试任务进行用户行为识别,本发明能够提高模型的泛化能力和识别准确率,减小模型训练的计算量。
-
公开(公告)号:CN118570718A
公开(公告)日:2024-08-30
申请号:CN202410583947.3
申请日:2024-05-11
Applicant: 重庆邮电大学
IPC: G06V20/52 , G06V10/26 , G06V10/25 , G06V10/28 , G06V10/764 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/084 , G06N3/0985
Abstract: 本发明涉及一种基于元学习的跨场景测试时自适应人群计数方法和装置,包括:获取不同场景的图像,对每张图像进行标记,获得图像的密度图文件和分割图文件;在元学习框架下按图像的场景将获取的图像划分为元训练集和元测试集;利用元训练集和元测试集对人群计数模型进行元训练;对训练好的人群计数模型使用测试时自适应方法进行优化,通过优化后的人群计数模型对目标场景下的图像进行人群计数;本发明采用元学习和测试时自适应相结合的方式训练人群计数模型,使人群计数模型可以快速适应到新的目标场景,以提高人群计数模型在应用到目标场景下的识别准确率。
-
公开(公告)号:CN119152576A
公开(公告)日:2024-12-17
申请号:CN202411307539.1
申请日:2024-09-19
Applicant: 重庆邮电大学
IPC: G06V40/20 , G06V20/70 , G06V10/80 , G06V10/62 , G06V10/82 , G06N3/042 , G06N3/0464 , G06N5/022 , G06N3/084 , G06N3/045
Abstract: 本发明属于图像处理与计算机视觉技术领域,涉及一种基于视觉语言模型和图卷积的第一人称行为识别方法,包括获取图像组数据集及其对应的标签提示词数据集;将标签提示词数据集、图像组数据集分别输入视觉语言模型CLIP的文本编辑器、视觉编辑器,得到文本特征集和视觉特征集;采用图卷积网络获取对偶融合知识图;对图像组数据集进行形状重塑后输入视觉编辑器得到重塑视觉特征;对重塑视觉特征进行形状重塑后输入时序融合模型得到时间视觉特征;将时间视觉特征与对偶融合知识图融合得到识别结果,根据识别结果计算损失反向传播训练;构建第一人称行为识别模型;采用第一人称行为识别模型进行识别;能够实现精确的行为识别。
-
-