-
公开(公告)号:CN119360270B
公开(公告)日:2025-04-25
申请号:CN202411385193.7
申请日:2024-09-30
Applicant: 北京邮电大学
Abstract: 本发明提供了一种基于骨骼点的时空域优化实时人体动作计数方法,用于对多媒体实时视频智能分析中。本发明方法包括:根据不同动作的标准示范视频对应生成若干条动作字典条目,每条目包含动作索引,骨骼点‑动作状态值的映射函数,理想时间‑动作状态波形,不同稠密采样的期望关键帧序列;对输入的视频流识别每个动作视频,对动作视频识别动作类型,根据关键帧序列对视频提取关键帧,并根据提取的关键帧的状态值动态调整所使用的期望关键帧序列,最后基于所提取的关键帧判断动作是否合格;进行动作计数直到视频流中断或结果,输出计数结果。本发明可实现动作内容可知的实时人体动作计数,且保证了足够高的精确度,识别的动作种类具有高可拓展性。
-
公开(公告)号:CN119149778B
公开(公告)日:2025-05-09
申请号:CN202411277266.0
申请日:2024-09-12
Applicant: 北京邮电大学
IPC: G06F16/783 , G06F16/74 , G06F16/738 , G06V20/40 , G06V10/82
Abstract: 本发明公开了一种视频集片段检索的错误依赖消除方法,属于多模态数据检索领域。本发明方法包括:对VCMR模型当前应用的视频数据集进行重分割,在重分割的数据集上通过分布外测试评估该VCMR模型对视频数据集中目标时域位置的偏置依赖程度,若模型的性能相比于原数据集明显下降,则表示模型对数据集中的偏置产生了明显的错误依赖;构造结构化归因模型分析模型的推理路径,通过归因介入调整模型的推理路径,缓解和消除VCMR模型对目标时域位置的错误偏置依赖。本发明方法实现对模型在不同分布的数据集上泛化能力的公平测试,能修正对数据集偏置进行错误依赖的原有推理路径,显著提高了模型在不同分布数据集上的检索和泛化能力。
-
公开(公告)号:CN119360270A
公开(公告)日:2025-01-24
申请号:CN202411385193.7
申请日:2024-09-30
Applicant: 北京邮电大学
Abstract: 本发明提供了一种基于骨骼点的时空域优化实时人体动作计数方法,用于对多媒体实时视频智能分析中。本发明方法包括:根据不同动作的标准示范视频对应生成若干条动作字典条目,每条目包含动作索引,骨骼点‑动作状态值的映射函数,理想时间‑动作状态波形,不同稠密采样的期望关键帧序列;对输入的视频流识别每个动作视频,对动作视频识别动作类型,根据关键帧序列对视频提取关键帧,并根据提取的关键帧的状态值动态调整所使用的期望关键帧序列,最后基于所提取的关键帧判断动作是否合格;进行动作计数直到视频流中断或结果,输出计数结果。本发明可实现动作内容可知的实时人体动作计数,且保证了足够高的精确度,识别的动作种类具有高可拓展性。
-
公开(公告)号:CN119149778A
公开(公告)日:2024-12-17
申请号:CN202411277266.0
申请日:2024-09-12
Applicant: 北京邮电大学
IPC: G06F16/783 , G06F16/74 , G06F16/738 , G06V20/40 , G06V10/82
Abstract: 本发明公开了一种视频集片段检索的错误依赖消除方法,属于多模态数据检索领域。本发明方法包括:对VCMR模型当前应用的视频数据集进行重分割,在重分割的数据集上通过分布外测试评估该VCMR模型对视频数据集中目标时域位置的偏置依赖程度,若模型的性能相比于原数据集明显下降,则表示模型对数据集中的偏置产生了明显的错误依赖;构造结构化归因模型分析模型的推理路径,通过归因介入调整模型的推理路径,缓解和消除VCMR模型对目标时域位置的错误偏置依赖。本发明方法实现对模型在不同分布的数据集上泛化能力的公平测试,能修正对数据集偏置进行错误依赖的原有推理路径,显著提高了模型在不同分布数据集上的检索和泛化能力。
-
-
-