-
公开(公告)号:CN103971103A
公开(公告)日:2014-08-06
申请号:CN201410220291.5
申请日:2014-05-23
Applicant: 西安电子科技大学宁波信息技术研究院
Abstract: 本发明涉及一种人数统计系统,其特征在于:包括人体目标检测模块和人体目标跟踪计数模块,其中人体目标检测模块包括:Kinect深度传感器,感兴趣目标检测模块,人脸目标检测模块;人体目标跟踪计数模块包括:目标模型集合,第一匹配模块,二匹配模块,和计数模块,用于对目标模型集合中的人体目标轮廓进行计数。与现有技术相比,本发明的优点在于:采用基于Kinect深度传感器进行人数统计的系统,统计结果比较精确,能适用于任何受控环境的场景,并能实时统计检测空间内的人数。
-
公开(公告)号:CN117493591A
公开(公告)日:2024-02-02
申请号:CN202311421259.9
申请日:2023-10-30
Applicant: 西安电子科技大学
IPC: G06F16/41 , G06F16/43 , G06F16/48 , G06N3/0464 , G06N3/08
Abstract: 本发明提供的一种基于提示嵌入的视频与文本跨模态哈希检索方法,涉及计算机技术领域,包括:获取待查询模态数据,将待查询模态数据通过相应符合条件的哈希学习模型转换成待查询哈希码;其中,符合条件的哈希学习模型包括:符合条件的VIT模型和符合条件的RoBERTa模型,符合条件的VIT模型用于视频模态数据的哈希码转换,符合条件的RoBERTa模型用于文本模态数据的哈希码转换;通过遍历的方式计算待查询哈希码与视频‑文本哈希码数据库中待匹配模态哈希码的汉明距离,通过汉明距离得到跨模态检索的输出。通过设计一个有效的跨模态映射,将不同模态的数据映射到一个共同的哈希空间,从而解决模态鸿沟问题,提高了视频与文本跨模态哈希检索的准确率。
-