基于Transformer的多视角图像目标检测方法

    公开(公告)号:CN120014246A

    公开(公告)日:2025-05-16

    申请号:CN202510242469.4

    申请日:2025-03-03

    Abstract: 本发明公开了一种基于Transformer的多视角图像目标检测方法,涉及图像处理方法技术领域。所述方法包括如下步骤:首先,对输入的左相机的图像和右相机的图像通过主干网络提取多尺度特征,主干网络之间参数共享;随后,将提取的图像多尺度特征输入到多视角图像目标检测模块之中进行处理,多视角图像目标检测模块包括两大部分:混合编码器模块和特征查询模块,依次进行编码操作以生成图像特征序列,以及特征查询对序列进行筛选,生成更具有语义信息的新图像特征序列;最后,通过基于Transformer的解码器以及检测头,用于进行解码操作和最终预测,得到多视角下的图像检测结果。所述方法能够得到更为丰富精细的图像特征序列,更多的关注高尺度特征,并更好地开展检测。

    基于轨迹引导的多目标跟踪方法
    2.
    发明公开

    公开(公告)号:CN119722741A

    公开(公告)日:2025-03-28

    申请号:CN202411840657.9

    申请日:2024-12-13

    Abstract: 本发明公开了一种基于轨迹引导的多目标跟踪方法,所述方法包括如下步骤:通过目标检测器对视频帧进行检测,获取目标人物的外观信息和位置信息,同时保留高置信度检测框和低置信度检测框,初始化轨迹;根据轨迹位置信息对下一帧中目标人物位置进行预测,卡尔曼滤波器预测阶段使用校正后的状态向量和协方差矩阵;根据运动相似性、外观相似性和速度方向计算代价矩阵将高置信度检测框与所有目标候选框进行第一次匹配,之后利用运动相似性和速度方向计算代价矩阵将未匹配的目标候选框和低置信度检测框之间执行第二次匹配;对匹配结果进行统一管理,输出目标轨迹信息。本发明能够实现端到端的多目标跟踪算法,提升跟踪的实时率和准确率。

    一种姿势引导对齐的轻量行人重识别方法

    公开(公告)号:CN115830643A

    公开(公告)日:2023-03-21

    申请号:CN202310130976.X

    申请日:2023-02-17

    Abstract: 本发明公开了一种姿势引导对齐的轻量行人重识别方法,所述方法包括以下步骤:使用主干网络和显著区域提取聚焦行人图像关键区域进行特征增强并得到全局特征;使用姿势估计算法进行行人图像的关键点检测并获取关键点局部特征;通过特征聚合模块对关键点局部特征进行聚合和对齐,并使用全局特征进行特征弥补;通过交叉图匹配模块,对输入行人图像的特征进行匹配,得到图像相互匹配的区域,并将得到的特征计算相似度;构建损失函数,对网络参数进行迭代优化;进行相似性度量,输出匹配列表。本发明高效地提取了行人图像的鲁棒的特征,有效的解决了特征非对齐问题,在保持模型参数量的同时达到了优异的行人重识别性能。

    一种基于双流网络的三维人体重建方法

    公开(公告)号:CN116934972A

    公开(公告)日:2023-10-24

    申请号:CN202310925356.5

    申请日:2023-07-26

    Abstract: 本发明为一种基于双流网络的三维人体重建,属于图像处理技术领域,提取图片特征网络,将图像I作为网络的输入,以残差网络作为特征提取器,将图像I转换为图像特征A;三维关节点预测网络,从图像I中选择与与SMPL参数位置相似的二位关节点J2D,通过全连接层,将二位关节点J2D与全连接层输出合并为三维关节点J3D;迭代回归网络,输入图像特征A、三维关节点J3D及SMPL模板形状参数β0、姿势参数θ0和初始相机参数C0,用三个全连接网络连接W0,生成对应维度的三个分量用形状参数β0、姿势参数θ0和初始相机参数C0逐位相加得到第一阶段输出形状参数β1、姿势参数θ1和初始相机参数C1,以此类推,得到β3、姿势参数θ3和初始相机参数C3,应用本方法可以降低误差,具有更好的预测效果。

    一种基于多模态信息学习的专家推荐方法

    公开(公告)号:CN114662652A

    公开(公告)日:2022-06-24

    申请号:CN202210155520.4

    申请日:2022-02-21

    Abstract: 本发明公开一种基于多模态信息学习的专家推荐方法,爬取网络专家信息数据和项目信息数据,并整理现有专家库中的专家信息数据;构建专家评审异构图和专家属性异构图;bert模型对专家的文本信息进行学习,图神经网络对专家的属性异构图进行学习,搭建自注意力推荐模型对专家历史评审序列进行学习,将学习到的嵌入输入融合层得到专家信息嵌入,得到预训练模型;用预训练模型提取专家信息嵌入,对项目信息编码获得项目信息嵌入,将获得的专家属性表示与项目信息表示输入多层感知机对模型训练,得到专家与项目的推荐分数。本发明将丰富的语义和属性信息充分融入到专家的嵌入和模型参数中,提升专家推荐的准确率。

    一种基于双流网络的三维人体重建方法

    公开(公告)号:CN116934972B

    公开(公告)日:2024-09-17

    申请号:CN202310925356.5

    申请日:2023-07-26

    Abstract: 本发明为一种基于双流网络的三维人体重建,属于图像处理技术领域,提取图片特征网络,将图像I作为网络的输入,以残差网络作为特征提取器,将图像I转换为图像特征A;三维关节点预测网络,从图像I中选择与与SMPL参数位置相似的二位关节点J2D,通过全连接层,将二位关节点J2D与全连接层输出合并为三维关节点J3D;迭代回归网络,输入图像特征A、三维关节点J3D及SMPL模板形状参数β0、姿势参数θ0和初始相机参数C0,用三个全连接网络连接W0,生成对应维度的三个分量用形状参数β0、姿势参数θ0和初始相机参数C0逐位相加得到第一阶段输出形状参数β1、姿势参数θ1和初始相机参数C1,以此类推,得到β3、姿势参数θ3和初始相机参数C3,应用本方法可以降低误差,具有更好的预测效果。

Patent Agency Ranking