一种多目标跟踪方法
    1.
    发明授权

    公开(公告)号:CN118247314B

    公开(公告)日:2024-08-16

    申请号:CN202410627421.0

    申请日:2024-05-21

    摘要: 本发明提供一种多目标跟踪方法,本方法包括采集若干包含有多人并进行运动的视频,并构建多目标跟踪训练集;获取每段视频中每一帧的关于人的标准跟踪队列并对应构建每段所述视频的标准跟踪队列集;通过基于Transformer模型构建多目标跟踪网络模型并获取每段所述视频的识别跟踪队列集,通过计算识别跟踪队列和标准跟踪队列的损失并更新得到训练好的所述多目标跟踪网络模型,通过所述训练好的所述多目标跟踪网络模型实现多目标的实时跟踪。与现有技术相比,本发明利用Transformer模型可以进行端到端的学习,且能够直接从原始数据中学习目标的运动模式,无需依赖目标检测器,使训练的模型能够有更高的计算效率,进而提高模型对多目标跟踪的实时性。

    用于远距离大透视畸变的标定板角点及角点编号确定方法

    公开(公告)号:CN117392161B

    公开(公告)日:2024-08-02

    申请号:CN202311442461.X

    申请日:2023-11-01

    IPC分类号: G06T7/13 G06T7/62 G06T7/73

    摘要: 本申请实施例提供了一种用于远距离大透视畸变的标定板角点及角点编号确定方法、装置、系统、计算机设备、存储介质和计算机程序产品。该方法包括:获取待检测图像;待检测图像包含相机标定板的相机标定板图像;获取待检测图像的二值化图像,并基于二值化图像,获取待检测图像对应的多个轮廓;在多个轮廓中获取相机标定板图像中的第一特征图案的第一轮廓和第二特征图案的第二轮廓;基于第一轮廓和第二轮廓,得到第一特征图案的多个角点,并获取第一特征图案的各角点的角点编号。该方法中,可以避免现有标定板以及基于标定板进行相机标定过程中产生的透视畸变问题,提高了远距离相机标定中的准确性。

    一种语音驱动三维人脸生成方法、系统及设备

    公开(公告)号:CN118229891A

    公开(公告)日:2024-06-21

    申请号:CN202410645944.8

    申请日:2024-05-23

    摘要: 本发明提供一种语音驱动三维人脸生成方法、系统及设备,所述方法包括:采集包含人脸并说话的视频样本,对所述视频样本提取视频数据和对应的音频数据;获取所述视频数据每一帧的三维人脸数据,并构建每个所述视频数据的标准四维人脸数据集和对应所述视频数据的三维人脸模板;提取所述音频数据的语音特征;与现有技术相比,本发明通过将提取到的所述音频数据的语音特征输入构建的语音驱动模型中进行训练,得到预测四维人脸数据集,并与基于所述视频数据获得的标准四维人脸数据集进行损失计算,能够在较少的训练样本的情况下,实现对模型的快速训练。

    一种基于多视角的3D人脸纹理融合方法

    公开(公告)号:CN117036214A

    公开(公告)日:2023-11-10

    申请号:CN202310532305.6

    申请日:2023-05-11

    摘要: 本申请提供一种基于多视角的3D人脸纹理融合方法,所述方法包括:获取多张单目图像,其中,所述单目图像为人脸的正脸图像、左侧脸图像、右侧脸图像中的一种,所述多张单目图像至少包括一张所述正脸图像,一张所述左侧脸图像与一张右侧脸图像;根据所述单目图像生成多个第一人脸模型,所述第一人脸模型包括真实纹理;根据所述第一人脸模型生成预测纹理图;将所述预测纹理图与真实纹理融合,得到多个纹理图;根据多个所述第一人脸模型生成多个纹理掩膜;根据多个纹理掩膜与多个纹理图生成目标图,根据所述目标图生成第二人脸模型。

    一种低数据成本的人脸识别的方法及装置

    公开(公告)号:CN113378660B

    公开(公告)日:2023-11-07

    申请号:CN202110569931.3

    申请日:2021-05-25

    IPC分类号: G06V40/16 G06T5/50

    摘要: 本发明公开了一种低数据成本的人脸识别的方法,构建KSlope‑curve转换器并对KSlope‑curve转换器进行训练;进行人脸识别的时候就可以通过转换器将人脸特征转成KSlope‑curve曲线,通过计算曲线之间斜率分布的均方差误差实现人脸识别的数据计算,本发明对算法网络结构不做任何操作,不会增加任何额外的计算量。该技术通过一个特殊的转换器对原始人脸进行加工处理,转化成一种更为容易识别的曲线来辅助进行人脸识别,该曲线是通过深度学习中的图像技术和音频技术共同生成,相较于人脸有着特征明显、易识别、抗噪性强等优点,只需要用百万级人脸数据就能达到千万级人脸数据训练的效果,对于侧脸、强光、逆光、低头这种困难人脸也有很好的识别效果。

    一种基于生成对抗网络的面部纹理补全方法

    公开(公告)号:CN116993892A

    公开(公告)日:2023-11-03

    申请号:CN202310892649.8

    申请日:2023-07-20

    摘要: 本申请提供一种基于生成对抗网络的面部纹理补全方法,涉及图像处理技术领域。该方法包括如下步骤:S101图像获取:获取2D人脸图像信息,基于所述2D人脸信息和多组相机参数生成多个视角下的3D渲染图像;S102图像补全:利用生成对抗网络对所述步骤S101中任意一个视角下的3D渲染图像进行缺失人脸纹理图像补全后,生成特定视角下的人脸补全纹理图像;S103图像融合:将步骤S102中特定视角下的人脸补全纹理图像进行融合处理,得到完整的人脸纹理图像。其能够通过生成对抗网络重建对任意视角下的3D渲染图像并对其进行纹理补充,然后再将纹理补全的图像进行融合,得到完整的人脸纹理图,该方法不需要大规模纹理数据集,不仅操作简单而且还降低了使用成本。

    常规定点定焦摄像头的人像跟踪锁定及人像放大的方法

    公开(公告)号:CN116012906A

    公开(公告)日:2023-04-25

    申请号:CN202211559099.X

    申请日:2022-12-06

    发明人: 张磊 李创成 林伟

    IPC分类号: G06V40/16 G06T7/292 G06T3/40

    摘要: 本发明公开了一种基于常规定点定焦摄像头的人像跟踪锁定及人像放大的方法,所述方法包括如下步骤:步骤1,通过常规定点定焦摄像头进行人脸检测,获取到视频图像中的所有的人脸区域坐标框;步骤2,剔除人脸检测算法的误检、漏检造成的外接框闪烁,通过人脸标记方法记录连续帧中人脸出现及丢失的次数,从而减少漏检误检造成的波动影响;步骤3,对人脸框放大及外接框计算,先根据所有人脸坐标框,计算出最小外接矩形框;步骤4,对外接人脸框进行欧元滤波及跟踪处理,使用两种不同的滤波算法对计算出的外接框进行滤波处理;步骤5,调整外接框的宽高比到与输入图像的宽高比一致;步骤6,对图像进行渐变缩放并填充缩放队列。

    一种低分辨率的实时手势识别方法

    公开(公告)号:CN115797976A

    公开(公告)日:2023-03-14

    申请号:CN202310039359.9

    申请日:2023-01-12

    发明人: 李观喜 张磊 苏鹏

    摘要: 本发明公开了一种低分辨率的实时手势识别方法,添加特征融合模块对高分辨率教师模型和低分辨率教师模型进行特征融合,使高分辨教师模型的颈部网络内的特征层尺度与低分辨率教师模型的颈部网络内的特征层尺度匹配,本发明为面向于移动端、嵌入式设备的一种低分辨率的实时手势识别方法。通过将两个模型特征图对齐的方式,解决高分辨率模型和低分辨率模型之间的特征图不匹配的问题,训练一个高精度的多分辨率模型,以高精度的多分辨率模型作为教师模型,低分辨率模型作为学生模型,结合知识蒸馏的方法,使用教师模型对学生模型进行特征指导,实现学生模型与教师模型的性能一致,并结合轻量级主干网络,对模型进一步的加速。

    基于黑盒通用人脸检测对抗攻击的方法、装置及存储介质

    公开(公告)号:CN112766430B

    公开(公告)日:2022-01-28

    申请号:CN202110026619.X

    申请日:2021-01-08

    摘要: 本发明公开了一种基于黑盒的通用人脸检测对抗攻击的方法,将图片进行预处理之后送入人脸检测器,得到模型预测的分类分数。这个分类分数是一个三维的向量,其中第一个维度是图片的数量;第二个维度为N个预测可能存在的人脸;第三个维度为2,是非人脸和人脸的概率分数。使用提取的人脸概率向量,在每一次迭代中将图片依次送入这些模型提取人脸概率向量并进行求和作为损失函数并反向传播来访问攻击图像的梯度。通过图像的梯度,可知模型在图像的最大响应位置并添加噪声,直到人脸检测器无法检测到人脸,停止迭代。通过本方法生成的对抗样本可用于对抗训练,人脸图片不容易再被第三方进行利用从而加强数据安全,从而加强数据的安全性。

    一种基于深度学习的体感游戏跟踪方法及装置

    公开(公告)号:CN113377192A

    公开(公告)日:2021-09-10

    申请号:CN202110551769.2

    申请日:2021-05-20

    摘要: 本发明公开了一种基于深度学习的体感游戏跟踪方法,通过使用深度或者单目体感摄像机不断地进行图片采集以实现行人检测以及人体关键点检测;构建滤波器,对帧数为t‑1时刻的图片每个行人检测框以及对应的人体关键点坐标建立状态向量x_(t‑1),并利用滤波器预测当前t时刻的状态结果x_(t),最后利用t时刻真实的观测结果对t‑1时刻的状态进行更新;确定行人跟踪以及所有行人ID号;选取游戏操作者的ID号,判断游戏操作者的ID号是否存在于跟踪的结果中;确定游戏操作者,根据的结果,选取游戏操作者的ID号对应的行人作为游戏操作者,选定了游戏操作者后即可通过不断的循环跟踪该游戏操作者,从而使体感游戏系统能够稳定并且准确地识别游戏的操作者。