一种单目标视频跟踪方法、装置、存储介质及设备

    公开(公告)号:CN117333514A

    公开(公告)日:2024-01-02

    申请号:CN202311636539.1

    申请日:2023-12-01

    Abstract: 本申请公开了一种单目标视频跟踪方法、装置、存储介质及设备,该方法包括:首先在获取到包含待跟踪的单目标对象的目标视频后,从目标视频中确定出包含第一帧图像对应的图像跟踪模板的M张图像跟踪模板,然后提取M张图像跟踪模板的模板图像特征,以及提取目标视频中每一帧搜索图像的搜索图像特征,并将模板图像特征和搜索图像特征输入预先构建的编码器网络进行编码,得到编码特征;接着将编码特征和开始标志位向量输入预先构建的解码器网络进行解码,预测出编码特征对应的搜索图像中单目标对象的位置和尺寸,从而能够提高目标视频中每一帧搜索图像中对于单目标视频跟踪结果的准确性。

    图像处理方法、装置、设备及存储介质

    公开(公告)号:CN116883700A

    公开(公告)日:2023-10-13

    申请号:CN202310798362.9

    申请日:2023-06-29

    Abstract: 本申请提供了图像处理方法、装置、设备及存储介质,具体实现方案为:获取第一图像中的各个图形元素的属性信息,所述各个图形元素构成所述第一图像中的第一图形对象,根据所述第一图像中的各个图形元素的属性信息,确定所述第一图形对象的图结构信息,以及,获取第二图像中的第二图形对象的图结构信息;至少根据所述第一图形对象的图结构信息,以及所述第二图形对象的图结构信息,从所述第二图形对象中确定出与所述第一图形对象匹配的图形区域。根据本申请的技术方案,能够有效提升拼图图像匹配的准确性。

    人脸跟踪方法、装置、电子设备及存储介质

    公开(公告)号:CN116051604A

    公开(公告)日:2023-05-02

    申请号:CN202310074684.9

    申请日:2023-01-16

    Abstract: 本发明提供一种人脸跟踪方法、装置、电子设备及存储介质,所述方法包括:获取视频帧序列中的当前帧,并判断所述当前帧的类型;若所述当前帧是检测帧,则对所述检测帧进行人脸检测,并根据人脸检测的结果进行不同处理,包括:未检出人脸时根据人脸关键点信息执行相似度计算,以及检出人脸时根据深度信息选择最优人脸;若所述当前帧是跟踪帧,则对所述跟踪帧进行人脸标定,并根据人脸标定的结果对当前帧的人脸关键点信息和上一帧的人脸关键信息的相似度计算;当所述检测帧或所述跟踪帧执行相似度计算的结果满足第一预设要求时,获取跟踪框以执行跟踪操作。由于引入了相似度和人脸区域深度信息,使得本发明即使在复杂的场景下,也能实现正确跟踪。

    基于多任务的座舱内行为检测方法、装置以及设备

    公开(公告)号:CN115546875B

    公开(公告)日:2023-04-04

    申请号:CN202211381696.8

    申请日:2022-11-07

    Abstract: 本发明公开了一种基于多任务的座舱内行为检测方法、装置以及设备,座舱内行为检测方法包括:接收座舱内的实时图像;识别所述实时图像中的人脸区域,扩大所述人脸区域形成的第一外轮廓,并提取扩大后的第一外轮廓所围区域的图像,作为输入图像;将所述输入图像输入多线索识别模型,获得每个目标行为的第一检测结果;所述多线索识别模型中,每个目标行为对应一个线索;对每个目标行为的第一检测结果进行分析,并判断是否满足提醒条件;若满足,则输出针对所述目标行为的提醒信息。本发明既充分利用了人脸全图语义信息,降低了误触发率,又减少了识别模型的数量,大大提高了车机的运行效率。

    一种座舱内手势交互方法及装置

    公开(公告)号:CN115424356B

    公开(公告)日:2023-04-04

    申请号:CN202211381906.3

    申请日:2022-11-07

    Abstract: 本发明公开了一种座舱内手势交互方法及装置,座舱内手势交互方法包括:接收座舱内的实时图像;将实时图像输入手势识别模型,获得手势识别模型输出的第一手势类别检测结果和第一位置类别检测结果;依据第一座舱位置上第一手势对应的控制指令控制座舱内的设备;其中,对于不同的第一座舱位置,相同的第一手势对应的控制指令不同。本发明通过手势识别模型直接获得手势类别检测结果,避免两阶段手势识别导致的车机工作压力,并通过识别手势动作人所在的座舱位置,为不同座舱位置上的相同手势配置不同的功能,提高了手势交互的丰富度。

    基于流式图像的手势识别模型训练方法、装置及电子设备

    公开(公告)号:CN115761892A

    公开(公告)日:2023-03-07

    申请号:CN202211486388.1

    申请日:2022-11-24

    Abstract: 本发明公开了一种基于流式图像的手势识别模型训练方法、装置及电子设备,本发明的主要构思在于,一方面通对连续帧图像进行信息流式读取、特征流式提取、结果流式输出,使得训练过程接近真实的应用场景,消除了训练与推理不匹配问题,使得训练过程更接近实际应用部署;另一方面在上述流式基础训练模式下,提出以此方式训练第一、第二手势识别模型,且在该第一、第二手势识别模型之间建立预设的互学习策略,使得用于最终部署的仅依据历史图像信息的第二手势识别模型能够具备预测未来信息的能力,从而既提升了手势识别模型的识别效果,又保障了推理效率更为接近实时,进而能够有效提升人机交互中手势交互的可用性。

    基于多任务的座舱内行为检测方法、装置以及设备

    公开(公告)号:CN115546875A

    公开(公告)日:2022-12-30

    申请号:CN202211381696.8

    申请日:2022-11-07

    Abstract: 本发明公开了一种基于多任务的座舱内行为检测方法、装置以及设备,座舱内行为检测方法包括:接收座舱内的实时图像;识别所述实时图像中的人脸区域,扩大所述人脸区域形成的第一外轮廓,并提取扩大后的第一外轮廓所围区域的图像,作为输入图像;将所述输入图像输入多线索识别模型,获得每个目标行为的第一检测结果;所述多线索识别模型中,每个目标行为对应一个线索;对每个目标行为的第一检测结果进行分析,并判断是否满足提醒条件;若满足,则输出针对所述目标行为的提醒信息。本发明既充分利用了人脸全图语义信息,降低了误触发率,又减少了识别模型的数量,大大提高了车机的运行效率。

    基于视频的物体平面贴图方法、装置以及设备

    公开(公告)号:CN112712571A

    公开(公告)日:2021-04-27

    申请号:CN202011566751.1

    申请日:2020-12-25

    Abstract: 本发明公开了一种基于视频的物体平面贴图方法、装置以及设备。本发明在用户参与交互的前提下不再要求复杂的操作以完成平面选择,而是通过第一阶段由视频物体平面检测技术结合用户简单的交互操作初步选择出候选平面区域,以及第二阶段根据候选平面区域在多帧图像中的图像特征判定出候选平面区域是否可用,从而实现待贴图平面的确定,本发明既可以极大简化用户交互流程的复杂度,又可以全面、可靠地获得待贴图平面区域的特征信息,并且利用图像自身信息进行植入可靠性判断,能够有效规避由于缺乏相关技术知识所带来的处理效果偏差。可见本发明在优化用户体验的同时,能够高效、便捷地确定出待贴图平面,进而极大提升图像植入的稳定性和有效性。

Patent Agency Ranking