图文多模态模型的知识蒸馏方法、图像处理方法及设备

    公开(公告)号:CN118587562B

    公开(公告)日:2024-10-22

    申请号:CN202411073162.8

    申请日:2024-08-06

    摘要: 本申请公开了一种图文多模态模型的知识蒸馏方法、图像处理方法及设备,方法包括:将样本图像输入至多模态模型的第一图像编码器,得到第一图像特征,将提示文本输入至多模态模型的文本编码器,得到文本特征;将样本图像输入至图像处理模型的第二图像编码器,得到第二图像特征;计算第一图像特征和第二图像特征之间的图像对齐损失;以及,计算文本特征和第二图像特征之间的图文对齐损失;基于图像对齐损失和图文对齐损失训练图像处理模型,可以分别从两个不同模态维度对图像处理模型的第二图像编码器进行蒸馏训练,使得图像处理模型的第二图像编码器可以理解复杂的文本语义信息,提升第二图像编码器的收敛速度,保证图像处理模型的图像处理效果。

    一种流动摊位检测方法、装置、电子设备及存储介质

    公开(公告)号:CN113723226B

    公开(公告)日:2024-09-06

    申请号:CN202110932893.3

    申请日:2021-08-13

    摘要: 本申请公开了一种流动摊位检测方法、装置、电子设备及存储介质,该方法包括:获取待检测图像;对待检测图像中待检测摊位的摊位类型、载体类型以及附属物类型中的至少两种对象进行检测,确定至少两种对象的检测结果;载体类型为待检测摊位中承载物品的载体的类型,附属物类型为待检测摊位相关联的附属物的类型;基于至少两种对象的检测结果,确定待检测摊位是否为流动摊位。因此,本申请在摊位检测过程中,通过结合摊位类型、载体类型以及附属物类型中的至少两种对象,提高了流动摊位检测的准确度。

    一种目标检测方法、装置以及计算机存储介质

    公开(公告)号:CN118279576A

    公开(公告)日:2024-07-02

    申请号:CN202410713699.X

    申请日:2024-06-04

    摘要: 本申请公开了一种目标检测方法、装置以及计算机存储介质,该目标检测方法包括:获取待检测图像;通过目标检测网络获取所述待检测图像的第一目标检测框;通过运动检测网络获取所述待检测图像的第二目标检测框;根据所述第一目标检测框和所述第二目标检测框获取所述待检测图像的前景图像;将所述前景图像输入目标分类网络,输出所述待检测图像的目标分类结果。通过上述方式,有效地从背景中提取前景目标,相较于传统的目标检测,本申请的目标检测方法能够检测目标像素更小、画面对比度更低的目标。

    电梯内电瓶车的报警方法及相关装置

    公开(公告)号:CN111439644A

    公开(公告)日:2020-07-24

    申请号:CN202010130375.5

    申请日:2020-02-28

    IPC分类号: B66B5/00 G06K9/00

    摘要: 本申请提供电梯内电瓶车的报警方法及其相关装置。电梯内电瓶车的报警方法包括:持续获取电梯的内景图像,得到内景图像序列;利用目标检测网络算法检测内景图像中的目标,利用目标分类网络算法对所检测到的目标进行分类,判断所检测到的目标中是否存在电瓶车目标;目标分类网络算法中包括电瓶车类别和自行车类别;检测内景图像序列中电瓶车目标的相关信息是否满足预设要求;若是,则进行报警相关操作。本申请的方法可以保证电瓶车检测的准确性。

    快件的滞留检测方法、电子设备以及存储介质

    公开(公告)号:CN118247723A

    公开(公告)日:2024-06-25

    申请号:CN202410160569.8

    申请日:2024-02-04

    摘要: 本申请公开了一种快件的滞留检测方法、电子设备以及存储介质。快件的滞留检测方法包括:获取对物流传送带中的目标检测区域采集到的目标图像组,目标图像组中存在不同时刻采集到的若干初始图像;确定目标图像组中各相邻图像之间的差值特征;基于各相邻图像之间的差值特征确定目标图像组的目标检测结果,目标检测结果中包括快件在物流传送带中的位置;响应于目标检测结果与历史目标检测结果之间的差异小于或等于预设差异,确定快件在物流传送带中滞留,其中,历史目标检测结果为历史目标图像组对应的目标检测结果,历史目标图像组为在获取目标图像组之前对目标检测区域采集得到。上述方案,能够提高确定快件滞留的准确度。

    目标检测方法及装置、存储介质、处理设备

    公开(公告)号:CN114463536A

    公开(公告)日:2022-05-10

    申请号:CN202111675330.7

    申请日:2021-12-31

    摘要: 本申请涉及一种目标检测方法及装置、存储介质、处理设备,所述方法包括:确定对象图像区域,所述对象图像区域基于待检测图像中的目标对象得到;从所述对象图像区域中确定出参考图像区域,所述参考图像区域为所述对象图像区域的子图像区域;基于所述对象图像区域与所述参考图像区域,确定所述对象图像区域中所述目标对象的数量。本申请可以根据所述对象图像区域中与所述参考图像区域相匹配的图像区域数量,确定所述对象图像区域中所述目标对象的数量,使得确定的所述目标对象的数量更加准确。

    车辆抛撒物检测方法、装置、电子装置和存储介质

    公开(公告)号:CN114463263A

    公开(公告)日:2022-05-10

    申请号:CN202111615410.3

    申请日:2021-12-27

    IPC分类号: G06T7/00 G06T7/70

    摘要: 本申请涉及一种车辆抛撒物检测方法、装置、电子装置和存储介质。其中,该车辆抛撒物检测方法包括:获取目标拍摄场景的参考背景图和待处理图像帧;基于待处理图像帧的非感兴趣区域对参考背景图进行更新,得到目标背景图,其中,非感兴趣区域包括待处理图像帧中除待处理车辆区域和待处理物体区域以外的其他区域;确定目标背景图中与待处理物体区域的位置信息相同的目标物体区域;基于目标物体区域与待处理物体区域的特征相似度,确定待处理物体区域中是否包含抛撒物。通过本申请,避免了在高速场景车辆速度较快且车辆存在严重的相互遮挡的情况下抛撒物被遮挡,而导致抛撒物检出率低的问题,从而提高了抛撒物检出率。

    一种电动车检测、报警方法、装置、设备、介质及系统

    公开(公告)号:CN113470011A

    公开(公告)日:2021-10-01

    申请号:CN202110857203.2

    申请日:2021-07-28

    摘要: 本发明公开了一种电动车检测、报警方法、装置、设备、介质及系统,包括:获取监控区域内的图像,将所述图像输入预先训练完成的电动车检测模型,基于所述电动车检测模型检测所述图像中车辆的车身整体检测框和车身局部检测框,并基于所述车身整体检测框确定对应的车辆的粗类别信息,以及基于所述车身局部检测框确定对应的车辆的局部特征信息;基于所述车辆的粗类别信息和所述车辆的局部特征信息,确定所述车辆是否为电动车。相较于现有技术中的方案,增加了车辆局部特征信息这一特征,更加能够体现电动车与其它车辆的区别,使得电动车的误检率降低,从而提高了电动车检测的准确性。

    目标检测方法、设备及存储介质
    10.
    发明公开

    公开(公告)号:CN118708744A

    公开(公告)日:2024-09-27

    申请号:CN202411200800.8

    申请日:2024-08-29

    摘要: 本申请公开了一种目标检测方法、设备及存储介质,该目标检测方法包括:获取待检索图像、对象描述文本和对象检索条件,其中,对象描述文本用于描述待检索对象,对象检索条件包括待检索对象对应的掩码图像和/或待检索对象对应的姿态和/或待检索对象对应的纹理;对待检索图像进行编码处理,得到图像编码结果;对对象描述文本进行编码处理,得到文本编码结果;对对象检索条件进行编码处理,得到条件编码结果;结合文本编码结果和条件编码结果对图像编码结果进行解码处理,得到待检索图像中待检索对象的目标位置。从多维度对待检索对象进行描述和限定,结合对象描述文本和一个或多个对象检索条件,得到准确的目标检索结果。