文本视频检索方法、装置、设备及存储介质

    公开(公告)号:CN117009407A

    公开(公告)日:2023-11-07

    申请号:CN202211483923.8

    申请日:2022-11-24

    摘要: 本申请涉及计算机领域,特别涉及了人工智能领域,提供了一种文本视频检索方法、装置、设备及存储介质。该方法包括:分别对表征检索信息的第一对象,以及对检索集中的各第二对象进行特征提取,获得相应的第一特征集与各第二特征集;其中,当第一对象或各第二对象为视频时,将各视觉原型的原型特征作为一个第一特征或一个第二特征;通过匹配第一特征集与各第二特征集,获得与第一对象关联的目标检索对象。利用每个视频块对不同视觉原型的关注度,基于各视频块的目标视频特征及各目标视频特征对同一视觉原型的贡献程度,生成能够表征视频中丰富信息的多个原型特征,以达到降低视频与文本之间的映射模糊性,提高检索准确率。

    步态识别方法、装置、设备及存储介质

    公开(公告)号:CN110705438B

    公开(公告)日:2023-07-25

    申请号:CN201910922345.5

    申请日:2019-09-27

    摘要: 本申请实施例公开了一种步态识别方法、装置、设备及存储介质,属于计算机技术领域。方法包括:获取目标视频中包括同一人体的多个视频帧;获取所述多个视频帧的步态轮廓图,所述步态轮廓图的排列顺序与所述步态轮廓图对应的视频帧的排列顺序相同;根据多个步态轮廓图中的至少两个步态轮廓图进行融合,得到至少一个融合特征图,所述至少两个步态轮廓图相邻;根据所述至少一个融合特征图进行识别,得到所述目标视频对应的识别信息。在对步态轮廓图进行处理时,会得到步态的静态特征和动态特征,根据得到的静态特征和动态特征进行识别,从而提高了识别结果的准确率。

    文本图像匹配方法、装置、计算机设备及存储介质

    公开(公告)号:CN113516143B

    公开(公告)日:2024-08-27

    申请号:CN202011350030.7

    申请日:2020-11-26

    摘要: 本申请是关于一种文本图像匹配方法、装置、计算机设备及存储介质,属于图像处理技术领域。该方法包括:获取第一特征以及第二特征;第一特征是由第一文本包含的至少两种尺度的文本特征经过编码得到的;第二特征是由第一图像包含的至少两种尺度的图像特征经过编码得到的,获取第一特征与第二特征之间的第一特征相似度;基于第一特征相似度,对第一特征以及第二特征进行加权,获得第一加权特征以及第二加权特征;基于第一特征、第二特征、第一加权特征以及第二加权特征,获取第一文本与第一图像的第二特征相似度;基于第二特征相似度,获取匹配信息。通过上述方案,提高了文本图像特征匹配的准确度。

    一种对象重识别方法及装置

    公开(公告)号:CN112052771B

    公开(公告)日:2024-08-27

    申请号:CN202010896120.X

    申请日:2020-08-31

    摘要: 本申请公开一种对象重识别方法及装置;本申请与人工智能的计算机视觉以及云技术领域相关,可以获取目标区域内多个对象样本图像和每一对象样本图像的样本标签和时空信息;根据多个对象样本图像构建无向图,无向图包括相互连接的图像节点,图像节点包括对象样本图像的图像特征;基于目标区域内的时空概率分布、以及多个对象样本图像的图像特征和时空信息,确定无向图中相邻图像节点之间的时空转移概率和图像相似度;基于神经网络模型、时空转移概率、图像相似度以及多个对象样本图像的图像特征和样本标签,对神经网络模型的网络参数进行调整,以通过训练后的神经网络模型对多个待识别对象图像进行对象重识别;本申请能提升对象重识别的准确率。

    图像分析方法、装置、存储介质、电子设备及产品

    公开(公告)号:CN117009567A

    公开(公告)日:2023-11-07

    申请号:CN202211656730.8

    申请日:2022-12-22

    发明人: 洪泽波 张均 任博

    摘要: 本申请公开了一种图像分析方法、装置、存储介质、电子设备及产品,涉及人工智能技术领域,本申请可以应用于区块链、云技术及地图车联网等领域,该方法包括:获取待分析图像及任务信息,任务信息包括描述任务信息以及问答任务信息中至少一种;将待分析图像及任务信息输入图像分析模型进行分析处理,得到分析结果,分析结果包括图像描述信息及图像问答信息中至少一种,其中,图像分析模型为采用图像样本及对应的预处理描述数据与预处理问答数据进行多任务联合训练得到的。本申请可以有效降低图像分析成本且提升图像描述任务和图像问答任务的分析结果的准确性。

    视频中的动作检测方法和装置、存储介质及电子设备

    公开(公告)号:CN116959091A

    公开(公告)日:2023-10-27

    申请号:CN202211476077.7

    申请日:2022-11-23

    摘要: 本申请公开了一种视频中的动作检测方法和装置、存储介质及电子设备。其中,该方法包括:从待检测视频中提取一组视频片段,视频片段中的每个视频片段时长均为预设时长;通过目标变换器模型从每个视频片段中提取与每个视频片段对应的时空特征,目标变换器模型包含依次连接的一组自注意力层,一组自注意力层中的每个自注意力层用于扩展每个自注意力层输入时空特征的通道维度、并降低每个自注意力层输入时空特征的时空维度,与每个视频片段对应的时空特征为一组自注意力层中的最后一个自注意力层输出的时空特征;根据每个视频片段对应的时空特征,对待检测视频进行动作检测,通过本申请,解决了相关技术中视频中的动作检测方法存在的准确性低的问题。

    一种跨模态检索方法、装置、设备及介质

    公开(公告)号:CN112528048A

    公开(公告)日:2021-03-19

    申请号:CN202110187051.X

    申请日:2021-02-18

    IPC分类号: G06F16/43 G06F16/903

    摘要: 本申请实施例公开了一种跨模态检索方法、装置、设备及介质,其中的方法包括:获取待检索的查询文本;根据查询文本在多媒体数据库中进行检索,得到候选多媒体集合;根据N个候选多媒体数据中的对象信息生成查询文本的缺失内容,并获取针对缺失内容的确认反馈;根据确认反馈对候选多媒体集合进行优化,得到检索结果。本申请实施例可适用于查询文本不完整的情况,且能够有效提升检索性能,提高检索结果的准确性。

    步态识别方法、装置、设备及存储介质

    公开(公告)号:CN110705438A

    公开(公告)日:2020-01-17

    申请号:CN201910922345.5

    申请日:2019-09-27

    摘要: 本申请实施例公开了一种步态识别方法、装置、设备及存储介质,属于计算机技术领域。方法包括:获取目标视频中包括同一人体的多个视频帧;获取所述多个视频帧的步态轮廓图,所述步态轮廓图的排列顺序与所述步态轮廓图对应的视频帧的排列顺序相同;根据多个步态轮廓图中的至少两个步态轮廓图进行融合,得到至少一个融合特征图,所述至少两个步态轮廓图相邻;根据所述至少一个融合特征图进行识别,得到所述目标视频对应的识别信息。在对步态轮廓图进行处理时,会得到步态的静态特征和动态特征,根据得到的静态特征和动态特征进行识别,从而提高了识别结果的准确率。

    一种轨迹追踪方法、装置和存储介质

    公开(公告)号:CN109978918A

    公开(公告)日:2019-07-05

    申请号:CN201910216785.9

    申请日:2019-03-21

    摘要: 本发明实施例公开了一种轨迹追踪方法、装置和存储介质;本发明实施例可以获取图像采集设备采集到的视频;对视频中的图像进行对象追踪,得到图像采集设备对应的对象轨迹,其中,所述对象轨迹包括所述视频中同一对象的多张对象图像;对所述对象轨迹中对象图像的质量进行分类,得到对象图像的质量类型;基于所述对象图像的质量类型对所述对象轨迹中的对象图像进行过滤,得到图像采集设备对应的过滤后对象轨迹;对图像采集设备对应的过滤后对象轨迹进行聚类,得到对象的目标轨迹。该方案可以大大提高轨迹追踪的精确性。

    文本图像匹配方法、装置、计算机设备及存储介质

    公开(公告)号:CN113516143A

    公开(公告)日:2021-10-19

    申请号:CN202011350030.7

    申请日:2020-11-26

    IPC分类号: G06K9/62 G06K9/46 G06N3/04

    摘要: 本申请是关于一种文本图像匹配方法、装置、计算机设备及存储介质,属于图像处理技术领域。该方法包括:获取第一特征以及第二特征;第一特征是由第一文本包含的至少两种尺度的文本特征经过编码得到的;第二特征是由第一图像包含的至少两种尺度的图像特征经过编码得到的,获取第一特征与第二特征之间的第一特征相似度;基于第一特征相似度,对第一特征以及第二特征进行加权,获得第一加权特征以及第二加权特征;基于第一特征、第二特征、第一加权特征以及第二加权特征,获取第一文本与第一图像的第二特征相似度;基于第二特征相似度,获取匹配信息。通过上述方案,提高了文本图像特征匹配的准确度。