一种视频数据处理方法、装置、计算机及可读存储介质

    公开(公告)号:CN111950424B

    公开(公告)日:2023-04-07

    申请号:CN202010783397.1

    申请日:2020-08-06

    摘要: 本申请实施例公开了一种视频数据处理方法、装置、计算机及可读存储介质,可以使用人工智能领域的计算机视觉及深度学习等技术,该方法包括:获取目标视频,从目标视频中获取待检测图像,识别待检测图像中的预测图标区域以及预测图标区域对应的预测图标类型;从待检测图像中截取预测图标区域,作为候选区域,获取预测图标类型对应的标准图标;将候选区域与标准图标进行匹配,若候选区域与标准图标的匹配结果为匹配成功结果,则确定目标视频中存在标准图标;将目标视频划分为标准图标对应的视频类别。采用本申请,提高了对视频中的图标进行识别的准确性。

    一种姿态识别方法、装置、电子设备及存储介质

    公开(公告)号:CN110728209A

    公开(公告)日:2020-01-24

    申请号:CN201910906271.6

    申请日:2019-09-24

    IPC分类号: G06K9/00 G06K9/32 G06K9/62

    摘要: 本申请涉及计算机技术领域,主要涉及人工智能中计算机视觉、机器学习技术,尤其涉及一种姿态识别方法、装置、电子设备及存储介质,确定待识别图像中的人体图像区域;对所述人体图像区域中进行人体姿态预估,得到所述人体图像区域对应的姿态特征热力图;根据所述姿态特征热力图,确定所述人体图像区域分别对应于各预设姿态类别的姿态得分;基于所述姿态得分,得到所述人体图像区域中人体姿态识别结果,这样,使用姿态特征热力图进行姿态识别,可以提高姿态识别准确性。

    动作识别方法和装置、存储介质及电子设备

    公开(公告)号:CN116453204B

    公开(公告)日:2024-08-13

    申请号:CN202210011197.3

    申请日:2022-01-05

    发明人: 陈思宏 陈宸 鞠奇

    摘要: 本发明公开了一种动作识别方法和装置、存储介质及电子设备。其中,该方法包括:获取待识别的目标视频图像;提取目标视频图像中目标对象的动作特征;利用动作特征与异常动作识别系数,确定目标对象对应于各异常动作类别的置信度,其中,异常动作识别系数是利用虚拟仿真游戏图像及真实场景图像进行训练后所得到的模型系数,虚拟仿真游戏图像中包括虚拟对象执行动作的图像;基于置信度确定目标视频图像中目标对象匹配的异常动作类别。本发明解决了现有技术对异常动作的识别操作复杂度高的技术问题。

    目标检测方法、装置、电子设备及存储介质

    公开(公告)号:CN110598788B

    公开(公告)日:2023-06-30

    申请号:CN201910864216.5

    申请日:2019-09-12

    发明人: 陈宸 肖万鹏 鞠奇

    摘要: 本申请提供了一种目标检测方法、装置、电子设备及存储介质,该方法包括:提取待处理图像的初始特征图;对所述初始特征图的特征图分辨率和特征图维度进行调整,得到待融合特征图;将所述初始特征图中的特征和所述待融合特征图的特征进行融合,得到所述待处理图像对应的融合特征图;根据所述融合特征图确定所述待处理图像的目标检测结果;与现有技术相比,通过本申请实施例所提供的方案,能够有效提高目标检测的效果。

    一种图像处理和图像分类方法、装置、设备及存储介质

    公开(公告)号:CN114693993A

    公开(公告)日:2022-07-01

    申请号:CN202210294934.5

    申请日:2022-03-23

    发明人: 陈宸 赵博文

    摘要: 本申请实施例提供了一种图像处理和图像分类方法、装置、设备及存储介质,可应用于人工智能、云技术、智慧交通、车载等各种场景,该方法包括:采用新旧样本图像集合对原始分类模型进行迭代训练,获得候选分类模型,故候选分类模型既学习到了新类别的分类能力,同时没有遗忘旧类别的分类能力。通过候选分类模型对多个矫正样本图像进行分类预测,并基于获得的在新旧类别上的预测值确定目标偏移量,再采用目标偏移量对候选分类模型进行输出矫正,获得目标分类模型,使得目标分类模型在新旧类别上输出的预测值是平衡的,进而提高了分类模型分类的准确性,同时,无需通过重复训练实现对候选分离模型的输出矫正,从而提高了增量学习的效率。

    一种视频数据处理方法、装置、计算机及可读存储介质

    公开(公告)号:CN111950424A

    公开(公告)日:2020-11-17

    申请号:CN202010783397.1

    申请日:2020-08-06

    摘要: 本申请实施例公开了一种视频数据处理方法、装置、计算机及可读存储介质,可以使用人工智能领域的计算机视觉及深度学习等技术,该方法包括:获取目标视频,从目标视频中获取待检测图像,识别待检测图像中的预测图标区域以及预测图标区域对应的预测图标类型;从待检测图像中截取预测图标区域,作为候选区域,获取预测图标类型对应的标准图标;将候选区域与标准图标进行匹配,若候选区域与标准图标的匹配结果为匹配成功结果,则确定目标视频中存在标准图标;将目标视频划分为标准图标对应的视频类别。采用本申请,提高了对视频中的图标进行识别的准确性。

    动作识别方法和装置、存储介质及电子设备

    公开(公告)号:CN116453204A

    公开(公告)日:2023-07-18

    申请号:CN202210011197.3

    申请日:2022-01-05

    发明人: 陈思宏 陈宸 鞠奇

    摘要: 本发明公开了一种动作识别方法和装置、存储介质及电子设备。其中,该方法包括:获取待识别的目标视频图像;提取目标视频图像中目标对象的动作特征;利用动作特征与异常动作识别系数,确定目标对象对应于各异常动作类别的置信度,其中,异常动作识别系数是利用虚拟仿真游戏图像及真实场景图像进行训练后所得到的模型系数,虚拟仿真游戏图像中包括虚拟对象执行动作的图像;基于置信度确定目标视频图像中目标对象匹配的异常动作类别。本发明解决了现有技术对异常动作的识别操作复杂度高的技术问题。

    样本图像的生成方法、装置、设备、介质及程序产品

    公开(公告)号:CN115239590A

    公开(公告)日:2022-10-25

    申请号:CN202210893870.0

    申请日:2022-07-27

    IPC分类号: G06T5/00 G06T7/11 G06T7/33

    摘要: 本申请公开了一种样本图像的生成方法、装置、设备、介质及程序产品,涉及机器学习领域。该方法包括:对指定样本图像进行区域划分后得到多个子图区域;基于图像主体在图像中的分布规律确定的概率分布条件,从多个子图区域中确定符合概率要求的目标子图区域;基于指定样本图像和候选样本图像之间的配准关系,从候选样本图像中确定出与目标子图区域匹配的候选子图区域;将候选子图区域应用于指定样本图像中目标子图区域的区域位置处,得到增强样本图像。通过以上方式,能够较大程度地避免破坏图像主体的完整性,得到与指定样本图像相似的大批量增强样本图像,提升增强样本图像的多样性。本申请可应用于云技术、人工智能、智慧交通等各种场景。

    图像处理方法、装置、电子设备以及可读存储介质

    公开(公告)号:CN115223020A

    公开(公告)日:2022-10-21

    申请号:CN202210861588.4

    申请日:2022-07-20

    摘要: 本申请实施例提供了一种图像处理方法、装置、电子设备以及可读存储介质,涉及人工智能、多媒体、以及云技术等领域。该方法包括:基于待处理图像,提取待处理图像对应的至少两种模态的数据特征;根据每种模态的数据特征,确定每种模态的数据特征的权重,其中,每种模态对应的权重表征了该模态的数据特征对于图像处理任务的贡献度;根据各模态的数据特征以及对应的权重,确定每种模态的目标特征;基于各模态的目标特征,确定待处理图像对应于图像处理任务的处理结果。基于本申请实施例提供的该方法,能够有效提高图像处理效果。

    一种检索模型的训练方法和相关装置

    公开(公告)号:CN115221388A

    公开(公告)日:2022-10-21

    申请号:CN202210886903.9

    申请日:2022-07-26

    IPC分类号: G06F16/953 G06K9/62 G06N20/00

    摘要: 本申请实施例公开了一种检索模型的训练方法和相关装置,可应用于车载场景。获取样本对中第一内容的第一向量以及第二内容的第二向量。第一向量和第二向量包括多个通道特征,各个通道特征表示的信息不同,将第一向量和第二向量输入至初始检索模型中,通过初始检索模型根据各个第一通道特征分别与至少两个第二通道特征间的关联性,得到第一向量与第二向量间的多个待定相似度,提高了不同向量包括的多个通道特征间的交互次数,加强了第一向量和第二向量间的信息交流。将多个待定相似度中最大的待定相似度作为第一向量与第二向量间的相似度,从而通过更为准确的相似度和样本标签训练初始模型的参数,得到的检索模型的准确性更高。