视频动作识别方法、装置和机器设备

    公开(公告)号:CN110163052B

    公开(公告)日:2022-09-09

    申请号:CN201810861147.8

    申请日:2018-08-01

    IPC分类号: G06K9/00 G06K9/62

    摘要: 本发明揭示了一种视频动作识别方法、装置和机器设备。所述方法包括:获取进行动作识别的视频数据;对视频数据在神经网络中进行网络各层的特征抽取中,经由神经网络的网络结构使得视频图像上抽取的空域特征进入双线性层;相邻帧视频图像之间根据空域特征进行双线性层上的双线性相关性运算,获得视频数据中每帧视频图像的时空域特征;通过时空域特征进行视频中动作的分类,获得视频数据的动作识别结果。对于神经网络中网络各层的特征抽取,在双线性层上双线性相关性运算中参数和计算复杂度得到控制,进而在控制复杂度的情况下抽取了时空域特征由此,实现了时域关系上的显式建模,有效提升动作识别的性能。

    一种图像识别方法、装置以及相关设备

    公开(公告)号:CN110147699A

    公开(公告)日:2019-08-20

    申请号:CN201810325819.3

    申请日:2018-04-12

    IPC分类号: G06K9/00 G06K9/62

    摘要: 本发明实施例公开了一种图像识别方法、装置以及相关设备,方法包括:根据多个样本视频以及与所述多个样本视频关联的多个辅助数据,生成识别模型的调整辅助参数;根据所述多个样本视频的分类误差参数以及所述调整辅助参数调整识别模型,当调整辅助参数和分类误差参数之和小于目标阈值时,将调整后的识别模型确定为用于识别视频中对象的属性类型的目标识别模型。采用本发明,可以提高图像识别的准确率。

    视频动作识别方法、装置和机器设备

    公开(公告)号:CN110163052A

    公开(公告)日:2019-08-23

    申请号:CN201810861147.8

    申请日:2018-08-01

    IPC分类号: G06K9/00 G06K9/62

    摘要: 本发明揭示了一种视频动作识别方法、装置和机器设备。所述方法包括:获取进行动作识别的视频数据;对视频数据在神经网络中进行网络各层的特征抽取中,经由神经网络的网络结构使得视频图像上抽取的空域特征进入双线性层;相邻帧视频图像之间根据空域特征进行双线性层上的双线性相关性运算,获得视频数据中每帧视频图像的时空域特征;通过时空域特征进行视频中动作的分类,获得视频数据的动作识别结果。对于神经网络中网络各层的特征抽取,在双线性层上双线性相关性运算中参数和计算复杂度得到控制,进而在控制复杂度的情况下抽取了时空域特征由此,实现了时域关系上的显式建模,有效提升动作识别的性能。

    图像处理方法、装置、电子设备及存储介质

    公开(公告)号:CN114676360B

    公开(公告)日:2024-09-17

    申请号:CN202210295315.8

    申请日:2022-03-23

    摘要: 本申请公开了一种图像处理方法、装置、电子设备及存储介质,属于计算机技术领域。该方法包括:获取与内容项相关联的至少一个原始图像;识别该至少一个原始图像中的第一区域;对该至少一个原始图像中除了该第一区域之外的第二区域的像素点进行颜色映射,得到与该内容项相关联的至少一个目标图像。本申请通过在换色过程中保持原始图像中第一区域的颜色不变,而仅对第二区域进行颜色映射,使得换色得到的目标图像是在原始图像的基础上衍生的配色方案,极大丰富了内容项所关联图像的显示方式,提高了内容项所关联图像的显示效果,尤其对于广告类的内容项,在广告落地页的交互设计中具有重大现实意义。

    一种确定智能设备移动方向的方法、装置及路径规划系统

    公开(公告)号:CN109902876B

    公开(公告)日:2024-09-06

    申请号:CN201910156350.X

    申请日:2019-03-01

    摘要: 本申请公开了一种确定智能设备移动方向的方法、装置及路径规划系统,引入了想象力模块,确定智能设备的移动方向,从而控制智能设备前往路径指令中指示的目标位置。通过引入的想象力模块计算出体现模拟路径的特征序列,并依据该特征序列通过解码器确定智能设备前往目标位置过程中每一个时间步骤对应的移动方向。由于依据了体现该模拟路径的特征序列,故确定出的移动方向能够更倾向于让智能设备最终到达目标位置。相对于传统方式中仅根据当前状态、环境为智能设备确定出的移动方向来说,本申请所确定的移动方向对于完成目标,即最终将智能设备移动至目标位置更为准确,提高了智能设备在路径指令下到达目标位置的可能性。

    内容生成方法、装置、设备及存储介质

    公开(公告)号:CN117874239A

    公开(公告)日:2024-04-12

    申请号:CN202410270954.8

    申请日:2024-03-11

    摘要: 本申请公开了一种内容生成方法、装置、设备及存储介质,涉及AI技术领域。所述方法包括:获取输入文本;从多个分类类别中,确定输入文本所属的第一分类类别,多个分类类别包括至少一个违规类别和一个合规类别,违规类别是指输入文本中包含的违规内容所属的类别,合规类别是指输入文本中不包含违规内容;确定第一分类类别对应的提示词,得到第一提示词,第一提示词用于指示输入文本对应的内容生成要求;通过生成模型根据输入文本和第一提示词,生成输入文本对应的输出内容。本申请通过针对输入文本所属的分类类别设计相对应的提示词,引导生成模型生成正向的输出内容,增强了内容生成的安全性和合规性。

    视频处理方法、装置、设备、介质及产品

    公开(公告)号:CN117576678B

    公开(公告)日:2024-04-05

    申请号:CN202410051120.8

    申请日:2024-01-15

    摘要: 本申请实施例提出了一种视频处理方法、装置、设备、介质及产品,该方法包括:对待处理的视频进行抽帧处理,得到视频帧序列,视频帧序列包含一个或多个视频帧;对每个视频帧进行文本检测处理,以检测得到每个视频帧中的文本行;基于每个文本行的文本行特征,对检测得到的文本行进行文案聚合处理,得到目标文案块集合;目标文案块集合中包含一个或多个文案块,每个文案块中包含一个或多个文本行,属于同一个文案块中的各个文本行的文本行特征之间相匹配;获取每个文案块分别对应的字幕置信度;按照每个文案块分别对应的字幕置信度,从一个或多个文案块中选择目标文案块确定为视频的字幕集合。本申请实施例能准确地识别视频的字幕内容。

    图片识别方法、装置、设备及存储介质

    公开(公告)号:CN112036564B

    公开(公告)日:2024-01-09

    申请号:CN202010885640.0

    申请日:2020-08-28

    发明人: 梅杰儒 高源 刘威

    IPC分类号: G06N3/082 G06N3/06

    摘要: 本申请公开了一种图片识别方法、装置、设备及存储介质,属于人工智能的深度学习技术领域。所述方法包括:获取已训练完成的神经网络;根据已训练完成的神经网络确定基神经元,基神经元用于重建已训练完成的神经网络中的神经元;根据基神经元,确定已训练完成的神经网络中的冗余神经元,冗余神经元是指已训练完成的神经网络中能够通过基神经元组合表示的神经元;去除已训练完成的神经网络中的冗余神经元,得到剪枝后的神经网络。本申请实施例实现了准确判断该神经元的重要性,避免去除重要的神经元导致对深度神经网络的预测准确性造成较大的影响,确保了深度神经网络在网络剪枝过程中的稳定性。

    视频分类方法、装置、计算机设备和存储介质

    公开(公告)号:CN112101154B

    公开(公告)日:2023-12-15

    申请号:CN202010907778.6

    申请日:2020-09-02

    摘要: 本申请涉及人工智能的计算机视觉技术、机器学习等技术,一种视频分类方法、装置、计算机设备和存储介质。所述方法包括:获取待分类视频片段;将待分类视频片段输入已训练的视频分类网络,得到第一视频分类结果,并将待分类视频片段输入已训练的人脸识别网络,得到与待分类视频片段对应的人物信息;将人物信息与各预设视频类别的人物信息集合进行比对,得到第二视频分类结果,根据第一视频分类结果以及第二视频分类结果,得到目标视频分类结果。采用本方法能够得到准确的视频分类结果。