一种动作检测方法、装置、终端设备和存储介质

    公开(公告)号:CN113326835A

    公开(公告)日:2021-08-31

    申请号:CN202110889116.5

    申请日:2021-08-04

    Abstract: 本申请涉及图像处理技术领域,提出一种动作检测方法、装置、终端设备和存储介质。该方法包括:获取包含目标动作的目标视频序列,所述目标视频序列包括一一对应的目标像素帧序列和目标深度图序列;根据所述目标像素帧序列生成像素特征图像,所述像素特征图像包含所述目标像素帧序列具有的各帧图像的特征;根据所述目标深度图序列生成深度特征图像,所述深度特征图像包含所述目标深度图序列具有的各帧图像的特征;将所述像素特征图像和所述深度特征图像输入已训练的深度神经网络执行图像特征的提取与融合处理,以确定所述目标动作的类别。采用该方法能够在一定程度上减弱环境因素对检测样本的干扰,从而提高动作检测的准确率。

    一种图像深度估计方法、终端设备及计算机可读存储介质

    公开(公告)号:CN112070817A

    公开(公告)日:2020-12-11

    申请号:CN202010863390.0

    申请日:2020-08-25

    Abstract: 本申请适用于图像处理技术领域,提供了一种图像深度估计方法、终端设备及计算机可读存储介质,通过将目标图像输入至预设的深度估计模型中,提取目标图像的全局特征,并从该全局特征中提取目标图像的关键特征,以及根据该关键特征确定目标图像的目标深度图,其中,目标深度图中每个像素点的值用于描述该像素点对应的被拍摄对象距离摄像机的远近程度。由于本方案中的关键特征用于描述目标图像中非空白区域包含的像素点的信息,即本方案在确定目标图像的目标深度图时,不考虑目标图像中空白区域包含的像素点的信息,只基于目标图像的关键特征确定目标深度,从而可以提高图像深度估计的估计精确度,减少图像深度估计的计算开销。

    一种基于轨迹相似性度量学习的多目标跟踪重定位方法

    公开(公告)号:CN112561960B

    公开(公告)日:2023-12-26

    申请号:CN202011435920.8

    申请日:2020-12-10

    Abstract: 本发明公开了一种基于轨迹相似性度量学习的多目标跟踪重定位方法。该方法包括:对采集的多目标轨迹整体和每一帧进行特征提取,获得反映深层特征的多目标运动轨迹;利用距离函数计算所述多目标运动轨迹间的相似性;对所述多目标运动轨迹间的相似性进行度量和轨迹聚类,以限制同类轨迹样本之间的距离,且增大不同类轨迹样本之间的距离。利用本发明能够克服多目标间的遮挡、重叠等因素带来的目标丢失和误跟踪问题。

    基于道路特征的车辆轨迹预测数据处理方法和装置

    公开(公告)号:CN114419877B

    公开(公告)日:2022-11-15

    申请号:CN202111536333.2

    申请日:2021-12-15

    Abstract: 本发明涉及一种基于道路特征的车辆轨迹预测数据处理方法,在车辆轨迹数据中融合路段间关系特征和路段的特征,目的是建立车辆轨迹数据与其所处道路的特征关联,从而更好地表示不同道路条件下车辆轨迹的共性与特性。所述方法包括下述步骤:建立路段关系图,获取路段间关系矩阵F1;基于路段的拟合曲线、路段类型和车道数,获取路段的特征矩阵F2;获取车辆轨迹点坐标映射(u,n),u为轨迹点在拟合曲线上的映射点参数,n为映射点与轨迹点之间的距离;将路段间关系矩阵F1、路段的特征矩阵F2、以及车辆轨迹点坐标映射(u,n)进行融合,进而获得车辆轨迹表示。本发明基于方法还实现了一种装置。

    一种基于特征交互学习的动作识别方法及终端设备

    公开(公告)号:CN112257526A

    公开(公告)日:2021-01-22

    申请号:CN202011078182.6

    申请日:2020-10-10

    Abstract: 本申请适用于计算机视觉技术领域,提供了一种基于特征交互学习的动作识别方法及终端设备,所述方法包括:获取待识别动作的视频数据,视频数据包括第一视频序列和第二视频序列;将第一视频序列和第二视频序列分别进行压缩处理,得到第一运动图和第二运动图;将第一运动图和第二运动图输入训练后的双流神经网络模型,通过训练后的双流神经网络模型对第一运动图的特征和第二运动图的特征进行交互学习,得到第一视频序列的第一预测结果和第二视频序列的第二预测结果;基于第一预测结果和第二预测结果,确定待识别动作的分类结果。通过本申请解决了稀疏采样的动作识别准确度低的问题;通过对多模态输入特征的交互学习,提高了对动作类别识别的准确度。

    一种图像特效处理方法、装置及终端

    公开(公告)号:CN111047509A

    公开(公告)日:2020-04-21

    申请号:CN201911300750.X

    申请日:2019-12-17

    Abstract: 本申请适用于图像处理技术领域,提供一种图像特效处理方法、装置及终端,其中方法包括:获取待处理的人脸图像,及与脸部特效图像对应的第一人脸语义分割掩膜;将所述待处理的人脸图像及所述第一人脸语义分割掩膜输入至密集映射网络,生成初步人脸图像;基于所述初步人脸图像,及所述脸部特效图像,通过循环式生成对抗网络,生成目标人脸图像,提高了效率,降低了成本,使大规模快速实现科幻电影特效成为可能。

    对象关系预测方法、装置、终端设备及可读存储介质

    公开(公告)号:CN111126049B

    公开(公告)日:2023-11-24

    申请号:CN201911292582.4

    申请日:2019-12-14

    Abstract: 的预测准确度。本申请适用于图像识别技术领域,提供了一种对象关系预测方法、装置、终端设备及可读存储介质,该方法包括:通过预设的对象检测器,获取待检测图像中多个对象的特征信息、以及待检测图像的视觉特征向量。根据每个对象的特征信息,获取多个对象的非视觉特征向量。根据两个对象之间的非视觉特征向量和视觉特征向量,通过预设的谓词预测模型,获取两个对象之间的谓词预测结果。由于在预测谓词时,考虑了两个对象之间的位置向量以及两个对象的语义嵌入向量,使得在出现零样本的对象标签时,可以根据(56)对比文件徐守坤 等.融合施工场景及空间关系的图像描述生成模型《.计算机工程》.2019,(第06期),第1-15页.丁文博 等.深度学习的视觉关系检测方法研究进展《.科技创新导报》.2019,(第27期),第145-150页.

    一种基于特征交互学习的动作识别方法及终端设备

    公开(公告)号:CN112257526B

    公开(公告)日:2023-06-20

    申请号:CN202011078182.6

    申请日:2020-10-10

    Abstract: 本申请适用于计算机视觉技术领域,提供了一种基于特征交互学习的动作识别方法及终端设备,所述方法包括:获取待识别动作的视频数据,视频数据包括第一视频序列和第二视频序列;将第一视频序列和第二视频序列分别进行压缩处理,得到第一运动图和第二运动图;将第一运动图和第二运动图输入训练后的双流神经网络模型,通过训练后的双流神经网络模型对第一运动图的特征和第二运动图的特征进行交互学习,得到第一视频序列的第一预测结果和第二视频序列的第二预测结果;基于第一预测结果和第二预测结果,确定待识别动作的分类结果。通过本申请解决了稀疏采样的动作识别准确度低的问题;通过对多模态输入特征的交互学习,提高了对动作类别识别的准确度。

Patent Agency Ranking