-
公开(公告)号:CN114119678A
公开(公告)日:2022-03-01
申请号:CN202111164952.3
申请日:2021-09-30
Applicant: 北京旷视科技有限公司 , 北京迈格威科技有限公司
IPC: G06T7/269 , G06V20/40 , G06V10/147 , G06V10/80 , G06K9/62
Abstract: 本申请涉及图像处理技术领域,提供一种光流估计方法、计算机程序产品、存储介质及电子设备。其中,光流估计方法包括:获取第一图像、第二图像、第一陀螺仪数据和第二陀螺仪数据;第一图像和第二图像为同一摄像头在不同时刻采集的图像,第一陀螺仪数据为第一图像采集期间陀螺仪采集的数据,第二陀螺仪数据为第二图像采集期间陀螺仪采集的数据;根据第一陀螺仪数据和第二陀螺仪数据计算陀螺域;根据第一图像和第二图像估计二者之间的临时光流,并将临时光流和陀螺域进行融合,得到第一图像和第二图像之间的光流。该方法能够显著提高光流估计精度,特别是能够有效处理雨天、雾天、夜晚等特殊场景下采集的图像。
-
公开(公告)号:CN113962846A
公开(公告)日:2022-01-21
申请号:CN202111056372.2
申请日:2021-09-09
Applicant: 北京旷视科技有限公司 , 北京迈格威科技有限公司
Abstract: 本申请涉及图像处理技术领域,提供一种图像对齐方法及装置、计算机可读存储介质及电子设备。其中,图像对齐方法包括:基于源图像和目标图像,利用神经网络模型计算得到多个权重;利用多个权重将对应的多个光流基进行求和,得到第一单应性光流;利用第一单应性光流将源图像向目标图像对齐;方法中的每个权重对应第一单应性光流的一个光流基,第一单应性光流为源图像和目标图像之间的单应性矩阵对应的光流。该方法通过高效率、高精度的单应性估计,显著改善了图像对齐的效果,并且方法具有良好的鲁棒性,能够适应图像中的不同场景。
-
公开(公告)号:CN112634331A
公开(公告)日:2021-04-09
申请号:CN202011408487.9
申请日:2020-12-04
Applicant: 北京迈格威科技有限公司 , 成都旷视金智科技有限公司
IPC: G06T7/269
Abstract: 本发明提供了一种光流预测方法及装置,涉及计算机视觉技术领域,包括:将两帧连续的待预测图像输入光流预测网络;根据光流预测网络得到预测的光流,其中,光流预测网络的损失通过如下方式确定,包括:根据预设裁剪规则对输入图像进行裁剪,确定两帧裁剪图像;将两帧裁剪图像输入光流预测网络,得到前向光流和后向光流;根据前向光流、后向光流和两帧输入图像进行边界填充映射,确定映射后的两帧映射图像;根据裁剪图像和映射图像确定光流预测网络的损失。本发明通过对裁剪图像进行边界填充映射,使得运动超出裁剪图像边界的像素在经边界填充映射后仍能通过输入图像的对应像素进行替换,得到正确的图像损失,提高了光流预测的准确性。
-
公开(公告)号:CN111444788A
公开(公告)日:2020-07-24
申请号:CN202010173400.8
申请日:2020-03-12
Applicant: 成都旷视金智科技有限公司 , 北京迈格威科技有限公司
Abstract: 本发明公开了一种行为识别的方法、装置及计算机存储介质。该方法包括:获取待识别图像,并将其输入至预先训练好的神经网络;获取所述神经网络的输出,包括表示待识别图像中人物行为正常的概率的第一输出、表示该人物正在进行第一行为的概率的第二输出、表示该人物正在进行第二行为的概率的第三输出;根据输出确定该人物的行为。可见,本发明实施例能够利用预先训练好的神经网络确定待识别图像中人物的行为,具体地,该神经网络能够提取丰富的视觉特征,能够关注待识别图像中的人物的特定行为,使得行为识别的准确率更高。并且,本发明实施例的行为识别的方法能够满足实时性要求,能够进行实时运算,进而满足各种不同的应用领域的识别要求。
-
公开(公告)号:CN111444788B
公开(公告)日:2024-03-15
申请号:CN202010173400.8
申请日:2020-03-12
Applicant: 成都旷视金智科技有限公司 , 北京迈格威科技有限公司
IPC: G06V40/20 , G06V10/774 , G06V10/776 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种行为识别的方法、装置及计算机存储介质。该方法包括:获取待识别图像,并将其输入至预先训练好的神经网络;获取所述神经网络的输出,包括表示待识别图像中人物行为正常的概率的第一输出、表示该人物正在进行第一行为的概率的第二输出、表示该人物正在进行第二行为的概率的第三输出;根据输出确定该人物的行为。可见,本发明实施例能够利用预先训练好的神经网络确定待识别图像中人物的行为,具体地,该神经网络能够提取丰富的视觉特征,能够关注待识别图像中的人物的特定行为,使得行为识别的准确率更高。并且,本发明实施例的行为识别的方法能够满足实时性要求,能够进行实时运算,进而满足各种不同的应用领域的识别要求。
-
公开(公告)号:CN112634331B
公开(公告)日:2025-01-14
申请号:CN202011408487.9
申请日:2020-12-04
Applicant: 北京迈格威科技有限公司 , 成都旷视金智科技有限公司
IPC: G06T7/269
Abstract: 本发明提供了一种光流预测方法及装置,涉及计算机视觉技术领域,包括:将两帧连续的待预测图像输入光流预测网络;根据光流预测网络得到预测的光流,其中,光流预测网络的损失通过如下方式确定,包括:根据预设裁剪规则对输入图像进行裁剪,确定两帧裁剪图像;将两帧裁剪图像输入光流预测网络,得到前向光流和后向光流;根据前向光流、后向光流和两帧输入图像进行边界填充映射,确定映射后的两帧映射图像;根据裁剪图像和映射图像确定光流预测网络的损失。本发明通过对裁剪图像进行边界填充映射,使得运动超出裁剪图像边界的像素在经边界填充映射后仍能通过输入图像的对应像素进行替换,得到正确的图像损失,提高了光流预测的准确性。
-
公开(公告)号:CN111046924B
公开(公告)日:2023-12-19
申请号:CN201911171882.7
申请日:2019-11-26
Applicant: 成都旷视金智科技有限公司 , 北京旷视科技有限公司
IPC: G06F18/214
Abstract: 本发明提供了一种数据处理方法、装置、系统及存储介质,方法包括:从训练集中获取预定数量的训练数据作为当前轮训练数据子集,并基于当前轮训练数据子集对神经网络进行训练,确定当前轮的训练参数,当前轮训练数据子集包括N类训练样本集,N为正整数;根据训练参数确定下一轮训练数据子集中各类训练数据的占比;基于下一轮训练数据子集对神经网络进行训练,得到数据处理模型;利用数据处理模型对待处理数据进行分类,确定待处理数据的分类结果。根据本发明的方法、装置、系统及存储介质,通过计算当前轮训练的训练参数确定下一轮训练数据的各类数据的占比训练得到模型进行数据处理,提高了数据处理的效率和准确性。
-
公开(公告)号:CN111046924A
公开(公告)日:2020-04-21
申请号:CN201911171882.7
申请日:2019-11-26
Applicant: 成都旷视金智科技有限公司 , 北京旷视科技有限公司
IPC: G06K9/62
Abstract: 本发明提供了一种数据处理方法、装置、系统及存储介质,方法包括:从训练集中获取预定数量的训练数据作为当前轮训练数据子集,并基于当前轮训练数据子集对神经网络进行训练,确定当前轮的训练参数,当前轮训练数据子集包括N类训练样本集,N为正整数;根据训练参数确定下一轮训练数据子集中各类训练数据的占比;基于下一轮训练数据子集对神经网络进行训练,得到数据处理模型;利用数据处理模型对待处理数据进行分类,确定待处理数据的分类结果。根据本发明的方法、装置、系统及存储介质,通过计算当前轮训练的训练参数确定下一轮训练数据的各类数据的占比训练得到模型进行数据处理,提高了数据处理的效率和准确性。
-
-
-
-
-
-
-