-
公开(公告)号:CN116901094A
公开(公告)日:2023-10-20
申请号:CN202211408199.2
申请日:2022-11-10
摘要: 本申请涉及机器视觉领域,提供一种机器人定位抓取方法、装置、设备及计算机程序产品。所述机器人定位抓取方法包括:根据采集的场景图像数据确定机器人的运动状况;基于所述场景图像数据和所述运动状况构建场景点云地图;基于所述场景点云地图,控制所述机器人到达目标区域,搜索所述目标区域内的目标物体;基于所述目标物体的三维信息,控制所述机器人抓取所述目标物体对应的待抓取物体。本申请通过场景点云地图的构建实现机器人的粗定位,基于目标物体的三维信息实现机器人对物体的抓取和搬运。
-
公开(公告)号:CN116912538A
公开(公告)日:2023-10-20
申请号:CN202211478007.5
申请日:2022-11-23
发明人: 张志鹏 , 马文婷 , 郝源 , 袁晓航 , 罗亚丹 , 柴鑫刚 , 何应腾 , 陈嘉敏 , 魏捷 , 喻朝新 , 答嘉曦 , 陈金悬 , 唐弘毅 , 汪啸林 , 崔金刚 , 李飞彬 , 连丽娜
IPC分类号: G06V10/764 , G06V10/774
摘要: 本发明提供一种目标检测模型的训练样本的获取及训练方法、装置及设备,包括:利用目标检测模型对指定生产场景的未标注数据样本进行目标检测,获取目标检测结果;对目标检测结果进行不确定性评估,获取目标检测结果的不确定信息量;依据不确定信息量确定未标注数据样本是否作为优化目标检测模型的训练样本。根据不确定信息量选择至少部分未标注数据样本作为训练样本;利用标注后的训练样本训练目标检测模型。通过目标检测结果进行不确定性评估,基于不确定信息量确定哪些数据可以作为训练数据,这些训练数据进行标注后提供目标检测模型进行训练,提供了有效的训练数据,提高目标检测模型的泛化能力,同时提高标注效率和模型优化效率。
-
公开(公告)号:CN116977246A
公开(公告)日:2023-10-31
申请号:CN202211349900.8
申请日:2022-10-31
发明人: 张志鹏 , 罗亚丹 , 刘玮 , 马文婷 , 郝源 , 何应腾 , 陈嘉敏 , 唐弘毅 , 魏捷 , 柴鑫刚 , 喻朝新 , 林世海 , 答嘉曦 , 陈金悬 , 袁晓航 , 汪啸林 , 崔金刚 , 李飞彬 , 连丽娜
IPC分类号: G06T7/00 , G06T7/70 , G06N3/0464 , G06N3/084 , G06V20/40
摘要: 本发明提供一种基于视频的异常检测方法、装置、设备及存储介质,包括:获取待检测视频的图像序列;将所述图像序列输入至行为检测模型,得到所述行为检测模型输出的检测结果;其中,所述行为检测模型是基于图像序列样本以及所述图像序列样本中目标车辆的车辆运行角度进行训练获得;基于所述检测结果以及预先设置的阈值参数,确定所述图像序列对应的车辆行为检测结果。本发明通过结合图像序列样本的车辆运行角度进行行为检测模型的训练,使得模型能够准确区分车辆翻转、急停、变道以及急转等危险驾驶情形,从而提高模型进行车辆异常驾驶行为检测的准确性。
-
公开(公告)号:CN116978019A
公开(公告)日:2023-10-31
申请号:CN202211406427.2
申请日:2022-11-10
IPC分类号: G06V30/148 , G06N3/0464 , G06T5/00 , G06T7/80 , G06T17/00 , G06V10/82 , G06V30/19
摘要: 本申请涉及机器视觉领域,提供一种压印字符识别方法、装置、设备及计算机程序产品。所述压印字符识别方法包括:在待识别压印字符上投射光栅图像;对所述光栅图像进行相位解码,得到光栅相位;根据标定相机和所述光栅相位对所述待识别压印字符进行三维重建,得到三维点云数据;将所述三维点云数据转换为深度图;基于所述深度图对所述待识别压印字符进行识别,得到压印字符识别结果。本申请通过转换得到的深度图以及基于深度学习的方法对待识别压印字符进行训练和识别,实现了压印字符的精确识别。
-
公开(公告)号:CN116957913A
公开(公告)日:2023-10-27
申请号:CN202211085497.2
申请日:2022-09-06
摘要: 本发明提供一种全景视频映射方法、装置、电子设备和存储介质。获取球面全景视频,将球面全景视频映射到类三棱柱模型,获得多个画面,即将球面全景视频的全部内容都映射到类三棱柱模型上,从而覆盖球面全景视频展开后的所有视频画面,保证了视频画面完整,避免丢失内容,之后,合并多个画面,得到平面矩形视频画面,进而将球面全景视频所有内容完全呈现;且多个画面包括类三棱柱模型的三个侧面对应的三个水平画面、类三棱柱模型的第一底面对应的第一底端画面、类三棱柱模型的第二底面对应的第二底端画面,即类三棱柱模型的每个面均映射有至少一个画面,而每个画面的内容都不存在画面失真,进而使合并后的平面矩形视频画面不失真,保证画面不失真。
-
公开(公告)号:CN116912539A
公开(公告)日:2023-10-20
申请号:CN202211601530.2
申请日:2022-12-13
IPC分类号: G06V10/764 , G06Q10/0875 , G06V10/82 , G06N3/0464
摘要: 本申请涉及人工智能技术领域,提供一种物料信息标记方法、装置和电子设备。方法包括:确定多个色块标签图像;每个色块标签图像中的色块标签包括多个色块颜色;多个色块标签图像中包括不同颜色组合的色块标签的图像;多个色块标签图像用于表征同一物料信息;确定对多个色块标签图像的分类结果:将多个色块标签图像输入至分类器,得到分类器输出的分类结果;基于分类结果与多个色块标签图像的预设标签计算预测准确率,基于预测准确率最高的色块标签图像确定目标色块标签图像;目标色块标签图像中色块标签的颜色组合用于标记物料信息。本申请实施例用以解决简单色块标签、二维码以及条形码进行物料信息标记的方法效果不佳的技术问题。
-
公开(公告)号:CN116962805A
公开(公告)日:2023-10-27
申请号:CN202210806674.5
申请日:2022-07-08
IPC分类号: H04N21/44 , H04N21/4402 , H04N21/8547
摘要: 本申请涉及视频处理领域,提供一种视频合成方法、装置、电子设备及可读存储介质。所述视频合成方法包括:将目标摄像机的视频流作为时间戳标准流,根据所述时间戳标准流对预处理服务器接收到的视频流进行帧同步;根据预设视角数和预设输出分辨率,对帧同步后得到的目标图像进行降采样处理,得到待合成图像;根据所述待合成图像的时间戳以及所述预设视角数,对各所述待合成图像进行合成,得到多视角视频。本申请通过视频流帧同步,目标图像降采样以及图像合成,解决了现有多视角转播存在的多视角画面不同步的问题。
-
公开(公告)号:CN117014723A
公开(公告)日:2023-11-07
申请号:CN202210441397.2
申请日:2022-04-25
IPC分类号: H04N23/695 , H04N21/234
摘要: 本申请涉及通信技术领域,提供一种视频数据传输方法、终端、网络设备、系统及电子设备。所述方法包括:确定目标视角;基于索引头信息,确定目标视角对应的帧数据在目标视频文件中的目标存储位置,目标视频文件包括索引头信息和多视角视频数据,多视角视频数据包括两个或两个以上视角分别对应的帧数据,索引头信息用于表征两个或两个以上视角分别对应的帧数据在目标视频文件中的存储位置;发送用于请求目标视角对应的帧数据的第一请求消息,第一请求消息中携带有目标存储位置;接收目标视角对应的帧数据。本申请实施例通过获取网络设备发送的目标视角对应的帧数据,无需下载所有视角对应的帧数据,可以避免视频质量变差。
-
公开(公告)号:CN118736570A
公开(公告)日:2024-10-01
申请号:CN202310324373.3
申请日:2023-03-29
申请人: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC分类号: G06V20/70 , G06V10/764 , G06V10/82 , G06T7/00 , G06N3/0464 , G06N3/08
摘要: 本申请公开了一种图像处理方法、装置、设备及计算机可读存储介质。其中,方法包括:获取未标注的图像集;确定所述未标注的图像集对应的第一目标检测模型;所述第一目标检测模型与所述未标注的图像集本身的图像特征信息相关,所述图像特征信息至少包括图像的类别信息;基于所述第一目标检测模型,对所述未标注的图像集进行目标检测,得到目标预标注结果;所述目标预标注结果用于构成已标注的图像集的图像。
-
公开(公告)号:CN118210515A
公开(公告)日:2024-06-18
申请号:CN202211585407.6
申请日:2022-12-09
申请人: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC分类号: G06F8/60 , G06F18/23213 , H04N7/18
摘要: 本发明提供了智慧园区视频AI模型部署方法、装置、设备及介质,所述方法包括:对智慧园区中各个监控点位的监控视频数据分别进行特征提取,得到所述各个监控点位的视频特征数据;基于所述各个监控点位的视频特征数据对所述各个监控点位进行聚类处理,得到至少一个点位集;针对每个所述点位集,根据相应点位集中的监控视频数据,对每个所述点位集部署对应的AI模型,所述AI模型用于对相应点位集中的监控视频数据进行预设任务处理。这样,对每个点位集部署对应的AI模型,以对监控视频数据进行预设任务处理,可以在复杂度较低的情况下,提升检测效果。
-
-
-
-
-
-
-
-
-