-
公开(公告)号:CN116901094A
公开(公告)日:2023-10-20
申请号:CN202211408199.2
申请日:2022-11-10
摘要: 本申请涉及机器视觉领域,提供一种机器人定位抓取方法、装置、设备及计算机程序产品。所述机器人定位抓取方法包括:根据采集的场景图像数据确定机器人的运动状况;基于所述场景图像数据和所述运动状况构建场景点云地图;基于所述场景点云地图,控制所述机器人到达目标区域,搜索所述目标区域内的目标物体;基于所述目标物体的三维信息,控制所述机器人抓取所述目标物体对应的待抓取物体。本申请通过场景点云地图的构建实现机器人的粗定位,基于目标物体的三维信息实现机器人对物体的抓取和搬运。
-
公开(公告)号:CN116977246A
公开(公告)日:2023-10-31
申请号:CN202211349900.8
申请日:2022-10-31
发明人: 张志鹏 , 罗亚丹 , 刘玮 , 马文婷 , 郝源 , 何应腾 , 陈嘉敏 , 唐弘毅 , 魏捷 , 柴鑫刚 , 喻朝新 , 林世海 , 答嘉曦 , 陈金悬 , 袁晓航 , 汪啸林 , 崔金刚 , 李飞彬 , 连丽娜
IPC分类号: G06T7/00 , G06T7/70 , G06N3/0464 , G06N3/084 , G06V20/40
摘要: 本发明提供一种基于视频的异常检测方法、装置、设备及存储介质,包括:获取待检测视频的图像序列;将所述图像序列输入至行为检测模型,得到所述行为检测模型输出的检测结果;其中,所述行为检测模型是基于图像序列样本以及所述图像序列样本中目标车辆的车辆运行角度进行训练获得;基于所述检测结果以及预先设置的阈值参数,确定所述图像序列对应的车辆行为检测结果。本发明通过结合图像序列样本的车辆运行角度进行行为检测模型的训练,使得模型能够准确区分车辆翻转、急停、变道以及急转等危险驾驶情形,从而提高模型进行车辆异常驾驶行为检测的准确性。
-
公开(公告)号:CN117014723A
公开(公告)日:2023-11-07
申请号:CN202210441397.2
申请日:2022-04-25
IPC分类号: H04N23/695 , H04N21/234
摘要: 本申请涉及通信技术领域,提供一种视频数据传输方法、终端、网络设备、系统及电子设备。所述方法包括:确定目标视角;基于索引头信息,确定目标视角对应的帧数据在目标视频文件中的目标存储位置,目标视频文件包括索引头信息和多视角视频数据,多视角视频数据包括两个或两个以上视角分别对应的帧数据,索引头信息用于表征两个或两个以上视角分别对应的帧数据在目标视频文件中的存储位置;发送用于请求目标视角对应的帧数据的第一请求消息,第一请求消息中携带有目标存储位置;接收目标视角对应的帧数据。本申请实施例通过获取网络设备发送的目标视角对应的帧数据,无需下载所有视角对应的帧数据,可以避免视频质量变差。
-
公开(公告)号:CN116912538A
公开(公告)日:2023-10-20
申请号:CN202211478007.5
申请日:2022-11-23
发明人: 张志鹏 , 马文婷 , 郝源 , 袁晓航 , 罗亚丹 , 柴鑫刚 , 何应腾 , 陈嘉敏 , 魏捷 , 喻朝新 , 答嘉曦 , 陈金悬 , 唐弘毅 , 汪啸林 , 崔金刚 , 李飞彬 , 连丽娜
IPC分类号: G06V10/764 , G06V10/774
摘要: 本发明提供一种目标检测模型的训练样本的获取及训练方法、装置及设备,包括:利用目标检测模型对指定生产场景的未标注数据样本进行目标检测,获取目标检测结果;对目标检测结果进行不确定性评估,获取目标检测结果的不确定信息量;依据不确定信息量确定未标注数据样本是否作为优化目标检测模型的训练样本。根据不确定信息量选择至少部分未标注数据样本作为训练样本;利用标注后的训练样本训练目标检测模型。通过目标检测结果进行不确定性评估,基于不确定信息量确定哪些数据可以作为训练数据,这些训练数据进行标注后提供目标检测模型进行训练,提供了有效的训练数据,提高目标检测模型的泛化能力,同时提高标注效率和模型优化效率。
-
公开(公告)号:CN116978019A
公开(公告)日:2023-10-31
申请号:CN202211406427.2
申请日:2022-11-10
IPC分类号: G06V30/148 , G06N3/0464 , G06T5/00 , G06T7/80 , G06T17/00 , G06V10/82 , G06V30/19
摘要: 本申请涉及机器视觉领域,提供一种压印字符识别方法、装置、设备及计算机程序产品。所述压印字符识别方法包括:在待识别压印字符上投射光栅图像;对所述光栅图像进行相位解码,得到光栅相位;根据标定相机和所述光栅相位对所述待识别压印字符进行三维重建,得到三维点云数据;将所述三维点云数据转换为深度图;基于所述深度图对所述待识别压印字符进行识别,得到压印字符识别结果。本申请通过转换得到的深度图以及基于深度学习的方法对待识别压印字符进行训练和识别,实现了压印字符的精确识别。
-
公开(公告)号:CN116957913A
公开(公告)日:2023-10-27
申请号:CN202211085497.2
申请日:2022-09-06
摘要: 本发明提供一种全景视频映射方法、装置、电子设备和存储介质。获取球面全景视频,将球面全景视频映射到类三棱柱模型,获得多个画面,即将球面全景视频的全部内容都映射到类三棱柱模型上,从而覆盖球面全景视频展开后的所有视频画面,保证了视频画面完整,避免丢失内容,之后,合并多个画面,得到平面矩形视频画面,进而将球面全景视频所有内容完全呈现;且多个画面包括类三棱柱模型的三个侧面对应的三个水平画面、类三棱柱模型的第一底面对应的第一底端画面、类三棱柱模型的第二底面对应的第二底端画面,即类三棱柱模型的每个面均映射有至少一个画面,而每个画面的内容都不存在画面失真,进而使合并后的平面矩形视频画面不失真,保证画面不失真。
-
公开(公告)号:CN116912539A
公开(公告)日:2023-10-20
申请号:CN202211601530.2
申请日:2022-12-13
IPC分类号: G06V10/764 , G06Q10/0875 , G06V10/82 , G06N3/0464
摘要: 本申请涉及人工智能技术领域,提供一种物料信息标记方法、装置和电子设备。方法包括:确定多个色块标签图像;每个色块标签图像中的色块标签包括多个色块颜色;多个色块标签图像中包括不同颜色组合的色块标签的图像;多个色块标签图像用于表征同一物料信息;确定对多个色块标签图像的分类结果:将多个色块标签图像输入至分类器,得到分类器输出的分类结果;基于分类结果与多个色块标签图像的预设标签计算预测准确率,基于预测准确率最高的色块标签图像确定目标色块标签图像;目标色块标签图像中色块标签的颜色组合用于标记物料信息。本申请实施例用以解决简单色块标签、二维码以及条形码进行物料信息标记的方法效果不佳的技术问题。
-
公开(公告)号:CN116962805A
公开(公告)日:2023-10-27
申请号:CN202210806674.5
申请日:2022-07-08
IPC分类号: H04N21/44 , H04N21/4402 , H04N21/8547
摘要: 本申请涉及视频处理领域,提供一种视频合成方法、装置、电子设备及可读存储介质。所述视频合成方法包括:将目标摄像机的视频流作为时间戳标准流,根据所述时间戳标准流对预处理服务器接收到的视频流进行帧同步;根据预设视角数和预设输出分辨率,对帧同步后得到的目标图像进行降采样处理,得到待合成图像;根据所述待合成图像的时间戳以及所述预设视角数,对各所述待合成图像进行合成,得到多视角视频。本申请通过视频流帧同步,目标图像降采样以及图像合成,解决了现有多视角转播存在的多视角画面不同步的问题。
-
公开(公告)号:CN118072232A
公开(公告)日:2024-05-24
申请号:CN202211465864.1
申请日:2022-11-22
发明人: 张豪杰 , 蔡铁光 , 刘少武 , 陈翰翔 , 党志俊 , 崔志顺 , 蔡伟文 , 孔轶 , 许耀顺 , 罗亚丹 , 万奇 , 刘福生 , 左建 , 李梓萌 , 刘玮 , 朱建 , 吴威 , 张慧勇 , 李虹 , 柴鑫刚 , 何应腾 , 倪春亚 , 张志鹏 , 郝源 , 唐弘毅 , 袁晓航 , 李科 , 王庆华
摘要: 本申请提供一种线缆识别方法、装置及相关设备,其中,所述方法应用于服务器时,包括:对终端设备上传的线缆图像进行图像识别,获得环带信息,其中,所述线缆图像包括线缆上绕设的多个环带的图像,所述环带信息包括所述多个环带中每一环带的颜色信息;根据所述多个环带中每一环带的颜色信息,确定用于下发给所述终端设备的线缆信息,其中,所述线缆信息包括线缆的编号、线缆的类型、线缆连接的设备端口号和线缆接入的设备标识中的至少一项。在本申请实施例中,应用图像识别的方式替换人工识别的方式,使线缆的识别效率得到提升,在此基础上,通过线缆上绕设的多个环带以及每个环带的颜色设置,确保线缆识别的准确性和可靠性。
-
公开(公告)号:CN118796066A
公开(公告)日:2024-10-18
申请号:CN202410839344.5
申请日:2024-06-26
申请人: 中国移动通信集团广东有限公司 , 中移湾区(广东)创新研究院有限公司 , 中国移动通信集团有限公司
IPC分类号: G06F3/0481 , G06F3/16 , G06V30/10 , H04N7/15
摘要: 本公开关于一种线上会议中的文档显示方法、装置、电子设备及存储介质。其中,所述方法,包括:在接收到第一用户设备发起的文档显示窗口共享指令的情况下,将目标文档共享至第二用户设备;对所述目标文档当前显示页面的文本内容进行文字识别处理,得到所述目标文档当前显示页面的文本内容;获取使用用户设备的用户的语音信息;所述用户设备包括所述第一用户设备和所述第二用户设备中的至少一个;在所述语音信息与所述目标文档当前显示页面的文本内容相匹配的情况下,按照预设方式显示匹配结果对应的目标文本内容。采用本公开实施例提供的方法,可以使得各个用户可以快速找到对应的文本内容,从而可以有效提高用户体验,提高线上会议效率。
-
-
-
-
-
-
-
-
-