-
公开(公告)号:CN118691965A
公开(公告)日:2024-09-24
申请号:CN202410723645.1
申请日:2024-06-05
申请人: 七腾机器人有限公司
IPC分类号: G06V20/10 , G06V10/44 , G06V10/77 , G06V10/764 , G06V10/80 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/08
摘要: 本发明涉及图像处理技术,揭露了工业场景下的开集目标检测方法,包括:获取工业图像数据,将工业图像数据输入至空间到深度卷积模块中进行特征提取,得到工业图像数据特征;将工业图像数据特征利用瓶颈注意模块进行特征降维操作,得到细化工业图像数据特征;利用膨胀卷积模块提取工业图像数据中的局部信息,并将局部信息映射至细化工业图像数据特征中,得到目标工业图像数据特征;将目标工业图像数据特征利用条状池化模块进行池化,得到最终工业图像数据特征,根据最终工业图像数据特征进行目标检测,得到目标检测结果。本发明还提出一种工业场景下的开集目标检测装置、设备以及存储介质。本发明可以提高工业场景下的开集目标检测的准确率和效率。
-
公开(公告)号:CN118657942A
公开(公告)日:2024-09-17
申请号:CN202410811465.9
申请日:2024-06-21
申请人: 七腾机器人有限公司
IPC分类号: G06V10/26 , G06V10/42 , G06V10/80 , G06V30/146 , G06V10/25 , G06V10/774 , G06V10/82 , G06N3/0455
摘要: 本申请涉及语义分割技术的领域,尤其涉及一种工业场景下的多模态语义分割方法、系统、装置及存储介质。其中,工业场景下的多模态语义分割方法包括获取包含待识别对象的RGB检测图像和待识别对象的文本数据;将所述RGB检测图像和所述文本数据输入语义分割模型,通过所述语义分割模型分别提取所述RGB检测图像的图像特征和所述文本数据的文本特征,将所述图像特征与所述文本特征进行对齐和融合得到处理后的语义特征,并基于所述语义特征评判所述RGB检测图像为目标对象的概率作为输出,得到对所述RGB检测图像的识别结果,能够提高复杂工业场景下待识别目标物体语义分割效果。
-
公开(公告)号:CN118172776A
公开(公告)日:2024-06-11
申请号:CN202410152010.0
申请日:2024-02-02
申请人: 七腾机器人有限公司
摘要: 本发明提供了一种频闪变化的LED数字表识别方法、设备及巡检系统。该方法包括:获取巡检机器人录制的设定时长的LED数字表视频;按照预设抽帧方法从所述LED数字表视频中抽取N帧图像;对N帧图像进行融合处理获得至少一张融合图像,融合处理包括:确定LED数字表的读数颜色通道;将多帧待融合图像的读数颜色通道的通道值进行最大值融合,将多帧待融合图像的第二通道的通道值进行平均值融合,第二通道为RGB三个通道中除读数颜色通道之外的通道;将至少一张融合图像分别输入预设的读数识别模型获得读数。本申请最大程度地保留了读数颜色通道的通道值,准确复原读数,解决了单次拍照采集读数方式的数字缺失问题,降低了漏检率。
-
公开(公告)号:CN116844022A
公开(公告)日:2023-10-03
申请号:CN202310850616.7
申请日:2023-07-11
申请人: 七腾机器人有限公司
IPC分类号: G06V10/82 , G06N3/0464 , G06N3/09 , G06N3/082 , G06V10/762 , G06V20/40
摘要: 本发明涉及人工智能技术,揭露了一种基于轻量化模型的监督方法,包括:获取监督目标的历史图像数据;对所述历史图像数据执行图像预处理,并将预处理后的图像数据根据预设图像数据格式转化成目标图像数据;利用所述目标图像数据训练预构建的目标检测模型,训练完成后得到标准目标检测模型;利用所述标准目标检测模型分析实时视频数据,在所述实时视频数据中检测到预设目标时,推送目标检测结果至预设设备端进行示警。本发明还提出一种基于轻量化模型的监督装置、电子设备以及存储介质。本发明可以提高施工作业环境下,对出现的异常情况执行示警的实时性。
-
-
-