-
公开(公告)号:CN119418342A
公开(公告)日:2025-02-11
申请号:CN202411423619.3
申请日:2024-10-12
Applicant: 厦门亿力吉奥信息科技有限公司
Inventor: 邱鹤庆 , 王震 , 王佩光 , 文昊 , 张卫东 , 邱炳煌 , 林仁杰 , 赖文雄 , 张路华 , 游伟鑫 , 蔡钦辉 , 郑安邦 , 谭景照 , 陈占帅 , 蔡良杰 , 李静 , 沈丽敏
IPC: G06V30/148 , G06V30/19 , G06V30/18
Abstract: 本发明公开了一种基于视觉大模型VLM的电力设备铭牌自动识别方法及系统,其中方法包括:S1:对采集到的图像进行预处理操作,并为每张图像生成对应的标签,得到附有标签的图像数据集;S2:将附有标签的图像数据集划分为训练集和测试集,根据图像数据集对视觉大模型进行模型训练和评估,得到训练好的视觉大模型VLM;S3:采用预训练的视觉大模型VLM对经过预处理的图像进行特征提取,得到识别的文字信息键值对;S4:对识别的文字信息键值对进行推理,根据预设的电力设备分类模型得到电力设备类型并输出对应的结构化信息。本发明解决了现有电力设备铭牌识别技术方案在效率、准确性和成本效率方面均存在明显的不足的问题。
-
公开(公告)号:CN117456549A
公开(公告)日:2024-01-26
申请号:CN202311413299.9
申请日:2023-10-27
Applicant: 厦门亿力吉奥信息科技有限公司 , 国网信息通信产业集团有限公司
IPC: G06V30/422 , G06V30/19 , G06V10/82
Abstract: 本发明涉及一种基于智能图像算法的站内专题图图元识别方法,包括以下步骤:收集站内专题图并生成预设比例的图片,再对图片进行预处理,并对预处理后的图片中的图元进行标记,将带有图元标记的图片组成训练集;构建图元识别推理模型,通过训练集对模型进行训练得到训练完成的图元识别推理模型;构建OCR识别模型,通过训练集对模型进行训练得到训练完成的OCR识别模型;分别输入训练完成的图元识别推理模型以及OCR识别模型,得到图元、图元坐标、图元名称、图元名称坐标,通过坐标绑定目标图元及其对应的文字信息,得到最终识别结果。
-