-
公开(公告)号:CN118193768A
公开(公告)日:2024-06-14
申请号:CN202410377832.9
申请日:2024-03-29
申请人: 山东大学
IPC分类号: G06F16/532 , G06F16/53 , G06V20/70 , G06V10/82 , G06V10/42 , G06V10/44 , G06N3/0499 , G06N3/09
摘要: 本发明提供了一种基于细粒度文本反转的多模态组合式图像检索方法及系统,获取参考图像和修改文本;利用预训练后的细粒度文本反转网络,将参考图像映射为面向主体的伪词标记和面向属性的伪词标记,并和修改文本拼接得到文本形式的组合查询,利用所述组合查询的表示向量与目标图像向量之间的余弦相似度作为检索的依据,以检索对应的图片。本发明基于图像的全局特征和局部特征分别得到面向主体的伪词标记和面向属性的伪词标记,并利用不同的基于标题的语义正则约束来规范伪词标记,实现更加高效精准的检索效果。
-
公开(公告)号:CN117809028A
公开(公告)日:2024-04-02
申请号:CN202311567341.2
申请日:2023-11-22
申请人: 山东大学
IPC分类号: G06V10/26 , G06V20/70 , G06V10/44 , G06V10/52 , G06V10/80 , G06V10/82 , G06V10/764 , G06N3/0464 , G06N3/0455 , G06N3/098 , G06N5/04
摘要: 本发明涉及基于跨模态交互推理的图像指代物体分割方法及系统,包括:对给定图片进行理解并生成相应的视觉特征;对给定查询语句进行有效表征,生成文本特征;文本特征与视觉特征联合编码;构建多模态图,进行跨模态图推理,进行目标物体的粗定位;对不同尺度下的跨模态特征进行特征增强,细化分割结果。本发明可以结合对视觉信息的理解来增强语言表达,进而在语言表达的不断引导下对重要的视觉特征进行编码。本发明使用多模态特征和语言特征构建多模态图,然后通过跨图交互和图内推理定位目标物体。本发明在多尺度上增强多模态特征,对来自编码阶段的特征自底向上地逐步细化,以实现精细分割。
-
-
公开(公告)号:CN115240075B
公开(公告)日:2022-12-13
申请号:CN202211154588.7
申请日:2022-09-22
申请人: 山东大学 , 智洋创新科技股份有限公司 , 国网浙江省电力有限公司温州供电公司 , 华北电力大学(保定) , 浙江大华技术股份有限公司 , 山东省计算中心(国家超级计算济南中心)
IPC分类号: G06V20/10 , G06V10/25 , G06V10/40 , G06V10/764 , G06V10/774 , G06V10/82 , G06T5/00 , G06N3/04 , G06N3/08
摘要: 本发明涉及输电线路巡检技术领域,具体涉及一种电力视觉多粒度预训练大模型的构建与训练方法,包括图像修复、图像分类、目标检测、图像描述四个粒度层级的视觉任务;采用多阶段的大模型训练方法,使得模型具有数据挖掘、增量训练和模型进化的功能;其中,第一阶段在海量公开数据集上训练,输出预训练大模型;第二阶段在大量无标签电力场景数据集上进行自监督训练,输出电力视觉多粒度预训练大模型;第三阶段利用大模型针对电力数据集进行隐患图像筛选,大大减轻了人工筛选代价,将隐患图像数据交由人工进行精细化标注,再次输入大模型进行迭代优化,使得视觉预训练大模型更加适配电力场景视觉任务需求。
-
公开(公告)号:CN115272777A
公开(公告)日:2022-11-01
申请号:CN202211169230.1
申请日:2022-09-26
申请人: 山东大学 , 智洋创新科技股份有限公司 , 国网浙江省电力有限公司温州供电公司 , 浙江大华技术股份有限公司 , 华北电力大学(保定) , 山东省计算中心(国家超级计算济南中心)
IPC分类号: G06V10/764 , G06V10/772 , G06V10/774 , G06V10/82 , G06N3/08
摘要: 本发明涉及输电线路巡检技术领域,具体涉及一种面向输电场景的半监督图像解析方法,包括以下步骤:S1:数据预处理:人工标注部分输电线路场景的分类数据集和目标检测数据集;S2:数据集的增广和模型优化训练:使用动态参数混合数据增广框架对有标注数据集进行数据增广和模型优化训练,将参数化后的混合数据增广策略融入到判别模型中;S3:半监督训练方法改良:基于S2中经过动态参数混合数据增广优化的模型,使用基于队列优化的鲁棒半监督训练方法,以最优队列的标签筛选策略替换传统的固定高阈值策略,来筛选高置信度伪标签以计算无监督损失;S4:获取S3中预训练好的模型参数,在输电线路图像解析的下游任务中测试效果。
-
公开(公告)号:CN115240075A
公开(公告)日:2022-10-25
申请号:CN202211154588.7
申请日:2022-09-22
申请人: 山东大学 , 智洋创新科技股份有限公司 , 国网浙江省电力有限公司温州供电公司 , 华北电力大学(保定) , 浙江大华技术股份有限公司 , 山东省计算中心(国家超级计算济南中心)
IPC分类号: G06V20/10 , G06V10/25 , G06V10/40 , G06V10/764 , G06V10/774 , G06V10/82 , G06T5/00 , G06N3/04 , G06N3/08
摘要: 本发明涉及输电线路巡检技术领域,具体涉及一种电力视觉多粒度预训练大模型的构建与训练方法,包括图像修复、图像分类、目标检测、图像描述四个粒度层级的视觉任务;采用多阶段的大模型训练方法,使得模型具有数据挖掘、增量训练和模型进化的功能;其中,第一阶段在海量公开数据集上训练,输出预训练大模型;第二阶段在大量无标签电力场景数据集上进行自监督训练,输出电力视觉多粒度预训练大模型;第三阶段利用大模型针对电力数据集进行隐患图像筛选,大大减轻了人工筛选代价,将隐患图像数据交由人工进行精细化标注,再次输入大模型进行迭代优化,使得视觉预训练大模型更加适配电力场景视觉任务需求。
-
公开(公告)号:CN115223049A
公开(公告)日:2022-10-21
申请号:CN202211140194.6
申请日:2022-09-20
申请人: 山东大学 , 国网浙江省电力有限公司温州供电公司 , 华北电力大学(保定) , 智洋创新科技股份有限公司 , 南瑞集团有限公司 , 山东省计算中心(国家超级计算济南中心)
IPC分类号: G06V20/10 , G06V10/74 , G06V10/774 , G06V10/82 , G06N3/08
摘要: 本发明属于压缩技术领域,具体提供了一种面向电力场景边缘计算大模型压缩的知识蒸馏与量化技术。其包括以下步骤:电力场景任务抽象;双层知识蒸馏网络单元构建;教师模型修饰处理;主从教师监督框架:基于教师‑学生蒸馏网络,使用多个数据集训练不同的教师模型,包括与目标任务类似的场景数据集和实际落地场景的数据集,将这些数据集进行划分,训练多个教师模型,按照数据集与落地场景相似度分配指导权重,分为主教师模型和若干个从教师模型,从而对学生模型进行不同层面的知识引导,提高学生模型在复杂场景下的泛化能力;学生模型压缩感知训练。
-
公开(公告)号:CN114862055A
公开(公告)日:2022-08-05
申请号:CN202210622952.1
申请日:2022-06-01
申请人: 河钢数字技术股份有限公司 , 山东大学 , 青岛海尔智能技术研发有限公司
摘要: 本发明公开了一种基于多源数据驱动的钢铁企业高炉煤气预测方法,步骤一:建立包含高炉煤气发生量、高炉煤气消耗量及其影响因素的实时数据库;步骤二:对步骤一生成的CSV文件进行预处理;步骤三:对原始数据进行数据分析,计算煤气量与其所有潜在影响因素的相关系数;步骤四:制作相应的训练样本,并划分训练数据集、验证数据集和测试数据集;步骤五:使用一维卷积神经网络和循环神经网络,对高炉煤气产生量和高炉煤气消耗量及其主要影响因素进行特征提取操作;本发明通过将卷积神经网络和循环神经网络应用到高炉煤气产消量的预测上,利用煤气历史量和主要影响因素相结合的多源数据进行驱动,实现了全自动、低误差率的实时动态煤气量预测。
-
公开(公告)号:CN114758285A
公开(公告)日:2022-07-15
申请号:CN202210663949.4
申请日:2022-06-14
申请人: 山东省人工智能研究院 , 山东大学 , 青岛海尔智能技术研发有限公司 , 泰华智慧产业集团股份有限公司
IPC分类号: G06V20/40 , G06K9/62 , G06V10/774
摘要: 本发明方法公开了基于锚自由和长时注意力感知的视频交互动作检测方法,属于计算机视觉和模式识别技术领域,实现了对长视频中动作部分的高效定位以及动作识别。方法的具体步骤如下:视频特征提取;搭建基于锚自由和长时注意力感知的视频交互双流网络模型;构建基于锚自由和长时注意力感知的视频交互动作检测方法的目标函数;基于锚自由和长时注意力感知的视频交互动作检测方法。本发明基于已知数据集训练后可对长视频的动作进行有效定位并进行动作识别,有效地解决了传统动作分类方法无法在长视频中进行有效分类的问题,并且提升收敛速度,提升了工作效率。
-
公开(公告)号:CN111291699B
公开(公告)日:2022-06-03
申请号:CN202010103140.7
申请日:2020-02-19
申请人: 山东大学 , 智洋创新科技股份有限公司 , 国网浙江省电力有限公司衢州供电公司 , 国网浙江省电力有限公司
IPC分类号: G06V20/40 , G06V10/762 , G06V10/764 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08 , G06Q50/06 , G06Q50/26
摘要: 一种基于监控视频时序动作定位和异常检测的变电站人员行为识别方法,利用先验知识进行了变电站人员异常行为监控视频数据集的自主采集、处理和构建,引入了新的变电站异常行为检测视频数据集;本发明通过基于迁移学习的视频动作检测模型对时序信息进行获取,可以实现精确的监控视频时序动作定位,从而在一段未剪辑的视频中找到工作人员动作开始和结束的时间,并对动作进行分类。同时,对于视频动作检测得到的人员特定行为视频片段。本发明利用视频异常检测技术,通过采用多示例学习在弱监督下进行训练,得到的模型可以判断片段中是否存在异常行为,实现了准确检测异常行为及发生的时序位置,提高了变电站视频监控的利用价值和异常检测准确性。
-
-
-
-
-
-
-
-
-