基于关系独立和特征适应器的关系增量场景图生成方法

    公开(公告)号:CN114972963B

    公开(公告)日:2025-04-22

    申请号:CN202210343339.6

    申请日:2022-03-31

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于关系独立和特征适应器的关系增量场景图生成方法。该方法包括如下步骤:获取用于训练关系增量场景图生成的、带有数据集标签的训练数据集,包含基子数据集和N个增量子数据集;使用预训练的目标检测器检测出训练数据集所有图像中的所有物体,选定关系检测器;在基子数据集上使用关系独立的训练方法训练关系检测器;在N个增量子数据集依次使用关系独立的训练方法配合特征适应器训练关系检测器;使用在第N个增量子数据集上训练好的关系检测器作为最终的关系检测器。本发明充分利用前序子任务的模型,并对各个关系进行独立建模,能够更好地适应关系增量场景图生成任务。

    一种基于自提升学习的显著性目标检测训练方法

    公开(公告)号:CN115131549B

    公开(公告)日:2024-11-08

    申请号:CN202210677715.5

    申请日:2022-06-15

    Applicant: 浙江大学

    Inventor: 李玺 曾浩 王环宇

    Abstract: 本发明公开了一种基于自提升学习的显著性目标检测训练方法。该方法包括如下步骤:使用显著性目标检测模型,预测出训练图像中的显著性物体;构建渐进式提升模块,用于预测一致连续的显著性标签,指导显著性模型的学习,并以动量更新的方式更新渐进式提升模块的网络参数;利用样本自适应模块评估生成的连续标签的质量,从而动态调节模型连续标签对于显著性模型优化过程的影响;通过数据增强的对输入图像增广变换,通过多层次一致性正则化操作,提升显著性模型的泛化能力。本发明提出的训练方法,充分利用自提升学习和一致性学习范式,能够更好地帮助显著性检测模型的训练,增强模型的准确性和泛化性。

    一种基于随机形态边缘几何建模的深度场景文本检测方法

    公开(公告)号:CN111931763B

    公开(公告)日:2024-03-12

    申请号:CN202010518387.5

    申请日:2020-06-09

    Applicant: 浙江大学

    Inventor: 李玺 王芳芳

    Abstract: 本发明公开了一种基于随机形态边缘几何建模的深度场景文本检测方法,其步骤为:S1、获取用于训练场景文本检测的图像数据集;S2、在极坐标系下对文本边缘进行采样和归一化,利用切比雪夫多项式拟合获得几何编码信息真值;S3、利用全卷积特征提取网络对图像进行特征学习与全局特征融合;S4、对候选文本的特征向量进行分类,预测实例级别的几何编码,在全监督下联合优化模型;S5、建立端到端联合学习框架预测几何编码信息,并利用预测出的编码信息解码出文本边缘的精确位置和形状;S6、对S5输出的多边形集合进行非极大值抑制得到最终文本检测结果。本发明能对场景文本进行实例级别的边缘参数化表达和有效的参数学习,从而使模型更具准确性和鲁棒性。

    一种基于记忆体的无监督域适应图片分类方法

    公开(公告)号:CN113673555B

    公开(公告)日:2023-12-12

    申请号:CN202110776679.3

    申请日:2021-07-09

    Applicant: 浙江大学

    Inventor: 李玺 郑良立 汪慧

    Abstract: 本发明公开了一种基于记忆体的无监督域适应图片分类方法,用于在给定有标签的源域数据集和无标签的目标域数据集上,通过记忆体对齐源域和目标域的分布,将源域数据集的知识迁移到目标域数据集上,在目标域数据集上获得较高的图像分类准确率。具体包括如下步骤:获取源域数据集和目标域数据集;用神经网络模型提取数据集中图片的特征,使用聚类算法辅助记忆体逐类别地存储源域和目标域的特征;训练神经网络,以源域与目标域记忆体的分布的相似性作为条件约束神经网络;不断迭代,得到训练好的网络模型;将模型应用在目标域数据集上,进行图像分类任务。本发明适用于无监督域适应领域中的知识迁移,面对各类复杂的情况具有较佳的效果和鲁棒性。

    一种针对语义分割模型的上下文不敏感的训练方法

    公开(公告)号:CN110807462B

    公开(公告)日:2022-08-30

    申请号:CN201910858848.0

    申请日:2019-09-11

    Applicant: 浙江大学

    Abstract: 本发明公开了一种针对语义分割模型的上下文不敏感的训练方法,用于对视频的语义分割算法进行大幅加速。具体包括如下步骤:1)获取用于训练语义分割的多组图像数据集,并定义算法目标;2)使用基于全卷积网络结构的模型在该数据集上进行学习;3)使用类擦去样本生成器产生新的训练样本;4)使用步骤2)得到的网络参数,在原始数据集和步骤3)生成的新样本上结合一致性约束进行优化,得到对上下文不敏感的模型。本发明挖掘语义分割的场景理解能力,所训练的模型在数据擦除、数据干扰和风格迁移等条件下具有更好的泛化能力。

    一种基于隐私保护的隐私图像处理方法、装置及设备

    公开(公告)号:CN113239852B

    公开(公告)日:2022-06-07

    申请号:CN202110582977.9

    申请日:2021-05-27

    Abstract: 本说明书实施例公开了一种基于隐私保护的隐私图像处理方法、装置及设备,该方法包括:获取待识别的包含用户隐私信息的第一图像;基于对第一图像和预设的第二图像的语义理解,采用预设的信息隐写的方式将第一图像隐写入第二图像中,得到载秘图像,其中,载秘图像对应的图像特征与第一图像对应的图像特征之间的相似度小于预设第一阈值,并与第二图像对应的图像特征之间的相似度大于预设第二阈值,第二阈值不小于第一阈值,第二图像与第一图像不同,该信息隐写的方式包括通过模型训练得到的相应模型进行信息隐写处理;将载秘图像提供给服务器,以使服务器对载秘图像中的用户隐私信息进行识别处理。

    一种基于结构感知的超快速车道线检测方法

    公开(公告)号:CN111310593B

    公开(公告)日:2022-04-19

    申请号:CN202010065160.X

    申请日:2020-01-20

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于结构感知的超快速车道线检测方法,用于在车道图像中进行超快速车道线检测问题。具体包括如下步骤:获取用于训练车道线检测方法的车道图像数据集,定义算法目标;建立基于分类的车道线预测模型;建立车道线结构模型;建立上下文全局分割特征模型;基于前述建模结果训练预测模型;使用所述学习框架的车道线预测结果。本发明用于复杂场景(复杂光照、遮挡)下的车道线检测,面对各类复杂情况具有较佳的效果和鲁棒性,同时具有极快的检测速度(大于300帧每秒)。

Patent Agency Ranking