-
公开(公告)号:CN119131393A
公开(公告)日:2024-12-13
申请号:CN202411254918.9
申请日:2024-09-09
Applicant: 中国科学技术大学
IPC: G06V10/26 , G06V10/774 , G06V10/778 , G06V10/80 , G06V10/82 , G06V20/70 , G06N3/091 , G06N3/096
Abstract: 本发明公开了一种主动域适应语义分割方法、系统、设备及存储介质,以超像素为单元进行选择标注,与图像级和像素级标注方法不同,超像素级标注通过仅为每个超像素分配一个语义类别大大提升了标注效率;此外,不同与现有方案基于不确定度的选择标注策略,本发明重点关注域适应场景下的难例样本,并提出基于域信息量的选择策略,选择对域适应学习最有价值的超像素进行标注;通过采用超像素级标注方法和基于域信息量的选择策略,本发明在大大降低标注成本的同时提高了标注的质量,保障了域适应语义分割的性能。
-
公开(公告)号:CN116452897B
公开(公告)日:2023-10-20
申请号:CN202310717959.6
申请日:2023-06-16
Applicant: 中国科学技术大学
IPC: G06V10/764 , G06V10/774 , G06V10/762 , G06V10/82 , G06N3/045 , G06N3/096
Abstract: 本发明公开了一种跨域小样本分类方法、系统、设备及存储介质,它们是一一对应的方案,方案中:使用聚类算法直接获得目标域集无标签图像样本的伪标签,可在开发目标域语义信息的同时完全规避由自训练方法导致的类别区分混淆的弊端,也免除了训练弱分类器所带来的时间与算力耗费;并且,通过在源域集与伪标注的目标域子集上构建一个领域混合训练任务,利用目标语义信息(以伪标签形式表达)促进模型向目标域的迁移,上述方式使模型对于目标域的适应性与分类效果都有更好的提升。
-
公开(公告)号:CN116612420A
公开(公告)日:2023-08-18
申请号:CN202310891912.1
申请日:2023-07-20
Applicant: 中国科学技术大学
IPC: G06V20/40 , G06V10/44 , G06V10/764 , G06V10/82 , G06N3/048 , G06V10/774
Abstract: 本发明公开了一种弱监督视频时序动作检测方法、系统、设备及存储介质,它们是一一对应的方案,方案中:设计了一种脱离分类任务的自训练分支,该分支可以不受动作上下文信息的干扰生成综合动作序列;并且对于预测结果中的假阳性片段做了针对性的设计,通过对假阳性片段的概率进行建模,并对高概率片段进行抑制,从而大幅度减少了假阳性片段的数量;此外,还设计了前景增强分支,增强模型对前景片段的识别能力。总的来说,本发明针对假阳性片段进行了有效抑制,提升了模型的检测性能。
-
公开(公告)号:CN114998602B
公开(公告)日:2022-12-30
申请号:CN202210942337.9
申请日:2022-08-08
Applicant: 中国科学技术大学
IPC: G06V10/40 , G06N3/04 , G06V10/24 , G06V10/26 , G06V10/74 , G06V10/764 , G06V10/774 , G06V10/80 , G06V10/82
Abstract: 本发明公开了一种基于低置信度样本对比损失的域适应学习方法及系统,使用对比学习的方法,在原有的利用目标域高置信度样本的域适应方法上,充分利用目标域低置信样本,防止图像分类模型因偏向目标域中与源域相近的样本而导致的次优的领域迁移效果;而且,在对比学习中,对原始的图像特征进行重新表示,更好地编码了任务特有的语义信息;此外,对低置信样本使用了跨域混合,并使低置信样本在其中占主导,减小了领域差异,使图像分类模型更好的学习领域不变特征。总的来说,本发明利用了低置信样本,提升了无监督域适应和半监督域适应图像分类的准确率。
-
公开(公告)号:CN115482262A
公开(公告)日:2022-12-16
申请号:CN202210910738.6
申请日:2022-07-29
Applicant: 国网安徽省电力有限公司超高压分公司 , 国网安徽省电力有限公司 , 中国科学技术大学先进技术研究院
Inventor: 董翔宇 , 樊培培 , 刘之奎 , 朱涛 , 李腾 , 宋健 , 蒋欣峰 , 葛健 , 刘锋 , 柯艳国 , 罗沙 , 谢佳 , 王子磊 , 张俊杰 , 黄道均 , 马欢 , 石玮佳 , 方晶晶 , 索浩银 , 方波 , 张晗
Abstract: 本发明实施例提供一种基于多智能强化学习的自然图像的几何配准方法及模型,属于图像识别技术领域。所述几何配准方法包括:获取源图像和配准图像;对所述源图像和配准图像分别执行结构信息提取操作以得到对应的第一特征和第二特征;根据所述第一特征和第二特征执行注意力相关图计算操作以得到注意相关图;根据所述注意力相关图分别执行多次策略网络计算操作以得到对应的多个第一向量;根据所述第一向量和所述注意相关图执行值融合网络计算操作以得到配准参数。该几何配准方法及模型能够准确完成图像配准操作。
-
公开(公告)号:CN115239621A
公开(公告)日:2022-10-25
申请号:CN202210658300.3
申请日:2022-06-10
Applicant: 国网安徽省电力有限公司超高压分公司 , 中国科学技术大学先进技术研究院
IPC: G06T7/00 , G06T19/00 , G06V10/28 , G06V10/44 , G06V10/75 , G06V10/774 , G06V10/82 , G06N3/08 , G06N3/04 , G06Q50/06
Abstract: 本发明实施例提供一种基于虚实匹配的变电站视觉智能巡检方法,属于变电站巡检领域。所述方法通过获取的真实场景变电站的场景布局和设备分布情况生成与真实变电站场景一致的数字孪生变电站。在获取真实变电站的真实场图像后获取与其对应的虚拟场景图像,并且经过进一步的计算得到虚拟场景解析图像和与其对应的真实场景解析图像。将需要检测的设备进行分类,然后对分类后的对应的真实场景图像进行相应的检测,并将检测结果发送出去,以提醒工作人员,该方法能够大幅度的提升变电站的自动化运维水平,且能够有效提高变电站缺陷检测的效率和准确率。
-
公开(公告)号:CN110503716B
公开(公告)日:2022-09-30
申请号:CN201910738871.6
申请日:2019-08-12
Applicant: 中国科学技术大学
Abstract: 本发明涉及一种机动车车牌合成数据生成方法,首先,从官方公开的规范文件上获取车牌字体并进行建模,使得合成的车牌数据贴近真实车牌的情况;其次,利用虚拟引擎构建场景并进行全方位渲染,自动生成标注,提高了数据集的采集生成效率;再次,从天气、光照、距离、角度等方面设置多样化的车牌生成条件,获得覆盖更加全面的数据;最后,利用风格迁移技术对所生成的合成车牌数据进行风格迁移,减小了人工合成图像与真实图像域之间的差异。
-
公开(公告)号:CN112016556B
公开(公告)日:2022-07-15
申请号:CN202010851716.8
申请日:2020-08-21
Applicant: 中国科学技术大学
Inventor: 王子磊
Abstract: 本发明公开了一种多类型车牌识别方法,包括:通过对待识别的车牌图像进行特征提取,获得对应的特征图;对特征图进行语义信息及位置信息提取;采用注意力机制融合语义信息和位置信息,通过共享分类器实现对车牌字符串的预测。该方法:一方面,通过显式地建模车牌字符位置信息,可以高效获取字符的位置信息进而利用位置信息进行字符识别,而无需按车牌类型分别处理;另一方面,采用注意力机制融合语义信息和位置信息,无需手动处理语义信息,避免任何繁琐的后处理步骤,算法效率高,鲁棒性强;最终,通过共享分类器,提高数据利用率且只需进行一次识别过程,有利于缓解数据不平衡问题。
-
公开(公告)号:CN114627312A
公开(公告)日:2022-06-14
申请号:CN202210534202.9
申请日:2022-05-17
Applicant: 中国科学技术大学
Abstract: 本发明公开了一种零样本图像分类方法、系统、设备及存储介质,为了建模属性中包含的具体信息,使用通道选择与空间抑制两个操作对视觉特征进行更新,从而定位视觉特征图中与语义属性相关且具有判别性的部分区域;为了建模对应于空间中多个部位关系的抽象属性,使用视觉特征与语义属性交互的方式,对抽象属性进行判别;本发明的上述方案通过动态建模来自适应地调整语义属性的表征,能够改善同一属性在不同物体上的视觉表征不一致的问题。实验结果表明本发明所提出方法在零样本图像分类任务上能够大幅提升分类准确率。
-
公开(公告)号:CN114494789A
公开(公告)日:2022-05-13
申请号:CN202210340249.1
申请日:2022-04-02
Applicant: 中国科学技术大学
IPC: G06V10/764 , G06V10/774 , G06V10/40 , G06V10/26 , G06K9/62 , G06N20/00
Abstract: 本发明公开了一种图像风格迁移模型的训练方法、系统、设备及存储介质,设计了三部分损失对图像风格迁移模型进行训练:1)通过总的对抗损失可以达到生成器和判别器的最优平衡;2)通过总的循环一致性损失可以保证生成器的重建效果;3)通过对比损失可以提升生成器的输出图像的逼真程度。综合以上三部分损失对图像风格迁移模型进行训练,能够提升图像风格迁移的能力,获得更好的风格迁移后的图像。
-
-
-
-
-
-
-
-
-