-
公开(公告)号:CN116030538B
公开(公告)日:2023-06-16
申请号:CN202310326090.2
申请日:2023-03-30
Applicant: 中国科学技术大学
IPC: G06V40/20 , G06V20/40 , G06V10/764 , G06V10/774 , G06V10/82 , G06N3/04 , G06N3/0895
Abstract: 本发明公开了一种弱监督动作检测方法、系统、设备及存储介质,它们是对应的方案,方案中:根据两种不同分支的动作预测结构,筛选出预测结果不一致的模糊视频帧,并使用对比学习,可以帧促进不一致视频帧的特征学习;通过对双分支进行一致性约束来减少双分支的差异,从而缓解了因双分支差异过大而导致的无法维持足够多的视频帧进行对比学习的问题,同时利用双分支的协同学习进一步加强动作检测结果的可靠性;通过施加类别无关动作检测分支内部的一致性约束可减小训练类别无关动作性预测分支时由于伪标签误差所带来的影响;总体而言,本发明通过利用对比学习和一致性约束,提升了动作检测网络的检测性能,保证了动作检测的准确性与可靠性。
-
公开(公告)号:CN116030538A
公开(公告)日:2023-04-28
申请号:CN202310326090.2
申请日:2023-03-30
Applicant: 中国科学技术大学
IPC: G06V40/20 , G06V20/40 , G06V10/764 , G06V10/774 , G06V10/82 , G06N3/04 , G06N3/0895
Abstract: 本发明公开了一种弱监督动作检测方法、系统、设备及存储介质,它们是对应的方案,方案中:根据两种不同分支的动作预测结构,筛选出预测结果不一致的模糊视频帧,并使用对比学习,可以帧促进不一致视频帧的特征学习;通过对双分支进行一致性约束来减少双分支的差异,从而缓解了因双分支差异过大而导致的无法维持足够多的视频帧进行对比学习的问题,同时利用双分支的协同学习进一步加强动作检测结果的可靠性;通过施加类别无关动作检测分支内部的一致性约束可减小训练类别无关动作性预测分支时由于伪标签误差所带来的影响;总体而言,本发明通过利用对比学习和一致性约束,提升了动作检测网络的检测性能,保证了动作检测的准确性与可靠性。
-
公开(公告)号:CN111008600B
公开(公告)日:2023-04-07
申请号:CN201911241946.6
申请日:2019-12-06
Applicant: 中国科学技术大学
IPC: G06V20/56 , G06V10/764
Abstract: 本发明公开了一种车道线检测方法,包括:构建车道线回归检测网络,通过对输入图像进行处理,获得输入图像中车道线起始位置图和车道线曲线参数图;对一系列车道线图像进行预处理,得到训练数据集;采用分类回归融合训练方法训练车道线回归检测网络,得到车道线回归检测模型;对于待检测图像,通过车道线回归检测模型获得车道线起始位置图和车道线曲线参数图,进而获得完整车道线。该方法直接预测车道线曲线参数,无需繁琐的后处理步骤,解决了现有方法在进行车道线检测时对环境干扰过于敏感而导致的检测鲁棒性差、效率低下等问题,使得车道线检测算法可应用于交通监控等复杂场景下。
-
公开(公告)号:CN114627312B
公开(公告)日:2022-09-06
申请号:CN202210534202.9
申请日:2022-05-17
Applicant: 中国科学技术大学
Abstract: 本发明公开了一种零样本图像分类方法、系统、设备及存储介质,为了建模属性中包含的具体信息,使用通道选择与空间抑制两个操作对视觉特征进行更新,从而定位视觉特征图中与语义属性相关且具有判别性的部分区域;为了建模对应于空间中多个部位关系的抽象属性,使用视觉特征与语义属性交互的方式,对抽象属性进行判别;本发明的上述方案通过动态建模来自适应地调整语义属性的表征,能够改善同一属性在不同物体上的视觉表征不一致的问题。实验结果表明本发明所提出方法在零样本图像分类任务上能够大幅提升分类准确率。
-
公开(公告)号:CN114359711A
公开(公告)日:2022-04-15
申请号:CN202111508103.5
申请日:2021-12-10
Applicant: 国网安徽省电力有限公司超高压分公司 , 中国科学技术大学先进技术研究院 , 国家电网有限公司
Inventor: 董翔宇 , 朱涛 , 刘之奎 , 徐斓瑛 , 容圣海 , 李腾 , 廖军 , 罗沙 , 谢佳 , 李卫国 , 黄道均 , 王子磊 , 周正 , 张俊杰 , 王刘芳 , 李冀 , 刘鑫 , 朱元付 , 常文婧
IPC: G06V20/10 , G06V10/40 , G06V10/774 , G06V10/764 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08 , G06T3/40
Abstract: 本发明提供一种自适应步幅卷积的细粒度图像识别方法及系统,属于图像识别技术领域。所述识别方法包括:将待分类图像输入注意力图提取器中以得到具有突出判别区域的注意力图,其中,所述注意力图提取器包括卷积神经网络、特征图重塑模块和三线性乘积模块,所述卷积神经网络用于根据所述待分类图像生成对应的特征图,所述特征图重塑模块用于将所述特征图重塑成矩阵,所述三线性乘积模块用于根据所述矩阵生成所述注意力图;采用步幅向量生成器根据所述注意力图生成用于表示卷积核分别沿着x轴和y轴方向上扫描的步幅向量;采用动态步幅卷积模块根据所述步幅向量对所述特征图进行滑窗计算以得到所述识别结果。该识别方法及系统能够提高图像识别的准确性。
-
公开(公告)号:CN114332568A
公开(公告)日:2022-04-12
申请号:CN202210258343.2
申请日:2022-03-16
Applicant: 中国科学技术大学
IPC: G06V10/774 , G06V10/764 , G06V10/82 , G06K9/62 , G06N3/04
Abstract: 本发明公开了一种域适应图像分类网络的训练方法、系统、设备及存储介质,引入对比学习将相同语义的特征聚类,解决域适应图像分类任务在目标域标签不足的问题;本发明将特征对比学习改进为概率对比学习,通过在概率空间进行对比学习,减小聚类后的同语义特征与类权重之间的距离,提高分类的准确率;并且,仅添加了一个对比学习的损失(即总的概率对比损失),并未添加复杂的附加模块,参数量与之前的方法相比没有增加。总体来说,本发明在不添加其他附加模块的情况下提升模型整体性能,能够获得更精确的图像分类结果。
-
公开(公告)号:CN108805083B
公开(公告)日:2022-03-01
申请号:CN201810607804.6
申请日:2018-06-13
Applicant: 中国科学技术大学
IPC: G06V40/20 , G06V20/40 , G06V10/774 , G06V10/82 , G06K9/62
Abstract: 本发明公开了一种单阶段的视频行为检测方法,其包括:在训练阶段,基于卷积神经网络构建多尺度行为片段回归网络;将训练视频和帧级真实行为标签作为输入,使用多任务学习的端到端优化方法训练多尺度行为片段回归网络,获得训练好的多尺度行为片段回归网络模型;在使用阶段,当新视频输入时,通过时间维度滑窗生成与训练视频具有相同长度的输入帧序列,使用训练好的多尺度行为片段回归网络模型,预测输入帧序列的行为类别和对应的时间位置;再使用非极大值抑制对预测结果进行处理,产生最终的行为检测结果。该方法可以提高检测性能与检测效率。
-
公开(公告)号:CN108664931B
公开(公告)日:2022-03-01
申请号:CN201810449678.6
申请日:2018-05-11
Applicant: 中国科学技术大学
Abstract: 本发明公开了一种多阶段视频动作检测方法,包括:对于输入的未剪切视频通过基于深度残差网络的二分类与投票融合策略,生成融合多尺度采样与单尺度训练的粗动作片段;对于粗动作片段,基于帧级动作识别结果,采用统计融合策略进行动作类别与动作边界的联合判别,获得初步的动作检测片段;结合初步的动作检测片段之间的IoU,利用改进的非极大值抑制算法对初步的动作检测片段进行处理,最终获得未剪切视频的动作检测结果,即每个视频动作检测片段的动作类别和起止时间位置。该方法可以提高动作分类准确率,并提高动作定位精度。
-
公开(公告)号:CN110503716A
公开(公告)日:2019-11-26
申请号:CN201910738871.6
申请日:2019-08-12
Applicant: 中国科学技术大学
Abstract: 本发明涉及一种机动车车牌合成数据生成方法,首先,从官方公开的规范文件上获取车牌字体并进行建模,使得合成的车牌数据贴近真实车牌的情况;其次,利用虚拟引擎构建场景并进行全方位渲染,自动生成标注,提高了数据集的采集生成效率;再次,从天气、光照、距离、角度等方面设置多样化的车牌生成条件,获得覆盖更加全面的数据;最后,利用风格迁移技术对所生成的合成车牌数据进行风格迁移,减小了人工合成图像与真实图像域之间的差异。
-
公开(公告)号:CN107071578B
公开(公告)日:2019-11-22
申请号:CN201710373843.X
申请日:2017-05-24
Applicant: 中国科学技术大学
IPC: H04N21/466 , H04N21/475 , H04N21/482 , H04N21/45 , H04N21/258
Abstract: 本发明公开了一种IPTV节目推荐方法,包括:根据用户的观看日志,构建用户收视矩阵;对用户收视矩阵依次进行低秩去噪、周期性压缩与观看模式提取,从而获得用户的周期性观看场景;将周期性观看场景中的每一观看模式作为一兴趣用户,并构建所有兴趣用户的评分矩阵;对当前观看模式进行识别,从而确定当前兴趣用户,再采用联合推荐策略,从历史影料库和当前直播的节目中推荐用户感兴趣的节目,生成推荐列表推送给用户。该方法能够较好地处理IPTV终端的多成员情况,提高了推荐的精确度;同时,还采用直播和点播融合的推荐策略,使得用户得到更加全面的推荐内容。
-
-
-
-
-
-
-
-
-