-
公开(公告)号:CN108921298B
公开(公告)日:2022-04-19
申请号:CN201810606662.1
申请日:2018-06-12
Applicant: 中国科学技术大学
Abstract: 本发明公开了一种强化学习多智能体沟通与决策方法,包括:根据各个智能体的观测状态信息通过神经网络提取相应的状态特征;将所有智能体的状态特征作为沟通信息输入至VLAD层中进行软分配与聚类,得到聚类后的沟通信息;将聚类后的沟通信息分发给各个智能体,由各个智能体将自身的状态特征与接收到的聚类后的沟通信息进行聚合,并通过智能体内部的全连接神经网络进行动作决策。该方法可以对各智能体的状态信息进行聚类并与其他智能体进行沟通,进而提高智能体的决策水平。
-
公开(公告)号:CN114332466A
公开(公告)日:2022-04-12
申请号:CN202210237914.4
申请日:2022-03-11
Applicant: 中国科学技术大学
Abstract: 本发明公开了一种图像语义分割网络持续学习方法、系统、设备及存储介质,一方面,通过特征空间中的非线性变换提取旧知识表征进行对齐的手段,有效保持旧知识不变性的同时提高对新知识学习的能力。另一方面,在嵌入空间中对新类别优化其拓扑结构,对旧类别维护其拓扑结构的不变性,达到降低遗忘,防止类间混淆的效果;此外,联合伪标签及伪标签降噪技术,使得在语义分割持续学习中无需提供旧类别的标签,降低标注成本。总体来说,本发明作为一种通用性的语义分割持续学习方法,对应用场景均无限制,具有很强的泛化能力与实用价值。
-
公开(公告)号:CN107239778B
公开(公告)日:2020-01-03
申请号:CN201710432232.8
申请日:2017-06-09
Applicant: 中国科学技术大学
Abstract: 本发明公开了一种高效准确的车牌识别方法,包括:对输入的车牌图片进行车牌紧致化处理,获得紧致的车牌图片;使用预先训练好的全卷积神经网络模型进行车牌整体识别,获得紧致的车牌图片中每一像素点字符类别的预测结果,形成标签得分矩阵;对标签得分矩阵进行分析,获得最终的车牌字符串信息。该方法无需进行字符分割,避免了现有方法在分割字符时鲁棒性差的问题;其次,本发明使用全卷积神经网络进行车牌识别,只需进行一次识别过程,算法效率高,且在识别过程中结合了车牌完整的上下文信息,大大提高了识别的准确度和鲁棒性;最后,本发明在进行标签矩阵分析时,针对不同的车牌和不同的字符进行差异化处理,进一步提高了算法的鲁棒性和适用性。
-
公开(公告)号:CN108664931A
公开(公告)日:2018-10-16
申请号:CN201810449678.6
申请日:2018-05-11
Applicant: 中国科学技术大学
Abstract: 本发明公开了一种多阶段视频动作检测方法,包括:对于输入的未剪切视频通过基于深度残差网络的二分类与投票融合策略,生成融合多尺度采样与单尺度训练的粗动作片段;对于粗动作片段,基于帧级动作识别结果,采用统计融合策略进行动作类别与动作边界的联合判别,获得初步的动作检测片段;结合初步的动作检测片段之间的IoU,利用改进的非极大值抑制算法对初步的动作检测片段进行处理,最终获得未剪切视频的动作检测结果,即每个视频动作检测片段的动作类别和起止时间位置。该方法可以提高动作分类准确率,并提高动作定位精度。
-
公开(公告)号:CN114495282B
公开(公告)日:2024-11-05
申请号:CN202210135464.8
申请日:2022-02-14
Applicant: 中国科学技术大学
IPC: G06V40/20 , G06V10/764 , G06V10/62 , G06V10/80 , G06V10/82
Abstract: 本发明公开了一种视频动作检测方法、系统、设备及存储介质,一方面,本发明针对性地建模动作执行者之间的交互关系,充分利用了视频信号的时空特性,可以极大地增强目标特征的表达能力,进而大幅提升交互类动作的识别效果;另一方面,本发明利用自注意力机制挖掘不同动作类之间的依赖关系,使得原始类别表征的鲁棒性和区分度进一步提高,以较低的计算代价解决了多标签问题。
-
公开(公告)号:CN118279689A
公开(公告)日:2024-07-02
申请号:CN202211731751.1
申请日:2022-12-30
Applicant: 合肥中科类脑智能技术有限公司 , 中国科学技术大学
IPC: G06V10/774 , G06V10/764 , G06V10/25 , G06T11/40 , G06T11/60
Abstract: 本发明公开了一种基于跨集合的样本分类的方法,该方法主要包含两个计算过程:首先是难例样本构建工作,采用对训练样本进行数据增强,以挖掘有助于模型训练的难例样本;然后是跨集数据增强操作,使用训练支持集中构建出的难例样本来扩增训练查询集,再进行情景训练,使模型能更加完整的响应目标区域,解决了现有的小样本分类方法存在的难以响应完整的目标区域,导致鲁棒性差、准确度低的问题,显著了提升小样本分类的性能。
-
公开(公告)号:CN117253097A
公开(公告)日:2023-12-19
申请号:CN202311541384.3
申请日:2023-11-20
Applicant: 中国科学技术大学
IPC: G06V10/764 , G06V10/774 , G06V10/82 , G06N3/0895
Abstract: 本发明公开了一种半监督域适应图像分类方法、系统、设备及存储介质,它们是一一对应的方案,方案中:使用灵敏度加权的特征对比损失与概率空间对比损失,在原有的特征对比学习的方法上,在概率空间构建对比损失,对齐多个维度的目标域特征并且同步特征提取器和分类器的优化,防止分类器因为偏向源域样本而导致的次优的领域迁移效果;并且,使用灵敏度分数引导网络关注具有挑战性的目标域样本,着重解决会导致分类效果差的少数困难样本;同时,伪标签监督概率空间对比损失,避免语义冲突的发生,使网络学习到更好的领域不变特征。总的来说,本发明利用联合对比学习,结合灵敏度分数和类别感知,提升了半监督域适应的图像分类准确率。
-
公开(公告)号:CN116563953B
公开(公告)日:2023-10-20
申请号:CN202310830419.9
申请日:2023-07-07
Applicant: 中国科学技术大学
IPC: G06V40/20 , G06V10/762 , G06V10/764 , G06V10/74 , G06V20/40 , G06N3/0895 , G06V10/82
Abstract: 本发明公开了一种自底向上的弱监督时序动作检测方法、系统、设备及介质,它们是一一对应的方案,方案中:通过帧级聚类对视频帧进行精确分布分析,随后通过一个簇级分类对聚类簇簇进行前背景分类,从而间接地实现对前景帧和背景帧的分离,这种自底向上的建模方式既能够为视频时序动作检测带来更多细粒度的监督信号,从而减少对视频监督信号的依赖,同时也能够兼顾准确的前背景分离,再结合弱监督视频时序动作检测模型获得的类激活序列以及帧级的注意力权重,可以准确的实现视频时序动作检测。
-
公开(公告)号:CN116363374B
公开(公告)日:2023-08-29
申请号:CN202310648233.1
申请日:2023-06-02
Applicant: 中国科学技术大学
IPC: G06V10/26 , G06V10/44 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种图像语义分割网络持续学习方法、系统、设备及存储介质,通过在特征空间中使用对比学习对新增类别的类别知识进行挖掘,显著降低语义分割网络在后续学习阶段特征空间的优化难度,进而提升其对新类别的学习性能。而且,在输出空间中训练一辅助分类器可降低网络模型的优化难度并提升新类别的识别性能;此外,联合伪标签及伪标签降噪技术,使得在语义分割持续学习中无需提供旧类别的标签,降低标注成本。相较于现有方法,本发明无需对知识蒸馏损失进行特殊设计即可显著提升新类别性能,从而提供了一种泛用的、全新的解决方案。本发明作为一种通用性的语义分割持续学习方法,对应用场景均无限制,具有很强的泛化能力与实用价值。
-
公开(公告)号:CN116309653B
公开(公告)日:2023-08-29
申请号:CN202310560357.4
申请日:2023-05-18
Applicant: 中国科学技术大学
IPC: G06T7/12 , G06T5/50 , G06V10/26 , G06V10/80 , G06V10/774
Abstract: 本发明公开了一种弱监督图像语义分割方法、系统、设备及存储介质,它们是一一对应的方案,方案中:通过训练一个孪生网络,对图像的不确定像素进行网络间的交互监督,以实现网络对不确定像素的鲁棒学习,减缓伪标签噪声的影响;同时针对边界噪声的问题,通过构造一些边界已知的样本来增强边缘区域的预测能力;综上,本发明通过结合提出的边界增强和协同训练方式,有效减缓了伪标签噪声的影响,提高了网络的语义分割性能,能够更为准确的实现图像的语义分割。
-
-
-
-
-
-
-
-
-