-
公开(公告)号:CN119206167A
公开(公告)日:2024-12-27
申请号:CN202411166335.0
申请日:2024-08-23
Applicant: 电子科技大学
IPC: G06V10/25 , G06V10/764 , G06V10/40 , G06V30/146 , G06V30/19 , G06V10/80 , G06V10/82
Abstract: 该发明公开了一种基于深度学习的零样本目标检测方法,涉及计算机视觉和机器学习领域。本发明的提出能够保证不增加训练开支的前提下,仅添加简单的模块就可以在现有的开放词汇目标检测模型的基础上提高基类的检测精度和对新类的泛化能力。通过对图像和文本描述进行编码和特征提取,利用全局分类评分模块对图像中的每个proposal的分类概率进行精炼,从而提高零样本目标检测的准确性和泛化能力。通过利用CLIP模型对图像的分类概率,对零样本目标检测分类器得到的每个区域候选的分类概率进行精炼,从而提高检测的准确性。
-
公开(公告)号:CN119004168A
公开(公告)日:2024-11-22
申请号:CN202411012805.8
申请日:2024-07-26
Applicant: 电子科技大学
IPC: G06F18/24 , G06F18/25 , G06F16/906
Abstract: 本发明公开了一种基于预训练模型的自适应融合多模态数据集识别方法,涉及深度学习领域中的多模态学习和类增量学习技术领域。本发明提出基于专家混合的参数高效微调方法和一个自适应加权融合模块能够动态适应增量场景,避免发生灾难性遗忘。同时利用文本增强技术和新提出的损失函数,使模型能够在类增量过程中取得更好的分类性能。此外,本发明在类增量学习过程中是不需要存储旧数据的,因此不会涉及隐私问题,并且模型的参数量较小,实现的几种经典类增量学习方法相比,本发明在智慧课堂场景数据集上获得了更优的分类性能。
-