-
公开(公告)号:CN113392980A
公开(公告)日:2021-09-14
申请号:CN202110540676.X
申请日:2021-05-18
Applicant: 电子科技大学
Abstract: 本发明涉及图像处理技术领域,涉及一种任务相关性驱动的增量学习方法,包括:一、模型在任务1的训练集上学习一定周期后,对其进行修剪;修剪后对模型进行一定周期的微调,得到模型1;二、计算任务2与任务1之间的相关性;三、初始化步骤一中修剪掉的参数并使用任务2的训练数据来学习这些参数;学习完成后,修剪固定比例的参数并使用任务2的训练数据在剩余属于任务2的参数上进行微调,得到模型2;四、后续任务学习时,先计算该任务与先头所有任务的相关性,然后采用与步骤三相同的方法进行学习。本发明不仅可以通过记忆模板有效的避免灾难性遗忘,还可以利用任务间的相关性辅助当前任务的学习,提升模型在当前任务上的性能。
-
公开(公告)号:CN102968772A
公开(公告)日:2013-03-13
申请号:CN201210511068.7
申请日:2012-12-04
Applicant: 电子科技大学
Abstract: 本发明公开了一种基于暗通道信息的图像去雾方法,属于图像处理和计算机视觉技术领域。本发明提出的方法首先对输入图像的各色彩通道采用最小值滤波器计算出各个像素点的最小值,接着计算不同尺度参数下的图像暗通道统计值,并对各尺度参数对应的暗通道统计值进行高斯平滑滤波,将滤波后的暗通道统计值根据不同的尺度参数分配不同的权重值,通过对按通道统计值的加权优化计算出场景的透射系数,以实现对图像的去雾处理,本发明的应用,能避免复杂的软抠图优化步骤,去雾处理的运算复杂度,去雾处理的图像质量高、且能满足实时处理应用的需求。
-
公开(公告)号:CN119600501A
公开(公告)日:2025-03-11
申请号:CN202411578060.1
申请日:2024-11-06
Applicant: 电子科技大学
IPC: G06V20/40 , G06V10/80 , G06V10/62 , G06V10/44 , G06V10/42 , G06V10/77 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06N3/0442 , G06N3/048
Abstract: 本发明公开了一种基于第一视角高动态长视频的注视谱估计方法,属于图像处理领域。本发明的注视谱预测方法通过三个创新模块有效解决了现有技术中的存在的长时间视频中时序信息丢失、局部与全局信息融合不足,以及静态掩码难以适应动态场景变化等关键问题。增强型长时记忆编码器通过多尺度注意力和层次化记忆机制,有效编码长时间视频,解决了在长时依赖下信息丢失和冗余的问题,确保时序信息的完整性;高通全局‑局部信息聚合模块通过设计跨层动态信息传递通道,使全局背景与局部细节在多层网络中有效结合,增强了复杂动态场景下的注视谱预测能力;动态掩码融合模块采用自适应机制,能够实时调整掩码权重,解决静态注意力无法应对快速变化背景的问题,提升模型的灵活性与准确性。
-
公开(公告)号:CN119538049A
公开(公告)日:2025-02-28
申请号:CN202411654641.9
申请日:2024-11-19
Applicant: 电子科技大学
IPC: G06F18/241 , G06F18/25 , G06F18/213 , G06V10/764 , G06V10/82 , G06V10/44 , G06N3/0455 , G06N3/048 , G06N3/0499 , G06N3/096
Abstract: 该发明公开了一种基于多模态适配器的第一视角增量行为识别方法,本发明涉及视频图像处理领域。本发明旨在通过时序蒸馏损失将旧任务识别模型中的时序感知能力迁移到当前任务识别模型中,并结合模态平衡适配器,通过旧任务识别模型的特征高斯采样和当前任务识别模型的特征高斯采样实现分类层对多任务的增量识别。首先在冻结的ImageNet数据集上预训练的Vit‑B/16模型的所有Transformer编码器的前向网络层的前后以残差的形式插入多模态时序感知适配器,实现在Transformer编码器中从视觉模态、加速度模态和陀螺仪模态的特征中提取时序信息,并通过时序蒸馏损失保证当前任务识别模型和旧任务识别模型的时序信息尽可能靠近。最后,通过计算当前任务识别模型的特征均值和方差构建当前任务的特征高斯分布,并结合旧任务识别模型的特征高斯分布实现多任务的特征高斯采样,在当前任务的分类层前插入模态平衡适配器,利用采样特征和模态平衡适配器再次训练当前任务的分类层,以提高分类层对各任务的识别能力。
-
公开(公告)号:CN119206167A
公开(公告)日:2024-12-27
申请号:CN202411166335.0
申请日:2024-08-23
Applicant: 电子科技大学
IPC: G06V10/25 , G06V10/764 , G06V10/40 , G06V30/146 , G06V30/19 , G06V10/80 , G06V10/82
Abstract: 该发明公开了一种基于深度学习的零样本目标检测方法,涉及计算机视觉和机器学习领域。本发明的提出能够保证不增加训练开支的前提下,仅添加简单的模块就可以在现有的开放词汇目标检测模型的基础上提高基类的检测精度和对新类的泛化能力。通过对图像和文本描述进行编码和特征提取,利用全局分类评分模块对图像中的每个proposal的分类概率进行精炼,从而提高零样本目标检测的准确性和泛化能力。通过利用CLIP模型对图像的分类概率,对零样本目标检测分类器得到的每个区域候选的分类概率进行精炼,从而提高检测的准确性。
-
公开(公告)号:CN117611913A
公开(公告)日:2024-02-27
申请号:CN202311655148.4
申请日:2023-12-05
Applicant: 电子科技大学
IPC: G06V10/764 , G06V10/82 , G06N3/045 , G06N3/084
Abstract: 本发明公开了一种基于低秩自适应组合的图像分类预训练模型连续学习方法,属于图像分类领域。在本发明提出(1)预训练模型在连续过程中,其权重变化存在低秩性,因此LoRA是一种更适合预训练模型进行连续学习的微调方式,(2)一种的LoRA模块加权组合方式,通过更新当前任务对应的LoRA模块及加权系数,帮助模型结合新旧任务的知识,在可塑性和稳定性间找到平衡;(3)一种正交损失,用于约束当前任务对应的LoRA模块的参数更新,使得模型在新旧任务上学习的知识不会相互干扰,进一步提升了模型的可塑性。此外,本发明提出的方法可以和基于回放的方法或免回放的方法相结合,在多个数据集上展现出优异的性能。
-
公开(公告)号:CN117292294A
公开(公告)日:2023-12-26
申请号:CN202311241281.5
申请日:2023-09-25
Applicant: 电子科技大学
IPC: G06V20/40 , G06V40/20 , G06V10/774 , G06V10/82
Abstract: 该发明公开了一种基于新类特征空间来缓解旧类遗忘的行为识别方法,属于深度学习、行为识别、类增量持续学习领域。首先通过关键帧提取算法和预处理插帧算法构建的记忆集,高效实现了记忆集尺寸和重演样本数量的平衡,在消耗和其他方法相同的存储空间下,本发明能在记忆集中存放更多的重演样本,从而有效缓解类增量持续学习中对旧类的灾难性遗忘。其次,本发明在新阶段反向更新模型时,随机冻结对旧类敏感的神经元,同时提前跳出训练,有效阻止了模型过度丢失旧类特征的倾向。通过轻微移动模型对新类的特征空间,保留更多的旧类特征分布,虽然本发明略微牺牲了模型对新类的识别性能,但是大幅度提升了模型对旧类的识别性能。
-
公开(公告)号:CN116779176A
公开(公告)日:2023-09-19
申请号:CN202310778241.8
申请日:2023-06-29
Applicant: 电子科技大学
Abstract: 本发明公开了一种基于神经网络深度特征的移植术后慢性肾病样本增广方法,属于数据挖掘和样本增广技术领域。本发明包括:构建数据集,构建包括特征提取器,辅助分类器和特征增广模块的特征增广网络,再基于此构建诊断评估网络,再对所构建的网络进行反向传播训练,以得到用于获取目标对象是否患有移植术后慢性肾病的辅助诊断评估器,进而生成待处理的数据的诊断结果。本发明针对肾移植受者肠道菌群数据较难获取的情况,本发明通过在特征空间上对样本进行增广,然后将增广之后的样本用作后续分类器的训练。与直接训练分类器相比,使得分类器具有更好的泛化性能,从而有效提升了辅助诊断准确率。
-
公开(公告)号:CN116311026A
公开(公告)日:2023-06-23
申请号:CN202211738731.7
申请日:2022-12-31
Applicant: 电子科技大学
IPC: G06V20/52 , G06V20/40 , G06V40/10 , G06V10/74 , G06V10/764 , G06V10/80 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/047 , G06N3/048 , G06N3/08
Abstract: 本发明公开了一种基于多层级信息融合Transformer的教室场景身份识别方法,属于图像检测技术领域。本发明包括:对视频进行采样处理,再送入目标检测网络中,基于目标检测网络的输出得到人物候选框,基于多层级信息融合Transformer网络对任务候选框进行特征提取,得到人物候选框的关键特征信息并保存,基于多层级信息融合Transformer网络对目标人物的人物候选框进行特征提取,得到目标人物的关键特征信息;基于关键特征信息之间的相似度比较确定视频帧是否存在目标人物识。本发明能有效检测并识别特定人物,具有较好的鲁棒性,在稀疏人群和密集人群中的效果都表现良好。同时该模块能为智慧课堂建设提供有力的辅助。
-
公开(公告)号:CN116229103A
公开(公告)日:2023-06-06
申请号:CN202310292680.8
申请日:2023-03-23
Applicant: 电子科技大学
IPC: G06V10/44 , G06V10/80 , G06V10/82 , G06N3/08 , G06N3/0464
Abstract: 本发明提供一种基于多尺度正负样本挑选的目标检测方法,主干网络输出的每一层的预测特征谱通过平均池化完成下采样再统一大小到与最高层特征谱相加得到中间特征;再使用注意力机制得到最终的中间特征谱;再利用最终的中间特征谱得到各层的融合加强特征谱;将各层的融合加强特征谱分别输入至目标检测头,将特征谱的尺度值大于等于尺度选择阈值的层的IoU最大的k个锚点框设置为正样本,其余预测的锚点框设置为负样本;将正样本和负样本一起输入至分类分支,将正样本输入至回归分支;分类分支用于输出目标的类别,回归分支用于输出目标所在矩形框的位置坐标;优化了现有目标检测任务的正负样本挑选策略。
-
-
-
-
-
-
-
-
-