-
公开(公告)号:CN103607588A
公开(公告)日:2014-02-26
申请号:CN201310394924.X
申请日:2013-09-03
Applicant: 电子科技大学
IPC: H04N19/122 , H04N19/13 , H04N19/149
Abstract: 本发明提供一基于模板的残差变换系数重要图编码方法。本发明基于变换系数标记组合统计特征的模板训练,保证所选的变换系数标记组合比特开销低于传统的CABAC重要图编码,从而有效提高本方法的鲁棒性;利用了变换系数标记组合的相关性以及非零系数个数先验,有效提高了算法的压缩效率;根据编码端的变化,调整了解码端水平级信息与重要图信息的解码顺序,有效保证了重要图信息的正确解码。
-
公开(公告)号:CN103475452A
公开(公告)日:2013-12-25
申请号:CN201310409587.7
申请日:2013-09-10
Applicant: 电子科技大学
IPC: H04L1/00
Abstract: 本发明提供一种针对信道码与扰码复合的扰码抵消方法,包括以下步骤:对解调后的数据进行分帧处理;统计每种帧长下的帧个数;每次从同一帧长下帧个数大于1的集合中提取出两帧,并提取该两帧的承载数据分别放到序列S1以及序列S2中;对序列S1以及序列S2进行异或得到去掉扰码的序列;基于去掉扰码的序列利用信道码识别方法进行信道码参数识别。本发明利用帧加扰位置相同、加扰序列相同的性质进行扰码抵消,提出了一种信道码与扰码复合的扰码抵消方法。再根据信道码码字间异或得到的码字仍属于原始码字空间的码字的性质,可以利用现有信道码识别方法进行信道码参数识别。
-
公开(公告)号:CN103440487A
公开(公告)日:2013-12-11
申请号:CN201310377443.8
申请日:2013-08-27
Applicant: 电子科技大学
Abstract: 本发明提供一种局部色调差异的自然场景文字定位方法。本发明不仅利用了文字的纹理特征,而且利用了文字区域与周围区域色调不同的特点,有效地对场景中的文字进行定位。通过取边缘像素点附近的平均色调差,利用该平均色调差与阈值相比较来判断该区域是否含有文字,这样做可以加入区域文字的局部颜色信息,利用文字的颜色一致性与背景的不同来定位文字。且本发明利用自适应的阈值处理方法来得到阈值,该阈值是由所有候选框的上下左右区域的主色调差的平均值得到的,这样做的目的是利用整幅图的颜色信息来为局部颜色信息做贡献,得到的阈值可以表征场景图的文字区域与背景的色调差。本发明能较快地对自然场景中文字进行准确定位。
-
公开(公告)号:CN119296103A
公开(公告)日:2025-01-10
申请号:CN202411617566.9
申请日:2024-11-13
Applicant: 电子科技大学
IPC: G06V20/70 , G06V10/764 , G06V10/26 , G06V10/82 , G06N3/0895 , G06N3/096
Abstract: 该发明公开了一种基于文本监督的第一视角场景解析方法,属于图像处理领域,特别是第一视角视觉场景解析领域。本发明提出了跨模态提示学习模块,引入视觉与文本可学习提示向量,针对在第三人称数据上预训练的视觉语言模型进行微调,使其能够应用于具有复杂目标关系的第一视角图像;此外,本发明还提出了表征知识迁移模块,将视觉语言预训练模型的特征级知识蒸馏到微调后的第一视角编码器中,提高第一视角模型的跨模态关联能力,从而基于类别文本对第一视角场景中的目标进行准确分割。本发明创新地提出了一种基于文本监督的第一视角场景解析方法,利用第一视角图像的类别文本生成对应的分割伪掩码以缓解像素级标注稀缺的问题。
-
公开(公告)号:CN118887382A
公开(公告)日:2024-11-01
申请号:CN202410896916.3
申请日:2024-07-05
Applicant: 电子科技大学
IPC: G06V10/25 , G06V10/22 , G06V10/766 , G06V10/764 , G06V10/74 , G06V10/774
Abstract: 本发明公开了一种基于预训练模型定位知识嵌入的零样本目标检测方法,属于深度学习目标检测领域。本发明在COCO数据集基础上,构建一个区域图像、IoU标签的数据集(Region‑IoU)。然后使用该数据集对传统的视觉语言模型CLIP进行微调以及学习对IoU敏感的语义提示。使得的IoU‑CLIP模型具备局部目标定位的相关知识,能够预测检测框的IoU分数以及生成类无关IoU敏感的视觉特征。最后将该特征与IoU分数集成进开放词汇零样本检测框架。本发明可以有效地提升开放词汇零样本目标检测任务的性能。
-
公开(公告)号:CN117746509A
公开(公告)日:2024-03-22
申请号:CN202410068386.3
申请日:2024-01-17
Applicant: 电子科技大学
IPC: G06V40/20 , G06V10/764 , G06V10/774 , G06V20/40 , G06N3/04 , G06N3/084
Abstract: 本发明提出一种基于可预见多模态泛化知识表示的持续行为识别方法,包括如下步骤:步骤S1:采集多模态行为活动数据,对行为活动数据进行预处理;步骤S2:进行任务划分;步骤S3:构建多模态行为识别模型;步骤S4:对基任务进行激励型训练;步骤S5:激励型训练结束后,评估多模态行为识别模型的识别精度,并选取一组表示均值向量和表示标准差向量进行存储;步骤S6:进行增量任务的训练;步骤S7:增量任务训练结束后,评估其识别精度,并选取一组表示均值向量和表示标准差向量进行存储以备后续任务;依次类推,直到最后一个任务结束。本发明缓解了由于模态不平衡性所带来的泛化性知识缺失问题,从而减少网络在持续任务中的灾难性遗忘问题。
-
公开(公告)号:CN117237765A
公开(公告)日:2023-12-15
申请号:CN202311270683.8
申请日:2023-09-28
Applicant: 电子科技大学
IPC: G06V10/776 , G06V10/74 , G06V10/764 , G06V10/82
Abstract: 该发明公开了一种基于类激活区域偏移度量的连续学习性能评估方法,属于深度神经网络模型的类增量连续学习领域。本发明在进行图像处理任务时,深度神经网络模型需要对图像中待处理的物体进行提取和重点关注,以完成后续的下游任务;在连续学习场景下,模型在后续任务的学习中灾难性遗忘可能会导致其对之前任务中的目标失去提取和关注能力。本方案提出了使用Grad‑cam类别激活映射谱在不同任务阶段的变化情况来衡量连续学习算法遏制灾难性遗忘的有效性,主要给出了量化的关注区域稳定度评价指标,并结合分类准确度形成了偏离度和相关度指标,最后综合DV和RL作为DR评价指标来衡量连续学习算法的整体表现。
-
公开(公告)号:CN116250846A
公开(公告)日:2023-06-13
申请号:CN202310249522.4
申请日:2023-03-15
Applicant: 电子科技大学
IPC: A61B5/369 , G06F18/2415 , G06F18/25 , G06N3/0464 , G06N3/08 , G06F3/01 , A61B5/372 , A61B5/00
Abstract: 本发明提供一种基于数据转换的多分支运动想象脑电信号特征融合分类方法,旨在扩充网络结构宽度即网络分支的基础上,将脑电波数据转换为不同的输入格式,使用多个分支网络进行处理,使用格拉姆角场作为新的转换后的数据格式输入网络,和深度分离卷积及时频图相比提供了更加丰富的特征,有利于提高特征提取的完整性,使得不同网络分支之间具有的显著特征不同,提取的特征相互互补。转换为不同的数据格式有利于训练网络学习不同类型的特征。同时使用了分类任务中大任务和小任务以及其他任务的约束,即使用网络不同的任务目标实现多种约束,有利于网络提取到通适性更高、更全面的特征,取得了更佳的运动想象脑电信号分类效果。
-
公开(公告)号:CN115713538A
公开(公告)日:2023-02-24
申请号:CN202211445260.0
申请日:2022-11-18
Applicant: 电子科技大学
Abstract: 本发明公开了一种基于跨模态对偶图对齐的参考图像分割方法,属于多模态图像分割领域。本发明创新性的提出了“部分‑统一‑整体”的范式,即将提取得到的视觉与文本特征先映射至一个统一的潜在表征结构,再进行跨模态融合。这有利于模型提取的显式对齐信息,可以有效增强最终的分割效果。
-
公开(公告)号:CN115578246A
公开(公告)日:2023-01-06
申请号:CN202211335202.2
申请日:2022-10-28
Applicant: 电子科技大学
Abstract: 该发明公开了一种基于风格迁移的非对齐可见光和红外模态融合目标检测方法,属于多模态目标检测领域。本发明充分考虑可见光和红外图像不对齐的问题,采用一个可学习的仿射变换网络,对红外模态作仿射变换,实现模态间特征对齐,有效的提升模态融合的效果。本发明中采用一个可学习的仿射变换模块LATM(learning affine transform moduel)来进行特征对齐,采用一个风格迁移融合模块来进行模态间特征融合,本发明可以有效地应对非对齐的可见光和红外图像融合目标检测任务。
-
-
-
-
-
-
-
-
-