一种基于模板的残差变换系数重要图编码方法

    公开(公告)号:CN103607588A

    公开(公告)日:2014-02-26

    申请号:CN201310394924.X

    申请日:2013-09-03

    Abstract: 本发明提供一基于模板的残差变换系数重要图编码方法。本发明基于变换系数标记组合统计特征的模板训练,保证所选的变换系数标记组合比特开销低于传统的CABAC重要图编码,从而有效提高本方法的鲁棒性;利用了变换系数标记组合的相关性以及非零系数个数先验,有效提高了算法的压缩效率;根据编码端的变化,调整了解码端水平级信息与重要图信息的解码顺序,有效保证了重要图信息的正确解码。

    一种针对信道码与扰码复合的扰码抵消方法

    公开(公告)号:CN103475452A

    公开(公告)日:2013-12-25

    申请号:CN201310409587.7

    申请日:2013-09-10

    Inventor: 李宏亮 孟凡满

    Abstract: 本发明提供一种针对信道码与扰码复合的扰码抵消方法,包括以下步骤:对解调后的数据进行分帧处理;统计每种帧长下的帧个数;每次从同一帧长下帧个数大于1的集合中提取出两帧,并提取该两帧的承载数据分别放到序列S1以及序列S2中;对序列S1以及序列S2进行异或得到去掉扰码的序列;基于去掉扰码的序列利用信道码识别方法进行信道码参数识别。本发明利用帧加扰位置相同、加扰序列相同的性质进行扰码抵消,提出了一种信道码与扰码复合的扰码抵消方法。再根据信道码码字间异或得到的码字仍属于原始码字空间的码字的性质,可以利用现有信道码识别方法进行信道码参数识别。

    一种局部色调差异的自然场景文字定位方法

    公开(公告)号:CN103440487A

    公开(公告)日:2013-12-11

    申请号:CN201310377443.8

    申请日:2013-08-27

    Abstract: 本发明提供一种局部色调差异的自然场景文字定位方法。本发明不仅利用了文字的纹理特征,而且利用了文字区域与周围区域色调不同的特点,有效地对场景中的文字进行定位。通过取边缘像素点附近的平均色调差,利用该平均色调差与阈值相比较来判断该区域是否含有文字,这样做可以加入区域文字的局部颜色信息,利用文字的颜色一致性与背景的不同来定位文字。且本发明利用自适应的阈值处理方法来得到阈值,该阈值是由所有候选框的上下左右区域的主色调差的平均值得到的,这样做的目的是利用整幅图的颜色信息来为局部颜色信息做贡献,得到的阈值可以表征场景图的文字区域与背景的色调差。本发明能较快地对自然场景中文字进行准确定位。

    一种基于文本监督的第一视角场景解析方法

    公开(公告)号:CN119296103A

    公开(公告)日:2025-01-10

    申请号:CN202411617566.9

    申请日:2024-11-13

    Abstract: 该发明公开了一种基于文本监督的第一视角场景解析方法,属于图像处理领域,特别是第一视角视觉场景解析领域。本发明提出了跨模态提示学习模块,引入视觉与文本可学习提示向量,针对在第三人称数据上预训练的视觉语言模型进行微调,使其能够应用于具有复杂目标关系的第一视角图像;此外,本发明还提出了表征知识迁移模块,将视觉语言预训练模型的特征级知识蒸馏到微调后的第一视角编码器中,提高第一视角模型的跨模态关联能力,从而基于类别文本对第一视角场景中的目标进行准确分割。本发明创新地提出了一种基于文本监督的第一视角场景解析方法,利用第一视角图像的类别文本生成对应的分割伪掩码以缓解像素级标注稀缺的问题。

    一种基于可预见多模态泛化知识表示的持续行为识别方法

    公开(公告)号:CN117746509A

    公开(公告)日:2024-03-22

    申请号:CN202410068386.3

    申请日:2024-01-17

    Abstract: 本发明提出一种基于可预见多模态泛化知识表示的持续行为识别方法,包括如下步骤:步骤S1:采集多模态行为活动数据,对行为活动数据进行预处理;步骤S2:进行任务划分;步骤S3:构建多模态行为识别模型;步骤S4:对基任务进行激励型训练;步骤S5:激励型训练结束后,评估多模态行为识别模型的识别精度,并选取一组表示均值向量和表示标准差向量进行存储;步骤S6:进行增量任务的训练;步骤S7:增量任务训练结束后,评估其识别精度,并选取一组表示均值向量和表示标准差向量进行存储以备后续任务;依次类推,直到最后一个任务结束。本发明缓解了由于模态不平衡性所带来的泛化性知识缺失问题,从而减少网络在持续任务中的灾难性遗忘问题。

    一种基于类激活区域偏移度量的连续学习性能评估方法

    公开(公告)号:CN117237765A

    公开(公告)日:2023-12-15

    申请号:CN202311270683.8

    申请日:2023-09-28

    Abstract: 该发明公开了一种基于类激活区域偏移度量的连续学习性能评估方法,属于深度神经网络模型的类增量连续学习领域。本发明在进行图像处理任务时,深度神经网络模型需要对图像中待处理的物体进行提取和重点关注,以完成后续的下游任务;在连续学习场景下,模型在后续任务的学习中灾难性遗忘可能会导致其对之前任务中的目标失去提取和关注能力。本方案提出了使用Grad‑cam类别激活映射谱在不同任务阶段的变化情况来衡量连续学习算法遏制灾难性遗忘的有效性,主要给出了量化的关注区域稳定度评价指标,并结合分类准确度形成了偏离度和相关度指标,最后综合DV和RL作为DR评价指标来衡量连续学习算法的整体表现。

Patent Agency Ranking