基于局部纹理特征和全局亮度特征的视频质量评价方法

    公开(公告)号:CN107465914B

    公开(公告)日:2019-03-12

    申请号:CN201710710891.3

    申请日:2017-08-18

    Abstract: 本发明公开一种基于局部纹理特征和全局亮度特征的视频质量评价方法,涉及图像及视频处理技术领域,包括如下步骤:S1:提取网络视频的每一帧图像的局部纹理特征和全局亮度特征;S2:根据每一帧图像的纹理特征和亮度特征进行迟滞帧检测;S3:对检测到的迟滞帧进行总迟滞频次和总迟滞时长的统计;S4:以迟滞频率和迟滞时间的线性组合结果作为预测的视频质量。本发明解决的问题是:(1)用户端无法从接收到的网络流直接判断网络迟滞的位置及时间;(2)传统的视频质量评价方法通过自然场景统计特征提取和回归技术等基于机器学习的方法进行视频质量测度的构建,其计算复杂度高,对计算和存储资源的消耗大。

    基于卷积神经网络的图像分割质量评价方法

    公开(公告)号:CN107123123A

    公开(公告)日:2017-09-01

    申请号:CN201710302338.6

    申请日:2017-05-02

    Abstract: 本发明公开了一种新的基于卷积神经网络的图像分割结果评价方法。分割结果评价具有十分重要的作用,有助于分割方法性能的提升以及分割结果的修复。分割结果评价通常被看作回归问题,而卷积神经网络在回归问题上具有非常好的性能,我们采用卷积神经网络来实现分割评价方法。然而,现有的分割评价方法缺乏一个全面有效的分割结果数据库,并且,适合于分割评价的卷积神经网络还有待研究。基于此,本发明充分挖掘了分割目标前景和背景的特征信息,设计了一种全新的分割质量评价卷积神经网络,通过验证,我们的方法表现出了优异的性能。此外,针对数据库的不足,我们构建了一个新的分割数据库,该数据库具有涵盖多种类型的分割结果及其客观评价指标。

    一种基于模板的残差变换系数重要图编码方法

    公开(公告)号:CN103607588B

    公开(公告)日:2016-11-02

    申请号:CN201310394924.X

    申请日:2013-09-03

    Abstract: 本发明提供一基于模板的残差变换系数重要图编码方法。本发明基于变换系数标记组合统计特征的模板训练,保证所选的变换系数标记组合比特开销低于传统的CABAC重要图编码,从而有效提高本方法的鲁棒性;利用了变换系数标记组合的相关性以及非零系数个数先验,有效提高了算法的压缩效率;根据编码端的变化,调整了解码端水平级信息与重要图信息的解码顺序,有效保证了重要图信息的正确解码。

    一种基于视觉语言知识引入的零样本多模态第一视角行为识别方法

    公开(公告)号:CN119203019A

    公开(公告)日:2024-12-27

    申请号:CN202411024976.2

    申请日:2024-07-29

    Abstract: 该发明公开了一种基于视觉语言知识引入的零样本多模态第一视角行为识别方法,属于多模态行为识别领域。本发明首先将视觉模态输入预训练的CLIP视觉编码器提取视觉特征,将经过STFT变换的加速度计模态、陀螺仪模态频谱图提取对应的特征,文本通过预训练的CLIP文本编码器提取到文本特征。然后将视觉特征传入到适配器模块,将零样本知识与新的自适应特征知识进行动态结合,得到最终的视觉特征。加速度计模态、陀螺仪模态通过惯性传感器融合模块得到最终的惯性传感器特征。最后将文本、视觉、惯性传感器特征一同输入多模态融合模块,充分考虑不同模态间对齐的问题,有效地提升模态融合的效果。该方法在零样本多模态第一视角行为识别任务上表现令人满意。

    一种针对多源异构数据连续学习能力的评价系统

    公开(公告)号:CN118861602A

    公开(公告)日:2024-10-29

    申请号:CN202410951724.8

    申请日:2024-07-16

    Abstract: 该发明公开了一种针对多源异构数据连续学习能力的评价系统,涉及深度学习中的连续学习领域。该系统包括:预处理模块、特征提取网络、分类器模块、混淆率计算模块、评价指标计算模块;将多源异构数据输入预处理模块,然后依次经过特征提取网络、分类器模块、混淆率计算模块、评价指标计算模块,由评价指标计算模块输出多源异构数据的连续学习能力评价指标;由于本发明于以往的评价指标不同,从多模态的角度和新旧任务之间混淆的角度进行思考,所以对于多模态连续学习方法的评价更加准确。

    一种基于高效视频记忆网络的视频域知识记忆与迁移方法

    公开(公告)号:CN117952162A

    公开(公告)日:2024-04-30

    申请号:CN202311750182.X

    申请日:2023-12-19

    Abstract: 该发明公开了一种基于高效视频记忆网络的视频域知识记忆与迁移方法,本发明涉及视频图像处理领域。本发明旨在源视频域模型的监督下将更多视频隐式地存储在大小与存储空间预算一致的高效视频记忆网络中,并通过蒸馏损失将源视频域知识迁移到目标视频域模型中。首先通过时空编码器对类别特征均值和帧索引进行编码,而后将编码后的时空特征送入重构解码器中得到重构帧图像,并在像素级别和特征级别上对高效视频记忆网络进行监督。最后,源视频域知识通过高效视频记忆网络进行存储,同时计算源视频域知识在源视频域模型和目标视频域模型的表达之间的蒸馏损失,将知识迁移到目标视频域上。

    一种基于特征对比损失的年龄估计方法

    公开(公告)号:CN115063862B

    公开(公告)日:2024-04-23

    申请号:CN202210731136.4

    申请日:2022-06-24

    Abstract: 该发明公开了一种基于特征对比损失的年龄估计方法,属于计算机视觉领域。该方法首先选择注意力机制作为特征提取网络的基本结构,并使用了基于注意力机制的偏移窗口变换网络作为特征提取网络的主要结构,用于从面部图像中提取鲁棒的年龄特征;然后设计了用于计算特征之间相对距离的距离估计网络,通过基于特征的对比损失引导特征空间保留标签空间的序约束关系,使得尾部特征能够利用头部特征的信息,进而提升尾部数据的预测准确度,从而解决年龄估计中的长尾分布问题。

    一种基于跨模态认知共识对齐的音视频分割方法

    公开(公告)号:CN117079181A

    公开(公告)日:2023-11-17

    申请号:CN202310933937.3

    申请日:2023-07-27

    Abstract: 该发明公开了一种基于跨模态认知共识对齐的音视频分割方法,属于多模态图像分割领域。提出了跨模态认知共识模块以及认知共识引导的注意力模块,跨模态认知共识模块分别计算音频、视觉分类置信度,并衡量音视频语义标签的互相似度,接着使用分类置信度对互相似度进行加权,得到语义级跨模态认知共识分数并选取语义对齐的标签;随后,将语义对齐的标签梯度反传回视觉编码器获取类激活信息,通过认知共识引导的注意力模块,突出语义一致性高的视觉目标,以指导后续的分割过程。一方面,本发明的方法在音视频分割数据集上达到了目前最先进的性能;另一方面,本发明的方法可以准确有效的分割出视频中的发声目标,并且输出像素级掩码。

Patent Agency Ranking