基于子带信息熵度量的图像质量评价方法

    公开(公告)号:CN105513048A

    公开(公告)日:2016-04-20

    申请号:CN201510830283.7

    申请日:2015-11-24

    CPC classification number: G06T7/0002 G06T2207/30168

    Abstract: 本发明公开了一种基于子带信息熵度量的图像质量评价方法,主要解决计算机对噪声图像的评价与人眼感知不符的问题。其实现步骤是:1.对待测试图像作分块离散余弦变换;2.合并各子块变换系数的相似频带系数;3.重组合并后的系数,将相同频带系数构成重组集合;4.计算每个重组集合系数的信息熵;5.对待测试图像对应的参考图像进行上述步骤1-4的操作,得到参考图像的信息熵;6.计算待测试图像和参考图像在各频带上信息量的差;7.计算所有频带信息量差的加权和,得到待测试图像的质量值;8.根据质量值得出待测试图像的质量评价。本发明的评价结果与人眼感知一致,可用于鉴别互联网上图像传输、图像检索和衡量图像处理指标的质量。

    基于方位选择特性的部分参考图像质量评价方法

    公开(公告)号:CN105389822A

    公开(公告)日:2016-03-09

    申请号:CN201510830282.2

    申请日:2015-11-24

    CPC classification number: G06T7/0002 G06T2207/30168

    Abstract: 本发明公开了一种基于方位选择特性的部分参考图像质量评价方法,主要解决现有不能利用有限的实验数据准确的评价噪声图像质量的问题。其实现步骤是:1.依据视神经的方位选择原理模拟图像像素点的空间结构分布特性;2.通过像素点间的方位角差值与设定阈值确定像素点的空间结构分布;3.将所有像素点的空间结构分布,归纳为基于方向选择特性模式,统计图像中属于某种方位选择特性模式的空间结构分布数量并映射为基于方位选择特性的直方图;4.利用参考图像和噪声图像的直方图,评价待处理图像的质量。本发明通过模拟人类视神经对方位的敏感性,能准确评价噪声图像的质量,可用于互联网上图像传输,图像检索,图像压缩和图像质量的鉴别。

    一种面向机器的多模态协同编码装置及其运用方法

    公开(公告)号:CN117440163A

    公开(公告)日:2024-01-23

    申请号:CN202311154946.9

    申请日:2023-09-07

    Abstract: 本发明公开了一种面向机器的多模态协同编码装置及其运用方法,所述装置包括特征抓取模块,用于从各模态的原生特征中抓取对应的专属嵌入特征;特征编解码模块,用于对所述专属嵌入特征进行编码压缩,通过信道传输在解码端进行特征解码获得重构特征;模态想象模块,用于通过已有模态信息想象出丢弃模态信息,获得前向丢弃模态特征以及联合多模态特征;分类器模块,用于以所述联合多模态特征为输入,获得概率分布结果,以进行多模态任务情感识别。因此,本发明实施例能够舍弃数据级别的保真而采用了语义级别的保真,对中间特征进行压缩、传输来降低带宽负载。

    基于意图识别的结构化视觉定位方法、系统及设备

    公开(公告)号:CN119848277A

    公开(公告)日:2025-04-18

    申请号:CN202411861774.3

    申请日:2024-12-17

    Abstract: 本申请涉及视觉定位技术领域,公开了一种基于意图识别的结构化视觉定位方法、系统及设备,包括:获取待定位图像和用户的当前语音指令;将所述当前语音指令输入预先训练好的意图识别模型进行语义结构化处理,以构建语义拓扑图;其中,所述语义拓扑图用于描述所述当前语音指令对应的目标结构化数据;基于所述语义拓扑图进行推理,得到所述当前语音指令对应的语义指代;对所述语义指代和所述待定位图像进行特征对齐,以在所述待定位图像中定位与所述语义指代匹配的目标对象。本申请通过对语音指令的语义结构化处理,能够对含有口语化语言指令的语义进行精准推理,从而大大提高了视觉定位系统的鲁棒性,有利于提高日常对话场景中的视觉定位效果。

    一种基于动态卷积神经网络的视频编码环路滤波方法

    公开(公告)号:CN119835415A

    公开(公告)日:2025-04-15

    申请号:CN202411930424.8

    申请日:2024-12-26

    Abstract: 本发明公开了一种基于动态卷积神经网络的视频编码环路滤波方法,包括以下步骤;步骤1:从输入的重建图像和预测图像提取多维度的浅层特征;步骤2:将所述浅层特征与量化参数相结合,并通过下采样减小特征图的大小;步骤3:网络的主干部分对融合减小后的特征图提取深层特征,根据输入数据的特点动态调整参数,得到处理后的特征图;步骤4:对处理后的特征图进行整合,并通过上采样操作恢复到原始输入的分辨率,进而得到残差图,将残差图与原始的重建图像相加得到滤波后的图像。本发明能够根据图像内容,动态的调整卷积核参数,来应对不同图像的压缩伪影。此外,将量化参数与动态卷积相结合,更好的利用量化参数的先验信息。

Patent Agency Ranking