基于分层时空感知的屏幕内容视频质量评价方法及装置

    公开(公告)号:CN118865075A

    公开(公告)日:2024-10-29

    申请号:CN202411319739.9

    申请日:2024-09-23

    申请人: 华侨大学

    摘要: 本发明公开了一种基于分层时空感知的屏幕内容视频质量评价方法及装置,涉及视频评价领域,包括:提取屏幕内容视频中的若干个碎片化视频和若干个关键帧并输入经训练的屏幕内容视频质量评价模型,每个关键帧输入显著性计算模块筛选出若干个显著视频块,每个显著视频块输入双通道卷积神经网络,得到每个阶段的多层特征并输入块级质量评估模块,经过空间门特征增强模块,得到每个阶段的增强特征并输入块级质量聚合模块,得到每个视频块的块级质量分数;采用自适应加权策略计算得到空域感知质量分数;碎片化视频输入时域感知质量评估支路,得到时域感知质量分数,两者结合计算得到屏幕内容视频的质量分数,解决现有视频质量评价方法可靠性差的问题。

    基于全局特征与头肩特征多核融合的行人识别方法及装置

    公开(公告)号:CN118397659B

    公开(公告)日:2024-10-15

    申请号:CN202410828405.8

    申请日:2024-06-25

    申请人: 华侨大学

    IPC分类号: G06V40/10 G06V10/80 G06V10/82

    摘要: 本发明公开了一种基于全局特征与头肩特征多核融合的行人识别方法及装置,涉及图像识别领域,包括:采用经训练的行人头肩部检测模型对行人图像进行头肩部检测,得到行人头肩部图像;在行人识别模型中,将行人图像和行人头肩部图像分别输入全局特征提取分支和头肩特征提取分支,得到全局特征向量和头肩特征向量并输入多核融合模块进行融合,得到融合特征向量,根据全局特征向量、头肩特征向量和融合特征向量构建损失函数,以训练行人识别模型,得到经训练的行人识别模型;将待识别的行人图像及其对应的行人头肩部图像输入经训练的行人识别模型,得到对应的融合特征向量,再进行行人识别。本发明解决鱼眼摄像机下图像特征差异大、准确度低的问题。

    一种基于强感知Transformer架构的缺损视频修复方法及系统

    公开(公告)号:CN118469876B

    公开(公告)日:2024-10-01

    申请号:CN202410912771.1

    申请日:2024-07-09

    申请人: 华侨大学

    摘要: 本发明公开了一种基于强感知Transformer架构的缺损视频修复方法及系统,涉及视频处理技术领域,方法包括以下步骤:特征提取模块接收待修复的缺损视频帧序列,采用卷积神经网络对视频帧进行特征提取,输出第一特征;强感知Transformer模块接收第一特征,采用交叉堆叠的局部感知Transformer和全局感知Transformer结构对第一特征进行纹理信息建模和结构信息建模,输出第二特征;重构模块接收第二特征,采用反卷积层进行视频帧重建,输出修复后视频帧序列。本发明采用交叉堆叠的局部感知Transformer和全局感知Transformer进行纹理信息和结构信息建模,有效解决现阶段缺损视频修复方法中存在修复区域缺乏细节纹理、全局结构与局部纹理不匹配的问题,实现更好的修复效果。

    基于池化正交融合的面部色素斑分类方法及装置

    公开(公告)号:CN118334733A

    公开(公告)日:2024-07-12

    申请号:CN202410757576.6

    申请日:2024-06-13

    摘要: 本发明公开了一种基于池化正交融合的面部色素斑分类方法及装置,涉及图像识别领域,包括:构建面部色素斑分类模型并训练,得到经训练的面部色素斑分类模型,面部色素斑分类模型中,利用深度骨干网络对色素斑图像进行特征提取,得到特征映射,池化正交融合模块中,先验平均池化分支用于提取特征映射中的空间全局信息,获得具有空间稳定性的先验池化特征,后验可学习池化分支借助可学习权重挖掘特征映射中的空间分布信息,获得空间敏感性的后验可学习池化特征,利用正交融合模块对先验池化特征和后验可学习池化特征进行正交融合,得到正交融合特征并输入到第一全连接层和Softmax函数层,输出预测类别概率。本发明解决散射分布斑点分类难的问题。

    一种基于结构相似度的非局部注意力学习方法

    公开(公告)号:CN114972812B

    公开(公告)日:2024-06-18

    申请号:CN202210624115.2

    申请日:2022-06-02

    IPC分类号: G06V10/74 G06N3/0464 G06N3/08

    摘要: 本发明提供一种基于结构相似度的非局部注意力学习方法,可广泛应用于机器视觉领域,例如图像分割、图像分类、图像识别等。现有非局部注意力方法简单计算不同空域位置的两个信号内积作为二者的相似度度量,并不完全符合人类视觉感知特点。针对这一问题,本发明提出利用结构相似度衡量不同空域位置的信号之间的相似度,在非局部注意力学习方法中充分考虑人类视觉对信号感知三个重要因素,即亮度、对比度和结构。其次,本发明进一步提出多尺度结构相似度度量策略,在不同尺度上更为全面地进行信号相似度度量。因此,本发明能够取得比现有非局部注意力方法更好地注意力学习效果。

    基于感兴趣区域的VVC码率控制方法及装置

    公开(公告)号:CN118101938A

    公开(公告)日:2024-05-28

    申请号:CN202410497734.9

    申请日:2024-04-24

    申请人: 华侨大学

    IPC分类号: H04N19/119 H04N19/154

    摘要: 本发明公开了一种基于感兴趣区域的VVC码率控制方法及装置,涉及视频编码领域,方法包括:使用基于残差SSD网络训练的人脸检测模型检测图像中的人脸区域作为ROI;使用斯塔克尔伯格模型对ROI的失真进行建模,并采用二分法求解ROI的目标比特;计算编码图像的JND图作为空域视觉敏感度,对8x8互不重叠的子块进行运动估计,得到时域视觉敏感度;将有约束问题转化为无约束问题,并采用KKT条件进行最优化求解,得到最优拉格朗日乘子用于进行比特分配。本发明考虑视频会议、视频监控等应用对ROI的需求增长,人眼对ROI区域重点关注,提取空时域感知敏感度,对ROI和nROI的比特分配问题分别建模并进行最优化求解,合理进行比特分配。

    基于云边搜索联邦深度学习方法的行人再辨识方法及系统

    公开(公告)号:CN117373066B

    公开(公告)日:2024-03-12

    申请号:CN202311667337.3

    申请日:2023-12-07

    申请人: 华侨大学

    摘要: 本发明公开了一种基于云边搜索联邦深度学习方法的行人再辨识方法及系统,涉及机器学习技术领域,方法包括以下步骤:S1,云端初始化全局深度网络模型,S2,云端将全局深度网络模型下发给边缘设备;S3,边缘设备利用个性化初始化函数构建总体优化目标函数,进行边缘深度网络模型训练;S4,云端对边缘深度网络模型权重参数进行加权平均聚合以更新云端全局深度网络模型;S5,重复S2至S4至最大次数,将最后一次生成的云端全局深度网络模型作为行人再辨识模型;S6,利用行人再辨识模型实现行人再辨识。本发明在保护数据隐私的前提下,让各个边缘设备根据本地数据特性个性化初始化自身网络,提升联邦学习中边缘深度网络和云端全局深度网络模型的性能。

    一种基于稀疏再聚焦的高分辨率人脸图像重建方法

    公开(公告)号:CN117671135A

    公开(公告)日:2024-03-08

    申请号:CN202311512308.X

    申请日:2023-11-14

    申请人: 华侨大学

    摘要: 本发明公开了一种基于稀疏再聚焦的高分辨率人脸图像重建方法,涉及图像处理技术领域,包括:利用卷积核为3×3的第一卷积层提取输入的低分辨率人脸图像的浅层特征;基于三个依次连接的组件特征提取网络提取组件特征;其中,第一个组件特征提取网络的输入与第一卷积层的输出相连接;基于三个依次连接的组件生成模块生成高分辨率组件图;其中,每个组件生成模块的输入与一个组件特征提取网络的输出相连接;利用逐像素相加合并高分辨率组件图,生成重建的高分辨率人脸图像。本发明能够有效抑制冗余特征并强调关键特征,实现高效的特征提取;根据图像组件的复杂度分而治之地重建组件并合并,能够降低高频细节的重建难度并复原高分辨率人脸图像。