基于丰富特征的光场图像质量评价方法

    公开(公告)号:CN115937154A

    公开(公告)日:2023-04-07

    申请号:CN202211597866.6

    申请日:2022-12-12

    摘要: 本发明公开了一种基于丰富特征的光场图像质量评价方法。本发明步骤如下:1:将数据集随机拆分成训练集和2测试集。对其中的光场图像通过固定表示角度信息的两个维度,转化成9×9的子孔径图像阵列。2:将每一张子孔径图像从RGB空间转换到HSV坐标上,提取亮度、色调和饱和度作为颜色信息特征。3:提取视差结构特征。4:获取图像角度纹理特征。5:将所有特征进行标准化,后拼接融合,利用基于遗传算法的支持向量模型(GA‑SVR)得到光场图像预测分数。本发明使用高维奇异值分解,减少了多张子孔径图像之间的信息冗余,提高了计算效率;同时将颜色信息特征、视差结构特征、角度纹理特征结合,更好地模拟人类视觉系统,对光场图像做出更加科学的评价。

    考虑标签信息的多任务对比学习图像美学风格分类方法

    公开(公告)号:CN116664945A

    公开(公告)日:2023-08-29

    申请号:CN202310690405.1

    申请日:2023-06-12

    摘要: 本发明公开了考虑标签信息的多任务对比学习图像美学风格分类方法,首先对图像美学风格数据集进行预处理;然后针对图像美学风格属性设计不同的对比学习任务,构建基于多任务对比学习的美学风格特征学习神经网络模型,使用经过预处理图像美学风格数据集对美学风格特征学习模型进行预训练,训练过程中不断调整多任务损失权重使模型可以更好地学习图像美学风格特征;预训练完成后,提取出预训练完成的美学风格特征学习模型,并连接一个风格分类器,建立图像美学风格分类模型。本发明采用了多个对比学习任务对模型进行训练,并结合多任务权重均衡策略调整任务权重,综合提升图像美学风格特征编码器的学习能力和风格分类的准确度。

    一种基于分层分类文本指导的真实场景图像编辑方法

    公开(公告)号:CN116912362A

    公开(公告)日:2023-10-20

    申请号:CN202310793941.4

    申请日:2023-06-30

    摘要: 本发明公开了一种基于分层分类文本指导的真实场景图像编辑方法,首先选取一个层级多标签文本分类模型,将输入的风格描述文本进行层级分类;利用e4e反演模型得到室内场景图像的潜在向量,基于StyleGAN的语义分层特性,将潜在向量进行划分;训练隐空间残差映射器,并分为四组,分别代表场景图像中的布局、对象、属性和颜色细节的生成,并可通过文本分层模型得到的二级词汇对映射模型进行选择性的训练;将文本分类模型得到的三级词汇输入到CLIP网络,并利用CLIP损失控制映射网络的训练;潜在向量通过分层输入映射网络后得到一个偏置向量,与原始向量进行求和后,输入StyleGAN,得到编辑后的图像。本发明实现对于文本指导图像的自动化编辑,减少了人为的手动操控。